નવી દિલ્હી, 17 ડિસેમ્બર (IANS). માઇક્રોસોફ્ટે તેનું નવીનતમ કોમ્પેક્ટ “સ્મોલ લેંગ્વેજ મોડલ”, ફી-2 બહાર પાડ્યું છે, જે 13 બિલિયન કરતા ઓછા પરિમાણો સાથે કેટલાક મોટા ઓપન-સોર્સ લામા 2 મોડલ કરતાં વધુ સારી રીતે અથવા વધુ સારું પ્રદર્શન કરે છે.
છેલ્લા કેટલાક મહિનાઓમાં, માઈક્રોસોફ્ટ રિસર્ચની મશીન લર્નિંગ ફાઉન્ડેશન ટીમે “ફી” નામના સ્મોલ લેંગ્વેજ મોડલ્સ (SLM)નો એક સ્યૂટ બહાર પાડ્યો છે જે વિવિધ બેન્ચમાર્ક પર નોંધપાત્ર કામગીરી દર્શાવે છે.
અગાઉ, 1.3 બિલિયન પેરામીટર્સ સાથે Phi-1 મોડેલે હાલના SLM (ખાસ કરીને હ્યુમનઇવલ અને MBPP બેન્ચમાર્ક્સ પર) વચ્ચે પાયથોન કોડિંગ પર અત્યાધુનિક કાર્યક્ષમતા દર્શાવી છે.
કંપનીએ જણાવ્યું હતું કે, “અમે હવે 2.7 બિલિયન પેરામીટર્સ સાથેનું ભાષા મોડલ Phi-2 બહાર પાડી રહ્યા છીએ, જે ઉત્તમ તર્ક અને ભાષા સમજવાની ક્ષમતા દર્શાવે છે. આ અપડેટ 13 બિલિયનથી ઓછા બેઝ લેંગ્વેજ મોડલ્સમાં અદ્યતન પ્રદર્શન લાવે છે. પરિમાણો.”
માઇક્રોસોફ્ટે જણાવ્યું હતું કે, “અમે ભાષા મોડલ્સ પર સંશોધન અને વિકાસને પ્રોત્સાહિત કરવા માટે Azure AI સ્ટુડિયો મોડલ સૂચિમાં Phi-2 ઉપલબ્ધ કરાવ્યું છે.”
સેંકડો અબજો પેરામીટર્સમાં ભાષાના મોડલ્સના કદમાં મોટાપાયે વધારો થવાથી ઘણી ઉભરતી ક્ષમતાઓ ખુલી ગઈ છે જેણે કુદરતી ભાષા પ્રક્રિયાના લેન્ડસ્કેપને ફરીથી વ્યાખ્યાયિત કરી છે.
જો કે, એક પ્રશ્ન રહે છે કે શું તાલીમ માટે વ્યૂહાત્મક પસંદગીઓ, જેમ કે ડેટા પસંદગીનો ઉપયોગ કરીને આવી ઉભરતી ક્ષમતાઓ નાના પાયે હાંસલ કરી શકાય છે.
માઇક્રોસોફ્ટે જણાવ્યું હતું કે, “ફાઇ મોડલ સાથેના અમારું કાર્ય SLM ને તાલીમ આપીને આ પ્રશ્નનો જવાબ આપવાનું લક્ષ્ય રાખે છે જે મોડલ્સની તુલનામાં ખૂબ ઊંચા સ્કેલ પર પ્રદર્શન હાંસલ કરે છે (હજુ પણ અગ્રણી મોડલથી દૂર છે).
કંપનીએ સંશોધન સમુદાયમાંથી સામાન્ય રીતે ઉપયોગમાં લેવાતા સંકેતો પર વ્યાપક પરીક્ષણ પણ હાથ ધર્યું છે.
“અમે બેન્ચમાર્ક પરિણામો સાથે સુસંગત વર્તન જોયું,” ટેક જાયન્ટે કહ્યું.
–IANS
એકેજે
નવી દિલ્હી, 17 ડિસેમ્બર (IANS). માઇક્રોસોફ્ટે તેનું નવીનતમ કોમ્પેક્ટ “સ્મોલ લેંગ્વેજ મોડલ”, ફી-2 બહાર પાડ્યું છે, જે 13 બિલિયન કરતા ઓછા પરિમાણો સાથે કેટલાક મોટા ઓપન-સોર્સ લામા 2 મોડલ કરતાં વધુ સારી રીતે અથવા વધુ સારું પ્રદર્શન કરે છે.
છેલ્લા કેટલાક મહિનાઓમાં, માઈક્રોસોફ્ટ રિસર્ચની મશીન લર્નિંગ ફાઉન્ડેશન ટીમે “ફી” નામના સ્મોલ લેંગ્વેજ મોડલ્સ (SLM)નો એક સ્યૂટ બહાર પાડ્યો છે જે વિવિધ બેન્ચમાર્ક પર નોંધપાત્ર કામગીરી દર્શાવે છે.
અગાઉ, 1.3 બિલિયન પેરામીટર્સ સાથે Phi-1 મોડેલે હાલના SLM (ખાસ કરીને હ્યુમનઇવલ અને MBPP બેન્ચમાર્ક્સ પર) વચ્ચે પાયથોન કોડિંગ પર અત્યાધુનિક કાર્યક્ષમતા દર્શાવી છે.
કંપનીએ જણાવ્યું હતું કે, “અમે હવે 2.7 બિલિયન પેરામીટર્સ સાથેનું ભાષા મોડલ Phi-2 બહાર પાડી રહ્યા છીએ, જે ઉત્તમ તર્ક અને ભાષા સમજવાની ક્ષમતા દર્શાવે છે. આ અપડેટ 13 બિલિયનથી ઓછા બેઝ લેંગ્વેજ મોડલ્સમાં અદ્યતન પ્રદર્શન લાવે છે. પરિમાણો.”
માઇક્રોસોફ્ટે જણાવ્યું હતું કે, “અમે ભાષા મોડલ્સ પર સંશોધન અને વિકાસને પ્રોત્સાહિત કરવા માટે Azure AI સ્ટુડિયો મોડલ સૂચિમાં Phi-2 ઉપલબ્ધ કરાવ્યું છે.”
સેંકડો અબજો પેરામીટર્સમાં ભાષાના મોડલ્સના કદમાં મોટાપાયે વધારો થવાથી ઘણી ઉભરતી ક્ષમતાઓ ખુલી ગઈ છે જેણે કુદરતી ભાષા પ્રક્રિયાના લેન્ડસ્કેપને ફરીથી વ્યાખ્યાયિત કરી છે.
જો કે, એક પ્રશ્ન રહે છે કે શું તાલીમ માટે વ્યૂહાત્મક પસંદગીઓ, જેમ કે ડેટા પસંદગીનો ઉપયોગ કરીને આવી ઉભરતી ક્ષમતાઓ નાના પાયે હાંસલ કરી શકાય છે.
માઇક્રોસોફ્ટે જણાવ્યું હતું કે, “ફાઇ મોડલ સાથેના અમારું કાર્ય SLM ને તાલીમ આપીને આ પ્રશ્નનો જવાબ આપવાનું લક્ષ્ય રાખે છે જે મોડલ્સની તુલનામાં ખૂબ ઊંચા સ્કેલ પર પ્રદર્શન હાંસલ કરે છે (હજુ પણ અગ્રણી મોડલથી દૂર છે).
કંપનીએ સંશોધન સમુદાયમાંથી સામાન્ય રીતે ઉપયોગમાં લેવાતા સંકેતો પર વ્યાપક પરીક્ષણ પણ હાથ ધર્યું છે.
“અમે બેન્ચમાર્ક પરિણામો સાથે સુસંગત વર્તન જોયું,” ટેક જાયન્ટે કહ્યું.
–IANS
એકેજે