ગુરુવારે, ગૂગલે જેમિની 1.5 પ્રોનું અનાવરણ કર્યું, જે કંપની કહે છે કે અગાઉના મોડલની તુલનામાં “નાટકીય રીતે સુધારેલ પ્રદર્શન” ઓફર કરે છે. કંપનીનો AI માર્ગ – તેના ભવિષ્ય માટે આંતરિક રીતે વધુને વધુ મહત્વપૂર્ણ માનવામાં આવે છે – ગયા અઠવાડિયે જેમિની 1.0 અલ્ટ્રાના અનાવરણને અનુસરે છે, નવા મોડલની વધુ શક્તિશાળી અને બહુમુખી ક્ષમતાઓ સાથે સંરેખિત કરવા માટે બાર્ડ ચેટબોટ (જેમિનીમાં) ની રજૂઆત સાથે. રિબ્રાન્ડિંગ સાથે.
એક જાહેરાત બ્લોગ પોસ્ટમાં, Google CEO સુંદર પિચાઈ અને Google DeepMind CEO ડેમિસ હાસાબીસ તેમના પ્રેક્ષકોને નૈતિક AI સલામતી વિશે ખાતરી આપીને સંતુલિત કરવાનો પ્રયાસ કરે છે જ્યારે તેઓ તેમના મોડલની ઝડપી ગતિશીલ ક્ષમતાઓનો ઉલ્લેખ કરે છે. “અમારી ટીમો સલામતીને ધ્યાનમાં રાખીને અમારા નવીનતમ મોડલ્સની સીમાઓને આગળ ધપાવી રહી છે,” પિચાઈએ સારાંશ આપ્યો.
કંપનીએ AI શંકાવાદીઓ (ભૂતપૂર્વ Google CEO સહિત) અને સરકારી નિયમનકારોની સુરક્ષા પર ભાર મૂકવાની જરૂર છે. પરંતુ તેણે AI ડેવલપર્સ, સંભવિત ગ્રાહકો અને રોકાણકારોને તેના મોડલ્સના પ્રદર્શનને વેગ આપવા માટે દબાણ કરવાની પણ જરૂર છે, ચિંતામાં કે કંપની ChatGPIT સાથે OpenAI ની બ્રેકઆઉટ સફળતા પર પ્રતિક્રિયા કરવામાં ખૂબ ધીમી હતી.
પિચાઈ અને હસાબીસ કહે છે કે જેમિની 1.5 પ્રો જેમિની 1.0 અલ્ટ્રા સાથે તુલનાત્મક પરિણામો આપે છે. જો કે, જેમિની 1.5 નીચી કોમ્પ્યુટેશનલ આવશ્યકતાઓ સાથે તે સ્તર પર વધુ કાર્યક્ષમ રીતે કાર્ય કરે છે. મલ્ટિમોડલ ક્ષમતાઓમાં ટેક્સ્ટ, છબીઓ, વિડિયો, ઑડિઓ અથવા કોડની પ્રક્રિયાનો સમાવેશ થાય છે. જેમ જેમ AI મોડલ્સ આગળ વધશે તેમ, તેઓ પ્રોમ્પ્ટ બોક્સમાં ક્ષમતાઓની વધુ સર્વતોમુખી શ્રેણી ઓફર કરવાનું ચાલુ રાખશે (એક તાજેતરનું ઉદાહરણ OpenAI DALL-E 3 ઇમેજ જનરેશનને ChatGPTમાં એકીકૃત કરવાનું હતું).
Gemini 1.5 Pro 10 લાખ ટોકન્સ સુધી પણ હેન્ડલ કરી શકે છે અથવા ડેટા AI મોડલના એકમો એક જ વિનંતીમાં પ્રક્રિયા કરી શકે છે. ગૂગલ કહે છે કે જેમિની 1.5 પ્રો 700,000 થી વધુ શબ્દો, એક કલાકનો વિડીયો, 11 કલાકનો ઓડિયો અને 30,000 થી વધુ લાઈનોનો કોડબેસ પ્રોસેસ કરી શકે છે. કંપની કહે છે કે તેણે 10 મિલિયન ટોકન્સ સુધીનું સમર્થન કરતા સંસ્કરણનું “સફળતાપૂર્વક પરીક્ષણ” પણ કર્યું છે.
કંપની કહે છે કે જેમિની 1.5 પ્રો જ્યારે શીખવા માટે વધુ નવો ડેટા હોય ત્યારે મોટી ટોકન કાઉન્ટ સાથેની ક્વેરીઝમાં ઉચ્ચ ચોકસાઈ જાળવી રાખે છે. તે કહે છે કે હેસ્ટક મૂલ્યાંકનમાં મોડેલે નીડલને પ્રભાવિત કરી. આ પરીક્ષણમાં, વિકાસકર્તાઓ એઆઈ મોડેલ તેને પસંદ કરી શકે છે તે જોવા માટે લાંબા ટેક્સ્ટ બ્લોકની અંદર માહિતીનો એક નાનો ભાગ મૂકે છે. ગૂગલે કહ્યું કે જેમિની 1.5 પ્રો 10 લાખ ટોકન્સ સુધીના ડેટા બ્લોક્સમાં 99 ટકા સમય એમ્બેડેડ ટેક્સ્ટ શોધી શકે છે.
ગૂગલ કહે છે કે જેમિની 1.5 પ્રો 402-પૃષ્ઠ Apollo 11 મૂન મિશન ટ્રાંસ્ક્રિપ્ટ્સમાંથી વિવિધ વિગતો વિશે કારણ આપી શકે છે. વધુમાં, તે બસ્ટર કીટોન અભિનીત 44-મિનિટની સાયલન્ટ ફિલ્મના પ્લોટ પોઈન્ટ અને ઘટનાઓનું વિશ્લેષણ કરી શકે છે. “1.5 પ્રોની લાંબી રેફરન્સ વિન્ડો મોટા પાયે મોડલ્સમાં તેના પ્રકારની પ્રથમ હોવાથી, અમે તેની નવી ક્ષમતાઓને ચકાસવા માટે સતત નવા મૂલ્યાંકન અને બેન્ચમાર્ક વિકસાવી રહ્યા છીએ,” હસાબીસે લખ્યું.
Google 128,000-ટોકન ક્ષમતાઓ સાથે Gemini 1.5 Pro લોન્ચ કરી રહ્યું છે, જે OpenAI (જાહેર રીતે જાહેર કરાયેલ) GPT-4 મોડલની મહત્તમ ક્ષમતા જેટલી છે. હાસાબીસ કહે છે કે ગૂગલ આખરે નવા ભાવ નિર્ધારણ સ્તરો રજૂ કરશે જે એક મિલિયન-ટોકન પ્રશ્નોને સમર્થન આપશે.
જેમિની 1.5 પ્રો વધારાના ફાઇન-ટ્યુનિંગ (“સંદર્ભમાં શીખવું”) વિના – લાંબા સિગ્નલોમાં માહિતીમાંથી નવી કુશળતા શીખવામાં પણ પારંગત છે. મશીન ટ્રાન્સલેશન ફ્રોમ વન બુક નામના બેન્ચમાર્કમાં, મોડેલે કલામંગા માટે વ્યાકરણ માર્ગદર્શિકા શીખી, એક એવી ભાષા કે જેમાં વૈશ્વિક સ્તરે 200 થી ઓછા બોલનારા છે, જેના પર તેને અગાઉ તાલીમ આપવામાં આવી ન હતી. કંપની કહે છે કે જેમિની 1.5 પ્રો એ સમાન કન્ટેન્ટ શીખતી વખતે કલામંગમાં અંગ્રેજી ભાષાંતર કરતી વખતે સમાન સ્તરે પ્રદર્શન કરવાનું શીખ્યા.
જાહેરાતના એક ભાગમાં જે વિકાસકર્તાઓનું ધ્યાન આકર્ષિત કરશે, ગૂગલ કહે છે કે જેમિની 1.5 પ્રો લાંબા કોડ બ્લોક્સમાં સમસ્યા હલ કરવાના કાર્યો કરી શકે છે. હાસાબીસે લખ્યું, “જ્યારે કોડની 100,000 થી વધુ રેખાઓ સાથે સંકેત આપવામાં આવે છે, ત્યારે તે ઉદાહરણોમાં વધુ સારી રીતે કારણ આપી શકે છે, ઉપયોગી ફેરફારો સૂચવી શકે છે અને કોડના વિવિધ ભાગો કેવી રીતે કાર્ય કરે છે તે સમજાવી શકે છે.” સમજૂતી આપી શકે છે.”
નૈતિકતા અને સુરક્ષા મોરચે, Google કહે છે કે તે “જવાબદાર જમાવટ માટે તે જ અભિગમ અપનાવી રહ્યું છે” જે તેણે જેમિની 1.0 મોડલ સાથે અપનાવ્યું હતું. આમાં રેડ-ટીમિંગ તકનીકો વિકસાવવા અને અમલમાં મૂકવાનો સમાવેશ થાય છે, જ્યાં નૈતિક વિકાસકર્તાઓનું જૂથ આવશ્યકપણે શેતાનના વકીલ તરીકે કાર્ય કરે છે, “સંભવિત મુશ્કેલીઓની શ્રેણી” નું પરીક્ષણ કરે છે. વધુમાં, કંપની કહે છે કે તે સામગ્રી સુરક્ષા અને પ્રતિનિધિત્વના નુકસાન જેવા ક્ષેત્રોની સંપૂર્ણ તપાસ કરે છે. કંપની કહે છે કે તે તેના AI સાધનો માટે નવા નૈતિક અને સુરક્ષા પરીક્ષણો વિકસાવવાનું ચાલુ રાખી રહી છે.
ગૂગલ ડેવલપર્સ અને એન્ટરપ્રાઇઝ ગ્રાહકો માટે અર્લી એક્સેસમાં જેમિની 1.5 લોન્ચ કરી રહ્યું છે. કંપની આખરે તેને વધુ વ્યાપક રીતે ઉપલબ્ધ કરાવવાની યોજના ધરાવે છે. Gemini 1.0 હાલમાં પ્રો વર્ઝન ધરાવતા ગ્રાહકો માટે ઉપલબ્ધ છે, જેની કિંમત $20 માસિક છે.
આ લેખ મૂળરૂપે Engadget પર https://www.engadget.com/googles-gemini-15-pro-is-a-new-more-efficient-ai-model-181909354.html?src=rss પર દેખાયો હતો.