સર્વમ એઆઈ: જ્યારે એઆઈ મોડલ બનાવવાની વાત આવે છે, ત્યારે કદાચ સૌથી પહેલા તમારા મગજમાં અમેરિકા અથવા ચીનનું નામ આવશે. પરંતુ તમને એ જાણીને ગર્વ થશે કે ભારતના એક AI મૉડેલે જેમિની અને ChatGPT જેવા મોટા AI મૉડલને પણ માત આપી છે. વાસ્તવમાં, બેંગલુરુ સ્થિત સ્ટાર્ટઅપ કંપની સર્વમ એઆઈના શાનદાર મોડેલે આ કર્યું છે. આ અઠવાડિયે તેના બે સાધનો, સર્વમ વિઝન અને બુલબુલ સમાચારમાં છે. સર્વમ AI એ Vision નામનું એક OCR ટૂલ લોન્ચ કર્યું છે જે ભારતીય ભાષાઓમાં દસ્તાવેજો વાંચવામાં જેમિની અને ChatGPT જેવા સાધનોને પાછળ રાખે છે, અને Bulbul V3 પણ લોન્ચ કર્યું છે જે AI વૉઇસ જનરેશનમાં ઉત્તમ છે. અમને વિગતોમાં જણાવો…
OCR ના કેટલાક બેન્ચમાર્કમાં ધ્વજ ઉભા કરવામાં આવ્યા)
IndiaToday ના અહેવાલ મુજબ, Servum Vision ChatGPT, Google Gemini અને Anthropic Claude જેવા મોટા અને લોકપ્રિય AI મોડલ્સને ઓપ્ટિકલ કેરેક્ટર રેકગ્નિશન (OCR)ના કેટલાક બેન્ચમાર્ક પર હરાવી રહ્યું છે, જે તેની વિશેષતાનું ક્ષેત્ર છે. તેનું પ્રદર્શન એટલું સારું છે કે તે વપરાશકર્તાઓ અને નિષ્ણાતો બંને તરફથી પ્રશંસા મેળવી રહ્યું છે.
સર્વમ AIના સહ-સ્થાપક પ્રત્યુષ કુમારે તાજેતરમાં X પર ઘણી પોસ્ટમાં કંપનીના ઇન-હાઉસ AI મોડલ્સની સિદ્ધિઓ શેર કરી છે. કંપનીના જણાવ્યા અનુસાર, સર્વમ વિઝનએ olmOCR-બેન્ચ પર 84.3 ટકાનો એક્યુરસી સ્કોર હાંસલ કર્યો છે. આ સ્કોર જેમિની 3 પ્રો અને ડીપસીક જેવા તાજેતરના OCR મોડલ્સ સાથે સુસંગત છે OCR v2 કરતાં ઊંચું છે, જ્યારે ChatGPTનું રેન્કિંગ ઘણું ઓછું હતું.
વધુમાં, સર્વમ વિઝન એ OmniDocBench v1.5 પર પણ સારો સ્કોર મેળવ્યો છે, જે એક માપદંડ છે જે પરીક્ષણ કરે છે કે AI સિસ્ટમ્સ વાસ્તવિક દુનિયાના દસ્તાવેજો કેવી રીતે વાંચે છે અને સમજે છે. જટિલ લેઆઉટ, ટેકનિકલ કોષ્ટકો અને ગાણિતિક સૂત્રોમાં ખાસ કરીને સારા પરિણામો સાથે તેણે એકંદરે 93.28 ટકા સ્કોર કર્યો. આ એવા વિસ્તારો છે જ્યાં પરંપરાગત OCR સિસ્ટમો નબળા ફોર્મેટિંગ અને ગાઢ સામગ્રીને કારણે ઘણીવાર સંઘર્ષ કરે છે.
AI ટૂલ્સના પ્રદર્શને વિશ્વભરનું ધ્યાન આકર્ષિત કર્યું છે. ભારતીય ભાષાઓમાં મોડેલ્સ પર ધ્યાન કેન્દ્રિત કરવા માટે અગાઉ પૂછવામાં આવેલા સર્વમને હવે પ્રશંસા મળી રહી છે.
ટેક કોમેન્ટેટર ડીડી દાસે, જેમણે અગાઉ ભારતીય ભાષાના નાના મોડલ બનાવવાના મૂલ્ય પર પ્રશ્ન ઉઠાવ્યો હતો, તેણે તાજેતરમાં સ્વીકાર્યું હતું કે તેણે કંપનીને ઓછો અંદાજ આપ્યો હતો. X પરની એક પોસ્ટમાં, દાસે જણાવ્યું હતું કે સર્વમના OCR અને ભારતીય ભાષાઓ માટે ભાષણ મોડલ મજબૂત છે અને તે અંતરને ભરે છે જેને મોટી વૈશ્વિક AI લેબોએ મોટે ભાગે અવગણ્યું છે.

