ઓગસ્ટમાં, મેટાએ તેનું મલ્ટિમોડલ AI અનુવાદ મોડલ, સીમલેસએમ4ટીનું અનાવરણ કર્યું, જે ટેક્સ્ટ માટે લગભગ 100 ભાષાઓ અને ભાષણ માટે 36 ભાષાઓને સપોર્ટ કરે છે. અપડેટેડ “v2” આર્કિટેક્ચર સાથે, ટેક જાયન્ટ હવે વાતચીતના અનુવાદોને વધુ સાહજિક અને અભિવ્યક્ત બનાવવા માટે આ સાધનને વિસ્તૃત કરી રહ્યું છે – બાદમાં ભાષાઓમાં અધિકૃત વાર્તાલાપની ખૂટતી ચાવી છે.
બે નવી સુવિધાઓમાંથી પ્રથમ “સીમલેસ એક્સપ્રેસિવ” છે, જે તમે નામ પરથી કહી શકો છો, તમારી ભાષાંતરિત ભાષણમાં તમારા અભિવ્યક્તિઓ પોર્ટ કરે છે. આમાં તમારી પીચ, વોલ્યુમ, ભાવનાત્મક સ્વર (ઉત્તેજના, ઉદાસી અથવા વ્હીસ્પરિંગ), વાણીનો દર અને વિરામનો સમાવેશ થાય છે. આપેલ છે કે અત્યાર સુધી ભાષાંતરિત ભાષણ હંમેશા રોબોટિક લાગતું હતું, આ સફળતા સંભવિતપણે ગેમ-ચેન્જર છે – આપણા રોજિંદા જીવનમાં અને સામગ્રી ઉત્પાદનમાં પણ. સમર્થિત ભાષાઓમાં અંગ્રેજી, સ્પેનિશ, જર્મન, ફ્રેન્ચ, ઇટાલિયન અને ચાઇનીઝનો સમાવેશ થાય છે, જોકે આ લેખ લખતી વખતે ડેમો પૃષ્ઠમાંથી ઇટાલિયન અને ચાઇનીઝ ખૂટે છે.
બીજું લક્ષણ “સીમલેસસ્ટ્રીમિંગ” છે, જે વક્તા બોલતા હોય ત્યારે વાણી અનુવાદ શરૂ કરે છે, જે અન્ય લોકોને ઝડપથી અનુવાદ સાંભળવા દે છે. હજુ પણ માત્ર બે સેકન્ડની થોડી વિલંબિતતા છે, પરંતુ ઓછામાં ઓછું તમારે વાક્ય પૂરું કરવા માટે કોઈની રાહ જોવાની જરૂર નથી. મેટા અનુસાર, અહીં પડકાર એ છે કે વિવિધ ભાષાઓમાં અલગ-અલગ વાક્ય માળખું હોય છે, તેથી અનુવાદિત આઉટપુટ કેવી રીતે જનરેટ કરવું તે નક્કી કરવા માટે તેને આંશિક ઑડિયો ઇનપુટનો અભ્યાસ કરવા માટે સમર્પિત અલ્ગોરિધમ વિકસાવવાનું હતું. શરૂ કરવા માટે પૂરતો સંદર્ભ છે કે નહીં. સાંભળતા રહો.
આ “સીમલેસ કમ્યુનિકેશન” સ્યુટ પર મેટાનો નવીનતમ વિકાસ પ્રભાવશાળી લાગે છે – ગૂગલ અને સેમસંગ જેવી કંપનીઓ દ્વારા ઓફર કરવામાં આવતા મોબાઇલ ઇન્ટરપ્રીટર ટૂલ્સ કરતાં પણ વધુ. લોકો ક્યારે આ નવી સુવિધાઓનો ઉપયોગ કરી શકશે તેના પર કોઈ શબ્દ નથી, પરંતુ હું પહેલેથી જ કલ્પના કરી શકું છું કે મેટા તેમને કોઈ દિવસ તેના સ્માર્ટ ચશ્મામાં પકવશે, તેમને પહેલા કરતા વધુ વ્યવહારુ બનાવશે.
આ લેખ મૂળરૂપે Engadget પર https://www.engadget.com/metas-latest-ai-suite-makes-speech-translation-more-seamless-and-expressive-060043686.html?src=rss પર દેખાયો હતો.