તે કેટલાક મહત્વપૂર્ણ અપડેટ્સ મેળવી રહ્યું છે જે ચેટબોટને વૉઇસ કમાન્ડ્સ અને ઇમેજ-આધારિત પ્રશ્નો સાથે વ્યવહાર કરવા સક્ષમ બનાવશે. વપરાશકર્તાઓ Android અને iOS પર ChatGPT સાથે વૉઇસ વાર્તાલાપ કરી શકશે અને તમામ પ્લેટફોર્મ પર તેમાં છબીઓ ફીડ કરી શકશે. હવે સુવિધાઓ શરૂ કરી રહ્યાં છીએ. તેઓ સૌપ્રથમ પ્લસ અને એન્ટરપ્રાઇઝ યુઝર્સ માટે ઉપલબ્ધ હશે, અન્યને પછીથી ઇમેજ-આધારિત સુવિધાઓની ઍક્સેસ મળશે.
જો તમે તેને અજમાવવા માંગતા હોવ તો તમારે ChatGPT એપ્લિકેશનમાં વૉઇસ વાર્તાલાપ વિકલ્પ પસંદ કરવો પડશે (સેટિંગ્સ અને પછી નવી સુવિધાઓ પર જાઓ). માઇક્રોફોન બટનને ટેપ કરીને, તમે પાંચ અલગ અલગ અવાજોમાંથી પસંદ કરી શકશો.
OpenAI કહે છે કે આગળ-પાછળની વૉઇસ વાતચીત નવા ટેક્સ્ટ-ટુ-સ્પીચ મૉડલ દ્વારા સંચાલિત છે જે “માત્ર ટેક્સ્ટ અને સેમ્પલ સ્પીચની થોડીક સેકન્ડ્સમાંથી માનવ જેવો ઑડિયો જનરેટ કરી શકે છે.” તેણે વ્યાવસાયિક કલાકારોની મદદથી પાંચ અવાજો બનાવ્યા. બીજી તરફ, કંપની યુઝરના બોલાયેલા શબ્દોને ટેક્સ્ટમાં કન્વર્ટ કરે છે.
ChatGPT સાથે આગળ-પાછળ વાતચીતમાં જોડાવા માટે તમારા અવાજનો ઉપયોગ કરો. સફરમાં તેની સાથે વાત કરો, સૂવાના સમયની વાર્તાની વિનંતી કરો અથવા રાત્રિભોજનના ટેબલ પર દલીલનું સમાધાન કરો.
ધ્વનિ 🔊 ચાલુ pic.twitter.com/3tuWzX0wtS
– OpenAI (@OpenAI) 25 સપ્ટેમ્બર 2023
છબી આધારિત કાર્યો પણ રસપ્રદ છે. ઉદાહરણ તરીકે, OpenAI કહે છે કે તમે ચેટબોટને તમારી ગ્રીલનો ફોટો બતાવી શકો છો અને પૂછી શકો છો કે તે શા માટે શરૂ નથી થઈ રહ્યું, તેને તમારા ફ્રિજમાં શું છે તેના આધારે ભોજનનું આયોજન કરવામાં મદદ કરે છે. અથવા તમે ગણિતની કોઈપણ સમસ્યા ઉકેલવા માટે કહી શકો છો. એક ચિત્ર લો. જેમ જેમ તે થાય છે, માઇક્રોસોફ્ટે ગયા અઠવાડિયે તેની સરફેસ ઇવેન્ટ દરમિયાન Windows માં CoPilot AI ને હાઇલાઇટ કર્યું હતું.
OpenAI GPT-3.5 અને GPT-4 નો ઉપયોગ ઈમેજ રેકગ્નિશન ફીચર્સને પાવર આપવા માટે કરી રહ્યું છે. ChatGPT ના ઇમેજ-આધારિત કાર્યોનો ઉપયોગ કરવા માટે, ફોટો લેવા માટે ફોટો બટનને ટેપ કરો અથવા તમારા ઉપકરણ પર અસ્તિત્વમાંની છબી પસંદ કરો (તમારે iOS અથવા Android પર પહેલા પ્લસ બટનને ટેપ કરવાની જરૂર પડશે). તમે બહુવિધ ફોટા માટે ChatGPT ક્વેરી કરી શકો છો અને ઇમેજના ચોક્કસ ભાગ પર ફોકસ કરવા માટે ડ્રોઇંગ ટૂલ્સનો ઉપયોગ કરી શકો છો.
અપડેટની જાહેરાત કરતા, ઓપનએઆઈએ નુકસાનની સંભાવનાની નોંધ લીધી. ખરાબ કલાકારો માટે જાહેર વ્યક્તિઓ (અને રોજિંદા લોકો) ના અવાજોનું અનુકરણ કરવું અને કદાચ છેતરપિંડી કરવી શક્ય છે. તેથી જ OpenAI આ ટેક્નોલોજી સાથે ChatGPAT વૉઇસ વાર્તાલાપ પર ધ્યાન કેન્દ્રિત કરી રહ્યું છે અને અન્ય મર્યાદિત ઉપયોગના કિસ્સાઓ પર પસંદગીના ભાગીદારો સાથે કામ કરી રહ્યું છે (એક ક્ષણમાં તેના પર વધુ).
જ્યાં સુધી ઈમેજીસનો સંબંધ છે, OpenAI એ એક મફત એપ લઈને આવ્યું છે જેનો ઉપયોગ અંધ અને ઓછી દ્રષ્ટિ ધરાવતા લોકો તેમની આસપાસના વાતાવરણને વધુ સારી રીતે સમજવામાં મદદ કરવા માટે કરી શકે છે, જે સ્વયંસેવકો સાથે મળીને વિડિયો કૉલમાં જોડાય છે તેમને આભાર. ઓપનએઆઈએ કહ્યું, “વપરાશકર્તાઓએ અમને કહ્યું છે કે તેઓને એવી છબીઓ વિશે સામાન્ય વાતચીત કરવી મૂલ્યવાન લાગે છે કે જેમાં પૃષ્ઠભૂમિમાં લોકો હોય, જેમ કે જ્યારે તમે તમારી રિમોટ કંટ્રોલ સેટિંગ્સને શોધવાનો પ્રયાસ કરી રહ્યાં હોવ ત્યારે કોઈ ટીવી પર જોતું હોય.” કંપનીએ નોંધ્યું છે કે તેણે ChatGPT કેવી રીતે પૃથ્થકરણ કરી શકે છે અને ઇમેજમાં દેખાતા લોકો વિશે સીધા નિવેદનો આપી શકે છે તે પણ મર્યાદિત કર્યું છે, “કેમ કે ChatGPT હંમેશા સચોટ હોતું નથી અને આ સિસ્ટમો વ્યક્તિઓની ગોપનીયતાનો આદર કરવા માટે બનાવવામાં આવી છે.” જરૂરી છે.” તેની પાસે ઇમેજ-આધારિત કાર્યક્ષમતાની સુરક્ષા સુવિધાઓ છે, જેને તે દ્રષ્ટિ સાથે GPT-4 કહે છે.
ChatGPT અન્ય ભાષાઓની સરખામણીમાં ઈમેજમાં અંગ્રેજી ટેક્સ્ટને સમજવામાં વધુ અસરકારક છે. ઓપનએઆઈ કહે છે કે ચેટબોટ હાલમાં અન્ય ભાષાઓમાં “નબળું પ્રદર્શન” કરી રહ્યું છે, ખાસ કરીને જ્યારે તે બિન-રોમન સ્ક્રિપ્ટનો ઉપયોગ કરતી ભાષાઓની વાત આવે છે. આમ, તે સૂચવે છે કે બિન-અંગ્રેજી વપરાશકર્તાઓ હમણાં માટે છબીઓમાં ટેક્સ્ટ સાથે વ્યવહાર કરવા માટે ChatGPT નો ઉપયોગ કરવાનું ટાળે છે.
દરમિયાન, Spotify એ રસપ્રદ હેતુ માટે વૉઇસ-આધારિત તકનીકનો ઉપયોગ કરવા OpenAI સાથે જોડાણ કર્યું છે. ભૂતપૂર્વએ પોડકાસ્ટર્સ માટે વૉઇસ ટ્રાન્સલેશન નામના ટૂલના પાઇલટની જાહેરાત કરી છે. તે શોમાં દેખાતા લોકોના અવાજનો ઉપયોગ કરીને પોડકાસ્ટને વિવિધ ભાષાઓમાં અનુવાદિત કરી શકે છે. Spotify કહે છે કે આ ટૂલ અન્ય ભાષાઓમાં રૂપાંતરિત કર્યા પછી મૂળ સ્પીકરના અવાજની વાણી લાક્ષણિકતાઓને જાળવી શકે છે.
શરૂઆત માટે, Spotify પસંદગીના અંગ્રેજી-આધારિત શોને અમુક ભાષાઓમાં રૂપાંતરિત કરી રહ્યું છે. કેટલાકનું સ્પેનિશ સંસ્કરણ આર્મચેર નિષ્ણાત અને સ્ટીવન બાર્ટલેટ સાથે સીઈઓની ડાયરી એપિસોડ્સ, ફ્રેન્ચ અને જર્મન વેરિયન્ટ્સ સાથે.
શું તમે એવી દુનિયાનું સ્વપ્ન જુઓ છો જ્યાં કેટલાક ટોચના પોડકાસ્ટ તમારી મૂળ ભાષામાં બોલવામાં આવશે? સારું, હવે તે શક્ય છે. અમે વૉઇસ ટ્રાન્સલેશનનું પરીક્ષણ કરવા માટે ઉત્સાહિત છીએ, AI દ્વારા સંચાલિત એક ગ્રાઉન્ડબ્રેકિંગ સુવિધા જે પોડકાસ્ટને વધારાની ભાષાઓમાં અનુવાદિત કરે છે – બધું પોડકાસ્ટરમાં… pic.twitter.com/7ebVwF99hD
– Spotify સમાચાર (@SpotifyNews) 25 સપ્ટેમ્બર 2023
આ લેખ મૂળરૂપે Engadget પર https://www.engadget.com/chatgpt-now-supports-voice-chats-and-image-based-queries-144718179.html?src=rss પર દેખાયો હતો.