ઓપનએઆઈએ તાજેતરમાં વોઈસ એન્જીન નામના નવા ટૂલની જાહેરાત કરી છે. તે વૉઇસ ક્લોનિંગ ટેક્નોલોજી છે જે 15 સેકન્ડના ઑડિયો સેમ્પલનું વિશ્લેષણ કરીને કોઈપણ સ્પીકરની નકલ કરી શકે છે. કંપની કહે છે કે તે “ભાવનાત્મક અને વાસ્તવિક અવાજો” સાથે “કુદરતી-ધ્વનિયુક્ત ભાષણ” ઉત્પન્ન કરે છે.
આ ટેક્નોલોજી કંપની પર આધારિત છે અને તે 2022 થી કામ કરી રહી છે. ઓપનએઆઈ પહેલેથી જ રીડ અલાઉડ સુવિધામાં ઉપલબ્ધ ટેક્સ્ટ-ટુ-સ્પીચ API અને પ્રીસેટ વૉઇસને પાવર આપવા માટે ટૂલસેટના સંસ્કરણનો ઉપયોગ કરી રહ્યું છે. કંપનીના અધિકૃત બ્લોગ પર પુષ્કળ નમૂનાઓ છે અને તે વાસ્તવિક વસ્તુની ખૂબ નજીક લાગે છે. હું તમને તેમને સાંભળવા અને સારી અને ખરાબ બંને શક્યતાઓની કલ્પના કરવા પ્રોત્સાહિત કરું છું.
OpenAI કહે છે કે તેઓ આ ટેક્નોલોજીને વાંચન, ભાષા અનુવાદમાં મદદ કરવા અને અચાનક અથવા અધોગતિગ્રસ્ત વાણીની સ્થિતિથી પીડાતા લોકોને મદદ કરવા માટે ઉપયોગી માને છે. કંપનીએ સ્કુલ પ્રોજેક્ટ માટે રેકોર્ડ કરેલ ઓડિયોમાંથી કાઢવામાં આવેલ વોઈસ એન્જીન ક્લોન બનાવીને વાણીની ક્ષતિથી પીડાતા દર્દીને મદદ કરી.
સંભવિત લાભો હોવા છતાં, ખરાબ કલાકારો ચોક્કસપણે કેટલીક ગંભીર ડીપફેક ટોમફૂલરીમાં જોડાવા માટે આ તકનીકનો દુરુપયોગ કરશે. તે ધ્યાનમાં રાખીને, વૉઇસ એન્જિન પ્રાઇમ ટાઇમ માટે તદ્દન તૈયાર નથી, કારણ કે ત્યાં ગંભીર ગોપનીયતાની ચિંતાઓ છે જે પૂર્ણ રોલઆઉટ પહેલાં સંબોધિત કરવી આવશ્યક છે.
OpenAI સ્વીકારે છે કે આ ટેક્નોલોજી “ગંભીર જોખમો વહન કરે છે, જે ખાસ કરીને ચૂંટણીના વર્ષમાં સૌથી વધુ હોય છે.” કંપનીનું કહેવું છે કે ઉત્પાદન ન્યૂનતમ જોખમ સાથે લોન્ચ થાય તે સુનિશ્ચિત કરવા માટે તે “સરકાર, મીડિયા, મનોરંજન, શૈક્ષણિક, નાગરિક સમાજ અને તેનાથી આગળના યુ.એસ. અને આંતરરાષ્ટ્રીય ભાગીદારો” તરફથી પ્રતિસાદ સામેલ કરી રહી છે. બધા પૂર્વાવલોકન પરીક્ષકો OpenAI ની ઉપયોગ નીતિઓ સાથે સંમત થયા હતા, જે સંમતિ અથવા કાનૂની સત્તા વિના અન્ય વ્યક્તિની નકલ કરવા પર પ્રતિબંધ મૂકે છે.
વધુમાં, ટેક્નોલોજીનો ઉપયોગ કરનાર કોઈપણ વ્યક્તિએ તેમના પ્રેક્ષકોને જાણ કરવી જોઈએ કે અવાજો AI-જનરેટેડ છે. OpenAI એ કોઈપણ ઑડિયોના મૂળને શોધવા માટે વોટરમાર્કિંગ અને સિસ્ટમનો ઉપયોગ કેવી રીતે થઈ રહ્યો છે તેનું “સક્રિય નિરીક્ષણ” જેવા સુરક્ષા પગલાં અમલમાં મૂક્યા. જ્યારે ઉત્પાદન સત્તાવાર રીતે લોન્ચ થશે ત્યારે ત્યાં એક “નો-ગો વૉઇસ લિસ્ટ” હશે જે AI-જનરેટેડ સ્પીકર્સ શોધી કાઢશે અને બ્લૉક કરશે જે મોટા સેલિબ્રિટીઝ જેવા જ અવાજ કરે છે.
આ રોલઆઉટ ક્યારે થશે તે અંગે OpenAI ચુસ્તપણે બોલતી નથી. ટેકક્રંચ અને એવું લાગે છે કે તે શમી જશે. વૉઇસ એન્જિનનો ખર્ચ $15 પ્રતિ મિલિયન અક્ષરો હોઈ શકે છે, જે લગભગ 162,500 શબ્દોમાં આવે છે. આ સ્ટીફન કિંગની ઊંચાઈ બરાબર છે ચમકતા, ઑડિયોબુક બનાવવા માટે આ ચોક્કસપણે બજેટ-ફ્રેંડલી રીત જેવું લાગે છે. માર્કેટિંગ મટિરિયલ્સ “HD” સંસ્કરણનો પણ સંદર્ભ આપે છે જેની કિંમત બમણી છે, પરંતુ કંપનીએ તે કેવી રીતે કાર્ય કરશે તે સમજાવ્યું નથી.
OpenAI આ અઠવાડિયે મોટા પગલાં લઈ રહ્યું છે. તેણે “સ્ટારગેટ” નામના AI-આધારિત સુપર કોમ્પ્યુટર બનાવવા માટે તેના સૌથી જાણીતા માઇક્રોસોફ્ટ સાથે બીજી ભાગીદારીની પણ જાહેરાત કરી. આ પ્રોજેક્ટમાં $100 બિલિયનનો ખર્ચ થશે, ,
આ લેખ મૂળ રૂપે Engadget પર દેખાયો https://www.engadget.com/openai-says-it-can-clone-a-voice-from-just-15-seasons-of-audio-190356431.html?src=rss પ્રકાશિત પર