ઓપનએઆઈ અને ગૂગલે તેમના AI મોડલ્સને યુટ્યુબ વિડિયોઝમાંથી ટ્રાંસ્ક્રાઇબ કરેલા ટેક્સ્ટ પર તાલીમ આપી હતી, જે સર્જકોના કૉપિરાઇટનું સંભવિત ઉલ્લંઘન કરે છે. , અહેવાલ, જે ઓપનએઆઈ, ગૂગલ અને મેટાએ તેમના AIને ફીડ કરેલા ડેટાની માત્રાને મહત્તમ કરવા માટે કેટલી લંબાઈ સુધી ગયા છે તેની રૂપરેખા આપે છે, કંપનીઓની પ્રેક્ટિસના જ્ઞાન ધરાવતા બહુવિધ લોકોને ટાંકે છે. યુટ્યુબના સીઈઓ નીલ મોહને એક ઈન્ટરવ્યુમાં કહ્યું તેના થોડા દિવસો બાદ આ વાત આવી છે ઓપનએઆઈએ તેના નવા ટેક્સ્ટ-ટુ-વિડિયો જનરેટર, સોરાને તાલીમ આપવા માટે YouTube વિડિઓઝનો ઉપયોગ કર્યો છે.
અનુસાર એનવાયટીOpenAI એ તેના વ્હીસ્પર સ્પીચ રેકગ્નિશન ટૂલનો ઉપયોગ યુ ટ્યુબના 10 લાખ કલાકથી વધુ વિડિયોને ટ્રાંસ્ક્રાઇબ કરવા માટે કર્યો હતો, જેનો ઉપયોગ GPT-4ને તાલીમ આપવા માટે કરવામાં આવ્યો હતો. અગાઉ એવું નોંધવામાં આવ્યું હતું કે OpenAI એ બે AI સિસ્ટમને તાલીમ આપવા માટે YouTube વિડિઓઝ અને પોડકાસ્ટનો ઉપયોગ કર્યો હતો. ઓપનએઆઈના પ્રમુખ ગ્રેગ બ્રોકમેન આ ટીમના લોકોમાં કથિત રીતે હતા. ગૂગલના પ્રવક્તા મેટ બ્રાયન્ટે સમજાવ્યું કે ગૂગલના નિયમો અનુસાર, “યુટ્યુબ કન્ટેન્ટને અનધિકૃત સ્ક્રેપિંગ અથવા ડાઉનલોડ કરવાની” મંજૂરી નથી. એનવાયટીતે એમ પણ કહી રહ્યું છે કે કંપની ઓપનએઆઈ દ્વારા આવા કોઈપણ ઉપયોગથી અજાણ હતી.
જો કે, રિપોર્ટમાં દાવો કરવામાં આવ્યો છે કે ગૂગલમાં એવા લોકો હતા જેઓ ઓપનએઆઈને જાણતા હતા પરંતુ તેમણે કાર્યવાહી કરી ન હતી કારણ કે ગૂગલ તેના AI મોડલ્સને તાલીમ આપવા માટે યુટ્યુબ વીડિયોનો ઉપયોગ કરી રહ્યું હતું. ગૂગલે જણાવ્યું એનવાયટી આ માત્ર એવા સર્જકોના વિડિયો સાથે થાય છે કે જેઓ પાયલોટ પ્રોગ્રામમાં ભાગ લેવા માટે સંમત થયા હોય. એન્ગેજેટે ટિપ્પણી માટે Google અને OpenAI નો સંપર્ક કર્યો છે.
એનવાયટી રિપોર્ટમાં એવો પણ દાવો કરવામાં આવ્યો છે કે Google જૂન 2022માં તેની ગોપનીયતા નીતિને અપડેટ કરશે જેથી તેના AI મૉડલ્સ અને ઉત્પાદનોને તાલીમ આપવા માટે Google ડૉક્સ અને Google Sheets સહિત સાર્વજનિક રીતે ઉપલબ્ધ સામગ્રીના ઉપયોગને વધુ વ્યાપકપણે આવરી લેવામાં આવશે. ફેરફારો કર્યા છે. બ્રાયન્ટે જણાવ્યું હતું એનવાયટી આ ફક્ત એવા વપરાશકર્તાઓની પરવાનગી સાથે કરવામાં આવે છે જેઓ Google ની પ્રાયોગિક સુવિધાઓને પસંદ કરે છે, અને કંપનીએ “આ ભાષા પરિવર્તનના આધારે વધારાના પ્રકારના ડેટા પર તાલીમ શરૂ કરી નથી.”
આ લેખ મૂળરૂપે Engadget પર દેખાયો https://www.engadget.com/openai-and-google-reportedly-used-transcriptions-of-youtube-videos-to-train-their-ai-models-163531073.html?src પ્રકાશિત પર =RSS