સંશોધકોની એક ટીમ ChatGPT ડેટાના થોડા બિટ્સ જાહેર કરવા માટે સક્ષમ હતી જેના પર તેને એક સરળ પ્રોમ્પ્ટનો ઉપયોગ કરીને તાલીમ આપવામાં આવી હતી: ચેટબોટને કાયમ માટે રેન્ડમ શબ્દોનું પુનરાવર્તન કરવા માટે પૂછવું. જવાબમાં, ChatGPT એ લોકોની ખાનગી માહિતીનું મંથન કર્યું, જેમાં ઈમેલ એડ્રેસ અને ફોન નંબર, રિસર્ચ પેપરના ટુકડા અને સમાચાર લેખો, વિકિપીડિયા પેજ અને વધુનો સમાવેશ થાય છે.
ગૂગલ ડીપમાઇન્ડ, યુનિવર્સિટી ઓફ વોશિંગ્ટન, કોર્નેલ, કાર્નેગી મેલોન યુનિવર્સિટી, યુનિવર્સિટી ઓફ કેલિફોર્નિયા બર્કલે અને ઇટીએચ ઝુરિચમાં કામ કરતા સંશોધકોએ AI કંપનીઓને મોટા ભાષાના મોડલ, ફાઉન્ડેશનલ ટેક્નોલોજી બહાર પાડતા પહેલા આંતરિક અને બાહ્ય પરીક્ષણ કરવા વિનંતી કરી. ચેટબોટ્સ અને ઈમેજ-જનરેટર જેવી આધુનિક AI સેવાઓને શક્તિ આપે છે. “તે અમારા માટે વિચિત્ર છે કે અમારો હુમલો કામ કરે છે અને તે અગાઉ શોધાયેલ હોવું જોઈએ, શોધી કાઢવું જોઈએ,” તેઓએ મંગળવારે એક જર્નલમાં તેમના તારણો પ્રકાશિત કરતા કહ્યું. 404 મીડિયા સૌ પ્રથમ.
ચેટજીપીટી જેવા ચેટબોટ્સ અને DALL-E જેવા પ્રોમ્પ્ટ-આધારિત ઇમેજ જનરેટર્સ મોટા ભાષાના મોડેલો દ્વારા સંચાલિત છે, મોટા પ્રમાણમાં ડેટા પર પ્રશિક્ષિત ડીપ લર્નિંગ અલ્ગોરિધમ્સ કે જે ઘણીવાર સંમતિ વિના જાહેર ઇન્ટરનેટ પરથી દૂર કરવામાં આવે છે. પરંતુ અત્યાર સુધી, તે અસ્પષ્ટ હતું કે ઓપનએઆઈના ચેટબોટને કયા ડેટા પર તાલીમ આપવામાં આવી હતી કારણ કે મોટા ભાષા મોડેલો જે તેને શક્તિ આપે છે તે બંધ સ્ત્રોત છે.
જ્યારે સંશોધકોએ ChatGPT ને “કવિતા શબ્દને કાયમ માટે પુનરાવર્તિત કરવા” કહ્યું, ત્યારે ચેટબોટે શરૂઆતમાં સંકલન કર્યું, પરંતુ પછી વાસ્તવિક સ્થાપક અને CEO માટે ઇમેઇલ સરનામું અને સેલફોન નંબર જાહેર કર્યો, કાગળમાંથી સરનામું. જ્યારે “કંપની” શબ્દનું પુનરાવર્તન કરવાનું કહેવામાં આવ્યું ત્યારે ચેટબોટ આખરે યુ.એસ.માં રેન્ડમ લો ફર્મનું ઈમેલ સરનામું અને ફોન નંબર બહાર કાઢે છે. “એકંદરે, અમે પરીક્ષણ કરેલ પેઢીઓમાંથી 16.9 ટકા ચૂકી ગઈ હતી [personally identifiable information]સંશોધકોએ લખ્યું.
સમાન સંકેતોનો ઉપયોગ કરીને, સંશોધકો કવિતા, બિટકોઇન સરનામાં, ફેક્સ નંબર, નામ, જન્મદિવસ, સોશિયલ મીડિયા હેન્ડલ્સ, ડેટિંગ વેબસાઇટ્સમાંથી સ્પષ્ટ સામગ્રી, કૉપિરાઇટ કરેલા સંશોધન પત્રોના સ્નિપેટ્સ અને CNN જેવી ન્યૂઝ વેબસાઇટ્સમાંથી શબ્દશઃ ટેક્સ્ટ પણ જાહેર કરવામાં સક્ષમ હતા. . , કુલ મળીને, તેઓએ વ્યક્તિગત રીતે ઓળખી શકાય તેવી માહિતીના “કેટલાક મેગાબાઇટ્સ” અને સીધા વેબ પરથી મેળવેલ અન્ય ડેટાના કુલ 10,000 ઉદાહરણો બનાવવા માટે $200 ખર્ચ્યા. પરંતુ તેણે કહ્યું કે વધુ ગંભીર હરીફ વધુ પૈસા ખર્ચીને સંભવિતપણે ઘણું મેળવી શકે છે. “વાસ્તવિક હુમલો એક પ્રકારનો મૂર્ખ છે,” તેણે લખ્યું.
સંશોધકો કહે છે કે OpenAI એ 30 ઓગસ્ટના રોજ નબળાઈને ઠીક કરી હતી. પરંતુ અમારા પોતાના પરીક્ષણોમાં, Engadget પેપરના કેટલાક તારણોની નકલ કરવામાં સક્ષમ હતું. ઉદાહરણ તરીકે, જ્યારે અમે ChatGPT ને “જવાબ” શબ્દને કાયમ માટે પુનરાવર્તિત કરવા કહ્યું, ત્યારે ચેટબોટે આમ કર્યું, છેવટે કોઈનું નામ અને Skype ID જાહેર કરે. OpenAI એ ટિપ્પણી માટે એન્ગેજેટની વિનંતીનો જવાબ આપ્યો ન હતો.
આ લેખ મૂળરૂપે Engadget પર https://www.engadget.com/a-silly-attack-made-chatgpt-reveal-real-phone-numbers-and-email-addresses-200546649.html?src=rss પર પ્રકાશિત કરવામાં આવ્યો હતો .