આજના ચેટબોટ્સને નિષિદ્ધ વિષયો પર ચર્ચા કરવા, ધર્માંધ સામગ્રીનું પુનઃપ્રસારણ કરવા અને ખોટી માહિતી ફેલાવવા માટે છેતરવું બિલકુલ મુશ્કેલ નથી. તેથી જ AI પ્રણેતા એન્થ્રોપિકે તેના જનરેટિવ AI, ક્લાઉડને ઔચિત્યના 10 સિક્રેટ સિદ્ધાંતોના મિશ્રણ સાથે રજૂ કર્યું, જે તેણે માર્ચમાં જાહેર કર્યું. મંગળવારે એક બ્લોગ પોસ્ટમાં, કંપનીએ આગળ સમજાવ્યું કે તેની બંધારણીય AI સિસ્ટમ કેવી રીતે ડિઝાઇન કરવામાં આવી છે અને તેને કેવી રીતે સંચાલિત કરવી.
સામાન્ય રીતે, જ્યારે જનરેટિવ AI મોડેલને તાલીમ આપવામાં આવી રહી હોય, ત્યારે આઉટપુટ પર ગુણવત્તા નિયંત્રણ અને પ્રતિસાદ આપવા માટે લૂપમાં એક માણસ હોય છે – જેમ કે જ્યારે ChatGPT અથવા Bard તમને તેમની સિસ્ટમ સાથેની તમારી ક્રિયાપ્રતિક્રિયાઓને રેટ કરવા માટે કહે છે. “અમારા માટે, આમાં માનવ ઠેકેદારો સાથેના બે પ્રતિભાવોની સરખામણી સામેલ છે,” એન્થ્રોપિક ટીમે લખ્યું. “એક મોડેલમાંથી અને કોઈ સિદ્ધાંત અનુસાર તેમને જે વધુ સારું લાગ્યું (ઉદાહરણ તરીકે, તે વધુ મદદરૂપ અથવા વધુ હાનિકારક હતું) પસંદ કરો.”
આ પદ્ધતિની સમસ્યા એ છે કે આઉટપુટ ખરેખર ભયાનક અને ખલેલ પહોંચાડવા માટે માણસને પણ લૂપમાં રહેવું પડે છે. કોઈને પણ આ જોવાની જરૂર નથી, મેટા દ્વારા તેને જોવા માટે એક કલાકમાં $1.50 ખૂબ ઓછા ચૂકવો. માનવ સલાહકાર પદ્ધતિ સ્કેલિંગમાં પણ નકામી છે, લોકો સાથે તે કરવા માટે પૂરતો સમય અને સંસાધનો નથી. તેથી જ એન્થ્રોપિક તે અન્ય AI સાથે કરી રહ્યું છે.
જેમ પિનોચિઓ પાસે જીમી ક્રિકેટ, લ્યુક પાસે યોડા અને જીમ પાસે શોર્ટ હતો, તેમ ક્લાઉડનું પોતાનું બંધારણ છે. “ઉચ્ચ સ્તરે, બંધારણ વર્ણવેલ આદર્શ વર્તન અપનાવવા માટેના મોડેલને માર્ગદર્શન આપે છે [therein]”એન્થ્રોપિક ટીમે સમજાવ્યું, શું તે “ઝેરી અથવા ભેદભાવપૂર્ણ આઉટપુટને ટાળવામાં મદદ કરે છે, માનવોને ગેરકાયદેસર અથવા અનૈતિક પ્રવૃત્તિઓમાં સામેલ થવાનું ટાળવામાં મદદ કરે છે, અને વધુ વ્યાપક રીતે એવી AI સિસ્ટમ બનાવે છે જે ‘મદદરૂપ, પ્રમાણિક અને હાનિકારક’ હોય.”
આજના ચેટબોટ્સને નિષિદ્ધ વિષયો પર ચર્ચા કરવા, ધર્માંધ સામગ્રીનું પુનઃપ્રસારણ કરવા અને ખોટી માહિતી ફેલાવવા માટે છેતરવું બિલકુલ મુશ્કેલ નથી. તેથી જ AI પ્રણેતા એન્થ્રોપિકે તેના જનરેટિવ AI, ક્લાઉડને ઔચિત્યના 10 સિક્રેટ સિદ્ધાંતોના મિશ્રણ સાથે રજૂ કર્યું, જે તેણે માર્ચમાં જાહેર કર્યું. મંગળવારે એક બ્લોગ પોસ્ટમાં, કંપનીએ આગળ સમજાવ્યું કે તેની બંધારણીય AI સિસ્ટમ કેવી રીતે ડિઝાઇન કરવામાં આવી છે અને તેને કેવી રીતે સંચાલિત કરવી.