Apple આજે AI ગેમમાં ટોચના ખેલાડીઓમાંનું એક નથી, પરંતુ ઇમેજ એડિટિંગ માટે કંપનીનું નવું ઓપન સોર્સ AI મોડલ દર્શાવે છે કે તે આ ક્ષેત્રમાં શું યોગદાન આપવા સક્ષમ છે. મોડેલને એમએલએલએમ-ગાઇડેડ ઇમેજ એડિટિંગ (એમજીઆઇઇ) કહેવામાં આવે છે, જે છબીઓની હેરફેર કરતી વખતે ટેક્સ્ટ-આધારિત આદેશોનું અર્થઘટન કરવા માટે મલ્ટિમોડલ લાર્જ લેંગ્વેજ મોડલ્સ (એમએલએલએમ) નો ઉપયોગ કરે છે. બીજા શબ્દોમાં કહીએ તો, ટૂલમાં વપરાશકર્તા દ્વારા ટાઇપ કરેલા ટેક્સ્ટના આધારે ફોટાને સંપાદિત કરવાની ક્ષમતા છે. જ્યારે તે આવું કરી શકે તેવું પહેલું સાધન નથી, “માનવ સૂચનાઓ કેટલીકવાર વર્તમાન પદ્ધતિઓ માટે કેપ્ચર અને અનુસરવા માટે ખૂબ સંક્ષિપ્ત હોય છે,” પ્રોજેક્ટના પેપર (PDF) વાંચે છે.
કંપનીએ કેલિફોર્નિયા યુનિવર્સિટી, સાન્ટા બાર્બરાના સંશોધકો સાથે MGIE વિકસાવ્યું. MLLM પાસે સરળ અથવા અસ્પષ્ટ ટેક્સ્ટ પ્રોમ્પ્ટ્સને વધુ વિગતવાર અને સ્પષ્ટ સૂચનાઓમાં રૂપાંતરિત કરવાની શક્તિ છે જેને ફોટો એડિટર પોતે અનુસરી શકે છે. ઉદાહરણ તરીકે, જો કોઈ વપરાશકર્તા પેપેરોની પિઝાના ફોટાને “તેને વધુ સ્વસ્થ બનાવવા” માટે સંપાદિત કરવા માંગે છે, તો MLLM આને “વેજીટેબલ ટોપિંગ્સ ઉમેરો” તરીકે અર્થઘટન કરી શકે છે અને તે રીતે ફોટોને સંપાદિત કરી શકે છે.
ઈમેજીસમાં મોટા ફેરફારો કરવા ઉપરાંત, MGIE ફોટાને ક્રોપ, રીસાઈઝ અને ફેરવી શકે છે, તેમજ ટેક્સ્ટ પ્રોમ્પ્ટ દ્વારા તેની બ્રાઈટનેસ, કોન્ટ્રાસ્ટ અને કલર બેલેન્સ સુધારી શકે છે. તે ફોટોના ચોક્કસ વિસ્તારોને પણ સંપાદિત કરી શકે છે અને, ઉદાહરણ તરીકે, વ્યક્તિના વાળ, આંખો અને કપડાંને સંશોધિત કરી શકે છે અથવા પૃષ્ઠભૂમિમાંના ઘટકોને દૂર કરી શકે છે.
તરીકે વેન્ચરબીટ નોંધ, Apple એ GitHub દ્વારા મોડલ બહાર પાડ્યું, પરંતુ રસ ધરાવનારાઓ ડેમો પણ અજમાવી શકે છે જે હાલમાં હગિંગ ફેસ સ્પેસ પર હોસ્ટ કરવામાં આવે છે. Apple એ હજુ સુધી કહ્યું નથી કે શું તે આ પ્રોજેક્ટમાંથી જે શીખે છે તેનો ઉપયોગ કોઈ સાધનમાં કરવાની યોજના ધરાવે છે કે પછી તે તેના કોઈપણ ઉત્પાદનોમાં સમાવી શકે તેવી સુવિધા.
આ લેખ મૂળ રૂપે Engadget પર દેખાયો https://www.engadget.com/apple-releases-an-ai-model-that-can-edit-images-based-on-text-based-commands-081646262.html?src પ્રકાશિત ચાલુ =RSS