સ્ટેબલ ડિફ્યુઝનની જનરેટિવ આર્ટ હવે એનિમેટેડ થઈ શકે છે, ડેવલપર સ્ટેબિલિટી AIએ જાહેરાત કરી. કંપનીએ રિસર્ચ પ્રીવ્યૂમાં સ્ટેબલ વિડિયો ડિફ્યુઝન નામની નવી પ્રોડક્ટ રિલીઝ કરી છે, જે યુઝર્સને એક જ ઈમેજમાંથી વીડિયો બનાવવાની મંજૂરી આપે છે. કંપનીએ લખ્યું, “આ અત્યાધુનિક જનરેટિવ AI વિડિયો મોડલ તમામ લોકો માટે, તમામ પ્રકારના મોડલ બનાવવા તરફની અમારી સફરમાં એક મહત્વપૂર્ણ પગલું રજૂ કરે છે.”
નવું ટૂલ બે ઇમેજ-ટુ-વિડિયો મૉડલ તરીકે રિલીઝ કરવામાં આવ્યું છે, જેમાં પ્રત્યેક 576×1024 રિઝોલ્યુશન પર 3 થી 30 ફ્રેમ પ્રતિ સેકન્ડની ઝડપે 14 થી 25 ફ્રેમ લાંબી જનરેટ કરવામાં સક્ષમ છે. તે મલ્ટિ-વ્યુ ડેટાસેટ્સ પર ફાઇન-ટ્યુનિંગ સાથે સિંગલ ફ્રેમમાંથી મલ્ટિ-વ્યૂ સિન્થેસિસ કરવા સક્ષમ છે. કંપનીએ તેની તુલના ટેક્સ્ટ-ટુ-વિડિયો પ્લેટફોર્મ્સ રનવે અને પીકા લેબ્સ સાથે કરી હતી, અને કહ્યું હતું કે, “પ્રકાશન સમયે તેમના મૂળભૂત સ્વરૂપમાં, બાહ્ય મૂલ્યાંકન દ્વારા, અમને જાણવા મળ્યું કે આ મોડલ્સે યુઝર પ્રેફરન્સ સ્ટડીઝમાં અગ્રણી બંધ મોડલને પાછળ રાખી દીધા છે.” ”
સ્ટેટિક વિડિયો પ્રચાર આ બિંદુએ માત્ર સંશોધન હેતુઓ માટે જ ઉપલબ્ધ છે, વાસ્તવિક દુનિયા અથવા વ્યાપારી એપ્લિકેશનો માટે નહીં. સંભવિત વપરાશકર્તાઓ “ટેક્સ્ટ-ટુ-વિડિયો ઈન્ટરફેસ દર્શાવતા આગામી વેબ અનુભવ”ની ઍક્સેસ માટે રાહ જોઈ રહેલી સૂચિમાં જોડાવા માટે સાઇન અપ કરી શકે છે,” સ્થિરતા AIએ લખ્યું. આ સાધન જાહેરાત, શિક્ષણ, મનોરંજન અને અન્ય ક્ષેત્રોમાં સંભવિત એપ્લિકેશનોનું નિદર્શન કરશે.
ઉપરોક્ત વિડિયોમાં બતાવેલ નમૂનાઓ પ્રતિસ્પર્ધી જનરેટર પ્રણાલીઓ સાથે મેળ ખાતા પ્રમાણમાં ઉચ્ચ ગુણવત્તાના હોય છે. જો કે, તેની કેટલીક મર્યાદાઓ છે, કંપનીએ લખ્યું: તે પ્રમાણમાં ટૂંકા વિડિયો (4 સેકન્ડથી ઓછા) બનાવે છે, તેમાં સાચા ફોટોરિયલિઝમનો અભાવ છે, ધીમા પેન સિવાય કૅમેરાની હલનચલન કરી શકતી નથી, તેમાં કોઈ ટેક્સ્ટ નિયંત્રણો નથી, સુવાચ્ય ટેક્સ્ટ જનરેટ કરી શકાતું નથી અને તે જનરેટ કરી શકતું નથી. લોકો અને ચહેરાઓ યોગ્ય રીતે.
આ ટૂલને લાખો વિડિયોના ડેટાસેટ પર તાલીમ આપવામાં આવી હતી અને પછી નાના સેટ પર ફાઇન-ટ્યુન કરવામાં આવ્યું હતું, જેમાં સ્ટેબિલિટી AIએ માત્ર એટલું જ કહ્યું હતું કે તે એવા વીડિયોનો ઉપયોગ કરે છે જે સંશોધન હેતુઓ માટે સાર્વજનિક રીતે ઉપલબ્ધ છે. ડેટા સેટની ઉત્પત્તિ મહત્વપૂર્ણ છે, આપેલ છે કે સ્ટેબિલિટી AI પર તાજેતરમાં ગેટ્ટી ઇમેજ દ્વારા તેના ઇમેજ આર્કાઇવ્સને સ્ક્રેપ કરવા માટે દાવો કરવામાં આવ્યો હતો.
સામગ્રી બનાવટને સરળ બનાવવાની તેની ક્ષમતાને કારણે, વિડિયો સામાન્ય AI માટે મુખ્ય લક્ષ્ય છે. જો કે, તે એક સાધન પણ છે જેનો ડીપફેક, કોપીરાઇટ ઉલ્લંઘન અને વધુ દ્વારા દુરુપયોગની સૌથી વધુ સંભાવના છે. અને તેના ચેટજીપીટી પ્રોડક્ટ સાથે ઓપનએઆઈથી વિપરીત, સ્ટેબિલિટીને તેના સ્ટેબલ ડિફ્યુઝન પ્રોડક્ટનું વ્યાપારીકરણ કરવામાં ઓછી સફળતા મળી છે અને તે ઊંચા દરે રોકડ બર્ન કરે છે. ટેકક્રંચ નોંધ્યું અને ગયા અઠવાડિયે, એડ ન્યૂટન-રેક્સ, સ્ટેબિલિટી AI ખાતે ઑડિયોના વાઇસ પ્રેસિડેન્ટ, જનરેટિવ AI મૉડલ્સને તાલીમ આપવા માટે કૉપિરાઇટ કરેલી સામગ્રીના ઉપયોગ પર રાજીનામું આપ્યું.
આ લેખ મૂળરૂપે Engadget પર https://www.engadget.com/the-ai-startup-behind-stable-dif Fusion-is-now-testing-generative-video-105519658.html?src=rss પર દેખાયો હતો.