સ્ટેબિલિટી AI તેના સંગીત-જનરેશન પ્લેટફોર્મનું અદ્યતન સંસ્કરણ છે. સિસ્ટમ વપરાશકર્તાઓને ટેક્સ્ટ પ્રોમ્પ્ટ દ્વારા ત્રણ મિનિટ સુધીનો ઑડિયો બનાવવાની મંજૂરી આપે છે. આ વાસ્તવિક ગીતની લંબાઈની આસપાસ છે, તેથી તે એક પ્રસ્તાવના, સંપૂર્ણ તાર પ્રગતિ અને એક આઉટરો પણ બનાવશે.
પ્રથમ, સારા સમાચાર. ત્રણ મિનિટ ખૂબ લાંબી છે. સોફ્ટવેરનું પાછલું વર્ઝન મહત્તમ 90 સેકન્ડ સુધી ચાલ્યું હતું. ફક્ત રોબ થોમસ/સેન્ટાના ટ્રેકની શૈલીમાં તમે બનાવટી જન્મદિવસના ગીતની કલ્પના કરો. બીજો આશીર્વાદ? આ સાધન કંપનીની વેબસાઇટ દ્વારા મફત અને સાર્વજનિક રૂપે ઉપલબ્ધ છે, તેથી તેનો ઉપયોગ કરો.
સ્ટેબલ ઑડિઓ 2.0 રજૂ કરી રહ્યાં છીએ – એક જ પ્રોમ્પ્ટથી 44.1 kHz સ્ટીરિયો પર ત્રણ મિનિટ સુધીના સાતત્યપૂર્ણ મ્યુઝિકલ સ્ટ્રક્ચર સાથે ઉચ્ચ-ગુણવત્તાવાળા, સંપૂર્ણ ટ્રેક બનાવવા માટે સક્ષમ નવું મોડલ.
મોડેલનું અન્વેષણ કરો અને મફતમાં નિર્માણ કરવાનું શરૂ કરો: https://t.co/E9ZIGagmPf
વાંચો… pic.twitter.com/rFGb0KpdeX
– સ્થિરતા AI (@StabilityAI) 3 એપ્રિલ 2024
તે મુખ્યત્વે ટેક્સ્ટ પ્રોમ્પ્ટ દ્વારા કામ કરે છે, પરંતુ તેમાં ઓડિયો ક્લિપ્સ અપલોડ કરવાનો વિકલ્પ પણ છે. સિસ્ટમ ક્લિપનું વિશ્લેષણ કરશે અને કંઈક આવું જ બનાવશે. અપલોડ કરેલ તમામ ઑડિયો કૉપિરાઇટ-મુક્ત હોવા જોઈએ, તેથી તે પહેલેથી અસ્તિત્વમાં છે તે કંઈક કૉપિ કરવાનો હેતુ નથી. તેના બદલે, તે ડ્રમના ભાગને ગુંજારવા માટે અથવા 20-સેકન્ડની ક્લિપને લાંબા સમય સુધી વિસ્તૃત કરવા માટે ઉપયોગી થઈ શકે છે.
હવે, ખરાબ સમાચાર. તે હજુ પણ AI-જનરેટેડ સંગીત છે. તે વાતચીતના ભાગ તરીકે અને સંભવિત ભવિષ્યના પ્રતીક તરીકે સારું છે જે ટિંકરર્સ માટે સારું છે અને સંગીતકારો માટે ખરાબ છે, પરંતુ તે તેના વિશે છે. જ્યાં સુધી સીમ દેખાવાનું શરૂ ન થાય ત્યાં સુધી ગીતો શરૂઆતમાં ખરેખર સારા લાગે છે. પછી વસ્તુઓ થોડી ડરામણી બની જાય છે.
ઉદાહરણ તરીકે, સિસ્ટમ સ્વરો ઉમેરવાનું પસંદ કરે છે, પરંતુ કોઈપણ જાણીતી માનવ ભાષામાં નથી. મને લાગે છે કે તે કોઈપણ ભાષા છે જે AI-જનરેટેડ ઈમેજોમાં ટેક્સ્ટ બનાવે છે. અવાજો વાસ્તવિક લોકો જેવા સંભળાય છે, અને અન્ય સમયે તેઓ બાહ્ય અવકાશમાં ફિલ્ટર કરેલા ગ્રેગોરિયન ગીતો જેવા સંભળાય છે. તે અનન્ય ખીણની મધ્યમાં તે યોગ્ય સ્થાન છે. ધાર “સૌમ્ય અને વિચિત્ર,” તેમને વ્હેલના અવાજો સાથે સરખાવી. તે ટ્રેક.
સ્ટેટિક ઑડિઓ 2.0 એ જ વિચિત્ર નાની ભૂલો કરે છે જે આ બધી સિસ્ટમો કરે છે, આઉટપુટ પ્રકારને ધ્યાનમાં લીધા વગર. ભાગો પાતળી હવામાં અદૃશ્ય થઈ શકે છે, જેનું સ્થાન કંઈક બીજું છે. કેટલીકવાર મધુર તત્વો ક્યાંયથી બમણા થઈ જાય છે, જેમ કે AI-જનરેટેડ ઈમેજીસમાં તે વધારાની આંગળીઓના ઓડિયો વર્ઝન.
નવા સ્ટેબલ ઓડિયો 2.0 સાથે બિલ્ટ @StabilityAI, pic.twitter.com/kmN0eubJSK
-ક્રિસ મેકી (@cmcky) 3 એપ્રિલ 2024
વેલ, તે બધા માટે કંટાળાજનક એક બીટ છે. આ માત્ર નામનું સંગીત છે. માનવ જોડાણ વિના, શું મુદ્દો છે? હું અન્ય વ્યક્તિ અથવા લોકોના જૂથના મગજમાં પ્રવેશવા માટે સંગીત સાંભળું છું. આર્ટિફિશિયલ જનરલ ઈન્ટેલિજન્સ (AGI) માત્ર મહિનાઓ દૂર છે એવી વારંવારની ઘોષણાઓ છતાં, અહીં પ્રવેશવાનો કોઈ રસ્તો નથી.
તેથી, આ ટેક્નોલોજી એવા લોકો માટે એક સંપૂર્ણ ભેટ છે જેઓ મૂર્ખ બર્થડે વીડિયો અથવા બેંક હોલ્ડ મ્યુઝિક બનાવે છે. બીજા બધા માટે? ખભા shrugging. એક વસ્તુ હું અંગત અનુભવથી કહી શકું છું: તે ખૂબ જ ઝડપી છે. સિસ્ટમે લગભગ એક મિનિટમાં મારી બિલાડી વિશે ખરેખર ભયંકર મોટા બેન્ડ ગીતનું નિર્માણ કર્યું.
આ લેખ મૂળરૂપે Engadget પર https://www.engadget.com/stability-ais-audio-generator-can-now-crank-out-3-minute-songs-160620135.html?src=rss પર દેખાયો હતો.