att dela en låt i separata sång och instrument har alltid varit en huvudvärk för producenter, DJs och alla andra som vill leka med Isolerat ljud. Det finns många sätt att göra det men processen kan vara tidskrävande och resultaten ofta ofullkomliga. Ett nytt AI-verktyg med öppen källkod gör denna knepiga uppgift snabbare och enklare.
programvaran heter Spleeter och utvecklades av musikströmningstjänsten Deezer för forskningsändamål. Igår släppte företaget det som ett open-source-paket, sätta koden upp på Github för alla att ladda ner och använda. Mata bara Spleeter en ljudfil och den spleets delar upp den i två, fyra eller fem separata ljudspår som kallas stammar. Resultaten är inte perfekta men de är mycket användbara och Spleeter själv är väldigt snabb. När du kör på en dedikerad GPU kan den dela upp ljudfiler i fyra stammar 100 gånger snabbare än realtid.
Du kan lyssna på ett exempel på programvaran som arbetar med David Bowies ”ändringar” nedan. Det finns några ljudartefakter i både sång-och band-bara stammar men de övergripande resultaten är fantastiska. Och om Bowie inte är din sak, här är ett annat Spleeter-exempel för den tidlösa balladen av kärlek och förlust: ”Scatman (Ski-ba-Bop-Ba-Dop-Bop).”
teknologen Andy Baio skrev ett utmärkt blogginlägg om Spleeter med många egna exempel. Baio säger att den isolerade sången som produceras av programvaran ”ibland får en robot autotuned känsla, men mängden blödning är chockerande låg i förhållande till andra lösningar.”Du kan lyssna på ett exempel genererat av Baio nedan med Spleeter som körs på Marvin Gayes” jag hörde det genom vinrankan.”(Men klicka definitivt vidare till sitt ursprungliga inlägg om du vill höra mer isolerade vokalspår från Lil nas X, Lizzo, Led Zeppelin och andra.)
Marvin Gaye – ”jag hörde det genom Grapevine”
Baio påpekar att Spleeter också kommer att vara mycket användbart för alla som vill skapa mashups, eftersom han demonstrerar sig med en ohelig union av Friends theme tune (”jag kommer att vara där för dig” av Rembrandts) med texterna från Billy Joels ”We Didn’ t starta elden.”
det här verktyget verkar extremt kapabelt men varnas: du behöver lite teknisk expertis för att använda den. Om du inte regelbundet spelar med programvara som Python eller Googles AI toolkit TensorFlow (som användes för att träna Spleeter) måste du ladda ner några program för att få allt igång. Och du måste vara bekväm med en kommandoradsinmatning (om än en mycket enkel) istället för ett mer tillgängligt visuellt gränssnitt.
Deezer konstaterar att detta inte är första gången människor har använt maskininlärning för att automatisera denna uppgift, och att företagets prestationer bygger på mycket tidigare forskning. Talar till The Verge via e-post, säger Deezers chefsdata och forskningsofficer Aurelien Herault att företaget utbildade sin programvara på 20 000 musikaliska spår med förisolerade sång över en rad genrer. Från denna information lärde sig programvaran hur man isolerar spåren själv.
Sammantaget är Spleeter ett annat fantastiskt exempel på hur AI-verktyg kan göra fiddly bitar av kreativt arbete enklare. Maskininlärning används för närvarande för att automatisera en rad tidskrävande uppgifter, från att ta bort bakgrunder på bilder till uppskalning av texturer i gamla videospel. Och i allt högre grad införlivas dessa verktyg i konsumentprogramvara, från Adobes Photoshop till nya utmanare som Runway ML.
Deezer säger att det inte har några planer på att göra Spleeter till ett konsumentverktyg, men andra kan ta sitt arbete och slå ett enkelt gränssnitt på det. De uppenbara applikationerna är för DJs och producenter som vill integrera isolerad sång i mixar, eller för personer som vill skapa homebrew karaoke backing tracks. (Sådana aktiviteter kanske inte överensstämmer med upphovsrättslagen beroende på hur slutprodukten distribueras.)
Deezer själv använder Spleeter för en rad forskningsapplikationer som hjälper till att förbättra sin streamingtjänst. ”Internt använder vi det som ett förbehandlingsverktyg för komplexa forskningsuppgifter som musikkategorisering, transkription och språkidentifiering”, säger Herault.
eller, naturligtvis, kan du bara använda den för att bättre komma till rätta med Scatman. Ski-bi dibby dib yo da dub dub.