felosztása egy dalt külön ének és hangszerek mindig is fejfájás a termelők, DJ-k, és bárki más, aki akar játszani körül elszigetelt audio. Ennek sokféle módja van, de a folyamat időigényes lehet, az eredmények gyakran tökéletlenek. Egy új nyílt forráskódú AI eszköz teszi ezt a trükkös feladat gyorsabb és könnyebb.
a szoftvert Spleeternek hívják, amelyet a Deezer zenei streaming szolgáltatás fejlesztett ki kutatási célokra. Tegnap a cég nyílt forráskódú csomagként adta ki, amivel bárki letöltheti és felhasználhatja a githubra a kódot. Csak takarmány Spleeter egy audio fájlt, és spleets osztja azt két, négy, vagy öt különálló hangsávot néven szárak. Az eredmények nem tökéletesek, de kiválóan használhatók, maga a Spleeter pedig nagyon gyors. Ha egy dedikált GPU-n fut, akkor az audiofájlokat négy szárra oszthatja 100-szor gyorsabban, mint valós időben.
meg lehet hallgatni egy példát a szoftver dolgozik David Bowie” változások ” alatt. Van néhány hanganyag mind a csak vokális, mind a csak sávos szárakban, de az általános eredmények fantasztikusak. És ha Bowie nem a te dolgod, itt van egy másik Spleeter példa a szerelem és veszteség időtlen balladájára: “Scatman (Ski-Ba-Bop-Ba-DOP-Bop).”
Andy Baio Technológus kiváló blogbejegyzést írt Spleeterről, rengeteg saját példájával. Baio szerint a szoftver által előállított elszigetelt ének ” néha robotos autotuned érzést kap, de a vérzés mennyisége megdöbbentően alacsony a többi megoldáshoz képest.”Meg lehet hallgatni egy példát által generált Baio alább Spleeter futó Marvin Gaye” hallottam, hogy a szőlőből.”(De mindenképpen kattintson át az eredeti posztjára, ha több elszigetelt vokális számot szeretne hallani Lil NAS X, Lizzo, Led Zeppelin stb.)
Marvin Gaye – “azt Hallottam, Hogy a Verebek”
Baio rámutat, hogy Spleeter is nagyon hasznos mindazok számára, akik létre mashups, ahogy ő is igazolja magát egy szentségtelen unió a Barátok téma dallam (“Ott Leszek az, Hogy” a Rembrandts) a szöveg a Billy Joel, hogy “Mi nem a Tüzet.”
Ez az eszköz rendkívül alkalmasnak tűnik, de figyelmeztetni kell: a használatához technikai szakértelemre lesz szüksége. Hacsak nem rendszeresen játszik olyan szoftverekkel, mint a Python vagy a Google AI Toolkit TensorFlow (amelyet a Spleeter edzésére használtak), le kell töltenie néhány programot, hogy mindent elindítson. Kényelmes lesz egy parancssori bemenet használata (bár nagyon egyszerű) a hozzáférhetőbb vizuális felület helyett.
Deezer megjegyzi, hogy nem ez az első alkalom, hogy az emberek gépi tanulással automatizálják ezt a feladatot, és hogy a vállalat eredményei sok korábbi kutatásra épülnek. Aurelien Herault, a Deezer vezető adat-és kutatási igazgatója a The Verge-nek elmondta, hogy a cég 20 000 zeneszámra képezte ki szoftverét, előre izolált vokállal több műfajban. Ebből az információból a szoftver megtanulta, hogyan kell elkülöníteni a számokat.
összességében a Spleeter egy másik fantasztikus példa arra, hogy az AI eszközök miként tehetik egyszerűbbé a kreatív munka fiddly bitjeit. A gépi tanulást jelenleg számos időigényes feladat automatizálására használják, a képek hátterének eltávolításától a régi videojátékok textúráinak kiemeléséig. Ezek az eszközök egyre inkább beépülnek a fogyasztói szoftverekbe, az Adobe Photoshop-tól az új versenyzőkig, mint például a Runway ML.
Deezer szerint nem tervezi, hogy a Spleetert fogyasztói eszközré alakítja, de mások elvehetik a munkájukat, és egy egyszerű felületet üthetnek rá. A nyilvánvaló alkalmazások a DJ-k és a termelők szeretnének integrálni elszigetelt ének keverékek, vagy az emberek szeretnének létrehozni homebrew karaoke háttér számokat. (Előfordulhat, hogy az ilyen tevékenységek nem felelnek meg a szerzői jognak a végtermék terjesztésének módjától függően.)
A Deezer maga a spleetert használja számos olyan kutatási alkalmazáshoz, amelyek segítenek a streaming szolgáltatás javításában. “Belsőleg előfeldolgozási eszközként használjuk olyan komplex kutatási feladatokhoz, mint a zene kategorizálása, átírás és nyelvfelismerés” – mondja Herault.
vagy természetesen csak arra használhatja, hogy jobban megbirkózzon a Scatmannel. Ski-bi dibby Dib yo da dub dub.