Ez a nyílt forráskódú AI eszköz gyorsan elkülöníti a vokál minden dal

felosztása egy dalt külön ének és hangszerek mindig is fejfájás a termelők, DJ-k, és bárki más, aki akar játszani körül elszigetelt audio. Ennek sokféle módja van, de a folyamat időigényes lehet, az eredmények gyakran tökéletlenek. Egy új nyílt forráskódú AI eszköz teszi ezt a trükkös feladat gyorsabb és könnyebb.

a szoftvert Spleeternek hívják, amelyet a Deezer zenei streaming szolgáltatás fejlesztett ki kutatási célokra. Tegnap a cég nyílt forráskódú csomagként adta ki, amivel bárki letöltheti és felhasználhatja a githubra a kódot. Csak takarmány Spleeter egy audio fájlt, és spleets osztja azt két, négy, vagy öt különálló hangsávot néven szárak. Az eredmények nem tökéletesek, de kiválóan használhatók, maga a Spleeter pedig nagyon gyors. Ha egy dedikált GPU-n fut, akkor az audiofájlokat négy szárra oszthatja 100-szor gyorsabban, mint valós időben.

meg lehet hallgatni egy példát a szoftver dolgozik David Bowie” változások ” alatt. Van néhány hanganyag mind a csak vokális, mind a csak sávos szárakban, de az általános eredmények fantasztikusak. És ha Bowie nem a te dolgod, itt van egy másik Spleeter példa a szerelem és veszteség időtlen balladájára: “Scatman (Ski-Ba-Bop-Ba-DOP-Bop).”

Andy Baio Technológus kiváló blogbejegyzést írt Spleeterről, rengeteg saját példájával. Baio szerint a szoftver által előállított elszigetelt ének ” néha robotos autotuned érzést kap, de a vérzés mennyisége megdöbbentően alacsony a többi megoldáshoz képest.”Meg lehet hallgatni egy példát által generált Baio alább Spleeter futó Marvin Gaye” hallottam, hogy a szőlőből.”(De mindenképpen kattintson át az eredeti posztjára, ha több elszigetelt vokális számot szeretne hallani Lil NAS X, Lizzo, Led Zeppelin stb.)

Marvin Gaye – “azt Hallottam, Hogy a Verebek”

Marvin Gaye (Ének Csak)
Marvin Gaye (Csak Zene)

Baio rámutat, hogy Spleeter is nagyon hasznos mindazok számára, akik létre mashups, ahogy ő is igazolja magát egy szentségtelen unió a Barátok téma dallam (“Ott Leszek az, Hogy” a Rembrandts) a szöveg a Billy Joel, hogy “Mi nem a Tüzet.”

Ez az eszköz rendkívül alkalmasnak tűnik, de figyelmeztetni kell: a használatához technikai szakértelemre lesz szüksége. Hacsak nem rendszeresen játszik olyan szoftverekkel, mint a Python vagy a Google AI Toolkit TensorFlow (amelyet a Spleeter edzésére használtak), le kell töltenie néhány programot, hogy mindent elindítson. Kényelmes lesz egy parancssori bemenet használata (bár nagyon egyszerű) a hozzáférhetőbb vizuális felület helyett.

Deezer megjegyzi, hogy nem ez az első alkalom, hogy az emberek gépi tanulással automatizálják ezt a feladatot, és hogy a vállalat eredményei sok korábbi kutatásra épülnek. Aurelien Herault, a Deezer vezető adat-és kutatási igazgatója a The Verge-nek elmondta, hogy a cég 20 000 zeneszámra képezte ki szoftverét, előre izolált vokállal több műfajban. Ebből az információból a szoftver megtanulta, hogyan kell elkülöníteni a számokat.

összességében a Spleeter egy másik fantasztikus példa arra, hogy az AI eszközök miként tehetik egyszerűbbé a kreatív munka fiddly bitjeit. A gépi tanulást jelenleg számos időigényes feladat automatizálására használják, a képek hátterének eltávolításától a régi videojátékok textúráinak kiemeléséig. Ezek az eszközök egyre inkább beépülnek a fogyasztói szoftverekbe, az Adobe Photoshop-tól az új versenyzőkig, mint például a Runway ML.

Deezer szerint nem tervezi, hogy a Spleetert fogyasztói eszközré alakítja, de mások elvehetik a munkájukat, és egy egyszerű felületet üthetnek rá. A nyilvánvaló alkalmazások a DJ-k és a termelők szeretnének integrálni elszigetelt ének keverékek, vagy az emberek szeretnének létrehozni homebrew karaoke háttér számokat. (Előfordulhat, hogy az ilyen tevékenységek nem felelnek meg a szerzői jognak a végtermék terjesztésének módjától függően.)

A Deezer maga a spleetert használja számos olyan kutatási alkalmazáshoz, amelyek segítenek a streaming szolgáltatás javításában. “Belsőleg előfeldolgozási eszközként használjuk olyan komplex kutatási feladatokhoz, mint a zene kategorizálása, átírás és nyelvfelismerés” – mondja Herault.

vagy természetesen csak arra használhatja, hogy jobban megbirkózzon a Scatmannel. Ski-bi dibby Dib yo da dub dub.

Related Posts

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük