Lemonade je jedním z nejžhavějších letošních IPO a klíčovým důvodem jsou vysoké investice společnosti do AI (umělá inteligence). Společnost využila tuto technologii k vývoji robotů pro zpracování nákupu politik a správy pohledávek.
Jak tedy taková společnost vytváří modely AI? Jaký je proces? No, jak by nemělo být žádným překvapením, je to složité a náchylné k selhání.
ale na druhou stranu je třeba mít na paměti některé klíčové zásady. Pojďme se tedy podívat:
výběr: na výběr jsou stovky algoritmů. V některých případech je nejlepším přístupem použít několik (toto je známé jako modelování souborů).
“ výběr správného modelu začíná důkladným pochopením toho, čeho chce organizace dosáhnout,“ řekl Shadi Sifain, který je senior manažerem datové vědy a prediktivní analýzy ve společnosti Paychex. „Výběr správného modelu se často také zahrnuje vyrovnávání řadu požadavků, včetně modelu, výkonu, přesnosti, interpretovatelnost, a výpočetní výkon mezi další faktory,“
je důležité si uvědomit, že budete potřebovat správný druh údaje pro určité modely. Pokud něco, je to jedna z největších výzev v procesu vývoje AI. „V průměru, příprava dat proces trvá 2X, nebo v některých případech 3X déle to jen návrh algoritmu strojového učení,“ řekla Valeria Sadovykh, který je nově Vznikající Technologie, Globální Dodací PwC Labs.
takže v raných fázích projektu musíte získat dobrý přehled o datech. „Provést explorativní analýzy,“ řekl Dan Simion, který je VP AI & Analytics v Capgemini Severní Americe. „Vizualizujte data ve 2-rozměrech a 3-rozměrech a poté spusťte jednoduché popisné statistiky, abyste lépe porozuměli datům. Dále zkontrolujte anomálie a chybějící data. Poté vyčistěte data, abyste získali lepší obrázek o velikosti vzorku.“
ale neexistuje dokonalý model, protože vždy budou kompromisy.
„je Tam stará věta v strojového učení a rozpoznávání vzorů společenství zvané Žádný Oběd Zdarma Věta, která uvádí, že neexistuje jediný model, který je nejlepší na všechny úkoly,“ řekl Dr. Jason Corso, který je Profesorem Elektrického Inženýrství a Počítačové Vědy na University of Michigan a co-zakladatel a generální ŘEDITEL společnosti Voxel51. „Pochopení vztahů mezi předpoklady, které model vytváří, a předpoklady, které úkol dělá, je klíčové.“
školení: jakmile máte algoritmus-nebo jejich sadu-chcete provést testy proti datové sadě. Osvědčeným postupem je rozdělit datovou sadu na nejméně dvě části. Přibližně 70% až 80% je určeno pro testování a ladění modelu. Zbývající pak budou použity pro ověření. Prostřednictvím tohoto procesu se podíváme na míry přesnosti.
dobrou zprávou je, že existuje mnoho platforem AI, které mohou pomoci zefektivnit proces. Tam jsou open source produkty, jako jsou například TensorFlow, PyTorch, KNIME, Anakonda a Keras, stejně jako proprietární aplikace, jako je Alteryx, Databricks, DataRobot, MathWorks a SAS. A samozřejmě existují bohaté systémy AI od Amazonu, Microsoftu a Google.
„klíčem je hledat nástroje s otevřeným zdrojovým kódem, které umožňují snadné a rychlé experimentování,“ řekla Monica Livingston, která je ředitelkou prodeje AI ve společnosti Intel. „Pokud dáváte přednost nákupu 3rd party řešení, existuje mnoho Isv nabízí AI-založené řešení pro úkoly, jako je rozpoznávání obrazu, chat boti, vadu detekce a tak dále.“
Feature Engineering: Toto je proces hledání proměnných, které jsou nejlepšími prediktory pro model. Zde je nezbytná odbornost datového vědce. Často je však také potřeba, aby odborníci na domény pomohli.
„Chcete-li provést funkce, techniky, lékaře budování modelu je nutné mít dobré znalosti o problému po ruce—například, mít představu o možné efektivní prediktory ještě předtím, než se jejich objevování prostřednictvím dat,“ řekl Jason Cottrell, kdo je generální ŘEDITEL Myplanet. „Například v případě předpovídání selhání žadatelů o úvěr by účinným prediktorem mohl být měsíční tok příjmů od žadatele.“
ale nalezení správných funkcí může být v některých situacích téměř nemožné. To by mohl být případ počítačového vidění, například při použití s autonomními vozidly. Přesto může být řešením použití sofistikovaného hlubokého učení.
„v Těchto dnech, neuronové sítě se používají naučit funkce, jako jsou lepší na pochopení statistiky než lidé,“ řekl Eric Yeh, kdo je počítačový vědec v oblasti Umělé Inteligence Centrum v SRI International. „Nejsou však nutně všelékem a mohou vyvinout funkce, které nebyly také zamýšleny. Slavným příkladem je klasifikátor obrazu, který byl vyvinut pro detekci tanků a džípů. Namísto, naučil se detekovat noc a den, protože všechny jeepové fotografie byly pořízeny ve dne a všechny tankové fotografie byly pořízeny v muzeu v noci.“
Tom (@ttaulli) je poradcem pro startupy a autor Umělé Inteligence Základy: Non-Technický Úvod a Robotické Automatizace Procesů Příručka: Příručka k Provádění RPA Systémy. Vyvinul také různé online kurzy, například pro programovací jazyk Python.
Následujte mě na Twitteru nebo LinkedIn. Podívejte se na mé webové stránky nebo některé z mých dalších prací zde.