Cum se creează un model AI (inteligență artificială)

date

imagine digitală generată de date.

Getty

limonada este unul dintre cele mai tari IPO-uri din acest an și un motiv cheie pentru aceasta este investițiile grele ale companiei în AI (inteligență artificială). Compania a folosit această tehnologie pentru a dezvolta roboți pentru a gestiona achiziționarea de politici și gestionarea creanțelor.

atunci cum creează o companie ca aceasta modele AI? Care este procesul? Ei bine, așa cum nu ar trebui să fie o surpriză, este complexă și susceptibilă la eșec.

dar apoi, din nou, există câteva principii cheie pentru a păstra în minte. Deci, să aruncăm o privire:

selecție: există sute de algoritmi din care să alegeți. În unele cazuri, cea mai bună abordare este utilizarea mai multor (acest lucru este cunoscut sub numele de modelare a ansamblului).

„selectarea modelului potrivit începe cu obținerea unei înțelegeri aprofundate a ceea ce organizația dorește să realizeze”, a declarat Shadi Sifain, care este senior manager al științei datelor și al analizei predictive la Paychex. „Selectarea modelului potrivit implică adesea și echilibrarea unui număr de cerințe, inclusiv performanța modelului, precizia, interpretabilitatea și puterea de calcul, printre alți factori”,

este important să vă dați seama că aveți nevoie de tipul potrivit de date pentru anumite modele. Dacă este ceva, aceasta este una dintre cele mai mari provocări în procesul de dezvoltare AI. „În medie, procesul de pregătire a datelor durează de 2 ori sau, în unele cazuri, de 3 ori mai mult decât doar proiectarea algoritmului de învățare automată”, a spus Valeria Sadovykh, care este liderul Emerging Technology Global Delivery la PwC Labs.

deci, în primele faze ale unui proiect, aveți nevoie pentru a obține un bun simț al datelor. „Efectuați o analiză exploratorie”, a declarat Dan Simion, care este vicepreședintele ai & Analytics la Capgemini America de Nord. „Vizualizați datele în 2 dimensiuni și 3 dimensiuni, apoi executați statistici simple, descriptive pentru a înțelege datele mai eficient. Apoi, verificați dacă există anomalii și date lipsă. Apoi curățați datele pentru a obține o imagine mai bună a dimensiunii eșantionului.”

dar nu există un model perfect, deoarece vor exista întotdeauna compromisuri. „există o teoremă veche în comunitatea de învățare automată și recunoaștere a modelelor numită Teorema NO Free Lunch, care afirmă că nu există un singur model care să fie cel mai bun pentru toate sarcinile”, a spus Dr.Jason Corso, profesor de Inginerie Electrică și Informatică la Universitatea din Michigan și co-fondator și CEO al Voxel51. „Deci, înțelegerea relațiilor dintre ipotezele pe care le face un model și ipotezele pe care le face o sarcină este esențială.”

instruire: odată ce aveți un algoritm – sau un set de ele-doriți să efectuați teste împotriva setului de date. Cea mai bună practică este împărțirea setului de date în cel puțin două părți. Aproximativ 70% până la 80% este pentru testarea și reglarea modelului. Restul va fi apoi utilizat pentru validare. Prin acest proces, va exista o privire la ratele de precizie.vestea bună este că există multe platforme AI care pot ajuta la eficientizarea procesului. Există oferte open source, cum ar fi TensorFlow, PyTorch, KNIME, Anaconda și Keras, precum și aplicații proprietare precum Alteryx, Databricks, DataRobot, MathWorks și SAS. Și, desigur, există sisteme AI bogate de la Amazon, Microsoft și Google. „cheia este să căutăm instrumente open source care să permită experimentarea ușoară și rapidă”, a declarat Monica Livingston, directorul de vânzări AI la Intel. „Dacă preferați să achiziționați soluții 3rd party, există multe ISV-uri care oferă soluții bazate pe AI pentru sarcini precum recunoașterea imaginilor, roboții de chat, detectarea defectelor și așa mai departe.”

Ingineria caracteristicilor: acesta este procesul de găsire a variabilelor care sunt cei mai buni predictori pentru un model. Aici este esențială expertiza unui om de știință de date. Dar, de asemenea, este adesea nevoie ca experții în domeniu să ajute. „pentru a efectua ingineria caracteristicilor, practicianul care construiește modelul trebuie să aibă o bună înțelegere a problemei la îndemână—cum ar fi să aibă o noțiune preconcepută de posibili predictori eficienți chiar înainte de a le descoperi prin date”, a spus Jason Cottrell, care este CEO al Myplanet. „De exemplu, în cazul prezicerii implicite pentru solicitanții de împrumut, un predictor eficient ar putea fi fluxul de venit lunar de la solicitant.”dar găsirea caracteristicilor potrivite poate fi aproape imposibilă în unele situații. Acesta ar putea fi cazul viziunii pe computer, cum ar fi atunci când este utilizat cu vehicule autonome. Cu toate acestea, utilizarea învățării profunde sofisticate poate fi o soluție.

„în zilele noastre, rețelele neuronale sunt folosite pentru a învăța caracteristici, deoarece înțeleg mai bine Statisticile decât oamenii”, a spus Eric Yeh, informatician la Centrul de inteligență artificială din SRI International. „Cu toate acestea, ele nu sunt neapărat un panaceu și ar putea dezvolta trăsături care nu au fost intenționate. Celebrul exemplu este clasificatorul de imagini care a fost dezvoltat pentru a detecta tancurile și jeep-urile. În schimb, a învățat să detecteze noaptea și ziua, deoarece toate fotografiile cu jeep au fost făcute în timpul zilei și toate fotografiile cu tancuri au fost făcute în muzeu noaptea.”

Tom (@ttaulli) este consilier pentru startup-uri și autorul „Artificial Intelligence Basics: A Non-Technical Introduction” și „Robotic Process Automation Handbook: A Guide to Implementing RPA Systems”. De asemenea, a dezvoltat diverse cursuri online, cum ar fi pentru limbajul de programare Python.

Obțineți cele mai bune din Forbes în căsuța de e-mail cu cele mai recente informații de la experți din întreaga lume.

Urmați-mă pe Twitter sau LinkedIn. Check out site-ul meu sau o parte din alte munca mea aici.

se încarcă …

Related Posts

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *