So erstellen Sie ein KI-Modell (künstliche Intelligenz)

Daten

Digital generiertes Bild von Daten.

Getty

Lemonade ist einer der heißesten Börsengänge dieses Jahres und ein Hauptgrund dafür sind die hohen Investitionen des Unternehmens in KI (Künstliche Intelligenz). Das Unternehmen hat diese Technologie genutzt, um Bots für den Kauf von Policen und die Verwaltung von Ansprüchen zu entwickeln.

Wie erstellt dann ein Unternehmen wie dieses KI-Modelle? Was ist der Prozess? Nun, wie sollte es keine Überraschung sein, es ist komplex und anfällig für Fehler.

Aber andererseits gibt es einige wichtige Prinzipien zu beachten. Werfen wir also einen Blick darauf:

Auswahl: Es stehen Hunderte von Algorithmen zur Auswahl. In einigen Fällen besteht der beste Ansatz darin, mehrere zu verwenden (dies wird als Ensemble-Modellierung bezeichnet). „Die Auswahl des richtigen Modells beginnt mit einem gründlichen Verständnis dessen, was das Unternehmen erreichen möchte“, sagte Shadi Sifain, Senior Manager für Data Science und Predictive Analytics bei Paychex. „Die Auswahl des richtigen Modells beinhaltet oft auch die Abwägung einer Reihe von Anforderungen, darunter Modellleistung, Genauigkeit, Interpretierbarkeit und Rechenleistung.“

Es ist wichtig zu wissen, dass Sie für bestimmte Modelle die richtige Art von Daten benötigen. Wenn überhaupt, ist dies eine der größten Herausforderungen im KI-Entwicklungsprozess. „Im Durchschnitt dauert der Datenaufbereitungsprozess 2X oder in einigen Fällen 3X länger als nur das Design des maschinellen Lernalgorithmus“, sagte Valeria Sadovykh, die Emerging Technology Global Delivery Lead bei PwC Labs ist.

In den frühen Phasen eines Projekts müssen Sie also ein gutes Gefühl für die Daten bekommen. „Führen Sie eine explorative Analyse durch“, sagte Dan Simion, Vice President of AI & Analytics bei Capgemini North America. „Visualisieren Sie die Daten in 2-Dimensionen und 3-Dimensionen und führen Sie dann einfache, beschreibende Statistiken aus, um die Daten effektiver zu verstehen. Überprüfen Sie anschließend auf Anomalien und fehlende Daten. Bereinigen Sie dann die Daten, um ein besseres Bild der Stichprobengröße zu erhalten.“

Aber es gibt kein perfektes Modell, da es immer Kompromisse geben wird. „Es gibt einen alten Satz in der Gemeinschaft für maschinelles Lernen und Mustererkennung, den No Free Lunch-Satz, der besagt, dass es kein einziges Modell gibt, das für alle Aufgaben am besten geeignet ist“, sagte Dr. Jason Corso, Professor für Elektrotechnik und Informatik an der University of Michigan und Mitbegründer und CEO von Voxel51. „Daher ist es wichtig, die Beziehungen zwischen den Annahmen eines Modells und den Annahmen einer Aufgabe zu verstehen.“

Training: Sobald Sie einen Algorithmus – oder einen Satz davon – haben, möchten Sie Tests mit dem Datensatz durchführen. Die beste Vorgehensweise besteht darin, den Datensatz in mindestens zwei Teile zu unterteilen. Etwa 70% bis 80% dienen zum Testen und Abstimmen des Modells. Der Rest wird dann zur Validierung verwendet. Durch diesen Prozess wird es einen Blick auf die Genauigkeitsraten geben.Die gute Nachricht ist, dass es viele KI-Plattformen gibt, die helfen können, den Prozess zu rationalisieren. Es gibt Open-Source-Angebote wie TensorFlow, PyTorch, KNIME, Anaconda und Keras sowie proprietäre Anwendungen wie Alteryx, Databricks, DataRobot, MathWorks und SAS. Und natürlich gibt es reichhaltige KI-Systeme von Amazon, Microsoft und Google. „Der Schlüssel ist, nach Open-Source-Tools zu suchen, die einfaches und schnelles Experimentieren ermöglichen“, sagte Monica Livingston, Director of AI Sales bei Intel. „Wenn Sie lieber 3rd-Party-Lösungen kaufen möchten, gibt es viele ISVs, die KI-basierte Lösungen für Aufgaben wie Bilderkennung, Chat-Bots, Fehlererkennung usw. anbieten.“

Feature Engineering: Dies ist der Prozess des Findens der Variablen, die die besten Prädiktoren für ein Modell sind. Hier ist die Expertise eines Data Scientists unerlässlich. Aber es gibt auch oft einen Bedarf an Domain-Experten helfen. „Um Feature Engineering durchzuführen, muss der Praktiker, der das Modell erstellt, ein gutes Verständnis für das vorliegende Problem haben — zum Beispiel eine vorgefasste Vorstellung von möglichen effektiven Prädiktoren, noch bevor er sie durch die Daten entdeckt“, sagte Jason Cottrell, der CEO von Myplanet. „Bei der Vorhersage von Ausfällen für Kreditantragsteller könnte beispielsweise der monatliche Einkommensfluss des Antragstellers ein wirksamer Prädiktor sein.“

In manchen Situationen kann es jedoch fast unmöglich sein, die richtigen Funktionen zu finden. Dies könnte bei Computer Vision der Fall sein, beispielsweise bei autonomen Fahrzeugen. Die Verwendung von ausgefeiltem Deep Learning kann jedoch eine Lösung sein. „Heutzutage werden neuronale Netze verwendet, um Funktionen zu lernen, da sie Statistiken besser verstehen als Menschen“, sagte Eric Yeh, Informatiker am Artificial Intelligence Center von SRI International. „Sie sind jedoch nicht unbedingt ein Allheilmittel und können Funktionen entwickeln, die nicht so gut beabsichtigt waren. Das berühmte Beispiel ist der Image Classifier, der entwickelt wurde, um Panzer und Jeeps zu erkennen. Stattdessen lernte es, Tag und Nacht zu erkennen, da alle Jeep-Fotos am Tag und alle Panzerfotos nachts im Museum aufgenommen wurden.“

Tom (@ttaulli) ist Berater für Startups und Autor von Artificial Intelligence Basics: A Non-Technical Introduction und The Robotic Process Automation Handbook: A Guide to Implementing RPA Systems. Er hat auch verschiedene Online-Kurse entwickelt, beispielsweise für die Programmiersprache Python. Holen Sie sich das Beste von Forbes in Ihren Posteingang mit den neuesten Erkenntnissen von Experten auf der ganzen Welt. Folgen Sie mir auf Twitter oder LinkedIn. Schauen Sie sich meine Website oder einige meiner anderen Arbeiten hier an.

Laden …

Related Posts

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.