レモネードは、今年の最もホットなIpoの一つであり、このための主な理由は、AI(人工知能)への同社の重い投資です。 同社は、ポリシーの購入や請求の管理を処理するためのボットを開発するために、この技術を使用しています。 では、このような会社はどのようにしてAIモデルを作成していますか? プロセスは何ですか? まあ、驚くべきことではないように、それは複雑で失敗の影響を受けやすいです。 しかし、再び、心に留めておくべきいくつかの重要な原則があります。
それでは、見てみましょう:
選択:から選択するアルゴリズムの何百もあります。 いくつかのケースでは、最良のアプローチは、いくつかを使用することです(これはアンサンブルモデリングと呼ばれます)。
“適切なモデルを選択するには、組織が達成したいことを完全に理解することから始まります”とPaychexのデータサイエンスと予測分析のシニアマネージャー “適切なモデルを選択するには、モデルのパフォーマンス、精度、解釈可能性、計算能力など、多くの要件のバランスをとることも必要です”
特定のモデルには、適切な種類のデータが必要であることを認識することが重要です。 どちらかといえば、これはAI開発プロセスにおける最大の課題の1つです。 PwC LabsのEmerging Technology Global Delivery LeadであるValeria Sadovykh氏は、「平均して、データ準備プロセスには機械学習アルゴリズムの設計に比べて2倍、場合によっては3倍の時間がかかります。 そのため、プロジェクトの初期段階では、データを十分に理解する必要があります。 Capgemini North AmericaのAI&AnalyticsのVPであるDan Simion氏は、「探索的分析を実施する」と述べています。 “データを2次元と3次元で視覚化し、単純な記述統計を実行してデータをより効果的に理解します。 次に、異常と欠損データをチェックします。 次に、データをきれいにして、サンプルサイズのより良い画像を取得します。”
しかし、常にトレードオフがあるので、完璧なモデルはありません。 ミシガン大学の電気工学とコンピュータサイエンスの教授であり、Voxel51の共同創設者兼CEOであるJason Corso博士は、”No Free Lunch Theoremと呼ばれる機械学習とパターン認識 「したがって、モデルが行う仮定とタスクが行う仮定との関係を理解することが重要です。”
トレーニング:アルゴリズムまたはそれらのセットを取得したら、データセットに対してテストを実行します。 ベストプラクティスは、データセットを少なくとも2つの部分に分割することです。 約70%から80%はモデルのテストそして調整のためです。 残りは検証に使用されます。 このプロセスを通じて、精度を見てみましょう。良いニュースは、プロセスを合理化するのに役立つ多くのAIプラットフォームがあるということです。
TensorFlow、PyTorch、KNIME、Anaconda、Kerasなどのオープンソース製品や、Alteryx、Databricks、DataRobot、MathWorks、SASなどのプロプライエタリなアプリケーションがあります。 もちろん、Amazon、Microsoft、Googleの豊富なAIシステムがあります。
“重要なのは、簡単かつ迅速な実験を可能にするオープンソースのツールを探すことです”とIntelのAIセールスディレクターであるMonica Livingston氏は述べています。 “サードパーティ製のソリューションを購入したい場合は、画像認識、チャットボット、欠陥検出などのタスクのためのAIベースのソリューションを提供するIsvが多”
特徴工学:これは、モデルの最良の予測子である変数を見つけるプロセスです。 これは、データサイエンティストの専門知識が不可欠である場所です。 しかしまた頻繁に範囲の専門家を助けてもらう必要性がある。
“特徴工学を実行するためには、モデルを構築する実践者は、データを通してそれらを発見する前であっても、可能な効果的な予測変数の先入観を持 “例えば、ローン申請者のデフォルトを予測する場合、効果的な予測因子は、申請者からの毎月の収入の流れである可能性があります。”
しかし、適切な機能を見つけることは、いくつかの状況ではほぼ不可能になる可能性があります。 これは、自動運転車で使用される場合など、コンピュータビジョンの場合に当てはまります。 しかし、洗練された深層学習を使用することは解決策になる可能性があります。
“最近では、ニューラルネットワークは、人間よりも統計を理解するのに優れているため、機能を学習するために使用されています”とSri Internationalの人工知能センターの計算機科学者であるEric Yeh氏は述べています。 “しかし、彼らは必ずしも万能薬ではなく、同様に意図されていなかった機能を開発する可能性があります。 有名な例は、タンクとジープを検出するために開発された画像分類器です。 代わりに、すべてのジープの写真は昼に撮影され、すべてのタンクの写真は夜に博物館で撮影されたので、夜と昼を検出することを学びました。”
Tom(@ttaulli)は、スタートアップのアドバイザーであり、Artificial Intelligence Basics:A Non-Technical IntroductionとRobotic Process Automation Handbook:A Guide to Implementing RPA Systemsの著者です。 彼はまた、Pythonプログラミング言語のような様々なオンラインコースを開発しました。
TwitterやLinkedInの上で私に従ってください。 私のウェブサイトや私の他の仕事のいくつかをここでチェックしてくださ