Lemonade es una de las OPI más populares de este año y una razón clave para esto son las grandes inversiones de la compañía en IA (Inteligencia Artificial). La compañía ha utilizado esta tecnología para desarrollar bots para manejar la compra de pólizas y la administración de reclamos.
Entonces, ¿cómo crea una empresa como esta modelos de IA? ¿Cuál es el proceso? Bueno, como no debería sorprender, es complejo y susceptible al fracaso.
Pero, de nuevo, hay algunos principios a tener en cuenta. Así que echemos un vistazo:
Selección: Hay cientos de algoritmos para elegir. En algunos casos, el mejor enfoque es usar varios (esto se conoce como modelado de conjuntos).
«Seleccionar el modelo correcto comienza con obtener una comprensión profunda de lo que la organización desea lograr», dijo Shadi Sifain, gerente sénior de ciencia de datos y análisis predictivo en Paychex. «Seleccionar el modelo correcto a menudo también implica equilibrar una serie de requisitos, incluidos el rendimiento del modelo, la precisión, la interpretabilidad y la potencia de cálculo, entre otros factores»,
Es importante darse cuenta de que necesita el tipo de datos correcto para ciertos modelos. En todo caso, este es uno de los mayores desafíos en el proceso de desarrollo de IA. «En promedio, el proceso de preparación de datos tarda 2 VECES o, en algunos casos, 3 veces más que el diseño del algoritmo de aprendizaje automático», dijo Valeria Sadovykh, Líder de Entrega Global de Tecnología Emergente en PwC Labs.
Así que en las primeras fases de un proyecto, necesitas tener una buena idea de los datos. «Realice un análisis exploratorio», dijo Dan Simion, vicepresidente de AI & Analytics en Capgemini Norteamérica. «Visualice los datos en 2 dimensiones y 3 dimensiones, luego ejecute estadísticas simples y descriptivas para comprender los datos de manera más efectiva. A continuación, compruebe si hay anomalías y datos faltantes. A continuación, limpie los datos para obtener una mejor imagen del tamaño de la muestra.»
Pero no hay un modelo perfecto, ya que siempre habrá compensaciones.
«Hay un antiguo teorema en la comunidad de aprendizaje automático y reconocimiento de patrones llamado Teorema de No Almuerzo Gratis, que establece que no hay un modelo único que sea mejor para todas las tareas», dijo el Dr. Jason Corso, profesor de Ingeniería Eléctrica y Ciencias de la Computación en la Universidad de Michigan y cofundador y CEO de Voxel51. «Por lo tanto, comprender las relaciones entre las suposiciones que hace un modelo y las suposiciones que hace una tarea es clave.»Formación
: Una vez que tiene un algoritmo, o un conjunto de ellos, desea realizar pruebas con el conjunto de datos. La mejor práctica es dividir el conjunto de datos en al menos dos partes. Alrededor del 70% al 80% es para probar y ajustar el modelo. El resto se utilizará para la validación. A través de este proceso, se analizarán las tasas de precisión.
La buena noticia es que hay muchas plataformas de IA que pueden ayudar a agilizar el proceso. Hay ofertas de código abierto, como TensorFlow, PyTorch, KNIME, Anaconda y Keras, así como aplicaciones propietarias como Alteryx, Databricks, DataRobot, MathWorks y SAS. Y, por supuesto, hay sistemas de IA ricos de Amazon, Microsoft y Google.
«La clave es buscar herramientas de código abierto que permitan una experimentación fácil y rápida», dijo Monica Livingston, Directora de Ventas de Inteligencia Artificial de Intel. «Si prefiere comprar soluciones de terceros, hay muchos ISV que ofrecen soluciones basadas en IA para tareas como reconocimiento de imágenes, bots de chat, detección de defectos, etc.»
Ingeniería de características: Este es el proceso de encontrar las variables que son los mejores predictores para un modelo. Aquí es donde la experiencia de un científico de datos es esencial. Pero a menudo también es necesario que los expertos en dominios ayuden.
«Para realizar ingeniería de características, el profesional que construye el modelo debe tener una buena comprensión del problema en cuestión, como tener una noción preconcebida de posibles predictores efectivos incluso antes de descubrirlos a través de los datos», dijo Jason Cottrell, director ejecutivo de Myplanet. «Por ejemplo, en el caso de predecir impagos para los solicitantes de préstamos, un indicador efectivo podría ser el flujo de ingresos mensuales del solicitante.»
Pero encontrar las características correctas puede ser casi imposible en algunas situaciones. Este podría ser el caso de la visión por computadora, como cuando se usa con vehículos autónomos. Sin embargo, el uso de aprendizaje profundo sofisticado puede ser una solución.
«En estos días, las redes neuronales se utilizan para aprender características, ya que entienden mejor las estadísticas que los humanos», dijo Eric Yeh, científico informático del Centro de Inteligencia Artificial de SRI International. «Sin embargo, no son necesariamente una panacea y podrían desarrollar características que no se pretendían tan bien. El ejemplo famoso es el clasificador de imágenes que se desarrolló para detectar tanques y jeeps. En cambio, aprendió a detectar día y noche, ya que todas las fotos de jeep se tomaron durante el día y todas las fotos de tanques se tomaron en el museo por la noche.»
Tom (@ttaulli) es asesor de startups y autor de Conceptos Básicos de Inteligencia Artificial: Una Introducción No Técnica y El Manual de Automatización de Procesos Robóticos: Una Guía para Implementar Sistemas RPA. También ha desarrollado varios cursos en línea, como para el lenguaje de programación Python.
Sígueme en Twitter o LinkedIn. Echa un vistazo a mi sitio web o a algunos de mis otros trabajos aquí. Carga