Este joven de 24 años construyó un imperio multimillonario de entrenamiento de IA
Si busca indicadores del auge del mercado de la IA, el meteórico ascenso de micro1 es prácticamente innegable. A principios de año, era un servicio de reclutamiento basado en IA que facturaba aproximadamente US$ 7 millones de dólares anuales. Ahora, ocho meses después de invertir en la anotación de datos para el entrenamiento de IA, ha superado los US$ 100 millones en ingresos anualizados y ha recibido ofertas de inversión con una valoración de US$ 2.500 millones (hace apenas unos meses, cerró una ronda de financiación que valoró la empresa en US$ 500 millones).
Ha sido una experiencia emocionante para Ali Ansari, el director ejecutivo de 24 años de la compañía, quien ahora está a punto de convertirse en uno de los multimillonarios más jóvenes del mundo. Si micro1 alcanza o supera la valoración de US$ 2.500 millones que actualmente manejan los inversores, la participación de Ansari en la compañía (aproximadamente el 42 %) superaría los US$ 1.000 millones, según estimaciones de Forbes.
Ansari se sintió intrigado por primera vez por el entrenamiento en IA cuando una gran empresa de etiquetado de datos acudió a ellos en busca de la ayuda de micro1 con el reclutamiento.
"Fue un proyecto impresionante para nosotros", dijo Ansari. "Pensábamos: ¿por qué esta empresa contrata a cientos de ingenieros en dos semanas? Dijimos: ¡Madre mía!, deberíamos centrarnos en este mercado".
Así, al igual que su competidor Mercor, que también empezó como un servicio de reclutamiento impulsado por inteligencia artificial, Ansari inclinó a micro1 hacia el etiquetado de datos.
El entrenamiento de IA (anotación humana de la información utilizada para entrenar los grandes modelos lingüísticos que sustentan la inteligencia artificial) es uno de los sectores de mayor crecimiento en Silicon Valley actualmente. Para que los modelos de IA se vuelvan más inteligentes, necesitan que los humanos añadan contexto y significado a la información con la que se entrenan. Dado que el rendimiento de la IA aumenta en relación directa con la cantidad de datos de alta calidad que puede procesar durante el entrenamiento, el mercado de proveedores de datos fiables ha crecido rápidamente. Ansari estima que los principales laboratorios de IA invierten actualmente US$ 15.000 millones al año en entrenamiento de IA. Cree que dentro de dos años esa cifra superará los US$ 100.000 millones.
Es un mercado en auge. Dependiendo de a quién le preguntes, el etiquetado de datos se convertirá en una industria masiva y en expansión o será reemplazado por una IA lo suficientemente avanzada como para autoaprendizaje. Pero ahora es un gran negocio, uno que ha dado origen a cuatro nuevos multimillonarios solo en los últimos meses: los fundadores de Mercor y Edwin Chen , fundador de Surge .
"La capacitación en IA está afectando fundamentalmente a la economía; es un sector laboral completamente nuevo".
Ali Ansari, director ejecutivo de micro1
Ansari no reveló clientes específicos aparte de Microsoft, pero afirmó que micro1 trabaja con varios laboratorios de IA de vanguardia y la mayoría de las empresas tecnológicas de las "Siete Magníficas". Todas buscan expertos en el sector para anotar datos de entrenamiento en áreas como atención al cliente y banca de inversión. Muchos de estos expertos tienen un alto nivel educativo y cobran entre US$ 60 y 170 por hora por evaluar los resultados de IA. Algunos, como los expertos médicos o financieros, pueden ganar hasta US$ 500 por hora.
Ansari imagina un futuro donde casi todos puedan ser instructores de IA, no solo los expertos en oficios. Está desarrollando un servicio que paga a las personas por grabarse en video realizando sus actividades diarias, como doblar la ropa, para generar datos de entrenamiento para modelos de IA robótica.
"La capacitación en IA está afectando fundamentalmente a la economía; es un sector laboral completamente nuevo", dijo.
Según Adam Bain, cofundador de 01A Ventures e inversor de Micro1, hasta hace poco el etiquetado de datos era un espacio "poco querido y poco apreciado".
"El consenso era que no era un buen sector para invertir", declaró Bain a Forbes. "Y el etiquetado de datos empezó siendo muy básico, pero ahora se trata literalmente de encontrar personas más inteligentes que los modelos... se ha vuelto muy complejo".
A los inversores les preocupaba que el etiquetado de datos se volviera obsoleto una vez que la IA alcanzara la inteligencia artificial general (IAG) y pudiera igualar las capacidades cognitivas humanas. También dudaban en abordar el poco atractivo negocio de gestionar proyectos a corto plazo con grandes grupos de contratistas.
"Nos preocupaba la magnitud del premio", dijo Jamin Ball, socio de Altimeter Capital, quien no ha invertido en ninguna empresa de etiquetado de datos. "El etiquetado de datos parecía un commodity con márgenes bajos al vencimiento".
Desde entonces, Ball cambió de opinión y ahora busca activamente invertir en empresas de datos. Los datos son el oxígeno de los modelos de IA, afirmó.
Para tener éxito como emprendedor en el etiquetado de datos es necesario comprender las turbulencias del mercado de la IA, algo mucho más difícil que que Accenture estableciera un centro de llamadas en el extranjero. Ansari es un experto en predecir el futuro, afirmó Bain, quien describe su actitud como "de 360 grados: le apasiona construir una gran empresa, dedicar tiempo a los clientes y trabajar con ahínco".
Ansari se mudó a Los Ángeles desde Irán hace poco más de una década y ha estado incursionando en el emprendimiento desde su adolescencia. Durante la secundaria, creó un modesto negocio de reventa de libros de texto en eBay; en la preparatoria, creó una plataforma de tutoría de matemáticas en línea que logró vender con ganancias ("seis cifras bajas") al graduarse. Mientras dirigía una consultoría de software como estudiante de Berkeley, Ansari se frustraba con lo difícil que era encontrar ingenieros competentes en el extranjero. Así que utilizó el modelo GPT-3 de OpenAI para crear un reclutador basado en IA que hablara con los candidatos por él y evaluara sus habilidades. Cuando el reclutador basado en IA superó el millón de dólares en ingresos anuales, cerró la consultora de software para centrarse en ella. Luego, se dedicó al etiquetado de datos.
Micro1 se distingue por una filosofía que Ansari denomina "lo humano primero", que prioriza la experiencia de los etiquetadores de datos humanos. El proceso comienza con una entrevista con IA y, posteriormente, un ejercicio realista de simulación de trabajo, para que los capacitadores de IA sepan qué esperar.
Una vez contratados, los expertos se emparejan con "gestores de datos humanos", generalmente recién graduados de universidades de prestigio, cuya función es ayudar a los expertos a desenvolverse en el mundo del entrenamiento de IA. Los gerentes de proyecto de micro1 reciben una compensación parcial basada en el "Índice de Felicidad de los Expertos" de micro1, y su desempeño se evalúa mediante análisis detallados y se clasifica por grupos.
"Si los expertos están contentos, producen un trabajo de mejor calidad y los laboratorios obtienen un mejor modelo", dijo Ansari.
Micro1 está enviando kits de equipos, incluidos los anteojos Rayban de Meta, a personas que crearán conjuntos de datos fundamentales para robots grabándose a sí mismos realizando diversas tareas.
Aunque algunos críticos consideran desalentador que los trabajadores estén entrenando a la IA que algún día podría reemplazarlos, Ansari sostiene que este próximo sector laboral en realidad generará una cantidad infinita de trabajo para que la gente haga y será una bendición para los trabajadores manuales desempleados.
Está muy entusiasmado con el mercado de datos emergente en torno a la robótica avanzada, que predice que algún día eclipsará al mercado actual de entrenamiento de IA. Para las empresas que desarrollan humanoides, no existe un corpus predefinido de datos de entrenamiento, ni internet que pueda extraer para desarrollar un modelo lingüístico extenso. Estos no son el tipo de datos que se extraen de editoriales o de Wikipedia, sino el tipo de datos que se necesitan crear y capturar.
Para lograrlo, micro1 está enviando kits de equipos, incluyendo las gafas Rayban de Meta, a personas que crearán conjuntos de datos fundamentales para robots grabándose mientras realizan diversas tareas: tender la cama, reparar un grifo que gotea o lavar los platos. Se trata de una tarea enorme y extensa si algún día los robots humanoides van a hacer siquiera la mitad de lo que nosotros hacemos. Y es la razón por la que Ansari confía tanto en el futuro del mercado en el que participa.
"La única manera de llegar al estado final es cuando seamos capaces de modelar el mundo completamente a la perfección, y eso nunca sucederá", dijo. (I)