Después de pasar una mañana revisando un conjunto de datos, leyendo artículos de investigación y jugando con modelos de inteligencia artificial de vanguardia en su apartamento de Manhattan, Edwin Chen da un breve paseo hasta el elegante Starbucks Reserve Roastery de tres pisos en la Novena Avenida.
Vestido con una camiseta azul marino de Vuori y un bolso de lona con un tigre colgado del hombro, Chen baja las escaleras y se sienta en una mesa oscura en un rincón. Bebiendo un té verde pequeño "porque pedir café aquí lleva demasiado tiempo", el fundador y director ejecutivo de Surge AI, una empresa de etiquetado de datos y entrenamiento de IA, se lanza entonces a una discusión ininterrumpida de dos horas sobre todo, desde la cultura de Silicon Valley (la detesta) hasta sus rivales ("son todos talleres de carrocería") y cómo los humanos podrían interactuar con los extraterrestres si vinieran a la Tierra. "No hablan inglés. Entonces, ¿cómo te comunicarías con ellos? ¿Cómo descifrarías su idioma? Ojalá haya alguna forma matemática de hacerlo".
Este dilema también se explora en su cuento favorito, una pieza de 1998 del autor de ciencia ficción Ted Chiang. "Story of Your Life" se convirtió en la base de la película Arrival, en la que un lingüista intenta hablar con extraterrestres identificando patrones en su habla y escritura. También fue parte de la inspiración de Chen para fundar Surge en 2020, dice, y agrega que quiere que su empresa de etiquetado de datos codifique la "riqueza de la humanidad". Para él, eso significa conseguir que los humanos más inteligentes (incluidos profesores de Stanford, Princeton y Harvard) entrenen a la IA, traduciendo su conocimiento especializado a los 1 y 0 que sustentan los grandes modelos lingüísticos. Además de los cerebritos de la Ivy League, Chen emplea a un ejército de más de un millón de trabajadores independientes de más de 50 países de todo el mundo que ayudan a plantear preguntas que podrían desconcertar a la IA, evaluando las respuestas de los modelos y redactando criterios que ayudan a la IA a generar una respuesta perfecta. "Realmente creo que lo que estamos haciendo es tan crucial para todos los modelos de IA que, sin nosotros, la IAG [inteligencia artificial general, término técnico que define cuándo la IA igualará o superará las capacidades humanas] simplemente no se materializará", afirma Chen. "Y quiero que se materialice".
Prolijo, brillante y excéntrico, Chen es quizás el emprendedor tecnológico más exitoso del que jamás hayas oído hablar. Esto se debe a que hasta hace muy poco lo quería así, a pesar de ser muy conocido en la comunidad de la IA. El científico de datos, que trabajó en Twitter, Google y Facebook, evitó el capital riesgo tradicional y abandonó el sector financiero del Área de la Bahía hace siete años, optando por financiar Surge él mismo, comenzando con "un par de millones" de ahorros de su década en las grandes tecnológicas. "Una de las razones por las que nos autofinanciamos es que siempre he odiado el juego del estatus de Silicon Valley", dice Chen, quien describe la típica startup de Silicon Valley respaldada por capital riesgo como un "plan para enriquecerse rápidamente". También detesta la idea de recaudar tanto dinero y luego tener que gastarlo. En su opinión, eso conduce a una sobrecontratación masiva. Señala que Surge tiene solo 250 empleados, incluyendo a tiempo completo, tiempo parcial y consultores. En cambio, Scale AI, su gran rival, tiene cuatro veces más personal y menos ingresos.
Surge, que ayuda a las empresas tecnológicas a obtener los datos de alta calidad que necesitan para mejorar sus modelos de IA, generó US$ 1.200 millones en ingresos en 2024, menos de cinco años después de su fundación, gracias a clientes como Google, Meta, Microsoft y los laboratorios de IA Anthropic y Mistral. (Ayudó a capacitar a Gemini de Google y a Claude de Anthropic). Según Chen, es rentable prácticamente desde el primer día. Según estas cifras, la empresa tiene un valor estimado de US$ 24.000 millones. Surge está en conversaciones para recaudar US$ 1.000 millones, con una valoración de US$ 30.000 millones, aunque la ronda aún no se ha cerrado.
La decisión de Chen de financiar Surge él mismo ha dado sus frutos: su participación de aproximadamente el 75 % tiene un valor estimado de 18 000 millones de dólares, suficiente para convertirlo en el recién llegado más rico de la lista F orbes 400 de los estadounidenses más ricos de este año . A sus 37 años, también es el miembro más joven.
Es tan probable que Chen le pida a alguien en una entrevista que hable sobre David Foster Wallace o la lingüística como que le pida que codifique o resuelva problemas en una pizarra. «Valoramos la creatividad», afirma.
Surge afirma que su enfoque no se asemeja a las antiguas formas de etiquetado de datos, en las que a personas —a menudo de países menos desarrollados del Sur Global— se les paga una miseria por hora para sentarse frente a una computadora e identificar la diferencia entre un gato y un perro. En cambio, los anotadores de datos de Chen, entre los que se incluyen profesionales y profesores, siguen un conjunto de instrucciones para interactuar con chatbots en línea. Se les puede pedir que intenten incitar al chatbot a emitir una respuesta incorrecta o tóxica. Luego, escriben una respuesta mejor. O se les puede pedir que comparen diferentes respuestas de IA a la misma pregunta y expliquen por qué una es mejor.
Por ingresos, Surge es el más grande en el negocio en este momento, pero competidores como Scale AI (de la cual Meta compró el 49% por US$ 14.000 millones en junio), Turing, Mercor e Invisible AI se están moviendo rápido. Las empresas gastaron US$ 104.000 millones en infraestructura de IA en 2024, estima la firma de investigación tecnológica International Data Corporation, y están en camino de gastar más este año. "Los datos son una parte importante de esa infraestructura, al igual que el cómputo [potencia de procesamiento bruta] y la energía", dice Jonathan Siddharth, CEO de Turing con sede en Palo Alto, California. "Creo que tiene sentido que una empresa gaste entre el 10 % y el 20 % de su gasto en cómputo en datos". Todos quieren un pedazo del pastel: En mayo, Jeff Bezos lideró una inversión de US$ 72 millones en la empresa de etiquetado de datos con sede en los Países Bajos Toloka. El gigante de viajes compartidos Uber comenzó a etiquetar sus propios datos en 2024. Los jugadores tradicionales como Appen con sede en Australia, que presta cada vez más servicios a los fabricantes de modelos chinos, también están renovando su marca para centrarse en la IA generativa.
Desde el principio, en silencio, Chen ha estado construyendo su empresa y su reputación. "Creo que [Surge] simplemente no quiere revelar nada de lo que hace", afirma un investigador actual de Meta. Pero a medida que la industria evoluciona, Chen ya no se conforma con permanecer entre bastidores. Le preocupa seriamente que los modelos de IA actuales estén optimizados para las cosas equivocadas, llevando a los usuarios a una "madriguera delirante", similar a cómo los algoritmos de YouTube y Twitter estaban optimizados en gran medida para el clickbait cuando él trabajaba en esos lugares. Quiere que Surge ayude a "dirigir la industria de la IA", lo que significa posicionarse como un líder de opinión. Ya era hora, dice el investigador de Meta. "Surge es realmente bueno, y la gente lo sabe. Le preguntaba [a Chen]: '¿Por qué crees que no eres tan famoso?'".
Chen creció en Crystal River, Florida (3.400 habitantes), una ciudad de la Costa del Golfo más conocida por sus manatíes y jubilados que por sus multimillonarios tecnológicos. Sus padres, quienes emigraron a Estados Unidos desde Taiwán, dirigían Peking Garden, un restaurante chino-tailandés-estadounidense, donde Chen trabajó durante su adolescencia.
Su verdadero interés eran los idiomas y las matemáticas, en relación entre sí. En sus palabras: «Siempre me interesaron los fundamentos matemáticos del lenguaje». De niño, quería aprender «como 20 idiomas» y le encantaban los concursos de ortografía. Hoy en día todavía habla un poco de francés, además de algo de español y mandarín (el hindi y el alemán han quedado en el olvido). Las matemáticas se le daban con facilidad, pero no captaron del todo su imaginación hasta que empezó a notar patrones distintivos en los números, «especialmente en el número tres», presentes en todo, desde los pétalos de las flores hasta las montañas.
Chen, quien cursó cálculo en octavo grado, afirma que recibió beca completa durante sus dos últimos años de preparatoria en el prestigioso internado Choate de Connecticut, entre cuyos exalumnos se encuentran John F. Kennedy, John Dos Passos e Ivanka Trump. Tras agotar el currículo de matemáticas de Choate, dedicó la mayor parte de su último año a investigar cualquier tema que le llamara la atención con profesores de Yale que también impartían clases en Choate. Después llegó al MIT, donde se especializó en matemáticas, cofundó una sociedad de lingüística y siguió un horario de sueño polifásico, lo que implica dividir el sueño en múltiples descansos cortos; por ejemplo, una siesta de 30 minutos cada seis horas en lugar de una de ocho horas.
Tras tres años en el MIT, Chen realizó prácticas en el antiguo fondo de cobertura de Peter Thiel en San Francisco y le gustó tanto que nunca volvió a estudiar. Tras completar los cursos obligatorios, solicitó un título y lo obtuvo dos años después. Después llegaron sus periodos en Twitter, Google y Facebook, donde trabajó en diversos puestos relacionados con la moderación de contenido y algoritmos de recomendación. En cada puesto, Chen se enfrentaba constantemente al mismo problema: era difícil obtener datos de alta calidad etiquetados por humanos a gran escala. Dejó su último trabajo en Twitter en 2020 para resolver este problema por su cuenta y fundó Surge ese mismo año. "He estado desarrollando versiones preliminares de este sistema durante los últimos 10 años", afirma.
Todo lo que Chen hace es consciente. Vegano y con una rutina de 20.000 pasos casi todos los días, dice que sus mejores reflexiones se producen caminando por Nueva York. Una o dos veces por semana, camina hasta Times Square a medianoche. «Me encanta ver esta mini representación de la humanidad: actores de Broadway, turistas de todo el mundo, trabajadores del turno de noche, artistas, rodeados de luces, tecnología e infraestructura». Es un gran fan de Eminem, pero aquí cita una letra de "Empire State of Mind" de Jay-Z y Alicia Keys: "Estas calles te harán sentir como nuevo, las grandes luces te inspirarán".
¿Por qué querría alguien cotizar en bolsa? Un gran problema con las empresas que cotizan en bolsa es que siempre tienen que preocuparse por el corto plazo.
Estaba harto de la anotación de datos que era "completa basura" de personas que no cobraban lo suficiente como para preocuparse o carecían del conocimiento cultural o político necesario para emitir un juicio informado. Un ejemplo: un anotador que no estuviera familiarizado con las elecciones estadounidenses podría calificar un comentario en redes sociales como "¡Vamos Brandon!" como "positivo". Surge buscaba contratar a personas que entendieran el contexto y tuvieran un profundo conocimiento del idioma. En 2021, Chen recibió un correo electrónico interesante del hermano de un ingeniero de software al que había intentado contratar.
El hermano, Scott Heiner, casi no tenía experiencia en tecnología; había sido baterista y mánager de giras de artistas indie-pop como Alec Benjamin durante más de una década. Sin embargo, el correo electrónico incluía un famoso ensayo de David Foster Wallace que analizaba quién tiene derecho a definir el inglés "correcto". Chen, intrigado, contrató a Heiner en octubre de ese año como el quinto empleado de Surge, a pesar de que nunca antes había trabajado en tecnología. Heiner dice de Chen: "Es un pensador completamente no tradicional".
En una entrevista, es tan probable que Chen le pida a un candidato que hable sobre el trabajo o la lingüística de Wallace como que le pida que codifique o resuelva problemas en una pizarra. Aproximadamente el 20 % del personal de Surge tiene una formación no tradicional. "Valoramos la creatividad", afirma Chen.
También aporta su propio enfoque a otras áreas de la empresa. Dejando de lado las ventas y el marketing tradicionales, inicialmente se comunicaba a través de su popular blog de ciencia de datos, que creó en su tiempo libre hace más de una década. Ahí fue donde Surge consiguió sus primeros clientes, afirma, aunque no especifica cuáles. Entre los primeros se encuentran Airbnb, Twitch y su antiguo empleador, Twitter. Intenta dirigirse directamente a los científicos de datos de las empresas tecnológicas, asumiendo que reconocerán la calidad de los datos de Surge y estarán más dispuestos a pagar por ellos. (Surge cobra entre un 50 % y 10 veces más que la competencia, según dos investigadores).
Un investigador de Google llamó a Chen un sábado por la noche en mayo de 2023 por recomendación de sus compañeros de trabajo. En aquel entonces, la familia de modelos de IA Gemini de Google se encontraba en muy mal estado. La llamada duró más de dos horas. Poco después, Google firmó un contrato con Surge que ascendía a más de US$ 100 millones anuales. "Sientes que estás pagando por la calidad en un caso, en lugar de por las horas de trabajo", afirma el investigador, quien posteriormente dejó Google y pidió no ser identificado.
Las startups de IA pueden ser reservadas, pero incluso comparadas con sus pares, Surge destaca. Sus principales clientes desconocen exactamente qué mejora sus datos. (Por otro lado, Surge y sus competidores desconocen qué datos se utilizan para entrenar modelos como Gemini, Claude o GPT de OpenAI). Surge no comparte cómo asigna participantes a proyectos, recopila sus datos ni cómo los anota. Lo único que sus clientes obtienen por sus millones es un enlace a un conjunto de datos.
Esto permite a Surge supervisar más de cerca el rendimiento de los anotadores mediante cuestionarios ocultos, revisiones manuales realizadas por anotadores con mayor calificación y, por supuesto, algoritmos de aprendizaje automático que optimizan el rendimiento y pueden ser bastante agresivos, afirma Chen. Sostiene que los controles de calidad y la profunda experiencia técnica de Surge son sus ingredientes secretos.
En cuanto a mantener el secretismo, Chen afirma que no es intencional, sino que Surge está "demasiado ocupado para hablar de nuestro trabajo externamente". Además, Surge opera bajo acuerdos de confidencialidad con sus clientes. Y contrata anotadores a través de una filial de su propiedad absoluta llamada DataAnnotation Tech. Ni sus ofertas de trabajo ni el sitio web que utilizan los anotadores mencionan a Surge por su nombre, lo que significa que los trabajadores podrían no saber que Surge es la empresa que lo respalda. El trabajo paga al menos 20 dólares por hora y más de 40 dólares por hora para tareas más especializadas, lo que no parece mucho para los mejores talentos. "Si eres un buen trabajador, eres muy inteligente y tienes muchos conocimientos", dice Chen, "queremos ser una plataforma donde puedas trabajar a tiempo completo". (I)