Por qué esta startup de videos fue valuada en más de US$ 75 millones
Los ingresos recurrentes anuales de la compañía alcanzaron los 18 millones de dólares.

Joshua Xu, antiguo ingeniero de software de Snap, cree que los videos generados por IA están a punto de vivir un momento similar al de Snapchat o Instagram en los primeros días de la revolución de la fotografía celular.

Como primera prueba, señala a su propia empresa HeyGen, que, tras lanzar su aplicación de creación de vídeo con IA el pasado septiembre, alcanzó el millón de dólares de ingresos anuales recurrentes en marzo y los 10 millones en octubre. Hoy, esa cifra asciende a 18 millones de dólares, según Xu, cofundador y CEO, a Forbes.

"Snapchat es una empresa de cámaras en la que todo el mundo crea contenido a través de la cámara del celular", explica Xu. "Creemos que la IA puede crear el contenido. La IA podría convertirse en la nueva cámara".

El miércoles, HeyGen anunció 5,6 millones de dólares en nueva financiación de capital riesgo liderada por Conviction Partners de Sarah Guo. La ronda valora la empresa con sede en Los Ángeles en 75 millones de dólares; Como parte del acuerdo, Guo va a tomar un asiento en el consejo en lugar de HongShan (anteriormente Sequoia China), ya que HeyGen toma medidas para distanciarse de sus orígenes chinos.

HeyGen también va a lanzar un nuevo producto que va a facilitar a los usuarios la creación de los avatares de IA personalizados que se presentan en sus videos. Anteriormente, los avatares personalizados fotorrealistas de HeyGen requerían fotografía profesional para su creación y un proceso que podía durar días, aunque también ofrece más de 100 avatares ya creados. 

Joshua Xu, antiguo ingeniero de software de Snap, cree que los videos generados por IA están a punto de vivir un momento similar al de Snapchat o Instagram en los primeros días de la revolución de la fotografía celular.

Xu afirma que el nuevo producto puede generar avatares de IA a partir de grabaciones de smartphones y en tan solo cinco minutos, una mejora que atribuye a un gran avance en la arquitectura del modelo de IA de HeyGen.

Xu y Wayne Liang, director de producto, estudiaron juntos en la Universidad Tongji de Shanghái y luego en la Universidad Carnegie Mellon como estudiantes de máster. Ambos acabaron en la costa oeste, Xu en Snap y Liang como diseñador de productos para la startup de aplicaciones de karaoke Smule y ByteDance, matriz de TikTok. Xu se encontró atrapado en China en 2020 después de que una visita a su país coincidiera con las restricciones de viaje del gobierno de Covid-19

Cuando renunció a Snap a finales de ese año para iniciar HeyGen, recaudó capital de firmas prominentes en su país natal, incluidas Sequoia China y ZhenFund.

Desde entonces, las crecientes tensiones entre Estados Unidos y China alteraron el escenario tecnológico, como demuestra la división geográfica de Sequoia. Xu afirmó que su intención siempre fue trasladar la empresa a Los Ángeles. Desde el lanzamiento del producto el año pasado, HeyGen se centró en los mercados occidentales (en China, el producto está prohibido por razones que Xu dice desconocer, aunque sospecha que son similares a la censura de Pekín a ChatGPT).

"La situación geopolítica cambió radicalmente en el último año y medio", dijo el nuevo inversor Guo. "[Xu] fue extremadamente decisivo al decir que vamos a ser muy claros sobre nuestra base de inversores, nuestra base de usuarios, nuestros centros de datos y no tener influencia gubernamental".

Xu se encontró atrapado en China en 2020 después de que una visita a su país coincidiera con las restricciones de viaje del gobierno de Covid-19.

HeyGen, que ahora cuenta con 25 empleados, se apresuró a aplicar los avances en modelos de IA generativa de "difusión", la tecnología en la que se basan populares generadores de imágenes como Midjourney o Dall-E de OpenAI. Xu dijo que la empresa creó sus propios modelos de IA para vídeo, al tiempo que integró grandes modelos lingüísticos de OpenAI y Anthropic para texto, y ofertas de Eleven Labs para audio.

"Estamos en el 0,1% de penetración de personas que ni siquiera entienden que esto es posible, y mucho menos que lo adoptan".
 

Sarah Guo, fundadora de Conviction Partners

Están surgiendo otras empresas de IA para vídeo, como Runway y Pika, que permiten a los usuarios generar y editar videos escribiendo un texto. Pero estas empresas se dirigen a creativos y consumidores. HeyGen se centró en el mercado empresarial y su interminable necesidad de videos de marketing, formación y procedimientos. Y lo está haciendo bien, pero Xu espera que el nuevo producto le dé más tracción entre los creadores de contenidos de YouTube y TikTok.

El año pasado, Xu describió la empresa a TechCrunch como Jasper para la producción de vídeo. Desde entonces, HeyGen se convirtió en un ejemplo canónico en Silicon Valley de una empresa de moda cuyo crecimiento de ingresos desplomó al desaparecer su novedad. Aunque HeyGen está acumulando clientes empresariales, muchos de ellos son personas que trabajan dentro de las empresas, no las propias empresas. HeyGen contrató a sus primeros representantes de ventas en noviembre y tiene previsto duplicar su plantilla el año que viene, centrándose en los contratos con empresas.

HeyGen, que ahora cuenta con 25 empleados, se apresuró a aplicar los avances en modelos de IA generativa de "difusión", la tecnología en la que se basan populares generadores de imágenes como Midjourney o Dall-E de OpenAI.

De este modo, HeyGen se enfrentará inevitablemente a rivales como Synthesia, un fabricante de software de inteligencia artificial para avatares con sede en Londres que recaudó más de 150 millones de dólares en financiación de capital riesgo. Xu espera distinguir a HeyGen haciendo hincapié en funciones como la personalización de avatares. Guo no está preocupada. Piensa que la competencia puede no ser un problema durante un tiempo debido al gran número de clientes sin explotar para diferentes casos de uso: si, por ejemplo, Synthesia acapara el mercado de la educación, HeyGen tiene mucho espacio abierto para videos de marketing.

"Estamos en el 0,1% de penetración de personas que siquiera entienden que esto es posible, y mucho menos que lo están adoptando", afirma.

*Con información de Forbes US