Scale AI Asegura una Serie F Revelada de $1 mil millones con una Valoración de $13.8 mil millones
La masiva ronda de financiación, liderada por Accel y Nvidia, marca un cambio fundamental en la valoración de los activos de datos listos para IA.
Scale AI ha finalizado una ronda de financiación de Serie F por valor de 1.000 millones de dólares (https://scale.com/blog/series-f), lo que eleva su valoración a 13.800 millones de dólares (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation). La ronda, que contó con una fuerte participación de pesos pesados estratégicos como Nvidia, Meta y Amazon, señala una realización fundamental del mercado: en la carrera por la inteligencia artificial general, la potencia de cálculo bruta solo es tan valiosa como los datos refinados que la alimentan. A medida que la industria se aleja de la era del web-scraping indiscriminado, la capacidad de Scale para proporcionar datos de alta fidelidad con intervención humana (HITL) se ha convertido en el foso competitivo definitivo para los laboratorios que aspiran a superar las mesetas de rendimiento actuales de los grandes modelos de lenguaje.
El fin de la escasez de datos
Durante años, el sector de la IA operó bajo la suposición de que Internet proporcionaba un suministro inagotable de material de entrenamiento. Sin embargo, a medida que los modelos alcanzan la escala de billones de parámetros, la industria se enfrenta a lo que los investigadores llaman el "Muro de Datos". La masiva recaudación de capital de Scale AI es una respuesta directa a esta escasez. Al asegurar 1.000 millones de dólares en nuevo capital (https://scale.com/blog/series-f), la empresa se posiciona no solo como un proveedor de servicios, sino como la infraestructura fundamental para la "abundancia de datos". Esta estrategia implica la ampliación masiva de operaciones especializadas de RLHF (Aprendizaje por Refuerzo a partir de Retroalimentación Humana), donde se contratan expertos de nivel de doctorado en física, derecho y codificación para generar las complejas cadenas de razonamiento que los modelos actuales no pueden encontrar en Reddit o Wikipedia.
Alineación estratégica de los titanes de la IA
La lista de inversores de esta ronda parece un directorio de la estructura de poder de la IA. Más allá de Accel, que lideró la ronda, la presencia de Nvidia y Meta (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation) sugiere una integración vertical de la cadena de suministro de IA. Nvidia necesita datos de alta calidad para garantizar que sus chips H100 y B200 ofrezcan la máxima utilidad, mientras que Meta requiere conjuntos de datos refinados para mantener la ventaja competitiva de su serie Llama de código abierto. Esta inyección de 1.000 millones de dólares se centra menos en la escalada tradicional de capital riesgo y más en asegurar una línea de suministro fiable de datos de "verdad fundamental" en un entorno de datos cada vez más litigioso y privado.
El cambio hacia el licenciamiento premium
La valoración de Scale AI en casi 14.000 millones de dólares refleja los crecientes costos observados en los acuerdos de licenciamiento de datos directos. A modo de contexto, OpenAI firmó recientemente un pacto de varios años con News Corp por 250 millones de dólares (https://www.reuters.com/technology/openai-news-corp-sign-content-licensing-deal-2024-05-22/) para acceder a archivos periodísticos premium. Simultáneamente, Google se ha comprometido a pagar unos 60 millones de dólares anuales (https://www.reuters.com/technology/reddit-ai-content-licensing-deal-with-google-sources-say-2024-02-22/) a Reddit por acceso a su API en tiempo real. Scale AI se sitúa en el centro de este ecosistema, transformando estas fuentes de datos sin procesar en los formatos estructurados necesarios para el ajuste fino. Es probable que el capital se utilice para expandir el "Motor de Datos" de Scale, que automatiza la curación de datos sintéticos validados por expertos humanos de alto nivel, un enfoque híbrido que se está convirtiendo en el estándar de la industria.
La frontera regulatoria y ética
A medida que la Ley de IA de la UE (https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai) comience a aplicar requisitos de transparencia más estrictos sobre los datos de entrenamiento, la prima por datos "limpios", de origen ético y con licencia legal no hará más que crecer. La inversión de Scale AI en la procedencia de datos de nivel empresarial es una apuesta estratégica por este futuro regulatorio. Las empresas ya no están dispuestas a arriesgarse a entrenar modelos multimillonarios con datos que podrían estar sujetos a futuras recuperaciones de derechos de autor. Al proporcionar una cadena de suministro de datos transparente y documentada, Scale está vendiendo efectivamente la desmitificación legal y operativa a las empresas más grandes del mundo.
Por qué es importante para los propietarios de datos
Para los propietarios de datos, desde redes médicas hasta repositorios legales, la valoración de Scale AI es una llamada de atención de que sus activos nunca han sido más líquidos. La transición de acuerdos de contenido de 250 millones de dólares a rondas de infraestructura de miles de millones de dólares indica que el mercado está superando la fase "experimental" de adquisición de datos. Ahora estamos en la era de la Clase de Activos de Datos. Si usted posee discurso humano propietario, de alta velocidad o altamente especializado, ya no es solo un editor o un proveedor de servicios; es el combustible para la próxima generación de inteligencia global. La clave para estos propietarios será pasar de las tarifas de licencia únicas a participaciones estructuradas, similares a las de capital, en los modelos de IA que sus datos crean.
d-nvest convierte los activos de datos detrás de estos acuerdos en oportunidades puntuadas y accionables.
Explorar el pipeline →