Scale AI Asegura $1 mil millones en Serie F con una Valoración de $13.8 mil millones
La ronda liderada por Accel posiciona a Scale AI como la principal 'Fundición de Datos' para el desarrollo de modelos de IA de vanguardia.
Scale AI ha finalizado una ronda de financiación Serie F de $1 mil millones (https://scale.com/blog/series-f) que eleva su valoración post-money a una cifra revelada de $13.8 mil millones (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation). Liderada por Accel con una participación significativa de Nvidia, Amazon y Meta, la ronda señala un enorme giro de capital hacia el 'cuello de botella de datos' que enfrentan actualmente los desarrolladores de Modelos de Lenguaje Grandes (LLM) más importantes. A medida que la industria avanza más allá de la era de 'raspar la web abierta', la misión de Scale AI de construir una 'Fundición de Datos' representa la inversión más significativa hasta la fecha en la creación de activos de datos expertos y de alta densidad para IA soberana y empresarial.
La Industrialización de los Datos de IA
La inyección de $1 mil millones (https://scale.com/blog/series-f) no es simplemente una ronda de crecimiento; es una jugada de infraestructura. Scale AI se está posicionando como la refinería esencial para la materia prima del siglo XXI. La financiación se utilizará para escalar su 'Motor de Datos', que proporciona el Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF) necesario para llevar los modelos más allá de las mesetas de razonamiento actuales. Con inversores como Cisco Investments, Intel Capital y AMD Ventures (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation) uniéndose a la tabla de capitalización, el acuerdo subraya un consenso intersectorial: la próxima generación de rendimiento de IA se ganará a través de la calidad de los datos, no solo del volumen de cómputo.
Los Acuerdos de Licencia Alcanzan un Punto Álgido
La ronda de Scale AI coincide con una ola sin precedentes de acuerdos directos de adquisición de datos entre constructores de modelos y propietarios de contenido premium. Notablemente, News Corp firmó un acuerdo multianual con OpenAI (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d) valorado en un estimado de $250 millones durante cinco años (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d). Esta asociación otorga a OpenAI acceso a archivos y contenido actual de The Wall Street Journal, Barron's y The Times, marcando un cambio definitivo hacia conjuntos de datos licenciados y de alta autoridad. De manera similar, la asociación de OpenAI con Reddit (https://openai.com/index/openai-and-reddit-partnership/) proporciona acceso en tiempo real a la API de Datos de Reddit, permitiendo la integración de datos conversacionales centrados en humanos en ChatGPT y otros productos.
Capitalizando Datos Corpóreos y Especializados
Más allá de los LLM basados en texto, el mercado de activos de datos especializados está experimentando enormes flujos de capital. Wayve aseguró recientemente $1.05 mil millones (https://www.reuters.com/business/autos-transportation/uk-ai-start-up-wayve-raises-105-bln-softbank-led-funding-2024-05-07/) en una ronda Serie C liderada por SoftBank para desarrollar 'IA Corpórea' para la conducción autónoma. Este acuerdo resalta la prima que se otorga a los 'datos de borde', información sensorial del mundo real que no puede ser replicada únicamente por la generación sintética. Apoyando este ecosistema rico en datos, CoreWeave recaudó $1.1 mil millones (https://techcrunch.com/2024/05/01/coreweave-raises-1-1b-at-a-19b-valuation/) para expandir su infraestructura de nube especializada, diseñada específicamente para manejar el rendimiento masivo requerido para cargas de trabajo de entrenamiento de IA intensivas en datos.
La Reacción Regulatoria y de Derechos
A medida que el valor de los activos de datos se dispara, los titulares de derechos se mueven agresivamente para proteger su propiedad intelectual. Sony Music Group emitió una advertencia formal a más de 700 empresas de IA (https://variety.com/2024/music/news/sony-music-warns-ai-companies-using-content-without-permission-1236006080/), declarando una 'exclusión voluntaria' explícita del raspado de datos no autorizado para el entrenamiento de IA. Esto sigue a una serie de acuerdos de licencia, como el acuerdo de OpenAI con Vox Media (https://www.theverge.com/2024/5/13/24155488/openai-vox-media-licensing-deal-chatgpt) y The Atlantic (https://www.theatlantic.com/press-releases/archive/2024/05/the-atlantic-and-openai-announce-strategic-content-and-product-partnership/678526/), lo que sugiere que la era del 'uso legítimo' para los datos de entrenamiento está siendo rápidamente reemplazada por un mercado estructurado de miles de millones de dólares para los derechos de contenido.
Por qué importa para los propietarios de datos
Para los propietarios de datos institucionales, la valoración de Scale AI y el acuerdo de News Corp confirman que los conjuntos de datos propietarios ya no son activos secundarios, sino la principal palanca en la economía de la IA. La transición de acuerdos de licencia de $250 millones a rondas de financiación de $1 mil millones para refinerías de datos indica que los 'datos limpios y etiquetados por expertos' son ahora una clase de activo distinta. Los propietarios de datos únicos, de alta velocidad o históricamente profundos deberían priorizar la gobernanza de datos y la 'preparación para la IA' para capturar las valoraciones premium que ahora establecen los actores más importantes del mercado.
d-nvest convierte los activos de datos detrás de estos acuerdos en oportunidades puntuadas y accionables.
Explorar el pipeline →