Miembro de la Junta Mistral y A16Z VC Anjney Midha dice que Deepseek no detendrá el hambre de GPU de AI

Andreessen Horowitz socio general y miembro de la junta de Mistral Anjney «Anj» Midha primero espió la actuación asombrosa de Deepseek Hace seis meses, le dice a TechCrunch.

Fue entonces cuando Deepseek introdujo Coder V2, que rivalizó con GPT4-Turbo de OpenAI para tareas específicas de codificación, según un artículo Se lanzó el año pasado. Esto puso a Deepseek en un camino para liberar modelos mejorados cada dos meses a través de R1, dijo. R1 es su nuevo modelo de razonamiento de código abierto que ha volcado a la industria tecnológica para ofrecer el rendimiento estándar de la industria a una fracción del costo.

A pesar de la venta de acciones de NvidiaMidha dice que R1 no significa que los modelos fundamentales de IA dejarán de gastar miles de millones en chips de GPU y construir más centros de datos tan rápido como puedan.

Significa que harán más con el poder de cálculo que pueden obtener.

«Cuando la gente dice, está bien, Mistral ha recaudado mil millones de dólares», dice. “¿Deepseek significa que todos esos mil millones de dólares son completamente innecesarios? No, en realidad, es extraordinariamente valioso para ellos poder ver las mejoras de eficiencia de Deepseek, internalizarlas y luego arrojarlos mil millones de dólares «.

Agrega: «Ahora podemos obtener 10 veces más salida del mismo cálculo».

Eso no significa que Mistral esté irremediablemente detrás de los rivales Openai y Anthrope, argumenta. Cada uno de ellos ha recaudado muchos más miles de millones que Mistral. Según los informes, Openai está en conversaciones para recaudar otro asombroso $ 40 mil millones.

Mistral sigue siendo competitivo con ellos porque es de código abierto, dice. Y su lógica tiene mérito. El código abierto brinda a una empresa acceso a mano de obra técnica esencialmente gratuita de aquellos que desean ayudar porque usan el proyecto. Los rivales de código cerrado protegen sus secretos y tienen que pagar toda la mano de obra y calcular el poder.

“No necesitas $ 20 mil millones. Solo necesita más cómputo que cualquier otra aplicación de modelo de código abierto. Entonces Mistral está posicionado [well]. Tienen el mayor cálculo de cualquier proveedor de código abierto ”, dijo Midha sobre su compañía de cartera.

La llama de Facebook, la mayor rival de modelos de IA de código abierto occidental de Mistral, también obtendrá mucha más inversión. El CEO Mark Zuckerberg dijo el miércoles que todavía está planeando gastar «cientos de miles de millones de dólares» En general en la IA. Eso incluye $ 60 mil millones en 2025 en gastos de capital, principalmente centros de datos.

Midha, quien también es miembro de la junta de AI Image Generator Black Forest Labs y 3D Model Maker Luma (Y un ángel con atuendos de IA antrópico, once y otros) tiene otra razón por la que no ve el hambre de AI de GPU disminuyendo en el corto plazo.

Es el líder del programa de oxígeno de A16Z. Las GPU, particularmente los H100 de vanguardia de Nvidia, se han convertido en una mercancía tan escasa que la empresa de capital de riesgo tomó el asunto en sus propias manos hace aproximadamente un año y medio. Compró un montón de ellos para que sus compañías de cartera los usen.

El oxígeno está «demasiado reservado en este momento». No puedo asignar lo suficiente «, se ríe Midha. Sus nuevas empresas no solo necesitan GPU para la capacitación en modelos de IA, sino que también necesitan aún más para administrar sus productos de IA en curso para los clientes.

«Ahora existe esta demanda insaciable de inferencia, para el consumo», explica.

Por eso también cree que los avances de ingeniería de Deepseek tampoco cambiarán a Stargate. Esa es la gran asociación de $ 500 mil millones de Openai Anunciado a principios de este mes con SoftBank y Oracle para los centros de datos de IA.

El cambio principal de los cambios profundos es el reconocimiento de los estados nacionales de que la IA es la próxima infraestructura fundamental, como la electricidad e Internet. Midha quiere que consideren la «independencia de la infraestructura», como él lo llama. ¿Quieren confiar en modelos chinos, con su censura y garras en sus datos? ¿O quieren modelos occidentales que sigan las leyes y la ética occidentales y cumplan con los acuerdos de la OTAN?

Obviamente está abogando por las naciones occidentales utilizando modelos occidentales, como su Mistral con sede en París. Cientos de empresas comparten esa preocupación y ya han bloqueado a Deepseek, que es tanto un servicio de aplicaciones de consumo como un modelo de código abierto.

No todos compran ese miedo a los modelos chinos de código abierto. Las empresas pueden ejecutarlos localmente en sus propios centros de datos. Y Deepseek ya está disponible como un servicio seguro en la nube de compañías estadounidenses como Microsoft Azure Foundrypor lo que los desarrolladores no tienen que usar el servicio en la nube de Deepseek.

De hecho, el ex CEO de Intel, Pat Gelsinger, alguien bien familiarizado con China – Le dijo a TechCrunch que su inicio Gloo está construyendo servicios de chat de IA en su propia versión de Deepseek R1 en lugar de opciones como Llama o OpenAi.

Pero si alguien quiere deshacerse de sus planes del centro de datos a la luz de Deepseek, Midra se ríe y tiene una solicitud: «Si tiene GPU adicionales, envíelos a ANJ».

¡TechCrunch tiene un boletín centrado en AI! Regístrese aquí Para conseguirlo en su bandeja de entrada todos los miércoles.

Programa de intercambio de GPU de oxígeno de A16Z «Overbooked»

Entradas relacionadas