DeepSeek ha convulsionado la industria de la inteligencia artificial (IA). La irrupción de este modelo chino gratuito y de código abierto ha puesto en tela de juicio la necesidad de utilizar en los procesos de entrenamiento e inferencia chips para IA muy potentes y caros. Como los que diseña NVIDIA, que lidera con una rotundidad inapelable el mercado del hardware para IA. Aun así, hace apenas diez días DeepSeek provocó que su valor de mercado cayese abruptamente.
Desde entonces el hardware empleado por esta compañía china ha generado mucha desconfianza. Los responsables de DeepSeek sostienen que la infraestructura que han utilizado para entrenar su modelo aglutina 2.048 chips H800 de NVIDIA. Y que este proceso con 671.000 millones de parámetros ha costado 5,6 millones de dólares. Sin embargo, algunos analistas defienden que estas cifras no reflejan la realidad.
El jugosísimo informe elaborado por SemiAnalysis sostiene que, en realidad, la infraestructura empleada por DeepSeek para entrenar su modelo de IA aglutina aproximadamente 50.000 GPU de NVIDIA con microarquitectura Hopper. Según Dylan Patel, AJ Kourabi, Doug O'Laughlin y Reyk Knuhtsen, al menos 10.000 de estos chips son GPU H100 de NVIDIA, y como mínimo otros 10.000 son GPU H800. Los chips restantes, según estos analistas, son las GPU recortadas H20.
El empaquetado CoWoS de TSMC es un espaldarazo muy fuerte para NVIDIA
Como acabamos de ver, en la coyuntura actual es razonable tener dudas acerca del hardware que ha utilizado DeepSeek en el entrenamiento de su modelo (en la inferencia parece estar utilizando las GPU Ascend 910C de Huawei). Y también acerca del coste real de este proceso, que podría ser mucho más alto que el anunciado oficialmente por esta compañía china. En cualquier caso, DeepSeek ha vertido incertidumbre sobre el mercado de la IA, y esta es la razón por la que tantas compañías de tecnología estadounidenses han perdido valor.
Sea como sea NVIDIA acaba de recibir un espaldarazo muy fuerte procedente de TSMC, que es el fabricante de semiconductores que produce sus GPU. Y es que, según DigiTimes Asia, esta compañía taiwanesa ha decidido poner en marcha un plan de expansión de cinco años de duración de su capacidad de fabricación de circuitos integrados empleando su tecnología de empaquetado avanzado CoWoS (Chip-on-Wafer-on-Substrate). Según Beth Kindig, de la consultora I/O Fund, esta tecnología acaparará entre el 50 y el 60% del mercado en 2025 frente al 15% que sostuvo durante 2024.
En 2024 TSMC anunció oficialmente que estaba construyendo dos plantas de empaquetado CoWoS en la localidad de Chiayi, alojada en el sur de Taiwán
La elevada demanda de las GPU para IA con microarquitectura Blackwell de NVIDIA es en gran medida la responsable de la puesta en marcha de este plan. La compañía liderada por Jensen Huang podrá responder mejor a las necesidades de sus clientes y verá cómo se incrementa su competitividad en una fase en la que DeepSeek y otras compañías chinas representan un desafío. En marzo de 2024 TSMC anunció oficialmente que estaba construyendo dos plantas de empaquetado CoWoS en la localidad de Chiayi, alojada en el sur de Taiwán.
No obstante, esto no es todo. También barajaba la opción de poner a punto una planta más especializada en esta tecnología de empaquetado avanzado en Japón, presumiblemente en la isla de Kyushu, en la que esta compañía está construyendo actualmente dos plantas de producción de semiconductores de vanguardia. En cualquier caso, hay algo más. Y es que las plantas de Chiayi estarán capacitadas para trabajar, además de con el empaquetado CoWoS, con las tecnologías avanzadas InFO y SoIC (System on Integrated Chips).
Es evidente que TSMC quiere cubrirse bien las espaldas y mirar hacia el futuro para evitar que su capacidad de producción vuelva a verse amenazada por un cuello de botella. Un apunte interesante: actualmente el empaquetado CoWoS está siendo utilizado con los chips Instinct MI250 de AMD y con las GPU A100, H100, H200, B100 y B200 de NVIDIA, así como en sus derivados. La revisión utilizada en estos dos últimos chips, los B100 y B200, se conoce como COWOS-L. En 2025 TSMC será capaz de procesar nada menos que 60.000 obleas al mes empleando su tecnología de empaquetado avanzado.
Imagen | TSMC
Más información | DigiTimes Asia | Yahoo! Finance
Ver 4 comentarios
4 comentarios
dark_god
Yo sigo esperando que alguien me diga en qué sentido DeepSeek y nvidia son rivales y competencia uno del otro. Nvidia vende hardware a todos los bandos. No hacen IAs más allá de DLSS, frame generation y esas cosas que para nada tienen que ver con Gemini, XAi, DeepSeek, etc. Ganan pasta de todos los bandos.
Miguel
En primer lugar, coge con pinzas lo que diga Beth si puedes. Se ve claramente que es tendenciosa. El bulo del D0 lo esparcio bien y tuvo que salir Patrick Moorhead a desmentirlo además del propio Pat.
Si tuviera que apostar diria que esta a sueldo de varias compañias.
En cuando a que CoWoS es un aliado de Nvidia diria que es igual de aliado que para Google, AWS, TESLA, MICROSOFT, Intel o como dices AMD puesto que todos ellos usan CoWos para instinct, TPU, Inferentia, Trainium, Dojo, FSD, Maia, Gaudi,... los cuales supusieron el 47% de las ventas de CoWoS.
Por ultimo veo que la gente en general no se ha dado cuenta de la importancia de Deepseek y el cambio de paradigma.
Hace un año aqui dije que lo de Nvidia era una burbuja que estallaria cuando aparecieran modelos de codigo abierto y que la industria tarde o temprano adoptaria estos modelos. Dije especificamente que la IA no era una burbuja, me referia a Nvidia.
Seguro que muchos tambien me tendrían como hater de Nvidia además de Apple. La realidad es que no me caso con nadie y si tengo que apostar, ahora mismo apuesto por Intel. Máxime con lo que he visto, que de momento no voy a publicar.
En 2018 dije que AMD y me tildaron de fanboy de AMD.
En 2020 dije que Apple tenia ese rendimiento por acaparar nodo avanzado y soldarlo todo.
En 2025 digo que en 2026 Intel se convertira en lider absoluto cubriendo todas las franjas estandar (XPU, NPU, CPU y dGPU) y que este año con PTL volvera, asi como ha opinado TechInsights, a liderar la manufactura avanzada de chips.
Veremos en el ISSCC que se cuentan Navid y Kemal de Arizona el 17 y el 20, y los de Hillsboro el 19.
P.D.: Seguimos con el +6% de diciembre repetido ahora en diciembre como el dia de la marmota por parte de la Dra. Kim hace dos días, como noticia refrito, que no se ha atrevido a contestarme.
A Ian parece ser que le gusto mi frase D0 or DIE (size) y ya ha diseñado unas camisetas con mi frase. Y es que esto del Yield por parte de TSMC y N2 es una tomadura de pelo.