Résumé :
- Jensen Huang, PDG de Nvidia, affirme que les investisseurs ont mal interprété les avancées de DeepSeek, provoquant une vente massive d’actions qui a coûté 600 milliards de dollars en capitalisation boursière à l’entreprise.
- DeepSeek, une entreprise chinoise d’IA, a développé un modèle performant (R1) avec des puces moins puissantes et moins de financement que les modèles occidentaux.
- Selon Huang, le post-entraînement des modèles d’IA reste « la partie la plus importante de l’intelligence » et continuera à nécessiter la puissance de calcul fournie par Nvidia.
- Les investisseurs semblent avoir compris le message puisque l’action Nvidia a depuis récupéré une grande partie de sa valeur perdue lors de la vente massive de janvier.
Dans une interview préenregistrée diffusée jeudi, Huang n’a pas mâché ses mots : les investisseurs ont tout simplement mal compris ce qui se passait.
Tout a commencé lorsque DeepSeek, propriété du fonds spéculatif High-Flyer, a lancé R1, un modèle d’IA open-source particulièrement performant. Ce qui a fait paniquer le marché ? L’affirmation que ce modèle aurait été développé avec des puces moins puissantes et une fraction du budget des géants occidentaux de l’IA.
Les investisseurs y ont vu un signal alarmant : si l’on peut créer des IA performantes avec moins de ressources, à quoi bon investir des fortunes dans l’infrastructure proposée par Nvidia ? Cette inquiétude a provoqué un mouvement de vente massif qui a temporairement amputé la fortune personnelle de Huang de près de 20 %.
Pour le patron de Nvidia, les marchés se sont trompés de paradigme. « Du point de vue des investisseurs, il y avait un modèle mental selon lequel le monde était divisé en pré-entraînement puis en inférence. Et l’inférence consistait à poser une question à une IA et à obtenir instantanément une réponse », a expliqué Huang. « Je ne sais pas à qui la faute, mais ce paradigme est manifestement erroné. »
Ce que les investisseurs n’ont pas saisi, selon lui, c’est l’importance cruciale de la phase post-entraînement dans le développement de l’IA. « C’est la partie la plus importante de l’intelligence. C’est là qu’on apprend à résoudre des problèmes », a insisté le PDG.
Loin de voir DeepSeek comme une menace, Huang se montre enthousiaste face à cette innovation : « C’est tellement excitant. L’énergie dans le monde entier suite à l’open-sourcing de R1 est incroyable. »
Le message est clair : même si l’entraînement initial des modèles peut devenir plus efficace, la puissance de calcul fournie par les puces Nvidia reste indispensable pour les étapes suivantes du développement de l’IA. Selon Huang, les méthodes post-entraînement sont « vraiment très intenses » et continueront à nécessiter une infrastructure robuste.
Depuis novembre, Huang défend l’idée que la mise à l’échelle des modèles d’IA n’est pas en difficulté, mais qu’elle a simplement évolué de l’entraînement vers l’inférence (la capacité d’un modèle à extrapoler des conclusions) et le post-entraînement.
Les remarques de Huang sur DeepSeek pourraient préfigurer le ton de la prochaine conférence sur les résultats de Nvidia, prévue pour le 26 février. Et il n’est pas le seul dirigeant à devoir s’exprimer sur le sujet : DeepSeek est devenu un sujet incontournable lors des appels aux résultats de nombreuses entreprises technologiques.
Lisa Su, PDG d’AMD et principale concurrente de Nvidia, a déjà déclaré que les innovations de DeepSeek sont « bonnes pour l’adoption de l’IA » – une vision apparemment partagée par Huang, mais avec une nuance importante : ces avancées ne remettent pas en cause la valeur des solutions Nvidia.
Le marché semble avoir finalement entendu ce message, puisque l’action Nvidia a récupéré une grande partie de sa valeur depuis la vente massive de janvier. Reste à voir si les résultats financiers du géant des GPU confirmeront cette confiance retrouvée.