CalculatriceCliquez pour ouvrir
L’industrie florissante de l’IA aux États-Unis est en train de recevoir un signal d’alarme, tout comme les investisseurs nerveux qui ont vu leurs actions augmenter grâce au boom de l’IA de ces dernières années. En effet, une startup chinoise, DeepSeek, a bouleversé les idées reçues sur la manière de créer des modèles d’IA avancés et sur leur coût.
La société a signalé début 2025 que ses modèles étaient en concurrence avec Chat GPT d’OpenAI, le tout pour un coût de formation déclaré de 6 millions de dollars. Cela a provoqué une baisse record de 600 milliards de dollars en une seule journée des actions de Nvidia (NVDA) et a obligé les investisseurs à repenser leurs paris basés sur l’IA à l’avenir.
Pour quiconque investit dans l’IA, comprendre l’évolution de DeepSeek est essentiel pour naviguer dans une nouvelle ère dans le domaine. Nous vous mettons au courant ci-dessous.
Leçon principale
- Le récent lancement de DeepSeek-R1 a effrayé les investisseurs en IA, entraînant une vente massive des fabricants de puces.
- Ses modèles montrent que l’ingénierie intelligente peut réduire le coût du développement de l’IA, un problème pour les sociétés américaines d’IA qui ont dépensé des centaines de milliards de dollars pour leurs propres projets.
- Des modèles open source abordables peuvent étendre l’adoption de l’IA, créant ainsi de nouvelles perspectives pour les investisseurs.
Qu’est-ce que DeepSeek ?
DeepSeek est une société de recherche en IA dont le siège est à Hangzhou, en Chine, fondée en juillet 2023 par l’ancien gestionnaire de fonds spéculatifs Liang Wenfeng et soutenue par le géant de l’investissement quantitatif High-Flyer Quant. Il a donné la priorité à l’efficacité algorithmique et à la collaboration open source pour contester la domination de l’IA par les géants américains de la technologie.
Depuis son lancement, DeepSeek a publié une série de modèles impressionnants, notamment DeepSeek-V3 et DeepSeek-R1, censés correspondre aux capacités d’inférence o1 d’OpenAI à faible coût. De plus, les modèles de DeepSeek sont open source, ce qui signifie qu’ils sont librement disponibles pour que quiconque puisse les utiliser, les modifier et les distribuer.
Plus important encore, et potentiellement le plus dévastateur pour ses concurrents, DeepSeek a réalisé ces progrès malgré les restrictions américaines à l’exportation sur les puces d’IA avancées, telles que les modèles H100 et A100 de Nvidia.
En fait, ces limitations pourraient être une aubaine pour les avancées de l’entreprise. DeepSeek affirme avoir trouvé une solution pour une plus grande capacité de puce et applique d’autres stratégies clés que les concurrents étudient actuellement en détail :
- Architecture mixte d’experts (MoE): activez uniquement un sous-ensemble de paramètres par tâche (par exemple, seulement 5 % du total des jetons disponibles), réduisant ainsi le coût de calcul.
- Apprentissage par renforcement: Entraînez le modèle grâce à des retours d’essais et d’erreurs, améliorant ainsi les capacités de raisonnement.
- Technique de distillation: Compresse les grands modèles comme GPT-4 en versions plus petites et moins chères.
Cette approche hybride permet à l’entreprise de former ses modèles à l’aide d’environ 2 000 GPU Nvidia en 55 jours pour un coût d’environ 5,6 millions de dollars, soit une fraction de ce que dépensent les géants technologiques américains.
Comment cela affecte-t-il les investissements en IA ?
Le succès de DeepSeek remet en question l’idée populaire qui motive les investissements massifs dans l’IA aux États-Unis, selon laquelle le développement de l’IA nécessite des sommes d’argent infinies pour dépenser de grosses sommes en puces de type Nvidia et autres technologies coûteuses.
Les principales valeurs technologiques aux États-Unis ont chuté de manière significative suite à l’annonce de ces développements. Les actions Nvidia ont plongé de près de 17 %, la plus forte baisse sur une journée de l’histoire du marché boursier américain. D’autres actions du secteur de l’IA, notamment Microsoft Corporation (MSFT), Alphabet Inc. (GOOGL) et ASML Holding NV (ASML), ont également fortement chuté.
Le moment DeepSeek crée également des opportunités pour les investisseurs dans le domaine de l’IA. Voici ce que les investisseurs avisés peuvent faire :
- Repenser la mentalité « plus c’est gros, mieux c’est ». Les investisseurs voudront peut-être rechercher des entreprises qui investissent dans des méthodes de formation plus efficaces et des technologies plus économes en énergie, plutôt que dans des clusters GPU à forte intensité de capital et en expansion aveugle. Les entreprises qui exploitent le cloud GPU décentralisé peuvent avoir un avantage.
- Préparez-vous à un accès accru à l’IA: Les obstacles à l’adoption de l’IA semblent diminuer. Les investisseurs devraient garder un œil sur les applications émergentes d’IA et sur les entreprises développant des produits d’IA du monde réel, plutôt que de simplement parier sur les fournisseurs de modèles de plateforme.
- Focus sur les logiciels : Alors que les investisseurs ont poussé les fabricants de puces liés à l’IA comme Nvidia à atteindre des sommets records, l’avenir de l’IA pourrait dépendre davantage de l’évolution des logiciels que d’un matériel coûteux.
- Surveillance des risques géopolitiques : Le succès de DeepSeek va probablement accroître les tensions technologiques entre les États-Unis et la Chine. Les investisseurs devraient surveiller les changements de politique, tels que des contrôles plus stricts à l’exportation.
Problème d’erreur DeepSeek
Les investisseurs doivent également rester informés à mesure que les experts approfondissent DeepSeek. Une première étude menée par NewsGuard, qui évalue la crédibilité des sites d’information et d’information, inclut des raisons de s’inquiéter sérieusement de la fiabilité de DeepSeek. Bien qu’il soit classé premier dans les téléchargements sur l’App Store, le chatbot IA chinois a échoué aux tests de précision 83 % du temps, le plaçant au bas des chatbots IA évalués – se classant 10e sur 11 concurrents.
L’examen de NewsGuard a révélé plusieurs problèmes importants :
- 30% des réponses contenaient des informations complètement fausses
- 53 % des réponses n’ont pas répondu aux requêtes
- Seulement 17 % des réponses ont réussi à démystifier les fausses allégations.
- Le chatbot a également tendance à répéter les positions du gouvernement chinois, même lorsqu’il répond à des questions sans rapport avec la Chine, par exemple en donnant la position diplomatique de la Chine sur des questions sans rapport avec la Chine.
L’approche de DeepSeek en matière d’exactitude semble donc transférer la responsabilité aux utilisateurs, avec des conditions d’utilisation les informant de « vérifier de manière proactive l’authenticité et l’exactitude du contenu de sortie ».
Conclusion
DeepSeek pourrait être le signe avant-coureur d’un avenir moins coûteux pour l’IA. Cela peut impliquer de se concentrer davantage sur les modifications logicielles face à la force brute d’une technologie de plus en plus coûteuse, d’une collaboration open source et d’une infrastructure évolutive. Mais cela signifie également regarder au-delà des gros titres et évaluer si DeepSeek offre quelque chose de nouveau et de différent, ou proposer quelques premiers tests de ses capacités, s’il ne s’agit que d’une autre illusion générée par l’IA.
