DeepSeek IA

L'Ascension Perturbatrice de DeepSeek dans l'IA

DeepSeek, un laboratoire chinois d'IA, a récemment attiré une attention significative, en tête des classements des boutiques d'applications et en suscitant des discussions sur la course mondiale à l'IA. Soutenus par High-Flyer Capital Management, les modèles d'IA de DeepSeek, développés avec des techniques de calcul efficaces, incitent les analystes à remettre en question la domination des États-Unis dans l'IA et la durabilité de la demande de puces d'IA.

Du Fonds Spéculatif à l'Innovateur en IA

Fondée par l'enthousiaste de l'IA Liang Wenfeng, High-Flyer Capital Management s'est initialement concentrée sur les algorithmes de trading basés sur l'IA. En 2023, DeepSeek a émergé comme un laboratoire distinct dédié à la recherche sur l'IA, pour finalement se séparer en tant que société à part entière. Malgré les défis tels que les interdictions d'exportation de matériel américain, DeepSeek a construit ses propres centres de données pour la formation de modèles, en utilisant des puces Nvidia H800.

L'équipe de DeepSeek est connue pour être jeune et recruter de manière agressive les meilleurs chercheurs en IA des universités chinoises. Ils embauchent également des personnes de divers horizons pour élargir la compréhension de leur IA sur divers sujets.

Les Avancées du Modèle DeepSeek

L'entreprise a dévoilé ses modèles initiaux en novembre 2023, mais c'est la famille DeepSeek-V2 qui a véritablement captivé l'attention de l'industrie de l'IA. DeepSeek-V2 a excellé dans les benchmarks d'IA et était remarquablement rentable, ce qui a poussé des concurrents comme ByteDance et Alibaba à baisser leurs prix de modèle.

DeepSeek-V3, lancé en décembre 2024, a encore consolidé la réputation de DeepSeek. Les tests internes suggèrent que DeepSeek V3 surpasse les modèles open source comme Llama de Meta et les modèles fermés comme GPT-4o d'OpenAI. De plus, le modèle de "raisonnement" R1 de DeepSeek démontre des performances comparables au modèle o1 d'OpenAI, excellant dans la vérification des faits et la fiabilité.

Préoccupations et Implications

Cependant, en tant qu'IA développée en Chine, DeepSeek est soumise à la réglementation du contenu, garantissant que ses réponses sont alignées sur les "valeurs socialistes fondamentales". Cela soulève des préoccupations quant à la censure potentielle et aux préjugés. Bien que le modèle économique de DeepSeek reste quelque peu flou, sa compétitivité en matière de coûts et ses licences permissives ont attiré une large base de développeurs, avec des modèles dérivés obtenant des millions de téléchargements.

L'ascension rapide de DeepSeek a perturbé le paysage de l'IA, ayant un impact sur le cours de l'action de Nvidia et suscitant des réponses du PDG d'OpenAI, Sam Altman. Alors que certaines entités interdisent DeepSeek en raison de préoccupations de sécurité et du contrôle étatique perçu, d'autres, comme Microsoft, intègrent sa technologie. Le gouvernement américain envisage également d'interdire DeepSeek sur les appareils gouvernementaux. L'avenir de DeepSeek reste incertain, mais ses modèles innovants et son impact sur l'industrie de l'IA sont indéniables.

Source: TechCrunch