Deepseek surtend sur l'App Store: quel est le modèle d'IA chinois et pourquoi est-ce un gros problème?

Deepseek surtend sur l'App Store: quel est le modèle d'IA chinois et pourquoi est-ce un gros problème?

La société de renseignement artificielle chinoise a sauté devant le chatpt d'Openai sur l'App Store d'Apple après avoir publié deux nouveaux modèles

Deepseek a envoyé des vagues de choc dans le monde de l'intelligence artificielle le week-end dernier et Wall Street lundi. Si vous suivez l'industrie de la technologie même avec parcimonie – ou si vous avez récemment eu de la mise sur X ou de l'App Store – vous avez probablement vu le nom.

Mais qu'est-ce que Deepseek, et quel est le problème? Sautons dedans.

Pour commencer, Deepseek est une entreprise et un laboratoire de recherche sur l'IA chinois qui crée des modèles de grande langue open source, ou LLMS. Les LLM open source sont des modèles d'IA qui permettent aux autres de s'appuyer sur sa technologie.

Le LLAMA de X's Grok et Meta est d'autres LLMS open-source bien connus, tandis que le Chatgpt d'Openai est le LLM de source fermée le plus populaire.

Pourquoi est-ce dans les nouvelles?

Deepseek a publié ses modèles de raisonnement R1 et R1-Zero le 20 janvier, et leurs capacités ont rapidement pris note dans les mondes technologiques et AI. En particulier, il y a deux aspects clés pour les dernières versions de Deepseek:

1) renforcement raffiné

Le modèle de Deepseek utilise une technique appelée renforcement – où un modèle prend des décisions pour atteindre un certain objectif – qui va au-delà des autres modèles. En effet, il n'utilise pas de rétroaction humaine pour se affiner, ce que font d'autres modèles.

Comme Ben Thompson, du blog Stratechery axé sur la technologie, l'a dit succinctement: «Les LLM à ce jour, cependant, se sont appuyés sur l'apprentissage du renforcement avec la rétroaction humaine; Les humains sont dans la boucle pour guider le modèle, naviguer dans des choix difficiles où les récompenses ne sont pas évidentes, etc.

2) Distillation

Un autre facteur important ici est la technique de distillation de Deepseek. La distillation est l'endroit où un modèle plus petit comme Deepseek est capable de soulever les informations des modèles plus grands, tout en utilisant moins de mémoire et une puissance de calcul.

Cela aide également à réduire les coûts. Deepseek a déclaré que ses récentes percées coûtaient moins de 6 millions de dollars et ont pris moins de deux mois à construire.

Pourquoi est-ce un gros problème?

D'un point de vue macro, il montre que la Chine – rappelez-vous, le gouvernement communiste chinois est étroitement lié à toutes ses sociétés, en particulier aux grandes entreprises technologiques qui se transforment sur différents marchés – est plus en détail dans l'innovation de l'IA que beaucoup n'en pensaient.

Et la performance de Deepseek est particulièrement remarquable, compte tenu de son faible coût et de sa capacité à naviguer dans les restrictions des puces qui ont été déployées par l'ancien président Joe Biden.

Marc Andreessen, co-fondateur de la société de capital-risque Andreessen Horowitz axée sur la technologie, a appelé dimanche «Sputnik Moment» de l'AI.

Concurrents

Deepseek a écrasé un espace d'IA déjà calé. Il a sauté Chatgpt dans l'App Store d'Apple en tant qu'application gratuite la plus téléchargée ce week-end, indiquant qu'il y a un fort intérêt pour les utilisateurs pour ce que Deepseek peut faire.

De nombreux analystes pensent que Deepseek, et ce qui signifie des capacités de l'IA chinois, était la principale raison pour laquelle le marché boursier américain était en baisse lundi matin, le S&P 500 a chuté de 1,72% dans les 90 premières minutes de négociation.

Meta, qui a annoncé vendredi qu'elle investirait 60 milliards de dollars à 65 milliards de dollars pour alimenter son activité de l'IA, n'a pas été frappée par la baisse de lundi, avec le cours de ses actions environ 1,5% en début de négociation. Google, qui a son propre modèle d'IA, Gemini, a vu son cours de bourse baisser d'environ 2,5%, tandis que Tesla était en baisse de 1%, bien que ses activités soient évidemment plus que sa composante IA. Microsoft, partenaire d'Openai, a vu son cours de bourse baisser de 3,7%.

Le plus grand succès a été pour Nvidia, qui fournit des puces et d'autres technologies importantes qui sous-tendent le développement de l'IA. Son cours de l'action a baissé de 14,8% au cours de la première heure et demie de négociation lundi.

Censure?

Pour renforcer que Deepseek est finalement redevable au gouvernement chinois, beaucoup ont noté ce week-end que son modèle ne répondra pas à certaines questions sur les sujets dont le PCC n'est pas un fan – comme le massacre de la place Tiananmen de 1989. Ceci est similaire à la façon dont Thewrap a récemment trouvé «Little Red Book», alias «RedNote», censurait le contenu de Tiananmen Square ou le traitement chinois des Ouïghours.