Tribunes

La leçon de DeepSeek (à la tech américaine)

La leçon de DeepSeek (à la tech américaine)
OpenAI a jeté le trouble sur le marché naissant de l’IA en arguant, suite à l’arrivée de R1 de DeepSeek, que les données de sortie de ses modèles pourraient être sa propriété. (Photo : Jonathan Kemper / Unsplash)

Les fournisseurs d'IA qui finiront par s'imposer seront ceux qui gagneront la confiance des entreprises clientes. OpenAI semble avoir pris le chemin inverse.

PublicitéAu cours des deux dernières semaines, DeepSeek a mis à mal le discours dans lequel s'était enfermé la Silicon Valley sur l'intelligence artificielle générative en introduisant des moyens nettement plus efficaces pour passer à l'échelle les grands modèles de langage (LLM). Ne disposant pas de milliards de dollars de capital-risque à dépenser en GPU Nvidia, l'équipe de DeepSeek a dû faire preuve de plus d'ingéniosité et a appris à « activer uniquement les parties les plus pertinentes de leur modèle pour chaque requête », comme le note Giuseppe Sette, président de Reflexivity, société fournissant des outils d'intelligence économique à base d'IA.

Il n'a pas fallu longtemps pour que tout le monde commence à interpréter les résultats de DeepSeek à travers le prisme de ses propres préjugés. Les fournisseurs de modèles fermés ont crié au vol de données d'entraînement (s'attirant une vague de commentaires ironiques étant donné la proportion de leurs propres données d'entraînement provenant d'autres sources), tandis que les fournisseurs de logiciels libres ont vu en DeepSeek l'accomplissement naturel de la supériorité des logiciels libres (en dépit du fait qu'il n'existe aucune corrélation entre le fait d'être Open Source et de de devenir un acteur dominant dans le domaine de la technologie).

Au milieu de tous ces biais de confirmation, DeepSeek débouche sur deux grandes évolutions, l'une positive et l'autre très négative. Premièrement, l'IA ne doit plus être dominée par un club de milliardaires. DeepSeek n'a pas vraiment démocratisé l'IA, mais il a montré que les coûts d'entrée dans l'IA ne nécessitaient pas forcément des tours de table de plusieurs centaines de milliards. Deuxièmement, bien qu'il n'y ait aucune raison de penser que les approches ouvertes de l'IA vont remporter la mise, il y a aujourd'hui toutes les raisons de penser que l'approche hyper-fermée d'OpenAI perdra très certainement parce qu'elle n'est pas centrée sur le client. La bataille dans le domaine de l'IA ne se jouera pas sur une question d'ouverture ou de fermeture, mais plutôt de confiance des clients.

« Techno-féodalisme sous stéroïdes »

Je n'ai rien à ajouter sur les implications financières de l'approche de DeepSeek. Comme le souligne Andrew Ng, fondateur de la société de formation spécialisée dans l'IA DeepLearning.AI, « les prix des jetons LLM ont chuté rapidement, et les modèles Open Weight ont contribué à cette tendance et offert plus de choix aux développeurs. » DeepSeek, en optimisant la façon de gérer le calcul et la mémoire, passe au niveau supérieur : « Le o1 d'OpenAI coûte 60 dollars par million de jetons en sortie ; le R1 de DeepSeek coûte 2,19 dollars ». Comme il le conclut, on peut s'attendre à ce que « l'humanité [et les développeurs] utilisent plus d'intelligence [...] à mesure qu'elle devient moins chère ».

PublicitéMais qui construira les outils permettant d'accéder à cette intelligence pilotée par l'IA ? C'est là que les choses deviennent intéressantes.

Bien qu'il soit amusant de tancer OpenAI et d'autres pour avoir pointé du doigt des données d'entraînement prétendument volées, étant donné la propension de ces fournisseurs de LLM à « emprunter » de grandes quantités de données d'autres pour entraîner leurs propres modèles, il y a quelque chose de bien plus troublant en jeu. Comme l'affirme Arnaud Bertrand, cofondateur de Me & Qi, « l'aspect le plus inquiétant ici est qu'OpenAI suggère qu'il y a des cas dans lesquels ils sont propriétaires des sorties de leur modèle ». Il s'agit là d'un « techno-féodalisme sous stéroïdes », prévient-il : un monde dans lequel les propriétaires de LLM peuvent revendiquer la propriété de « chaque élément de contenu touché par l'IA ».

OpenAI : une question de confiance

Il ne s'agit pas d'opposer Open Source et Closed Source. Les logiciels à code source fermé n'essaient pas de s'approprier les données qu'ils touchent. Il s'agit de quelque chose allant au-delà. OpenAI, par exemple, indique clairement que les utilisateurs sont propriétaires des résultats de leurs prompts, mais qu'ils ne peuvent pas utiliser ces résultats pour entraîner un modèle concurrent. Cela constituerait une violation des conditions générales de l'éditeur. A première vue, ce n'est pas si différent du Llama de Meta basé sur des principes d'ouverture pour les usages - à moins que vous n'entriez en concurrence avec lui à grande échelle.

Et pourtant, c'est différent. OpenAI semble suggérer que ses données d'entraînement devraient être ouvertes et libres, mais que les données utilisées par d'autres (y compris les données que les LLM concurrents ont recyclées à partir d'OpenAI) pourraient être en accès réservé. Il s'agit là d'un terrain glissant, qui n'augure rien de bon pour l'adoption de la technologie si les entreprises clientes doivent s'inquiéter - ne serait-ce qu'un peu - du fait que leurs données de sortie sont la propriété des vendeurs de modèles. Le coeur du problème est la confiance et le contrôle par le client, et non l'opposition entre Open Source et modèle propriétaire.

Des éditeurs et investisseurs trop pressés

Steve O'Grady, cofondateur du cabinet d'analyse RedMonk, résume bien les préoccupations des entreprises en matière d'IA : « Les entreprises ont conscience que, pour maximiser les avantages de l'IA, elles doivent être en mesure d'accorder l'accès à leurs données internes ». Cependant, elles n'ont pas voulu le faire à grande échelle parce qu'elles ne font pas confiance aux fournisseurs de LLM sur ce terrain. Et OpenAI a exacerbé cette méfiance. Les fournisseurs qui finiront par s'imposer seront ceux qui gagneront la confiance des clients sur ce plan. L'Open Source peut y contribuer, mais en fin de compte, les entreprises ne se soucient pas réellement de la licence ; elles s'intéressent à la manière dont le fournisseur traite leurs données. C'est l'une des raisons pour lesquelles AWS et Microsoft ont été parmi les premiers à se développer dans le cloud. Les entreprises leur ont fait confiance pour prendre en charge leurs données sensibles.

Dans cette première ruée vers l'or sur le marché de l'IA, nous sommes devenus tellement obsédés par les modèles de fondation que nous avons oublié que le véritable marché, le plus important, n'a pas encore émergé et que la confiance sera essentielle pour le conquérir. Tim O'Reilly a, comme toujours, raison lorsqu'il dénonce les « dirigeants d'entreprises d'IA et leurs investisseurs » qui sont « trop attachés à la poursuite ou à la préservation du pouvoir que leur confère leur situation de monopole et aux rendements démesurés qui en découlent ». Selon le fondateur d'O'Reilly Media, ils oublient que « la plupart des grandes entreprises naissent après une période d'expérimentation et d'expansion du marché, et non pas après un blocage imposé dès le départ ». Les entreprises spécialisées en IA tentent d'optimiser leurs profits trop tôt par rapport à l'évolution du marché. Les efforts visant à contrôler les résultats des modèles auront tendance à en limiter l'adoption par les clients, et non à en étendre les usages.

En somme, les fournisseurs d'IA qui veulent s'imposer doivent réfléchir soigneusement à la manière dont ils peuvent bâtir la confiance sur un marché qui a évolué trop rapidement pour que les acheteurs d'entreprise se sentent en sécurité. Les affirmations tendancieuses, telles que celles d'OpenAI sur les données de sortie des modèles, ne sont, ici, d'aucun secours.

Partager cet article

Commentaire

Avatar
Envoyer
Ecrire un commentaire...

INFORMATION

Vous devez être connecté à votre compte CIO pour poster un commentaire.

Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire

    Publicité

    Abonnez-vous à la newsletter CIO

    Recevez notre newsletter tous les lundis et jeudis

    La question du moment
    Votre organisation a-t-elle établi une cartographie des risques cyber ?