↩ Accueil

Vue normale

Wikimedia signe avec les majors de l’IA générative pour son programme Enterprise

16 janvier 2026 à 14:49
À table avec une longue cuillère ?
Wikimedia signe avec les majors de l’IA générative pour son programme Enterprise

Alors que Wikipédia fête ses 25 ans, la fondation Wikimedia en profite pour mettre en avant son programme « Enterprise » et les accords qu’elle vient de signer avec des entreprises majeures de l’IA générative telles qu’Amazon, Meta, Microsoft, Mistral AI ou Perplexity. Des accords qui lui permettent de canaliser le nombre énorme de requêtes effectuées par les bots crawlers d’IA générative sur ses infrastructures.

Hier, Wikipédia fêtait ses 25 ans. « Avec des milliards de visites mensuelles et un nombre toujours croissant d’organisations qui s’appuient sur les connaissances gratuites et vérifiées de Wikipédia, cette plateforme est devenue partie intégrante de l’architecture de l’ensemble de l’Internet », déclarait à cette occasion Maryana Iskander, directrice générale de la Fondation Wikimédia.

Le lendemain de cet anniversaire, cette même fondation annonce avoir conclu des accords avec les entreprises d’IA générative Amazon, Meta, Microsoft, Mistral AI et Perplexity pour son programme « Wikimedia Enterprise ».

Une saturation des infrastructures de Wikimédia qui demande un changement d’utilisation

Depuis le début des modèles de langage, le contenu de Wikipédia est crucial pour leur entrainement. L’encyclopédie participative permet à toutes ces entreprises de s’appuyer sur d’importantes masses de données créées par des humains. Elle est à la fois une source énorme d’exemples d’écriture et d’informations mises à jour régulièrement couvrant un spectre encyclopédique.

L’adoption par Wikipédia de la licence Creative Commons by-sa en 2009 rend les choses encore plus simples pour la réutilisation de ses contenus (la question de la citation des auteurs dans les outils d’IA générative se pose néanmoins). Ainsi, en 2020, GPT-3 d’OpenAI s’appuyait déjà sur trois milliards de tokens venant de la version anglophone de l’encyclopédie.

Mais depuis, les modèles de langage sont sortis des laboratoires et les entreprises en mettent de nouveaux sur le marché toutes les semaines. De plus, l’utilisation généralisée du RAG (ou génération à enrichissement contextuel en français), technique qui permet d’optimiser leur réponse sans relancer un processus d’entrainement, augmente considérablement le nombre de requêtes envoyées aux sites qui peuvent rafraichir les informations contenues dans le modèle. Ces requêtes envoyées par les robots crawlers des entreprises d’IA saturent régulièrement les infrastructures de certains sites. Et Wikipédia en fait évidemment partie.

En avril 2025, la fondation Wikimedia tirait un signal d’alarme : « Notre infrastructure est conçue pour supporter des pics soudains de trafic d’origine humaine lors d’événements très intéressants, mais le volume de trafic généré par les robots scrapeurs est sans précédent et présente des risques et des coûts croissants », expliquait-elle. Surtout que certaines entreprises d’IA générative ne respectent pas les fichiers robots.txt qui sont censés permettre de donner des instructions aux robots crawlers comme leur interdire l’accès.

Plusieurs API et une volonté d’utiliser le programme pour mieux gérer les citations

Le programme Enterprise permet à la fondation de rediriger les entreprises d’IA vers des API qui gèrent mieux leurs accès au contenu. Elle en propose plusieurs : l’API On-demand renvoie la version la plus récente pour une demande d’article spécifique, l’API Snapshot fournit Wikipédia sous forme de fichier téléchargeable pour chaque langue, mis à jour toutes les heures, et l’API Realtime diffuse les mises à jour dès qu’elles se produisent.

En octobre dernier, la fondation expliquait que l’encyclopédie perdait 8 % de pages vues par les humains en un an et mettait ça sur le compte de l’IA. À cette occasion, elle s’émeuvait d’un risque d’une baisse de la participation au projet. Car si les internautes ne savent pas que les contenus générés par IA sont tirés en grande partie de Wikipédia et qu’ils ne la consultent plus, il est possible qu’ils ne voient plus l’intérêt d’y participer. La fondation expliquait à ce moment-là que son programme « Enterprise » devait pousser aussi les entreprises d’IA à attribuer correctement les contenus.

« Wikipédia est un élément essentiel du travail de ces entreprises technologiques, qui doivent trouver comment le soutenir financièrement », explique Lane Becker, président de Wikimedia Enterprise à Reuters. « Il nous a fallu un certain temps pour comprendre quelles étaient les fonctionnalités et les caractéristiques à proposer si nous voulions faire passer ces entreprises de notre plateforme gratuite à une plateforme commerciale… mais tous nos grands partenaires technologiques comprennent vraiment la nécessité de s’engager à soutenir le travail de Wikipédia », ajoute-t-il.

La fondation précise que ce ne sont pas les premiers accords dans ce sens avec d’importantes entreprises du monde de l’IA générative. Ainsi, Google, Ecosia, Nomic, Pleias, ProRata et Reef Media étaient déjà entrées dans son programme Enterprise.

Mais avec les cinq nouveaux accords, la fondation Wikimédia se lie économiquement de plus en plus avec ce milieu. Si leurs montants prennent une place significative dans son budget, des dents pourraient grincer au sein de la communauté Wikipédia. Rappelons que l’IA est un sujet sensible qui s’est un peu enflammé quand la fondation a voulu utiliser l’IA générative pour créer des résumés automatiques d’articles de l’encyclopédie.

☕️ La distribution Tails 7.4 permet maintenant de garder les réglages de langues

16 janvier 2026 à 08:57

La distribution Linux Tails, spécialisée dans la sécurité, a été mise à jour jeudi. Arrivant un mois après la 7.3.1, cette nouvelle version contient des évolutions de paquets telles que le passage de Tor Browser à la version 15.0.4, Thunderbird en version 140.6.0 ou le noyau Linux dans sa version 6.12.63.

Une des nouveautés les plus visibles pour l’utilisateur, c’est la possibilité de garder ses réglages de langues, de disposition de clavier et de format d’affichage des dates et heures entre deux utilisations de la distribution live.

En effet, l’équipe de Tails explique avoir mis en place une option pour enregistrer ces options si l’utilisateur l’active. Ainsi, on peut plus facilement saisir le mot de passe de notre stockage persistant, si on le veut. Attention, le billet annonçant la nouvelle version précise que ces options sont stockées de manière non chiffrée.

L’équipe de Tails précise aussi qu’ « avec la transition en cours de BitTorrent v1 vers v2, les fichiers BitTorrent v1 que nous avons fournis jusqu’à présent peuvent devenir un problème de sécurité ». Elle a donc choisi de ne plus utiliser le protocole BitTorrent pour distribuer sa distribution : « Nous ne pensons pas que la mise à jour vers BitTorrent v2 justifie les coûts supplémentaires liés à la migration et à la maintenance ».

Santé : le ministère met en place une stratégie pour lutter contre la désinformation en ligne

15 janvier 2026 à 12:53
Et la santé surtout !
Santé : le ministère met en place une stratégie pour lutter contre la désinformation en ligne

Alors que la pandémie de Covid-19 a marqué un accroissement de la circulation de fausses informations en santé, notamment via les réseaux sociaux, la ministre de la Santé, Stéphanie Rist, lance une stratégie pour « y répondre de manière concrète, durable et collective ».

Des outils de diffusion d’informations et de riposte contre la désinformation, la constitution d’un « observatoire de la désinformation en santé » et la mise en place d’outils de mesure de la perception des citoyens… La ministre de la Santé, Stéphanie Rist, semble vouloir agir contre la désinformation en santé dont la circulation s’est fortement accrue depuis le début de la pandémie de Covid-19.

Elle vient de lancer une « stratégie nationale contre la désinformation en santé » en s’appuyant sur le rapport que lui ont remis lundi 12 janvier Mathieu Molimard, Dominique Costagliolia et Hervé de Maisonneuve.

« La parole publique en santé est trop dispersée, trop lente face à la viralité »

Dans leur texte [PDF], les trois médecins rapporteurs affirment que la plupart des acteurs qu’ils ont interrogés « décrivent une augmentation de la désinformation en santé, alimentée par une littératie scientifique déficiente, un esprit critique insuffisant, la viralité numérique, la perte de repères scientifiques et la diffusion organisée de contenus trompeurs ». Des journalistes scientifiques, des organismes de santé, des politiques ou même des plateformes de réseaux sociaux comme Meta ou YouTube (le rapport note le « seul refus explicite d’entretien » de la part de la plateforme X/Twitter) ont été auditionnés.

Pour les auteurs, « si notre système scientifique, pris dans son ensemble, est solide, la parole publique en santé est trop dispersée, trop lente face à la viralité ». Et la désinformation touche « tous les domaines » de la santé : « vaccination, cancer, alimentation, santé mentale, santé des femmes, pratiques de soins non conventionnelles ou risques environnementaux ».

Les profils des acteurs de la désinformation en santé en France sont « variés » : influenceurs, groupes militants, professionnels de santé ou scientifiques dévoyés… « Les industriels, qu’ils commercialisent des produits de santé ou des produits impactant la santé, peuvent aussi être à l’origine de désinformation en santé », expliquent-ils. Et les trois médecins constatent que « la détection et la réponse à la désinformation restent inorganisées ».

Écoute et riposte prévues par le ministère

C’est à ce problème que veut remédier Stéphanie Rist. Sa stratégie se déploie sur trois axes. De l’écoute et des consultations citoyennes, d’abord, avec l’exploration des perceptions et logiques de croyance et un baromètre national sur la question. Mais aussi l’observation en ligne « dans la durée des attitudes et pratiques des citoyens face à la désinformation en santé » et la volonté de « recueillir leurs réactions en temps réel et tester des hypothèses de communication ». Un « comité » composé de 27 citoyens a aussi été mis en place. Il doit remettre un avis à la fin du mois de janvier ou début février.

La ministre explique travailler à la mise en place d’un « Observatoire de la désinformation en santé » dont elle ne donne pour l’instant pas la composition. Celui-ci doit « être l’acteur essentiel de l’identification et de la compréhension des phénomènes de désinformation en santé ».

Concernant la riposte sur le numérique, un dispositif d’« infovigilance en santé » doit être lancé à partir de fin janvier. En s’appuyant sur de la veille et de la détection de fausses informations en santé, il est censé conduire à la mise en place d’outils de diffusion d’informations et de riposte sur ces sujets adaptés aux plateformes comme TikTok et YouTube Shorts, avec comme « site de référence » l’espace « décryptages » du site sante.fr (et non Santé.fr comme écrit dans le rapport). Espérons qu’un effort de modernisation du site soit prévu avant le lancement de la campagne.

Enfin, pour « bâtir un socle de confiance propice à l’information en santé », le ministère élabore des « kits pédagogiques sur l’information en santé à destination des enseignants et enfants ». Il veut aussi intégrer plus la désinformation en santé au sein des programmes de recherche. Il aurait été d’ailleurs intéressant que, pour le rapport sur lequel il s’appuie, le ministère ne sollicite pas seulement le regard de médecins mais aussi celui de chercheuses et chercheurs en sciences de l’information et en sociologie.

☕️ Un rapport de police britannique invente un match de foot et rejette la faute sur Copilot

15 janvier 2026 à 10:46

Le responsable de la police du comté britannique des Midlands de l’Ouest, Craig Guildford, a reconnu une erreur dans un rapport concernant l’interdiction de stade de supporters du club de foot lors d’un match de Ligue Europa.

En effet, pour le match d’Aston Villa contre le Maccabi Tel-Aviv qui se jouait en octobre dernier, la police locale l’avait classé « à haut risque » et s’était prononcée pour l’interdiction aux supporters visiteurs d’assister au match. Dans son communiqué de presse, pas d’erreur, mais dans son rapport remis aux autorités pour justifier sa position, elle évoquait un match entre West Ham et le Maccabi Tel Aviv qui n’a jamais eu lieu.

Depuis la date du match, les critiques pleuvent sur cette décision, notamment de la part du Premier ministre britannique Keir Starmer et du gouvernement israélien. Lundi dernier, Craig Guildford a envoyé une lettre [PDF] à Karen Bradley, membre du Parlement britannique et responsable du Home Affairs Select Committee de la Chambre des communes.

« Vendredi après-midi, j’ai pris conscience que le résultat erroné concernant le match West Ham contre Maccabi Tel Aviv était dû à l’utilisation de Microsoft Co Pilot », s’y explique-t-il après avoir nié en décembre s’être appuyé sur l’IA pour préparer le rapport, remarque The Verge. Il avait aussi imputé le problème à une erreur dans les résultats du moteur de recherche de Google.

illustration d'une personne manipulée comme une marionnette par une IA

Pour la ministre de l’Intérieur britannique, Shabana Mahmood, c’en est trop. Selon l’AFP, celle-ci a affirmé : Craig Guildford « n’a plus ma confiance » devant la Chambre des communes après avoir commandé un rapport indépendant dont les conclusions sont « accablantes », selon elle. L’agence de presse explique qu’elle n’a pas le pouvoir de le démettre de ses fonctions mais qu’elle a annoncé que son gouvernement allait rétablir cette possibilité.

❌