Départ canon, réception glaciale. La joie a été de courte durée : le premier raid shooter PvP de Wildlight Entertainment a culminé à plus de 95 000 joueurs, avant de se heurter presque aussitôt à une note « Mostly Negative » sur Steam.
Highguard, entre afflux massif et rejet express
Lancé par surprise sur Steam, Xbox et PlayStation, Highguard capitalisait sur le pedigree de ses vétérans. Moins de deux heures après la mise en ligne, SteamDB recensait déjà plus de 95 000 joueurs simultanés.
La dynamique s’est toutefois brisée côté avis: sur 10 716 évaluations, 78,2 % sont négatives, soit 8 383 critiques défavorables pour seulement 2 333 positives. La page Steam affiche « Mostly Negative » et le studio n’a, à ce stade, fait aucun commentaire sur les performances ou le ressenti des joueurs.
Le contraste rappelle le cas Splitgate: Arena Reloaded, désormais au ralenti malgré un lancement récent et un héritage apprécié. Le parallèle nourrit l’inquiétude autour de la rétention et du positionnement de Highguard.
Critiques récurrentes et dissonance de design
Les retours pointent un manque de cap clair, un design de cartes et d’interactions jugé faible, une boucle de gameplay discordante et des performances en deçà. Plusieurs joueurs décrivent un 3v3 sur une grande carte, alourdi par du minage et du loot jugés laborieux, loin de la promesse d’un gunplay nerveux.
Sur r/PS5, des témoignages évoquent une image « floue » et la lassitude face à l’avalanche de MOBAs et de shooters. La critique principale reste la tentation du grand écart: vouloir plaire à tous au détriment d’une expérience focalisée.
Wildlight face au dilemme de l’itération rapide
Si le free-to-play favorise l’ajustement post-lancement, l’écart entre promesse et exécution complique la rétention. Sans feuille de route visible ni message fort à court terme, le pic initial risque de ne pas se transformer en base active durable.
Un iGPU qui refuse de vieillir, et une montée en gamme réservée aux élites. La feuille de route officieuse d’AMD dessine un paysage où la majorité des laptops resterait figée sur la même génération graphique.
RDNA 3.5 maintenu jusqu’en 2029
Une diapositive partagée sur Weibo par Golden Pig Upgrade, réputé pour ses fuites fiables, indique qu’AMD conserverait l’iGPU RDNA 3.5 jusqu’en 2029. Ce n’est pas une roadmap officielle, mais le signal est fort: l’iGPU des Ryzen AI 300 et 400 resterait la norme pour des années.
Concrètement, la grande majorité des portables bureautiques et machines milieu de gamme verrait peu ou pas d’évolution graphique, malgré le rythme annuel des raffinements chez la concurrence. Le progrès se déplacerait côté CPU, avec Zen 6 présenté comme l’attraction majeure des laptops mainstream.
RDNA 5 pour le haut de gamme « Halo »
Les véritables nouveautés architecturales basculeraient sur des SKU premium. Les variantes « Medusa Halo » dotées de tuiles GPU séparées adopteraient RDNA 5, tandis que les puces « Medusa Point » standard resteraient en RDNA 3.5. L’unique levier possible pour doper l’iGPU courant serait d’augmenter le nombre de CU via un die plus grand ou un process plus dense, hypothèse jugée peu probable si RDNA 5 est gardé pour le segment Halo.
Un cap déjà perceptible avec RDNA 4
Le lancement des dGPU RDNA 4 a donné le ton : présence limitée au desktop, pas de variantes mobiles ni d’intégration APU, et une stratégie cantonnée au milieu de gamme sans concurrent haut de gamme. Prolonger RDNA 3.5 sur près d’un demi‑décennie accroîtrait l’écart technologique si les rivaux itèrent plus vite.
Si ce scénario se confirme, AMD prendrait un pari industriel clair : réserver l’innovation graphique aux produits phares à forte marge, tout en capitalisant sur l’endurance de RDNA 3.5 pour le volume. À court terme, les utilisateurs de laptops mainstream devraient attendre Zen 6 pour un saut notable, tandis que le jeu en iGPU restera stable, sauf rare hausse de CU.
Le chroniqueur tech du Washington Post, Geoffrey A. Fowler, a mis à l’épreuve ChatGPT Health avec dix ans de données issues de son Apple Watch, soit 29 millions de pas et 6 millions de mesures de fréquence cardiaque. Le système l’a catégorisé « F » en santé cardiaque, déclenchant une alerte qui s’est révélée infondée après avis médical.
Un modèle qui confond estimation et biomarqueur
Le cœur du faux diagnostic tient à l’interprétation de la VO2 max. ChatGPT Health l’a traitée comme une valeur clinique absolue alors qu’Apple la présente explicitement comme une estimation utile au suivi de tendance, pas au triage médical. Sur cette base bancale, l’outil a émis un jugement négatif qui ne résiste pas à un examen clinique standard.
L’IA a aussi pris pour un signal physiologique une rupture de série provoquée par un changement de génération d’Apple Watch. Le passage à un nouveau capteur a modifié la ligne de base de la fréquence cardiaque au repos, mais l’algorithme l’a assimilé à une dégradation de l’état de santé, ignorant l’effet matériel d’un hardware révisé.
Variabilité des réponses et trous de contexte
Au-delà de la lecture erronée des données, la sortie de ChatGPT Health s’est montrée instable. À question identique, Fowler a reçu des évaluations oscillant de « F » à « B ». Le système a en outre « oublié » à plusieurs reprises des informations de base comme l’âge ou le sexe, et a ignoré des résultats sanguins récents pourtant fournis dans le fil de discussion.
Pris ensemble, ces comportements traduisent un modèle qui ne gère ni la qualité hétérogène des capteurs grand public ni la persistance contextuelle indispensable à l’analyse santé. Ils posent la question de l’aptitude d’un assistant généraliste à exploiter des métriques portées par des montres connectées, où chaque révision de capteur et chaque changement de portabilité peut altérer la série.
Au-delà du cas individuel, l’épisode illustre un écueil structurel: sans calibrage par appareil, sans gestion des ruptures liées au passage à un nouveau capteur et sans hiérarchie explicite entre estimation grand public et biomarqueur clinique, un moteur conversationnel générera des alertes contradictoires et anxiogènes. Tant que ces briques ne sont pas standardisées — détection de drift matériel, métadonnées de capteur, protocole d’incertitude — la valeur ajoutée restera limitée au conseil hygiène plutôt qu’au triage.
« DeepSeek-V3 est construit sur notre architecture. » La phrase d’Arthur Mensch, CEO et cofondateur de Mistral, a déclenché un tir de barrage. Dans un entretien récent sur la dynamique de l’open source en Chine, le dirigeant a décrit Mixtral comme le premier « sparse Mixture-of-Experts » maison publié début 2024 et affirmé que DeepSeek-V3 et ses itérations s’appuyaient sur la même architecture, rendue reproductible par Mistral.
La chronologie et la technique compliquent toutefois ce récit. Les deux papiers fondateurs sont apparus à trois jours d’intervalle sur arXiv (Mixtral: 2401.04088 ; DeepSeek: 2401.06066), tous deux axés sur les SMoE avec activation clairsemée pour réduire le coût de calcul et améliorer les performances.
Mais les objectifs divergent : Mixtral procède d’une approche d’ingénierie visant à montrer qu’un socle solide + un MoE éprouvé peut dépasser des denses plus grands, quand DeepSeek revendique une refonte de l’architecture pour traiter deux angles morts du MoE classique, la surcharge de compétence des experts et les redondances d’apprentissage.
Deux voies pour le SMoE
Les deux utilisent un routage Top-K façon GShard. Mixtral conserve une granularité standard : chaque expert est un bloc FFN complet, tous considérés à parité, sélectionnés dynamiquement par le routeur. La distribution des connaissances y reste relativement plate, mêlant généraliste et spécifique au sein des mêmes experts.
DeepSeek introduit une segmentation fine des experts, découpant de « gros » experts en unités plus petites à paramètres constants, pour des combinaisons plus flexibles et un apprentissage plus ciblé. S’y ajoutent des « experts partagés », toujours activés et exclus du routage, qui encapsulent les compétences générales, pendant que les experts soumis au Top-K se spécialisent. Résultat : un découplage explicite des connaissances générales et spécifiques, absent du design Mixtral.
Autre point qui alimente la controverse : la publication « Mixtral of Experts » ne détaille ni données, ni hyperparamètres, ni tokens d’entraînement, ni ablations. À l’inverse, la communauté a relevé fin 2025 que Mistral 3 Large reprenait le schéma architectural popularisé par DeepSeek-V3, renversant de fait l’argument d’antériorité suggéré par Arthur Mensch.
Open source, influence et récit d’antériorité
Sur le fond, l’affirmation d’un « même type d’architecture » tient pour le cadre SMoE/Top-K. Sur les choix structurants, elle s’effrite. L’impact industriel penche aujourd’hui du côté de DeepSeek, dont les contributions sur le MoE clairsemé et la MLA ont marqué l’écosystème, quand Mistral a surtout installé Mixtral comme référence opérationnelle et catalyseur de l’adoption. Au-delà du bruit, le différentiel d’influence technique s’est déplacé, et la bataille d’image autour de l’antériorité reflète la tension entre itération d’ingénierie et réagencement algorithmique.
Dans un marché où la performance/coût sur GPU devient l’axe cardinal, la granularité des experts, le rôle d’experts partagés et la discipline de routage ne sont pas des détails : ils conditionnent l’efficacité d’entraînement, la stabilité et l’utilisation mémoire. La prochaine salve se jouera moins dans les déclarations que dans les courbes de perplexité, la qualité des ablations et les gains visibles en production, alors que DeepSeek prépare déjà une nouvelle fenêtre de tir.
Selon The Sun, Roberto Moreno, ex-sélectionneur intérimaire de l’Espagne, a été remercié par le FK Sotchi après une série noire et une gestion jugée déconnectée, marquée par un recours obsessionnel à ChatGPT pour des décisions sportives et logistiques. Arrivé l’été dernier, l’Espagnol de 48 ans a quitté le club en septembre après sept matches et un seul point, avec en prime une relégation du club de l’élite russe vers la deuxième division.
Des plannings dictés par l’IA, incompréhensibles pour le vestiaire
Andrey Orlov, ex-directeur sportif de Sotchi, décrit un staff sidéré. Pour un déplacement à Khabarovsk, Moreno aurait calé l’intégralité du voyage sur un plan généré par ChatGPT, imposant un réveil à 5 h, un entraînement à 7 h deux jours avant le match et jusqu’à 28 heures sans sommeil pour l’effectif. « J’ai tout paramétré dans ChatGPT », lui aurait-il expliqué, malgré les protestations et l’incompréhension des joueurs.
Le technicien aurait également marginalisé les séances sur coups de pied arrêtés et persisté dans une approche très axée sur la possession, sans efficacité dans la zone de vérité. En fin de cycle, Orlov évoque un vestiaire fracturé, des cadres russes exaspérés, des étrangers dubitatifs et un manque d’empathie ressenti envers adjoints et joueurs.
Recrutement: ChatGPT en arbitre final
Sur le marché des attaquants, l’été dernier, le club aurait soumis à ChatGPT des données Wyscout de plusieurs profils, dont Georgi Meleshin, Ivan Sergeïevitch Pisarsski et Ilya Shchuranachev. L’outil aurait recommandé Shchuranachev, finalement recruté, mais resté muet en dix rencontres. « En outil d’appoint, pourquoi pas. En boussole principale, non », tranche Orlov, pointant une dépendance qui a parasité les choix sportifs.
Moreno avait assuré l’intérim de la Roja sur trois matches avant de succéder officiellement à Luis Enrique en juin 2019, lorsque ce dernier s’était retiré pour raisons familiales. À Sotchi, sa méthode s’est heurtée au terrain, au rythme des voyages en Russie et à une réalité statistique impitoyable.
L’épisode illustre les limites d’une externalisation de la décision sportive vers des modèles conversationnels, surtout lorsqu’ils pilotent la charge de travail, la gestion du sommeil et l’évaluation des profils à partir de jeux de données partiels. Dans un environnement de haute performance, l’IA a sa place comme couche d’aide — pas comme substitut au jugement tactique, à la préparation physique et à la lecture humaine du groupe.
Un rendez-vous PlayStation début février 2026 se précise, et l’agenda des sorties de Sony pourrait s’y réorganiser. Les spéculations s’emballent déjà autour des gros dossiers first-party et de quelques revenants.
State of Play 2026 : fenêtre et premier signal
Le leaker bien connu NateTheHate2 évoque sur X un State of Play en première moitié de février 2026, avec une date ciblée au 12 février 2026. Aucune liste de titres n’accompagne son indication, mais la perspective suffit à déclencher le jeu des pronostics.
Autre bruit récurrent : un Horizon MMO, déjà entrevu via des fuites précédentes, que certains imaginent faire surface lors de ce format. Sans confirmation côté Sony, le timing coïnciderait avec une montée en charge de la communication sur l’alignement 2026.
Les candidats évidents du line-up 2026
Sony a déjà officialisé plusieurs sorties attendues en 2026: Marvel’s Wolverine, Dune: Awakening, Onimusha: Way of the Sword et Saros, ce dernier étant déjà disponible en précommande. Des segments de gameplay ou des vitrines dédiées sont probables si l’événement est maintenu à cette période.
À surveiller aussi: Marvel Tōkon: Fighting Souls, jeu de combat 4v4 dont une nouvelle démonstration s’insérerait bien dans un State of Play. Côté tiers, une autre rumeur circule: Rockstar travaillerait sur une version next‑gen de Red Dead Redemption 2. Si elle existe, une apparition en février donnerait un signal fort au parc PS5 en 2026.
Ce que pourrait signifier un State of Play en février
Caler un State of Play mi‑février sécuriserait un tempo marketing avant l’intersaison des salons et donnerait de l’air aux précommandes à moyen terme, notamment pour Wolverine et Dune: Awakening. Si Rockstar confirme RDR2 next‑gen, Sony capterait un pic d’attention sur PS5, utile pour étirer le cycle et densifier la fenêtre 2026.
Week-end sous stéroïdes pour un petit studio: plus de 100 000 copies écoulées en trois jours, et une remise agressive pour entretenir la traction.
LORT explose son lancement sur Steam
Disponible en accès anticipé, LORT signe un départ spectaculaire avec 100 000 unités vendues « en un peu plus de 3 jours » selon le studio Big Distraction. Le jeu est proposé avec une remise de 34% jusqu’au 3 février, à moins de 10 € TTC, ce qui a clairement aidé l’élan initial.
Le studio remercie les joueurs ayant wish-listé, testé la démo et relayé le projet, et promet de continuer à bâtir le jeu avec la communauté. Un trailer de lancement accompagne la sortie.
Big Distraction revendique des playtests de « centaines d’heures », mais reconnaît l’inévitable lot de bugs au lancement. L’équipe suit de près Steam Discussions, les avis et Discord pour prioriser les correctifs « ASAP ».
Accès anticipé: prix, mises à jour et engagement
Le ticket d’entrée sous 10 USD, combiné à une remise limitée dans le temps, installe une fenêtre d’adoption favorable. Le studio promet « du LORT plus neuf, meilleur, plus bizarre » via des updates à venir, avec un ton volontairement décalé qui nourrit l’identité du jeu.
Entre « Legendary loot drops », « one-hit brick kills » et les « squawks » de Lawrence Fishbird, la proposition assume une fantaisie arcade assumée qui peut soutenir le bouche-à-oreille. En accès anticipé, la cadence de patches et la lisibilité de la roadmap seront déterminantes pour transformer l’élan des 100 000 premiers acheteurs en socle durable.
Si Big Distraction maintient le tempo de corrections et capitalise sur la promo jusqu’au 3 février, LORT peut s’installer dans la durée sur Steam grâce à une base engagée, à condition de sécuriser la stabilité et d’enrichir le contenu sans diluer son ton singulier.
Un changement de cap contrôlé, et un clin d’œil assumé au renommage avorté. Le prochain jeu narratif de DigixArt prend rendez-vous un peu plus tard, mais fixe une date claire.
Tides of Tomorrow: nouvelle date et périmètre de lancement
DigixArt, le studio derrière Road 96, et l’éditeur THQ Nordic confirment la sortie de Tides of Tomorrow le 22 avril 2026 sur PC, PlayStation 5 et Xbox Series X|S. Le jeu conserve son titre initial malgré une parenthèse taquine autour de « Tides of the Day After Tomorrow ».
Le lancement se fera en numérique et en édition physique dans les principaux territoires. En attendant, une démo jouable est disponible sur Steam, accompagnée d’une série de présentations de personnages.
Deux vidéos mettent l’univers en place, dont une rencontre avec Nahe, qui introduit une narration façonnée par vos décisions et celles des Tidewalkers passés. Le ton reste celui d’un récit interactif axé conséquences et héritage des choix.
Démo et premiers repères pour les joueurs
La démo Steam offre un aperçu du rythme narratif et des embranchements. Les vidéos hébergées via YouTube-nocookie permettent de jauger la direction artistique et la mise en scène sans divulgâcher l’intrigue.
DigixArt et THQ Nordic misent sur une montée en température progressive jusqu’au 22 avril 2026, avec une communication focalisée sur le casting et les mécaniques de choix. Le maintien d’une version physique confirme l’ambition d’une présence retail au-delà du PC.
Pour un studio reconnu pour la souplesse de sa narration, ce léger décalage laisse le temps de verrouiller rythme, lisibilité des embranchements et polish. S’il tient ses promesses, Tides of Tomorrow a la place pour s’installer dans le segment des aventures narratives premium sur current-gen.
Le sang fait office de munitions, et chaque tir vous rapproche du game over. Blumhouse mise sur une tension à l’ancienne, où la survie redevient une gestion froide des ressources.
Crisol: Theater of Idols fixe sa date et son prix
Sortie le 10 février 2026 au prix de 17,99 € . Développé par Vermila Studios et publié par Blumhouse Games, le titre arrive sur Steam, PlayStation et Xbox, avec une démo jouable disponible sur Steam.
Le studio ancre son action-horreur à la première personne sur l’île maudite de Tormentosa, dans une Hispania qui déforme l’Espagne. Le protagoniste, Gabriel, sacrifie sa santé pour alimenter ses armes, un équilibre salué par les previews pour remettre le « survival » au cœur du survival horror.
Bestiaire et décors s’inspirent de statues religieuses réelles trouvées en Espagne, twistées en fanatismes et monstruosités. L’objectif reste clair: explorer, dévoiler les secrets de l’île, et survivre à des affrontements où chaque goutte compte.
Crisol: Theater of Idols sur PC et consoles
Blumhouse pousse son label jeux avec une proposition tarifaire agressive (17,99 $) et un positionnement frontal sur l’horreur « ressource-centrée ». Les previews globales pointent la mécanique « sang = arme et lifeline » comme pivot du gameplay.
Le trailer est disponible, d’autres vidéos doivent suivre avant lancement. Wishlist ouverte sur Steam, PlayStation et Xbox; la démo Steam permet déjà de jauger la discipline imposée par le système de saignée.
Cadre, influences et promesse ludique
Le contraste entre iconographie sacrée et violence du trade-off vital rappelle une approche plus européenne de l’horreur, loin du power fantasy. Si l’équilibrage tient sur la durée, le ticket d’entrée contenu et l’angle esthétique pourraient en faire un outsider crédible du calendrier.
Trois fois plus rapide que Trainium v3 en FP4, au-dessus de TPU v7 en FP8: la nouvelle puce IA de Microsoft vise l’inférence à grande échelle et la facture cloud.
Microsoft Maia 200: cap sur l’inférence rentable
Gravée en 3 nm chez TSMC, Maia 200 aligne plus de 140 milliards de transistors, des Tensor Cores natifs FP8/FP4 et un sous-système mémoire repensé: 216 GB de HBM3e à 7 TB/s et 272 MB de SRAM on‑chip. Le SoC cible 750 W de TDP avec plus de 10 petaFLOPS en FP4 et plus de 5 petaFLOPS en FP8.
Microsoft annonce 30% de performance par dollar en mieux vs sa génération actuelle et revendique « le plus performant » des siliciums propriétaires de hyperscaler. L’accélérateur nourrit les plus gros modèles d’aujourd’hui et anticipe des tailles supérieures.
La mémoire s’articule autour de types de données étroits, d’un DMA spécialisé, d’une SRAM intégrée et d’un NoC dédié au débit, pour maximiser le throughput de tokens. Côté comparaison, Microsoft évoque un ratio 3× la perf FP4 d’Amazon Trainium de 3e génération et une perf FP8 au‑dessus de la 7e génération de TPU de Google.
Intégration Azure et écosystème logiciel
Maia 200 s’intègre à Azure et arrive avec un SDK en préversion: intégration PyTorch, compilateur Triton, librairie de kernels optimisés et un langage bas niveau pour un contrôle fin. Objectif: portage facile entre accélérateurs hétérogènes, sans sacrifier les optimisations ciblées.
Les déploiements démarrent en région US Central (près de Des Moines, Iowa), puis US West 3 (Phoenix, Arizona), d’autres régions suivront. Les workloads ciblés incluent les modèles GPT‑5.2 d’OpenAI pour Foundry et Microsoft 365 Copilot, ainsi que les pipelines de données synthétiques et le RL du groupe Superintelligence.
Réseau scale‑up sur Ethernet et efficacité datacenter
Le système introduit un réseau scale‑up à deux niveaux basé sur Ethernet standard: couche de transport maison, NIC intégrée, bande passante bidirectionnelle dédiée de 2,8 TB/s par accélérateur. Les opérations collectives sont annoncées prévisibles jusqu’à 6 144 accélérateurs.
Dans chaque tray, quatre Maia sont reliés en direct sans switch pour garder le trafic à haut débit local. Le protocole de transport Maia s’étend intra‑rack et inter‑rack avec peu de sauts, simplifiant le dev et réduisant la capacité perdue. L’approche vise un meilleur TCO et une consommation contenue à l’échelle du cloud.
Cycle de validation et mise en production
Microsoft a simulé tôt les charges LLM pour co‑optimiser silicium, réseau et logiciel, avec un passage au rack deux fois plus rapide que sur des programmes comparables. Les modèles tournaient quelques jours après l’arrivée des premiers packages, aidés par une intégration native au plan de contrôle Azure, une télémétrie complète et un refroidissement liquide à boucle fermée de seconde génération.
Si Microsoft tient ses promesses de perf/$ et d’échelle sur Ethernet, Maia 200 pourrait bousculer la prime aux fabrics propriétaires dans l’inférence dense, tout en renforçant l’avantage coût/latence d’Azure sur les services Copilot et les pipelines de données synthétiques. Reste à voir l’élasticité réelle à 6 144 accélérateurs sur des charges mixtes et la cadence de déploiement par région.
Un shooter où l’on capture une épée magique avant d’assaillir la base adverse à dos d’ours, ça change le tempo. Highguard vient de sortir et pose ses règles dès le premier jour.
Highguard pose sa boucle de jeu: raid PvP en 3v3
Nouveau « PvP raid shooter » signé Wildlight Entertainment, Highguard oppose deux équipes de trois joueurs qui fortifient leur base, partent en monture collecter des ressources, puis lancent des raids pour détruire la forteresse ennemie. Mélange de MOBA, survival shooter et reverse Capture the Flag, chaque manche s’articule autour du Shieldbreaker, une épée qui déclenche l’assaut une fois insérée dans l’un des points de la barrière magique adverse.
Le déroulé est cadencé: 1 minute initiale de fortification, exploration en monde ouvert pour looter et convertir des cristaux en améliorations, formation de tempêtes sur des zones prédéfinies où apparaît le Shieldbreaker. L’équipe qui ramène l’épée à la base ennemie ouvre une brèche via une tour de siège servant aussi de point de respawn. Objectif: percer des murs destructibles, armer une charge sur l’un des trois emplacements et tenir jusqu’à l’explosion. Deux cibles infligent de lourds dégâts au total de vie, la cible centrale détruit la base d’un coup.
Si aucune base ne tombe, le match réinitialise la phase et relance un Shieldbreaker plus tard, avec un équipement globalement meilleur disponible en map et en boutiques. Respawns et minutage sont stricts, pour des parties de 10 à 30 minutes, souvent à renversements tardifs.
Montures, arsenal et Wardens: l’ADN Respawn, version Wildlight
Né chez des vétérans d’Apex Legends, Titanfall et Call of Duty, le gunplay est net, la mobilité fluide (course, glissade, mantling) et la nouveauté tient aux montures invocables presque partout: chevaux, ours, panthères, griffons, différences cosmétiques mais impact macro clair pour couvrir de grandes distances et intercepter un porteur du Shieldbreaker.
10 armes au lancement, deux emplacements, plus un outil de raid parmi trois (lance-roquettes, masse explosive, pistolet à tyrolienne) pour l’utilité et la démolition. Les personnages jouables, les Wardens, sont au nombre de huit au lancement, un par équipe, avec passif, tactique à cooldown et ultime à charge. Exemples cités: Atticus qui lance des lances électriques façon bobines Tesla, Una qui invoque des esprits étourdissants et un ultime arbre-guardian, Kai qui érige un mur de glace capital pour le contrôle des choke points.
Les bases elles-mêmes sont un choix d’équipe: six variantes votées puis injectées dans n’importe quelle carte. Hellmouth, suspendue au-dessus d’une fosse de lave avec ponts étroits, se combine parfaitement avec le mur de Kai. L’ensemble Wardens/bases/armes/outils ouvre un vrai terrain de méta et de synergies/counters dès le jour 1.
Roadmap live service: chapitres de deux mois, contenu mensuel
Wildlight cadence Highguard en chapitres bimestriels, chacun scindé en deux. Concrètement, un ajout de contenu chaque mois: nouveaux Wardens, bases, cartes, armes, outils de raid et plus. Le premier update, attendu dans quelques semaines, introduira le classé et des modes alternatifs rotatifs, dont une course montée inspirée Mario Kart. Tout le contenu gameplay est gratuit, la monétisation est strictement cosmétique.
Le studio revendique une préparation spécifique à l’exploitation live, tirée de l’expérience Apex Legends où la phase post-lancement avait connu une latence de contenu. Ici, l’année 1 est déjà bien engagée en production, avec des Wardens non révélés en réserve.
Highguard est disponible gratuitement dès aujourd’hui sur PC/Steam, Xbox Series X|S et PlayStation 5.
Dans un marché saturé, l’originalité du mode raid PvP 3v3, combinée à un rythme de jeu en phases et un pipeline live déjà calé, donne à Wildlight une fenêtre pour s’installer au-delà des catégories établies battle royale/extraction. Le suivi mensuel sera l’arbitre de la rétention et du potentiel esportif, mais la base mécanique est suffisamment distincte pour créer sa niche.
Course contre la montre dans l’IA : CoreWeave vise plus de 5 GW de « factories » d’ici 2030. Conséquence immédiate, NVIDIA met 2 milliards de dollars sur la table pour verrouiller l’alignement technologique et l’accès aux capacités.
NVIDIA CoreWeave: cap sur 5 GW d’usines d’IA
NVIDIA et CoreWeave consolident leur partenariat pour accélérer le déploiement de plus de 5 gigawatts d’« AI factories » d’ici 2030. En parallèle, NVIDIA investit 2 milliards de dollars (environ 1,84 Md€) dans CoreWeave via des actions ordinaires de classe A au prix de 87,20 dollars par action.
Objectif affiché: répondre à une demande exponentielle en calcul, du pré-training au post-training. Jensen Huang parle du « plus grand chantier d’infrastructure de l’histoire » et s’appuie sur l’exécution de CoreWeave pour industrialiser les usines d’IA basées sur la plateforme accélérée de NVIDIA.
Le plan comprend l’alignement infrastructure, software et plateforme: CoreWeave développera et opérera ces usines avec la pile NVIDIA, tandis que NVIDIA apportera sa puissance financière pour accélérer l’acquisition de foncier, d’énergie et de shells.
Feuille de route technique et logicielle
Les deux acteurs testeront et valideront le software natif IA de CoreWeave et ses architectures de référence, dont SUNK et CoreWeave Mission Control, avec pour ambition de les intégrer dans les architectures de référence NVIDIA pour les partenaires cloud et les clients enterprise.
CoreWeave adoptera en avance plusieurs générations d’infrastructure NVIDIA: la plateforme Rubin, les CPU NVIDIA Vera et les systèmes de stockage NVIDIA BlueField. Côté inference, CoreWeave met en avant Blackwell comme architecture au coût au plus bas.
Capacité, financement et exécution
Au-delà du silicium, l’accord porte sur la sécurisation du foncier et de la puissance électrique, points de tension clés pour des déploiements multi-gigawatts. CoreWeave capitalise sur son cloud spécialisé, son logiciel et son opérationnel orienté workloads IA intensifs.
L’enjeu pour l’écosystème est double: industrialiser la production d’IA à grande échelle et réduire le coût total d’exploitation des clusters. Si le calendrier 2030 est tenu, les 5 GW annoncés peseront sur l’accès aux GPU, aux CPU Vera et aux infrastructures réseau/stockage BlueField, avec un effet d’entraînement sur l’offre cloud GPU et les prix pour les studios IA comme pour les entreprises.
NVIDIA a dévoilé Earth-2, une série de modèles ouverts et accélérés dédiés à la météo et au climat, pensée pour couvrir toute la chaîne opérationnelle: assimilation des observations, prévisions globales à 15 jours et nowcasting kilométrique. Les modèles sont utilisables et déployables sur infrastructures propres, avec entraînement et affinage via le framework open source PhysicsNeMo.
Trois nouveaux modèles au cœur de la pile Earth-2
Earth-2 Medium Range s’appuie sur l’architecture Atlas pour une prévision globale jusqu’à 15 jours sur plus de 70 variables (température, pression, vent, humidité, etc.). Sur les benchmarks de référence, il surpasse les principaux modèles ouverts sur les variables les plus utilisées, tout en restant exploitable en production.
Earth-2 Nowcasting, basé sur StormScope, pousse la prévision de 0 à 6 heures à l’échelle kilométrique au niveau national. Le modèle simule directement la dynamique des systèmes convectifs, prédit images radar et satellite, et revendique des performances supérieures aux approches physiques traditionnelles pour les précipitations à court terme.
Earth-2 Global Data Assimilation, avec l’architecture HealDA, produit en quelques secondes sur GPU les conditions initiales globales à partir d’observations hétérogènes (satellites, radiosondages, stations). Couplé au modèle Medium Range, il constitue une chaîne de prévision entièrement IA, ouverte et optimisée pour l’exécution accélérée.
Intégration de la pile et écosystème
Les nouveautés complètent CorrDiff, génératif de descente d’échelle qui convertit des champs à résolution grossière en champs régionaux fins, avec un gain de vitesse annoncé de 500× par rapport aux méthodes classiques. FourCastNet3 reste positionné sur la prévision multi-variables (vent, température, humidité) avec une précision comparable aux meilleurs modèles de diffusion, tout en étant jusqu’à 60× plus rapide que les approches de référence.
Earth-2 agrège également des modèles ouverts de l’ECMWF, de Microsoft et de Google. L’ensemble se pilote via PhysicsNeMo, cadre Python open source pour le développement à grande échelle de modèles d’IA physique, facilitant entraînement, fine-tuning et déploiement.
La promesse est autant opérationnelle que scientifique: accélérer la production d’analyses initiales, améliorer la qualité des prévisions et standardiser un socle ouvert propice à la collaboration inter-instituts. Pour les centres météo nationaux et privés, la perspective d’une chaîne full-IA, portable et accélérée, peut réduire le coût d’entrée en prévision haute résolution et accélérer le transfert de la recherche vers l’opérationnel.
Ryzen 7 9850X3D en kit complet ? Une photo de boîte retail laisse penser qu’AMD prépare un bundle associant processeur, mémoire DDR5 et ventirad, destiné en priorité au marché chinois.
Ryzen 7 9850X3D : un pack multi‑marques repéré en Chine
D’après une image partagée par JustBuy sur Bilibili, la boîte arbore les logos AMD, Cooler Master et V-Color, signe d’un ensemble co‑marqué plutôt qu’un simple emballage CPU. La liste au dos mentionne un Ryzen 7 9850X3D, un kit V-Color DDR5 au timing CL36 en 32 Go (2 × 16 Go) et un ventirad Cooler Master Hyper 612 APEX PRO. La fréquence exacte de la mémoire n’est pas indiquée.
Pour situer les tarifs séparés, le Hyper 612 APEX a été vu autour de 79,99 dollars (environ 74 euros). Le kit V-Color Manta XFinity RGB DDR5‑6000 CL36 32 Go correspondant aux marquages et timings est apparu à 509,99 dollars sur Newegg, illustrant des prix DDR5 très variables selon les boutiques. AMD a déjà confirmé le Ryzen 7 9850X3D, référencé sur ses pages produits, avec un lancement annoncé au 29 janvier à 499 dollars (environ 460 euros).
Spécificités listées sur la boîte
Processeur : AMD Ryzen 7 9850X3D.
Mémoire : V-Color DDR5, 32 Go (2 × 16 Go), CL36, fréquence non spécifiée.
Refroidissement : Cooler Master Hyper 612 APEX PRO (aircooling).
Le concept existe déjà.
Le concept n’est pas inédit : aux États‑Unis, des enseignes comme Micro Center proposent régulièrement des combos CPU avec carte mère et mémoire à prix groupé. Reste l’inconnue de la disponibilité : selon JustBuy, ce kit « sera bientôt en vente », sans précision de lieu ni de tarif final. Il semblerait que ce pack vise d’abord la Chine, même si chaque composant est ou sera disponible mondialement.
Mais attention : il n’est pas exclu qu’il s’agisse simplement de kits presse, envoyés aux testeurs avant le lancement. Avec la tension actuelle sur la RAM, imposer un kit mémoire pourrait être délicat, au risque de brider le CPU. Sans compter l’ajout d’un ventirad qui ne conviendrait pas forcément à tous les usages ni à toutes les configurations.
Alibaba a dévoilé ce soir Qwen3-Max-Thinking, nouveau modèle « reasoning » haut de gamme de la famille Qwen. La société annonce une architecture dépassant le millier de milliards de paramètres, un entraînement par renforcement élargi et des avancées nettes sur la factualité, le raisonnement complexe, l’alignement et l’utilisation native d’outils. Sur 19 benchmarks de référence, Alibaba revendique des performances du niveau de GPT-5.2-Thinking, Claude Opus 4.5 et Gemini 3 Pro.
Le modèle est disponible dans Qwen Chat avec une capacité de recours autonome au moteur de recherche, à la mémoire et à un interpréteur de code. L’API publique est ouverte sous l’identifiant « qwen3-max-2026-01-23 ».
Focus technique et perfs mesurées
Qwen3-Max-Thinking met l’accent sur deux briques. D’abord, une invocation d’outils auto-adaptative : le modèle choisit et orchestre seul la recherche, la mémoire et l’exécution de code, après un cycle de fine-tuning spécifique puis un entraînement supplémentaire guidé par retours hybrides (règles et feedback modèle). Alibaba indique une baisse sensible des hallucinations, un accès temps réel aux informations et des réponses mieux personnalisées.
Ensuite, une stratégie de Test-Time Scaling itératif orientée « expérience cumulée ». Plutôt que d’augmenter simplement le nombre de trajectoires en parallèle, Qwen3-Max-Thinking limite ces chemins et réinvestit le budget de calcul dans des boucles de réflexion successives. Un mécanisme d’extraction d’« insights » issus des tours précédents évite les répétitions et concentre le raisonnement sur les zones d’incertitude, avec une meilleure utilisation de la fenêtre de contexte à consommation de tokens comparable.
Les gains annoncés, à méthodologie constante, sont chiffrés sur plusieurs suites: GPQA de 90,3 à 92,8, HLE de 34,1 à 36,5, LiveCodeBench v6 de 88,0 à 91,4, IMO-AnswerBench de 89,5 à 91,5, et HLE avec outils de 55,8 à 58,3. Alibaba met en avant des résultats en tête sur GPQA Diamond (sciences), IMO-AnswerBench (maths) et LiveCodeBench (code).
Disponibilité et intégration
Qwen3-Max-Thinking est accessible via Qwen Chat (chat.qwen.ai), avec la sélection automatique d’outils activée, et via l’écosystème Alibaba Cloud Bailian. Le déploiement vise autant l’usage direct que l’intégration agentique, le modèle étant conçu pour raisonner tout en exécutant des appels outils de manière fluide.
Au-delà de la surenchère paramétrique, l’enjeu se déplace vers la chaîne de raisonnement et l’efficacité du calcul à l’inférence. La mise en avant d’un Test-Time Scaling mieux capitalisé et de capacités agent natives confirme la bascule des LLM généralistes vers des systèmes orientés tâches, où le pilotage d’outils et la discipline du raisonnement comptent autant que le score brut sur benchmarks.
Un développeur affirme avoir porté en 30 minutes un backend CUDA complet vers ROCm en s’appuyant exclusivement sur l’agent de programmation Claude Code. Publié le 22 janvier sur Reddit par « johnnytshi », le récit décrit une migration sans couche d’abstraction intermédiaire, avec une traduction directe des primitives CUDA vers leurs équivalents ROCm via un cadre d’agents capable d’inférer la logique bas niveau du code.
Selon l’auteur, l’interaction s’est faite en ligne de commande, sans mise en place d’un pipeline Hipify. Le seul obstacle notable aurait concerné le « data layout », point sensible dès qu’on touche à la hiérarchie mémoire et aux schémas d’accès. Pour le reste, l’IA aurait géré l’alignement des appels, la réécriture des kernels et l’adaptation des API, profitant du parallélisme conceptuel entre CUDA et ROCm.
La parenté entre les deux piles logicielles facilite les cas simples, mais les limites apparaissent dès qu’un codebase fortement couplé exploite des optimisations fines de cache, des patterns warp/onde spécifiques, ou des chemins critiques sensibles à la latence mémoire. L’auteur reconnaît que les optimisations « deep hardware » restent hors de portée de l’outil dans l’état, et que l’automatisation ne remplace ni la validation de performance ni le profiling ciblé.
La démonstration illustre une tendance: l’IA abaisse le coût d’entrée du portage CUDA→ROCm pour les projets modestes, au moins jusqu’à la compilation et aux tests fonctionnels. Pour des bibliothèques HPC, des runtimes d’entraînement ou des graphes complexes mêlant communications et kernels spécialisés, la barrière reste la stabilité des perfs et la maîtrise des topologies mémoire, deux sujets qui exigent encore des itérations manuelles, du profiling et une connaissance intime des GPU cibles.
À court terme, ce type d’assistance peut accélérer les explorations multi-vendeurs et la réduction de dette technique liée au verrou CUDA. À moyen terme, l’enjeu sera la capacité de ces agents à raisonner sur les modèles d’exécution, la coalescence des accès, l’occupation, et à proposer des transformations sûres au-delà de la simple correspondance d’API.
– Article invité, rédigé par Vincent Lautier, contient des liens affiliés Amazon –
Bon, vous commencez à me connaître, j'ai une passion presque maladive pour les câbles, les batteries et tout ce qui permet de nourrir mes trucs de geek maladif. J’ai acheté il y a quelques semaines ce bloc chargeur de chez Anker équipé d’un grand écran, et franchement, je l’adore. Il trône sur mon bureau, sous mon écran, et je charge absolument tout avec lui. Il fournit 250W en GaN, et autant vous dire qu’avec ce truc, votre bureau ne sera plus jamais le même.
Au premier coup d'œil, la bête ressemble à un petit réveil futuriste, compact et plutôt mignon avec sa robe grise assez classique des produits Anker Prime sortis ces dernières semaines. Puis vous le branchez, et là on change un peu de dimension. On se retrouve face à un chouette écran LCD de 2,26 pouces qui affiche en temps réel ce qui se passe dans le ventre de la bête. C’est le genre de détail dont je ne pourrai plus jamais me passer : voir les watts défiler précisément port par port, c'est limite hypnotique et vraiment très satisfaisant.
La fiche technique est tout simplement monstrueuse avec quatre ports USB-C en façade et deux ports USB-A sur le côté. Le premier port USB-C est capable à lui tout seul de balancer 140W, ce qui vous permettra de redonner 50% de batterie à un MacBook Pro 16 pouces en quelque 25 minutes. Avec une puissance totale de 250W, vous pouvez même alimenter simultanément deux ordinateurs portables, une tablette et vos smartphones divers et variés sans faire chauffer le boîtier (merci la technologie GaN).
L’autre truc très marrant c’est la molette de contrôle située sur le côté de l'appareil. En tournant et en cliquant, on accède à une gestion plus fine de l'énergie délivrée. On peut par exemple activer le mode Dual-Laptop pour prioriser deux ordinateurs, ou passer en mode Low Current pour optimiser la charge des petites batteries de vos AirPods ou de votre Apple Watch durant la nuit. Tout est transparent, intuitif, et on peut même gérer l'ensemble depuis une application dédiée sur son smartphone si l'on a la flemme de tendre le bras. Pour être très honnête je n’utilise jamais la molette, je l’ai branché, et par défaut, c’est déjà parfait.
Pour ceux qui veulent vraiment un réveil sur leur bureau, en mode horloge, le chargeur affiche l'heure et la date proprement. C’est validé pour ça aussi.
Alors certes, c’est 160 euros, mais franchement c’est tellement puissant, pratique, design et satisfaisant, qu’à mon avis, ça vaut vraiment le coup, surtout si vous aussi, vous aimez voir les watts défiler en temps réel. Disponible par ici, sur Amazon !
Non mais attendez... y'a un mec qui vient de concevoir
une carte mère 486 from scratch
, en grand 2026 comme disent les jeunes ! Pas une repro. Pas un clone. Non non, une vraie carte mère complète avec son propre chipset custom qui fait tourner DOOM et Linux.
Un PCB 4 couches fait maison, rien que ça !!
Piotr Grzesik, alias maniek86, est un étudiant en électronique polonais qui s'est lancé dans un projet complètement dingue. Tout est parti d'une sombre arnaque sur une carte POST ISA chinoise... et suite à ça, il s'est dit "bon, je vais apprendre le VHDL et l'ISA bus moi-même". En fait, au début je pensais que c'était juste un projet de bricolage de plus, mais non. De fil en aiguille, il a fini par créer la
M8SBC-486
, une carte mère qui accueille de vrais processeurs Intel 486 vintage.
La carte mère M8SBC-486 dans toute sa splendeur rétro
Et le bonhomme n'a pas juste fait un PCB, mais a carrément développé son propre chipset baptisé "Hamster" qui tourne sur un FPGA Xilinx Spartan II. Il aurait pu utiliser un FPGA récent mais il a préféré le Spartan II parce que les outils Xilinx modernes supportent plus ces vieilles puces. Donc il bosse avec des logiciels de 15 ans d'âge... logique.
Et dedans, y'a tout ce qu'il faut pour émuler un PC des années 90 : un timer 8254, un contrôleur d'interruptions 8259, un contrôleur clavier PS/2, et même une horloge temps réel.
Côté specs c'est du bon vieux socket PGA-168 compatible avec tous les processeurs 486 5V, que ce soit du Intel ou des compatibles. Le bus tourne à 24 MHz, ce qui donne du 48 MHz avec un DX2 (et théoriquement 72 MHz avec un DX4). Y'a 4 Mo de SRAM, 256 Ko de ROM pour le BIOS, et deux slots ISA 16 bits pour les nostalgiques des cartes d'extension. Attention par contre, si vous comptez utiliser un 486 3.3V genre les derniers AMD, ça passera pas... faut du 5V uniquement.
Perso, ce qui m'impressionne le plus c'est la liste des trucs qui tournent dessus. MS-DOS 6.22 évidemment, FreeDOS, mais aussi Linux 2.2.26 ! Sans oublier DOOM, Wolfenstein 3D, et la démo Second Reality qui en a fait baver plus d'un à l'époque. Même Windows 3.1 démarre. Bon, la souris fonctionne pas, mais quand même...
J'aurais bien voulu tester moi-même sur un vieux 486 DX2/66 qui traîne quelque part dans un carton au garage, mais retrouver ce truc c'est un projet en soi. Finalement, si vous êtes fan d'
émulation rétro
, c'est pil poil le genre de projet qui fait rêver les vieux grands enfants que nous sommes !
Le plus beau dans tout ça, c'est que Piotr a publié l'intégralité du projet en open source sur GitHub : les schémas, le PCB, le code VHDL du chipset, les sources du BIOS... Tout est dispo. Du coup si vous avez envie de vous lancer dans le rétrocomputing hardcore, vous savez où chercher.
Bon après, y'a quelques limitations. C'est là que ça peut coincer car y'a pas de DMA, donc oubliez les cartes son type Sound Blaster. Pas de second PIC non plus, et le Plug and Play ISA n'est pas encore implémenté dans le BIOS. Sauf si vous êtes prêt à contribuer au code, évidemment.
Mais franchement, pour un premier essai de cette envergure, c'est du très très solide.
Bref, si vous voulez voir la bête en action, la vidéo montre la démo Second Reality qui tourne avec quelques petits glitches visuels et pas de son, mais c'est normal vu les limitations.
Et si vous avez des vieux 486 qui traînent dans un carton, vous avez maintenant une raison de les ressortir !
Enregistrez de manière sécurisée tous vos mots de passe, générez des mots de passe complexes et retrouvez-les simplement et sûrement à partir de n'importe quel ordinateur ou de votre smartphone...
Vous vous êtes déjà demandé à quoi ressemblerait un magazine fabriqué quasi entièrement par des IA ?
Hé bien ne cherchez plus et allez lire
Les Heures Claires
! Il s'agit d'un mensuel d'environ 90 pages où 99% du contenu, des articles aux illustrations, est généré avec l'aide d'outils comme Midjourney, DALL-E 3 ou ChatGPT. "Avec l'aide" ça veut dire qu'il y a quand même des humains derrière, hein...
Le projet est né de l'imagination de Rémi Rostan, un photographe Google Street View certifié et le gars connaît bien l'image et la technologie, car ça se sent dans le résultat.
Concrètement, le mag est découpé en trois sections. Y'a "Les Heures Innovantes" qui cause tech et IA, "Les Heures Claires" qui explore le côté créatif et artistique, et "Les Heures Sombres" pour le ton plus décalé et humoristique. Perso, c'est ce mélange des genres qui rend le truc intéressant... On est donc loin d'un énième catalogue de prompts Midjourney ou d'un PDF SlopAI ^^.
Et d'ailleurs, en parlant de Midjourney, c'est là que
GenIArt
entre en jeu. Cette communauté francophone, fondée par Nicolas, un fidèle lecteur de Korben.info, en avril 2023, regroupe plus de 3000 membres sur Discord et contribue régulièrement au magazine avec des tutoriels et des techniques de prompt engineering. Ils ont même remporté un prix aux AI Film Awards de Cannes 2025 avec leur clip "Croquette Crew".
Pas mal pour des passionnés !
Côté diffusion, le mag a déjà conquis environ 10 000 lecteurs, avec 1000 à 1500 nouveaux abonnés chaque mois. Vous pouvez le lire gratuitement en PDF et depuis quelques mois, y'a même une version anglaise pour l'international.
Ce qui est vraiment dingue, c'est que Rémi et ses contributeurs utilisent plus de 20 outils IA différents pour produire chaque numéro. Magnific pour l'upscaling, Generative Fill pour les retouches, et tout un arsenal de modèles de langage pour les textes... Et depuis, le projet a évolué avec la création de
StudioLHC
, un studio créatif qui propose maintenant ses services aux marques et agences qui veulent intégrer l'IA générative dans leur communication.
La boucle est bouclée !
Moi je trouve ça génial. Les articles sont excellents et les illustrations et autres photos, vraiment très bien exécutées. En plus on apprend des choses.
Bref, si vous voulez voir ce que donne la création de contenu assistée par IA quand c'est bien fait, Les Heures Claires est un exemple plutôt convaincant. Ça fait réfléchir sur l'avenir de l'édition... et c'est un peu le but.
OpenAI présente GPT-5.2 comme son modèle « le plus avancé pour le travail professionnel ». Une série de tests conduite par le Guardian met pourtant en cause sa fiabilité sur des sujets sensibles, pointant des réponses s’appuyant sur Grokipedia, l’encyclopédie en ligne de xAI déjà critiquée pour ses sources problématiques.
Le quotidien britannique a constaté que ChatGPT citait Grokipedia lorsqu’il répondait à des questions liées à l’Iran, notamment autour d’allégations sur des liens entre le gouvernement et MTN Iran, ainsi que sur des points touchant l’historien Richard Evans, expert lors du procès en diffamation impliquant le négationniste David Irving. En revanche, sur d’autres terrains inflammables comme un supposé biais médiatique en faveur de Donald Trump, l’outil n’aurait pas fait appel à Grokipedia.
Lancé en décembre, GPT-5.2 cible les usages pros, de la production de feuilles de calcul à la gestion de tâches complexes. Grokipedia, antérieure au modèle, a déjà suscité des critiques pour avoir agrégé des références issues de forums néonazis. Des travaux universitaires américains ont également relevé des citations « douteuses » et des sources « problématiques » dans cette encyclopédie générée par IA.
Interrogé, OpenAI explique que GPT-5.2 interroge « des sources et points de vue publiquement accessibles variés » tout en appliquant des filtres de sécurité destinés à réduire l’exposition à des contenus à risque. La formulation reste prudente et ne précise ni le poids accordé à chaque source ni les critères d’exclusion dynamiques.
Contexte et portée des tests
Le constat du Guardian ne vaut pas audit exhaustif du graphe de connaissances de GPT-5.2, mais souligne un angle mort : sur des sujets polarisés, les citations peuvent basculer vers un référentiel controversé sans signalisation claire. Le fait que Grokipedia ne soit pas invoquée de manière systématique renforce l’idée d’une pondération contextuelle, difficile à prédire.
Le différentiel de comportement selon le thème pose une question de gouvernance des sources, au-delà des garde-fous de sécurité. Dans un cadre professionnel, où traçabilité et conformité documentaire priment, l’absence d’explicitation des priorités de citation devient un point de friction.
Implications pour les usages pros
Pour des workflows qui exigent une chaîne de sources vérifiables, l’appel potentiel à une encyclopédie contestée affaiblit la valeur probante des sorties, même si celles-ci restent factuellement correctes. Les entreprises devront durcir les politiques d’attribution, imposer des listes blanches de référentiels et exiger la restitution des citations primaires plutôt que des méta-sources.
L’enjeu dépasse le filtrage des contenus à risque : il s’agit de hiérarchiser des corpus reconnus, de préférence à des agrégateurs dont la gouvernance éditoriale est mouvante. Sans granularité de contrôle côté modèle, le besoin se reporte sur l’orchestration applicative et l’audit humain des réponses sensibles.
À court terme, cette controverse rappelle que les modèles « généralistes » restent fragiles dès qu’ils mêlent assistance à la rédaction et autorité documentaire. Le marché ira vers des piles hybrides combinant LLM, moteurs de RAG verrouillés sur des sources certifiées et politiques d’archivage des citations, faute de quoi la promesse « pro » se heurte à des exigences de conformité que la seule modération automatisée ne couvre pas.
Au CES, les humanoïdes ont défilé. Puis Atlas est monté sur scène et la catégorie a changé d’échelle. Conçu par Boston Dynamics, désormais détenu à 80 % par Hyundai, ce robot de 1,5 m (2,3 m bras tendus) cible clairement l’industrie, loin du gadget dansant. Capable de se déplacer avec assurance, de manipuler des pièces fines et, au besoin, d’enchaîner des gestes complexes, Atlas s’inscrit comme le futur bras polyvalent des ateliers où l’automatisation classique cale encore.
Cadence industrielle, pas de « coup de mou »
Hyundai prévoit un démarrage en production au RMAC, son centre d’applications dédié, avec des déploiements dans plusieurs usines du groupe à partir de 2028 et un objectif de 30 000 unités à l’horizon 2030. Le message est limpide : la stabilité prime sur la vitesse. Là où un opérateur humain baisse de régime au fil de la journée, le robot maintient une cadence constante, sans supervision lourde.
Le démonstrateur sur le stand Hyundai à Las Vegas illustrait cette logique. Atlas transférait des composants d’auto entre bacs sans se déplacer, en pivotant le torse et les membres grâce à 56 degrés de liberté. Ses préhenseurs, assez précis pour saisir des objets fragiles, s’accompagnent d’une autonomie pensée pour le terrain : fonctionnement en extérieur, dock de changement de batterie que le robot rejoint seul, architecture modulaire avec bras, jambes et mains remplaçables en quelques minutes par du personnel formé.
Pourquoi un humanoïde, et pourquoi maintenant
Boston Dynamics assume l’option biped pour une raison prosaïque : l’essentiel du parc industriel occidental fonctionne dans des bâtiments de plus de 30 ans, conçus pour des humains. Automatiser sans refaire l’usine impose un gabarit et une cinématique compatibles avec l’existant. Atlas complète un portfolio déjà orienté métier, du chien Spot aux solutions de logistique type Stretch, mais vise le multi-tâches grâce aux progrès de l’IA, notamment sur les modèles de comportement développés avec DeepMind.
À court terme, l’effort porte sur l’intelligence motrice – course, saut, danse ne sont pas qu’un show, ce sont des marges de manœuvre cinématiques pour absorber les aléas des postes. La brique « comportement » suit, avec l’ajout d’outillages et de gestes métier comme le soudage ou la construction légère. L’ambition reste pragmatique : résoudre les tâches que les robots fixes n’attrapent pas, sans restructurer la ligne.
Une course à plusieurs, des positions déjà prises
La concurrence s’aligne : Tesla pousse Optimus, Figure AI, Agility Robotics ou Apptronik avancent leur copie, et en Chine, Zoomlion déploie déjà des humanoïdes en usines. Boston Dynamics oppose une chaîne d’industrialisation existante, financée et outillée par Hyundai, avec support terrain, intégration, maintenance et logistique. Reste la question des coûts : pour beaucoup d’ateliers, l’humain demeure aujourd’hui plus économique.
Le discours social s’ajuste en conséquence. BD parie sur la montée de postes d’« opérateur robot » plutôt que sur une substitution brute à court terme. Et pour le domicile, la réponse est claire : pas avant une décennie. Le ticket d’entrée, les exigences de sécurité et l’imprévisibilité d’un intérieur rendent le marché grand public inopportun. Le calendrier interne place les déploiements industriels massifs entre 2028 et 2030, puis un éventuel virage vers le foyer cinq ans plus tard.
Si Hyundai tient la rampe industrielle et si l’IA comportementale tient ses promesses, Atlas pourrait signer la bascule de l’automatisation vers les « zones grises » de l’usine, celles que l’on a laissées humaines faute de ROI et de flexibilité. Le vrai enjeu n’est pas de remplacer un poste isolé, mais de rendre reconfigurable et résiliente une production brune sans CAPEX massif. C’est là que l’humanoïde, plus qu’un format, devient une interface universelle avec l’existant.
Selon une étude relayée par Digital Trends et menée par Mercor, les grands modèles d’IA peinent à exécuter des tâches de bureau réalistes : aucun ne dépasse 25 % de précision sur le nouveau benchmark APEX-Agents. Ce protocole ne teste ni poésie ni équations, mais des workflows concrets de juristes, consultants et banquiers, avec des séquences multi‑étapes faisant appel à plusieurs sources d’information.
Le meilleur score revient à Gemini 3 Flash (24,0 %), suivi de GPT‑5.2 (23,0 %). Derrière, Claude Opus 4.5 et Gemini 3 Pro affichent 18,4 %, GPT‑5 18,3 %, Grok 4 15,2 %, puis un net décrochage pour GPT‑OSS‑120B (4,7 %) et Kimi K2 Thinking (4,0 %). Ces résultats confirment la difficulté des modèles à tenir une chaîne d’actions fiable lorsqu’il faut enchaîner consultation d’agendas, historiques de messagerie, PDF et feuilles de calcul.
Contexte et limites du protocole
Mercor attribue l’échec récurrent à la gestion du contexte et au passage d’une source à l’autre, où les modèles confondent, mélangent ou abandonnent des étapes critiques. Dans un environnement de bureau, cette fragilité les cantonne au rôle d’« assistant stagiaire » peu fiable plutôt qu’à celui d’opérateur autonome. La méthodologie APEX-Agents se distingue en imposant une coordination d’outils et de supports hétérogènes, un point névralgique des usages réels que les benchmarks classiques éludent encore trop souvent.
Progrès rapides mais insuffisants
Mercor souligne néanmoins une progression marquée : des tests comparables plafonnaient à 5–10 % il y a un an, contre 24 % aujourd’hui pour le meilleur modèle. L’accélération est nette, sans pour autant valider une substitution proche des travailleurs du savoir tant que la gestion multi‑tâches et les bascules de contexte resteront instables. Pour les déploiements en production, la fiabilisation passera autant par l’orchestration outil‑par‑outil et la vérification systématique que par de nouveaux entraînements focalisés sur l’exécution et la mémoire de travail.