Apple sera en retard pour son nouveau Siri
D'après Mark Gurman, le nouveau Siri devait être dévoilé en juin 2025 à la WWDC d'Apple.
Toujours d'après lui il devrait intégrer l'ancien système et ses capacités ainsi que de l'IA de type LLM pour permettre des échanges conversationnels.
Il rapporte que Siri serait en retard sur les 3 nouveautés annoncées par Apple l'an dernier.
Et pourrait sortir en septembre 2025, donc avec 3 mois de retard.
Je peux confirmer ce retard, le nouveau Siri ne devrait sortir complet qu'en septembre 2025 avec iOS 19, mais avec un ajout de taille et probablement essentiel: identifier les émotions dans la voix et être capable de réagir en conséquence.
Notamment la peur, la détresse, la colère, le dégoût, le mépris, la joie, le calme, etc.
Outre les émotions, il y aura le niveau d'implication dans la conversation avec Siri qui sera analysé et évalué par celui-ci, là aussi pour diriger ses réponses.
Aussi la reconnaissance de l'environnement, conversation entre personnes, télé ou musique en fond, voiture, etc. Un point de donnée en plus pour comprendre le contexte.
Les plans d'Apple n'intégraient pas cela l'an dernier et c'est vers la mi-février de cette année qu'ils ont lancé cela à toute vitesse, en mettant de coté d'autres projets, qui eux aussi pourraient n'arriver qu'en septembre avec iOS 19.
Comme celui-ci pour comparer les langues et leurs variantes...
Ce nouveau projet pour Siri est appelé chez Apple en interne "Voice Distress" ou "Voice Affect" sur les différentes documentations et outils dont celui développé par Scilliance et accédé depuis un navigateur avec une authentification via AppleConnect.
Un outil d'écoute d'extraits de conversations téléphonique, avec généralement l'interlocuteur filtré (plus ou moins bien), et d'annotation des émotions, de l'implication ainsi que des bruits ou conversations autour.
Ils ont depuis peu des annotateurs de données qu'Apple a certifié, qui travaillent sur de vieux enregistrements téléphoniques (délivrés via cette URL) au profil suivant: entre 1994 et 2014, des locuteurs ayant une éducation supérieure et entre 30 et 60 ans en général, principalement Américains avec quelques Anglais, mais quasiment jamais depuis une voiture (étrange!) et quasiment jamais avec de la peur.
Le dernier point étant un problème en soi pour l'identification de cette émotion forte et essentielle.
Très certainement le nouveau Siri ne pourra être prêt pour juin 2025 comme espéré, mais il pourrait être meilleur que prévu grâce à la reconnaissance des émotions, de l'implication et même de types d'environnement (voiture, conversation entre personnes, fond sonore).