Un étrange bug de Spotlight bloque l’indexation d’un fichier texte s’il commence par certains caractères
Howard Oakley a découvert un bug bien étrange dans Spotlight, le moteur de recherche de macOS. Un lecteur lui a d’abord signalé qu’un fichier texte brut qui commençait par les lettres LG en majuscule n’était pas indexé par Spotlight, rendant l’intégralité de son contenu inaccessible. D’autres recherches ont prouvé depuis que ce n’était pas le seul cas de figure : le bug survient aussi au minimum lorsque HPA et même Draw sont présents en tête du fichier texte. À défaut de comprendre les raisons exactes de ce bug qui existe depuis bien des années, le développeur a réussi à identifier son origine.
Concrètement, la source du problème est à chercher dans RichText.mdimporter, l’outil développé par Apple qui se charge d’ajouter le contenu des fichiers texte dans la base de données de Spotlight. On sait que la version incluse à partir de macOS Ventura (13) est touchée et c’est encore le cas sous macOS Tahoe. Pour une raison qu’il est difficile d’éludicer puisque le code source de cet outil est fermé, les premiers caractères d’un fichier texte peuvent provoquer un bug qui bloque l’indexation du contenu. Il semblerait que l’outil d’Apple considère à tort que le fichier n’est pas du texte, mais un autre format qui le conduit à ignorer ce qu’il contient.
L’hypothèse la plus probable est qu’Apple a changé la méthode pour déterminer le type d’un fichier à partir de macOS 13. Une explication pourrait être que Spotlight utilise maintenant la commande UNIX file, présente dans le système depuis Tiger, pour effectuer cette tâche. Son travail repose sur une analyse des premiers octets d’un fichier, au lieu de simplement faire confiance au système d’exploitation qui assigne un format à chaque document géré par ses soins. C’est l’inclusion de Draw qui a mis la puce à l’oreille, puisque c’est le format de fichier d’un très vieil éditeur vectoriel sorti à la fin des années 1980.
Un fichier texte qui commence par ces quatre lettres pourrait ainsi être considéré à tort comme du dessin vectoriel et non du texte brut. On imagine que LG et HPA correspondent à d’autres formats et on suppose qu’il peut y avoir d’autres séquences de caractères qui bloquent ainsi Spotlight. Comme le souligne Howard Oakley, l’opacité du moteur de recherche conçu par Apple n’aide pas à comprendre le bug, macOS ne remontant aucune information détaillée et offrant encore moins de contrôle sur le processus. Tout est censé fonctionner et si ce n’est pas le cas, l’utilisateur n’a aucun recours.
Il faut reconnaître que ce bug était bien caché : il ne fonctionne qu’avec les fichiers en texte brut, pas ceux en texte enrichi, et les caractères incriminés doivent être les premiers. Ajoutez un espace juste avant et l’indexation par Spotlight se fera normalement. Oubliez une majuscule et de la même manière, le contenu sera correctement ajouté à la base de données. Cela explique sans doute pourquoi il est passé si longtemps sous les radars d’Apple et on peut espérer qu’il sera corrigé dans une future version de macOS maintenant qu’il a été rendu public.

Le youtubeur Vadim Yuryev a publié une intéressante vidéo du MacBook Pro M5 qu'il compare au précédent MacBook Pro M4 sur de nombreux tests de performance. On peut y retrouver les scores de Geekbench ainsi que les débits doublés du SSD (y compris sur le modèle d'entrée de gamme avec 512 Go...




La publicité s'apprêterait bien à faire son arrivée dans l'application Plans d'Apple, d'après Mark Gurman sur Bloomberg. Le journaliste avait déjà évoqué l'idée en février dernier. C'est à ce moment-là que la réflexion sur le sujet aurait été lancée à Cupertino, et Mark Gurman...



