1) Chat GPT4 est passé au multi-modal en septembre 2023 : production de textes mais aussi reconnaissance et description d’images et parole avec une voix quasiment parfaite.

D’après l’agence Reuters, trouvé sur le site www.zonebourse.com :

“Grâce à la prise en charge des images, les utilisateurs de Chat-GPT4 peuvent prendre des photos de ce qui les entoure et demander au chatbot de “dépanner leur gril qui ne démarre pas, d’explorer le contenu de leur réfrigérateur pour préparer un repas ou d’analyser un graphique complexe pour y trouver des données liées au travail”.

Google Lens d’Alphabet est actuellement (25.10.23) la solution la plus répandue pour obtenir des informations sur des images.

2) Un algorithme reconstruit les images observées par des humains, à l’aide de clichés médicaux de leur cerveau. 

Ceci n’est pas un nouvel épisode de la série télévisée dystopique Black Mirror, mais une technologie émergente, révèle New Scientist. “Une IA [intelligence artificielle] peut recueillir les images du cerveau d’une personne”, commence l’hebdomadaire. L’IA derrière cet exploit est une invention de Guohua Shen et de son équipe de l’Institut international de recherche en télécommunications avancées, situé au Japon. Elle a fait l’objet d’une publication dans bioRxiv le 27 février.

L’algorithme mis au point par les chercheurs utilise les clichés – acquis par imagerie par résonance magnétique fonctionnelle (IRMf) – du cerveau d’une personne en train de regarder une image. Celle-ci peut représenter des figures ‘naturelles’ comme des chauves-souris, des motoneiges ou du verre coloré, ou ‘artificielles’ telles que des carrés, le symbole de l’addition, ou des lettres de l’alphabet”, précise New Scientist. Après avoir décodé les IRMf, l’IA est en mesure de reconstruire l’image observée.”

Trouvé sur https://www.courrierinternational.com/article/une-intelligence-artificielle-capable-de-voir-ce-que-nous-voyons