La nouvelle version de ChatGPT se rapproche encore un peu plus de l'humain

OpenAI a annoncé le lancement du nouveau modèle GPT-4o. Il sera plus rapide et gratuit pour tous les utilisateurs.
Le PDG d'OpenAI Sam Altman s'entretient avec des journalistes à son arrive au Forum bipartite sur l'intelligence...
Le PDG d'OpenAI, Sam Altman, s'entretient avec des journalistes à son arrivée au Forum bipartite sur l'intelligence artificielle (IA) au Capitole à Washington DC, le 13 septembre 2023.The Washington Post/Getty Images

Mira Murati, directrice technologique d’OpenAI, a fait ce lundi une annonce qui a secoué le monde de l'intelligence artificielle. L'événement s'est déroulé un jour avant la conférence annuelle des développeurs de Google, au cours de laquelle la société devrait annoncer des mises à jour de son modèle d'IA Gemini.

Devant une foule très enthousiaste dans les locaux de l'entreprise, elle a dévoilé le tout dernier modèle de pointe : une version améliorée de Chat-GPT, baptisée Chat GPT-4o (le «o» pour «omni», signifiant «tout»). Ce nouveau système sera plus rapide et accessible gratuitement à tous les utilisateurs. Sa mise à jour comprend de nouvelles fonctionnalités telles que l'assistance vocale et l'interprétation de texte, d'images et d'audio. Il est déjà disponible sur la plateforme du célèbre chatbot.

Selon OpenAI, cet outil marque une avancée majeure dans le domaine de l'IA et «représente l'avenir de l'interaction entre les humains et les machines». Cependant, certains de ses détracteurs s'inquiètent de voir une machine atteindre une réactivité comparable à celle des humains.

Toujours plus rapide, toujours plus loin…

Les fonctionnalités linguistiques de ChatGPT ont subi des améliorations significatives en termes de qualité et de vitesse, selon OpenAI. Désormais, le chatbot est capable de mener des conversations dans plus de 50 langues. De plus, grâce à son nouvel agent conversationnel, deux personnes parlant des langues différentes peuvent bénéficier d'une traduction orale en temps réel pour faciliter leur communication.

L'entreprise a également travaillé sur la tonalité de la voix, permettant à l'assistant de raconter des histoires avec différents tons et même de chanter. Une avancée majeure de cet outil est sa capacité à produire un son naturel, incluant des onomatopées et des blagues dans ses réponses.

L'événement a été marqué par des démonstrations en direct des nouvelles capacités vocales du modèle. Deux responsables de recherche de l'OpenAI ont dialogué avec l'IA, lui demandant de moduler son ton de voix et d'exprimer diverses émotions. Ils ont ensuite procédé à un test consistant à prendre en photo une équation mathématique, pour que le modèle vocal de ChatGPT puisse expliquer comment la résoudre. Les deux opérations ont été exécutées avec brio.

Enfin, un chercheur a sollicité la machine pour lire l'expression s'affichant sur son visage et jauger ses émotions. L'assistant vocal de ChatGPT a estimé qu'il avait l'air «heureux et gai, avec un grand sourire et peut-être même une pointe d'excitation». Capable de réagir en temps réel et de commenter le monde qui l’entoure, le nouvel assistant vocal a des airs du film Her de Spike Jonze.

Mira Murati a également annoncé que la version actualisée de ChatGPT sera dotée de capacités de mémoire, lui permettant d'assimiler les conversations précédentes pour rendre l'interaction «beaucoup plus naturelle et beaucoup plus fluide».

Et la sécurité dans tout ça ?

Avant le lancement de GPT-40, des rapports contradictoires prédisaient qu'OpenAI annoncerait un moteur de recherche IA pour rivaliser avec Google et Perplexity. Ce n’est visiblement toujours pas le cas, mais l’entreprise d’intelligence artificielle de Sam Altman serait sur le point de conclure un partenariat avec Apple. Son modèle vocal pourrait offrir des fonctionnalités plus avancées que ce que Siri propose à présent.

Bien que M. Murati ait affirmé qu'OpenAI prenait des mesures pour éviter que ses nouvelles capacités vocales puissent être utilisées à mauvais escient, l'événement n'a pas apporté de détails concrets sur les protocoles de protection des données personnelles et de la reconnaissance faciale. En Europe par exemple, ChatGPT soulève des critiques car sa collecte de données ne se fonderait sur aucunes des six bases légales posées par le reglement général sur la protection des données (RGPD) européen.

Parallèlement à ces développements technologiques, OpenAI est confrontée à plusieurs poursuites judiciaires, notamment de la part de médias pour des violations présumées de droit d’auteur. Le New York Times, entre autres, accuse OpenAI d'avoir entraîné illégalement ses modèles d'IA sur leurs travaux, sans compensation ni consentement, et réclament des dommages-intérêts qui pourraient s'élever à plusieurs milliards de dollars.