OpenAI déclare que ChatGPT peut désormais « voir, entendre et parler » avec de nouveaux outils de reconnaissance

OpenAI déclare que ChatGPT peut désormais « voir, entendre et parler » avec de nouveaux outils de reconnaissance

L’entreprise technologique commence à déployer de nouvelles fonctionnalités de chatbot pour les utilisateurs payants

OpenAI déploie de nouvelles fonctionnalités de voix et d’image pour son chatbot, ChatGPT, permettant une interaction plus humaine, a annoncé lundi la société.

Les utilisateurs de ChatGPT pourront désormais utiliser leur voix pour engager une conversation avec le chatbot. La fonctionnalité est alimentée par un nouveau modèle de synthèse vocale, qui a la capacité de générer un son de type humain. OpenAI a collaboré avec des comédiens professionnels pour créer la fonctionnalité.

ChatGPT pourra également interpréter les photos des utilisateurs pour répondre aux questions. Le service de reconnaissance d’images est alimenté par GPT-3.5 et GPT-4 multimodaux, qui appliquent des compétences de raisonnement linguistique aux images, avec ou sans texte.

OpenAI déploiera les fonctionnalités sur ChatGPT au cours des deux prochaines semaines pour les abonnés des niveaux Plus et Entreprise du service. La voix sortira à terme sur iOS et Android, tandis que la reconnaissance d’images sera disponible sur toutes les plateformes.

Dans l’annonce des nouvelles fonctionnalités de ChatGPT, OpenAI a noté quelques avertissements concernant la confidentialité et les limitations des fonctionnalités. La société a déclaré avoir pris « des mesures techniques pour limiter considérablement la capacité de ChatGPT à analyser et à faire des déclarations directes sur les personnes, car ChatGPT n’est pas toujours précis et ces systèmes doivent respecter la vie privée des individus ».

« L’utilisation réelle et les commentaires nous aideront à améliorer encore ces protections tout en gardant l’outil utile », a écrit OpenAI dans son annonce.

« Nous sommes transparents sur les limites du modèle et décourageons les cas d’utilisation à plus haut risque sans vérification appropriée », a poursuivi la société. « De plus, le modèle est compétent dans la transcription de textes anglais, mais ses performances sont médiocres avec d’autres langues, en particulier celles dont l’écriture n’est pas romaine. Nous déconseillons à nos utilisateurs non anglophones d’utiliser ChatGPT à cette fin.

Lundi, Spotify a lancé un système de traduction de podcast qui utilisera la technologie OpenAI pour cloner les voix de l’hôte dans une langue différente.

Publications similaires