OpenAI déclare que ChatGPT peut désormais « voir, entendre et parler » avec de nouveaux outils de reconnaissance -

L’entreprise technologique commence à déployer de nouvelles fonctionnalités de chatbot pour les utilisateurs payants

OpenAI déploie de nouvelles fonctionnalités de voix et d’image pour son chatbot, ChatGPT, permettant une interaction plus humaine, a annoncé lundi la société.

Les utilisateurs de ChatGPT pourront désormais utiliser leur voix pour engager une conversation avec le chatbot. La fonctionnalité est alimentée par un nouveau modèle de synthèse vocale, qui a la capacité de générer un son de type humain. OpenAI a collaboré avec des comédiens professionnels pour créer la fonctionnalité.

ChatGPT pourra également interpréter les photos des utilisateurs pour répondre aux questions. Le service de reconnaissance d’images est alimenté par GPT-3.5 et GPT-4 multimodaux, qui appliquent des compétences de raisonnement linguistique aux images, avec ou sans texte.

OpenAI déploiera les fonctionnalités sur ChatGPT au cours des deux prochaines semaines pour les abonnés des niveaux Plus et Entreprise du service. La voix sortira à terme sur iOS et Android, tandis que la reconnaissance d’images sera disponible sur toutes les plateformes.

Dans l’annonce des nouvelles fonctionnalités de ChatGPT, OpenAI a noté quelques avertissements concernant la confidentialité et les limitations des fonctionnalités. La société a déclaré avoir pris « des mesures techniques pour limiter considérablement la capacité de ChatGPT à analyser et à faire des déclarations directes sur les personnes, car ChatGPT n’est pas toujours précis et ces systèmes doivent respecter la vie privée des individus ».

« L’utilisation réelle et les commentaires nous aideront à améliorer encore ces protections tout en gardant l’outil utile », a écrit OpenAI dans son annonce.

« Nous sommes transparents sur les limites du modèle et décourageons les cas d’utilisation à plus haut risque sans vérification appropriée », a poursuivi la société. « De plus, le modèle est compétent dans la transcription de textes anglais, mais ses performances sont médiocres avec d’autres langues, en particulier celles dont l’écriture n’est pas romaine. Nous déconseillons à nos utilisateurs non anglophones d’utiliser ChatGPT à cette fin.

Lundi, Spotify a lancé un système de traduction de podcast qui utilisera la technologie OpenAI pour cloner les voix de l’hôte dans une langue différente.

OpenAI déclare que ChatGPT peut désormais « voir, entendre et parler » avec de nouveaux outils de reconnaissance

Limitez votre enthousiasme Les 10 plus grands arguments de Larry David et Richard Lewis…

2024 semble être la meilleure année pour les films de Pedro Pascal

Les stars de Fast and Furious Luke Evans et Sung Kang se réunissent lors d'un week-end

Bowen Yang et Matt Rogers 4e annuels Las Culturistas Culture Awards à diffuser sur Bravo en août

Kang The Conqueror de MCU est la version de bande dessinée que nous voulions absolument

Interview de Tony Hale et Kristen Schaal : The Mysterious Benedict Society Saison 2

Fascination Cinématographique : L’Influence du Casino Live dans les Films et Séries

Le Film Les Voleuses : l’Incroyable Triomphe Cinématographique Féminin sur Netflix

Films et séries en streaming illimitées : Découvrez Films-Complet.fr

À quels usages correspondent les rubans adhésifs au cinéma ?

Offrez un de ces cadeaux à un ami cinéphile !

Publications similaires