L’IA est loin d’être capable de refaire « Breakfast at Tiffany’s » avec un acteur différent – pour le moment | Vidéo
TheGrill 2023 : le président et directeur de la stratégie de Cineverse, Erick Opeka, a discuté de ce qui doit se passer pour que cela devienne réalité
« L’année dernière, l’IA générative n’était sur l’écran radar de personne », a déclaré mercredi Peter Csathy, président de Creative Media, lors de la conférence annuelle de l’industrie de Jolie Bobine, TheGrill.
Csathy — aux côtés d’Erick Opeka, président et directeur de la stratégie de Cineverse ; Mark Mothersbaugh de DEVO ; explication en chef de la Human Artistry Campaign, Dr Moiya McTier ; responsable des partenariats médias et divertissement pour Intel, Rick Hack ; Thobey Campion, fondateur de Lore Machine ; et la fondatrice de What’s Trending, Shira Lazar, ont discuté de l’avenir de l’IA, qui, selon Opeka, n’est pas aussi vaste qu’on le craignait.
« Le tableau d’ensemble est que nous utilisons une grande partie de la technologie dont nous disposons pour réfléchir à la direction que cela prendra et à la manière de construire des systèmes pour créer la prochaine génération de divertissement ? » dit Opéka.
« Aujourd’hui, les données sont très limitées », a-t-il poursuivi. « La plupart des LLM d’aujourd’hui sont très axés sur des données textuelles ou des images individuelles. » En effet, les ensembles de données créés pour l’IA ont été créés il y a plus de dix ans et leur portée est encore limitée. « Les ensembles de données qui existent aujourd’hui sont très, très loin de dire : ‘Hé, crée ‘Breakfast at Tiffany’s’ mais mets-y cet acteur », a-t-il déclaré.
Que faudrait-il alors pour que cela se produise ? Comme l’a expliqué Opeka, plusieurs éléments doivent être négociés, à commencer par la réglementation.
« Est-ce que nous, en tant que société, allons permettre cela ? il a dit. Il y a aussi un volet logistique. La quantité considérable de puissance de traitement et de données nécessaire à la construction d’un système permettant cela constitue, comme l’explique Opeka, le « terrain de jeu exclusif » des plus grandes entreprises du monde. Ce ne serait pas quelque chose accessible aux masses.
Et comme les données actuelles sont toutes textuelles, elles obligent les générateurs d’IA à créer des éléments à l’aide de balises descriptives. « Comment avez-vous des balises descriptives à un niveau de profondeur pour faire des longs métrages ? Cela nécessite une quantité incroyable de puissance de traitement (et) vous avez besoin d’experts qui surveillent », a déclaré Opeka.
Opeksa a expliqué que même s’il s’agit d’IA, il y a encore beaucoup de main-d’œuvre consacrée au traitement. Aujourd’hui, la plupart des modèles de langage, a-t-il déclaré, comptent entre 40 et 50 personnes qui travaillent dessus : « Littéralement, des armées de personnes derrière le rideau forment ces modèles. »
Cela soulève également la question de savoir comment les gens seraient rémunérés, qu’ils travaillent sur les modèles ou qu’ils en soient la base. Il faudrait également répondre à la vieille question de savoir s’il existe un modèle économique pour cela.
Comme Opeka l’a expliqué plus en détail, c’est une chose de créer quelque chose qui pourrait permettre à un spectateur de regarder « Robocop » avec un acteur différent, ou c’est une comédie, mais un public de masse serait-il prêt à payer pour cela ? Il a comparé la technologie au début des années 1900, lorsque les gens regardaient des nickelodeons (courtes vidéos) dans les magasins à dix sous.
« C’est loin d’être ‘Avatar’, mais c’est la genèse qui a conduit à ‘Avatar’. »
Regardez le panel complet dans la vidéo ci-dessous.
À propos de TheGrill : Depuis plus d’une décennie, la série d’événements TheGrill mène le débat sur la convergence du divertissement, des médias et de la technologie, réunissant des acteurs de l’actualité pour débattre des défis et des opportunités liés à la création de contenu à l’ère numérique. TheGrill propose une série unique de discussions organisées, de panels industriels et d’activations de réseautage qui explorent le paysage médiatique en constante évolution.







