Le géant des réseaux sociaux a dévoilé mercredi des chatbots dotés de personnalités et des outils qui permettent de créer des images et du texte, et interagissent avec l’utilisateur en langage courant.
Ces annonces surviennent après des mois d’une course effrénée au développement de la dernière génération d’intelligence artificielle (IA). En tête, OpenAI, avec son interface ChatGPT, et les groupes Google et Microsoft, qui rivalisent à coups de logiciels conçus pour aider les humains à faire des recherches en ligne, être plus productifs ou encore éduquer leurs enfants.
Mais Meta n’est pas en retard, affirme Andrew Bosworth, pendant l’événement annuel du groupe californien pour les développeurs. «Il y a plein d’outils cools, comme Stable Diffusion, pour générer des images. Mais ils requièrent pas mal d’expertise et prennent beaucoup de temps», remarque le dirigeant, plus connu sous le surnom de «Boz». «Nous voulions que les résultats soient super et rapides, même sur des smartphones», quand les utilisateurs créeront des vignettes directement dans les messageries, avec des requêtes comme «hérisson à vélo» ou «joyeux anniversaire à un marathonien».
De Galactica à Llama
En novembre 2022, deux semaines avant que ChatGPT ne crée la sensation, Meta avait sorti son propre chatbot d’IA générative, spécialisé dans la recherche scientifique. Baptisé «Galactica», il pouvait «rédiger des articles», «résoudre des problèmes mathématiques», mais aussi fabriquer des réponses de toutes pièces. Meta l’a rapidement retiré de la circulation.
«Si cela n’avait tenu qu’à moi, je l’aurais laissé», commente Andrew Bosworth. «Nous avions prévenu que notre chatbot était capable de dire n’importe quoi. L’idée était justement de permettre aux chercheurs de mieux comprendre comment appréhender (cette technologie)». Mais après des années de controverses autour de la modération des contenus sur ses plateformes, la maison mère de Facebook a moins le droit à l’erreur que ses concurrents ChatGPT, Bing (Microsoft) ou Bard (Google). Les leçons tirées de Galactica ont aidé Meta à affiner Llama 2, la deuxième version de son modèle de langage généraliste.
Il faut ensuite fixer des limites éditoriales aux applications. Trop libres, elles risquent de tenir des propos dangereux. Trop contraintes, elles peuvent se révéler ennuyeuses. Pour ses propres personnages virtuels (tels que «Becca, maman dévouée à son toutou» et «Max, sous-chef expérimenté»), Meta va probablement tabler sur la prudence au début, et les «libérer avec le temps», indique Andrew Bosworth.
Des jambes et des yeux
Employé de Facebook depuis 2006, il a créé en 2017 la branche qui allait devenir «Reality Labs», dédiée aux réalités virtuelle et augmentée, et propulsée sur le devant de la scène fin 2021, quand l’entreprise est devenue Meta, pour marquer son tournant vers le métavers. Cette stratégie a suscité quantité de moqueries et de commentaires désobligeants des analystes et observateurs, car les progrès n’ont pas été aussi rapides qu’escompté. «Nous aurions dû avoir des jambes plus tôt», plaisante Boz au sujet des avatars des utilisateurs dans Horizon Worlds.
Il reconnaît que l’adoption de ce réseau social virtuel a été un peu lente, mais «la majorité du temps passé en réalité virtuelle consiste désormais à socialiser», a-t-il affirmé.
Mercredi, Meta a mis l’accent sur la réalité «mixte». Ses nouvelles lunettes connectées permettent par exemple aux utilisateurs de diffuser en direct ce qu’ils voient. Et le nouveau casque Quest 3 à 500 dollars gère beaucoup mieux les transitions entre l’environnement physique et l’univers immersif, pour éviter de se cogner dans ses meubles pendant une partie de tennis virtuelle.
Créer des interactions authentiques en virtuel ou dans le monde réel, requiert de nombreux arbitrages entre la technologie et les coûts. Pour son premier casque de réalité mixte, Apple a mis au point un appareil ultra perfectionné, commercialisé à partir de 3500 dollars début 2024. «Je peux construire ce casque», lance Boz avec un grand sourire. «Mais nous ne pensons pas que cela permettrait à nos développeurs d’atteindre suffisamment d’utilisateurs pour avoir du sens».