Intelligence Artificielle Générative pour les Communicateurs

L’introduction d’outils d’intelligence artificielle générative (IA) au cours des derniers mois n’a pas manqué. Les critiques prédisent des pertes d’emplois chez les écrivains et les artistes alors que les créateurs se tournent vers l’IA pour produire leur contenu. L’indignation accompagne les accusations selon lesquelles ces outils volent le travail produit par les humains pour l’incorporer dans leurs sorties.

Ni l’un ni l’autre n’est vrai. Comprendre le fonctionnement des outils d’IA générative peut offrir un certain confort aux communicants qui peuvent alors se concentrer sur leur utilisation pour faciliter leur travail, comme je l’ai fait récemment.

Qu’est-ce que l’IA générative ?

L’IA générative se concentre sur la création de nouveaux contenus ou données basés sur un ensemble de données d’entrée. Cela peut inclure la génération de texte, d’images ou d’audio sur la base d’un ensemble donné de paramètres ou d’un modèle formé sur un grand ensemble de données. L’IA générative a le potentiel de créer un contenu nouveau et unique, ce qui en fait un outil puissant pour une variété d’applications.

Le paragraphe ci-dessus a été écrit par ChatGPT, un nouveau générateur de texte rendu public en décembre 2022 par OpenAI. L’ensemble de données d’entrée est plus familièrement connu sous le nom d’invite. L’invite à laquelle j’ai répondu pour produire ce texte était : « Expliquez l’intelligence artificielle générative en 50 mots ». Il a fallu moins de 10 secondes à ChatGPT pour élaborer son explication en fonction des paramètres que j’ai fournis.

La sortie ChatGPT fait également référence à de grands ensembles de données. Contrairement aux moteurs de recherche, les outils d’IA générative ne parcourent pas le Web à la recherche de ressources lors de la compilation de leurs résultats. Au lieu de cela, leurs réseaux de neurones apprennent des énormes ensembles de données dont ils sont nourris. Un générateur d’images peut potentiellement alimenter des milliards d’images avec des informations pertinentes. Il apprend à quoi ressemble un éléphant, ainsi que le style employé par le regretté artiste franco-russe Marc Chagall, et peut produire une image originale d’un éléphant dans le style de Chagall.

C’est ce qui préoccupe beaucoup d’artistes. Une amie déplore que son art puisse faire partie d’un ensemble de données et se retrouver dans une sortie d’IA pour laquelle elle ne sera jamais rémunérée ni même reconnue. Ce n’est cependant pas ainsi que fonctionnent ces outils. Ils n’« échantillonnent » pas les œuvres dans une base de données. Ils ne produiront jamais de sorties qui sont des collections d’actifs préexistants. Pensez plutôt à une artiste humaine qui passe sa vie à visiter des musées et des galeries, à feuilleter des livres d’art et à dévorer des images en ligne. Ils absorbent toutes ces images ; ils influencent leur propre travail.

L’Associated Press (AP) utilise un outil d’IA génératif appelé Wordsmith depuis 2014 pour les rapports financiers. L’ensemble de données de Wordsmith comprend des centaines de milliers de rapports sur les revenus. Désormais, AP peut fournir des données financières brutes à l’outil et il produit un article utile car il a appris la structure assez rigide d’un rapport sur les résultats.

AP utilise également l’IA générative pour produire des articles couvrant les matchs de baseball des ligues mineures, résolvant ainsi le problème de ne pas avoir suffisamment de journalistes sportifs sur sa liste de paie pour couvrir tous les matchs des ligues mineures. Mais alors que les outils d’IA génératifs comme Wordsmith ne sont pas nouveaux, la dernière génération d’applications a suscité un nouvel intérêt.

Quels sont ces outils ?

Il existe deux catégories d’outils d’IA générative de haut niveau : l’image et le texte. Les générateurs d’images chaudes incluent Midjourney, Stable Diffusion et DALL-E 2 (d’OpenAI, la même organisation qui vient de publier ChatGPT).

DALL-E 2 et Stable Diffusion fonctionnent à peu près de la même manière que ChatGPT : visitez le site Web, entrez une invite dans le champ de texte et cliquez pour générer des images que l’IA pense que vous recherchez. Midjourney est un peu différent, les utilisateurs saisissant leurs invites dans un groupe de discussion Discord, où vous voyez les images qu’il crée. Ils seront également enregistrés sur votre compte sur le Web.

Tous les trois sont capables de créer des images uniques dans une vaste gamme de styles, des aquarelles aux illustrations photoréalistes. Par exemple, un ancien collègue à moi, Steve Coulson, a produit des romans graphiques, « The Bestiary Chronicles » (« la dernière tentative de l’humanité pour se sauver des monstres qui errent sur la planète ») en utilisant Midjourney.

Une image créée par Midjourney à partir des romans graphiques de Steve Coulson, « The Bestiary Chronicles »

Jason Allen, un créateur de jeux fantastiques sur table, a utilisé Midjourney pour remporter la première place dans la catégorie « photographie manipulée numériquement » du concours des beaux-arts de la Colorado State Fair en septembre 2022, battant 20 autres participants.

Photo de Jason Allen de Midjourney

ChatGPT n’est pas le premier générateur de texte mais, jusqu’à présent, c’est le meilleur de son genre. J’utilise Jasper, un générateur de texte payant, depuis environ un an, principalement à des fins d’expérimentation. Alors que ChatGPT propose un champ de saisie rapide, Jasper propose une grande variété de modèles. Si vous travaillez sur un article de blog, par exemple, vous pouvez sélectionner un paragraphe d’introduction, un plan d’article, des idées de sujet et d’autres modèles. Il existe également un générateur de FAQ et un modèle de liste qui génère une liste numérotée basée sur un sujet.

Comme ChatGPT, vous produisez du contenu à partir de l’un de ces modèles en fonction d’une invite de texte. Vous pouvez également sélectionner le nombre de sorties souhaitées. Mais avec ChatGPT, vous pouvez faire tout cela dans l’invite. Par exemple, vous pouvez l’inviter à « écrire un paragraphe d’introduction à un article de blog sur les raisons pour lesquelles les entreprises doivent prendre position sur les questions sociales ». Ensuite, une fois qu’il a terminé sa tâche, il suffit de cliquer sur « Réessayer » pour générer une nouvelle tentative.

Il existe également des outils d’IA génératifs qui produisent de la musique, des vidéos, des rendus 3D et même du code informatique à partir d’invites de texte.

Comment les communicateurs peuvent-ils utiliser ces outils ?

Les artistes utilisent déjà des générateurs d’art IA pour accélérer leurs propres processus de création. Comme indiqué dans la publication Science Focus, « Les illustrateurs et les artistes visuels pourront utiliser ces outils d’IA pour générer des idées, recueillir l’inspiration et expérimenter des prototypes qu’ils modifieront ensuite en un produit final. » Les communicateurs peuvent faire de même, en envoyant à un artiste des œuvres d’art générées par l’IA, en notant : « Quelque chose comme ça, c’est ce que j’ai en tête », ainsi que les ajustements spécifiques qu’ils souhaitent.

Pour les communicateurs dont les budgets limités ont empêché l’utilisation d’artistes rémunérés, ces outils sont une aubaine. J’ai récemment eu besoin d’une image pour accompagner un article sur le blog du leadership sur l’intranet où je travaille. J’ai parcouru le service de photos d’archives auquel je suis abonné, mais je n’ai rien trouvé qui corresponde à mes besoins, alors je me suis tourné vers DALL-E 2, incitant l’application à me donner une image photoréaliste d’un superviseur et d’un employé engagés dans un tête-à-tête. -une rencontre sur un chantier. L’une des quatre images produites correspondait exactement à ce que je voulais.

ChatGPT est également venu à mon secours. Parmi mes efforts récurrents figure un bulletin mensuel axé sur le bien-être envoyé par courriel à tous les employés de l’entreprise. La rubrique «Nutrition Nugget» a été rédigée par la coordinatrice du bien-être, qui a récemment quitté l’entreprise. Confronté à passer une heure à faire des recherches sur la courge spaghetti, j’ai choisi d’inviter ChatGPT à « écrire un article sur la courge spaghetti ». J’ai vérifié la sortie, qui s’est avérée exacte à 100%, puis j’ai fait quelques recherches pour ajouter une ligne ou deux sur l’histoire du légume (qui avait toujours été un élément de ces articles). J’ai terminé en moins de cinq minutes.

Je ne me sens pas le moins du monde mal à utiliser l’IA pour écrire un court article sur la courge spaghetti en mon nom. J’ai pu utiliser ce temps sur un travail plus substantiel qu’AI n’aurait pas pu faire pour moi. Vous pouvez également utiliser ChatGPT pour raccourcir un article, le résumer en puces, écrire des titres et des sous-titres, et même vérifier que vous avez résolu tous les problèmes possibles liés à votre sujet.

Je peux imaginer d’innombrables utilisations pour ces outils. Imaginez que vous ayez besoin d’une image de votre PDG assis au sommet d’une montagne de (entrez le nom ici). Vous pouvez installer Stable Diffusion sur votre propre ordinateur et l’entraîner sur l’image de votre PDG, puis l’inviter à diffuser l’image que vous souhaitez. J’ai testé cette capacité, en l’entraînant sur des images de moi, puis j’ai soumis plusieurs invites : moi en tant que Captain America, moi jouant de la guitare électrique et un portrait à l’huile de moi qui est devenu mon nouvel avatar Facebook (ci-dessous).

Images générées par l’IA à partir de Stable Diffusion

Quoi de neuf ?

En plus des améliorations apportées à l’écurie existante d’outils d’IA générative et de nouvelles entrées dans les champs de texte et d’image, davantage de catégories de contenu seront bientôt possibles. Il existe déjà des outils pour créer de la musique de cette façon, dont un appelé Boomy. J’envisage d’utiliser des outils comme celui-ci – lorsqu’ils s’améliorent au niveau actuel des générateurs d’art et de texte – comme lit de musique de fond pour une vidéo.

En parlant de vidéo, il existe plusieurs startups utilisant l’IA générative vous permettant de produire des vidéos marketing, des vidéos explicatives et d’autres catégories. Jetez un oeil à Synthesys comme exemple; d’autres incluent les goûts de Synthesia et InVideo. Incidemment, si vous utilisez déjà Descript, l’outil d’édition audio tout-en-un, l’application vous permet désormais d’éditer une vidéo comme vous le feriez pour éditer du texte dans un traitement de texte, le tout grâce à l’IA générative. Par exemple, Descript utilise l’IA pour créer une voix qui ressemble à la personne dans la vidéo afin que vous puissiez apporter des corrections en tapant de nouveaux mots, comme vous le feriez dans Microsoft Word. Descript demande ensuite à l’orateur de dire les nouveaux mots dans sa propre voix.

Bien que cela puisse sembler être un foyer de problèmes éthiques, les membres de l’IABC n’ont pas à s’inquiéter tant qu’ils respectent notre code d’éthique lorsqu’ils utilisent ces outils.

Comme d’habitude, la meilleure façon d’étirer votre propre imagination sur la façon dont ces outils peuvent vous servir est de les essayer. Heureusement, ChatGPT et Stable Diffusion sont parmi plusieurs qui sont entièrement gratuits et les prix des autres sont remarquablement bas, surtout par rapport aux alternatives traditionnelles.

Shel Holtz, SCMP, ABC, membre de l’IABC