J’ai beaucoup utilisé le logiciel Midjourney récemment
Midjourney est une IA générative, qui prend en entrée une phrase de description en anglais et qui génère une image sur la base de la demande de l’utilisateur.
Une loutre Superman
Par exemple, en demandant « otter as superman, octane render, photorealistic, unreal engine» (« loutre superman photoréaliste »), le logiciel calcule quatre propositions comme point de départ que l’on peut progressivement affiner.
Sur la base de cette quatre propositions, j'ai affiné ma demande en demandant quatre variations sur l'image 4, pour obtenir un portrait.
Ensuite, j'ai demandé d'affiner au maximum l'image 3 et voici le résultat.
Midjourney : vers des interfaces de création itérative
La question des IA génératives comme outil de création me passionne.
Avec Midjourney, un embryon de workflow hybride commence à émerger. L’artiste donne ses directives en langage naturel et l’IA travaille. Ensuite, l’artiste mesure l’écart avec son intention et tente de guider le logiciel, en langage naturel, pour affiner la création.
Pour le moment, c’est laborieux et les leviers de contrôle sont limités. On relance une requête en tentant de la formuler plus finement pour obtenir un résultat plus proche du résultat souhaité.
C’est un workflow itératif, mais sans la mémoire et la capacité à altérer finement l’image produite. Un jour on pourra simplement continuer la discussion en demandant de retirer tel objet, d’en ajouter un, de changer la forme du visage, de modifier des couleurs, etc. Au final, ce type d’interface reproduit la conversation entre un artisan et son client, qui itère jusqu’au produit final. Je pense que Midjourney et les concurrents qui vont suivre vont parvenir à mettre en place un workflow de ce type.
Un nouveau type d’interaction avec la machine émerge, dans la droite ligne des interfaces conversationnelles des assistants vocaux. Les IA génératives s’intégreront un jour avec ces assistants.
Avec cette convergence, nous assistons à la matérialisation d’un workflow de type « centaure », une collaboration hybride entre l’homme et la machine. C’est l’intuition de Gary Kasparov qui prend vie. Au-delà de l’affrontement, Kasparov a vu le potentiel de la collaboration homme/machine dans le domaine des échecs, une collaboration qui tire parti des forces de chacun, la puissance de la machine, la créativité humaine. Cette collaboration hybride produit des résultats meilleurs qu’un humain travaillant seul ou qu’une machine évoluant en autonomie.
C’est pour cette raison que Midjourney, qui produit pour la première fois des contenus exploitables, est une étape majeure. L’émergence d’un tel workflow créatif ne peut que s’accélérer désormais.
Liens
- Midjourney, Exemples marquants
- Gary Kasparov, Deep Thinking