Google ne s’arrête plus dans sa course à l’IA.
La semaine dernière, pendant que OpenAI lançait ChatGPT Projects .pour nous permettre de mieux organiser nos conversations sur ChatGPT, la firme de Mountain View a dévoilé Whisk, un générateur d’images qui fonctionne un peu différemment des autres.
Ici, pas besoin de se casser la tête pour décrire ce que tu veux.
Tu te dis peut-être : “OK, mais ça existe déjà, non ?“.
Eh bien, oui, mais Whisk va plus loin. Et c’est là que ça devient intéressant.
Pourquoi c’est intéressant ?
👉 Je suis sûr que tu as déjà connu ce moment un peu frustrant où décrire exactement ce que tu veux créer comme image avec l’IA est une vraie galère.
Moi ça m’arrive tout le temps.
Genre « un pingouin qui fait du skate, lunettes de soleil, style manga » ?
👉 Et puis finalement, on finit avec un résultat un peu à côté de la plaque.
Avec Whisk, plus besoin de chercher les mots parfaits.
Google présente ça comme un outil de “remix visuel”, et je dois dire que c’est plutôt fun.
Comment ça marche concrètement ?
Le principe est simple. Tu ajoutes des images pour définir :
- Le sujet : ton fameux pingouin skateur.
- La scène : une rampe de skate au coucher du soleil.
- Le style : manga, photoréaliste, impressionniste… à toi de choisir.
Whisk, comme un robot pâtissier mixe le tout pour te servir une création sur mesure avec un petit goût de surprise.
- En coulisse, c’est Gemini qui s’amuse à décrire ton image avec des mots.
- Ensuite, Imagen 3, le dernier modèle de génération d’images de Google, se base sur cette description pour créer l’image.
- Petit bonus sympa : Whisk te montre aussi le prompt textuel qui “pilote” l’image générée. Du coup, si le résultat est un peu à côté de la plaque, tu peux ajuster ce texte pour affiner. C’est un peu comme avoir le meilleur des deux mondes, une sorte de double système visuel + texte qui s’adapte à ton style. Pas mal, non ?
NB : Whisk est pour l’instant limité aux États-Unis et aux utilisateurs inscrits sur Google Labs. Oui, il va falloir patienter pour tester ça comme d’habitude.
Google mise sur la créativité visuelle (et ça change tout)
👉 Comme en pâtisserie, l’idée, c’est d’expérimenter et d’ajuster au feeling.
Tu balances tes ingrédients (images de référence), et tu regardes ce que ça donne.
Whisk est conçu pour la créativité rapide, pas pour faire la recette parfaite à la Mary Berry.
Le résultat est parfois imprévisible, parce que l’IA « capture » et non « copie » : il réinvente à partir des détails qu’il juge importants.
Elle s’inspire des images de références pour produire quelque chose de nouveau, avec un petit côté aléatoire qui fait partie du jeu.
👉 Si tu veux une image ultra précise au pixel près, tu risques de rester sur ta faim.
Whisk, un générateur d’images IA qui sort du lot ?
👉 Google a bien senti que tout le monde n’a pas la fibre artistique pour générer des prompts parfaits.
En rendant le processus visuel et ludique, Whisk permet de générer rapidement des idées sans avoir à jongler avec les subtilités des prompts textuels.
Personnellement, j’aime bien l’idée et j’ai hâte de pouvoir tester.
👉 Alors c’est bientôt la fin des prompts textuels ? Je ne pense pas.
C’est juste que Whisk offre une autre façon d’aborder l’IA visuelle : plus intuitive, plus libre.
Si tu cherches un outil pour brainstormer et laisser place à l’inattendu, tu vas probablement apprécier.