Google a annoncé un nouvel outil d’IA appelé Whisk qui vous permet de générer des images en utilisant d’autres images comme invites au lieu de nécessiter une longue invite de texte.
Avec Whisk, vous pouvez proposer des images pour suggérer ce que vous souhaitez comme sujet, scène et style de votre image générée par l’IA, et vous pouvez inviter Whisk avec plusieurs images pour chacune de ces trois choses. (Si vous le souhaitez, vous pouvez également remplir des invites textuelles.) Si vous n’avez pas d’images sous la main, vous pouvez cliquer sur une icône de dé pour que Google remplisse certaines images pour les invites (bien que ces images soient également semblent être générés par l’IA). Vous pouvez également saisir du texte dans une zone de texte à la fin du processus si vous souhaitez ajouter des détails supplémentaires sur l’image que vous recherchez, mais ce n’est pas obligatoire.
Whisk générera ensuite des images et une invite de texte pour chaque image. Vous pouvez ajouter ou télécharger l’image si vous êtes satisfait des résultats, ou vous pouvez affiner une image en saisissant plus de texte dans la zone de texte ou en cliquant sur l’image et en modifiant l’invite de texte.
Dans un article de blogGoogle souligne que Whisk est conçu pour « une exploration visuelle rapide, et non des modifications au pixel près ». La société affirme également que Whisk peut « rater la cible », c’est pourquoi elle vous permet de modifier les invites sous-jacentes.
Au cours des quelques minutes où j’ai utilisé l’outil lors de l’écriture de cette histoire, cela a été amusant de bricoler. Les images prennent quelques secondes à générer, ce qui est ennuyeux, et même si les images ont été un peu étranges, tout ce que j’ai généré a été amusant à parcourir.
Google affirme que Whisk utilise la « dernière » itération de son modèle de génération d’images Imagen 3, qu’il a annoncé aujourd’hui. Google a également présenté Veo 2, la prochaine version de son modèle de génération vidéo, qui, selon la société, comprend « le langage unique de la cinématographie » et hallucine des choses comme des doigts supplémentaires « moins fréquemment » que les autres modèles (l’un de ces autres modèles est probablement Sora d’OpenAI). Veo 2 arrive en premier sur VideoFX de Google, pour lequel vous pouvez vous inscrire sur la liste d’attente de Google Labs, et il sera étendu aux « autres produits » YouTube Shorts l’année prochaine.