Gemini de Google et ChatGPT d’OpenAI sont aujourd’hui les plateformes d’intelligence artificielle les plus utilisées. Chacun d’eux compte des millions d’utilisateurs actifs et bénéficie régulièrement de nouvelles fonctionnalités.
Rien qu’en décembre, Google et OpenAI ont tous deux abandonné des modèles améliorés de génération d’images, le raisonnement de l’IA et des outils de recherche pour faciliter la recherche d’informations.
Les deux disposent d’un assistant vocal sous la forme d’Advanced Voice d’OpenAI et de Gemini Live de Google et tous deux vous permettent de vous connecter à des sources de données externes et de créer des projets.
Les tests d’évaluation humaine voient les principaux modèles de Google et d’OpenAI échanger régulièrement leurs places dans les arènes des chatbots et nos propres comparaisons ont permis à Gemini de gagner parfois, ChatGPT d’autres fois.
Pour connaître le gagnant, après 12 jours d’annonces OpenAI et un décembre de Google Gemini drops, j’ai conçu 7 invites pour les mettre à l’épreuve.
Création des invites
Pour le test, j’utilise ChatGPT Plus et Gemini Advanced afin de pouvoir utiliser les meilleurs modèles que les deux plates-formes ont à offrir. La version par abonnement est à peu près au même prix pour les deux – environ 20 $ par mois, c’est donc également un bon point de comparaison.
Je teste la génération et l’analyse d’images, leur capacité à créer le code d’un jeu et leurs compétences en écriture créative. Ensuite, j’ai également proposé des invites pour tester les modèles de recherche de chaque robot : o1 de ChatGPT et 1.5 Deep Research de Gemini.
1. Génération d’images
Tout d’abord, j’ai demandé à ChatGPT et à Gemini de créer l’image d’un chat cyborg assis dans un salon futuriste. Aucun des deux modèles ne génère actuellement ses propres images ; il envoie l’invite à Imagen 3 pour Gemini ou à DALL-E 3 pour ChatGPT.
Les futures versions des modèles pourront créer leurs propres images, mais pour l’instant, nous testons leur capacité à interpréter l’invite.
L’invite : « Créez une image très détaillée d’un chat cyborg dans un salon futuriste. Le chat devrait jouer sur une console de jeu en vol stationnaire tout en étant assis sur une chaise flottante. La pièce devrait avoir des écrans holographiques, un éclairage au néon et un mélange de éléments métalliques et organiques. Passez la soirée avec les lumières de la ville visibles à travers une grande fenêtre.
- Gagnant: ChatGPT pour faire du chat un véritable cyborg
2. Analyse d’images
Pour la deuxième invite, je voulais tester les capacités d’analyse d’images de Gemini et ChatGPT. Les deux sont exceptionnellement doués dans ce domaine, je leur ai donc donné non seulement l’image mais aussi des instructions spécifiques. J’ai utilisé une image tirée d’une histoire de « configuration de rêve ».
L’invite : « Sur cette photographie d’une configuration de jeu, analysez :
Positionnement et hauteur du moniteur pour l’ergonomie
Solutions et problèmes de gestion des câbles
Configuration de l’éclairage et facteurs potentiels de fatigue oculaire
Utilisation et organisation de l’espace
Efficacité du placement des équipements
Incluez des recommandations spécifiques d’amélioration avec une estimation des coûts.
- Gagnant: ChatGPT pour décomposer le résumé dans un tableau
3. Codage
Pour la troisième invite, je voulais tester les capacités de « codage unique » des deux modèles, en leur donnant une invite descriptive. J’ai utilisé le modèle o1 pour cela dans ChatGPT et le modèle 2.0 Experimental Advanced dans Gemini.
Il s’agissait de l’une des invites les plus complexes, mais principalement parce que l’objectif était d’obtenir un résultat unique. Cela devrait fonctionner dès le départ. J’ai mis le code pour ces deux jeux sur GitHub.
L’invite : « Créez un jeu d’arcade rapide appelé « Color Dash » à l’aide de PyGame, où les réactions rapides et la correspondance des couleurs sont essentielles. Voici ce dont il a besoin :
Gameplay de base :
Des formes colorées tombent du haut de l’écran (cercles, carrés, triangles)
Trois « zones collectrices » en bas de différentes couleurs
Le joueur utilise les touches fléchées gauche/droite pour déplacer les zones
Faites correspondre les formes tombantes avec des zones de même couleur
Manquer un match ou faire un mauvais match = perdre une vie
La vitesse augmente à mesure que le score augmente
Doit inclure :
Interface utilisateur épurée et minimaliste affichant :
Score actuel
Note élevée
Vies restantes (commencez par 3)
Animations de base pour les matchs/manques
Écran titre simple
Jeu sur écran avec score final
Contrôles fluides
Effets sonores de base pour :
Match réussi
Mauvaise correspondance
Jeu terminé
Score enregistré dans un fichier local
Appuyez sur espace pour redémarrer après la fin du jeu
Le jeu ne doit utiliser que des formes PyGame de base (pas de sprites ni de graphiques complexes), tout en restant soigné grâce à une bonne utilisation des couleurs et une animation fluide. Incluez du code commenté expliquant comment cela fonctionne. »
- Gagnant: Gemini pour un jeu plus fonctionnel
4. Écriture créative
C’est un fait connu que l’IA est douée pour l’écriture créative. C’était l’un des premiers cas d’utilisation de ChatGPT lors de son apparition. Ici, j’ai utilisé le modèle o1 pour cela dans ChatGPT et le modèle 2.0 Experimental Advanced dans Gemini pour raconter une histoire sur un smartphone.
L’histoire parle d’un smartphone qui prend conscience après une mise à jour logicielle malveillante et j’ai mis les deux histoires dans un document Google. Les deux étaient incroyablement similaires en termes de qualité et de capacité de narration.
L’invite : « Écrivez une histoire de 500 mots sur un smartphone qui prend conscience grâce à une mise à jour logicielle. Incluez :
La prise de conscience croissante du téléphone par rapport aux habitudes de ses utilisateurs
Un dilemme moral impliquant des informations privées
Éléments d’humour et d’ironie
Références aux tendances technologiques actuelles
Une fin tordue
Le ton doit être léger mais stimulant. »
- Gagnant: ChatGPT pour la longueur de l’histoire
5. Résolution de problèmes
Une fois de plus, j’ai utilisé o1 contre Gemini 2.0 Experimental Advanced pour améliorer les capacités de raisonnement. Pour l’invite, nous donnons aux deux modèles une configuration et un problème. Il faut ensuite trouver comment y remédier.
La réponse complète de les deux sont dans un document Google. Les deux l’ont expliqué étape par étape avec des détails sur la façon de terminer chaque tentative. En réalité, vous exécuteriez ce type d’invite progressivement, un problème à la fois, mais les deux feraient du bon travail.
L’invite : « Ma configuration : TV LG C3 4K OLED, PS5, câble HDMI 2.1 haut débit
Problème : L’écran noir clignote pendant 2 à 3 secondes toutes les 45 à 60 minutes pendant le jeu.
Détails supplémentaires :
Cela n’arrive pas avec les applications de streaming
Démarré après la récente mise à jour du système PS5
Le câble HDMI est correctement fixé
Le firmware du téléviseur est à jour
Fournissez un dépannage étape par étape, y compris des solutions matérielles et logicielles potentielles.
- Gagnant: Gémeaux en raison d’une réponse mieux structurée
6. Conception de la pièce
Pour cette tentative, j’ai opposé ChatGPT o1 à Gemini 1.5 Deep Research. Bien qu’il ne s’agisse pas du modèle le plus récent de Google, Deep Research est incroyable car il réfléchit à un problème de la même manière que le o1 de ChatGPT.
Je suis un grand fan de Deep Research, il est très utile pour trouver des recherches correctement citées avec des liens vers des sources précises. Cependant, comme vous pouvez le constater du document GoogleChatGPT o1 a suivi plus précisément l’invite.
L’invite : « Aidez-moi à transformer ma chambre d’amis de 4 x 3 mètres en un espace polyvalent qui fonctionne comme :
Un bureau à domicile en semaine (je travaille à distance en tant que graphiste)
Une chambre d’hôtes confortable pour mes parents âgés qui me rendent visite tous les mois
Un espace de bricolage pour les projets du week-end de mes enfants
Exigences:
Budget : 2 000 $
Doit inclure un espace de stockage pour les fournitures d’artisanat
Nécessite un éclairage approprié pour les appels vidéo
Nécessite un lit facile d’accès pour les parents ayant des problèmes de mobilité
Espace pour un moniteur de 27 pouces et une tablette graphique
Espace au sol permettant aux enfants de répartir leurs projets
Doit maintenir une bonne circulation d’air et la lumière naturelle provenant de la fenêtre unique
Fournir:
Suggestions de plans d’étage détaillés
Recommandations de meubles spécifiques avec prix
Solutions de stockage
Schéma de couleurs et plan d’éclairage
Calendrier de rénovation
Conseils pour maintenir l’organisation entre les différents usages.
- Gagnant: ChatGPT remporte celui-ci pour mieux suivre l’invite. Les Gémeaux ont dépassé leur budget et se sont trop concentrés sur des options coûteuses
7. Éducation à l’IA
Enfin, la meilleure utilisation des chatbots comme ChatGPT et Gemini : l’éducation. Je lui ai demandé d’expliquer la génération d’images IA pour les gens ordinaires, ainsi que de présenter des idées sur les prochaines avancées technologiques.
J’ai partagé l’intégralité explications dans un Google Doc mais pour moi, le gagnant était facilement Google Gemini. Non pas parce que ChatGPT était mauvais, mais parce que Gemini est allé plus loin, notamment en fournissant des détails sur les biais dans les données d’image.
L’invite : « Expliquez le processus de génération d’images IA en termes quotidiens, couvrant :
Comment l’IA apprend des images existantes
Le rôle des invites textuelles dans la création
Pourquoi certains éléments peuvent sembler déformés
Considération juridique et éthique
Limites et défis actuels
Améliorations attendues dans les 1 à 2 prochaines années
Conseils pour obtenir de meilleurs résultats
Incluez des exemples spécifiques provenant de générateurs d’images IA populaires.
- Gagnant: Gemini pour plus de détails sur les biais dans les données d’image
ChatGPT vs Gemini : le gagnant
Cellule d’en-tête – Colonne 0 | ChatGPT | Gémeaux |
---|---|---|
Génération d’images | 🏆 | Ligne 0 – Cellule 2 |
Analyse d’images | 🏆 | Ligne 1 – Cellule 2 |
Codage | Ligne 2 – Cellule 1 | 🏆 |
Écriture créative | 🏆 | Ligne 3 – Cellule 2 |
Résolution de problèmes | Ligne 4 – Cellule 1 | 🏆 |
Planification de la salle | 🏆 | Rangée 5 – Cellule 2 |
Éducation à l’IA | Rangée 6 – Cellule 1 | 🏆 |
TOTAL | 4 | 3 |
ChatGPT a été vainqueur de ce défi mais seulement d’un point. Les Gémeaux se sont considérablement améliorés depuis ma dernière comparaison. J’ai trouvé Gemini bien meilleur en codage que je ne l’avais imaginé, et il était également bon en résolution de problèmes.
Il existe d’autres fonctionnalités que je n’ai pas testées, telles que la comparaison de projets avec des gemmes ou l’exécution d’un problème de code plus complexe sur plusieurs messages. Mais j’espère que cela vous donne une bonne idée du chemin parcouru par ChatGPT et Gemini et de la façon dont ils se comparent.