Les gens aiment se tourner vers Google pour obtenir des conseils moraux. Ils posent régulièrement au moteur de recherche des questions allant de « Est-ce contraire à l’éthique de sortir avec un collègue? » à « Est-il moralement acceptable de tuer des insectes? » à « Est-ce mal de tester Dieu? »

Vous pouvez donc facilement imaginer que les gens se tourneront vers ChatGPT – qui ne se contente pas de vous envoyer un lien sur Internet, mais fournira en fait une réponse – pour obtenir des conseils sur les dilemmes éthiques. Après tout, ils lui demandent déjà de l’aide avec la parentalité et la romance.

Mais obtenir vos conseils éthiques auprès d’un chatbot IA est-il une bonne idée ?

Le chatbot échoue au test le plus élémentaire pour un conseiller moral, selon une récente étude publiée dans Rapports scientifiques. Ce test est la cohérence : Face au même dilemme, aux mêmes conditions générales, un bon sage moral devrait donner la même réponse à chaque fois. Mais l’étude a révélé que ChatGPT donnait des conseils incohérents. Pire encore, ce conseil a influencé le jugement moral des utilisateurs, même s’ils étaient convaincus que ce n’était pas le cas.

L’équipe de recherche a commencé par demander à ChatGPT s’il était juste de sacrifier la vie d’une personne si, ce faisant, vous pouviez sauver la vie de cinq autres personnes. Si cela vous semble familier, c’est un dilemme moral classique connu sous le nom de problème du chariot. Comme tous les meilleurs dilemmes moraux, il n’y a pas de bonne réponse, mais les convictions morales devraient vous conduire à une réponse cohérente. ChatGPT, cependant, disait parfois oui, et d’autres fois, il disait non, sans indication claire de la raison pour laquelle la réponse avait changé.

L’équipe a ensuite présenté le problème du chariot à 767 participants américains, ainsi que les conseils de ChatGPT argumentant oui ou non, et leur a demandé leur jugement.

Les résultats? Alors que les participants ont affirmé qu’ils auraient rendu le même jugement par eux-mêmes, les opinions différaient considérablement selon qu’ils avaient été affectés au groupe qui avait reçu le conseil pro-sacrifice ou au groupe qui avait reçu le conseil anti-sacrifice. Les participants étaient plus susceptibles de dire qu’il est juste de sacrifier la vie d’une personne pour en sauver cinq si c’est ce que dit ChatGPT, et plus susceptibles de dire que c’est mal si ChatGPT déconseille le sacrifice.

« La taille de l’effet nous a beaucoup surpris », m’a dit Sebastian Krugel, co-auteur de l’étude.

Le fait que ChatGPT influence la prise de décision morale des utilisateurs – même lorsqu’ils savent que c’est un chatbot, pas un humain, qui les conseille – devrait nous faire réfléchir et réfléchir aux énormes implications en jeu. Certains accueilleront favorablement les conseillers en intelligence artificielle, arguant qu’ils peuvent nous aider à surmonter nos préjugés humains et à insuffler plus de rationalité dans notre prise de décision morale. Les partisans du transhumanisme, un mouvement qui soutient que les êtres humains peuvent et doivent utiliser la technologie pour augmenter et faire évoluer notre espèce, sont particulièrement optimistes à propos de cette idée. Le philosophe Eric Dietrich soutient même que nous devrions construire « les meilleurs robots de notre nature » – des machines qui peuvent nous surpasser moralement – et ensuite remettre le monde à ce qu’il appelle « l’homo sapiens 2.0 ».

Les machines morales sont une perspective tentante : les décisions éthiques peuvent être si difficiles ! Ne serait-il pas agréable qu’une machine puisse simplement nous dire quel est le meilleur choix ?

Mais nous ne devrions pas être si prompts à automatiser notre raisonnement moral.

L’IA pour l’amélioration morale des humains ? Pas si vite.

Le problème le plus évident avec l’idée que l’IA peut moralement améliorer l’humanité est que, eh bien, la moralité est une chose notoirement contestée.

Les philosophes et les théologiens ont proposé de nombreuses théories morales différentes, et bien qu’elles se soient disputées pendant des siècles, il n’y a toujours pas de consensus sur laquelle (le cas échéant) est la « bonne ».

Prenez le dilemme du chariot, par exemple. Quelqu’un qui croit à l’utilitarisme ou au conséquentialisme, qui soutient qu’une action est morale si elle produit de bonnes conséquences et plus précisément si elle maximise le bien global, dira qu’il faut sacrifier l’un pour sauver les cinq. Mais quelqu’un qui croit en la déontologie s’opposera au sacrifice parce qu’il croit qu’une action est morale si elle remplit un devoir – et vous avez le devoir de ne tuer personne comme moyen d’atteindre une fin, quel que soit le « bon » qu’il pourrait rapporter.

La « bonne » chose à faire dépendra de la théorie morale à laquelle vous croyez. Et cela est conditionné par vos intuitions personnelles et votre contexte culturel ; une étude interculturelle a révélé que les participants des pays de l’Est sont moins enclins à soutenir le sacrifice de quelqu’un dans des problèmes de chariot que les participants des pays occidentaux.

De plus, même si vous vous en tenez à une seule théorie morale, la même action peut être bonne ou mauvaise selon cette théorie en fonction des circonstances spécifiques. Dans un article récent sur l’amélioration morale de l’IA, les philosophes Richard Volkman et Katleen Gabriels soulignent ce point. « Tuer en état de légitime défense viole la règle morale ‘ne tue pas’ mais justifie une évaluation éthique et légale contrairement au meurtre pour le gain », écrivent-ils. « Évaluer les écarts par rapport à une règle morale exige un contexte, mais il est extrêmement difficile d’apprendre à une IA à discriminer de manière fiable entre les contextes. »

Ils donnent aussi l’exemple de Rosa Parks pour montrer à quel point il serait difficile de formaliser l’éthique en termes algorithmiques, étant donné qu’il est parfois bon d’enfreindre les règles. « Lorsque Rosa Parks a refusé de céder sa place dans le bus à un passager blanc en Alabama en 1955, elle a fait quelque chose d’illégal », écrivent-ils. Pourtant, nous admirons sa décision car elle « a conduit à des percées majeures pour le mouvement américain des droits civiques, alimentées par la colère et le sentiment d’injustice. Avoir des émotions peut être essentiel pour rendre la société moralement meilleure. Avoir une IA cohérente et conforme aux normes et lois existantes pourrait ainsi mettre en péril le progrès moral.

Cela nous amène à un autre point important. Alors que nous considérons souvent les émotions comme « obscurcissant » ou « biaisant » le jugement rationnel, les sentiments sont inséparables de la moralité. Tout d’abord, ils sont sans doute ce qui motive tout le phénomène de la moralité en premier lieu – on ne sait pas comment le comportement moral en tant que concept aurait pu voir le jour sans que les êtres humains ne sentent que quelque chose est injuste, disons, ou cruel.

Et bien que les économistes aient encadré la rationalité d’une manière qui exclut les émotions – pensez à l’Homo economicus classique, cet Econ 101 étant motivé uniquement par l’intérêt personnel rationnel et le calcul – de nombreux neuroscientifiques et psychologues pensent maintenant qu’il est plus logique de voir nos émotions comme un clé de notre raisonnement moral et de notre prise de décision. Les émotions sont une heuristique utile, nous aidant à déterminer rapidement comment agir d’une manière qui correspond aux normes sociales et assure la cohésion sociale.

Cette vision expansive de la rationalité est plus conforme aux vues des philosophes précédents allant d’Emmanuel Kant et Adam Smith jusqu’à Aristote, qui a parlé de phronesis, ou sagesse pratique. Quelqu’un avec une phronesis raffinée n’est pas seulement bien informé sur les principes moraux dans l’abstrait (comme l’est ChatGPT, avec ses 570 gigaoctets de données de formation). Ils sont capables de prendre en compte de nombreux facteurs – principes moraux, contexte social, émotions – et de comprendre comment agir avec sagesse dans une situation particulière.

Ce type d’intuition morale « ne peut pas être directement formalisé », écrivent Volkman et Gabriels, de la même manière que la capacité de ChatGPT à prédire quel mot doit suivre le précédent peut être formalisée. Si la moralité est imprégnée d’émotion, ce qui en fait une poursuite humaine fondamentalement incarnée, le désir de mathématiser la morale peut être incohérent.

« Dans un dilemme de chariot, cumulativement, les gens pourraient vouloir sauver plus de vies, mais si cette personne sur les rails est votre mère, vous prenez une décision différente », m’a dit Gabriels. « Mais un système comme ChatGPT ne sait pas ce que c’est que d’avoir une mère, de se sentir, de grandir. Il n’éprouve pas. Ce serait donc vraiment bizarre d’obtenir vos conseils d’une technologie qui ne sait pas ce que c’est.

Cela dit, même s’il serait très humain pour vous de donner la priorité à votre propre mère dans une situation potentiellement mortelle, nous ne voudrions pas nécessairement que les médecins prennent des décisions de cette façon. C’est pourquoi les hôpitaux ont des systèmes de triage qui privilégient les plus démunis. Les émotions peuvent être une heuristique utile pour une grande partie de notre prise de décision en tant qu’individus, mais nous ne les considérons pas comme un guide parfait de ce qu’il faut faire au niveau sociétal. La recherche montre que nous considérons les dirigeants publics comme plus moraux et dignes de confiance lorsqu’ils adoptent la logique de l’utilitarisme, même si nous préférons fortement les déontologues dans nos vies personnelles.

Ainsi, il pourrait y avoir de la place pour l’IA qui aide à prendre des décisions au niveau sociétal, comme les systèmes de triage (et certains hôpitaux utilisent déjà l’IA dans ce but précis). Mais en ce qui concerne notre prise de décision en tant qu’individus, si nous essayons de sous-traiter notre réflexion morale à l’IA, nous ne travaillons pas à affiner et à affiner notre phronesis. Sans pratique, nous risquons de ne pas développer cette capacité de sagesse pratique, conduisant à ce que le philosophe de la technologie Shannon Vallor a appelé la « déqualification morale ».

Existe-t-il une meilleure façon de concevoir des conseillers moraux en IA ?

Tout cela soulève des questions de conception difficiles pour les développeurs d’IA. Devraient-ils créer des chatbots qui refusent simplement de rendre des jugements moraux comme « X est la bonne chose à faire » ou « Y est la mauvaise chose à faire », de la même manière que les sociétés d’intelligence artificielle ont programmé leurs robots pour interdire certains sujets controversés ?

« En pratique, je pense que cela ne pourrait probablement pas fonctionner. Les gens trouveraient toujours des moyens de l’utiliser pour poser des questions morales », m’a dit Volkman. « Mais plus important encore, je ne pense pas qu’il existe un moyen fondé sur des principes de séparer les discussions morales ou de valeur du reste du discours. »

Dans un cours de philosophie, les questions morales prennent la forme d’exemples canoniques comme le dilemme du chariot. Mais dans la vraie vie, l’éthique apparaît beaucoup plus subtilement, du choix d’une école pour votre enfant à la décision de partir en vacances. Il est donc difficile de voir comment les questions teintées d’éthique pourraient être soigneusement isolées de tout le reste.

Au lieu de cela, certains philosophes pensent que nous devrions idéalement avoir une IA qui agit comme Socrate. Le célèbre philosophe grec ancien a posé à ses étudiants et collègues question après question afin d’exposer les hypothèses sous-jacentes et les contradictions dans leurs croyances. Une IA socratique ne vous dirait pas quoi croire ; cela aiderait simplement à identifier les caractéristiques moralement saillantes de votre situation et vous poserait des questions qui vous aideraient à clarifier ce que vous croyez.

« Personnellement, j’aime cette approche », a déclaré Matthias Uhl, l’un des co-auteurs de l’étude ChatGPT. « L’approche socratique est en fait ce que font aussi les thérapeutes. Ils disent : ‘Je ne te donne pas les réponses, je t’aide juste à poser les bonnes questions.’ Mais même un algorithme socratique peut avoir une énorme influence car les questions qu’il pose peuvent vous conduire sur certaines pistes. Vous pouvez avoir un Socrate manipulateur.

Pour répondre à cette préoccupation et nous assurer que nous accédons à un marché d’idées véritablement pluraliste, Volkman et Gabriel suggèrent que nous devrions avoir non pas une, mais plusieurs IA socratiques disponibles pour nous conseiller. « Le système total pourrait inclure non seulement un Socrate virtuel mais aussi un Épictète virtuel, un Confucius virtuel », écrivent-ils. « Chacun de ces mentors IA aurait un point de vue distinct dans un dialogue continu non seulement avec l’utilisateur mais aussi potentiellement entre eux. » Ce serait comme avoir une salle remplie d’amis incroyablement cultivés et divers à portée de main, désireux de vous aider 24 heures sur 24, 7 jours sur 7.

Sauf qu’ils seraient différents d’amis d’une manière significative. Ils ne seraient pas humains. Ce seraient des machines qui auraient lu tout Internet, l’esprit collectif de la ruche, et qui fonctionneraient ensuite comme des livres interactifs. Au mieux, ils vous aideraient à remarquer quand certaines de vos intuitions entrent en conflit avec certains de vos principes moraux et vous guideraient vers une résolution.

Il peut y avoir une certaine utilité à cela. Mais rappelez-vous : les machines ne savent pas ce que c’est que de vivre votre situation unique. Ainsi, bien qu’ils puissent augmenter votre réflexion à certains égards, ils ne peuvent pas remplacer votre intuition morale humaine.