Quelque chose d’effrayant dans l’IA

Il y a quelque chose d’effrayant dans ce qu’il est convenu d’appeler l’IA, mais qui ne doit rien aux « robots tueurs ». Non que ces futures armes ne soient pas effrayantes en elles-mêmes, mais il y a quelque chose de bien pire selon nous, et que nous résumons en deux mots : « l’intelligence mécanisée ». Au départ de notre réflexion, il y a cet article en anglais, (traduit en annexe avec Google Trad), qui relate une application faite à l’Université de Standford. Voyons comment ça marche grosso-modo : d’abord les chercheurs ont exploité 50 millions d’images de Street View, prises dans 35 villes américaines, pour en extraire 22 millions d’images de voitures qu’ils ont classées en 2657 catégories. Puis ils ont pris les données du dernier recensement et ont appris à leur IA à faire des corrélations avec les voitures. Une fois l’apprentissage terminé, l’IA peut prédire les données du recensement à partir des voitures : « Nous avons constaté qu’en conduisant dans une ville pendant 15 minutes en comptant les berlines et les camionnettes, il est possible de déterminer de façon fiable si la ville a voté démocrate ou républicain ».

Pas l’ombre d’une analyse, d’un raisonnement ni d’un modèle a priori dans cette méthode, absolument rien de ce qui a toujours fait « la science » traditionnelle. Et pourtant, c’est « fiable » : c’est cela qui est « effrayant » car, si c’est « fiable », alors la méthode sera utilisée toujours plus et dans tous les domaines. Et cette méthode est « mécanique », elle ne fait que « mouliner » d’énormes volumes de données sans produire la moindre analyse compréhensible par l’être humain. Elle ne produit que des nombres dépourvus de toute signification.

Un lecteur de les-crises.fr qui a lu « Intelligence artificielle et bêtise naturelle », où nous disons que les IA « pourront juger n’importe quel texte bien mieux que nous », a répondu : « Tant que les IA seront incapables de comprendre le texte, cela reste une pure annonce commerciale » : il se trompe, il n’a pas admis l’idée fondamentale qu’il n’est pas nécessaire de comprendre pour produire une réponse pertinente, c’est-à-dire « intelligente ». C’est pourtant cela que les résultats spectaculaires démontrent, mais sans rien expliquer. C’est donc « intelligent » puisque c’est « fiable », mais c’est aussi « très bête » parce qu’il est impossible de « comprendre » pourquoi. Ce qui fait l’efficacité d’une IA n’est pas un modèle a priori, (il n’y en a aucun), mais sa structure question/réponse : d’abord on l’entraîne sur des cas particuliers pour répondre à des questions dont on connaît les réponses, (ce qui permet de corriger les erreurs), puis on lui demande de répondre au même genre de questions sur n’importe quel cas nouveau, ce qu’elle fait de façon « fiable », en ne se trompant quasiment jamais.

C’est un contre-sens de croire qu’il faudrait « comprendre » un texte pour pouvoir en extraire de l’information pertinente, car la « compréhension » est plutôt un obstacle : elle oriente l’esprit vers une information a priori qui peut fort bien être un non-sens. Prenons l’exemple de la polémique de Laurent Fabius et son fameux « Al-Nosra a fait du bon boulot » démenti par le Decodex et « C politique ». A son origine, il y a cette phrase du Monde : « M. Fabius a ainsi estimé, mercredi, que “tous les Arabes étaient vent debout” contre la position américaine, “parce que, sur le terrain, ils font un bon boulot”. » Le Decodex soutient que l’explication avancée par Fabius serait en fait celle des « Arabes » alors que la structure grammaticale de la citation ne permet pas de l’affirmer. Comparons-la à un contre-exemple :

M. Fabius a ainsi estimé, mercredi, que M. Fabius a ainsi estimé, mercredi, que
tous les Arabes étaient vent debout” contre la position américaine tous les chats étaient gris” quelque soit leur pelage
parce que, sur le terrain, ils font un bon boulot” parce que, sur le terrain, on n’y voit rien”

Vous ne pouvez pas attribuer l’opinion « on n’y voit rien » à « tous les chats », mais c’est pourtant ce qu’a fait le Decodex, bien sûr sans en avoir conscience.1

Entraînée par des opérateurs humains avertis, une IA attribuerait sans se tromper le « ils font du bon boulot » à « M. Fabius », et pourrait répéter ce genre d’opération des milliards de fois sur des milliards de phrases. C’est ainsi qu’à force de croiser des données, (ce que vous lisez, postez, commentez…), Facebook saura un jour tout ce que vous pensez ou pourriez penser : il pourra prédire votre degré d’adhésion à n’importe quel discours, (raciste ou anti-raciste par exemple), tout comme l’IA de l’exemple ci-dessus permet de prédire un vote. D’énormes progrès restent à faire avant que l’on vienne nous administrer une nouvelle preuve de sa puissance, mais il est certain que l’analyse sémantique prendra le chemin qui fut celui de la reconnaissance des caractères, des images, des mouvements, des visages, des objets, etc. où la machine est d’ores et déjà plus performante que nous.

C’est « effrayant » quand on songe à l’opinion de notre lecteur : « Tant que les IA seront incapables de comprendre le texte, cela reste une pure annonce commerciale ». Il ne réalise pas du tout ce qui est en train de se passer. Son opinion montre le fossé entre la pensée humaine, sujette à une multitude de « biais », et la pseudo-pensée de ces machines qui ne comprendront jamais rien mais auront réponse à tout. Des machines qui travaillent en aveugle et contre lesquelles on ne pourra rien faire.

Depuis la victoire d’une IA sur le champion du monde de Go, il est évident que ce nouveau paradigme de la connaissance va s’imposer, mais les gens continuent d’estimer le possible en fonction de « la science » telle qu’elle se fait depuis des siècles. Ils ne veulent pas voir qu’un bouleversement est en cours dans le monde entier(avec tous ses défauts et avantages), et qu’il se répandra aussi vite que les téléphones portables.

 

Règle

Plus de publications sur Facebook : On fonce dans le mur

ANNEXE : traduction par Google Trad de cet article en anglais :

Comment les images de Google Street View révèlent la composition démographique des États-Unis

Une machine d’apprentissage en profondeur a appris à démêler les niveaux de revenu et d’éducation d’une région simplement en regardant les images de Google Street View.

Chaque année, le Census Bureau des États-Unis dépense 1 milliard de dollars pour étudier la population. Ces enquêtes sont conçues pour démystifier la composition démographique du pays en interrogeant un groupe représentatif de personnes sur leur race, leur sexe, leur éducation, leur profession, etc. C’est un exercice important car il donne une vue d’ensemble de la population et de son évolution.

Mais ce n’est pas facile. Pour commencer, les données sont relativement importantes – l’enquête principale du Census Bureau, l’American Community Survey, donne des résultats pour toutes les villes et les comtés comptant plus de 65.000 habitants. Les zones plus petites n’y figurent pas. De plus, l’étude de la population est un exercice qui prend beaucoup de temps; si bien que certaines données peuvent avoir cinq ans au moment où elles sont publiées. Et parce que d’autres données sont beaucoup plus récentes, les comparaisons peuvent être problématiques.

Les démographes aimeraient donc avoir une façon plus rapide, plus efficace et à plus haute résolution d’étudier la population.

[C’est là qu’interviennent] Timnit Gebru à l’Université de Stanford et quelques copains, qui ont utilisé des images de Google Street View pour faire des évaluations remarquablement précises de la répartition démographique dans un large éventail de villes des États-Unis. Leur technique montre comment les démographes peuvent collecter des données fiables d’une manière entièrement nouvelle qui complète et améliore les méthodes actuelles.

Gebru et co commencent avec 50 millions d’images Street View recueillies par les voitures de Google dans 200 villes américaines. L’équipe croit que le type de voiture que les gens possèdent est un indicateur fort de leur race, de leur revenu, de leur niveau d’éducation, de leur profession et ainsi de suite.

Gebru a donc formé un ensemble d’algorithmes de vision artificielle pour reconnaître les voitures dans ces images, puis les classer dans l’une des 2.657 catégories différentes qui dépendent non seulement de la marque et du modèle de la voiture, mais aussi de son âge. Cela donne une idée précise de la valeur de la voiture.

Au total, ils ont classé quelque 22 millions de véhicules, soit environ un tiers de tous les véhicules en circulation dans ces villes. Et il a fallu environ deux semaines à leur machine pour effectuer la tâche à un rythme d’environ 0,2 seconde par véhicule. « Un expert humain, en supposant 10 secondes par image, prendrait plus de 15 ans pour effectuer la même tâche« , disent Gebru et co.

Mais comment la population de véhicules dans une zone est-elle liée à la démographie locale? Pour le savoir, l’équipe a formé un autre algorithme d’apprentissage en profondeur pour apprendre la corrélation entre les types de véhicules et les données du recensement américain et des tendances des élections présidentielles dans chaque circonscription (une zone d’environ 1000 personnes). Cet ensemble de données sur la formation comprenait les données de 35 villes.

Ils ont ensuite utilisé le reste des données pour tester l’algorithme d’apprentissage en profondeur. La question à laquelle ils voulaient répondre était: étant donné la configuration des véhicules dans une région, l’algorithme pourrait-il prédire avec exactitude les données démographiques telles qu’elles figurent dans le recensement américain et les données de vote présidentielles ?

Il s’avère que l’algorithme d’apprentissage en profondeur peut le faire remarquablement bien. « En utilisant les véhicules à moteur classifiés dans chaque quartier, nous déduisons un large éventail de statistiques démographiques, d’attributs socio-économiques et de préférences politiques de ses résidents », disent-ils.

Par exemple, les berlines sont plus étroitement associées aux démocrates, tandis que les camionnettes à cabine allongée sont plus étroitement associées aux circonscriptions qui ont voté républicain. « Nous avons constaté qu’en conduisant dans une ville pendant 15 minutes en comptant les berlines et les camionnettes, il est possible de déterminer de façon fiable si la ville a voté démocrate ou républicain« , disent Gebru et co.

Une question importante est de savoir dans quelle mesure ces conclusions correspondent à celles recueillies par les enquêtes de manière conventionnelle. Pour le savoir, Gebru et ses collègues ont comparé leurs résultats avec ceux des données du United States Census Bureau de l’American Community Survey. Et ils ont trouvé une forte corrélation avec des facteurs démographiques tels que le revenu, l’éducation, la profession et ainsi de suite. Ils ont même été en mesure de faire des prédictions détaillées sur les préférences des électeurs au niveau des circonscriptions, qui englobent environ 1000 personnes.

L’American Community Survey devrait rester la référence en matière de collecte de données, du moins pour l’instant. Mais la capacité à collecter rapidement des données de haute qualité à l’aide de Google Street View offre un grand potentiel de surveillance en temps quasi réel des changements dans la population.

Et bien sûr, Google n’est pas la seule organisation à collecter des images de la rue – il n’est pas difficile d’imaginer le même processus appliqué aux images de Facebook, Twitter ou d’autres réseaux de médias sociaux qui sont géomarqués et datés.

Ref: arxiv.org/abs/1702.06683: Utiliser Deep Learning et Google Street View pour estimer la composition démographique des États-Unis

1Il ne l’a pas affirmé explicitement mais il a posé cette question qui s’appuie sur la citation litigieuse : « Lorsqu’il évoque le « bon boulot » du Front Al-Nosra, reprend-il ce qualificatif à son compte, ou bien se contente-t-il de le replacer dans la ligne qu’il évoque, à savoir celles des Arabes, « vent debout » contre la position américaine ? » Fabius aurait ajouté : « C’était très net, et le président de la coalition était aussi sur cette ligne », mais ce « aussi » laisse entendre qu’il s’inclut.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

w

Connexion à %s

Créez un site ou un blog sur WordPress.com

Retour en haut ↑

%d blogueurs aiment cette page :