NOUVELLES
14/02/2014 05:33 EST | Actualisé 16/04/2014 05:12 EDT

Collecte de métadonnées : est-il trop tard pour s'inquiéter?

Au-delà des révélations faites par l'ex-consultant de la NSA Edward Snowden, des chercheurs analysent la révolution que nous écrivons tous chaque jour sans le savoir à coups de milliards d'octets, les métadonnées.

Nous faisons le point avec Yves-Alexandre de Montjoye, chercheur en sciences sociales informatiques au laboratoire de dynamique humaine du Media Lab du Massachusetts Institute of Technology (MIT) de Boston.

Une entrevue de Michel Désautels à Désautels le dimanche

Lorsqu'on parle de métadonnées, la distinction avec l'écoute électronique, qu'autoriserait un juge pour un individu par exemple, est-elle si importante?

Les métadonnées au sens strict sont des données à propos des données, des données téléphoniques, de cartes de crédit par exemple. On ne va pas lire le contenu des SMS ou écouter les appels. Nous saurons qu'une personne « A » a appelé une personne « B » à un certain moment, à partir d'un certain endroit, et que le coup de fil a duré un certain temps.

Tout ça peut paraître bien anodin, mais lorsqu'on multiplie les conversations, lorsqu'on les analyse avec des outils informatiques performants, on obtient un portrait de « A » et de « B » beaucoup plus précis que ce que nous pourrions imaginer. Nous sommes des milliards à nous penser comme les autres, mais vous nous dites que chaque être est unique en fait?

Voilà, une partie de notre recherche était de travailler sur les données de mobilité et de savoir ce que nous pouvions comprendre de la mobilité des individus en regardant leurs traces en fonction des coups de téléphone passés. Ensuite, nous nous sommes interrogés sur l'anonymité (sic) de ces informations. [...] Jusqu'à récemment, on a considéré anonyme tout ce qui ne contenait pas un morceau d'information permettant de vous identifier directement : nom, date de naissance ou numéro d'assurance sociale, adresse courriel ou numéro de téléphone, code postal.

Ce que nous avons voulu démontrer, c'est que rapidement, sans nous en rendre compte, notre mobilité est extrêmement unique. Nous avons regardé, à très grande échelle, avec les données d'un million et demi de personnes, ce qu'on a besoin de savoir pour être capable de vous retrouver dans la base de données.

Et la réponse est absolument extraordinaire. On sait déjà que dans le cas des empreintes digitales, on a besoin de 12 points pour identifier une personne et trouver un coupable de crime, par exemple. Avec les métadonnées, vous avez eu besoin de combien d'informations pour identifier la personne au bout du fil?

Quatre points. Quatre données spatiotemporelles nous suffisent. Notre comportement est tellement unique. Quand on y réfléchit, ce n'est pas spécialement étonnant. On suit tous une certaine routine, on habite et on travaille tous quelque part, on a nos préférences, on passe au magasin, on va chercher les enfants, ce genre de choses. [...] On a regardé tous les endroits où vous allez et on a regardé dans quelle mesure ceci était suffisant pour être certain que vous étiez la seule personne dans ce pays à avoir été dans ces quatre endroits à ces quatre moments.

Vous dites qu'il y a dans la psychologie industrielle, depuis des décennies, des tests qui permettent d'établir notre profil en une centaine de questions, pour notre employeur, notre banquier, des tests qui permettent de prédire si nous serons à l'heure, fiable, coopératif, méfiant, un bon client ou pas. Les métadonnées vont donner les mêmes réponses, voire un profil plus précis en posant moins de questions, n'est-ce pas?

Il y a énormément de travail académique qui a été fait sur les métadonnées. Elles représentent une masse de données absolument fascinantes au point de vue des sciences sociales. Beaucoup de chercheurs dans les 10 dernières années, dans de nombreuses universités, ont utilisé les métadonnées combinées au bon type de mathématiques et d'algorithmiques pour répondre à des questions qu'on se posait depuis une centaine d'années en sociologie. L'accès à cette masse d'information nous permet d'apprendre énormément sur l'être humain et la société, D'un point de vue scientifique, l'accès à ce type de données à été comparé par plusieurs à l'invention du microscope en biologie.

Donc, c'est le côté lumineux de l'affaire?

C'est un des côtés lumineux de l'affaire. Comprendre ce qu'il est possible de faire avec les métadonnées, à la fois au niveau prédictif et d'identification, pour être capable de déceler ce qui est à mon sens une infime proportion d'utilisations néfastes. Les utilisations que nous n'acceptons pas en tant que société ne devraient pas empêcher les autres 99 % d'usages de continuer. On travaille énormément sur ce sujet au MIT.

Sans être paranoïaque, moi, j'aimerais bien savoir qui sait quoi sur moi, et surtout à quelles fins cela peut servir. Au Media Lab, vous êtes un peu dans cette direction, en disant, on ne peut pas empêcher la collecte et l'analyse de métadonnées, c'est impossible de faire tourner le vent.

Je pense qu'on ne le voudrait pas de toute façon, même si on pouvait fermer le robinet, ce ne serait pas positif au niveau sociétal.

Qu'est-ce qu'on peut faire pour protéger les personnes que nous sommes, l'individu unique dont vous parliez?

Je pense que ça dépend énormément des utilisations : il y a l'utilisation gouvernementale, l'utilisation d'un point de vue de la recherche, et ensuite l'utilisation commerciale.

C'est le caractère nominal qu'il faut protéger?

Deux choses sont importantes. Premièrement, et c'est un problème surtout dans l'utilisation commerciale des métadonnées, c'est la notion d'anonymité. On a utilisé ces données en les supposant anonymes, mais il est temps de définir une nouvelle anonymité. Quelque chose qui n'est pas binaire, à savoir le degré de difficulté pour une personne de vous retrouver en fonction des données dont il dispose.

Et une des avenues que vous évoquez, c'est la possibilité que je sois mis au courant du fait qu'on est sur mon cas, qu'au moins je sache qui s'intéresse à moi et pourquoi. Est-ce que c'est réaliste?

C'est la deuxième chose importante : comment redonner le contrôle de ses données à l'utilisateur? Il y a une utilisation qui est faite de nos données pour des buts tout à fait louables : pouvoir nous dire de combien de temps nous aurons besoin pour rentrer chez vous en fonction du trafic, je veux dire, il y a des études qui ont été faites sur l'utilisation de la mobilité pour comprendre les épidémies, la propagation de la malaria au Kenya récemment, par exemple. Mais comment vous donner, à tout le moins, une copie de ces données, pour que vous soyez, en tant qu'individu, sur un pied d'égalité et capable de donner un sens à ces données.

Mais c'est rêver ça! Je ne serai jamais à la hauteur d'une grande entreprise qui a l'équipement, le personnel et les moyens d'analyser les données, alors que je ne saurai pas quoi faire du relevé de mes données si je le reçois sur mon ordinateur ou ma tablette!

Ce n'est pas une question de vous, en tant qu'utilisateur, d'interpréter directement ces métadonnées, même si nous au MIT nous adorerions voir les utilisateurs pourvoir aller dans leurs métadonnées. Mais au moins de le voir, de comprendre vraiment ce que sont les métadonnées, et ensuite, d'avoir le contrôle de qui accède à vos métadonnées. Le contrôle de l'accès aux métadonnées est absolument essentiel.

Je pense à un exemple: les applications de téléphones portables, ou les applications Facebook. Très clairement quand vous installez une application de ce genre, vous avez un avertissement qui vous dit qu'on veut accéder à votre localisation ou à votre liste de contact. Il y a beaucoup de critiques à l'égard de ce système. Vous devriez pouvoir, à tout moment, retirer l'accès à une société ou à un chercheur, donne l'accès à une société ou à un chercheur.

En vue de l'émission cette semaine, nous vous posons la question : les téléphones portables savent tout sur nous, et le disent. Est-il trop tard pour s'inquiéter? Répondez-nous dans les commentaires ci-dessous.