Vidéosurveillance par IA : « Ces systèmes sont faillibles, on peut les contrer »

Billet de blog 21 janvier 2025

Mediapart

Après 12 ans dans la sécurité informatique, Thomas Jusquiame devient journaliste, infiltrant des entreprises de Vidéosurveillance algorithmique (VSA). Son but : « Faire tomber les masques », et montrer que, loin d’être d’utilité publique, ces technologies coûteuses -et inefficaces- « sont des outils développés par les classes dominantes pour contrôler les classes dominées ». Entretien.

Mouais, le journal dubitatif (avatar)

Mouais, le journal dubitatif

Mensuel dubitatif

Abonné·e de Mediapart

Ce blog est personnel, la rédaction n’est pas à l’origine de ses contenus.

Mačko Dràgàn : Tu as une technique de reportage assez particulière, qui consiste à te faire embaucher dans une boîte de vidéo-surveillance algorithmique (VSA) ; qu’est-ce que tu as découvert de l’intérieur sur ces boîtes ?

Thomas Jusquiame : A la base, je m’intéressais à l’urbanisme sécuritaire. Ça part un peu des Gilets jaunes, parce qu’à force d’être nassés, gazés, je m’étais posé la question de l’organisation spatiale. Est-ce qu’une ville comme Paris, où je manifestais principalement, contribuait à nous empêcher de manifester ? En étudiant tout ça, j’ai découvert des concepts comme la « prévention situationnelle », où tu as des sortes de criminologues qui vont faire rentrer l’espace public dans une matrice de « risques », et dire qu’il y a des crimes parce que l’environnement est criminogène. Selon eux, si tu as des buissons partout, des caches, les gens vont faire du deal -donc tu vas construire les cités et certains lieux d’une certaine façon apte à permettre la surveillance policière, et éviter le passage à l’acte délinquant.

Dans le volet de cette « prévention situationnelle », tu as les caméras. Je me suis tourné vers les boîtes qui font de la VSA, et ce qui m’a directement interpellé, c’est qu’il n’y avait pas d’infos, rien. J’ai bossé 12 ans dans l’informatique, j’étais commercial, et je sais l’importance de montrer tes projets pour donner envie aux clients… Je trouvais ça chelou. A l’époque, il n’y avait que la Quadrature du net [association de défense des libertés publiques – N.D.L.R.] sur ces sujets, et ça manquait de consistance à mon goût. Je me suis donc rendu sur « Welcome to the jungle », un site de recrutement pour les startups -que moi même j’avais mis en place d’ailleurs dans une autre boîte- et, là, je vois des boîtes de VSA qui se présentent comme des petites startups normales, tout ce qu’il y a de plus classique, avec des dirigeants trentenaires sortis d’HEC, des postes en production, en commercial, en marketing… J’envoie un CV à trois boîtes. On me répond le lendemain, et je suis embauché assez rapidement, comme « commercial grands comptes ».

Il y a deux types d’acteurs dans la VSA. Les premiers qui assument pleinement ce côté très sécuritaire, comme BriefCam, et quelques autres acteurs internationaux, et d’autres plus ambiguës, qui vont aussi proposer une « smart city », c’est-à-dire une meilleure gestion des ressources de la ville. Par exemple, connecter les caméras aux feux rouges pour pouvoir éviter les bouchons, ou encore poser des caméras dans des croisements pour analyser les types de mobilité et pouvoir permettre à la ville d’avoir des datas où ils vont dire, tiens, il y a beaucoup de voitures ici, il y a tant de vélos là, il y a tant de piétons ici, faisons des nouveaux aménagements. Tout ça peut te paraître extrêmement bullshit, -et c’est le cas. J’ai intégré une boîte : ils disent qu’ils aident carrément à… lutter contre le changement climatique. Donc quand ils me demandent pourquoi je veux intégrer la boîte, je leur dis que je veux les aider à sauver la planète, que ça me branche quoi (rires).

M.D. : Ils affirment qu’ils limitent les émissions de CO2 en fluidifiant le trafic, ou un truc comme ça, je suppose ?

T.J. : C’est ça. Ils vont pas mal se positionner sur les flux de transport, en disant qu’en analysant par exemple les flux de foule dans la RATP, on va pouvoir automatiser l’envoi de train en direct en fonction du flux de transport. Mais c’est hyper cosmétique, parce que la RATP sait très bien quelles sont les heures d’affluence. Ils ne réinventent pas l’eau chaude.

Leur argument c’est : il y a trop de caméras, c’est une mine d’or de data inexploitée, on vous propose de mettre des algos derrière pour exploiter cette mine d’informations dont on ne fait rien. Et ça démarre comme ça. J’arrive dans cette boîte en juin 2023, et mon rôle est vendre le logiciel de VSA en France et à l’international. Avec deux types de cibles : les communes, et les grandes infrastructures. Soit, les deux lieux où tu as plein de caméras.

Les grandes infrastructures, c’est les ports, les aéroports, les centres commerciaux, même les parcs d’attraction, tous les lieux où tu as de gros contrats avec des centaines, voire des milliers de caméras. Pendant un mois j’ai accompagné les dirigeants à quasiment tous leurs rendez-vous, dont le premier s’est d’ailleurs passé dans la ville où j’habitais à l’époque, au ***, et je me retrouve dans la mairie du *** en train de faire l’équipement du logiciel de VSA. On leur explique qu’on va permettre au *** de mieux analyser les mobilités et de proposer des solutions derrière pour favoriser les mobilités douces. Mais en vrai, les mecs s’en branlent total. Le seul truc qui les intéresse, c’est : « Ah mais en fait, on peut faire de la vidéo verbalisation ! » Parce que ce sont des logiciels qui coûtent cher, autour de 150 et 300 balles pour équiper un seul flux vidéo ; il faut donc les rentabiliser.

Thomas Jusquiame – Circulez – La ville sous surveillance, Editions Marchialy, 2024

M.D. : L’argument sorti par ces boites, c’est aussi souvent de dire que ça permet de retrouver des gosses perdus, des bagages abandonnés. Mais… En quoi l’IA est nécessaire dans ce cadre-là ? Un enfant perdu, on les retrouve sans jamais faire appel à l’IA ; c’est à chaque fois des fonctions où les humains font déjà ça très bien, où il y a déjà des fonctionnalités humaines qui font ça déjà sans que ce soit nécessaire d’être amélioré…

T.J. : C’est une bonne remarque. Disons le tout-net, ces logiciels-là, c’est de la merde. En termes d’efficacité, ça ne marche pas. Par exemple, dans la loi relative aux Jeux olympiques et paralympiques du 19 mai 2023 (loi JOP), qui autorise officiellement la VSA -alors que ça fait déjà des années qu’elle a été déployée de manière parfaitement illégale, en tout cas sans cadre légal-, les huit cas d’usage type détection de bagages abandonnés, ça ne marche pas du tout, alors même que ça a été l’argument de cette loi-là. C’était un joli argument politique, qui surfe sur les peurs sécuritaires, mais en termes d’efficacité technique, ça ne marche pas. C’est trop complexe, en fait. Il y a trop de gens qui se baladent. L’algorithme n’est pas capable de traiter tout ça. Je ne dis pas qu’il ne le sera pas un jour, mais en tout les cas aujourd’hui, ça ne fonctionne pas. Et pour en revenir à ton exemple de l’enfant perdu, dans la boîte où j’étais, à chaque cas d’usage qu’on proposait, il existe déjà des dispositifs qui fonctionnent déjà plus ou moins bien. On peut donc bien dire de la VSA aujourd’hui que c’est un dispositif technologique cosmétique, qui ne répond pas vraiment à certains besoins. Là où il est utile, et c’est le succès de BriefCam, c’est sur l’analyse a posteriori. C’est-à-dire que tu vas analyser des milliers d’heures d’enregistrement, par exemple, sur une enquête de stup’ dans un immeuble, qui évite qu’un policier se paluche toutes les vidéos de surveillance. Pareil, si tu veux chercher, disons, un mec en rouge avec un pantalon noir et un chapeau, tu rentres ces critères-là, et le logiciel va te faire une présélection qui va faire avancer la recherche de l’enquête.

M.D. : Après, c’est là où ça peut faire flipper aussi, parce que si jamais ça tombe en mauvaise main, tu prends une liste d’opposants politiques, tu la fous dans un algorithme, tu branches sur tout le réseau de surveillance du pays et hop.

T.J. : C’est ce que dit Félix Tréguer dans son dernier livre Technopolice. Il prend un exemple un peu provocateur mais non moins troublant : qu’est-ce que ça aurait fait à nos grands-parents résistants s’il y avait un Briefcam à l’époque ? Parce que s’il y a bien une seule chose qui marche bien aussi dans la VSA, c’est la reconnaissance faciale. Alors ça, oui pour le coup, ça marche bien. Il faut que la caméra soit de bonne qualité, il faut que le visage de la personne soit dans la base, ou que la caméra prenne la photo de toi à un instant T, et ensuite l’intègre dans sa base, ou qu’il te shot ça sur Facebook -ça c’est BriefCam qui te le dit directement-, et si les caméras sont relativement récentes, ça va bien marcher.

Il y a quelques mois, j’ai eu le ministre de l’Intérieur au téléphone sur un brief off, pour qu’il fasse un premier rapport d’efficacité sur les premiers mois d’utilisation de la VSA. Il y avait le concert de Depeche Mode, un match au Parc des Princes, un truc à Nice, etc., Ils ont dit : ça ne marche pas (rires). Enfin, évidemment, ils ne l’ont pas dit comme ça. Ils ont dit qu’il y avait un cas qui marchait très bien sur les huit cas de la loi JOP, c’est celui de la détection d’une personne sur les voies ferrées. Mais tu m’étonnes, en fait (rires). Il y avait bien besoin d’une VSA pour éviter qu’il y ait un gars sur la voie ferrée… Et en plus, moi je leur ai demandé, est-ce que ça a déclenché une intervention ? Est-ce qu’on a sauvé une vie ? Et évidemment, la réponse est non. Et là, il y avait le directeur de la sécurité, une représentante des partenariats du ministère de l’Intérieur, etc, bref, tout le monde était là.

Effectivement, là où ça marche bien, c’est quand l’environnement n’est pas trop complexe, c’est-à-dire qu’il n’y a pas un million de personnes qui se baladent, des bagages, des objets partout… La VSA fonctionne dans les contextes où on n’en a pas besoin. Mais qui est installée partout, hors de tout cadre légal ; d’ailleurs, pendant mon intervention, la CNIL s’est positionnée, et a demandé à ce qu’une loi soit votée. Et là, je peux te dire, ça a commencé à paniquer un peu partout dans le secteur de la VSA. Il y a Dominique Legrand, le patron de l’Association nationale de la vidéo-protection, le plus gros lobby de la vidéosurveillance, qui, à un salon où j’étais présent, a dit à tout le monde, tous les industriels, à tous les gens présents : « Débranchez vos systèmes ! » Ce qui m’a fait rire parce que je me suis dit : personne ne va le faire. C’était clairement une position communicationnelle, ils ne pouvaient pas dire autre chose, mais ça donnait quand même une idée : « on est sous le radar, on est dans l’illégalité ». Mais BriefCam, ils m’ont dit qu’ils avaient plus de 200 projets en France, soit potentiellement 200 villes équipées en France, donc je les voyais mal débrancher…

MD : D’ailleurs, c’est marrant, enfin non, mais avec la question des Jeux olympiques, il y a eu cette réunion où ils ont acté, sans le dire, que la VSA ne marchait pas. Mais ils ont quand même décidé de la garder et de l’intégrer, tout en sachant, tout en ayant vu que ça ne servait à rien.

T.J. : Là, tu touches à un point important parce qu’au-delà des questions de libertés publiques, de la répression, de la surveillance d’État, de la ministérisation sécuritaire et la traque des militants, il y a aussi, et c’est un peu ce que j’explique dans le livre, la question économique. La Quadrature est d’ailleurs un peu critiquée sur sa vision un peu purement orwellienne du problème, avec notamment Myrtille Picot qui, gentiment, les a repris sur la question cruciale des enjeux économiques. La France est désindustrialisée depuis longtemps, et l’industrie sécuritaire, on ne le rappelle pas assez, est un fleuron de l’industrie française. Thalès, Idemia… ce sont des monstres, qui réunissent à eux deux des centaines de milliers d’emplois dans le monde. Un marché énorme de 176 milliards de chiffre d’affaires, dont 36 milliards en France. Et ce sont les chiffres de 2017. Les JO ont été une vitrine pour tous les acteurs ayant fait des partenariats -Coca, McDo… Mais ce qu’on oublie aussi de dire, c’est que l’industrie sécuritaire, en mettant le macaron « surveillance JO », en a également tiré un profit incroyable : quand ils ont gagné le marché, crois, ils ont fait l’amour (rires). Ces Jeux, pour eux, ça a été un terrain de jeu gigantesque pour attaquer les marchés étrangers.

C’est quoi le Deep learning ? : « Ces logiciels reposent sur une branche de l’intelligence artificielle qu’on appelle la vision par ordinateur. C’est détecter un objet et le traquer dans le flux vidéo, via l’analyse des pixels d’une image. C’est du « deep learning », avec deux méthodes d’apprentissages : La première c’est le semi-automatisé, avec des ingénieurs qui vont aider l’algorithme. Et le non-supervisé, avec la machine qui se démerde toute seule et s’auto-corrige -avec quand même l’aide d’un ingénieur à la fin. »

M.D. : Et ce côté inutilement sécuritaire, les problèmes éthiques que ça pose, est-ce que ce sont des choses qui sont discutées chez les employés, en interne ?

T.J. : Non. Du problème sécuritaire, du fait qu’on surveille la vie des gens, qu’on fasse tourner des algorithmes dans l’espace public, on n’en parle pas ; on ne parle pas du fait que c’est quand même chelou de vendre des analyses de maraudage, -donc de traque des sans-abris. La moyenne d’âge des employés, c’est 25 piges, c’est hyper jeune. Les ingénieurs, je les connais bien. Ils sont très contents d’être là parce qu’ils bossent sur de l’IA, la pointe de la tech. Ils en sont assez fiers. Il y a pas mal de gens qui viennent du Maghreb, car ils coûtent moins cher et les mecs sont bons -je dis « mec » parce qu’il n’y avait que deux meufs dans la boîte… On ne se pose pas ces questions-là. Côté ingénieur, on ne voit que le « fun » de l’outil, on bosse sur des trucs cools, complexes, intéressants et tendance… Il y a un niveau de conscience politique qui est proche de zéro. Et pourtant, il y a des têtes bien faites. Il y avait une meuf, d’ailleurs, polytechnique, grosse matheuse… Je fais un entretien avec elle et je lui demande « Comment tu t’es retrouvée là ? ». Elle me dit « je finis mes études, majeure de promo, spécialisation en maths polytechnique… J’étais un peu perdue, j’avais envie de travailler sur des projets concrets ». Elle vient d’une famille populaire, de sa campagne, et voilà, elle se retrouve là-dedans, avec des responsabilités sympas, elle bosse sur des trucs hyper techniques… Mais, me dit-elle : « Mon boulot, je n’arrive pas à en parler à mes amis. J’ai honte de ce que je fais parce que ça me fait flipper ». Donc pour nuancer, je pense qu’en leur for intérieur, il y en a certains qui clairement étaient mal à l’aise.

M.D. : Ce que je trouve terrifiant là-dedans, c’est justement cette impression qu’il y a une espèce de bureaucratie secondaire, gestionnaire, mais qui va déléguer ça à des algorithmes, qui fonctionnent quasiment tout seuls, et entre les mains de jeunes ingénieurs, geeks, qui vont s’amuser avec leurs joujoux. Sans prendre en compte les populations soumises à ça, hors de tout contrôle démocratique….

T.J. : Oui, c’est ça. Même s’il y a quand même des paratonnerres. Par exemple, les boites ne collectent aucune donnée personnelle. Tout ça est très sécurisé. On donne le logiciel à la mairie ou à la police, et on ne voit pas ce qu’ils en font.

M.D. : Pour synthétiser ton livre, du coup, t’en tires quoi aussi au niveau personnel ? Nous autre activistes, on imagine un sheitan, c’est vraiment ça ?

T.J. : Bonne question. J’en ai tiré surtout des convictions. Ce qui me guide journalistiquement, c’est de faire tomber les masques. Il y a un foutage de gueule général sur ce sujet, et on ne veut pas reconnaître qu’on est dans un système de classe, avec un rapport de force. Il faut sortir de cette hypocrisie générale sur la tech, arrêter de prendre les gens pour des cons et de vouloir faire croire qu’on permet aux villes de mieux gérer leurs ressources et d’avoir une vie plus cool et de mieux vivre ensemble, ça me rend dingue : non, ce sont des outils développés par les classes dominantes pour contrôler les classes dominées. Quand je dis « tomber les masques », je ne pense pas forcément aux mecs de l’HEC et de l’ESSEC -eux, ce sont des causes perdues. Plutôt à tous ces stagiaires et ces ingénieurs avec qui j’ai travaillé, et qui viennent du même milieu que moi. Ces gens-là, j’espère qu’ils me lisent, et qu’il y aura un jour une petite lumière critique qui leur arrivera pour les faire douter. Mon parcours, c’est celui-là. Si je n’avais pas pu lire des gens un peu critiques, je n’en serais pas là. J’ai bon espoir qu’ils réagissent ; je les trouve humain au fond, ils ont beau être un peu couillons, ne pas s’intéresser à grand chose, ça reste des gens gentils, humains, qui, je suis optimiste, s’ils me voyaient lancer un pavé, me fileraient la main. On essaye aussi de nous faire croire qu’on ne peut pas en sortir, ça m’énerve. L’attaque a toujours une avance sur la défense. La question c’est de savoir qui attaque. Si j’ai appris quelque chose en 10 ans, c’est que tous les systèmes de sécurité sont faillibles. Ils aimeraient nous faire croire que la VSA, c’est capable de tout détecter. Bah non, c’est faux. Et les militants ou les gens qui sont contre, les citoyens, peuvent penser aussi des systèmes pour les contrer. Ça existe déjà.

Par Mačko Dràgàn

Article issu du numéro #54, abonnez-vous pour recevoir la revue directement chez vous : www.mouais.org/abonnements

Ce champ est nécessaire.

Soyez le premier à commenter

Poster un Commentaire

Votre adresse de messagerie ne sera pas publiée.


*