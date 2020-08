le informations personnelles de 235 millions d’utilisateurs Instagram, TikTok et YouTube sont restés en ligne potentiellement visibles par quiconque dans une énorme base de données non protégée. La découverte a été faite par des chercheurs de Comparitech, qui, dans l’une de leurs activités en ligne, ont trouvé une archive sur le Web contenant noms, prénoms, adresses e-mail, photographies et autres informations contact – tous stockés sans protection et donc potentiellement disponibles pour toute personne tentant d’y accéder.

Selon Comparitech, derrière la compilation de l’archive se trouve Deep Social, une entreprise qui n’est plus spécialisée dans la construction de grandes archives de données personnelles à des fins commerciales. En fait, les données finies en ligne n’ont pas été obtenues par des techniques d’intrusion informatique; bref, la collection ce n’était pas le travail de hackers, mais d’une opération appelée web scraping. Dans cette pratique, les algorithmes apprennent un visiter automatiquement autant de pages que possible lié à un site et télécharger toutes les informations sur ces pages: il ne s’agit pas d’une cyberattaque, mais d’une activité que, dans tous les cas, la plupart des plateformes de partage interdisent expressément.

Dans le cas d’Instagram, le web scraping peut en effet conduire à racheter les informations présentes dans tous profils publics, qui comprennent les preudonymes, les noms et prénoms, les biographies et même toutes les photographies téléchargées et celles sur lesquelles elles ont été étiquetées; pour TikTok et YouTube, cela peut être la même chose, mais avec une liste de vidéos publiées. Les informations obtenues lors des activités rapportées par Comparitech ont été utilisées pour compiler des bases de données soignées avec des listes de noms, de dates de naissance et de tout matériel multimédia connecté à des utilisateurs individuels.

Les responsables de Deep Social ont adressé les questions des chercheurs de Comparitech à Social Data, une autre société qui a cependant nié tout lien avec Deep Social, tout en insistant sur le fait que les informations contenues dans les archives qui ont émergé en ligne n’ont pas été obtenues par piratage. . Néanmoins, les fruits de la collecte réalisée sont décidément dangereux: si entre les mains de Deep Social l’archive pouvait servir à évaluer les activités des influenceurs sur les trois plateformes (c’était le but déclaré par l’entreprise lorsqu’elle était en affaires), l’ayant laissé en ligne sans les protections permettaient à quiconque de mettre la main dessus. Les escrocs et attaquants potentiels pourraient par exemple utiliser les noms, prénoms, photos et vidéos de l’archive pour escroqueries par hameçonnage automatisé et autres types d’escroqueries, se faisant passer pour les victimes de la fuite de données en ligne.