document.addEventListener("DOMContentLoaded", function(event) { var classname = document.getElementsByClassName("atc"); for (var i = 0; i

Les Métadonnées : Définition, utilisation et leur rôle dans l’IA

par | 13 Juin 2023 | Réflexions et analyses

Qu’on le veuille ou non, les données sont omniprésentes. Elles sont le moteur des décisions commerciales, guident nos préférences en ligne et sont le fondement même des technologies d’Intelligence Artificielle. Cependant, pour que ces données soient véritablement exploitables, elles doivent être organisées et comprises. C’est là que les métadonnées entrent en jeu.

Ces données sur les données, jouent un rôle déterminant dans l’organisation, la gestion et l’interprétation des données.

L’utilisation des métadonnées soulève également d’importantes questions de confidentialité et de protection des données. Comprendre les métadonnées, leur utilisation et leur importance c’est comprendre notre présent.

Explorons ce que sont les métadonnées, les différents types de métadonnées et leurs utilisations, leur importance pour les individus et les entreprises, ainsi que leur rôle dans la formation de l’IA et les questions de confidentialité associées.

Qu’est-ce qu’une métadonnée ?

Les métadonnées sont des informations qui décrivent d’autres données. Le terme est dérivé du préfixe grec « méta », qui signifie « au-delà » ou « à côté de ». En clair, les métadonnées permettent une meilleure compréhension et une gestion plus efficace des données qu’elles décrivent.

 

Les métadonnées en vidéo

Quels sont les différents types de métadonnées ?

Les métadonnées sont utilisées dans presque tous les domaines de la vie courante, et ce, depuis très longtemps. L’ancêtre de la métadonnée en imprimerie est le colophon. C’était une note détaillée sur les anciens manuscrits comprenant différentes indications telles que le titre, le nom de l’auteur, le nom du copiste et la date d’impression.

Les images

Si vous avez une base de données de photos, de dessins, etc. Les métadonnées permettent de dire à un système de les trier par date, taille, auteur, lieu ou tout autre critère qui a été prédéterminé. Les images numériques contiennent ces spécifications depuis 1995 (données EXIF).

illustration : copyright

Les fiches de bibliothèque

Que ce soit sur papier ou dans une base de données informatiques, les différents ouvrages sont répertoriés en fonction de l’auteur, de la langue, de l’année de sortie, de la tranche d’âge …

En archéologie

Lorsqu’un tesson est découvert, les archéologues l’enregistrent avec le plus d’informations possibles pour un référencement future.

Les moteurs de recherche

En dehors du texte qui apparaît lorsque vous ouvrez une page, il y a des données invisibles pour les utilisateurs qui la décrivent. Les balises d’auteur, de données, de sujet et autres permettent aux moteurs de recherche de comprendre si la page est pertinente par rapport à votre recherche sans pour autant qu’une personne physique ne l’ait lue.

Les annonces publicitaires

Si les spécialistes du marketing disposent de métadonnées en quantité suffisante, ils peuvent déterminer si un internaute correspond à leur cible pour certaines annonces. Les métadonnées peuvent indiquer le temps passé sur certains sites ou les recherches effectuées autour d’un sujet défini par exemple.

La surveillance

Dans ce cas particulier, la liste des possibilités est infinie avec la navigation Internet et la capacité des FAI à retracer l’intégralité de la navigation internet d’un de leur abonné.

  • Le nom du titulaire du compte, son adresse, sa date de naissance, ses adresses électroniques et d’autres informations permettant d’identifier la personne
  • Les moyens de communication utilisés (voix, SMS, e-mail, chat, forum, réseaux sociaux, media center, applications…)
  • La localisation géographique de la personne au début et à la fin de la communication
  • Les coordonnées de tous les destinataires
  • Le canal utilisé pour la communication (Wi-Fi, VoIP, câble, etc.).

L’importance des métadonnées

Les métadonnées facilitent l’accès à l’information, ce qui rend la recherche et le classement des données beaucoup plus efficaces. Cela est vrai tant pour les informations publiques (comme la recherche d’un livre dans une bibliothèque) que pour les informations personnelles (comme la recherche d’une photo dans une galerie d’images). Cela permet également d’avoir des information sur des photos, l’adresse GPS quand il s’agit d’un selfie, la date de la prise de vue…

illustration : données de couleur

Les métadonnées et la confidentialité individuelle

Si les données réelles concernant la vie privée des personnes sont encore, à ce jour, difficiles à obtenir, ce n’est pas le cas des métadonnées. Très simples à collecter, elles renseignent sur la totalité de l’activité internet, mais pas seulement. La quantité d’appareils dont dispose une personne, ses différents systèmes d’exploitation, les versions, quelles applications sont installées, à quelle fréquence elles sont utilisées, l’emprunte de chacun des navigateurs.

Ces métadonnées sont thématisées par des courtiers en données, des entreprises spécialisées dans la collecte, l’analyse et la vente d’informations sur les individus. Ces informations sont utilisées pour construire des profils d’utilisateur détaillés.

L’utilisation des métadonnées dans la formation d’une l’IA

Les métadonnées jouent également un rôle essentiel dans la formation des modèles d’Intelligence Artificielle (IA). Elles fournissent un contexte précieux aux données d’entraînement, permettant une amélioration de la qualité et de la pertinence des résultats de l’IA.

En fournissant des informations comme la source des données, la méthode de collecte, et les attributs des données, les métadonnées peuvent aider à affiner les modèles d’IA. Par exemple, dans un modèle de reconnaissance d’images, des métadonnées comme la date de prise de vue, l’appareil photo utilisé, le lieu de prise de vue, peuvent être cruciales pour améliorer la performance du modèle.

En outre, les métadonnées peuvent servir à étiqueter les données d’entraînement pour faciliter les processus de classification. Dans la classification d’images, par exemple, les métadonnées peuvent comprendre des étiquettes décrivant le contenu des images, telles que les catégories d’objets présents, les actions réalisées, les scènes, etc. Ces étiquettes peuvent être utilisées pour former un modèle capable de prédire les étiquettes appropriées pour de nouvelles images.

Les métadonnées, l’IA et la confidentialité

L’utilisation des métadonnées dans la formation de l’IA soulève actuellement des questions de confidentialité et de protection des données. En effet, comment garantir que l’exploitation des métadonnées respecte les réglementations et les meilleures pratiques en matière de protection des données personnelles ?

Dans certaines juridictions, comme aux États-Unis, l’exploitation des métadonnées récupérées par les fournisseurs d’accès à Internet est légale depuis 2017. En France, des organismes comme la CNIL veillent à la protection du droit à la vie privée, bien que l’exploitation des métadonnées reste une zone légale relativement floue. Elle n’a d’ailleurs pas manqué d’épingler CLEARVIEW, l’IA de reconnaissance faciale pour violation de la vie privée.

Bien qu’ayant l’air abstraites, ces informations sur les informations sont pourtant réelles et peuvent permettre d’identifier quelqu’un. L’utilisation d’un VPN sans log (qui ne conserve pas de journaux de ses utilisateurs) permet de les dissimuler le données de navigation de son utilisateur et de les rendre inexploitables.

illustration : metadonnées explications
Share This