2.01. Mais en fait, qu’est-ce qu’une donnée ?

Si le terme data ou données fait depuis longtemps partie du vocabulaire des professionnels du spectacle vivant, c’est de façon inégale et souvent avec beaucoup d’incompréhension vis-à-vis de ses enjeux.

Découvrez dans cette fiche ce que sont les données et métadonnées dans le contexte culturel, et leurs enjeux appliqués au domaine du spectacle vivant

La donnée, base de la connaissance sur les publics

La donnée (ou Data dans le monde anglo-saxon) est un élément brut, “défini et isolable”, “constitué à partir de règles ou de catégories”1 qui sert de point de départ à une recherche, et qui, une fois traité et interprété, nous permet de créer du sens et d’acquérir de la connaissance. Cette donnée, qui peut être un fait, un symbole numérique, une référence, une date, un nom, peut exister sous une forme numérique, c’est-à-dire être lisible par un ordinateur ou non. Appliquée au secteur culturel, cette donnée peut être un prénom, une date, un numéro de téléphone, le genre d’un spectateur, le nom d’un spectacle... En outre, une donnée peut être publique ou bien privée.  

Les données sont couramment comprises comme les matériaux bruts produits dans l’abstraction du monde en catégories, mesures et toute autre forme de représentation-nombres, caractères, symboles, images, sons, ondes électromagnétiques, bits qui constituent les fondations sur lesquelles l’information et le savoir sont créés.

Rob Kitchin,"The Data Revolution", Sage, 2014

Ces données brutes sont vérifiées et traitées pour leur donner un sens. Le produit de cette analyse devient une information. Cette information, placée dans un contexte précis, devient une connaissance, de laquelle pourra découler une compétence. La donnée constitue dans tous les cas le socle de ce processus. 

Processus d’évolution de la donnée à la compétence

Les métadonnées, enfin, sont des données qui décrivent une autre donnée. Les métadonnées vont apporter des éléments de compréhension sur la donnée ou fournir des instructions sur la manière de la traiter. Si l’on prend l’image d’un livre, on pourrait dire que les métadonnées sont les références bibliographiques (titre, formats, date de publication, auteur, résumé), et que les données sont le contenu du livre lui-même. Dans ce cas, les métadonnées résument les informations sur les données, ce qui facilite comme pour une bibliographie leur recherche et leur gestion. C’est pourquoi elles jouent un rôle déterminant dans le développement de nombreuses solutions numériques.

Les métadonnées sont de l’information structurée qui décrit, explique, localise ou facilite autrement l’obtention, l’utilisation ou la gestion d’une ressource d’information. Les métadonnées sont souvent appelées données des données ou information sur l’information.

National Information Standards Organization

Les données sont devenues un élément central des sociétés humaines contemporaines, tant les moindres aspects de nos vies privées et professionnelles sont dirigés de manière numérique, générant à chacune de nos actions des données en très grande quantité. Ce phénomène, à mettre en lien avec le développement faramineux de l’informatique, est qualifié de datafication de la société. (voir la fiche consacrée aux enjeux sociétaux qui entourent la donnée).

Dans un tel contexte, les métadonnées sont le langage universel utilisé par les systèmes informatiques. Ces informations sont donc critiques dans l’organisation et l’utilisation des données. Dès lors, les métadonnées sont aussi importantes que les données qu’elles qualifient. 

La mise en données désigne autre chose que la numérisation, laquelle consiste à traduire un contenu analogique - texte, film, photographie - en une séquence de 1 et de 0 lisible par un ordinateur. Elle se réfère à une action bien plus vaste, et aux implications encore insoupçonnées : numériser non plus des documents, mais tous les aspects de la vie.

Kenneth Cukier & Viktor Mayer-Schönberger,"Mise en données du monde, le déluge numérique", Le Monde Diplomatique, juillet 2013

Quels sont les différents types de données existant dans le contexte du spectacle vivant ?

La section québécoise de l'Internet Society, ISOC Québec, a publié en 2019 une étude sur les données d’usage culturelles à l’ère du numérique1. Celle-ci devait documenter pour une commission "les enjeux et défis liés à l’accès, à l’utilisation et à la gouvernance des données" dans un web dominé par les plateformes. 


Dans cette étude conduite partir d'une revue de littérature et une synthèse des connaissances disponibles, les auteurs distinguent trois grandes familles de données : les données descriptives, les données d’usage, et les données relevant du croisement de ces deux familles.

Typologie des données

Les données descriptives correspondent aux données permettant d’inventorier les informations sur un objet culturel. Elles peuvent être de nature assez diverse : descriptive (nom, auteur, titre...), juridique, géographique, administrative (délai de conservation) ou technique (support, format...) Pour être exploitables entre plusieurs entités, que ce soit deux services ou des pays, les données descriptives doivent s’aligner sur des référentiels communs (fiche sur ce sujet liée).

Les données d’usage, quant à elles, se rapportent à la personne utilisant ou consommant ledit contenu culturel. Ces données se rapportent à l’usage fait de l'œuvre et à la manière dont il ou elle interagit avec ce contenu. Ces données sont à nouveau très variées et peuvent être :

  • Des données personnelles ou nominatives (nom, adresse, identifiant dans la base, etc.)
  • Relatives aux transactions (date achat, mode de paiement, moyen de réservation, etc.)
  • Concerner les comportements de l’individu (mode de consultation, récurrence d’un horaire de consultation, etc.)
  • Traiter des centres d’intérêt de la personne
  • Des données de navigation (parcours sur le site web, pages consultées, etc.)

Les sources de données d'usage : rencontre TMNlab #22 : "Audience et découvrabilité, la donnée entre enjeux politiques et économiques"

Toujours selon cette étude de l’ISOC, le croisement des données descriptive et d’usage va permettre, s’il est bien réalisé, "d’analyse la consommation culturelle, d’améliorer la connaissance des publics et d’interpréter la relation au contenu". En effet, les données descriptives vont fournir un contexte d’interaction avec le contenu (exemple : le spectacle, l’atelier ou la conférence), quand les données d’usage vont caractériser l’utilisation même du contenu. C’est pourquoi ces données ont bien plus de valeur lorsqu’elles sont croisées, d’une part, et pourquoi le caractère détaillé des données descriptives conditionne la possibilité d’expliquer les choix et d’identifier des comportements récurrents.

L’étude, enfin, désigne les métadonnées comme essentielles pour permettre des rapprochements entre plusieurs bases de données, et d’établir des liens entre "la qualification d’une œuvre ou d’un contenu et les déterminants contextuels" de la consultation de ce contenu par un individu.

Selon Synapse C, organisme à but non lucratif québécois spécialisé dans l'accompagnement à la data literacy des acteurs culturels, "la finalité des données est de produire de l’information riche qui permette de connaître le public puis de le rejoindre avec une description optimale de votre offre culturelle. Toute initiative de projets pour la découvrabilité doit donc débuter par un diagnostic des données disponibles et de leur qualité."

Pour aller plus loin

Envie de contribuer ?

Depuis plus de 10 ans, le TMNlab anime une communauté apprenante francophone de professionnels du spectacle vivant pour produire et diffuser une culture numérique responsable. Envie d’en savoir plus ou de contribuer à cette plateforme ? Contactez-nous.