Les métadonnées de la musique un trésor bien protégé

Les métadonnées de la musique un trésor bien protégé

Les métadonnées représentent l’ensemble des informations techniques et descriptives ajoutées aux documents disponibles sur Internet. Elles sont la base d’une nouvelle technologie permettant d’organiser le web, de l’optimiser. Le commerce et le partage en ligne de musique sont des domaines dans lesquels l’utilisation des métadonnées se généralise. De nouvelles plateformes ou outils de consommation musicale offrent ainsi des suggestions personnalisées. Les métadonnées ont déjà fait évoluer le web musical et promettent des développements majeurs dans un futur proche.

Cet article est le deuxième volet de trois articles portant sur l’application du droit sur les métadonnées des biens culturels et, en l’espèce de la musique :

1)Les métadonnées de la musique un trésor bien protégé

2) A qui appartiennent les métadonnées ?

3) Une base universelle de données musicales, opération à « cœur ouvert » ?

 

1) Les métadonnées musicales, qu’est ce que c’est ?

 

Les métadonnées ou metadata sont des « données sur les données ». Mot composé du préfixe grec meta, indiquant l'autoréférence, il signifie proprement « donnée de/à propos de donnée ». Il s’agit d’une documentation, destinée à servir d’information, permettant à l’utilisateur ou au gestionnaire de comprendre, localiser et croiser ses données. Les métadonnées ont un rôle d’identification et de spécification : qui, quand, comment, où [1]? Dans le système de gestion des bases de données, elles permettent la localisation et le référencement des données. Elles sont donc un maillon essentiel pour le partage de l’information et l’interopérabilité des ressources électroniques. L’interopérabilité est “la capacité d'échanger des données entre systèmes multiples“. Elle est rendue difficile par la multiplicité des standards qui, s'ils sont utiles dans les différents contextes de création et de gestion de documents numériques, n'en constituent pas moins un obstacle théorique et pratique. C’est l’enjeu majeur des metadata.

 

La dématérialisation de la musique lui a fait perdre les données associées. - source: kalieye / Flickr
notes de musique

 

Jean-François Bert, fondateur de la société Transparency, a décrit une typologie des metadata musicales en se fixant comme critère leur nature et leur usage [2]. Nous y retrouvons les métadonnées principales, celles de propriété, ou identifiants, qui ciblent « les structures et individus ayant un droit de propriété (commerciale ou intellectuelle) sur le contenu », les métadonnées de gestion ou métadonnées commerciales, ou encore les métadonnées descriptives qui vont servir à identifier une œuvre, à la décrire plus précisément (métadonnées caractérisantes) ou à guider et conseiller l’auditeur en interagissant avec d’autres données (metadata conjoncturelles). D’autres types de métadonnées, plus englobantes existent, ainsi les métadonnées d’enrichissement permettent d’ajouter à l’œuvre un véritable contexte et une plus-value à l’expérience de l’auditeur. Les métadonnées acoustiques relèvent de l’analyse du signal audio.

A partir de cette classification, il est possible d’extraire un tableau récapitulatif des metadata de la musique.

 
Métadonnées en musicologie
 

Les données ou métadonnées créées par l’utilisateur peuvent être des métadonnées collaboratives, c’est-à-dire issues de systèmes comme Last.fm, Jamendo ou MusicBrainz qui sont des modèles très riches de création de métadonnées par les utilisateurs ou membres. Elles peuvent aussi être extraites des blogs, sites, réseaux sociaux ou commentaires laissés sur les espaces dédiés à l’artiste ou son œuvre.

Les descripteurs acoustiques sont des métadonnées non textuelles attachées à un fichier, du type chapitrage ou données relevant de l’analyse du signal. Maÿlis Dupont [3] envisage de joindre une metadata contenant la forme d’ondes calculée du fichier, et attachée à celui-ci, plutôt que chaque site ou opérateur effectue des calculs avec ses propres algorithmes. Dans ce cadre, il s’agit de technologies propriétaires, grâce auxquelles des entreprises ont déjà enrichi des bases de contenus musicaux de repères analytiques appliqués à chaque titre. Le principe de l’application phare Shazam est le suivant : une large base de données sonores (20 millions de titres) est analysée, tous les titres sont échantillonnés et des repères apposés (fréquence, accords, rythmicité, périodicité, etc.) selon une grille prédéfinie. Quand le logiciel capte une nouvelle entrée, il l’analyse selon les éléments définis en amont et relève le plus grand nombre de repères connus. Puis il va croiser ces résultats avec ceux de l’analyse de sa base de données enregistrées. Enfin, si le son est connu il peut en restituer son identification à l’utilisateur. Shazam est ainsi propriétaire d’une base immense et enrichie de metadata musicales, au même titre que EchoNest ou GraceNote. Il est à noter dans ce cadre que cette analyse peut être faite de manière automatique par des logiciels d’analyse : les Descripteurs de l’Ircam par exemple, sont des logiciels permettant d’effectuer l’analyse d’un fichier audio en temps réel selon les éléments qu’ils détectent à l’intérieur comme son rythme, sa périodicité, sa fréquence, et même pour certains descripteurs plus développés, les instruments ou les types de voix.

Jean-François Bert conclut avec humour à ce propos « mettre sa musique sur le net sans métadonnées, c’est comme distribuer des flyers pour un concert sans indiquer le nom de la salle » [4].

Le terme de métadonnée, apparaît, aux vues de la diversité et de la richesse des données concernées, presque pauvre ou insuffisant. Certes au moment de sa création la métadonnée se comprend comme un outil mais il y a ensuite un important enrichissement. Peut-on encore parler de métadonnées pour ce type de contenus ? Faudrait-il inventer un nouveau mot ?  Les métadonnées dans la musique comprennent des notions très larges sur l’auteur, mais aussi sur le public ou les règles d’utilisation. La métadonnée dans la musique est un concept vaste dont la signification dépasse le simple outil d’indexation ou d’archivage.

 

2) « Content is the King, Connected Content is the Emperor », à quoi servent les métadonnées sur Internet ?

 

Les métadonnées sont des outils commerciaux. A partir d’une base de metadata bien organisée et claire, les plateformes de vente ou de services vont pouvoir créer leurs propres outils de découverte, applications ou innovations propres à enrichir l’expérience de l’auditeur. Ainsi différents types de suggestions sont possibles : artistes similaires, titres similaires, du même label, de la même époque, etc.…

Avec les données utilisateurs croisées aux metadata musicales, les plateformes peuvent proposer des achats liés : « les utilisateurs ayant acheté cette œuvre ont aussi acheté celle-ci » (Amazon). A titre d’exemple Noomiz, une plateforme indépendante entre artistes, public et professionnels de la musique, va proposer des suggestions selon la géolocalisation de l’internaute. Noomiz propose par exemple les « artistes les plus écoutés dans votre région ». Les sites créent ainsi une vraie valorisation des contenus culturels annexes : « voir les actualités de cet artiste », « voir les chroniques de son album » (Qobuz), « autour de l’album », etc. Les statistiques de vente et d’écoute permettent de faire des « Tops » : meilleures ventes, artistes les plus écoutés dans tel genre, …

Les metadata de gestion incluant le prix, les offres et promotions sont très importantes. Elles permettent de proposer les meilleures offres ou la mise en avant sur les plateformes de vente des promotions du moment. En les croisant avec les données sur les genres ou thématiques, les sites proposent des offres promotionnelles dans un genre précis.

En croisant les statistiques des ventes avec des métadonnées enrichies les acteurs peuvent aller encore beaucoup plus loin : meilleurs ventes dans un genre ou sous-genre précis, meilleures ventes dans telle région, mais aussi de tel type de musique avec tel type d’instruments, ou des recommandations très précises mêlant l’époque, le genre, la famille artistique, etc. La description audio progressant à grands pas, l’analyse du signal audio et des éléments composant un titre comme les instruments, les voix, les rythmes, permettra d’aller toujours plus loin dans le domaine de la recommandation. Les possibilités, applications et  nouveaux services sont quasi-illimités dans ce domaine et une vraie politique d’innovation est nécessaire pour permettre la compétition entre les acteurs du secteur.

 

3)    La réutilisation multisectorielle des données, des marchés en devenir.

 

La connaissance et les outils techniques de gestion des métadonnées permettent tout d’abord de développer le marché de la gestion des droits d’auteur numériques. Ceci s’applique notamment à la gestion des droits des œuvres autoproduites et mises en ligne par leur auteur sur des plateformes comme BandcampSoundCloudYoutube ou Facebook. Ces acteurs ont développé des technologies de suivi, de monétisation des œuvres et de versement de redevances très perfectionnées. Ils ouvrent ainsi le marché de la rémunération en direct des auteurs déposant leurs œuvres sur leurs plateformes et leurs réseaux sociaux. Ces acteurs concurrencent directement les sociétés de perception et de répartition des droits (SPRD) en développant un système clair, efficace et surtout très simple, sans intermédiaire, mais laissant planer l’ombre de nouveaux monopoles. Il convient de parler du rôle très important des distributeurs de musique en ligne, intermédiaires entre les producteurs et les éditeurs de services. Ceux-ci ont un rôle technique d’enrichissement, de standardisation des metadatas puis de suivi et d’optimisation de celles-ci pour servir au plus près la stratégie commerciale mise en place [5]. Ces entreprises, cruciales autant pour les labels indépendants que pour les artistes autoproduits, investissent lourdement dans ce nouveau marché et ses technologies (Believe, Ioda, Idol,…).

La gestion de ce marché va être renforcée par les technologies d’analyse et de description audio permettant de créer une empreinte digitale audio de chaque composition, identifiant et conservant les caractéristiques, uniques, de chaque enregistrement. Une startup innovante, TuneSat, [6] a par exemple créé un outil très efficace de reconnaissance audio intelligent. M. Schreer, son PDG [7] déclare que « ce système peut prendre l’empreinte digitale de n’importe quel enregistrement musical de plus de 3 secondes. Il est aussi capable d’immatriculer des fichiers sonores de mauvaise qualité ou dont la musique est noyée sous d’autres couches de sons : dialogues, bruits environnants. »

D’autres entreprises comme Transparency vont se spécialiser dans l’aide et le conseil en gestion des bases de metadata et des droits d’auteur auprès des labels, plateformes de vente et autres acteurs.

 

L’innovation dans tous les domaines touchant à la musique ne peut être développée que grâce à un enrichissement et un travail sur les metadata. Nombre d’applications sont à recenser dans le domaine musical. Le Music Tech Fest de Londres récompense tous les ans la meilleure nouvelle application de l’année. On peut recenser des outils d’un niveau technique très élevé mêlant croisement de metadata et analyse sonore. Shazam en est un exemple phare. Spotify, un logiciel d’écoute de musique en ligne, développe ses propres applications en partenariat avec de nombreux acteurs (médias, maisons de disques, journaux). Spotify possède l’une des technologies les plus développées du marché dans les domaines du partage, des suggestions, du croisement de métadonnées, notamment due à son partenariat avec Facebook. Beaucoup d’applications apparaissent sur la plateforme d’écoute Deezer. Elles sont développées en interne ou par des utilisateurs (par exemple Deezer Lyrics, Soundmap). Spotify développe notamment des applications mobiles autour de la recherche et du partage. Il propose ainsi plusieurs types de services aux utilisateurs :

-       Des playlists en fonction de l’humeur de l’utilisateur avec Moodagent ou Billboard Top Charts qui proposent les hits les plus récents.

-       Des fonctions de création, découverte et partage de playlists avec Facebook : Playlists.net. Rejoindre des amis et écouter de la musique avec des amis Facebook grâce à Soundrop.

-       Des fonctions pour enrichir l’écoute en partenariat avec des sites ou médias musicaux: avec les recommandations de Last.fm et We Are Hunted, ou découverte des dernières sorties grâce aux conseils de magazines comme Rolling StoneThe Guardian et Pitchfork, ou suivre les actualités musicales de Fuse.

-       Des applications développées en externe : TuneWiki pour découvrir les paroles des chansons en direct ou accès et conseil de concerts avec Songkick.

 

La recherche scientifique [8] va aussi bénéficier des bases de métadonnées organisées. Les bases de données des instituts de recherche en technologies audio ainsi que celles créées par les chercheurs, universitaires ou instituts du monde entier sont des sources très précieuses de renseignements et d’analyses des œuvres. Il faut à ce titre citer les recherches qui ont lieu dans le fameux institut Fraunhofer dans lequel le format MP3 a été développé. Le chercheur en musicologie Bruno Bossis [9] rappelle l’existence de compilant les références des écrits consacrés à la musique ou les sources musicales elles-mêmes développées sur papier puis sur le web : le Répertoire International de Littérature Musicale (RILM) et le Répertoire International des Sources Musicales (RISM). Contrairement à ces deux exemples, de nombreux projets sont spécialisés comme celui du groupe de recherche Musique, Informatique et Nouvelles Technologies (MINT) de l’Université Paris IV- Sorbonne. Celui-ci s’est intéressé aux sommaires des publications spécialisées dans le domaine des musiques électroacoustiques et a établi un répertoire d’analyses hypermédias disponibles en ligne. Le Research Center de l’Université De Montfort en Angleterre a créé le portail ElectroAcoustic Resource Site (EARS). Le Florida Electroacoustic Music Studio de l’Université de Floride recense quant à lui un grand nombre de liens vers des sites internet concernant des lieux, des genres et des sociétés. Ces quelques exemples montrent l’étendue des recherches sur le repérage des sources dans le domaine des musiques électroacoustiques et l’intérêt des chercheurs pour l’enrichissement en données musicales de plus en plus précises et enrichies.

 

Il existe un véritable enjeu quant à la maîtrise des metadata, elles sont un « trésor de guerre [10] » pour les acteurs de la musique, permettant d’identifier et de décrire une œuvre, ces « données sur les données » sont cruciales pour la gestion des droits, le marketing d’une œuvre, connaître sa popularité, ou obtenir des données sur le public. La base des métadonnées constitue donc une richesse importante pour les distributeurs et une nouvelle ressource à conserver, valoriser et développer.

Un véritable business des métadonnées des artistes autoproduits est en train d’émerger : de nombreuses plateformes sur lesquelles les utilisateurs mettent en ligne gratuitement leurs créations et peuvent les vendre, les partager sur les réseaux sociaux, obtenir des statistiques très précises sur leur diffusion et gagner de l’argent sur les ventes existent. Des grandes entreprises commencent à créer des bases très importantes regroupant une multitude de données liées de près ou de loin à la consommation musicale et s’ensuit un développement de la gestion des droits d’auteur directe, concurrençant les sociétés de perception et de répartition des droits.

Pour la transparence et l’optimisation du traçage des droits d’auteur à travers une meilleure valorisation des contenus tous les acteurs ont un intérêt à se diriger vers une harmonisation des métadonnées. C’est ce que tentent de faire depuis 2006 les grands acteurs de la profession avec le Digital Data Exchange créé en 2006 (DDEX), depuis 2011, le projet du Global Repertory Database (GRD) ainsi que depuis 2012, l’International Music Registry (IMR) sous l’égide de l’OMPI.

 

 

Dans un prochain article, nous nous pencherons sur l’avenir de cette mise en commun, à qui appartiennent ces données ? Qui en maîtrise l’ouverture ?

 

A propos de l'auteur :

 

Hugo Bon est le fondateur d’Echopolite (echopolite.com), maison de disques numérique et plateforme d’écoute dédiée aux musiques contemporaines de haute qualité. Juriste diplômé (du Master 2 Droit du Numérique) de l’Université Paris 1 Panthéon-Sorbonne, avec pour spécialité l’application du droit dans la musique en ligne, il est l’auteur du mémoire intitulé Encadrement des pratiques et des métadonnées: nouveaux enjeux de la musique en ligne.

 

 

[1] Ibid.
[3] M. DUPONT, Ils ont (méta)donné leur avis, interview du 4 avril 2011 pour l’IRMA, disponible ici.
[4] J-F. BERT, Ibid. M. DUPONT est la fondatrice du site Commonecoute, solutions pour des concerts live augmentés.
[5] Lire à ce sujet le focus de l’IRMA de juin 2012 ainsi que les interviews de distributeurs.
[6] Startup développant une technologie de gestion des signaux des satellites de télévision permettant de garder la trace de l’utilisation de la musique dans les chansons, publicités, bande-sons et autres types de diffusions.
[7] S. ROSENBUSH, How Big Data Will Disrupt the $9 Billion Music Publishing Rights Business, article du 15 mai 2012 pour le site CIO Journal, disponible ici.
[8] Voir à ce propos la conférence de Geoffroy Peeters, chef de l’équipe analyse/synthèse des sons de l’Ircam, Descripteurs et gestion de bases de données sonores, 2010,  disponible ici.
[9] B. BOSSIS, Des index aux bases de connaissances : prospection sémantique pour une musicologie de l’électroacoustique, Electroacoustic Music Studies Network - Beijing 2006 disponible ici
[10] Entretien personnel du 11 mais 2012 avec Lionel MAUREL, Conservateur à la Bibliothèque nationale de France.

 

En savoir plus :

 

L’ENJEU DES MÉTADONNÉES MUSICALES, La musique n’est pas qu’un fichier son http://www.irma.asso.fr/L-ENJEU-DES-METADONNEES-MUSICALES


Commentaires

Posts les plus consultés de ce blog

TOP outils de référencement gratuits qui valent la peine d'être utilisés en 2023

Les outils de référencement gratuits qui valent vraiment la peine d'être utilisés

Changement de domaine en 2023 : tout ce que vous devez savoir

Chatbot Dialogflow : Tutoriel NoCode NLP pour les spécialistes du marketing | Landbot

Revenu passif : idées pour gagner de l'argent (en dormant)

Meilleurs outils de référencement 🛠 organisée par Saijo George

La toolbox du growth hacker 💎 - Outils - Growthhacking.fr | Communauté française de growth hacking

Comment signer avec une maison de disques ? Voici notre guide ultime pour 2024

100 outils pour lancer sa startup sans argent (mais pas sans talent)