Non, les données ne sont pas le mal. Oui, elles sont au cœur de tout aujourd’hui. La récolte et le traitement des données sont devenus une révolution indispensable de notre société – et de nos métiers audiovisuels. Mais en quoi consistent ces données ? Qu’est-ce que cette fameuse data qui semble susciter autant de fantasmes que de peurs ?

L’air de rien

« L’or des données », « le déluge des données », « la protection des données », « le scandale des données »… Que d’expressions croisées tous les jours dans le journal, sur les réseaux sociaux, dans notre milieu professionnel ! On me dit qu’il y a là quelque chose d’important, mais cela semble abstrait et impalpable. J’entends dire qu’un tas de règlements veulent me protéger afin qu’on ne me les extorque pas, mais je constate surtout que je croule désormais sous des demandes sans fin sur mon consentement. Opt-in : voulez-vous accepter ? Opt-out : non je ne veux pas. Je sais vaguement qu’une révolution est en marche dans le monde d’Internet, qui s’appellerait le web 3.0. Que cette révolution aurait pour but de « décentraliser » les données, d’éviter que quelqu’un les possède toutes, et que cela serait l’idée du bitcoin. Je lis sans vraiment comprendre l’idée, vague encore, d’un « métaverse » qui serait l’étape suivante d’Internet, une réponse agressive que les GAFAM apporteraient à ce web 3.0 pour ne pas perdre la main sur ces données. Ça semble important. Ça semble crucial. Mais je n’y comprends rien. Est-ce bien ? Est-ce mal ? Est-ce de l’enfumage technologique, ou bien cela a-t-il quelque chose à voir avec ma vie de tous les jours ? Mieux : cela a-t-il quelque chose à voir avec nos métiers de l’audiovisuel ? Comment ça marche et comment ça s’organise ? C’est quoi les règles du bon usage ?

On va expliquer tout ça. Et je commence par trois énormes spoilers :
1. les données sont effectivement au cœur de tout et sont en train de tout changer ;
2. les données, ce n’est pas le mal ;
3. il y a une urgence à s’y coller pour bien les utiliser.

Une donnée, c’est quoi ? Il y a beaucoup de débats là-dessus. D’abord, et pour commencer, c’est une espèce de bâtard entre un simple fait, posé là, brut, et une information que l’on procure plus ou moins consciemment. En réalité, le mot « une donnée » en français est un peu torve. Il est rare que la donnée en question soit réellement un don, un présent, voire tout simplement que ce soit volontaire. Souvent c’est une trace que l’on laisse – une « aban-donnée » serait plus juste comme terme.

Une donnée, c’est ce qui rend pourtant le moins mal possible en français le mot « datum », qui est le « supin » latin du mot « dare » / « do », je donne. Singulier datum, et pluriel ce « data » qui est passé en anglais tout seul comme un grand, indénombrable. La data, c’est la donnée.

Cette donnée « abandonnée » est aussi souvent prise et même volée. C’est la raison pour laquelle on a proposé de remplacer le mot « data » par « sublata » (Bruno Latour), c’est-à-dire quelque chose qui est piqué à autrui. Je préfère personnellement le terme de Johanna Drucker qui parle, dans ce cas des données extorquées, de « capta », c’est-à-dire ce qu’on a pris à l’autre, « capté ».

Mais enfin bon, toute cette dramatisation de la data qui devient capta est un peu théorique. On n’est pas non plus tout le temps en train de nous voler ou de nous extorquer les traces que nous laissons. Entre ce que nous abandonnons et ce qui nous est volé, il y a aussi tout l’espace de ce que nous consentons à laisser comme faits ou comme informations. Comme faits : je passe dans une rue qui dispose de caméras (c’est indiqué), je sais donc qu’on peut connaître le fait que j’y suis. Comme informations : quand je circule sur internet, à moins de disposer d’un outil qui me rend anonyme (un VPN), je sais que je laisse une trace, une adresse IP, où que j’aille. Comme informations : je donne ma taille de chemise au commerce en ligne sur lequel je viens d’acheter.

Bref. Une donnée est un hybride entre un fait et une information. Et ça se tient quelque part entre ce que j’abandonne, ce que je donne et ce qu’on me prend.

Eh bien voilà ! On n’a pas encore fait deux pas dans la donnée que c’est déjà le cirque. Et ce n’est pas fini ! Oh que non !

À quoi sert cette data, que fait-on avec de la data ? Vous allez rigoler : on fait une grande soupe. Car la donnée toute seule est totalement sans intérêt. Il faut un troupeau de données pour qu’on commence à y trouver de l’utilité. Un petit troupeau : c’est le small data. Un grand troupeau : le big data. Exemple de small data : l’évolution des notes de mes étudiants aux examens sur cinq ans. Exemple de big data : le comportement des publics sur Netflix, entre choix des genres, âges moyens, durées de visionnement, etc. Cela veut dire d’emblée que la donnée n’a de sens que si elle appartient à une bergerie : celle de la statistique. Une donnée prend de l’intérêt quand elle est utilisée de manière statistique.

Et c’est ici qu’on rigole : car, forcément, qui dit statistique dit moyenne. Qui dit moyenne dit fantôme – on sait bien que l’homme moyen n’existe pas. C’est le petit tour de magie qu’il faut bien connaître avant même de mettre le pied dans l’univers de la donnée : on va utiliser la donnée pour faire de la prestidigitation. Un tour de passe-passe qui va consister en ceci : faire croire que l’on est capable de reconstituer les individus laissant leurs données, alors qu’on ne parvient qu’à définir de grands ensembles vagues. Par conséquent, ce qu’on fait avec les données, c’est ceci : on dit qu’on va les utiliser pour « personnaliser » une offre, un service etc., alors qu’en réalité on ne fait que « probabiliser » le fait que monsieur ou madame fasse partie d’un ensemble d’individus ayant les mêmes comportements. On vise la personne et, en réalité, on s’adresse à une fiction, ce que le marketing appelle un « persona », c’est-à-dire un groupe d’individus au comportement semblable. La personnalisation, ce n’est pas s’adresser aux personnes, mais aux « personas » ou aux « look-alike » du marketing, c’est-à-dire à de grandes catégories dans lesquelles on fait rentrer les gens.

En voilà assez pour aujourd’hui : la donnée est un croisement entre un fait et une information ; une donnée est quelque chose entre data et capta ; une donnée ne prend sens que dans un ensemble statistique qui s’évertue à viser des individus alors qu’il ne vise que des ensembles moyens. Par nature la personnalisation par les données n’est qu’un tour de passe-passe statistique.

Est-ce pour autant inutile et dangereux ? Parfois, souvent, pas forcément : la récolte et le traitement des données sont devenus, pour des raisons que nous expliquerons dans la prochaine chronique, un « must have » et une révolution indispensable de notre société – et de nos métiers audiovisuels.

Emmanuel TOURPE

.
Lire les chroniques précédentes d’Emmanuel Tourpe :
Les deux plus beaux mots du moment : « Consentement » et « Nature »
La Modernité est morte. Vive la Modernité !
Du neuf dans le spectacle ! Le “transport narratif” : une idée puissante à creuser
Le bonheur est dans l’oubli – Quand le “woke” devient un crime contre l’esprit (2)
La mémoire ET l’oubli – Quand le “woke” devient un crime contre l’esprit (1)
Il faut sauver le soldat Raison (série complète téléchargeable en pdf)

.


Emmanuel Tourpe, 52 ans et père de 4 enfants, est le directeur de la transformation digitale et du data management à Arte. Il a occupé la direction de la programmation TV / numérique de la chaîne culturelle Arte et de la RTBF pendant presque vingt ans. Docteur habilité en philosophie, il est l’auteur d’un grand nombre d’ouvrages et d’articles scientifiques. Il est également un conférencier international. Il exerce également des fonctions de conseil en communication, management et stratégie. Il tient une chronique bimensuelle, qui n’engage que lui et en aucun cas les différentes institutions pour lesquelles il travaille, dans Profession Audio|Visuel depuis octobre 2020.