Le développement de l'information sur internet conduit-il au règne du copié-collé, au détriment de l'information de qualité ? Peut-on inventer de nouveaux modèles économiques pour les médias permettant de tirer le meilleur parti des nouvelles technologies ?
Ce travail de recherche inédit tente d'apporter de nouvelles réponses à ces questions, en conjuguant les outils du « big data », du « machine learning » et de l'économie. Il se base sur la construction et l'analyse d'une base de données unique en son genre : l'intégralité du contenu produit en ligne par les médias d'information en France sur une année (2013), qu'il s'agisse de la presse écrite, de la télévision, de la radio, des pure internet players ou encore de l'AFP.
Nous combinons ainsi pour la première fois plusieurs millions de documents avec d'une part les caractéristiques humaines et économiques des diff érents médias - en particulier la taille de leur rédaction - et d'autre part avec des données d'audience des diff érents sites, permettant d'analyser dans quelle mesure les citoyens adaptent leur consommation sur internet à l'originalité des contenus produits.
En appliquant notre algorithme de détection de copie, nous montrons que, dans le cas des actualités chaudes, 64 % de l'information publiée en ligne correspond à du copié- collé pur et simple (sans même prendre en compte les reformulations), un niveau d'homogénéité insoupçonné. Les copies ainsi détectées vont souvent au-delà de l'exception de « courte citation » autorisée par la loi et omettent le plus souvent les procédures réglementaires de citations et de crédits.
Or le recours croissant au copié-collé combiné à une vitesse de propagation extrêmement élevée de l'information en ligne - un quart des événements se propagent en moins de 4 minutes - risque de tuer à termes les incitations des médias à produire de l'information originale. Nous montrons ainsi que les médias n'arrivent plus à monétiser cette information si coûteuse à produire.
Au-delà de ces constats, le livre souligne et quantifi e les risques pour l'information et la démocratie associés à l'accélération de la baisse de la taille des rédactions. Il passe en revue les diff érentes solutions : une application plus stricte du droit d'auteur sur internet ; la mise en place de murs payants ; la syndication de contenu et la mutualisation des coûts de production de l'information ; le soutien public transmedia à la production d'information ;
Ou encore de nouvelles formes juridiques pour les médias.
Surtout, il souligne la nécessité de repenser entièrement les systèmes de régulation existants des médias. Cette régulation se fait aujourd'hui par support ; elle doit être adoptée au XXIe siècle, c'est-à-dire transmedia. Internet est une chance unique de mieux informer les citoyens ; n'en faisons pas le tombeau de l'information.
Professeure d'économie à Sciences Po Paris, Julia Cagé est l'auteure de Sauver les médias (2015), Le Prix de la démocratie (2018) et d'une Histoire du conflit politique (avec Thomas Piketty, 2023).