De plus en plus d’initiatives voient le jour pour renforcer la souveraineté québécoise en matière d’intelligence artificielle, assurer un meilleur contrôle des données et préserver les spécificités culturelles dans l’univers numérique. Mais cette ambition pourrait-elle se construire au détriment des créateurs ?« Quand Trump est arrivé, je me suis dit : il y a vraiment urgence d’agir. » Christian Gagné est professeur à l’Université Laval, où il dirige l’Institut intelligence et données. Depuis un peu plus d’un an, il réfléchit à l’importance de développer des capacités d’IA québécoises.L’enjeu est d’abord culturel. « Avoir des modèles qui comprennent le français québécois et notre culture, ça va nous permettre d’avoir des services adaptés à nos réalités. » Plus largement, sur les plans économique et stratégique, il s’agit de nous défaire de notre dépendance aux technologies américaines et de rapatrier données et expertises. « On ne peut pas éliminer les GAFAM de l’équation, mais on peut réduire la dépendance. » Propulser l’IA québécoise n’est pas impossible, soutient-il, notant les avancées marquées des approches ouvertes, capables de rivaliser avec les géants américains. « Ça prend de l’expertise, de la capacité de calcul, puis des données. »L’appétit de l’IA pour les donnéesChristian Gagné le reconnaît : il existe une vraie tension entre l’appétit croissant des modèles d’IA pour les données et le respect du droit d’auteur. « Le volume est plus important que la qualité », explique-t-il. Le nœud de la guerre : pour améliorer leurs modèles et les garder à jour, les développeurs d’IA — qui ont déjà exploité la plupart des corpus librement accessibles — sont à la recherche de « données fraîches ».« Ces données-là, porteuses de l’état de la culture, de l’actualité, sont essentielles pour maintenir la pertinence des IA », explique Christian Clavette, professeur de droit des technologies à l’Université de Moncton. « Mais, par défaut, ce sont des données qui sont souvent protégées. » Pour y accéder, il estime que les développeurs cherchent constamment à repousser les limites du droit d’auteur, et il donne comme exemple les nombreuses polémiques et poursuites qui ont secoué l’actualité de l’IA ces dernières années.Le casse-tête du droit d’auteur« Il faut pouvoir dédommager les détenteurs de droits d’auteur, mais la loi n’est pas adaptée actuellement », constate Christian Gagné. Il souligne le flou qui existe quant à l’utilisation des données pour l’entraînement des modèles. « Est-ce qu’il s’agit d’une copie ou d’une synthèse ? Faut-il un dédommagement complet ? » Il soutient que la situation se distingue des balises jusque-là établies. « Si on fait de la reproduction d’œuvres, il faut payer l’auteur. Là, ça s’apparente plutôt à un livre dans une bibliothèque qui sera lu par plusieurs » Selon lui, l’entraînement des modèles d’IA n’extrait pas grand-chose de chaque œuvre, il se fonde plutôt sur la force statistique du corpus complet.« Ce qui serait intéressant, ce serait de construire des jeux de données pour l’IA en bien commun », explique Christian Gagné. Il mentionne qu’une rétribution pour les détenteurs de droits pour l’entraînement des modèles est souhaitable, même s’il reconnaît qu’il ne pourra pas s’agir de « grand-chose ». « Si on veut des acteurs qui se comportent de façon plus éthique et des outils d’IA qui comprennent notre culture et qui peuvent la mettre en valeur, il faut avoir accès à ces données-là, résume-t-il néanmoins. Je le vois comme un vrai projet de société, comme les grands projets nationaux qui ont marqué notre histoire », explique-t-il, faisant la comparaison avec la nationalisation de l’hydroélectricité. « On s’est organisés, on s’est dotés d’une capacité structurante en se basant sur notre bien public. Là, on peut s’appuyer sur notre bien culturel, puis construire une vraie capacité pour le développement économique. »« C’est une très bonne métaphore, dit Arezki Raab, directeur général adjoint de Copibec. Parce que nos rivières sont effectivement un bien commun, mais il y a un cadre légal très clair qui encadre leur exploitation. En matière de droits d’auteur, le cadre existe déjà, il faut juste le respecter. » Selon lui, tout comme les entreprises d’IA paient l’électricité qu’elles utilisent comme matière première, elles devraient aussi payer les données culturelles à leur juste valeur. « Pourquoi pense-t-on que le contenu qui est créé par l’humain doit être une exception ? Aujourd’hui, aucun modèle d’IA ne peut fonctionner s’il n’a pas cette matière première. »Stéphanie Hénault, directrice des affaires juridiques à l’Association nationale des éditeurs de livres, se montre encore plus critique. « La comparaison ne tient pas, parce que le contenu créatif ne se renouvelle pas par magie comme la pluie qui tombe. » Selon elle, les secteurs culturels doivent impérativement être protégés pour pouvoir continuer à subsister. « Si on utilisait le contenu de tout le monde sans distinction, on couperait l’herbe sous le pied des créateurs. Ce n’est pas parce que des gestes illégaux ont été posés ailleurs qu’il faut les imiter pour être concurrentiels. »