Financé par l'Union européenne, le projet « European Language Equality » (ELE) est un consortium de 52 partenaires dont l'objectif est de développer un agenda et une feuille de route pour atteindre une égalité numérique totale des langues en Europe d'ici 2030.
Le Luxembourg Institute of Science and Technology (LIST) y intervient comme seul représentant du Luxembourg et de la langue luxembourgeoise.
Dimitra Anastasiou, chercheuse en data science & analytics au sein du département IT for Innovations Services est responsable de ce projet au LIST. « J’ai collecté des métadonnées sur tout ce qui a trait au luxembourgeois, c'est-à-dire des ressources de données, des documents bilingues ou monolingues, des dictionnaires, des glossaires, ainsi que tous les outils et toutes les applications qui font la promotion du luxembourgeois ou qui sont écrits en luxembourgeois », explique-t-elle sur son rôle au sein du projet ELE.
En janvier, Dimitra a soumis un rapport sur ces métadonnées collectées comprenant l’ensemble du paysage de la technologie linguistique pour le luxembourgeois, dont notamment les outils et ressources disponibles ainsi que les projets, initiatives et parties prenantes. Ce rapport a aussi été envoyé à l'Université du Luxembourg qui étudie la langue luxembourgeoise, au Commissaire à la langue luxembourgeoise Marc Barthelemy, mais aussi au « Zenter fir d'Lëtzebuerger Sprooch (ZLS) », responsable des questions relatives à l'orthographe luxembourgeoise dont le rapport fait état fréquemment.
Promouvoir le luxembourgeois n'est cependant pas aussi facile que de promouvoir les autres langues officielles du pays, à savoir le français et l'allemand. « C’est une tâche difficile car le luxembourgeois est une langue qui ne dispose pas de ressources suffisantes. Il y a donc beaucoup de données manquantes. Je dirais que l’explication derrière ce constat est que le Luxembourg est particulièrement multilingue et multinational avec un pourcentage d'étrangers qui atteint presque 50%. Tout le monde parle français, allemand ou anglais, donc les gens communiquent dans une autre langue que le luxembourgeois parce qu'ils n'en ont pas besoin », souligne Dimitra.
Bien que la langue nationale du Grand-Duché soit le luxembourgeois, le français est en effet la langue législative du pays. De plus, le français, l'allemand et le luxembourgeois sont les trois langues administratives et judiciaires.
« La deuxième raison pour laquelle cela est difficile est que le luxembourgeois n’est actuellement pas une langue officielle de l'Union européenne (UE). Les documents officiels de l'UE ne sont donc pas traduits en luxembourgeois », ajoute Dimitra.
Cependant, si le luxembourgeois obtient un jour le statut de langue officielle de l'UE, cela aura un impact considérable sur les technologies linguistiques. Une très grande quantité de données sera en effet créée. « Tous les sites internet de l'UE seraient alors en luxembourgeois et, grâce à l'exploration des données, un grand nombre de données seraient donc traitées. Cela implique néanmoins un investissement élevé, tant en termes de coût que de temps, pour traduire tous les documents officiels de l'UE en luxembourgeois - ce qui devrait être pris en compte par de nombreuses parties prenantes », explique Dimitra.
L'objectif principal est de parvenir à l'égalité numérique pour la majorité des langues européennes, qui comprennent elles-mêmes de nombreuses variantes. En d’autres termes, les langues disposant de peu de ressources, comme le luxembourgeois, devraient donc être mieux représentées sur internet et au sein du gouvernement.
Le projet ELE est une réponse directe à la résolution « L'égalité des langues à l'ère numérique », qui a été adoptée par le Parlement européen lors d'un vote en septembre 2018. Il prend en compte plus de 70 langues et a reçu un financement de l'Union européenne.
L'implication de la langue luxembourgeois au sein du projet ELE soulève donc une question : Pourrait-il s'agir d'une étape vers l’accès du luxembourgeois au rang de langue officielle de l'UE ? « Absolument, c'est une vision à long terme des institutions, des organisations et du gouvernement de promouvoir le luxembourgeois et de l'avoir sous une forme numérique bien représentée et nous avons vu l'arrivée récente de projets de technologie linguistique, comme le Chatbot. Je suis donc très optimiste quant à l'avenir, car un projet en amène un autre. J'aimerais continuer à travailler sur le traitement du langage naturel, car je considère qu'il s'agit d'un domaine très prometteur dans de nombreuses disciplines telles que l'informatique biologique et sanitaire, la banque, le divertissement et la communication », répond Dimitra.
Mais travailler avec une langue aussi petite représente un défi de taille. Alors qu'il est relativement facile de soutenir le français, l'allemand ou l'espagnol - car les ressources sont abondantes dans tous les domaines - le luxembourgeois manque cruellement de ressources et, dans de nombreux cas, tout doit être créé de toutes pièces. Comme le luxembourgeois écrit n'est généralement pas enseigné en continu dans les écoles et qu'il s'agit principalement d'une langue orale, l'orthographe peut ne pas être cohérente dans certains cas, d'où la consultation du LIST avec ZLS.
Le projet ELE se poursuivra jusqu'en juin 2023 avec un possible suivi par la suite.
Le LIST est également un Centre de Compétence National dans un projet similaire au projet ELE : la Grille européenne des langues (ELG – de l’anglais : European Language Grid), dont l'objectif est de créer une plateforme technologique linguistique puissante et évolutive utilisant une architecture en grille avec des milliers de jeux de données et des centaines de services technologiques linguistiques.