L’IEML, le langage universel du futur.

Pierre Levy nous invite à une nouvelle façon de gérer l’information, au delà des barrières linguistiques

Par Virginie Guignard Legros , le 04 mars 2019 | Dernière mise à jour de l’article le 04 avril 2019.

La façon de rechercher, de classer les informations constitue un changement de paradigme à la fois dans les technologies sur le Web, comme celle de l’intelligence artificielle, et dans la philosophie d’approche de la gestion de ces mêmes informations.

L’IEML (Information Economy Meta-Language) a été conçu par Pierre Levy, le père des premières études en intelligence collectives, qu’il a transposé aux domaines des données en utisant un langage mathématique associé aux langages naturels.

“Né en Tunisie en 1956, il a étudié en France la sociologie, l’histoire, la philosophie, l’histoire des sciences et les sciences de la cognition…  En 1998, il s’est établi au Canada, où de 2002 à 2016, il a dirigé la Chaire de Recherche du Canada en Intelligence Collective à l’Université d’Ottawa. En reconnaissance de son enseignement et de ses recherches il a été élu membre de la Société Royale du Canada en 2004. Il est aujourd’hui professeur à l’Université de Montréal où il participe activement aux activités du CRIHN (Centre de recherche inter- universitaire sur les humanités numériques).”

Grâce à des rencontres comme celle de Candide Kemmler et à une petite équipe composée de Louis van Beurden comme concepteur et programmateur, d’Eric Waldman, comme programmateur de l’interface ainsi que des ingénieurs Hadrien Ti- teux et Zacharia Soliman. Ils ont développé un logiciel prototype open source appelé Intlekt afin de faire comprendre les mécanismes des concepts de l’IEML.

Qu’est-ce que l’IEML (Information Economy MetaLanguage) ?

C’est un langage articifiel qui intègre les possibilités des technologies à transcender les langues et sans doute aussi une nouvelle science du management des savoirs. Dans l’histoire, chaque évolution dans ce domaine à eu un effet sur les vies et économies à tous les niveaux de la société.

Il y eut d’abord eu la création des symboles avec l’écriture, ensuite leur structuration avec l’alphabet, au 16ème siècle la multiplication des symboles avec l’imprimerie, au 20ème siècle l’industrialisation de cette multiplication par les médias électroniques.

Le 21ème siècle quand à lui est l’ère de la manipulation des symboles à la fois par des programmes d’intelligence artificielle et en même temps par leur affichage sur des millions de supports en même temps.

Par le biais de la structuration mathématique du langage naturel, l’IEML propose de faire le lien entre nos cerveaux et la connaissance. Ainsi celle-ci passe à un niveau supérieur tout en s’appuyant sur l’évolution antérieure de la technologie.

C’est aujourd’hui  l’aboutissement d’un travail de 20 ans que vous pourrez lire dans ce dernier texte de Pierre Levy qui conclut sa trilogie par un livre blanc :

  • La Sphère Sémantique I. Computation, cognition, économie de l’information (2011) qui expose les considérations scientifiques et philosophiques ayant mené à l’invention du métalangage.
  • La Sphère Sémantique II, La Grammaire d’IEML, publié en 2015, première description formelle d’IEML qui inclut une preuve de calculabilité des relations sémantiques internes au métalangage.
  • Le livre blanc d’IEML peut être considéré comme le troisième et dernier volume de la trilogie de La Sphère Sémantique, et comme le rapport final de la Chaire de Recherche du Canada en Intelligence Collective de l’Université d’Ottawa.

À quoi sert l’IEML ?

L’IEML sert à optimiser le fonctionnement des ordinateurs, des recherches, classements sur le web et à enrichir la façon dont nous abordons les savoirs. Notre façon de faire est aujourd’hui séquentielle. Si on observe la recherche sur internet, elle se fait actuellement principalement sur la base des mots, des hashtags et des mots clefs. Demain, celle-ci se fera selon de multiples dimensions.

Par exemple, si vous cherchez le mot « chat » sur internet, votre recherche détaillera tous les textes et documents rangés par le mot, le mot clef ou le hashtag : « chat ». Les textes parlant de « chat » dans lesquels il n’y a ni le mot « chat » ou le mot clef ou les hashtag associés au chat, n’apparaîtront pas dans votre recherche. Et, en particulier, ceux de sens et de concepts complexes. L’IEML permet en langage naturel (même si sa technologie sous-jacente est de type mathématique) de trouver tous les univers complexes en relation avec le chat et non plus seulement ceux associés au simple mot chat. Cette innovation fait faire un bond technologique mais aussi sémantique par un enrichissement de la compréhension des symboles autour des concepts des connaissances.

“En IEML, les expressions syntaxiquement valides – qu’elles soient des mots, des phrases ou des textes – sont appelées des USLs (Uniform Semantic Locators) et elles fonctionnent comme des adresses conceptuelles. De même que les URLs adressent les données sur le Web, les USLs adressent et interconnectent les concepts”.

La grande innovation est d’élargir la recherche par les mots à celle des concepts en utilisant un nouvel outil internet dans nos moteurs de recherche appelé des USLs. L’IEML est aussi un langage universel qui va pouvoir faire le lien entre les concepts quelques soient leurs langues d’origine.

“L’usage contemporain des mots-clés et des hashtags en langues naturelles est utile, mais la catégorisation à laquelle il aboutit est trop simple. Le principal défaut de ces mots-clés vient de ce que ce sont de simples séquences de caractères, au lieu d’être de véritables codes sémantiques ou conceptuels.

  • Par exemple, le concept d’«éducation» est représenté par des hashtags séparés dans des langues naturelles différentes: #education en anglais et #ausbildung en allemand. Il n’y a pas de hashtag universel pour « l’édu- cation » qui recouvre l’usage de ce concept dans des langues différentes.
  • De nouveau, le concept pour les « technologies pour l’éducation » est représenté par différents hashtags dans la même langue comme #techinedu et #edtech en anglais.
  • Des concepts totalement différents utilisent le même hashtag: #GPL sur Twitter signifie General Public Licence mais aussi Global Player League ou encore Gas Pétrole Liquéfié, bien que ce soit trois choses complètement distinctes.
  • Des concepts sémantiquement liés ne sont pas connectés: le hashtag pour #éducation ne mène pas à d’autres hashtags comme #enseignants ou #étudiants, et ainsi de suite”.

Là, où les mots, hashtags, mots clefs sont limités car définis et juste utilisés tels des données passives, L’IEML est lui vivant et interactif à la fois avec les données et l’homme. Il  solutionne ces problèmes grâce aux USLs (des balises sémantiques) qui, elles, sont actives car elles s’auto-traduisent en langues naturelles et s’inter-connectent de façon logique au sens, ce qui permet d’affiner les concepts, les champs de recherche et elles sont auto-apprenantes en compilant les recherches, ce qui va enrichir le grand dictionnaire des savoirs, les listes de recherche et la cartographie des savoirs selon de multiples dimensions.

Comprendre l’IEML n’est pas encore facile, car la façon de travailler la connaissance et l’information est radicalement différente. C’est pourquoi en 2019, Pierre Levy lance Intlekt, une application pour écrire en IEML et pour s’exercer à l’enrichissement des mots, des bases de données, le tout en mode collaboratif.

Sa modélisation est de type décentralisée et  est visible sur Gitup à l’adresse suivante : https://iemldev.github.io/ieml-dictionary/

“Pour chacun des objets de la base de donnée, il y a une page web où l’on peut trouver :

  • les traductions de l’objet en langues naturelles,
  • ses propriétés (classe grammaticale, type, taille, couche . . .),
  • ses commentaires,
  • ses relations sémantiques vers les autres objets de la base de données et
  • la structure de table si l’objet est un paradigme”.

C’est aussi une invitation à créer des équipes universitaires ou professionnelles souhaitant faire des développements avec l’IEML :

“Dans un futur proche, nous aimerions rassembler et renforcer une communauté d’utilisateurs innovants, de développeurs open source, d’ingénieurs et d’investisseurs responsables”.

Avec l’IEML, nous entrons dans la science des données sémantiques.

Illustration :  Pixabay Annca

Sources :

Pierre Levy – Récentes publications en français
https://pierrelevyblog.com/2019/02/06/quelques-recentes-publications-en-francais

Intlekt Editor – https://intlekt.io/

Le livre blanc d’IEML – https://pierrelevyblog.files.wordpress.com/2019/03/0-00-ieml-manifesto-2019-fr.pdf

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *