Translittération de l’arabe pour le tchat

26/05/2021

Je montrais il y a quelques jours à mon voisin mon avancée sur le projet Matahah, pour lequel je prépare un site spécimen et revoit quelque peu le caractère. D’origine marocaine, il pouvait en effet m’aider sur quelques points de construction de lettres et de compositions destinées au site. Au cours de la discussion il m’a parlé du dialecte qu’il utilisait pour discuter avec son smartphone : il s’agissait d’une langue liée à l’arabe, mais écrite en mélangeant l’alphabet latin et des chiffres indo-arabes. En effet, d’après ses dires, cette façon d’écrire est plus simple et plus rapide, en particulier pour l’écriture sur smartphone.

Arabe marocain et culture francophone

De ce que m’a expliqué mon voisin, l’arabe marocain est assez différent de l’arabe standard, dit aussi arabe classique. Si une personne parlant l’arabe marocain peut comprendre un locuteur de l’arabe classique, la réciproque est moins évidente. L’arabe marocain est en effet une réunion de plusieurs dialectes des populations arabophones présentes sur son territoire, donc une sorte de lingua franca pour les diverses population du pays.

Carte linguistique de la zone du Maroc
Carte linguistique de la zone du Maroc, wikimedia.

Le Maroc est fortement influencé par la francophonie, par l’historie coloniale, l’immigration et la relative proximité avec la France. Les personnes, dans ce contexte, utilisent à loisir le français ou l’arabe marocain (aussi appelé darija, الدارجة), voire les deux en même temps, et finalement assez peu l’arabe classique pour la communication vernaculaire.

Translittération de l’arabe

Avec ce socle posé vient une problématique intéressante : mon voisin, lorsqu’il communique avec ses amis, sa famille, utilise son téléphone et les divers système de messagerie instantanée. Jusque là rien d’étonnant, mais du fait de sa spécificité culturelle, son téléphone est plutôt configuré pour un européen, avec un clavier présentant l’alphabet latin, et écrivant de gauche à droite, là où l’arabe s’écrit de la droite vers la gauche.

Comment donc parler en utilisant l’alphabet arabe ? On pourrait installer un second clavier à son téléphone, mais ça ne serait pas très pratique pour communiquer aisément, rapidement, à la fois en français et en arabe et comment gérer le problème de sens de l’écriture opposé de ces deux systèmes ? La solution trouvée par les marocains a donc été de translittérer les caractères arabes utiles au darija en caractères latins et en chiffres indo-arabes pour en faire un système efficace et facile à mettre en oeuvre, appelé arabi (عربي) ou arabizi (عربيزي), de la contraction de arabic et easy (arabe facile). Bien qu’il existe des normes de translittération de l’arabe officielles (la norme DIN 31635 de 1982 entre autres), il s’agit dans ce cas d’une formation émanent directement de la communauté qui l’utilise.

Ce système d’écriture met en place plusieurs règles : Chaque lettre arabe est substituée à une lettre ou un chiffre, soit par convention entre les locuteurs, soit par similarité de forme entre la lettre arabe et le glyphe de transcription. Par exemple la lettre ‹ء› (Hamza) est translittérée en ‹2› ou en ‹a›, par symétrie de forme ou par similarité sonore ; ‹ع› (Ayn), est lui translittéré par un ‹3›. Chaque caractère a un son unique, non influencé par l’enchaînement des autres caractères. Autrement dit on ne fait pas de liaison ou de modification du son selon son contexte dans la phrase. Enfin on écrit dans le sens inverse de l’arabe : au lieu d’écrire de droite à gauche, on écrit de gauche à droite, tout en maintenant l’ordre des sons des mots d’origine.

Translittération de l’arabe
Translittération de l’arabe, wikimedia.

Do you 5P34K L33T ?

La forme que prend l’arabizi fait tout de suite écho au Leet Speak, un forme d’écriture issue du web qui avait pour but de chiffrer l’écriture (de langues utilisant l’alphabet latin) en replaçant certaines lettres par des chiffres (L33T 5P34K), pour sa forme la plus simple, ou en replaçant des lettres par un ou plusieurs signes non alphabétiques, pour les versions les plus complexes (|_ 33¯|¯ _/¯|°3/-|<). Là ou l’arabizi est utilisé pour faciliter la transmission d’information et l’accès à tous aux moyens de communications actuels, le Leet Speak était plutôt fait pour lier une communauté en rendant l’accès aux personnes extérieures plus complexe : Leet Speak vient de la déformation de Elite Speak (langage d’élite). Certains sont largement contre l’utilisation du langage SMS, qui soit-disant réduirait le niveau de français, et on pourrait rapprocher formellement ce système d’écriture à celui de l’arabizi. Mais dire qu’il s’agit d’un appauvrissement de la langue me semble faux (d’ailleurs regardez cette vidéo de Monté) : au contraire on a créé un système qui permet de contourner les limitations d’un système. À ce titre c’est plutôt un enrichissement et un renouvellement de la langue. Pour le langage SMS, il s’agissait d’écrire un message avec le moins de caractères possible, car à l’époque chaque message était facturé, et le nombre de caractère par message était limité à qu’un tweet. Ns navion pa le choi, c t kom sa. Il en est de même avec le franglais, qui, au grand dam des défenseurs acharnés de la «bonne langue», est très utile lorsqu’il s’agit de vocabulaire qui n’a pas encore eu de traduction française. Je pense en particulier aux mots liés au web ou aux nouveau canaux de communication, d’information et de divertissement, et qui ont mis un certain temps à trouver de formes françaises (spoil → divulgacher, spam → pourriel, etc.), ou qui n’ont pas réellement d’équivalent aujourd’hui (une story Instagram, binge watcher un série, etc.). Aujourd’hui écrire en langage SMS devient inutile et est même mal perçu, à raison : puisque les limitations précédentes ne sont plus d’actualité, ce système est devenu obsolète.

Captures d’écran de deux conversations bilingues arabizi-français fournies par mon voisin.

Pour les marocains cependant l’arabizi semble rester essentiel pour communiquer facilement en utilisant une seule base, l’alphabet latin (et les chiffres indo-arabes), qui permet d’écrire en continu plusieurs langues et dialectes à la fois. C’est somme toute un système très rationnel.


  1. «Arabe marocain», wikipedia (source)
  2. «Alphabet de tchat arabe», wikipedia (source)
  3. «Qu'est-ce que l’easy Arabic ou arabizi ?», Joumana Barkoudah, Institut du monde Arabe (source)
  4. «Arabizi, le printemps linguistique», Le temps, 9 octobre 2012 (source)
  5. «Lumière sur : l’arabizi», Kawa news, 17 décembre 2019 (source)
  6. «Communication écrite», Shane Hartford, TradOline (blog), 7 décembre 2020 (source)
  7. «Transcription et translittération», wikipedia (source)
  8. Transliteration of Arabic, Thomas T. Pedersen, http://transliteration.eki.ee/, 2008.
  9. «Leet speak», wikipedia (source)
  10. «Langage SMS», wikipedia (source)

[Ehmay Ghee Chah] A Universal Second Language, Elmer Joseph Hankes, 1992

À propos de l’auteur

Elmer Joseph Hankes (1913-2012), d’après le peu d’informations que j’ai pu trouvé, arrive à Minneapolis (Minnesota, USA) dans les années 1940 comme ingénieur mécanique. Il dépose divers brevets dans le domaine des machines permettant la correction automatiques des tests standardisés. Ce qui nous intéresse plus particulièrement ici est son travail d’invention d’une langue secondaire et universelle, qu’il nomme EhmayGheeChah et qui signifie « langue secondaire », tout un programme donc, qui se déploie dans une édition préliminaire éditée en 1992 : EhmayGheeChah A Universal Second Language.

Un livre sorti des collections

Cette édition préliminaire a un format assez commun de 160×233 mm pour 174 pages, avec une couverture rigide en papier gaufré noir, avec son titre encré sur le dos et deux papiers imprimés et collés pour faire office de 1re et 4e de couverture. L’édition présentée ici provient de la Hillsboro High Library (Nashville, USA), sous la référence 499.99 HAN n°222827. Cet ouvrage a été sorti des collections à une date non précisée comme l'indiquent les deux mentions « withdrawn » tamponnés sur la première page et sur la pochette accueillant la fiche d’emprunt. Je m’avancerai à dire que cette sortie du catalogue est possiblement due au fait que le livre n’a apparemment jamais été emprunté, puisque la carte d’emprunt est vierge et semble de la même époque que la sortie du livre.

La courverture de l’ouvrage avec le papier imprimé collé sur la couverture

Une édition pour la recherche

C’est précisé dès le titre intérieur, cette édition préliminaire n’est destinée qu’à la recherche, puisqu’une première édition définitive était prévue pour le quatrième semestre de l’année 1993, édition définitive dont je n’ai pas trouvé trace lors de mes recherches. Le livre est découpé en 5 parties matérialisées par une marque visible sur sa tranche. On a dans un premier temps une présentation générale du projet et des principes de construction de ce système de communication. Viennent ensuite des tableaux de construction de mots suivi par deux parties de vocabulaire général par thèmes puis par ordre alphabétique. On finit par des appendices complétant le projet et ses futurs développements. Cette édition devait à l’origine être accompagnée d’un cassette audio permettant d’écouter Elmer Hankes parler dans sa langue, pour nous permettre d’en apprendre la prononciation, mais je n’ai que le livre. En somme cet ensemble était à la fois la présentation d’un projet et un guide d’apprentissage de l’EhmayGheeChah.

Structure de la langue

La proposition de Hankes est basée sur un construction proche des hiéroglyphes égyptiens en ce qui concerne les chiffres : un signe représente à la fois un mot (un chiffre) et a également une valeur de phonème. Les chiffres sont un calque des chiffres indo-arabes, avec une nouvelle prononciation. Les lettres sont quand à elles des signes inventés, construites sur un principe monocaméral modulaire assez rigide : chaque lettre possède une barre verticale à laquelle peuvent s’ajouter un ou plusieurs traits horizontaux sur le haut, le milieu ou le bas de cette barre, à sa gauche ou sa droite. Des points pouvant se placer sur quatre positions définies (2 à gauche, 2 à droite) viennent compléter la construction. D’autres signes divers (ponctuation, notes tonales, etc.) terminent l’ensemble. Les barres horizontales ne peuvent se placer que d’un côté à la fois, les 20 voyelles ont des barres à droites et les 20 consonnes ont des barres à gauche. On peut rapprocher cette construction avec le système numéraire cistercien, dont vous pourrez retrouver une vidéo proposée récemment par Benjamin Brillaud. Les mots de base sont composés de trois syllabes, les deux premières permettant d’identifier la thématique linguistique du mot, par exemple les actions, les mathématiques, les couleurs, etc. La construction est donc emprunte d’une rigueur toute mathématique, ce qui n’a rien d’étonnant avec le passif d’ingénieur de l’auteur, le fait qu’il cherche également par ce langage à faciliter l’OCR, la communication homme-machine et l’idée que l’on se fait d’une langue universelle, qui doit être basée sur des principes éminemment logiques.

pp.4-5 : la structure de la langue, son alphabet et ses divers signes.
pp.6-7 : les signes étrangers et le système de dénombrement.
pp.68-69 : une double page du vocabulaire préliminaire.

L’utopie du langage universel

Difficile de ne pas penser à cette utopie plutôt ancienne de la création d’une langue de zéro, construite sur des bases logiques qui ferait d’elle une langue secondaire universelle (on parle alors de pasigraphie), voire pour les plus ambitieux une langue mondiale unique venant reconnecter tous les Hommes. On retourne au mythe de Babel. Mis à part l’Esperanto, qui connait un certain succès, force est de constater que cette utopie ne s’est jamais vraiment matérialisée, les diverses propositions de langues universelles restant pour la plupart des curiosités ou des expérimentation de fiction, telle que le Rapid Language que le collectif Normals développe et qui unifie les humains et l’internet (appelé chez eux le stream). Au final c’est l’anglais qui s’est peu à peu imposé comme une langue internationale, à défaut d’être à proprement parler une langue universelle. Elmer Hankes est sur ce point assez pragmatique, il reconnait la difficulté de ce travail, mais reste néanmoins extrêmement confiant sur sa réussite puisqu’il a fondé dans le même temps la Fondation Hankes pour supporter l’EhmayGheeChah, que le design des caractères et déposée par brevet et que cette édition préliminaire a été éditée à 10 000 exemplaires, ce qui me semble un peu excessif pour ce type de projet dans les années 1990. Il revient plusieurs fois sur les progrès dont pourraient bénéficier la société grâce à son language, qu’il qualifie lui-même de « poli », qui permettrait d’unifier les hommes, et c’est pourquoi les quatre premiers mots créés sont please, excuse me, thanks et welcome.

Il y a une forme d’ambiguïté dans ce projet basé sur une volonté louable : un goût pour la liaison et la paix entre les Hommes. Pourtant c’est un projet breveté, conçu, diffusé et développé par un auteur omnipotent qui ne semble pas avoir pris conscience de toutes les tentatives similaires précédentes qui se sont conclues par des échecs plus ou moins fracassant. Le peu d’informations que j’ai pu glané ne permettent pas réellement de saisir l’impact de ce travail, s’il a eu, au moins pendant un court moment, une certaine reconnaissance publique et s’il a été investi par des organisations, comme cela avait été le cas avec la sémantographie de C. K. Bliss. Trente ans après, l’EhmayGheeChah semble n’avoir été qu’une étoile filante dans le paysage des pasigraphies.


  1. Elmer J. Hankes, Ehmay Ghee Chah – A Universal Second Language – preliminary edition, The Hankes Foundation, Minneapolis, 1992
  2. «Elmer Joseph Hanks», startribune.com source
  3. «Elmer Joseph Hanks», prabook.com source
  4. Arika Okrent, In the Land of Invented Languages, Spiegel & Grau, New-York, 2010
  5. «Système cistercien de notation numérique», wikipedia.org source
  6. «Rapid Language», Normals, normalfutu.re source & source

Histoire universelle des chiffres, Georges Ifrah, 1981.

À propos de l’auteur

Georges Ifrah (1947-2019), fut tout d’abord professeur de mathématiques. Après qu’un de ses élèves lui demanda d’où venait les chiffres, il fut pris au dépourvu : il n’avait aucune idée d’où venait les chiffres. Il décida donc d’arrêter son travail pour se lancer corps et âme dans la recherche sur l’histoire des chiffres, afin de pouvoir répondre à toutes ces questions naïves mais néanmoins importantes. Il voyagea alors aux quatre coins du monde pour étudier les sources historiques et questionner les spécialistes du domaine. Le fruit de ce travail fut publié en 1981 par les éditions Seghers sous un titre qui donne le ton : Histoire universelle des chiffres – Lorsque les nombres racontent les hommes.

Un (immense) ouvrage

L’édition que je possède (l’édition originale publiée chez Seghers) est d’un format similaire à celui d’un dictionnaire : 175×242 mm pour 570 pages, en corps 10. Détail étonnant, le livre est étonnamment léger comparé à d’autres livres d’un gabarit similaire. Découvert auprès de vendeurs de livres d’occasion, ce livre, avec sa couverture brillante tri-chrome noir, argent et or, attire clairement l’œil.

La courverture de l’ouvrage en trichromie noir–or–argent
La courverture de l’ouvrage en trichromie noir–or–argent

Respectant scrupuleusement son titre, l’ouvrage revient, semble-t-il, de manière exhaustive sur l’histoire de chiffres et de la numération, de l’invention du concept même de numération jusqu’à l’aboutissement de la numérotation actuelle basée sur les chiffres indo-arabe (les chiffres «arabes» nous ont effectivement été transmis par les arabes, mais ils les ont hérités des indiens). On apprend entre autres quel est le point commun entre des tas de petits cailloux, le dénombrement, les caillots sanguins ou encore pourquoi nous comptons le temps en base 60, faisons des maths en base 10 mais en gardant, du moins en France, «quatre-vingts» pour 80, et pas «octante», pourtant plus en accord avec le système. L’ouvrage fait évidemment le tour de l’ensemble des systèmes de dénombrement ainsi que les systèmes d’écriture associés : toutes les cultures – actuelles ou disparues – y passent et c’est extrêmement enrichissant de découvrir des cultures par ce biais.
Jusqu’au-boutiste, Ifrah a lui-même réalisé l’ensemble des schémas et illustrations présents dans l’ouvrage, d’après des modèles existant ou pour mettre en image son propos. Un énorme travail, puisque l’on trouve des schémas, documents iconographiques, ou tableaux de données toutes les deux pages au minimum.

pp.38-39 : dénombrer avec ses mains.
pp.38-39 : dénombrer avec ses mains.
pp.132-133 : utilisation du boulier en Chine.
pp.132-133 : utilisation du boulier en Chine.
pp.266-267 : reproduction d’une stèle gravée et une page de titre
pp.266-267 : reproduction d’une stèle gravée et une page de titre

Avec ses 600 pages, à peu de choses près, cet ouvrage est tout bonnement impressionnant tant il foisonne de connaissances sur les chiffres au sens large. Au point qu’honnêtement il est difficile d’en arriver au bout tant le livre devient parfois une liste de références mises bout à bout. On ne peut clairement pas critiquer Georges Ifrah, réellement passionné (probablement de manière compulsive) au point de tout écrire et décrire dans cet ouvrage. En vérité, l’ouvrage est tellement dense qu’il est difficile de pouvoir assimiler son contenu, pourtant extrêmement éclairant sur l’évolution des cultures humaines et de leurs développements. Un conseil donc : il vaut mieux lire cet ouvrage par petits morceaux sous peine de surchauffer, ce qui fut mon cas.
Malgré cette difficulté d’accès, le succès fut au rendez-vous pour cet auteur puisque que son ouvrage a été plusieurs fois ré-édité et traduit dans de nombreuses langues. Avide de savoir, Ifrah va alors écrire un second volume, sorti en 1994, orienté sur l’essor de l’informatique et son utilisation des chiffres. Son travail aurait été utilisé par une génération de professeurs voulant parfaire leurs connaissances et les transmettre à leurs élèves. Le travail d’Ifrah a également été cité dans l’article «100 or so Books that chape a Century of Science», paru dans la revue American Scientist en 1999.

La communauté scientifique en émoi

Tout ceci est cependant trop beau pour être vrai. Bien qu’il est indéniable que l’intérêt d’Ifrah pour la question des chiffres est sincère, et que le succès public fut au rendez-vous, de nombreuses critiques se sont élevées contre son travail : des experts français ont pointés les nombreuses approximations de l’ouvrage, les erreurs de datation, voire des allégations fantasques basées sur aucune données scientifiques, quand celles-ci ne sont pas purement et simplement ignorées ou déformées par l’auteur, même s’il est difficile de dire s’ils s’agit d’oublis de bonne fois ou d’écartements conscients. Malgré ces critiques nombreuses, il semblerait qu’Ifrah n’ai jamais corrigé son ouvrage, alors même que les ré-éditions successives aurait pu le permettre. Joseph Dauben, historien des sciences, a rédigé deux articles (en anglais) publié dans le magazine de la Société américaine de mathématiques compilant les principales critiques émises à l’encontre des deux volumes d’Histoire universelle des chiffres et de son auteur.

Qu’en dire alors ? Si le sujet des signes vous intéresse tout comme moi, et plus particulièrement celui des chiffres et de leur histoire, il est probable que vous ayez envie de vous procurer cet ouvrage, somme toute fort enrichissant. Tout n’est pas à jeter dans cet ouvrage, mais restez conscient qu’être une personne passionnée ne fait pas de vous un expert scientifique (dans le sens de la méthodologie scientifique) de votre sujet de prédilection, et Georges Ifrah, malgré toute sa bonne volonté, en est un exemple malheureusement criant, qui n’as pas su accepter les critiques et améliorer son travail.


  1. Georges Ifrah, Histoire universelle des chiffres – Lorsque les nombres racontent les hommes, Éditions Seghers, Paris, 1981.
  2. « Georges Ifrah », wikipedia.org source
  3. « The 100 or so Books that shaped a Century of Science », Philip and Phylis Morrison, American Scientist Volume 87, No. 6, November-December 1999. source
  4. Bulletin de l’Association des professeurs de mathématiques et de l’enseignement publique, n°398, Avril-Mai 1995. source
  5. Joseph Dauben, « Book Review: The Universal History of Numbers and The Universal History of Computing (part 1) », Notices of the AMS, vol. 49, no 1,‎ janvier 2002, p. 32-38 source  (pdf)
  6. Joseph Dauben, « Book Review: The Universal History of Numbers and The Universal History of Computing (part 2) », Notices of the AMS, vol. 49, no 2,‎ février 2002, p. 211-216 source (pdf)