Translittération de l’arabe pour le tchat

26/05/2021

Je montrais il y a quelques jours à mon voisin mon avancée sur le projet Matahah, pour lequel je prépare un site spécimen et revoit quelque peu le caractère. D’origine marocaine, il pouvait en effet m’aider sur quelques points de construction de lettres et de compositions destinées au site. Au cours de la discussion il m’a parlé du dialecte qu’il utilisait pour discuter avec son smartphone : il s’agissait d’une langue liée à l’arabe, mais écrite en mélangeant l’alphabet latin et des chiffres indo-arabes. En effet, d’après ses dires, cette façon d’écrire est plus simple et plus rapide, en particulier pour l’écriture sur smartphone.

Arabe marocain et culture francophone

De ce que m’a expliqué mon voisin, l’arabe marocain est assez différent de l’arabe standard, dit aussi arabe classique. Si une personne parlant l’arabe marocain peut comprendre un locuteur de l’arabe classique, la réciproque est moins évidente. L’arabe marocain est en effet une réunion de plusieurs dialectes des populations arabophones présentes sur son territoire, donc une sorte de lingua franca pour les diverses population du pays.

Carte linguistique de la zone du Maroc
Carte linguistique de la zone du Maroc, wikimedia.

Le Maroc est fortement influencé par la francophonie, par l’historie coloniale, l’immigration et la relative proximité avec la France. Les personnes, dans ce contexte, utilisent à loisir le français ou l’arabe marocain (aussi appelé darija, الدارجة), voire les deux en même temps, et finalement assez peu l’arabe classique pour la communication vernaculaire.

Translittération de l’arabe

Avec ce socle posé vient une problématique intéressante : mon voisin, lorsqu’il communique avec ses amis, sa famille, utilise son téléphone et les divers système de messagerie instantanée. Jusque là rien d’étonnant, mais du fait de sa spécificité culturelle, son téléphone est plutôt configuré pour un européen, avec un clavier présentant l’alphabet latin, et écrivant de gauche à droite, là où l’arabe s’écrit de la droite vers la gauche.

Comment donc parler en utilisant l’alphabet arabe ? On pourrait installer un second clavier à son téléphone, mais ça ne serait pas très pratique pour communiquer aisément, rapidement, à la fois en français et en arabe et comment gérer le problème de sens de l’écriture opposé de ces deux systèmes ? La solution trouvée par les marocains a donc été de translittérer les caractères arabes utiles au darija en caractères latins et en chiffres indo-arabes pour en faire un système efficace et facile à mettre en oeuvre, appelé arabi (عربي) ou arabizi (عربيزي), de la contraction de arabic et easy (arabe facile). Bien qu’il existe des normes de translittération de l’arabe officielles (la norme DIN 31635 de 1982 entre autres), il s’agit dans ce cas d’une formation émanent directement de la communauté qui l’utilise.

Ce système d’écriture met en place plusieurs règles : Chaque lettre arabe est substituée à une lettre ou un chiffre, soit par convention entre les locuteurs, soit par similarité de forme entre la lettre arabe et le glyphe de transcription. Par exemple la lettre ‹ء› (Hamza) est translittérée en ‹2› ou en ‹a›, par symétrie de forme ou par similarité sonore ; ‹ع› (Ayn), est lui translittéré par un ‹3›. Chaque caractère a un son unique, non influencé par l’enchaînement des autres caractères. Autrement dit on ne fait pas de liaison ou de modification du son selon son contexte dans la phrase. Enfin on écrit dans le sens inverse de l’arabe : au lieu d’écrire de droite à gauche, on écrit de gauche à droite, tout en maintenant l’ordre des sons des mots d’origine.

Translittération de l’arabe
Translittération de l’arabe, wikimedia.

Do you 5P34K L33T ?

La forme que prend l’arabizi fait tout de suite écho au Leet Speak, un forme d’écriture issue du web qui avait pour but de chiffrer l’écriture (de langues utilisant l’alphabet latin) en replaçant certaines lettres par des chiffres (L33T 5P34K), pour sa forme la plus simple, ou en replaçant des lettres par un ou plusieurs signes non alphabétiques, pour les versions les plus complexes (|_ 33¯|¯ _/¯|°3/-|<). Là ou l’arabizi est utilisé pour faciliter la transmission d’information et l’accès à tous aux moyens de communications actuels, le Leet Speak était plutôt fait pour lier une communauté en rendant l’accès aux personnes extérieures plus complexe : Leet Speak vient de la déformation de Elite Speak (langage d’élite). Certains sont largement contre l’utilisation du langage SMS, qui soit-disant réduirait le niveau de français, et on pourrait rapprocher formellement ce système d’écriture à celui de l’arabizi. Mais dire qu’il s’agit d’un appauvrissement de la langue me semble faux (d’ailleurs regardez cette vidéo de Monté) : au contraire on a créé un système qui permet de contourner les limitations d’un système. À ce titre c’est plutôt un enrichissement et un renouvellement de la langue. Pour le langage SMS, il s’agissait d’écrire un message avec le moins de caractères possible, car à l’époque chaque message était facturé, et le nombre de caractère par message était limité à qu’un tweet. Ns navion pa le choi, c t kom sa. Il en est de même avec le franglais, qui, au grand dam des défenseurs acharnés de la «bonne langue», est très utile lorsqu’il s’agit de vocabulaire qui n’a pas encore eu de traduction française. Je pense en particulier aux mots liés au web ou aux nouveau canaux de communication, d’information et de divertissement, et qui ont mis un certain temps à trouver de formes françaises (spoil → divulgacher, spam → pourriel, etc.), ou qui n’ont pas réellement d’équivalent aujourd’hui (une story Instagram, binge watcher un série, etc.). Aujourd’hui écrire en langage SMS devient inutile et est même mal perçu, à raison : puisque les limitations précédentes ne sont plus d’actualité, ce système est devenu obsolète.

Captures d’écran de deux conversations bilingues arabizi-français fournies par mon voisin.

Pour les marocains cependant l’arabizi semble rester essentiel pour communiquer facilement en utilisant une seule base, l’alphabet latin (et les chiffres indo-arabes), qui permet d’écrire en continu plusieurs langues et dialectes à la fois. C’est somme toute un système très rationnel.


  1. «Arabe marocain», wikipedia (source)
  2. «Alphabet de tchat arabe», wikipedia (source)
  3. «Qu'est-ce que l’easy Arabic ou arabizi ?», Joumana Barkoudah, Institut du monde Arabe (source)
  4. «Arabizi, le printemps linguistique», Le temps, 9 octobre 2012 (source)
  5. «Lumière sur : l’arabizi», Kawa news, 17 décembre 2019 (source)
  6. «Communication écrite», Shane Hartford, TradOline (blog), 7 décembre 2020 (source)
  7. «Transcription et translittération», wikipedia (source)
  8. Transliteration of Arabic, Thomas T. Pedersen, http://transliteration.eki.ee/, 2008.
  9. «Leet speak», wikipedia (source)
  10. «Langage SMS», wikipedia (source)