Langues et écritures

Nalini Balbir, docteur d’Etat en études indiennes, est professeur d’indologie à l’Université Paris-3 Sorbonne-Nouvelle et directrice d’études (Philologie moyen-indienne) à l’Ecole Pratique des Hautes Etudes.

LANGUES

Sur la carte mondiale, l'Asie du sud est une aire linguistique particulièrement riche et variée. La plupart des langues qui y sont représentées ont une très longue histoire, souvent d'abord documentée par l'épigraphie, et sont utilisées aujourd'hui, pour certaines par plusieurs centaines de millions de locuteurs. Outre l'anglais et le hindi, vingt-deux langues sont reconnues dans la Constitution indienne. Parmi les traits linguistiques que partagent la plupart, on relève :

l'opposition entre voyelles brèves et voyelles longues,
l'existence de consonnes rétroflexes,
l'emploi d'une forme verbale dédiée pour exprimer les actions antérieures à celles du verbe principal,
des constructions indirectes pour exprimer notamment sensations et sentiments où le sujet grammatical n'est pas la personne concernée,
des conjugaisons causatives spécifiques pour indiquer qu'une action est effectuée par un intermédiaire (type "faire faire", "faire nettoyer"),
des syntagmes verbaux où l'un d'eux est un auxiliaire à valeur sémantique,
l'emploi de mots à écho
un ordre des mots souvent flexible mais à tendance dominante sujet - objet - verbe.

Les langues d'Asie du sud se répartissent en quatre familles.

Langues indo-aryennes

Elles forment l'une des branches de la famille des langues indo-européennes, au même titre que le latin, le grec, les langues iraniennes, slaves, celtiques et romanes.

Indo-aryen ancien

Ce terme générique inclut en pratique le sanskrit dans toutes ses variétés : le plus ancien, le sanskrit védique, représenté dans les Védas, puis les formes classiques de la langue incarnées dans une très vaste littérature, et la langue véhiculaire que se sont approprié toutes les régions et toutes les communautés.

Moyen indo-aryen

Il comprend plusieurs stades et variétés linguistiques.

Le pali (mot dont le sens littéral est "texte sacré" par opposition à "commentaires") est la langue donnée, depuis le XVII^e siècle, aux Écritures du bouddhisme Theravāda, d'abord transmises oralement et mises par écrit au I^er siècle av. n. è. à Ceylan. Aujourd'hui, il est vivant à des degrés divers parmi les bouddhistes du Sri Lanka, de Thaïlande, du Laos, de Birmanie et du Cambodge.

Les prakrits (prākṛta, litt. "naturel", "vulgaire", "commun") sont des langues populaires, assez proches les unes des autres, qui étaient utilisées concurremment au sanskrit, langue de l'élite, par exemple dans le théâtre de l'Inde ancienne par les femmes ou d'autres personnages. Elles se sont épanouies en langues littéraires ou religieuses bien attestées jusqu'au XII^e -XIII^esiècle, nettement moins vivaces ensuite. Les inscriptions de l'empereur Asoka en sont le témoignage le plus anciennement attesté (III^e siècle av. n.è.). Les noms des prakrits font référence à des aires géographiques, mais les différenciations ne sont pas toujours nettes.

Śauraseni	globalement Inde centrale (Madhyadeśa)	parlé par les femmes et le bouffon dans le théâtre
Śauraseni jaina	globalement Inde centrale	Écritures canoniques des jaina digambara
Māgadhī	Magadha (Bihar)	locuteurs de basse extraction dans le théâtre
Ardhamāgadhī	Inde de l'est et du nordest	Écritures canoniques des jaina śvetāmbara
Māhārāṣṭrī	Inde de l'ouest	poésie lyrique, strophes du théâtre, poèmes épiques et narratifs
Māhārāṣṭrī jaina		variété de māhārāṣṭrī : commentaires, textes littéraires jaina

Le terme générique d'apabhraṃ śa (litt. "déviation") regroupe un ensemble de dialectes prakrits tardifs qui précèdent l'émergence des langues vernaculaires néo-indo-aryennes. Il est représenté par des poèmes mystiques bouddhiques de l'est de l'Inde, et, surtout, par une vaste littérature produite en milieu jaïn dans le nord et l'ouest de l'Inde.

Langues néo-indo-aryennes

Le hindi (plus de 500 millions de locuteurs à travers le monde) est la langue nationale de l'Inde indépendante, aux côtés de l'anglais, la langue maternelle de plus de 40% de la population du sous-continent et la seconde langue de beaucoup, sauf dans certaines régions du sud de l'Inde où la résistance au hindi est forte. Les premiers documents littéraires en hindi remontent au XIII^esiècle. Une riche littérature s'épanouit en hindoustani, hindi fortement imprégné de persan. À côté du hindi moderne standard, on recense plusieurs variétés soutenues par une riche tradition littéraire depuis l'époque médiévale, parmi lesquelles le braj (région d'Agra) et l'avadhi (région de l'Oudh) : le premier est la langue de la dévotion krishnaïte (Sūrdās, XVI^e s.) et le second celle qui domine dans le Rāmāyaṇa de Tulsīdās (XVI^e s.). Le bhojpuri, très vivant autour de Bénarès ainsi que dans la diaspora de l'Ile Maurice, et le rajasthani sont très riches en traditions orales et folkloriques, tandis que le maithili est un dialecte hindi de l'est de l'Inde. L'ourdou, parlé aujourd'hui par plus de soixante-quinze millions de personnes en Inde (y compris au Cachemire), au Pakistan et, dans une moindre mesure, au Népal et au Bangladesh, est le résultat de la convergence des cultures indiennes et islamiques à partir du XIII^e siècle et de l'époque moghole. Langue sœur du hindi, il porte la marque du persan et de l'arabe dans son vocabulaire.

Le penjabi (plus de cent millions de locuteurs) est aujourd'hui parlé au Pakistan et dans plusieurs régions du nord de l'Inde, y compris Delhi. Il est attesté depuis le XIIe siècle, mais s'est surtout épanoui en lien avec le sikhisme et les poèmes composés par le maître Guru Nanak (XV^e siècle) qui constituent le noyau de l'Ādi Granth, livre sacré des sikhs.

Langues du groupe oriental

Elles sont tenues pour remonter globalement au prakrit māgadhī associé à l'est du sous-continent indien et partagent bon nombre de traits phonétiques (fricative unique sh en lieu et place des trois sifflantes du sanskrit) et morphologiques (absence de genre grammatical).

Le bengali (ou: bangla), parlé par plus de 265 millions de personnes au Bengale et au Bangladesh, émerge comme langue indépendante au début du deuxième millénaire avec des poèmes mystiques bouddhiques (Caryāpada) et s'épanouit sans interruption comme langue littéraire et de culture raffinée.

L'oriya ou odiya (plus de 38 millions de locuteurs) est né dans le nord-est de l'Inde vers les X^e -XI^esiècles. Aujourd'hui, il est parlé principalement dans les états d'Orissa (Odisa) et de Chhatisgarh.

L'assamais (plus de 15 millions de locuteurs) est utilisé dans le nord-est de l'Inde, région où coexistent des langues appartenant également à d'autres familles. Il est attesté depuis le XIII^e siècle.

Langues du groupe occidental

Elles conservent certains traits typiques hérités du sanskrit : trois genres (masculin, féminin, neutre), futur de type sigmatique, etc. et sont tenues pour remonter, globalement, au prakrit de type māhārāṣṭrī. On en distingue généralement trois stades : ancien, moyen, moderne.

Le gujarati (plus de 55 millions de locuteurs), parlé au Gujarat, au Maharashtra et par une diaspora importante, émerge au XIIe siècle attesté par des œuvres à tendance religieuse, hindoue ou jaïne notamment.

Le marathi (plus de 84 millions de locuteurs), parlé notamment au Maharashtra, est une langue littéraire majeure attestée depuis au moins le XII^e siècle par des œuvres, notamment religieuses, de premier plan. Il est influencé par les langues dravidiennes voisines.

Le konkani (plus de sept millions de locuteurs), parlé notamment à Goa et sur la bande côtière de l'Inde occidentale, a donné naissance, entre autres, à une vaste littérature catholique dans le cadre des missions évangéliques des XVI^e -XVIII^e siècles.

Autres

Le népali (plus de 17 millions de locuteurs) est parlé au Népal, au Bhoutan et en Inde du nord-est. Sa phonétique est proche du hindi, mais sa morphologie et sa syntaxe sont assez spécifiques en sorte que sa place au sein de la famille indo-aryenne n'est pas univoque. Il est attesté, avec certitude, depuis le XVII^e siècle environ par l'épigraphie.

Le cachemiri (plus de 6 500 000 locuteurs) occupe une place à part car il appartient aux langues dardes, branche de l'indo-aryen proche de l'iranien. Il est parlé dans les régions montagneuses du nord-ouest de l'Inde et au nord-est du Pakistan.

Le cinghalais, malgré sa position méridionale, est bien une langue indo-aryenne. Il a une tradition écrite qui remonte aux derniers siècles avant notre ère. C'est aujourd'hui la langue officielle de Sri Lanka, à côté du tamoul.

Langues dravidiennes

Aujourd'hui principalement associées au sud du sous-continent indien, elles furent probablement présentes autrefois sur toute son étendue, comme le suggèrent d'une part la survivance du brahui au Pakistan et, d'autre part, l'inclusion d'emprunts dravidiens au sein même des Védas. L'histoire linguistique indienne s'est nourrie des interactions continuelles explicites ou subtiles entre dravidien et indo-aryen.

Cette famille, qui n'a de lien génétique avec aucune autre, comprend au moins une vingtaine de langues correspondant à plus de deux cent soixante millions de locuteurs et présentant des affinités structurelles qui encouragent à l'étude linguistique comparative. Quatre d'entre elles ont une longue histoire et une très riche transmission manuscrite et littéraire ; le tamoul (plus de 78 millions de locuteurs), le télougou (plus de 86 millions), le kannara (ou kannaḍa, plus de 44 millions) et le malayalam (plus de 39 millions), dans l'Inde d'aujourd'hui, dominent respectivement dans les états du Tamilnadu, de l'Andhra Pradesh, du Karnataka et du Kerala, tandis que le tamoul est aussi la langue des populations du nord du Sri Lanka et de celle de nombreuses diasporas à travers le monde. Le tamoul est, au même titre que le sanskrit, une langue classique de l'Inde ancienne dont les premières attestations (épigraphiques) remontent au III^e s. av. n. è., tandis que télougou, kannara et malayalam sont attestées depuis les VI^e -VII^e s. de n.è. environ.

Les intérêts des missionnaires expliquent en partie les nombreuses enquêtes dont le tamoul (grammaire et lexique) a fait l'objet dès le XVII^e siècle. La diglossie, c'est-àdire une forte différence entre langue écrite et langue orale et, donc, l'existence de nombreuses variétés, éventuellement liées au statut social, caractérise tamoul, télougou et kannara, qui ont toutes aussi des variétés régionales. L'influence du tamoul mais aussi celle du sanskrit s'exerce diversement sur les lexiques télougou, kannara et malayalam.

Parmi les autres langues de la famille figurent le tulu, le toda, le badaga, le kodugu et le pengo, dont les traditions orales sont très riches.

Dictionary, French-Tamil, after Beschi. 1800

Langues austro-asiatiques

Comparées aux autres familles linguistiques d'Asie du sud, elles rassemblent bien moins de locuteurs et sont présentes dans des territoires plus limitées. Le groupe mon-khmer inclut notamment le khasi (environ un million de locuteurs) parlé au Meghalaya et le nicobarais (environ 25 000 locuteurs) parlé aux Iles Nicobar et divisé en plusieurs dialectes en danger. Le munda, représenté par plusieurs langues nonécrites proches les unes des autres, est considéré comme une sorte de substrat autochtone du sous-continent indien remontant à des migrations d'époque préhistorique, antérieures à l'arrivée des Aryens. Les structures de ces langues sont spécifiques et atypiques, même si leur vocabulaire peut porter la marque de l'influence indo-aryenne. Les locuteurs munda (environ douze millions aujourd'hui) sont aujourd'hui surtout des populations tribales vivant dans l'Inde centrale (Madhya Pradesh / Maharashtra) ou dans l'Inde du nord-est (Jharkhand, Orissa, Bihar, Bengale) avec quelques poches au Népal et au Bangladesh. Dans le groupe septentrional, le santali est l'une des plus importantes numériquement (environ 7 500 000 locuteurs) et constitue une langue officielle, aux côtés du mundari (1 400 000) et du ho (1 200 000), tandis que le korwa (34 000) est encore moins répandu. L'impression de livres en ces langues, qu'il est important de documenter, est un phénomène récent.

Langues tibéto-birmanes

Elles ont une présence assez bien circonscrite. Les langues apparentées au tibétain sont utilisées au Bhoutan, au Ladakh et au Népal, où les principales sont le newar et le tamang. Les principales autres sont dominantes les états du nord-est de l'Inde (Assam, Mizoram, Meghalaya, Tripura, Nagaland, Arunachal Pradesh, Sikkim). Deux d'entre elles, le bodo (1 700 000 locuteurs) le meithei parlés en Assam sont reconnues par la Constitution indienne.

ECRITURES

La plus ancienne écriture du sous-continent indien est représentée par les pictogrammes de la civilisation de l'Indus (3000 av. n.è.). Mais la langue qu'ils notent n'est toujours pas déchiffrée. Aucune des hypothèses proposées n'a pu emporter la conviction.

L'écriture kharoṣṭhī est présente sur une période limitée : environ III^e s. av. n.è. - IIIe s. ap. n.è. sur une aire géographique limitée : l'Inde du nord-ouest. Elle est peutêtre d'origine araméenne, s'écrit de droite à gauche et ne note pas les quantités vocaliques. Elle est associée au prakrit de type gāndhārī, langue moyen-indienne attestée par des édits sur rocher promulgués par l'empereur Asoka (III^e s. av. n. è.) aux confins nord-ouest de son empire, par des documents économiques sur tablettes de bois trouvées dans des oasis d'Asie centrale (Niya, II^e -III^e s. de n.è.) et surtout par un assez grand nombre de textes bouddhiques, le plus souvent écrits sur écorce de bouleau. L'un des plus importants est le Dharmapada "Stances sur la Loi", qui fut d'abord connu par les "fragments Dutreuil de Rhins", rapportés d'Asie centrale. Une partie d'entre eux se trouve à la Bibliothèque nationale de France (Pali 715) et donna lieu à l'étude fondatrice d'É. Senart. Depuis, de nombreux autres manuscrits bouddhiques en écriture kharoṣṭhī et langue gāndhārī ont été découverts au Pakistan et en Afghanistan, sont préservés dans plusieurs bibliothèques occidentales et nourrissent un courant d'études en pleine expansion depuis les années 1990.

L'ancêtre de la plupart des écritures utilisées dans le sous-continent indien (Inde, Népal, Sri Lanka) et dans plusieurs pays d'Asie du sud-est (Thaïlande, Cambodge, Laos, Birmanie) est l'écriture brāhmī. Attestée depuis le III^e s. av. n. è. par les inscriptions d'Asoka, elle a évolué, s'est transformée et a connu une immense diffusion spatiale et temporelle. Elle s'écrit de gauche à droite et forme un système alphasyllabaire en adéquation avec le phonétisme du sanskrit et des autres langues indiennes : chaque consonne contient un son a bref ; les sons vocaliques associés à des consonne sont notés par des signes abrégés et les sons vocaliques isolés ont des signes spécifiques. Issue de la brāhmī, l'écriture (deva)nāgarī se développe progressivement à partir des VI^e -VII^e s. de n. è. et se décline en plusieurs variétés (nāgarī jaina, ex. Indien 706 ; nāgarī du Népal, ex. Sanscrit 1814). Dans ses formes modernes, elle note aujourd'hui le hindi, le népali et le marathi. Des formes apparentées, mais non identiques, sont utilisées pour les autres langues indoaryennes (gujarati : Indien 721, Indien 722 ; bengali et assamais, oriya, cinghalais).

Les écritures, de formes beaucoup plus arrondies, des langues dravidiennes (tamoule, télougoue, kannara, malayalam) ont aussi pour ancêtre ultime la brāhmī, également attestée en pays tamoul à date ancienne, tandis que l'écriture grantha est utilisée dans le sud de l'Inde pour noter le sanskrit. Au Cachemire, l'écriture traditionnelle est la śāradā, également dérivée de la brāhmī, qui notait le sanskrit mais aussi le cachemiri. Aujourd'hui, les brahmanes de la région continuent à l'utiliser en contexte sacré, en concurrence avec la nāgarī. De la śāradā provient la gurumukhi employée par les sikhs pour le penjabi.

Les savants occidentaux du XIX^e siècle se sont souvent appliqués à dresser, ou à faire dresser par des intermédiaires indiens, des tables de ces écritures (Sanscrit 1129 : cinq alphabets de l'Inde : devanāgarī, grantha, telinga, singhalais, tamoul ; Indien 839 Alphabet indoustani avec essai de transcription) et à rassembler des documents en écritures diverses (Indien 757). La transcription en caractères latins a également donné lieu à recherches et tâtonnements avant d'aboutir à la forme standard qui recourt à des signes diacritiques pour noter les phonèmes propres aux langues indiennes (macron pour les voyelles longues, ex. ā, ī, ū ; points souscrits pour les consonnes rétroflexes, ex. ṭ, ḍ, ṇ, etc.).

Les écritures indiennes n'ont pas de calligraphie (comparable à la chinoise ou à l'arabe), mais des formes quasi-calligraphiques sont susceptibles d'être utilisées à l'occasion dans des œuvres religieuses : Védas (Sanscrit 320), livre sacré jaïn (Indien 889), tandis que tous les stades, depuis l'écriture cursive jusqu'aux formes plus soignées, sont largement attestés d'autre part.

Papiers de commerce

Contrairement à une idée reçue, l'écriture devanāgarī n'a pas toujours été la seule utilisée pour noter le sanskrit, transmis d'abord par la brāhmī sous toutes ses formes, par les écritures des langues vernaculaires (ex. bengali) et aussi, dans le sud de l'Inde, par le grantha, ou, dans le nord, même occasionnellement, par l'écriture persane.

Le cas de la langue pāli illustre une situation particulière. En effet, elle n'a pas d'écriture propre et peut être notée en devanāgarī (le plus souvent en Inde) mais aussi en caractères cinghalais (Sri Lanka), khom (Thaïlande et Cambodge), tham (Thaïlande du nord-est), khmers (Cambodge), birmans ou laos, latins (en Occident). Les planches accompagnant l'Essai fondateur de Burnouf et Lassen (1826) en montrent la variété et les tables de correspondances alphabétiques sont un format de transmission du savoir dont on a maints exemples (ex. Pali 541 Syllabaire pālikham-singhalais).

Si elle n'est pas née en Asie du sud, l'écriture arabo-persane doit cependant être ajoutée à l'inventaire car elle a servi à noter le persan en Inde à l'époque moghole et prémoderne et aussi le hindi jusqu'au début du XX^e siècle. Aujourd'hui, elle note régulièrement l'ourdou, langue utilisée en Inde et au Pakistan et est aussi utilisée par les musulmans du Cachemire ou ceux du Penjab. Mais l'ourdou a pu aussi être noté au moyen des écritures utilisées pour les langues régionales, comme le bengali.

Publié en avril 2024

Langues indo-aryennes

Essai sur le pali ou langue sacrée de la presqu'île au delà du Gange avec la notice des manuscrits palis de la Bibliothèque du Roi 1826

Observations grammaticales sur quelques passages de l'Essai sur le pali E. Burnouf. 1827

Kaccâyana et la littérature grammaticale du pâli. 1ère partie, Grammaire pâlie de Kaccayana : sûtras et commentaire 1871

Langues dravidiennes

Grammaire des grammaires de la langue tamile E. Ariel. 1846-1852

Dictionnaire tamoul-français sans titre, précédé d'une liste. Indien 210 C. G. Beschi. 19e

Saduragarâdi. Indien 229 19e

Notes sur la prosodie tamoule J. Vinson. 1925

Sanskrit

Cours de Chézy et traductions. Papiers Burnouf 99 1822-1824

Observations sur les mots zends et sanscrits Vahista et Vasichtha et sur quelques superlatifs en zend E. Burnouf. 1834

Lexiologie indo-européenne, ou Essai sur la science des mots sanskrits, grecs, latins, français, lithuaniens, russes, allemands, anglais, etc H.-J. Chavée. 1849

La langue et la littérature sanscrites : discours d'ouverture des conférences de sanscrit P. Regnaud. 1879

Le 17ème chapitre du Bhāratīya-Nātya-Çāstra, intitulé Vāg-Abhinaya P. Regnaud. 1880

Métrique de Bhārata, texte sanscrit de deux chapitres du Nātya-Çāstra P. Regnaud. 1880

Nouveaux aperçus sur le vocalisme indo-européen : précédés d'une analyse critique des systèmes actuellement en vigueur P. Regnaud. 1883

Manuel pour étudier la langue sanscrite. Chrestomathie, lexique, principes de grammaire A. Bergaigne. 1884

La Syntaxe des comparaisons védiques A. Bergaigne. 1886

Manuel pour étudier le sanscrit védique : précis de grammaire, chrestomathie, lexique A. Bergaigne et V. Henry. 1890

Fragment du Kātantra provenant de Koutcha L. Finot