Kürzel für Namen von Sprachen

von Helmut Richter


Es wird ein Überblick über das wichtigste Schema zur Abkürzung der Namen von Sprachen, die Normenreihe ISO 639, gegeben. Außerdem enthält der Artikel zahlreiche Links.


Norm- und Standarddokumente, Vergleich zwischen ISO- und SIL-Codes

Suchen in der SIL Ethnologue Database


Zur Abkürzung der Namen von Sprachen werden hauptsächlich zwei Schemata verwendet:

Bis vor kurzem gab es darüberhinaus die dreibuchstabigen Kürzel aus der Ethnologue Database des SIL. Diese wurden üblicherweise mit Großbuchstaben geschrieben, um sie von den meist klein geschriebenen ISO-Kürzeln unterscheiden zu können. Seit der 15. Auflage der SIL-Datenbank werden diese SIL-Kürzel nicht mehr verwendet: Wo immer es eine Diskrepanz zwischen den SIL- und den bestehenden ISO-Kürzeln gab, hat SIL sein Kürzel geändert – das betrifft mehrere hundert Sprachen. Im Gegenzug hat ISO die SIL-Kürzel der bis dahin noch nicht erfassten Sprachen übernommen, vorerst nur als Normentwurf ISO 639-3, der aber mit Ausnahme der Kürzel für ganze Gruppen von Sprachen eine Obermenge der Kürzel in Norm ISO 639-2 bildet.

Im Folgenden werden alle diese Kürzel immer durch eckige Klammern gekennzeichnet.

Die dreibuchstabigen Kürzel nach ISO 639-2 sind später zu den zweibuchstabigen hinzugefügt worden, um mehr Sprachen zu erfassen. Welche Sprachen auch zweibuchstabige Kürzel haben, richtet sich dabei weniger nach ihrer Bedeutung, sondern mehr danach, wie bekannt sie den europäischen und amerikanischen Normern waren: Sprachen, die in Europa ums Überleben kämpfen wie Friesisch oder schottisches Gälisch haben ihre zweibuchstabigen Kürzel bekommen – anders als etwa Hausa [hau], das mit 25 Millionen Muttersprachlern und als internationale Verkehrssprache im nördlichen Westafrika sicherlich eine viel größere Bedeutung hat.

Auch wenn eine Sprache den Namen des Landes trägt, in dem sie vornehmlich gesprochen wird, ist das zweibuchstabige Kürzel der Sprache nach ISO 639-1 durchaus nicht immer dasselbe wie das zweibuchstabige Länderkürzel nach ISO 3166. Oft ist es so, z.B. für Bulgarisch [bg], Deutsch [de], Finnisch [fi], Französisch [fr], Indonesisch [id], Isländisch [is], Italienisch [it], Kroatisch [hr], Lettisch [lv], Litauisch [lt], Maltesisch [mt], Mazedonisch [mk], Mongolisch [mn], Niederländisch [nl], Polnisch [pl], Portugiesisch [pt], Rumänisch [ro], Russisch [ru], Slowakisch [sk], Spanisch [es], Thailändisch [th], Türkisch [tr] und Ungarisch [hu]. Aber es gibt auch Fälle, wo es anders ist: Albanien (al) – Albanisch [sq], Bangladesch (bd) – Bengalisch [bn], Dänemark (dk) – Dänisch [da], Estland (ee) – Estnisch [et], Griechenland (gr) – Neugriechisch [el], Japan (jp) – Japanisch [ja], Luxemburg (lu) – Luxemburgisch [lb], Malaysia (my) – Malaysisch [ms], Schweden (se) – Schwedisch [sv], Slowenien (si) – Slowenisch [sl], Tschechien (cz) – Tschechisch [cs], Ukraine (ua) – Ukrainisch [uk]. Ein Sonderfall ist Norwegen (no): dort gibt es Kürzel für die beiden Landessprachen Bokmål [nb] und Nynorsk [nn], wogegen [no] die gemeinsame norwegische Sprache bezeichnet, was auch immer damit gemeint sein mag.

Sprachen, die in mehr als einem Land oder nur in Teilen eines Landes gesprochen werden oder die ganz anders heißen als das Land, in dem sie vornehmlich gesprochen werden, haben Kürzel, die sich nur nach dem Namen der Sprache richten, z.B. Amharisch [am], Arabisch [ar], Baskisch [eu], Chinesisch [zh], Englisch [en], Esperanto [eo], Friesisch [fy], irisches Gälisch [ga], Hebräisch [he], Hindi [hi], Jiddisch [yi], Katalanisch [ca], Koreanisch [ko], Lappisch = Saami [se], Latein [la], Persisch = Farsi [fa], Philippinisch = Tagalog [tl], Rätoromanisch [rm], Sanskrit [sa], Serbisch [sr] und Swahili [sw].

Es gibt in ISO 639-2 auch Kürzel für Gruppen von Sprachen und für einige nicht mehr gesprochene Sprachen. Um Kompatibilität mit früheren bibliographischen Gepflogenheiten herzustellen, sind die im Bibliothekswesen verwendeten, auf englischen Bezeichnungen beruhenden Kürzel zusätzlich in ISO 639-2 enthalten, unter anderen [alb] neben [sqi] für Albanisch, [baq] neben [eus] für Baskisch, [chi] neben [zho] für Chinesisch, [cze] neben [ces] für Tschechisch, [dut] neben [nld] für Niederländisch, [fre] neben [fra] für Französisch, [ger] neben [deu] für Deutsch, [gre] neben [ell] für Neugriechisch und [per] neben [fas] für Persisch. Bei der Verwendung von ISO 639-2 muss man also darauf achten, dass die Kürzel nicht immer eindeutig sind.

Historische Sprachen sind bisher insgesamt wenig vertreten; sie werden erst in ISO 639-3 berücksichtigt. Nur Latein [la, lat] und Sanskrit [sa, san] kommen in allen Codes vor. Bei Griechisch wird stets der Unterschied zwischen Altgriechisch [grc] und Neugriechisch [el, ell] gemacht, dagegen erst in ISO 639-3 der zwischen Althebräisch [hbo] und modernem Hebräisch [he, heb], die früher nur im SIL-Code unterschiedlich waren. Beispiele weiterer alter Sprachen im Code ISO 639-2 sind Altägyptisch [egy], Aramäisch [arc], Ugaritisch [uga], Althochdeutsch [goh] und Mittelhochdeutsch [gmh].

Nachteilig an ISO 639-2 ist eine starke Orientierung an politischen Gegebenheiten: so werden Serbisch, Kroatisch und Bosnisch als drei verschiedene Sprachen geführt, hingegen die mindestens acht völlig voneinander verschiedenen chinesischen Sprachen nur als eine. Demgegenüber hat das SIL-Schema stärker versucht, sich nach linguistischen Kriterien zu orientieren, auch wenn es natürlich viele Fälle gibt, wo diese keine eindeutige Entscheidung zwischen getrennten Sprachen einerseits und Dialekten derselben Sprache andererseits zulassen. In solchen Fällen geht wohl der Trend bei der Zusammenlegung der beiden Schemata eher zur feineren Unterteilung in verschiedene Sprachen. Dabei wird neuerdings zwischen „Einzelsprachen“ (individual languages) und „Makrosprachen“ (macrolanguages) unterschieden, während reine Dialekte einerseits und Gruppen von Sprachen andererseits unberücksichtigt bleiben sollen. Die Kriterien, deren Anwendung natürlich in jedem Einzelfall kontrovers bleiben wird, besonders wenn Politik im Spiel ist, stehen im Artikel „Scope of denotation for language identifiers“. Von Makrosprachen spricht man dabei vor allem in den Fällen, in denen eine Variante in vielen Kontexten die anderen im Schriftlichen vertritt, wie im Chinesischen [zh, zho, chi]. Ein Blick in die Liste der Makrosprachen lohnt sich, um zu vermeiden, dass man bei der Wahl eines Kürzels versehentlich zu restriktiv ist und beispielsweise das Kürzel [swh] (Swahili der ostafrikanischen Küste) statt [sw, swa] (Swahili allgemein) verwendet, wenn eine solche Differenzierung nicht gemeint war.

Um möglichst bekannte und möglichst eindeutige Kürzel zu haben, empfiehlt es sich, die zweibuchstabigen ISO-639-Kürzel zu verwenden, wenn man es ausschließlich mit „gängigen“ Sprachen zu tun hat, etwa bei der Übersetzung von Webseiten oder Gebrauchsanweisungen in ein paar zusätzliche Sprachen. Für exotischere Sprachen oder wenn es auf die genaue Bezeichnung einer ganz bestimmten Sprache ankommt, richtet man sich am besten nach der SIL-Datenbank. Wenn das dort vorgeschlagene Kürzel noch nicht Norm ist, gibt es wohl für die Sprache noch kein normgerechtes Kürzel und der SIL-Vorschlag sollte die besten Chancen haben, Norm zu werden. Die bisherige Schreibung des SIL-Codes [XYZ] als x-sil-XYZ hat keinen rechten Sinn mehr. Wo sie auftaucht, handelt es sich vermutlich um einen alten Code vor Erscheinen der 15. Auflage der SIL-Datenbank; man sollte sie ersetzen.


© Helmut Richter      published here 2004-08-25; last update 2006-03-20      http://www.lrz.de/~hr/lang/abk.html