Как устроен “Реестр Лингвосферы” |
back to Обсерватория Лингвосферы |
В Реестр включена информация о всех живых языках Земли. Из мертвых языков учтены: во-первых, те, которые в письменной форме продолжают использоваться в настоящее время (например, латынь, санскрит, церковнославянский и др.), причем предполагается учесть и все языки, от которых остались какие-либо письменные памятники (этрусский, древнекитайский, хеттский и пр.); во-вторых, языки, исчезнувшие прежде всего в течение XX века (убыхский, айнский и др.), а по возможности и за последние пять столетий (например, полабский, готский, многие языки Америки, Австралии и других регионов, исчезнувшие в процессе экспансии европейских языков), — поскольку языки как первой, так и второй групп непосредственно влияли и влияют на современное состояние лингвосферы.
Система классификации языков, принятая в Реестре, является оригинальной разработкой Дэвида Долби. В ее основу положены принципы в чем-то традиционные, но в чем-то весьма отличные от других указателей языков (прежде всего (link)“Этнолога”). Хотелось бы подчеркнуть, что Долби не ставит своей задачей создать принципиально новую (генетическую, ареальную) классификацию языков. Его задача — разработать достаточно простой и удобный принцип каталогизации языков мира в их подробном Реестре.
Этот каталог языков можно сравнить с каталогом библиотеки: он устроен так, чтобы объединить языки и группы языков как можно более наглядным образом, облегчающим работу с указателем. Наиболее крупными референциальными единицами (так сказать, “стеллажами библиотеки”) являются 10 секторов, каждый из которых подразделяется на 10 зон (которые можно сравнить с полками на стеллаже). Как сектора, так и зоны выделяются либо по генетическому принципу (это, соответственно, “филосектора” и “филозоны”), так и по ареальному (“геосектора”, “геозоны”) в случае, если последнее основание выделения предпочтительнее.
Филосекторов пять — (1) Афразийский, (3) Австронезийский, (5) Индо-европейский, (7) Сино-индийский и (9) Трансафриканский. Как легко заметить, эти сектора примерно соответствуют традиционным “семьям” или “макросемьям” — под Сино-индийским сектором в данном случае имеется в виду сино-тибетская семья языков, а под Трансафриканским — конго-атлантическая (включающая все языки гипотетической нигеро-кордофанской макросемьи, кроме манде и кордофанских).
Геосекторов (в них включаются языки соответствующих регионов, не охваченные ни одним из филосекторов) также пять — это (0) Африка (куда попали языки нило-сахарской и койсанской макросемей, и манде и кордофанские языки, включаемые в нигеро-кордофанскую макросемью), (2) Австралазия (австралийские, тасманийские и папуасские языки), (4) Евразия (алтайская, уральская, дравидийская, аустроазиатская, паратайская, северокавказская, картвельская семьи и все изолированные языки Евразии), а также (6) Северная Америка и (8) Южная Америка.
Каждой из 100 языковых зон присвоен номер (от 00 до 99). Внутри зон языки группируются уже исключительно по генетическому принципу, причем здесь также используется оригинальная концепция группировки языков, предложенная Д. Долби взамен традиционных терминов “семья”, “группа”, “подгруппа” и пр. Внутри зоны языки последовательно объединяются на трех уровнях генетической близости: крупнейшее объединение именуется ОТРЯД (англ. set) и предусматривает наличие у языков хотя бы 25-35% совпадений в базовом словаре. Таких объединений насчитывается 694. (Примерами объединений уровня ОТРЯД могут служить абхазо-адыгский, нахско-дагестанский и картвельский отряды в Кавказской геозоне или енисейский, чукотско-камчатский, юкагирский и нивхский отряды в Сибирской геозоне). Далее, уровень ЗВЕНО (англ. chain) соответствует большей степени близости языков, примерно 36-50% (1.410 групп, например нахское, лезгино-даргинское, аваро-андо-цезское и лакское звенья в нахско-дагестанском отряде или скандинавское, английское, западно-германское и восточно-германское звенья в германском отряде Германской филозоны). Наконец, уровень ЯЧЕЙКА (англ. net) отражает степень близости с порядка 51-70% лексических совпадений (это 2.694 объединения типа аваро-андийской и цезской ячеек в аваро-андо-цезском звене или четырех ячеек в славянском звене славянского же сота Славянской филозоны). Каждому из трех уровней объединения соответствует буквеный код из заглавных букв (типа 42-ABA для аваро-андийской ячейки).
Внутри ячеек происходит последнее деление языков, причем здесь также выделяются три уровня (Д. Долби намеренно отказывается от жесткой дихотомии “язык” vs. “диалект”). Внешний язык (вш.яз.) соотносится с базовой демографической единицей классификации. В традиционной классификации он соответствует одному или группе нескольких близкородственных языков, для которых можно говорить примерно о 71-85% совпадений в базовом словаре. Всего внешних языков насчитывается 4.994; это, например, русско-украинско-белорусский, аварский, андийский вш.яз-ы. Базовой единицей собственно лингвистической классификации является внутренний язык (вт.яз.); таких единиц в Реестре 13.840. Традиционно ему соответствует наречие, группа диалектов или отдельный язык, с более чем 86% совпадений в базовом словаре. Наконец, в классификации может использоваться и самый нижний уровень — диалект, соответствующий определенной территориальной, социальной или письменной разновидности внутреннего языка. Диалектов выделяется более 8 тысяч.
Впрочем, значительную роль в выделении языков играют и внешнелингвистические факторы. Так, например, в англоязычном ареале (ячейка English) выделяются 3 внешних языка: северо-британский (шотландско-нортумбрийские д-ты), южно-британский (собственно английские д-ты) и Global-English (все остальные варианты: стандартный английский и не-британские формы).
Литературные языки трактуются наряду с нелитературными формами как внутренние языки (сербский и хорватский наряду с кайкавским, чакавским и штокавским внутренними языками в сербско-хорватском внешнем языке) или диалекты (болгарский или македонский литературные диалекты в составе соответствующих внутренних языков в одном болгаро-македонском внешнем языке). Аналогично, одним внешним языком (и двумя внутренними) являются хинди и урду, которые, несмотря на использование различных систем письма, практически полностью взаимопонимаемы в устной речи.
Формально Реестр устроен в виде пяти колонок, каждая из которых имеет фиксированное содержание.
42-AAA-ab |
adyğë-bzл-E. |
adö g« bz« ; къэбэрдеи-бзэ;
q’eberdej-cerkes, qaberdey, kabarday, kabardi, kabard, qabardian,
kabardino-cherkes; cherkes-E.; "kabardian";
"circassian"-E.; "upper circassian"; in [53] Russkiy:
кабардино-черкесский, кабардинский; in [44] Malqar: къабарты
E bilingual in [53] Russkiy |
RF (Kabardino-Balkaria; Karachay-Cherkes; N. Ossetia; Adyghea Republics; Stavropol, Krasnodar territories); migration> Turkey; Syria; Jordan; Saudi Arabia; subsequently also USA |
5 |
В колонке 1 приводится буквенный код, который в полном своем виде состоит из двух цифр (сектор+зона), трех заглавных букв (отряд+звено+ячейка) и трех строчных букв (внешний язык+внутренний язык+диалект): 52-AAA-aaa.
В колонке 2 приводится основное название (reference-name), используемое при отсылки. Для языков и диалектов таковым всегда является самоназвание (“автоглоссоним”), что обеспечивает универсальную систему обозначения языков, не зависящую от языка описания и сравнимую с латинской номенклатурой в биологии. Большинство основных названий групп языков созданы сочетанием названий двух основных составляющих вместо использования традиционных, часто искусственных и иноязычных названий (Norsk+ Svenska вместо Nordic или Scandinavian). В первом печатном издании Реестра самоназвания даны в латинице (например, “russkiy”, “ukrainska”, "kartuli" и др.), однако в будущем планируется приводить также и написание названия языка в оригинальной письменности. Перед названиями идиомов, которые существуют ныне только на письме, ставится значок & ; а для идиомов, основанных на письменной норме (литературных), значок - . Названия разного уровня иерархии отличаются типографически: от жирных заглавных букв для отряда (NORSK+ SVENSKA) до простых строчных для диалекта (nynorsk-F.).
В колонке 3 приводятся все прочие названия, в том числе варианты самоназвания, и основное(-ые) названия по-английски (выделенные жирным шрифтом). Названия на других языках предваряются указанием на язык (напр., “in [53] Russian: абадзехский”); где в квадратных скобках указывается номер зоны. Названия языков, вопреки принятой у большинства европейских языков традиции, начинаются со строчных букв, в отличие от географических названий. Это не касается комментариев, которые даются курсивом. В этой же колонке даются и прочие сведения о языке, предваряемые специальными значками:
E сведения о дву-, многоязычии и диглоссии;
C сведения о контактах и взаимодействии языков;
Å сведения об ареале или эпицентре распространения;
¶ сведения о носителях, их перемещениях и т.д.;
# номенклатурные замечания: этимология, использование названий;
Ø сведения о близости языков, переходном характере и т.д.;
& сведения об используемой письменности и письменной норме.
В колонке 4 указываются государства (а в скобках более мелкие административные единицы), в которых распространен данный идиом. На официальный статус указывает значок флага u ***; о транснациональном характере свидетельствует значок перекрещенных флагов U ***.
В колонке 5 указывается индекс численности носителей. Индексом является цифра от 0 до 9, которая соответствует порядку числа говорящих (как в качестве первого, так и второго) на языке (0 = язык вымер после 1900 г., 1 = менее 100 чел., 2 = 100 и более чел., 3 = 1000 и более чел., и т.д.). Индекс 9 присвоен лишь двум языкам с наибольшим числом говорящих. Это путунхуа, или северокитайский язык (часто называемый диалектом китайского), и английский. На обоих языках говорит приблизительно по 1 миллиарду человек, причем титул “языка с наибольшим числом говорящих” попеременно переходит то к одному, то к другому из них в течение суток. Когда солнце восходит над Тихоокеанским побережьем Евразии, больше всего говорящих на путунхуа. Когда же там наступает ночь, и просыпается Западное полушарие, самым популярным языком становится английский. Значком i *** помечены ячейки, звенья или соты целиком исчезнувшие к концу 20-го столетия, а значком l *** – идиомы, вымершие до начала 20-го века.
Для простоты обозначений в Реестре используется целый ряд "суффиксов", присоединяемых к названию идиомов или групп языков.
Во-первых, это суффиксы сторон света: “-N.” северный, “-W.” западный, “-SW.” юго-западный, и т.д. Так, вместо "western adyghe" используется "adyghe-W."
Во-вторых, это суффиксы специальных "категорий", обычно заменяющие часто встречающиеся определения: “
-A. "собственно" (например, "собственно" русский=великорусский),
-D. язык / диалект диаспоры,
-F. (formal) литературный,
-G. (historical) обще- (койне) ("общерусский разговорный"),
-H. (?historical) древне- / старо- (древнерусский),
-L. (liturgical/literary) классический / богослужебный (церковнославянский),
-M. (middle) средне- (в смысле географически, средненемецкий ),
-U. (urban) городской (московский диалект),
-V. (vehicular) лингва-франка ("среднеазиатский русский").
К названиям языков или к другим сведениям, в которых авторы не уверены и которые требуют подтверждения, прибавляется звездочка: *.
Особым понятием в Реестре является “артериальный язык” — так называют внешний язык, которым хотя бы пассивно владеют не менее 1% населения Земли и который, тем самым, занимает исключительно важное место в речевой коммуникации нашей планеты. Артериальных языков по меньшей мере 28.
Для наглядности разберем несколько примеров. (В таблицах ниже в первой колонке указан буквенный код, во второй колонке указано русское название, в третьей – основная форма именования, затем количество более мелких подразделений.)
Пример 1: От Индо-европейского филосектора к (южно-)английскому внутреннему языку.
Таблица 1: Членение Индо-европейского филосектора на зоны.
отряды |
внешн. яз-ки |
артер. яз-ки |
индекс численности |
|
5= ИНДО-ЕВРОПЕЙСКИЙ филосектор |
10 |
150 |
12 |
9 |
50= КЕЛЬТСКАЯ филозона |
1 |
5 |
0 |
6 |
51= РОМАНСКАЯ филозона |
1 |
30 |
4 |
8 |
52= ГЕРМАНСКАЯ филозона |
1 |
25 |
2 |
9 |
53= СЛАВЯНСКАЯ филозона |
1 |
8 |
1 |
8 |
54= БАЛТИЙСКАЯ филозона |
1 |
3 |
0 |
6 |
55= АЛБАНСКАЯ филозона |
1 |
1 |
0 |
6 |
56= ГРЕЧЕСКАЯ филозона |
1 |
2 |
0 |
7 |
57= АРМЯНСКАЯ филозона |
1 |
1 |
0 |
6 |
58= ИРАНСКАЯ филозона |
1 |
26 |
0 |
7 |
59= ИНДИЙСКАЯ филозона |
1 |
49 |
5 |
9 |
Таблица 2: Членение Германского отряда на звенья.
код |
русское название |
основное название |
ячейки |
внешн. яз-ки |
внутр. яз-ки |
52= |
ГЕРМАНСКАЯ филозона |
NORSK+ FRYSK |
6 |
25 |
205 |
52-A |
ГЕРМАНСКИЙ отряд |
NORSK+ FRYSK |
6 |
25 |
205 |
52-AA |
скандинавское звено |
NORSK+ SVENSKA |
1 |
3 |
32 |
52-AB |
английское (Anglic) звено |
ENGLISH+ ANGLO-CREOLE |
2 |
3+4 |
29+41 |
52-AC |
континентальное западно-германское звено |
FRYSK+ DEUTSCH |
2 |
5+9 |
12+90 |
52-AD |
восточно-германское звено |
"Gothic" |
1 |
1 |
1 |
Таблица 3: Членение Английского звена на внешние языки.
код |
русское название |
основное название |
внешн. яз-ки |
внутр. яз-ки |
д-ты |
52-AB |
английское (Anglic) звено |
ENGLISH+ ANGLO-CREOLE |
3+4 |
29+41 |
|
52-ABA |
АНГЛИЙСКАЯ ячейка |
ENGLISH |
3 |
29 |
|
52-ABA-a |
северо-британский внеш. яз |
Scots+ Northumbrian |
2 |
||
52-ABA-b |
южно-британский |
Anglo-English |
4 |
||
52-ABA-c |
всемирный английский |
Global-English |
23 |
||
52-ABB |
АНГЛО-КРЕОЛЬСКАЯ ячейка |
ANGLO-CREOLE |
4 |
41 |
|
52-ABB-a |
карибский креол внеш. яз |
Caribbean-anglo-creole |
25 |
||
52-ABB-b |
западно-африканский креол |
Wes-kos-anglo-creole |
7 |
||
52-ABB-c |
океанийский креол |
Oceanian-anglo-creole |
5 |
||
52-ABB-d |
китайский+ питкэрнский креолы |
Pacific-Creoles* |
4 |
Таблица 4: Членение Южно-Британского внешнего языка на внутренние языки.
код |
русское название |
основное название |
внутр. яз-ки |
д-ты |
52-ABA-b |
Южно-Британский (англо-английский) внеш. яз |
Anglo-English |
4 |
(2) |
52-ABA-ba |
старо-английский (12-17 вв.) внутр. яз |
& transitional-english |
- |
|
52-ABA-bb |
мидлэндский английский |
midlands-anglo-english |
17 |
|
52-ABA-bc |
южно-английский |
southern-anglo-english |
16 |
|
52-ABA-bd |
староирландский английский (12-16 вв.) |
& old-anglo-irish |
- |
Created in May, 2001 ¦ Last updated on Jan, 14, 2008 18:00