Home ¦ Реестр языков мира ¦ Карты ¦ Языки России ¦ Страны мира ¦ Publications

Систематика языков

Принципы устройства

Во многих науках существует особая вспомогательная дисциплина, помогающая упорядочивать изучаемые данной наукой объекты – систематика.

В основу Систематики языков должна, очевидно, лечь генетическая классификация языков (ГКЯ): эволюционно-генетическая группировка является естественной, а не искусственной, она достаточно объективна и устойчива (в отличие от зачастую быстро меняющейся ареальной принадлежности). На языковой систематике основывается устройство Реестра языков мира.

Для систематики характерны следующие принципы:

Единство всей системы и сравнимость единиц одного уровня должны обеспечиваться общими критериями для отнесения объектов к тому или иному уровню. Это касается как верхних уровней (семьи и группы), так и нижних (языки и диалекты). В единой систематике критерии для отнесения объектов к одному уровню должны отвечать следующим требованиям: применимость к любому объекту и непротиворечивость (или однозначность) отнесения объекта к определенному классу.

Единая система таксонов. Стройной системе таксонов в биологии лингвисты могут только позавидовать. Хотя и у нас существует немало терминов (семья, группа, ветвь, иногда фила, филум, сток), но их использование очень сильно варьирует от автора, языка описания и конкретной ситуации. Очевидно, что необходимо предложить некоторую стройную систему таксонов (лучше вместе с примерным уровнем сохранения базовой лексики для каждого уровня). Возможно, что лучше :-) даже отказаться от традиционной терминологии, чтобы она не приводила к путанице.

Единая система номинации. В отличие от биологии, где существует стройная система номинации на латинском языке с использованием бинарного названия для базовой единицы, в лингвистике ничего подобного нет и едва ли уже возникнет. Поэтому, главное, что можно сделать – это, во-первых, упорядочить названия языков в языке описания, выбрав для каждого идиома и группы идиомов основное название (см. ниже); во-вторых, в качестве дополнительного средства для однозначного обозначения языков независимо от языка описания – указывать для каждого его самоназвание (также см. ниже), – что мы и стараемся делать.

Использование данных лексикостатистики. Для определения уровня таксонов в существующей классификации (или для построения классификации, там где ее еще нет) и отнесения объекта к определенному таксону мы будем стараться пользоваться критерием сохранения базовой лексики; причем не только для построения верхних уровней классификации (что тривиально), но и для разграничения отдельных идиомов. Процент совпадений (ПС) будет даваться от стандартного 100-словного списка Сводеша. Мы намеренно акцентируемся на проценте совпадений (хотя время распада будет обычно приводиться для справки), поскольку в этом вопросе среди компаративистов не наблюдается единодушия, а на наш взгляд для построения систематики языков вполне достаточно относительного процента совпадений, а не абсолютного времени распада. Но в принципе мы ориентируемся скорее на формулу, предложенную С.А. Старостиным. Сами проценты совпадений также зачастую берутся из его базы стословников.

Группы

Единые критерии для выделения групп и семей. Наиболее удобным является критерий сохранности базовой лексики, так чтобы каждому уровню соответствовал определенный процент совпадений. Уровень группы определяется временем ее распада на составляющие (=минимальным процентом совпадений ее членов, ПЧmin), а не временем ее выделения из группы более верхнего уровня (=максимальным процентом совпадений с другими группами, ПДmax).

Возможны следующие варианты устройства таксономии:

В качестве рабочего варианта мы будем пока использовать схему из таксонов семья, ветвь и группа с прибавлением приставок над- и под- и указанием на процент совпадений для ее составляющих: АБХАЗО-АДЫГСКАЯ группа [54]. При этом ветви и группы разных семей не обязаны быть одного уровня глубины, важен лишь их относительный порядок внутри одной семьи.

Семья – верхний базовый уровень, на котором основывается вся систематика. Семья – это группа определенно, но достаточно далеко родственных языков, которые имеют не меньше 20 процентов совпадений в базовом списке. В качестве примеров см. список семей Евразии или обзор семей Африки.

В таблице приведены примеры построения систематики с использованием традиционных таксонов. Если для индоевропейских некоторые уровни можно пропустить, то для известных своей разветвленностью австронезийских их даже не хватает (так в данном пример пропущен, например, уровень центрально-восточно-океанийских языков между океанийской ветвью и отдаленно-океанийской подветвью).

Табл. 1. Примеры использования таксонов

таксон    
семья индоевропейская австронезийская
подсемья "европейская" малайско-полинезийская
надветвь   восточно-МП
ветвь балто-славянская океанийская
подветвь   отдаленно-океанийская
надгруппа   центрально-тихоокеанская (фиджи-полинезийская)
группа славянская полинезийская
подгруппа восточнославянская ядерно-полинезийская
подподгруппа   самоанско-внешняя
кластер русско-белорусский  
язык белорусский самоанский

Такой подход к построению классификаций не нов. Аналогично, например, разработана классификация для языков Мезо-Америки. В ней выделяется 6 уровней: диалект, языковой комплекс, группа, ветвь, семья и сток/филум, каждому из которых присвоен определенный процент совпадений по 100-словному списку и время распада (правда, посчитанное по формуле Сводеша) [Meso-American 1997].

Подчеркнем еще раз, что в рамках данного проекта не планируется создание новой классификации языков. Везде, где возможно, будет использоваться существующие классификации. Если таковых для какой-то семьи или группы несколько, одна будет выбираться в качестве основной, но будут приводиться сведения и о других вариантах. А при наличии соответствующих данных, при узлах существующей классификации будут указываться проценты совпадений, как показано выше.

Язык / диалект

Критерии выделения. При формализации таксонов нижних уровней (то есть язык и диалект) добавляются проблемы иного рода, помимо чисто классификационных. Уже само использование критерия структурной близости для выделения отдельных языков и диалектов может встретить немало возражений. Многие лингвисты уже привыкли к тому, что понятия "язык" и "диалект" слишком расплывчаты и их разграничение относится скорее к ведению социолингвистики. Однако для нужд такого справочника, как наш, требуется однозначное и универсальное определение языка и диалекта. Для этого критерии для отнесения идиомов к одному или разным языкам должны отвечать следующим требованиям: применимость к любому объекту (универсальность) и непротиворечивость (или однозначность) отнесения объекта к определенному классу (как и вообще критерии для отнесения объектов к одному уровню, см. выше). Посмотрим, можно ли это сделать с помощью социолингвистических критериев, используемых для отнесения идиомов к одному или нескольким языкам. Можно выделить следующие критерии:

Наличие единой этнической общности, к которой относятся носители данных идиомов. Этот критерий неудобен уже тем, что определение народа является еще более сложным. Вероятно, скорее одним из параметров для классификации народов является языковой, а не наоборот. Кроме того, постоянно наблюдается несоответствие народов и языков: американцы и англичане говорят по-английски, ирландцы говорят по-английски и по-ирландски; мордва говорит по-мокшански, эрзянски (и русски), носители аваро-андийских, цезских и арчинского языков считаются аварцами, а языки итальянцев относятся к трем разным группам романских языков. Скорее, наоборот, полное соответствие языка и народа – это редкость.

Самоидентификация носителей идиома. Многие исследователи целиком уповают на мнение носителей. Однако мнение разных носителей может не совпадать между собой; это мнение легко меняется под воздействием внешних факторов и пропаганды; утверждение одних людей, что они говорят на языке Х, может противоречить мнению других носителей этого же языка, утверждающих, что первые говорят на другом языке; и наконец, во многих культурах вообще не было и нет четкого представления о своем языке. Так что этот самый важный критерий для социолингвиста противоречит обоим поставленным требованиям.

Взаимопонятность идиомов. Этот критерий является следствием структурного различия языков и мог бы быть вынесен за рамки социолингвистики, однако реально взаимопонятность осложняется многими другими факторами, как то: знакомство с языком собеседника, тема общения, само желание/нежелание понимать собеседника и пр.

Наличие престижного наддиалектного идиома, воспринимаемого носителями данных идиомов как "свой". Общая письменная традиция (ср. немецкий термин Dachsprache "язык-крыша") часто объединяет довольно далеко разошедшиеся идиомы (например, "диалекты" итальянского, немецкого или китайского языков) или даже слабо родственные (латынь в средние века). Причем у разных частей одного идиома могут оказаться разные "крыши" (нижнесаксонские диалекты на северо-востоке Нидерландов и на севере Германии) , что противоречит принципу однозначности. А главное, это принцип заведомо не может быть применим к языкам, не обслуживаемым никакой письменной традицией.

Функциональная полноценность данного идиома. Следуя этому критерию, мы должны присвоить некоторому числу функционально полноценных идиомов статус "язык", остальные же (например, используемые лишь в ситуации бытового общения) оставить в ранге "диалектов". Безусловно, этот, хотя и очень важный, критерий невозможно использовать как универсальный для всех языков.

Таким образом, видно, что социолингвистические критерии не могут лечь в основу однозначной систематики языков. Остается обратиться к не раз уже предлагавшемуся структурному критерию. Помехой тому, чтобы его широко использовать, была естественная сложность: как сравнить степень структурного отличия немецких и китайских "диалектов"? Это действительно сложно, и единственным выходом видится использование того же процента совпадений (ПС) базовой лексики.

Однако, при попытке определить процент совпадений, необходимый для пары идиомов, чтобы считать их одним языком, оказывается, что идиомы, традиционно считаемые одним языком, имеют очень разную структурную близость. Возьмем ПС для пар (или троек) идиомов, часть из которых традиционно считается одним языком (подчеркнуты), а часть – разными, и расположим их на одной оси.

Таксоны нижних уровней. Таким образом, можно принять, что, если у двух идиомов ПС < 89 (ВР=1100), то это явно разные языки. Если ПС > 97 (ВР=560), то явно диалекты одного языка. Для оставшегося же интервала (89-97) можно предложить промежуточный уровень очень близких языков/ отдаленных диалектов. В качестве рабочего мы будем использовать для этого уровня название "наречие" в тех случаях, когда это традиционно рассматривается как компонент другого языка, и "язык", когда принято это считать отдельным языком (тогда объединение, куда он входит и соответствующее по степени близости языкам, – "кластером"). Наглядно это проиллюстрировано в таблице 2.

Табл. 2. Четыре уровня для "языков и диалектов"

уровни

примеры

 

a)

b)

Идиом-1 уровень [89-95 % совпадений между составляющими] обычно соответствует либо а) достаточно отличным языкам (плохо взаимопонятным между собой), либо б) группе (кластеру) близко родственных языков. Английский, французский русско-белорусский кластер,
иберороманский кластер
Идиом-2 [95-99] – соответствует а) наречиям (группам дилектов) или б) отдельным близкородственным языкам (частично взаимопонятным). пикардское, валлонское, "литературный французский язык" белорусский, средне-южнорусский, севернорусский; галисийский, португальский, испанский языки
Идиом-3 [99-100] – соответствует отдельным диалектам (с хорошим взаимопониманием). namurois, liégeois, wallo-picard, … псковская группа говоров (ГГ), тверская ГГ, московская ГГ
Идиом-4 – соответствует отдельным говорам (с очень небольшими структурными различиями); используется только в некоторых случаях. liégeois "proper, malmédien, verviétois, … московский городской, …

В любом случае, информация о том, чем традиционно считается данный идиом – языком или диалектом – указывается в соответствующих справочных сведениях. Разные уровни для языков и диалектов различаются визуально: разным оформлением основного названия и абзаца. См. примеры в табл. 3.

Еще примеры:

Французский (или язык ойль) язык включает в себя франсийское (на основе диалекта которого сложилось другое наречие – "французский литературный язык"), пикардское, нормандское и другие наречия.

Вайнахский кластер включает в себя чеченский и ингушский языки.

Сербохорватский кластер включает в себя чакавское, кайкавское и штокавское наречия, а последнее также сербский, хорватский и боснийский литературные языки (= диалекты).

Западно-огузский кластер состоит из турецкого, гагаузского, южно-крымско-татарского языков.

Кыпчакский кластер состоит из ногайского, карачаево-балкарского, кумыкского, татарского, башкирского, казахского, каракалпакского, (и других) языков.

Иберо-романский кластер включает в себя португальский, галисийский, астуро-леонский, испанский, (верхне-)арагонский языки.

Данная схема является удобным служебным подспорьем для удобства организации языков и диалектов в одном справочнике и для удобства сравнения степенй их близости между собой.

Идея выделения нескольких уровней языка не нова. В разной форме ее уже предлагали, например, Дэвид Долби в Реестре Лингвосферы [Dalby 2000; http://www.linguasphere.net] и Тэрренс Кауфман [Kaufmann 1997, 31-32].

Долби предлагает вместо традиционной дихотомии язык vs. диалект выделять три уровня: внешний язык (outer language), внутренний язык (inner language) и диалект. Однако, не давая им четких определений, он считает первый базовой демографической единицей классификации, а второй – базовой единицей собственно лингвистической классификации. Во многих случаях эти уровня совпадают с нашими языком1 и языком2, хотя нередки и расхождения.

Кауфман выделяет, помимо языков и диалектов, следующие случаи.

Языковая зона (language area) включает несколько идиомов, достаточно близких между собой, чтобы считаться диалектами, но достаточно далеких (ПС=92-96), чтобы их носители считали себя отдельными этническими группами, а свои идиомы отдельными языками (emergent languages, "нарождающиеся, развивающиеся языки"). В нашей терминологии это соответствует языку1 и входящим в него языкам2.

Диалектный континуум (dialect chain) объединяет ряд идиомов, соседние из которых структурно достаточно близки (ПС > 96), но чем дальше они друг от друга, тем близость становится меньше, так что между крайними диалектами взаимопонимание отсутствует, а ПС < 89 (но не > 82), то есть достаточный, чтобы считать их отдельными языками. Однако провести четкие границы внутри такой цепочки невозможно. Это явление называется также цепочечным взаимопониманием. В нашей терминологии это соответствует либо языку1 и входящим в него языкам2, с оговоркой, впрочем, о том, что языки2 в крайних точках отстоят друг от друга больше, чем на 89% совпадений, либо все-таки микрогруппе (ПС=82-89) с входящими в нее языками1 и с входящими в них языками2.

Языковой континуум / комплекс (language complex) – ситуация, аналогичная предыдущей с той лишь разницей, что в качестве составных компонентов выступают языки1 (virtual languages, "фактические языки"), границы между которыми также трудно провести. В нашей терминологии соответствует надмикрогруппе (ПС=71-81) с входящими в нее языками1 (без промежуточных микрогрупп).

Выделенные нами уровни можно попытаться соотнести со степенью взаимопонятность, что особенно полезно, когда в наличии нет посчитанных процентов совпадений между языками. Между двумя языками взаимопонятность сильна затруднена и нормальное общение невозможно без специального обучения. Внутри языка между двумя наречиями существует взаимопонятность, но не полная; коммуникация возможна, но могут возникнуть недопонимания или ошибки. Между диалектами внутри наречия существует практически полная взаимопонятность, хотя носители отмечают особенности каждого диалекта, обычно в произношении (акцент) и употреблении некоторых слов.

Макроуровни

Несмотря на то, что верхним рабочим таксоном в данном справочнике является семья, в нем будет приводиться также информация и о более глубинном родстве. Поэтому необходимо упорядочить терминологию и для более верхних уровней.

Гипотеза – предположительное объединение семей, без установления соответствий и подсчета ПС между отдельными составляющими. Как правило, делается навскидку. Например, нило-сахарская, широко-койсанская гипотеза.

Макросемья (= фила) – объединение семей, с хоть как-то установленными соответствиями и примерно посчитанными ПС. Таковы, видимо, ностратическая, сино-кавказская, койсанская макросемья.

Надсемья – объединение близких семей (ПС = 18-20), которые часто считаются одной семьей, но в соответствие с нашим определением семьи, должно быть вынесено в более верхний уровень. Надсемьей, видимо, является алтайские языки в широком смысле (включая японский и корейский) и австронезийские.

В работах преимущественно зарубежных лингвистов (см. например, [Kaufman 1994: 32; Wurm 1994: 93; Voegelin 1977: 2-3]) употребляются и другие термины:

Сток (stock) – это объединение семей (families), которые в этом случае понимаются более узко, нежели определено выше. Примерами стоков являются индоевропейский (с германской, романской и другими семьями), уральский, тибето-бирманский, автронезийский; таким образом, сток, как правило, соответствует нашей семье.

Филум/ фила (phylum, pl. phyla) – это объединение стоков (называемое также надстокsuperstock) или семей (если термин сток не используется), причем, как правило, скорее предполагаемое, нежели доказанное. В целом соответствует макросемье.

О других терминах см. Глоссарий.

Раннюю версию смотри в статье "Систематика языков мира и базы данных".

ЮК


This page is a part of Lingvarium project website www.lingvarium.org

 

Supported by Linguistic Community Mastered by: Yuri Koryakov e-mail: lingvarium @ gmail.com

Яндекс цитирования

Created in January, 2004 ¦ Last updated on Jan, 11, 2008 14:55