Сколько слов в языке? (1 часть)



Не правда ли, вопрос в заглавии напоминает другой «наивный» вопрос: «Сколько звезд на небе?» Помню свое разочарование, когда в детстве узнал, что пушкинский звездочет не считал звезды, а читал по ним судьбу. Сосчитать их казалось мне куда более важной задачей. Возможно, что для человечества в его младенчестве задача счета заключала в себе особый интеллектуальный вызов. Недаром сохранилось так много загадок, в которых звезды — это нечто, что мы безуспешно пытаемся перечислить. «Рассыпалось золото по черному бархату, никому его не собрать: ни попам, ни дьякам, никаким хитрякам, никаким серебрянникам».
И вот что еще поразительно: профессиональные астрономы на протяжении веков занимались самыми разными вычислениями, а звезд не считали. Всего лишь лет двести назад, то есть совсем недавно, учитывая почтенный возраст этой науки, английский астроном Вильям Гершель начал свое «черпание звезд». Но и его интересовало совсем не общее число звезд, а неравномерность их распределения в пространстве. Считая звезды, он пытался определить форму нашей Галактики.
Краткий экскурс в астрономию дал нам простой пример еще одной проблемы, которую так соблазнительно «атаковать в лоб». Ведь слова, как и звезды, казалось бы, можно перебирать поштучно — бери и считай: раз, два... И не оставляет чувство, что этот подсчет, как и подсчет звезд, кто-то давным-давно сделал. Но в действительности лингвисты были еще более равнодушны к поставленному нами вопросу, чем астрономы к подсчету звезд. Мелькающие в популярных изданиях сведения о том, что в таком-то языке столько-то сотен или миллионов слов, характеризуют в основном воображение авторов. А главное — нет объяснений, каким образом получены эти данные.
Ну, что же, если никто до нас не брался за подсчет слов, попробуем сделать это сами. Но не будем тешить себя иллюзиями — в лучшем случае хотя бы для себя ответим на вопросы: возможно ли это, а если возможно, то нужно ли, а если нужно, то для чего?
Прежде чем начать считать, хорошо бы знать, что именно мы будем считать, то есть что такое слово.
И здесь мы  сталкиваемся с парадоксальной     ситуацией.      Шумеры или хетты выделяли и классифицировали слова практически так же, как и мы сделали бы это сейчас. Но тем не менее даже сейчас, после каких-нибудь четырех тысяч лет практики, лингвисты не слишком преуспели в теории. Не то чтобы вообще никаких определений слова не было, их предостаточно. Одно из первых принадлежит еще Дионисию Фракийцу (170—90 годы до новой эры): «Слово — это наименьшая часть связного предложения». А вот одно из последних: «Слово — это последовательность букв, заключенная между двумя пробелами».
Хотя эти определения разделяет более двух тысяч лет, они оба просто ссылаются на опыт членения связных текстов на части. Единственная новость в том, что в течение двух тысяч лет сам этот опыт нашел более или менее последовательное отражение в орфографии. Дионисий Фракиец не мог ведь сослаться на пробелы — в его время как эллины, так и другие народы обходились без них.
Да вряд ли вообще когда-либо можно будет дать вполне удовлетворительное    определение    слова. Просто   в   языкознании   нет   более очевидного, наглядного и  важного понятия, через которое можно было бы определить слово. Великий немецкий лингвист Вильгельм Гумбольдт писал: «Слово есть полный, распустившийся цвет языка; в слове язык дает свое окончательное произведение...»
Но ведь и Вильям Гершель, когда начал считать звезды, не имел никакого определения звезды! Вместо этого у него были составленные его предшественниками каталоги, где перечислены типичные, удобные для наблюдения, так сказать, образцовые звезды. Их давно уже научились отличать от планет и их спутников, от комет... А Гершелю пришлось научиться отличать их от туманностей, которые были хорошо видны в его мощный телескоп.
В таком же приблизительно положении находимся и мы. У нас. нет «магической формулы» слова, но есть тщательно подобранные примеры — словарь. Словарь, конечно, не просто список «стандартных блоков», из которых строится текст (такие стандартные блоки обычно называют формами слов или словоформами), но «типизированных блоков». То есть при составлении словаря, как правило, отвлекаются от грамматических различий между словоформами: вместо стоя, стола, столами в словаре будет представлена лексема стол, а вместо бегу, бежал, буду бежать -+ будет только бежать.
С помощью грамматических правил для каждой лексемы можно образовать совершенно определенное число форм. Соответствующие правила обычно имеют вид таблиц, которые прилагаются к словарю. Поэтому если сосчитать лексемы, то число форм, будь в этом нужда, получить уже легко.
Решая, что перед ним — слово члц нет, лингвист использует словарь примерно так же, как биолог-систематик собранную коллекцию: «Знакомясь с многочисленными представителями какого-либо рода, мы узнаем, какие признаки у них варьируют, в каком направлении и в каких пределах. В результате этого ознакомления у нас и складывается представление о типе рода.
У хорошего систематика это представление очень отчетливое. Руководствуясь им, он смело включает вновь открытую форму в данный род или, наоборот, выделяет из его состава формы, которые не подчиняются законам варьирования признаков, характерным для этого рода, и которые, таким образом, являются чуждыми его типу, не укладываются в его поле. Но этот систематик, конечно, никак не сможет нарисовать или описать тип, хотя он является для него настоящей реальностью...» (из письма Б. С. Кузина — А. А. Любищеву).
Языкознание не в меньшей, вероятно, степени, чем систематика, есть искусство рассуждать на примерах.
Поэтому посмотрим прежде всего, какие коллекции русских слов есть в нашем распоряжении. Наименьшие по объему словари — это словари-минимумы, включающие, как правило, две-три тысячи слов. Эти словари предназначены для первоначального ознакомления с неродным языком в школе или в вузе и должны быть «пройдены» за определенное число учебных часов. Головоломная задача, которую пытаются решить их составители, напоминает, как мы в детстве менялись перочинными ножиками. Нож был спрятан в руке, и весь азарт игры состоял в том, чтобы по крохотному кончику лезвия угадать, что предлагается в обмен. Один из лучших словарей такого типа, действительно позволяющий нечто сказать о лексике русского языка по ее «кончику» (в словаре примерно две с половиной тысячи слов), предназначен для учащихся эстонских школ (составители Э. Роовет и Э. Штейнфельдт). Я раскрыл этот словарь наугад и выписал подряд восемь следующих слов: двенадцать, дверь, двести, движение, двое, двор, дворец, девочка.
Следующий тип словарей — «карманные», их объем примерно в три раза больше словаря-минимума — семь-восемь тысяч слов. Это исключительно двуязычные словари (русско-английский, русско-немецкий и т. д.). Хотя подобные словари давно издаются во всем мире, никогда не было ясно, зачем они нужны: то ли в качестве шпаргалки, то ли — сувенира.
Чтобы понять, какие новые примеры слов дают эти более пространные словари по сравнению со словарями-минимумами, выберем из них те слова, которые можно вставить, учитывая алфавитный порядок, между двенадцать и девочка. При этом будем учитывать только те, что есть в большинстве подобных словарей. После просмотра нескольких словарей в нашем списке, кроме исходных восьми, оказалось еще четырнадцать слов: двигатель, двигаться, двинуться, двоеточие, двойка, двойник, двойной, дворник, двоюродный, двуличный, двурушник, двусмысленный, двухэтажный, девать.
Вновь утроим объем нашей коллекции. Двадцать —: двадцать пять тысяч слов — это стандартный объем «краткого» двуязычного словаря. Такие словари тоже издаются во всем мире. Помещенных в них слов уже достаточно для чтения, например, газеты. И вновь отберем слова, попавшие в большинство таких словарей, но которых нет в более кратких. Список пополнится еще сорока словами; среди них: двигать, движимость, движимый, двоиться, двойня, дворняжка, двоякий, двухколейный, дебаты, дебри, деверь, девиз и другие.
Утроенный объем «краткого» словаря — семьдесят — восемьдесят тысяч слов. Это объем либо «большого» двуязычного словаря, либо толкового одноязычного словаря, который претендует на то, чтобы достаточно полно отразить лексику современного литературного языка. К этому типу словарей относится выходящий сейчас вторым изданием «Словарь русского языка» в четырех томах — так называемый «Малый академический» (первое издание 1957— 1961 годы; 82 159 слов), и несколько устаревший, но все ещё очень ценный «Толковый словарь русского языка» под редакцией Д. Н. Ушакова (1934—1940 годы; 85 289 слов). Аналогичные по задачам и объему словари изданы для всех основных европейских языков.
Здесь нужно упомянуть еще о двух типах словарей, занимающих как бы промежуточные положения по отношению к словарям описанной выше «тетрады». О двуязычных словарях, которые примерно в два раза больше «карманных» (15 тысяч слов или около того), ничего особенно интересного сказать нельзя. Другое дело словари, примерно в два раза большие «кратких».
Двуязычные словари на 50 тысяч слов пользуются наибольшей популярностью, так как они позволяют решить большинство вопросов, которые возникают у человека, прилично владеющего языком, при чтении иностранного текста, и — что удобно — обычно издаются в одном томе. Такой же объем имеют и самые маленькие, но и самые популярные толковые словари. Сюда относится всем известный словарь С. И. Ожегова (четырнадцатое издание, 1983 год; около 57 тысяч слов).
Выписав из академического словаря и словаря Ушакова слова, пополняющие мой список, я вставил несколько слов, пропущенных в них, но вошедшие в «пятпдесяти-тысячники», или в словарь Ожегова. В результате в списке появилось 220 слов. Среди них были такие, которые нельзя связать ни с    какой   специальной   областью: дворик, дворничиха, двубортный, двукратно, двоедушие, двуногий и т. д. Но были и уже «попахивающие» химией (двуокись, двууглекислый, двухатомный), биологией (двоякодышащие, двудольный, двудомный, двулетник), геологией (девон, девонский), экономикой (дебет, девальвировать, девиза, девизный) и т. д. Впрочем, каждое из этих слов вполне могло появиться и не в специальном тексте.
Интересно, какие новые слова появились бы в списке, если бы можно было заглянуть в словарь раза в три больше, чем самый полный словарь «тетрады»? К сожалению, для русского языка такой словарь — в нем было бы 200— 250 тысяч слов — не составлен. К этому объему приближается «Толковый словарь живого великорусского языка» В. И. Даля. Но нисколько не преуменьшая достоинств этого удивительного словаря, нужно заметить, что, во-первых, первый том первого издания этого словаря вышел 120 лет назад, во-вторых, он совершенно не сопоставим с рассмотренными выше словарями.
Дело в том, что пока все использованные словари — это словари литературного русского языка, то есть они фиксируют результаты выбора одного или нескольких способов выразить нужное понятие из огромного количества других способов, которые не противоречат законам русского языка. Пару близнецов можно было бы назвать двойней, двойняшками, двояшками, двойнями, двойчатами, двойчатками, двойничками, двойнишками, двояками, двоячками, двоя-тами и т. д. Не понятно, почему мы не называем их двушками, а двухкопеечную монету — двойняшкой.
В данном случае литературный язык, то есть, попросту говоря, небольшая, но влиятельная часть общества — «пишущая братия», выбрал двойню, не отверг двойняшек (ограничив их употребление пометой «разговорное»), но отказался от двояшек (с пометой «просторечное» — это слово вне литературного языка).
При этом словарь часто не только фиксирует выбор, сделанный носителями литературного языка, а производит свой, еще более жесткий «нормализующий» выбор.
Выбор, сделанный «пишущей братией», не обязательно является окончательным. Судя по всему, двойни или двойчатки на границе XIX и XX веков вполне укладывались в тогдашнюю норму, а слово двойня в начале XIX века, наоборот, казалось неприемлемым. Поэтому объем в 200—250 тысяч слов должен был бы иметь словарь, отражающий принятые сейчас решения и всю историю их принятия. Такие словари обычно опираются на большое число цитат, взятых из наиболее авторитетных источников соответствующего периода. К этому типу словарей у нас ближе всего «Словарь современного русского литературного язы ка» (1948—1965 годы) в сем над цати томах, но он отражает только последние 150 лет истории лите ратурного языка. Итак, для того чтобы убедиться в неполноте собранной коллекции, даже не нужно сравнивать ее со словарями-рекордсменами. Но все-таки, говоря словами Б. С. Кузина, она позволяет узнать, какие признаки включенных в нее представителей варьируются и в каком направлении. Может быть, мы поймем, и в каких пределах варьируются эти признаки? А тут уж рукой подать до ответа на наш основной вопрос...

Окончание статьи - читать.