Частотность слов и культура
Хотя разработанность словаря, несомненно, представляет собой ключевой показатель специфических черт различных культур, он, конечно, не является единственным показателем. Родственный показатель, часто не учитываемый, состоит в частоте употребления. Например, если какое-то английское слово можно сопоставить по смыслу с некоторым русским словом, но при этом английское слово является распространённым, а русское используется редко (или наоборот), то данное отличие наводит на мысль об отличии в культурной значимости.
Нелегко получить точное представление том, сколь общеупотребительным является слово в некотором данном обществе... Результаты всегда будут зависеть от размеров корпуса и выбора входящих в него текстов.
Так действительно имеет ли смысл пытаться сравнивать культуры, сравнивая частотность слов, зарегистрированную в имеющихся частотных словарях? Например, если мы обнаруживаем, что в корпусе американских английских текстов Кучеры и Франсиса и Кэрролла слово if встречается соответственно 2461 и 2199 раз на один миллион слов, тогда как в корпусе русских текстов Засориной соответствующее слово если встречается 1979 раз, можем ли мы что-либо заключить из этого о роли, которую гипотетический способ мышления играет в указанных двух культурах?
Лично мой ответ состоит в том, что ... нет, не можем, и что было бы наивно пытаться сделать это, поскольку различие такого порядка может быть чисто случайным.
С другой стороны, если мы обнаруживаем, что частотность, приводимая для английского слова homeland, равна 5, тогда как частотность русского слова родина составляет 172, ситуация качественно иная. Пренебрегать различием такого порядка (приблизительно 1:30) было бы ещё более глупо, нежели придавать большое значение различию в 20% или 50%...
В случае слова homeland оказалось, что оба упомянутые здесь частотных словаря английского языка дают одну и ту же цифру, но во многих других случаях приводимые в них цифры значительно различаются. Например, слово stupid «глупый» появляется в корпусе C et al. 9 раз, а корпусе K&F — 25 раз; idiot «идиот» 1 раз появляется в C et al. и 4 раза — в K&F; а слово fool «дурак» появляется 21 раз в C et al. и 42 раза — в K&F. Всеми этими различиями, очевидно, можно пренебречь как случайными. Однако, когда мы сравним английские показатели с русскими, вырисовывающуюся картину едва ли можно будет отвергнуть аналогичным образом.
Английский язык (K&F / C et al.) Русский язык
fool 43/21 дурак 122
stupid 25/9 глупый 199
stupidly 12/0,4 глупо 134
idiot 14/1 идиот 129
Из этих цифр вырисовывается чёткое и ясное обобщение (относительно всего семейства слов), полностью согласующееся с общими положениями, выведенными независимым образом, на основе неколичественных данных; оно состоит в том, что русская культура поощряет «прямые», резкие, безоговорочные оценочные суждения, а англосаксонская культура — нет. Это согласуется с другими статистическими данными... использование слов terribly и awfully в английском языке и слов страшно и ужасно в русском:
Английский язык (K&F / C et al.) Русский язык
terribly 18/9 ужасно 170
awfully 10/7 страшно 159
horribly 12/1
Если прибавить к этому, что в русском языке есть также гиперболическое существительное ужас с высокой частотностью 80 и полным отсутствием аналогов в английском языке, различие между этими двумя культурами в их отношении к «преувеличению» станет ещё более заметным.
Аналогичным образом, если мы заметим, что в одном английском словаре (K&F) зарегистрировано 132 вхождения слов truth, тогда как в другом (C et al.) — только 37, это различие, возможно, поначалу приведёт нас в смятение. Однако, когда мы обнаружим, что цифры для ближайшего русского аналога слова truth, а именно правда, составляют 579, мы, вероятно, в меньшей степени будем склонны пренебречь этими различиями как «случайными».
Всякий, кто знаком как с англосаксонской культурой (в любой из её разновидностей), так и с русской культурой, интуитивно знает, что родина представляет собою... общеупотребительное русское слово и что закодированный в нём концепт культурно значим — в значительно большей степени, нежели английское слово homeland и закодированный в нём концепт. Не вызывает удивления, что частотные данные, сколь бы они ни были ненадёжны в целом, подтверждают это. Точно так же тот факт, что русские склонны чаще говорить о «правде», нежели носители английского языка говорят о «truth», едва ли покажется удивительным тем, кто знаком с обеими культурами. Тот факт, что в русском лексиконе есть ещё одно слово, обозначающее нечто вроде «truth», а именно истина (79), в отличие от частотности слова правда, не столь поразительно высока, даёт дополнительные свидетельства в пользу значимости указанной общей темы в русской культуре...