Сколько слов в русском языке и сколько слов в английском языке?

Угрожающие попытки "развенчать мифы о великом и могучем"

Хорошо известно, что словарный запас различных языков неодинаков. Лексикон цивилизованного человека может в десятки раз превышать словарный запас представителя какого-нибудь дикого племени Африки. Также понятно, что и в пределах одного и того же языка у разных носителей словарный запас сильно различается: у ребенка и взрослого, у дворника и профессора... В любом случае, ни у кого не возникает сомнений, что более обширный словарь всегда связан с запасом знаний и интеллектуальным превосходством. А теперь внимание: что бы вы подумали, если бы вам официально заявили, что наш русский язык - дикарский, содержит в пять раз меньше слов, чем английский? Конечно, возмущенно оспорили бы эту чушь! Однако подобное "научное мнение" неоднократно транслируется в СМИ. Это не может не настораживать.

Последний раз это утверждение прозвучало с телеэкранов в 2011 году. Но обсуждать и анализировать легче не телепередачи, а печатные материалы, с которыми легче ознакомиться (например, в интернете). Так, можно заглянуть в архив журнала "Наука и жизнь". В 6-м номере за 2009 год опубликована доктора филологических наук (!), некоего Милославского, под издевательским названием "Великий, могучий русский язык". В нем автор "развенчивает мифы" о русском языке. В частности, утверждается, что "по весьма огрубленным подсчетам, словари английского литературного языка содержат порядка 400 тыс.слов, немецкого - порядка 250 тысяч, русского - порядка 150 тысяч". Из чего предлагается сделать выводы о том, что "богатство русского языка - миф" (почти дословная цитата). Вообще, статья написана в духе самооплевывания, характерного для начала 90-х; меня даже несколько поразила ее анахроничность. Не говоря уж о полной ненаучности.

Автор даже не упомянул о сложностях и проблемах подсчета слов и вообще о проблеме возможности и уместности сколь-нибудь научного определения и сравнения словарного запаса целых языков. Считаю необходимым привести следующие возражения.

1) В разных культурах различны критерии "допуска" слов в литературный язык. В континентальной традиции господствует централизованное планирование, тогда как у англосаксов во всем стихия рынка (неформальный подход). Например, у французов лексика проходит строгую цензуру со стороны такого органа как Academie Francais (Академия французского языка). Она решает, какие слова принадлежат литературному французскому языку, а какие нет. В силу такой цензуры сложилась ситуация, когда считается, что во французском языке, со всей его богатейшей литературой, не более 150.000-200.000 слов. В английском же каждый может придумать слово и сразу ввести его в язык. Так, Шекспир писал, что придумал около 1,7 тыс.слов из своего писательского словаря в 21 тысячу слов. Это, кстати, огромное достижение для писателя, его превышает только наш Пушкин: 24 тыс.слов, абсолютный и непревзойденный индивидуальный рекорд активного словаря всех времен - см. "Словарь языка Пушкина" в 4-х томах (М., 1956-1961). Большинство же образованных европейцев активно используют не более 8-10 тыс.слов, а пассивно - 50 тыс. и более.

Очевидно, названные автором той статьи 150.000 русских слов - это слегка округленный объем широко известного Большого Академического словаря русского языка (БАС), который в издании 1970 года в 17 томах насчитывал 131 257 слов. А английские 400.000 - это, по-видимому, последние издания Оксфордского и Вебстера. Причем в предпоследних изданиях этих же английских словарей слов было в несколько раз меньше (конкретику можно посмотреть в интернете). Откуда же такой прирост и почему их словари содержат больше слов, чем наши? Первая причина - беззастенчивый подсчет архаизмов, которые современные англичане и американцы, конечно же, не знают. В английской филологической традиции лексикой современного английского языка считаются все слова со времен Шекспира (современника Ивана Грозного и Бориса Годунова). В российской же традиции вся допетровская, а с подачи знаменитого лексикографа Ушакова - и допушкинская лексика считается древне- или старорусской.

Вторая причина в том, что стали еще менее строгими критерии "приема" новых слов в язык. Подходы к английскому языку становятся всё более смелыми, появляющиеся в интернете оценки просто фантастичны. Так, агентство GLM (Global Language Monitor, сайт www.languagemonitor.com) рапортует о появлении... миллионного слова в английском языке! По тому, какое слово считается миллионным, сразу понятно, за какую свалку мусора они пытаются выдать английский язык: это "слово" Web 2.0! И это наряду с тем, что (the) web ("паутина") считается отдельным словом. Очевидно, Web 1.0 тоже где-то посчитали как отдельное слово! Более того, они не стесняются считать словами словосочетания: в качестве 1 000 001-го слова посчитано "financial tsunami" - "Финансовое цунами". В таком случае и в русском языке наряду со словами "финансовый(-ая,-ое)" и "цунами" есть слово "финансовое цунами", которое можно посчитать. Впрочем, пуристы, составлявшие БАС, вряд ли включили в него слово "цунами", поскольку это иностранное заимствование (об этом см. следующий пункт ниже).

Для справки:

Анализ компании Global Language Monitor состоит из нескольких этапов. На первом этапе подсчитываются слова, которые вошли в известнейшие словари английского языка: Merriam-Webster"s, Oxford English Dictionary, Macquarie"s . При этом стоит заметить, что в последнее издание словаря Merriam-Webster"s вошло только 450 тысяч английских слов. На втором этапе сотрудники компании на основе специального исследовательского алгоритма учитывают все неологизмы английского языка. При этом производится анализ текстов в сети Интернет, включая блоги и другие неформальные сетевые ресурсы. Учитываются периодические издания, как в электронном, так и бумажном виде, новинки литературы различной направленности. Именно этот прием в работе компании Global Language Monitor вызывает шквал критических замечаний со стороны независимых экспертов. Главный упрек сводится к тому, что при подсчетах в лексику английского языка включаются как устаревшие слова и словосочетания, так и сленговые образования. Кроме того, при своем методе учета, компания учитывает и слова, употребляемые только в разновидностях английского языка, к примеру, в Китае и Японии. А это составляет порядка 20% от общего количества слов, которые признаются специалистами компании. Вдобавок ко всему, в качестве лексических новинок английского языка, учтены и языковые ляпы, допущенные Президентом США - Бушем.

Предлагаю: внести в словарь все ляпы Черномырдина и тем самым "перегнать Америку"!

Классические методы учета слов гораздо консервативнее. К примеру, Оксфордский словарь учитывает только 300 тысяч слов.

2) Английский не только создает свои, но и весьма активно заимствует чужие слова из языков всего мира. Мы жалуемся на засилье английских заимствований, но тот слой научно-технической и деловой лексики, который проник в наш язык с падением железного занавеса, - это лишь жалкая горсточка по сравнению с активными заимствованиями, без всякого ложного стеснения производимыми английским языком. Еще со времен Вильгельма Завоевателя он наполовину французский. Получается, что мы заимствуем заимствованное! Или, образно говоря, перекупаем купленное. А теперь, когда миллионы людей в транснациональных компаниях общаются на английском, который для них неродной, возникают целые пласты лексики "китайского английского", "латиноамериканского английского", "японского английского". Эти пласты лексики относятся к так называемым окказионализмам .

Для справки:

Окказионализмы - это слова, созданные спонтанно, для однократного употребления. Встает вопрос - с какого момента считать это слово частью словарного запаса? Сколько нужно повторений этого слова в речи или в печати, чтобы прийти к выводу, что оно перестало быть случайным артефактом и стало полноправной частью лексики?

Существуют также слова, ограниченные очень узкой частью социума. Скажем, одной семьей. Реальный пример: все члены одной известной мне семьи называют вареную картошку, поджаренную с колбасой, словом «второжарёнка». Это их собственное изобретение, и больше я такого слова нигде не встречал. Можно ли считать этот окказионализм полноправной частью русской лексики?

С запозданием обнаружил старую новость.

English passed the Million Word mark earlier today, June 10 at 10:22 am GMT
The Global Language Monitor today announced that Web 2.0 has bested Jai Ho , N00b and Slumdog as the 1,000,000 th English word or phrase added to the codex of fourteen hundred-year-old language. Web 2.0 is a technical term meaning the next generation of World Wide Web products and services. It has crossed from technical jargon into far wider circulation in the last six months…

At its current rate, English generates about 14.7 words a day or one every 98 minutes.


These are the fifteen finalists for the one millionth English word, all of which have met the criteria of a minimum of 25,000 citations with the necessary breadth of geographic distribution, and depth of citations.
1,000,000: Web 2.0 - The next generation of web products and services, coming soon to a browser near you.
999,999: Jai Ho! - The Hindi phrase signifying the joy of victory, used as an exclamation, sometimes rendered as “It is accomplished”. Achieved English-language popularity through the multiple Academy Award Winning film, “Slumdog Millionaire”.
999,998: N00b — From the Gamer Community, a neophyte in playing a particular game; used as a disparaging term.
999,997: Slumdog - a formerly disparaging, now often endearing, comment upon those residing in the slums of India.
999,996: Cloud Computing - The ‘cloud’ has been technical jargon for the Internet for many years. It is now passing into more general usage.
999,995: Carbon Neutral — One of the many phrases relating to the effort to stem Climate Change.
999,994: Slow Food — Food other than the fast-food variety hopefully produced locally (locavores).
999,993: Octomom - The media phenomenon relating to the travails of the mother of the octuplets.
999,992: Greenwashing - Re-branding an old, often inferior, product as environmentally friendly.
999,991: Sexting - Sending email (or text messages) with sexual content.
999,990: Shovel Ready - Projects are ready to begin immediately upon the release of federal stimulus funds...


In addition, the 1,000,001 st word is Financial Tsunami - The global financial restructuring that seemingly swept out of nowhere, wiping out trillions of dollars of assets, in a matter of months
Each word was analyzed to determine which depth (number of citations) and breadth (geographic extent of word usage), as well as number of appearances in the global print and electronic media, the Internet, the blogosphere, and social media (such as Twitter and YouTube). The Word with the highest PQI score was deemed the 1,000,000th English language word. The Predictive Quantities Indicator (PQI) is used to track and analyze word usage.
Global Language Monitor has been tracking English word creation since 2003. Once it identifies new words (or neologisms) it measures their extent and depth of usage with its PQI technology.

http://www.languagemonitor.com/news/1000000th-english-word-announced

На 4 октября 2009 г. в английском языке уже 1002116 слов.
http://www.languagemonitor.com/

А сколько слов в современном русском языке?
С какой скоростью увеличивается количество слов в нем?
Ведет ли кто-нибудь его мониторинг?

П.С.
Пока максимальная оценка - Словарь В.Даля, около 200 тыс. слов.

Английский стал первым языком, в котором словарный запас перешагнул миллионный рубеж, заявила американская группа исследователей The Global Language Monitor.

Ни один существующий ныне язык не обладает таким объемным словарным запасом, как английский. Словарь его пополнялся 1,5 тысячи лет. И вот теперь порядковый номер, равный миллиону, получило слово «Web 2.0» .

Но прежде чем слово нового поколения признали, оно должно было появиться в текстах 25 тысяч раз (только в этом случает какое-либо обозначение имеет право на статус слова). The Global Language Monitor, следящая за употреблением новых терминов пользователями Интернета, подтвердила, что слово встречается в поисковых запросах более 25 тысяч раз и за последние полгода стало общеупотребимым. Этот факт был зафиксирован 10 июня 2009 года.

«Глобал лэнгуидж монитор» базируется в Калифорнии и имеет «наблюдателей» едва ли не во всех точках мира, пишет Итар-Тасс. Они внимательно следят за появлением любых неологизмов, направляя свежие данные в центральный офис службы. По их подсчетам, количество слов в современном английском языке увеличилось за последнюю тысячу лет примерно в 20 раз. Ожидалось, что словарный запас перевалит за миллион еще в 2006 году (тогда активно пополняющийся английский словарь насчитывал 986 тыс. 120 слов). Но случилось это лишь три года спустя.

Предполагалось, что слово придет из гибридов английского языка - чайнглиша, хинглиша или спанглиша. Хотя не исключалась возможность проникновения слова из молодежной субкультуры или веб-сленга, что и произошло.

В ходе мониторинга неологизмов было обращено особое внимание на слова: «снэпарацци» - люди, использующие мобильный телефон со встроенной фотокамерой для съемки знаменитостей; «подкаст» - цифровая запись радио и иных программ, которую можно скачать из Интернета для последующего прослушивания; и «мисандерэстимейт», как Дж. Буш после трагических событий в сентябре 2001 года назвал вопиющую недооценку угрозы и возможностей международного терроризма. А из Китая узнали слово «дринкти», что означает перерыв на чаепитие в мелкой торговой лавке.

Конечно, не все неологизмы в итоге попадают в Оксфордский словарь, но многие из них уверенно входят в повседневный речевой обиход. Английский язык превратился в своего рода лингва-франка - универсальное средство межэтнического общения во многих сферах деятельности. В этом смысле он давно выполняет функцию, которую некогда хотели возложить на подзабытый ныне эсперанто. А поскольку «инглиш» весьма распространен, он более других языков открыт все новым и новым заимствованиям.

Ученые установили, что Шекспир использовал во всех своих произведениях от 20 до 24 тыс. слов, 1700 из которых придумал сам. Более 50 шекспировских неологизмов используются до сих пор. Для того чтобы понять, что такое миллион слов, достаточно привести некоторые научно подтвержденные данные. Например, взрослый носитель английского языка в зависимости от уровня образования употребляет в своей речи от 10 до 50 тыс. лексем. Среднестатистический англичанин , американец, канадец и т. д. знают значение около 75 тыс. слов, но далеко не все активно используют. Наконец, в словаре младенца в возрасте от полутора до двух лет - не более пяти десятков речевых единиц.

И хотя ученые утверждают, что английский стал первым языком-миллионером, в этом можно усомниться. Один из наиболее авторитетных в мире специалистов по английской филологии, британский академик Дэвид Кристал убежден, что «инвентаризация» лексикона - вообще бессмысленная затея. Считать ли, скажем, словами аббревиатуры наподобие CNN или IBM? Могут ли считаться разными словами английский и американский орфографические варианты написания слова «цвет» («color» и «colour»)? Нужно ли включать в общую статистику научные термины, для классификации которых применяется латынь? Кроме того, ставится под сомнение, можно ли назвать «словом» обозначение, содержащее в себе цифры (Web 2.0)? Скорее всего, это - словосочетание. По оценке Кристала, английский лексикон увеличивается медленнее, чем полагает The Global Language Monitor, - приблизительно на тысячу новых слов в год. Но так как других, более достоверных подсчетов нет, да и статистики по нашему родному русскому языку - тоже. Остается лишь доверять исследованиям и подсчетам американской группы исследователей.


С каждым годом количество слов в английском языке растет: в сутки появляется 14,7 лексических единиц. Со времен существования Шекспира, использовавшего в своих произведениях в среднем 20 000 слов, в английском языке многое изменилось. Некоторые слова сегодня практически не используются, а вот о вновь появившихся еще пока мало кто знает.

Довольно сложно точно ответить на вопрос о количестве слов в английском языке, т. к. число это постоянно растет. Еще с десяток лет тому назад число в 500 000 слов для изучающих английский язык казалось зловещей цифрой, сейчас же студенты проще реагируют на растущие цифры, понимая, что все слова охватить не получится, да и зачем.

Основным фиксатором лексики в английском языке является «Global Language Monitor » (GLM), эта же организация записывает каждое новое слово, появившееся в журналах и газетах, научной и художественной литературе, а также на просторах интернета, а именно в социальных сетях, блогах, подкастах.

И если вам еще не терпится узнать количество слов, то по данным «GLM » на первое января 2016 года их было 1 035 877 .

Каково же было удивление, что топовым словом 2015 года стало “microaggression ”, а самым популярным выражением — “migrant crisis ”. Почему именно эти слова стали популярными, думаю, всем понятно. “Microaggression ” – научный термин, занявший все европейские и американские таблоиды, а вот “migrant crisis ” – выражение, характеризующее перемещение более миллиона беженцев с Ближнего Востока (преимущественно из Сирии, Ирака и Афганистана), а также из стран Северной Африки в Европу. Эта миграция является самой большой со времен Второй мировой войны.

2014 год характеризовался совершенно другими словами и выражениями, и вектор слов даже близко не касался политических событий в мире. Слово “emoji ” захватило сердца миллионов людей на планете, поэтому сегодня даже карапузы знают, что это такое (если вы уже не карапуз, но все еще не знаете, о чем речь, тогда подсказываем – идеограмма, смайлик или улыбочка).

Английский язык продолжает уверенно шагать по планете, позволяя словам все глубже проникать в каждую сферу деятельности и в мировое сознание. Так, выражение “climate changing ”, употребляемое с окончанием “ing” указывает на продолжительное изменение климата. Далеко не новое слово “refugee ” – беженец, снова звучит все чаще и чаще, описывая мигрантов, которые вынуждены были покинуть дома из-за войны.

Content ” – модное словечко, обозначающее информацию, материал. К популярным словам 2015 года еще отнесли “affluenza ” – сочетание “affluence ” + “influenza ” = достаток + грипп, на самом деле обозначающее здоровых состоятельных людей, которых одолевает отсутствие мотивации, чувство вины и ощущение изоляции. ”Opioids ” – в США от опиоидных болеутоляющих и героина погибают гораздо больше людей, чем от автомобилей и вооруженного насилия.

Среди распространенных выражений 2015 года присутствует также “digital darkness ” (цифровая тьма) – то, что может произойти, если мы перестанем получать доступ к цифровой информации, поэтому на всякий случай сохраняйте бумажные копии любимых фотографий.

Как слова становятся популярными?

Для того чтобы попасть в список «GLM» слово должно соответствовать определенным требованиям:

Глубина определяется появлением в различных формах в СМИ, широта – распространением слова по всему миру, не ограничиваясь определенной сферой деятельности.

Сегодня к популярным словам относят не только достижения науки и техники, не только гибриды “spanglish”, “danglish” и прочие, но и молодежный сленг, а также веб-сленг.

Отметим, что в обиходе носителя языка насчитывается примерно 50 000 – 70 000 слов , многие из которых практически не используются. Человеку, только собирающемуся освоить иностранный язык, на первоначальном этапе достаточно будет усвоить 3 000 – 5 000 слов. В идеале для чтения литературы, понимания происходящего и полноценного общения нужно запомнить 15 000 – 17 000 лексических единиц.

Это интересно:

Для того чтобы напечатать все слова, имеющиеся в английском языке, человеку понадобится 744 дня, при условии восьмичасового рабочего дня и десятиминутного перерыва в час. Однако при этом словарный состав будет пополняться и вам придется потратить гораздо больше времени, а именно 2 года 135 дней и 4 часа.