The Miracle of English Vocabulary: A Quantitative Analysis | 25 февраля 2016 года, 15:02

Про словарный запас в английском языке и про изучение языка. Вчера в учебных целях посмотрел фильм 2000 года “The Miracle Worker” про детство Хеллен Келлер. Там довольно простой и понятный английский и интересный биографический сюжет.

Сегодня решил ответить на вопрос, а настолько богатая лексика в фильме. Сколько надо знать слов, чтобы понимать хотя бы субтитры?

С помощью нехитрых приспособлений (Wget, Perl, Bash) я сделал следующее:

* Выкачал файл с субтитрами,

* Вырезал из них только реплики. Получилось 1409 реплик,

* Разбил на слова. Убрал спецсимволы, знаки препинания. Убрал повторные слова (остались уникальные). Получилось 1095 слов,

* Как мог убрал формы слов (множественное число, прошедшее время, наречия, ing-формы). Осталось 982 слова,

* Скормил их переводчику lingvo. Он опознал и перевел 898 слов,

* Если оттуда убрать однобуквенные слова, которые я не заметил на раннем этапе, выйдет около 875-880 слов.

Файл с полным перечнем слов и переводами, а также ссылка на сам фильм в онлайне – на моем блоге https://beinginamerica.com/2016/02/26/how-many-words-you-need-to-know/.

Итого, для того, чтобы на 100% понимать абсолютно все в фильме, нужна лексика всего в 880 слов. А?

https://beinginamerica.com/2016/02/26/how-many-words-you-need-to-know/

Оставьте комментарий