20 мая 2018 года, 14:14

Интересно, как точно у нас работает речевой аппарат и распознавание звуков мозгом. Взять, к примеру, слоги «па» и «ба».

Разница между «па» и «ба» заключается лишь во времени задержки звука перед гласным: если задержка дольше, мы слышим «п», если короче – «б». Поднесите руку к шее в области голосовых связок: при произнесении «ба» губы размыкаются одновременно с вибрацией связок; при произнесении «па» вибрации запаздывают.

График показывает, что разница порождается в районе 20-30 мс задержки

Вдруг я понял, что мое имя стоит на пауза | 07 мая 2018 года, 11:15

Вот так на 41-году жизни узнаешь, что правильно в моем имени ударение ставить на второй слог, а не на первый, как меня родители всегда называли)

https://udaren.ru/%D0%A0%D0%B0%D1%83%D1%84

https://udaren.ru/%D0%A0%D0%B0%D1%83%D1%84

04 мая 2018 года, 15:41

“Медуза” вытащила из пыльных заколок слово “многажды” и использует вовсю)

https://www.google.com/search?rlz=1C5CHFA_enUS780US780&{google:acceptedSuggestion}oq=%D0%BC%D0%BD%D0%BE%D0%B3%D0%B0%D0%B6%D0%B4%D1%8B+site%3Ameduza.io&{google:instantFieldTrialGroupParameter}sourceid=chrome&ie=UTF-8&q=%D0%BC%D0%BD%D0%BE%D0%B3%D0%B0%D0%B6%D0%B4%D1%8B+site%3Ameduza.io

31 марта 2018 года, 14:48

Кроме “as though”, который встречается 51 раз в первом Гарри Поттере и ноль в двух Нарниях, я заметил, что Роулинг любит использовать глагол “stare” – 58 раз в “Филосовском камне”, в то время как в двух Нарниях – 9 раз.

30 марта 2018 года, 16:55

Читаю первого Гарри Поттера, обратил внимание на любовь Роулинг к “as though”.

В книге это словосочетание повторяется 51 раз, в то время как в первых двух книгах Нарнии, например, – ни разу. По таким параметрам можно, наверное, автоматически угадывать кто автор книги даже по фрагменту без имен собственных, если натренировать на словосочетаниях и грамматических паттернах)

Быстрый просвет: если if… | 23 октября 2017 года, 18:30

Только что пришла из школы бумажка, на которой я нашел интересную грамматическую конструкцию “if school _will_ close early, the announcement _will_ be made…”. Нас всегда учли, что после if будущего времени быть не может. Я знаю про три исключения:

1) если if употребляется в значении “ли” (“Doctor, can you tell me if my hamster will have babies?”)

2) если will употребляется в значении willingness (“I think I will warm some water for tea if you will excuse me.”)

3) если часть в if идёт по времени после части then (легче на примере показать: “If aspirin will ease my headache, I will take a couple tonight instead of this horrible medicine.”)

P.S. Спасибо, что-то я проглядел, тут и правда третий случай. Сначала анонс, потом закрытие школы. Я что-то подумал, что наоборот, не вдумался в смысл) В общем, хорошая иллюстрация третьего пункта

15 октября 2017 года, 21:08

Третья и четвертая части моего выступления в SAP Moscow. В прошлый раз было про поисковую аналитику, в этот – про фразовые синонимы и автоматическое определение фасетов по поисковому запросу. Пара видео по 10 минут каждое,

Велкам всем интересующимся.

Видео на русском и английском. Английская версия – voiceover + subtitles.

https://hybrismart.com/2017/10/15/sap-hybris-thinking-outside-the-box-part-3-and-4-video-russian-english-multi-word-synonyms-and-automatic-facet-discovery/

https://hybrismart.com/2017/10/15/sap-hybris-thinking-outside-the-box-part-3-and-4-video-russian-english-multi-word-synonyms-and-automatic-facet-discovery/

Тайные законы текста: что я узнал с Лавренко в свободное время | 12 октября 2017 года, 13:03

(TIL) В свободное время от работы смотрю лекции Лавренко. Сегодня с утра слушал лекцию “Законы текста”.

Например, вы знали, что есть такой закон Ципфа, говорящий, что частота n-го слова в списке самых частых слов любого языка окажется приблизительно обратно пропорциональной его порядковому номеру n?

Или вот есть эмпирический закон Бенфорда: в таблицах чисел, основанных на данных источников из реальной жизни (что угодно – от электрических счетов до номеров домов в городах) цифра 1 на первом месте встречается гораздо чаще, чем все остальные (приблизительно в 30% случаях), цифра 2 больше, чем, например, 8 и.д.. Простым языком Закон Бенфорда можно описать так: маленьких вещей в мире всегда больше, чем больших. Объяснение закона Бенфорда заключается в том, что величинам этого мира свойственен экспоненциальный рост, а не линейный. Очень интересно.

Или вот закон Хипа. Количество уникальных слов в любом тексте с числом слов N подчиняется закономерности f(N) = k*N^b, где b в большинстве случаев равно 1/2.

Эти законы позволяют, например, проверять данные или текст на “естественность”.

Или вот еще. Для любого очень редкого слова вероятность того, что он встретится в тексте очень низкая, и это понятно. Но если это слово все-таки встречается в тексте, то вероятность того, что оно встретится снова, очень высока.

https://www.youtube.com/playlist?list=PLBv09BD7ez_64T7_6df4362YRhYblYxPv