**Learning Korean Brand Names: A Fun Exercise in Language Acquisition** | 15 сентября 2018 года, 18:58

#learnkorean (в продолжение предыдущего поста про корейский язык)

Для закрепления корейской азбуки в голове, решил посмотреть как пишутся известные мне корейские бренды на родном языке.

Samsung – ну это номер один. Два слова: 삼성. Английский эквивалент очень точная озвучка оригинала, sam-sung. Означает “три звезды” оригинально.

Hyundai – два слога: 현대. Переводится как “современный”.

Kia. На корейском ki-a, 기아. переводится как “Войти в мир из Азии”. Тут ki и a – это не просто буквы алфавита, а озвучка китайских иероглифов 起 и 亞 (от 亞細亞 – Asia).

Daewoo – 대우, обозначает “Великий Woo”, где Woo – основатель. Скромный) Ну, компании уже нет.

Доширак – 도시락 , читается тосирак, и обозначает “рис в коробке”.

Кстати, еще Тхеквондо корейское слово, 태권도.

**Learning Korean: My Experience with the Language** | 15 сентября 2018 года, 18:37

#learnkorean Я тут над одним многоязычным личным проектом работаю, скоро анонс будет. Там потихоньку появляются новые языки, и вторым я выбрал корейский, потому что в наших краях корейцев много. Ну и решил разобраться, как “работает” этот язык. Учить серьезно не буду, но буду понимать как переводить, и хотя бы бренды узнавать на письме)

Буду здесь оставлять заметки. И сам лучше запомню, и остальным может быть интересно.

Тут есть парные звуки – к/г, т/д, п/б, ч/дж и ведущий себя несколько по особенному р/л. В целом это означает, что в одном случае кореец прочитает п, в другом – б, и в целом эти буквы в чужих языках будет слегка путать. Или не слегка.

Например, выяснилось, что буквы Ф в корейском нет, так что мое имя пишется без ф вообще: 라오, а вообще f в словах обычно заменяется на что-то невнятное, и “фокус” будет читаться как “по-кос-сы” = 포커스. Иногда подбираются другие звуки. Например, напиток Фанта у них 환타 (хан-тАа).

У них “р” и “л”, также как и у японцев, по сути один звук. Я не понимал, как это “один звук”. Оказалось интересно. Например, имя “Лайза” (Liza) будет писаться по-корейски как “라이자” (буквально “раизА”).

У них нет буквы “в”, но есть очень близкая по звучанию буква “б”. Например, по всем правилам, “Ваня” будет записываться как “반야” (бан-нЯ). Правда, мне это не очень понятно еще, почему нельзя написать это же имя как “오안야” (ван-йа). Спрошу послезавтра у кореянки на работе.

У них нет звука “з”. Есть буковка ㅈ, которая звучит как J. Заменой “з” являться не может, но как есть так есть.

Во-вторых, у них не читается “р” на конце никогда. Поэтому имя “Peter” будет записываться как “피터 ” (питО)

В-третьих, в корейском нет такого, чтобы шли несколько согласных подряд. Поэтому имя “Крис” будет записываться как “크리스” (кы-рис-сыы).

В-четвертых, у них есть долгие глухие согласные. кк, гг, пп.

В-пятых, у них в алфавите есть гласные с одинаковым звучанием. Например, “ㅖ” и “ㅒ” оба звуча как “йе”, а ㅐ и ㅔ звучат как “э”. Ну ок, если тут хоть слегка разница слышна, если очень постараться, то вот между “ᅫ” и “ᅬ” ее не слышно вообще (“вэ”, см. hangul.ru). Это уже никого не парит давно. Раньше оно было разным, но теперь стерлось.

Потом с произношением там есть засада в том, что произношение согласной меняется в зависимости от следом идущей гласной. Например, 마 читается как чистая русская “ма”, состоит из двух букв, первая из которых как бы “м”, а вторая – “а”. Но 무, которая состоит из той же “м” (ㅁ), но уже парится с “у” (ㅜ), производят вместе звук, который на “муо” уже совсем не похож, а ближе к “ну” или “гу”, а если “м” (ㅁ) идет вместе с “и” (ㅣ), то читается уже не “ми” (хотя в английской транскрипции именно так), а “би” (или “(б+м)”, “и”). Такая же история с “누”, который состоит как бы из “н” и “у”, но читается вместе как “ды” или что-то типа того. Передать сложно)

Интересно, что почти все корейские фамилии состоят из одного слога, а имена – из двух слогов. Например, исполнителя Gangham style зовут не Psy (싸이), что псевдоним, а 박재상 – Park или Bak (박), это фамилия, и Jae-sang (재상) – это распространенное имя в Корее. Имена строятся из двух знаков, в данном случае Jae и Sang, которые выбираются из довольно ограниченного списка возможных вариантов, списки отдельны для мужчин и женщин. Ну традиционно, исключения тоже есть. https://www.topikguide.com/find-korean-name-gender-male-or-female/ – тут они приведены. Поэтому если вам пишет кореец, можно попробовать догадаться он это или она именно так).

Where the Term Chauffeur Came From: A Surprising History | 14 сентября 2018 года, 13:04

The word “chauffeur” originally (many years ago) refers to the person who put coal in the locomotives of the steam trains in order to move them forward.

The driver, the one who put coal in the fire, became the driver, and the word kept after the arrival of the gasoline then electric trains.

The analogy was generalized to all vehicles afterwards.

https://www.pourquois.com/francais/pourquoi-conducteur-est-chauffeur.html

https://www.pourquois.com/francais/pourquoi-conducteur-est-chauffeur.html

01 августа 2018 года, 22:23

Listening to the physics lectures, and drew attention that there are two interesting words in English, looking similarly but having completely different pronunciation: _infinite_ and _finite_ ( /ɪnfənɪt/ and /faɪnaɪt/). Another example is mal-tai rather than mul-tee (multi-).

Трудности языковой коммуникации в Walmart | 31 июля 2018 года, 10:26

In Walmart, three Indian guys in the Fin Dept was attempting to properly type the MoneyGram recipient’s name which I was pronouncing, letter by letter, as clearly as I can. My “D” they have interpreted as Z, G or J, but never as D. Can’t say those were their ears or my mouth are broken or all together. This phonetic alphabet would be a great helper in such cases.

Набирали втроём с двумя индусами (?) имя получателя в пункте перевода денег в волмарте. На букву D (Ди) они нажимают Z, G, или J, но не D. Вот такую табличку не лишне заучить наизусть.

Марковские цепи: от бессмысленных текстов до алгоритмов поиска | 13 июля 2018 года, 23:06

Кстати, люди используют для генерации бессмысленных текстов цепи Маркова. Современные смартфоны используют статистику пар слов в чужих и ваших предложениях, чтобы подсказать следующее слово. Попробуйте написать что угодно матом- она правильно продолжит;) так вот, цепь Маркова – это последовательность таких предположений, основанных на статистике сочетаний. В моем практически детстве так пытались обманывать поисковики генерацией страниц-заглушек с типа реальным текстом и рекламными ссылками внутри ( они уже секут давно этот прием). А ещё я использовал этот механизм для создания случайных слов, которые можно читать без напряга (заполнял ими словарь и обфускировал по словарю данные с реальных логов для публикации на блоге).

Есть ещё интересное применение. Вы наверняка не знали, что марковские цепи лежат в основе способа сортировки результатов поиска Гугла. Если проводить параллели со словами, то пары часто используемых слов тут – пары сайтов, связанных ссылками. Есть интересное свойство марковской цепи : если она достаточно длинна, и данных достаточно много , то на “длинной дистанции” вероятность исхода (слова в случае подсказок) не зависит от того, с какого слова вы начали писать, предполагая, что речь идёт о длиной цепочке. Так вот, чем выше вероятность, тем выше pgerank, тем ближе к началу будет результат. Ну понятно, что гугл уже серьезно модифицировал алгоритм, но принципы этой фигни по ссылке и гугловского Pagerank очень близки;)

https://meduza.io/shapito/2018/07/13/prochital-na-meduze-chto

https://meduza.io/shapito/2018/07/13/prochital-na-meduze-chto

09 июля 2018 года, 12:56

Как интересно. Для Гугла и Яндекса “Новичок” практически не обозначает ничего иного, чем отравляющее вещество. Как слово, обозначающее человека, кто недавно ознакомился с чем-нибудь, для поисковиков практически умерло. Гугл транслейт еще переводит как Newbie, но, чувствую, скоро будет переводить как Novichok…

https://www.google.com/search?rlz=1C5CHFA_enUS780US780&{google:acceptedSuggestion}oq=%D0%BD%D0%BE%D0%B2%D0%B8%D1%87%D0%BE%D0%BA&{google:instantFieldTrialGroupParameter}sourceid=chrome&ie=UTF-8&q=%D0%BD%D0%BE%D0%B2%D0%B8%D1%87%D0%BE%D0%BA

https://www.google.com/search?rlz=1C5CHFA_enUS780US780&{google:acceptedSuggestion}oq=%D0%BD%D0%BE%D0%B2%D0%B8%D1%87%D0%BE%D0%BA&{google:instantFieldTrialGroupParameter}sourceid=chrome&ie=UTF-8&q=%D0%BD%D0%BE%D0%B2%D0%B8%D1%87%D0%BE%D0%BA

19 июня 2018 года, 11:21

Интересно, что еще ни один голосовой помощник или просто распознаватель голоса не может нормально обрабатывать речь, содержащую слова из разных языков. Также у них у всех есть проблемы с распознаванием слов, отсутствующих в словаре английского языка, но присутствующих в каком-то ограниченном списке (типа телефонного справочника). Мне так и не удалось научить сири или гугл распознавать русские имена, написанные латинницей через транслит. Казалось бы, базовая функция телефона, а нет, не работает