05 октября 2017 года, 16:32

Всем известно, что i18n – это internationalization, l10n – это localization, gr8 – это great, a 1ce – это once.

Вам загадка: А что означает этот нумероним? Только что передо мной ехал. Чтобы не палить ответы, давайте договоримся, что в комментах только русский перевод, чтобы я понял, что вы разгадали.

Названия в переводе: как имя может стать именем | 01 сентября 2017 года, 17:02

Работая с международными заказчиками и командами, столкнулся с интересным опытом, о котором не задумывался раньше: имена людей,с которыми вам работать, могут быть вообще любым произносимым (иногда и не очень) набором букв. Или ваше имя может оказаться таковым для них. Поэтому тут приезжие китайцы-корейцы переименовались в английские имена.

Интересная статья: http://www.slate.com/articles/arts/culturebox/2009/04/the_names_du_xiao_hua_but_call_me_steve.html

http://www.slate.com/articles/arts/culturebox/2009/04/the_names_du_xiao_hua_but_call_me_steve.html

10 августа 2017 года, 16:56

Сейчас работаю над одним большим проектом, там поиск, SOLR, grocery, и один из языков – французский. И во французском есть проблема с многозначностью слов: cerise переводится как “вишня”, но tomate cerise – как маленькие помидорчики, поэтому правильный поиск по cerise должен выдавать вперед вишню. Другой пример: fraise – это клубника, а fromage frais – это творог (frais в этом случае свежий), ну и по fraise должна клубника вперед идти, а не творог. Или вот, например, pomme de terre (картошка). Pomme – это яблоко. Поэтому картошку по pomme показывать не надо.

И вот нигде, ну нигде о таких проблемах и что с ними делать в сети не написано. Хотя понятно, конечно, что делать. Но сколько их таких? Каждый случай по-своему надо обрабатывать.

09 августа 2017 года, 12:50

Новая статья на моем hybris-блоге: поисковые синонимы и улучшенный поиск по фразам. Есть известная проблема в SOLR (и это не только с хайбрисом), что многословные синонимы работают очень криво. С однословными еще кое-как работает, но тоже со своими сложностями. На блоге описано решение, позволяющее обойти эти проблемы и сделать поиск умнее.

https://hybrismart.com/2017/08/09/enhanced-multi-word-synonyms-and-phrase-search/

https://hybrismart.com/2017/08/09/enhanced-multi-word-synonyms-and-phrase-search/

31 июля 2017 года, 18:19

Забавно. Только что наткнулся: в SAP hybris в конфиге можно указывать не только TRUE, “1”, ON или YES, но и JAWOLL, что на немецком означает “да” на военном сленге (типа “так точно!”, “есть, командир!” и всё такое)

29 июля 2017 года, 14:13

Забавно. Сегодня узнал, что форточка по-французски — vasisdas, что произошло от немецкого was ist das, что означает “это что за хрень такая?”.. Вспомнились происхождения слов “кенгуру” и “шарамыжники”…

https://www.grammarphobia.com/blog/2013/11/vasistas.html

25 июля 2017 года, 12:52

Читаю брошюрку “Этический кодекс сотрудника компании” клиента, к которому я сюда приехал. Брошюрка на французском. Там фраза про то, что компания примет меры в случае нарушения закона – по-французски это prendre des mesures. То есть, буквально калька выходит. Пришел домой гуглить, а при чем тут собственно меры-то (mesure). Слово “мера” явно относится к измерению, а prender – это брать. В английском есть похожее to take measures. Интернет не дает ответа на вопрос, почему что-то измерять означает что-то делать, чтобы что-то исправить. Может, вы знаете?

Еще интересный пример вспомнил, я о нем как-то писал. Слово au lieu означает “вместо”, где au=в, а “leau” – место. Интересно, что в английском instead тоже построено по такой же схеме (stead означает “место”, что однокоренное к stadt по-немецки, город). То есть, тоже калька.

Заинтересовался вопросом лингвинистических “калек”, и нашел еще несколько интересных. Вы когда-нибудь задумывались, что department – это “отделение” в буквальном переводе, а influence – влияние, где in = в, а fluence – течение. А вот слово “переворот” – калька с revolution, потому что revolver – это крутить. А еще интересно слово “трогательный” переводится – touchant. Собственно, оно оттуда в русский и пришло. les personnages les plus touchant 🙂

Всё, что осталось от акцента: V.M.Vargas Unique Pronunciation in Fargo 3 | 11 июля 2017 года, 02:12

Никак не могу найти в сети ничего про акцент V.M.Varga из Фарго 3. А он у него какой-то необычный. Во многих местах, где нормальные люди говорят eɪ, он говорит aɪ:

private planes – ˈpraɪvɪt plAɪnz (1:38)

famed misprint – fAɪmd ˌmɪsˈprɪnt(2:26)

sold into slavery – səʊld ˈɪntuː ˈslAɪvəri (2:53)

these the same – ðɪs ðə sAɪm

it goes without saying – ɪt gəʊz wɪˈðaʊt ˈsAɪɪŋ,

what a day! – wɒt ə dAɪ!

making – ˈmAɪkɪŋ

bland – blAɪnd

states – stAɪts

great – grAɪt

may – mAi

и т.д.

вот э дай вообще убило 🙂 Это что за акцент? что-то из Англии?

https://youtu.be/DvKXdXjMJas?t=103

21 июня 2017 года, 22:54

Сегодня открыл для себя OpenNLP — Java-инструментарий обработки текстов на основе методов машинного обучения. Ушел весь вечер на то, чтобы его запустить с SOLR. Кто-то это начинал, но хило и оно не работает. У меня наконец завелось как надо. Теперь по запросу red IKEA table я смогу выводить не всё подряд красное от IKEA, а все столы, в первую очередь красные, во вторую – от IKEA, а потом просто столы. Без этой доработки впереди будет идти что-то одно из этих трех вариантов, и владельцу магазина не так-то просто добиться какой-то одной стратегии.

Допилю, скоро статья будет. Пока прям доволен как слон

В США ударение играет критическую роль в понимании языка | 29 мая 2017 года, 10:00

В Америке нейтивы очень чувствительны к ударениям. Они могут тупо не узнать слово, если в нем слегка поменять ударение. Те, кто путешествует или имел дело с иностранцами, чуть подпривык уже. И с ними не так все плохо. Но порой не понимаешь, ну как можно не узнать какой-нибудь старбАкс или эмвЕй тем, кто знаком со стAрбaксом (все) или Эмвеем (многие)? А не узнают. Потом исправляешь ударение, и – “Ah! Starbucks!”. Примеры не самые лучшие, но все же