Особенный день нашего питомца | 14 мая 2026 года, 23:39

Надя сказала собаке утром, что будем забирать кота. Он пару раз приходил на кухню и не отрываясь смотрит на меня. Мол, что сидишь, говори уже, я помню, что сегодня особенный день. Ну я сижу работаю, он пошёл спать. Проснулся. Смотрит в окно. Решил его обрадовать;)

Особенный день у него завтра, день рождения.

Не та раскладка: когда gremlin стал похуистом | 2026-04-28T20:33:08

Это я набрал слово gremlin, не переключив раскладку. Собрался блин почитать про язык запросов графовых баз данных, по работе надо. Удивляет гугл, удивляет

Глоссарий к «Лолите» Набокова: не просто словарь, а книга-путеводитель | 2026-04-08T11:24:22

Я наконец доделал до конца книгу The Reader’s Glossary — это по сути словарь на 5200 слов по «Лолите» Набокова, но организовыванный не в алфавитном порядке, как обычные словари, а в порядке встречаемости сложных слов, с разбивкой по главам и с указанием контекста слова или фразы. Сайт — readersglossary точка com (в первом комменте). Предполагается, что им будут пользоваться в том числе при чтении оригинала как книга-компаньон. Да, она вдвое больше 🙂

Словарь получился довольно толстым — на 600-700 страниц. Он доступен на четырех языках — русском, английском, французском и немецком. Также перевод (RU, FR, DE) или разъяснение (на англ) не абстрактные, а контекстные, да еще и с учетом того, как тот или иной фрагмент переводил сам Набоков с английского («Лолита» писал сначала на английском, потом переводил на русский).

У меня на сайте есть огромные фрагменты этих словарей RU,FR,DE,EN на ознакомление (каждая — около 1/3 полного объема).

Также полноценный интерактивный словарь на сайте, где можно вбить слово и посмотреть перевод или разъяснение. В словаре собраны в основном сложные слова, но мы знаем, что сложность для каждого имеет свое определение, поэтому все слова разбиты на три категории и выделены разными рамочками. Наверное, для начитанного англофона первая категория (пунктиром) вообще бесполезная (это около 50% словаря), для неначитанного, наверное, процентов 20 бесполезны. Но я решил дальше не резать, потому что книга не только для англофонов, но и для тех, кому английский второй язык, и там эти рамочки пунктирные очень даже кстати.

В целом, я это делал «для себя и друзей», just for fun, а не как коммерческий проект. Поэтому я совершенно трезво понимаю, что аудитория у нее супернишевая, и если хотя бы раз в неделю будет появляться кто-то, кому она может быть полезна, уже приятно.

Несмотря на то, что это было что-то типа хобби, времени книжки потребовали много. Для того, чтобы получить то, что получилось, я разработал с десяток приложений/скриптов, из которых пара имеют свой интерактивный UI, в котором я в общей сложности за два месяца работы провел много часов. И конечно, во многом разобрался, собственно, это и есть главный фан от процесса.

Итак, приходите на сайт — readersglossary точка ком. Ссылка в комментариях

P.S. На русском языке — только как PDF пока. Amazon не дает продавать книги на русском, только на небольшом количестве европейских языков в дополнение к английскому. Французская и немецкая версии словаря выйдут на Амазоне через неделю где-то.

Словарь Набокова: Мультиязычное путешествие по текстам писателя | 2026-03-15T18:30:39

Читаю Набокова и решил отвлечься и сделать удобную программку «Словарь Набокова» и подумываю продавать его на Амазоне как книгу. По сути, выглядит это так (см скриншот) — определения сложных слов на английском, русском, немецком и французском, идущих в том же порядке, в каком они идут в оригинальной книге.

Вы бы купили такую книжку?

Для того, чтобы корректно сделать их определения, я также написал aligner — программу, которая сопоставляет предложения и абзацы на английском с их переводами (набоковским) на русский. И когда создается определение слова, используется не только знание LLM, но и перевод на русский автора. Отдельно стоит рассказать, как работает алгоритм (я его сам придумал, потому что все, что нашел в сети, не работало как мне надо). Он находит сначала длинные предложения, и находит для самых длинных предложений их пару через косинусное сходство embedding-векторов, созданных через модель multilingual e5. Эти предложения становятся якорями. Затем, предполагая, что для длинных предложений ошибка почти исключена, находится самое длинное предложение уже между якорями, и все повторяется заново рекурсивно. Там много ситуаций, когда у предложения на русском нет аналога на английском и наоборот, когда предложение разбито на два, или наоборот два слиты в одно. Алгоритм как может это обрабатывает. Результат — очень неплохое качество выравнивания. До такой степени, что ошибки выравнивания уже не получается находить (но наверняка они есть). Так или иначе, оно нужно только для контекста для перевода слов, даже если там и есть редкие ошибки, то не страшно.

Вы бы купили такую книжку?

Мировой калейдоскоп названий индейки | 2026-03-09T21:36:50

Задумался, почему индейку называют тут turkey и как ее называют в Турции. В Турции ее называют hindi — индейкой! Решил посмотреть, а как тогда в Индии ее называют. Ха, на хинди ее называют турецкой (टर्की). Смотрим на других языках. Португальский — Peru. То есть, у них она перуанская. По-испаски — pavo, то есть отсылка к павлину 🙂 «pavone» в итальянском — павлин. По-французски — dinde, потому что эта птица пришла из Вест-Индии (Америки). Произошло от poule d’Inde — «курица из Индии/Вест-Индии». Греческий — «Γαλοπούλα» «французская птица».

Реки и холмы: игра слов в топонимике | 2026-03-08T02:54:57

Читаю Набокова, там «…with the dash of the Danube in his veins…». Оказалось, Danube — это Дунай. Но это ладно, ерунда, интереснее другое. Что Дон, Дунай, Днестр, Днепр, Донец, Двина, и Дисна по сути плюс-минус означают одно и то же — река. Видимо, древние люди не всегда отличались бурной фантазией в топонимике. Если ты живешь у воды, ты называешь её просто «Река». Со временем приходят другие народы, слышат это слово, принимают его за имя собственное и немного меняют под свой акцент. Так «Река» (Danu) превратилась в десяток разных имен на карте Европы.

Река Волга по сути тоже просто «река». Ну ок, там слегка иначе, «Волга» происходит от праславянского *Vòlga, что буквально означает «влага» или «вода».

А еще оказалось, что пустыня Сахара называется так, потому что Сахара (الصحراء) — это пустыня. А пустыня Гоби называется Гоби, потому что Гоби на монгольском — это пустыня.

Пока гуглил, наткнулся еще на одну забавную штуку. Есть такое место в Англии, Torpenhow Hill. Название складывается из четырех разных языковых пластов: Tor — на древнеанглийском «холм», Pen — на камбрийском «холм», How — на древнескандинавском «холм», Hill — на современном английском «холм». Итог: «Холм-холм-холм-холм». Вероятно, каждый новый народ, приходящий в эту местность, не понимал, что Tor, Pen и How — это уже название горы, и добавлял свой вариант слова «холм».

Эволюция шахматных фигур: от слона до епископа | 2026-02-14T16:24:38

Все началось с вопроса — а зачем этот вырез у слона ♗? И вообще, где он — слон, а где — бишоп, и вырез это про слона или бишопа? В общем, слушайте что нарыл, тут много интересного.

Шахматы родом из Индии. Там эту фигуру изначально называли верблюдом. А слон у них было то, что у нас ладья — что если задуматься, то ладья — вообще лодка такая — или в английском rook, что если задуматься на персидском, то это колесница.

Название «Тура», которое мы часто слышим в разговорной речи, — это чистый импорт из Европы. Во французском — tour. В итальянском — torre. В латыни — turris. Все они означают одно и то же: башня. Когда шахматы попали в Европу, рыцари и монахи не очень понимали, что такое «боевая колесница» (они к тому времени уже вышли из моды), зато отлично знали, что такое осадная башня.

Так вот, возвращаясь к слону и вырезу.

Короткий ответ — чтобы отличать от пешки. Но есть длинный.

Когда шахматы пришли в Европу, индийского верблюда переключили на католического епископа и потому фигуру назвали bishop. Типа прорезь символизирует митру — высокий головной убор священнослужителей. Именно поэтому в английском языке фигура называется bishop. Хотя по мне это вообще рот из маппет-шоу.

Еще интересно, что во французском это le fou — шут. А в немцком Läufer — бегун. А на греческом — офицер (Αξιωματικός). Почему офицер? Не знаю, но накопал, что в китайских шахматах сянци (象棋) фигура «слон» обозначается и произносится как xiàng (象). Этот иероглиф действительно означает «слон». Но в истории Китая существовала высшая государственная должность, называемая xiàng (相), которая обычно переводится как «канцлер», «премьер-министр» или «главный министр». Это другой иероглиф, хотя произношение совпадает. Наверное, как-то офицер отсюда же.

Шахматный конь почти во всех языках конь, вот только в английском и еще нескольких — рыцарь (правда, в немецком например, это Springer — прыгун, а на Сицилии — осел).

То есть, в немецком есть прыгун и бегун. А коник в немецком вообще король.

А еще узнал, что оказывается, есть готовые решения ЛЮБОГО шахматного эндшпиля, в котором на доске остаётся семь или меньше фигур, независимо от позиции, состава оставшихся фигур или возможных ходов. Эта информация, известная как таблицы эндшпиля, в настоящее время занимает 18,4 терабайта.

из комментариев: «Самое интересное, что на этой неделе закончилась многолетняя работа, и есть готовое решение для любой позиции с 8 фигурами и меньше (7 фигур было уже 12 лет назад примерно, но там очень большая разница)»

Смородина: история названия и культурные различия | 2025-07-17T13:09:40

Знаете, 99.9% американцев никогда не пробовали смородину. Ее в 1911 году запретили тут законодательно, потому что смородина переносила заразу, от которой мёрли сосны. Ну и крыжовник вместе с ней, и киндер сюрприз. Дело даже дошло до того, что фиолетовые скиттлс в США имеют виноградный вкус, а в Европе — вкус черной смородины.

Но сегодня о другом. Я тут задумался, а почему смородина зовется по-русски смородиной, а по-английски — currant. Выяснилось, что смородина — это по сути родственное слово смраду, потому что по мнению наших предков, она воняла. Смрадом раньше назывался любой сильный запах. Уж не знаю, насколько неприятно она для них пахла, но это отличало ее от крыжовника, которые оба росли вдоль речек, поэтому и то, и то еще зовется в украинском и польском языках как porzeczka и порічка, особенно красная и белая. По мне, крыжовник пахнет даже сильнее.

Английское название тоже интересное. Английское currant восходит к среднеанглийскому rayson of Corantes («виноград из Коринфа»), где Corantes — это искажённое название греческого города Коринф (Corinth). В Средние века в Англию активно ввозили мелкий сушёный виноград из Греции (из района Коринфа) и эти сушёные ягоды называли raisins of Corinth, а затем это выражение сократилось до currant. Первоначально currant обозначало именно изюм, сушёный виноград (по сути, маленькие изюмки). Да и сейчас продолжает означать кое-где.

Но дальше произошло смещение смысла. Позднее, когда в Северной Европе начали культивировать кустарники рода Ribes (крыжовниковые), в частности Ribes rubrum (красная смородина) и Ribes nigrum (чёрная смородина), за ними закрепили то же название, поскольку их ягоды тоже мелкие и тёмные, как греческий изюм. Так слово currant стало употребляться для обозначения и смородины. И крыжовника 🙂 но потом все-таки их разделили. Да, крыжовник и смородина оказались родственниками как в биологическом, так и этимологическом смысле.

А еще помните была сказка про добрых молодцев и богатырей Добрыней Никитичей, которые воевали с Чудом-Юдом трёхголовым на Калиновом мосту, переброшенном через реку Смородину. Так вот, эта река Смородина границей между миром живых (Явь) и миром мертвых (Навь).

Владимир Александрович Холодковский | 2025-07-09T01:27:33

Мне Надя из России только что привезла три книжки по моему заказу. «Искусство цвета» И.Иттена, «Американцы и все остальные» И.Курилла и вот эта, комментарии Холодковского к его переводу Фауста. Интересно, что, кажется, этих комментариев нет на русском языке.. точнее как.. на современном русском языке.. Есть репринт оригинального издания 1914 года, созданный на основе электронной копии высокого разрешения, которую очистили и обработали вручную, сохранив структуру и орфографию оригинального издания, а на современный русский, кажется, так и не перевели. Впрочем, никаких сложностей читать репринт нет.

От молока к звёздам: происхождение слова «галактика» | 2025-06-29T12:57:30

Смотрю фотки и читаю материал про млечный путь и обратил внимание, что слово галактика (любая) по сути означает «молочный» с греческого. Κύκλος Γαλαξίας. По сути, lac из lactose, и gala из galaxy по сути пришли из единого протоиндоевропейского ģlákts. Неожиданно