Словарь Набокова: Мультиязычное путешествие по текстам писателя | 2026-03-15T18:30:39

Читаю Набокова и решил отвлечься и сделать удобную программку «Словарь Набокова» и подумываю продавать его на Амазоне как книгу. По сути, выглядит это так (см скриншот) — определения сложных слов на английском, русском, немецком и французском, идущих в том же порядке, в каком они идут в оригинальной книге.

Вы бы купили такую книжку?

Для того, чтобы корректно сделать их определения, я также написал aligner — программу, которая сопоставляет предложения и абзацы на английском с их переводами (набоковским) на русский. И когда создается определение слова, используется не только знание LLM, но и перевод на русский автора. Отдельно стоит рассказать, как работает алгоритм (я его сам придумал, потому что все, что нашел в сети, не работало как мне надо). Он находит сначала длинные предложения, и находит для самых длинных предложений их пару через косинусное сходство embedding-векторов, созданных через модель multilingual e5. Эти предложения становятся якорями. Затем, предполагая, что для длинных предложений ошибка почти исключена, находится самое длинное предложение уже между якорями, и все повторяется заново рекурсивно. Там много ситуаций, когда у предложения на русском нет аналога на английском и наоборот, когда предложение разбито на два, или наоборот два слиты в одно. Алгоритм как может это обрабатывает. Результат — очень неплохое качество выравнивания. До такой степени, что ошибки выравнивания уже не получается находить (но наверняка они есть). Так или иначе, оно нужно только для контекста для перевода слов, даже если там и есть редкие ошибки, то не страшно.

Вы бы купили такую книжку?

Геополитический расклад: анализ отношений между странами | 2026-03-12T03:29:28

Ради развлечения решил сделать матрицу кто с кем друг и кто с кем враг. Для каждой пары страна-страна я спрашивал у Gemini, в какую из пяти категорий попадают отношения: «на ножах» (фиолетовые), «преимущественно недобрые» (красным), «никакие» (желтым), преимущественно добрые» (голубым), «друзья» (зеленым). Лиза сказала, что «никакие» должны быть фиолетовыми. В целом, качество оценок Gemini неплохое.

Из всех стран выделяются три красные линии. Это страны, у которых не очень с очень много кем. Ну Россию вы правильно угадали. А что за вторая страна? Израиль? Нет, это Беларусь и Венесуэла.

В пятерку стран, с которыми все дружат и которые много с кем дружат, LLM включил США, Великобританию, Канаду, Францию и Германию. Есть антирейтинг — это страны, у которых много с кем очень не ладится («на ножах»). В этом рейтинге на первом месте Россия с 21 страной, и на втором месте Израиль с 18 недругами. Дальше с большим отрывом идут Сирия и США с 9 недругами. Есть отдельный рейтинг Conflict zone — это по сумме красных с фиолетовыми. Россия, Венесуэла, Беларусь, Израиль, США, Иран, Украина.

Есть «клуб пацифистов». Эти те, у которых вообще нет врагов с сортировкой по числу друзей. Рейтинг: Багамы, Ватикан, Люксембург, Ангола, Сингапур, Исландия, Ямайка, Танзания, Замбия.

Мне было интересно, а что если применить формулу: враг моего врага — мой друг? Что поменяется? Это привело к новым краскам на матрице — logic friends.

Самым неожиданным лидером рейтинга Master Pragmatists стал Тайвань (25 логических связей). Почему так? В логике LLM, Тайвань — это страна, которая официально признана немногими, но из-за глобального противостояния с Китаем она автоматически становится «логическим другом» для всех, у кого с Пекином натянутые отношения. Это подтверждается и в разделе Shadow Bridges: у Тайваня 23 связи за пределами своего региона. Он буквально «сшивает» разные части света через общую проблему.

Отчет «Тайные партнеры» — список геополитических оксюморонов. Это пары, которые в официальных новостях «на ножах», но по расчету Gemini вынуждены дружить. Например, Афганистан — США/Великобритания. Несмотря на статус «rather bad relations», логика Gemini видит в них «логических друзей». Вероятно, из-за общих региональных угроз (например, ИГИЛ) или зависимости от гуманитарных и теневых каналов. Или вот странный союз «Беларусь — Венгрия». Номинально — разные лагеря, фактически — схожий стиль риторики и общие «недруги» в Брюсселе. Эритрея — Эфиопия: Статус «на ножах», но при этом они попали в логические друзья.

В отчете «наиболее противоречивые» первые места занимают США, и потом с большим отрывом Россия, и еще с большим — Великобритания, Канада, Украина. Это страны с наибольшим значением произведения Love x Hate. То есть, у которых одновременно много и друзей, и врагов.

Еще один отчет — пофигисты. Про них LLM не смогла много что сказать, видимо, потому, что они никого не волнуют (как в прямом, так и в переносном смысле). Там например Магадаскар и Гаити.

Еще я попробовал кластеризовать по силе друзей и получил четыре группы стран.

Самый масштабный кластер. Ядро: Китай, Россия, Иран, Индия и страны БРИКС+, а также почти весь африканский континент (от Египта до ЮАР) и значительная часть Ближнего Востока (ОАЭ, Саудовская Аравия, Катар).

Во второй кластер попали главным образом европейские страны. Ядро: Франция, Германия, Великобритания. Сюда алгоритм определил Украину и Израиль. Это логично: их выживание зависит от «преимущественно добрых отношений» с европейским ядром. В этом же клубе находятся Армения, Грузия и Сербия. Видимо, несмотря на все политические качели, их связи с Европой Gemini считает более фундаментальными, чем любые другие.

В третий кластер попали США, Канада, Бразилия, Мексика, а также, например, Тайвань. Официально он может быть «логическим другом» для всех врагов Китая, но по «силе друзей» он намертво пришит к американскому блоку. Сюда же попал Ватикан, что делает этот клуб не только экономическим, но и в некотором роде «ценностным».

В четвертый, самый компактный и специализированный клуб, попали страны Океании и Юго-Восточной Азии. Лидеры: Австралия, Япония, Новая Зеландия, Сингапур. Это получился клуб стран, которые пытаются балансировать в самом сложном регионе планеты. Здесь же находятся почти все островные государства (Фиджи, Самоа, Тонга).

Что еще можно попробовать вытащить из этой информации?

Мировой калейдоскоп названий индейки | 2026-03-09T21:36:50

Задумался, почему индейку называют тут turkey и как ее называют в Турции. В Турции ее называют hindi — индейкой! Решил посмотреть, а как тогда в Индии ее называют. Ха, на хинди ее называют турецкой (टर्की). Смотрим на других языках. Португальский — Peru. То есть, у них она перуанская. По-испаски — pavo, то есть отсылка к павлину 🙂 «pavone» в итальянском — павлин. По-французски — dinde, потому что эта птица пришла из Вест-Индии (Америки). Произошло от poule d’Inde — «курица из Индии/Вест-Индии». Греческий — «Γαλοπούλα» «французская птица».

Boney M: Легенды и Тайны | 2026-03-07T15:11:03

Оказалось, что группа из моего детства, Boney M,

1) до сих пор гастролирует. В 2026 концерты. Но из всей группы то только

2) Maizie Williams там сейчас зажигает, ей 74 года. Но ни на одной пластинке Boney M тех времен ее голоса нет. На конецртах давали попеть, да.

3) Frank Farian, создатель группы, белый чувак Германии, собравший в 1974 «экзотику». Пару лет назад умер в своем доме во Флориде.

4) А «тот чёрный парень» — это Bobby Farrell, который был диджеем с Арубы, прежде чем Фариан нанял его, чтобы он открывал рот под мужские партии, записанные самим Фарианом во всех песнях Boney M. Серьёзно, послушайте Boney M и обратите внимание на мужские партии. Теперь, когда вы знаете, кто на самом деле их пел, вы уже не сможете не услышать сильный немецкий акцент Фариана 🙂

5) Boney M были первой западной группой (из ФРГ!), прорвавшей «железный занавес». В 1978 были концерты уже.

6) Помните их песню «РаспутИн»? Бобби Фаррелл умер в ту же дату (30 дек) и в том же городе (в Питере), что и Распутин. В отеле «Амбассадор», который находится буквально в нескольких минутах ходьбы от Юсуповского дворца, где убили Григория.

Кстати, Фрэнк Фариан был королем «фанерных» проектов. Спустя 10 лет после успеха Boney M он провернул ту же схему с дуэтом Milli Vanilli. Но если в случае с Boney M это сошло ему с рук (все и так понимали, что это шоу), то с Milli Vanilli случился грандиозный скандал: у группы отобрали премию «Грэмми», когда выяснилось, что красавцы-модели на сцене не спели ни одной ноты.

Эволюция шахматных фигур: от слона до епископа | 2026-02-14T16:24:38

Все началось с вопроса — а зачем этот вырез у слона ♗? И вообще, где он — слон, а где — бишоп, и вырез это про слона или бишопа? В общем, слушайте что нарыл, тут много интересного.

Шахматы родом из Индии. Там эту фигуру изначально называли верблюдом. А слон у них было то, что у нас ладья — что если задуматься, то ладья — вообще лодка такая — или в английском rook, что если задуматься на персидском, то это колесница.

Название «Тура», которое мы часто слышим в разговорной речи, — это чистый импорт из Европы. Во французском — tour. В итальянском — torre. В латыни — turris. Все они означают одно и то же: башня. Когда шахматы попали в Европу, рыцари и монахи не очень понимали, что такое «боевая колесница» (они к тому времени уже вышли из моды), зато отлично знали, что такое осадная башня.

Так вот, возвращаясь к слону и вырезу.

Короткий ответ — чтобы отличать от пешки. Но есть длинный.

Когда шахматы пришли в Европу, индийского верблюда переключили на католического епископа и потому фигуру назвали bishop. Типа прорезь символизирует митру — высокий головной убор священнослужителей. Именно поэтому в английском языке фигура называется bishop. Хотя по мне это вообще рот из маппет-шоу.

Еще интересно, что во французском это le fou — шут. А в немцком Läufer — бегун. А на греческом — офицер (Αξιωματικός). Почему офицер? Не знаю, но накопал, что в китайских шахматах сянци (象棋) фигура «слон» обозначается и произносится как xiàng (象). Этот иероглиф действительно означает «слон». Но в истории Китая существовала высшая государственная должность, называемая xiàng (相), которая обычно переводится как «канцлер», «премьер-министр» или «главный министр». Это другой иероглиф, хотя произношение совпадает. Наверное, как-то офицер отсюда же.

Шахматный конь почти во всех языках конь, вот только в английском и еще нескольких — рыцарь (правда, в немецком например, это Springer — прыгун, а на Сицилии — осел).

То есть, в немецком есть прыгун и бегун. А коник в немецком вообще король.

А еще узнал, что оказывается, есть готовые решения ЛЮБОГО шахматного эндшпиля, в котором на доске остаётся семь или меньше фигур, независимо от позиции, состава оставшихся фигур или возможных ходов. Эта информация, известная как таблицы эндшпиля, в настоящее время занимает 18,4 терабайта.

из комментариев: «Самое интересное, что на этой неделе закончилась многолетняя работа, и есть готовое решение для любой позиции с 8 фигурами и меньше (7 фигур было уже 12 лет назад примерно, но там очень большая разница)»

Городки: больше, чем игра | 2025-12-20T05:29:16

Что-то у меня в голове сегодня внезапно выскочило слово «городки». Когда я был маленький, в Баку, в Азербайджане, мы почему-то во дворе играли в две игры — городки и ножички.

Гуглю. Интернет говорит, что в России есть Федерация Городошного спорта России. У нее есть президент, первый вице-президент, и просто вице-президент. Все в пинжачках. Есть президиум, и там есть председатель комиссии по международным связям. Есть целый аппарат президента городошного спорта с тремя советниками и ответсвенным секретарем. Они проводят конференции, как минимум в 2018 и 2020. У них есть марш городошников, музыка А. Рощина, слова В. Авдеева, И. Виноградского.

На сайте есть раздел «Антидопинг». Вы себе как представляете допинг в городошном спорте? У него есть подраздел «методические рекомендации».

В 2024 был Чемпионат Мира По Городошному Спорту. И у него было Торжественное Закрытие. Кроме Беларуси, в чемпионате мира принимали участие спортсмены из Германии и Казахстана. Из Германии кроме Сергея, Виталия, и Константина был Шляйн Ойген, короче, Женя.

Мастера спорта. Для допуска к международным соревнованиям нужно прийти со справкой, ой, сертификатом о прохождении антидопингового образования учреждения, что бы это ни значило.

В общем, все серьезно.

А вот федерации игры в ножички я не нашел.

Интерактивное обучение 1986: «Химический тренажер» | 2025-11-23T15:55:06

У меня дома в Коломне есть книжка Химический тренажер 1986 года. Я таких никогда не до и не после не видел.

Материал каждой из 54 программ подразделяется на множество мелких, очень коротких частей, или рубрик. В конце каждой рубрики задается один или несколько вопросов. Это делается с целью проверить – действительно ли понято содержание данной рубрики. У каждого ответа есть место в книге, куда нужно перепрыгнуть, чтобы почитать, правильный ли ответ. Если ответ неправильный, там описывается, почему и задается новый вопрос. Если правильный — продвигаешься в этом квесте дальше.

Эти немцы в 1986 году сделали интерактивный учебник еще до того, как это стало модным.

Запуск книги «Рекомендательные алгоритмы»: все, что нужно знать | 2025-10-25T17:36:38

I finally released a book on #RecSys! It’s called Recommender Algorithms, where I’ve compiled over 50 recommendation algorithms with detailed mathematical derivations, thorough explanations, and code examples.

It all started early this spring in Germany, when I attended an ACM conference and sketched out the first structure of the book while analyzing the talks from the RecSys track. And now, just six months later, it has come to life.

Why did I write it? Because neither online nor in print is there a single, accessible resource that deeply explores recommendation algorithms of various types and purposes. There are articles focused on small subsets, but collecting and systematizing approaches—from foundational methods to the very latest—seems to have never been done before. I don’t know if I succeeded, but I’d love to hear your feedback.

Please like & share!

P.S. Click at READ SAMPLE to see the first 40 pages. The table of contents is there as well.

Recommender Algorithms: Путеводитель по алгоритмам рекомендаций | 2025-10-13T11:54:14

Наконец-то я выпустил книгу! Она называется Recommender Algorithms — в ней я собрал более 50 алгоритмов рекомендаций с математическими выкладками, подробным описанием и примерами кода.

Все началось ранней весной в Германии, когда я посетил конференцию ACM и сделал первые наброски структуры книги, анализируя доклады по потоку RecSys. И вот, спустя полгода, книга увидела свет.

Почему она появилась? Потому что ни в интернете, ни в печати нет единого, доступного источника, где подробно разбирались бы алгоритмы рекомендаций разных типов и назначения. Есть статьи, сфокусированные на узких аспектах, но собрать и систематизировать разработки — от фундаментальных до самых недавних — до сих пор, кажется, никому не удавалось почему-то. Может, это никому и не надо было. Мне вот вдруг стало надо. Не знаю, получилось ли у меня, но буду рад вашим отзывам.

Продаётся на amazon и Barnes and Noble. Есть русский автоматический перевод (удивительно, но очень неплохой), но я не знаю, как его продавать пока.

(Это не единственная моя книга, но сегодня — только об этой.)

80-летие победы Китая в WWII: Взгляд сквозь десятилетия | 2025-08-31T14:02:05

3 сентября в Пекине пройдет военный парад, посвященный 80-летию победы Китая во Второй мировой войне. Я, видимо, плохо слушал уроки истории в школе: оказалось, что потери Китая во время WWII были почти такими же, какими были потери СССР, если считать официальные цифры (в обеих случаях они сильно ниже реальных). Но там есть хитрость — война Китая и Японии началась в 1937 году, и позже слилась со Второй мировой, когда Япония в 1941 году напала на США и союзников, а Китай официально стал частью антигитлеровской коалиции. Германия в 1937 пока только готовилась: через год, в 1938-м, начнётся аншлюс Австрии, а ещё через год (1939) — нападение на Польшу, и тогда же СССР напал на Финляндию.

А вот в Германии, считается, точность немецкой бухгалтерии была несоизмеримо выше, и потери агрессоров совокупные, вместе с Японией, были, оказывается, в 4 раза меньше, чем совокупные потери защищающихся.

Цифра потерь Китая — это главным образом гражданское население. Военных потерь у них было 3-4 млн, а 12-17 млн пострадали от бомбадировок, карательных акций, болезней (вспоминаем японский отряд 731 и биологическую войну) и прочих последствий войны.

——

Ниже цитирую мой пост от 25 января этого года — просто в тему и к дате:

Кто победил во Второй Мировой войне? Интересно, заметьте, что никто не обратил внимание на слова Трампа про Вторую Мировую войну в недавнем твите-ультиматуме.

.

Он пишет «Russia helped us win the Second World War» — «Россия помогла США победить во Второй Мировой». Все обратили внимание на некорректную цифру потерь в 60 млн, но почему-то не на это.

.

Я нашел интересное исследование 2017 года. Исследование того, как люди (опрос, 1338 человек) из 11 стран помнят войну, включая 8 стран-союзников и 3 страны оси.

.

Оно показало значительные различия в том, как бывший Советский Союз и 10 других стран вспоминают войну.

.

События, отмеченные представителями Советского Союза, практически полностью отличались от тех, которые упоминались в других странах. Кроме того, россияне заявили о большей ответственности за победу в войне (75% военных усилий), чем представители любой другой нации (хотя США и Великобритания также оценили свой вклад более чем в 50%).

.

Однако, когда люди из каждой страны оценивали вклад других стран в войну, они приписывали США больший вклад, чем бывшему Советскому Союзу.

.

Еще один интересный вывод заключается в том, что на вопрос, почему США сбросили атомные бомбы на Японию, большинство жителей десяти стран ответили, что это было сделано для победы в войне, за исключением россиян.

.

Кроме того, чем старше были респонденты в 7 из этих стран, тем чаще они соглашались с утверждением, что США сбросили бомбы, чтобы завершить войну.

.

Россия (СССР) в результатах опроса демонстрирует уникальный нарратив, сосредоточенный на Восточном фронте, в отличие от западных стран.

.

Большинство стран (включая бывшие страны Оси) фокусируются на событиях, связанных с США и Великобританией, например, Пёрл-Харборе, высадке в Нормандии, атомных бомбардировках Японии и Холокосте.

СССР занимает центральное место в российском нарративе (75% вклада в победу). США и Великобритания также завышают свои оценки, заявляя, что их вклад превышает 50%, фокусируясь на Западном фронте и Тихоокеанской кампании. Суммарные оценки вклада восьми союзных стран составляют 309%, что демонстрирует эффект «национального нарциссизма». Большинство стран отдают приоритет США (27%), а СССР — 20%.

.

4 события получили статус «ключевых» (упомянуты более чем 50% респондентов): Атака на Пёрл-Харбор, Атомные бомбардировки Японии, Высадка в Нормандии, Холокост. Российский нарратив концентрируется на событиях, которые в советской и современной российской историографии называются Великой Отечественной войной (1941–1945). Россияне выделяли уникальные события: битвы под Сталинградом, Курском, Москвой, Берлином, блокаду Ленинграда. Таким образом, несмотря на то, что США и Россия сражались вместе как союзники, исследования показывают, что практически не существует пересечения в том, какие события запоминаются как наиболее важные. Члены каждой группы в основном помнили те события, которые были связаны с их собственной страной. Впрочем, это не удивительно.

.

По атомным бомбардировкам большинство респондентов считают, что цель бомбардировок — завершение войны. Россияне видят это событие как акт устрашения СССР. Мнения внутри стран различаются по возрасту: старшие поколения чаще поддерживают официальную версию о завершении войны.

.

Во Франции в 1945 году 57% населения считали СССР главным победителем. К 2004 году этот показатель снизился до 20%, а доля США выросла до 58%.

.

Причины понятны: Учебники истории и популярная культура усиливают национальный акцент. В США и Великобритании преобладают фильмы и книги, восхваляющие их роль в войне. СССР и США сражались на разных фронтах и представляют разные идеологические системы, что определило нарративы. Ну и разумеется, все страны завышают свою роль в исторических событиях.