От российской водки до героина: необычные требования космонавта | 25 мая 2026 года, 04:15

Скоро дочитываю Project Hail Mary. Напишу отдельно про впечатления. Сегодня — некоторые заметки по пути, которые почему-то не вошли в фильм.

Российский инженер Олеся Илюхина на встрече она пьет водку из пугающе огромного стакана, а во время старта ракеты радостно кричит и пьет одну рюмку за другой. В ее личном багаже для космического полета обнаруживается 5 литров водки в пакетах. Грейс напрямую спрашивает российского ученого Дмитрия: «Все русские сумасшедшие?», на что тот с улыбкой отвечает: «Да. Это единственный способ быть русским и при этом счастливым». Илюхина же, планируя свою смерть, просит предоставить ей героин. Она хочет умереть от передозировки, чтобы перед смертью испытать «максимальное удовольствие» (а китаец Яо прагматично выбирает пистолет). Во время запуска модулей корабля (кабины, лаборатории и спального отсека), трансляция которого велась из Центра управления полетами в Москве, российская космонавтка Олеся Илюхина пьет водку и кричит телевизору: «Не облажайтесь с моим домом, ублюдки из Роскосмоса!». Но в целом российские космические технологии местами даже восхваляются — например, утверждается, что эксперты со всего мира признали российский скафандр «Орлан» самым безопасным и надежным, поэтому именно его используют в миссии.

Когда главный герой (Грейс) видит чернокожего американского ученого Мартина Дюбуа, он обращается к руководительнице проекта Стрэтт: «Дюбуа, похоже, черный! Удивительно, что вы это позволили! Не боитесь, что он испортит миссию разговорами о рэп-музыке и баскетболе?»

Когда Грейса решают отправить в космос насильно, его запирают в специальной комнате на космодроме Байконур. Эта комната похожа на студенческое общежитие, но имеет стальную дверь и решетки на окнах. Герой иронизирует над этим: «Зачем на стартовом комплексе Байконура тюремная камера? Я не знаю. Спросите у русских»

Грейс жалуется на то, как организована работа с отчетами о неполадках во время подготовки корабля. Вместо того чтобы прислать электронное письмо, ему приносят стопки бумажных документов. Грейс: «Потому что русские делают вещи определенным образом, и проще работать с ними, чем жаловаться на это»

Грейс из научного любопытства решает понаблюдать, как его инопланетный друг Рокки ест. Оказывается, Рокки — «моностом», то есть он ест и испражняется через одно и то же отверстие в теле. Грейс видит, как из живота инопланетянина со влажным звуком вываливается серый сгусток, после чего Рокки в то же самое отверстие забрасывает кусочки свежего мяса. Грейс резюмирует: «Объект испражняется изо рта… Да уж, это было довольно мерзко»

Несколько няпрягает карикатурность персонажей, стереотипы, фантастические совпадения и «рояли в кустах» и всякие «сценарные натяжки».

Автоматизация кросс-постинга: боремся с трудностями API Facebook | 2026-05-23T14:28:22

Доделал в лучшем виде кросс-постинг из фейсбука на два моих сайта-блога [на которые почти никто не заходит] — beinginamerica точка com и raufaliev точка com. При публикации нового поста в фейсбуке по расписанию стартует механизм перевода поста на английский, разбор приложенных картинок, генерация описаний к ним, создание заголовка на основе текста поста и описания картинок, создание тегов на их же основе, запись поста в turso db — это облачная база, бесплатная до определенных лимитов, создание эмбеддингов через openai, запись в qdrant cloud — это тоже облачная база, но уже векторная, ну и загрузка изображений в wordpress по API, и публикация поста на английском и на русском по API.

Все бы хорошо, но из всех API самый дурацкий — у фейсбука. Во-первых, для страниц как у меня, переведенных в New Experience, нет возможности использовать почти все из этого API. Точнее, есть, но нужно долго доказывать фейсбуку, что это реально надо, показывая документы на стартап, демонстрируя приложение и т.д. Очевидно, им не хочется иметь дело с чем-то уносящим контент из их системы во вне. Кроме этого, токен, который дает доступ к последним сообщениям, относительно короткоживущий (возможно, несколько недель), и получать его заново нужно через браузер только. То есть, любая автоматика требует регулярного внимания, иначе она ломается.

Если протупил и вовремя не выгрузил последние посты через этот Facebook Graph API, они просто исчезают из списка последних и все, больше по API к ним не обратиться. Единственный способ — запросить выгрузку архива у фейсбука. Эта выгрузка тоже довольно дурацкая — там нужно много трансформаций делать и убирать лишнее. Например, в файле с постами, который я обрабатываю, там почему-то хранятся ссылки, которые я отправлял в комментариях без сопроводительного текста. А комментарии там идут в отдельном файле!

Чтобы назначить теги, пришлось решить отдельный челендж. Вот есть около 10000 постов за все время. Это большой кусок, и по нему теги построить нельзя, потому что он в контекстное окно LLM не помещается. А надо. Поэтому я делал так: скрипт берет случайные посты из 10000 в таком объеме, чтобы их суммарный размер был чуть меньше указанного лимита в токенах, и в конец этого блока добавляется промпт «сгенери мне наиболее частые теги, 30 штук» (промпт привожу упрощенно). В итоге я запустил это 10 раз и получил 10 наборов тегов по 30 штук, сгенерированных для разных срезов базы. Получилось 300 тегов, из которых конечно есть полные дубликаты, а есть синонимы и близкие по смыслу. Это все скармливается LLM, и получаем список тегов и иерархию тегов. Теперь у нас есть ограниченный набор тегов, которые максимально отражают 10000 постов. Так получилось, что за почти 20 лет на фейсбуке у меня расклад такой:

Тег Постов

==================================================

#Russia 3412

#Thoughts 3146

#Tech 3105

#Culture 2765

#Hobbies 2726

#AI 1603

#Science 1367

#Software 1358

#Travel 1298

#Learning 1138

#Society 1050

#Nature 958

#Education 915

#Business 902

#Art 894

#Programming 889

#Humor 840

#History 807

#Gadgets 750

#Moscow 713

#USA 614

#Cinema 567

#Webdev 493

#Music 476

#Sports 473

#Mindset 443

#Auto 400

#Books 386

ну и так далее. Этот список включает как теги из ограниченного списка, так и теги, которые LLM поставила материалу просто потому, что не нашла в ограниченном ничего подходящего.

Теги из ограниченного списка стали категориями на сайте. Остальные теги + эти стали просто тегами wordpress.

Поиск по картинкам. У меня было две идеи как его сделать. Первая — OpenCLIP. Это довольно просто, но требует хостинга модели где-нибудь. На своей машине легко, но каждый раз ее запускать неудобно, плюс я планировал переносить мигратор на дешевый сервер в амазон. В облачных моделях тоже нормально считать, но хоть немного за это надо платить, а это еще одна dependency. Но главное — что и без этого неплохо работает. Я с помощью OpenAI , который и так используется для перевода на английский, генерю описания к картинкам, и дальше по этим описаниям делаю embeddings с помощью large модели. Пока что все тесты на поиск проходят на ура. Особенно, когда на картинке есть текст, и большой вопрос разобрал бы ли его OpenCLIP.

В итоге:

1) вордпресс raufaliev точка com — бесплатный

2) вордпресс beinginamerica точка com — бесплатный

3) turso db где хранятся все посты — бесплатный

4) qdrant cloud где хранятся эмбеддинги — бесплатный

5) openai для перевода и описания картинок — не бесплатный, но недорогой (обработка постов за год потребовала 30 баксов).

Прикладываю два скриншота — как работает поиск по изображениям, и по текстам, а также дашборд мигратора.

Захватывающее чтение на английском: «Project Hail Mary» | 2026-05-10T15:30:56

Прочитал пока где-то четверть project hail mary. Очень простой английский, легко читается, увлекательно, в фильме пока все идет почти по книге, но но из-за этого почти читать все-таки интересно. Но мне вообще сложно читать художественную литературу, потому что я постоянно отрываюсь гуглить всякое. Дошел до фразы «..I used the bathroom (or «head» I guess, because I was on the ship)…» и задумался, а интересно, оказывается, что туалет на судне не только в русском называется иначе. И почему head? оказалось, что гальюн — это и есть head, только на датском и немецком). Кстати, гальюн есть еще и на самолетах, а исторически гальюны были только для матросов, офицеры ими не пользовались.

Вообще текст очень детский, ну и понятно почему — главный герой все-таки учитель физики в школе. Все эти motherfluffer и dang it, gosh darn it, fudge, holy moly, for cripes’ sake вместо for christ’s sake, там даже есть bull-puckey вместо bullshit. «Сходить по-маленькому» там to go wee. Вспоминается, позавчера мы заходили в магазин матрасов, и там консультант, обсуждая поднятую тему «если один из вас идет в туалет, второй даже не заметит, что первый встал» — ну мол, матрасы такие мягкие — активно использовала глагол «пописать» (to pee). А что такого? 🙂

Update: когда учитель физики встречает инопланетный корабль на 120 странице, глава заканчивается holy fucking shit! Вот к чему было все остальное;)

Там периодически бывают довольно забавные выражения, которые можно даже использовать в жизни 🙂 например, главный герой спрашивает Who pooped in your Rice Krispies? — это идиома to poop in someone’s cereal — «кто тебе в кашу нагадил».

В общем, если выбираете первую книжку для прочтения на английском — это в моем рейтинге на первом месте. Например, даже простой казалось бы «Гарри Поттер» сложнее (sophisticated) на мой взгляд. Здесь куча диалогов, школьная, но почти без сленга лексика, и довольно интересный сюжет. Плюс это настоящая научная фантастика, где автор образовывает читателя, про научный метод, про устройство мира и т.д. это происходит от имени героя, учителя физики, где тот делится всякими фактами и размышлениями о том, как работает физика, в применении к сюжету в общении с другими героями или сам с собой (а не с читателем). На уровне школьной программы 6-8 класса пока, но может дальше будет посложнее.

Словесные паттерны в религиозной литературе: анализ на основе Project Gutenberg | 2026-05-02T03:28:59

Интересно, что если взять 8000 книг из библиотеки Гутенберга, и по каждой построить по словам граф, чтобы посмотреть, насколько «дружны» слова — если слово А часто встречается с Б, а Б с В, то как часто А встречается с В — для этого есть метрика — средний коэфициент кластеризации, а затем просто отсортировать книги по уменьшению этого коэфициента, то процентов 70 топа будут составлять религиозные книги — библии, книга мормонов, Коран. Ну хорошо, часть из них являются дубликатами в каком-то смысле, потому что Библия в разных вариантах остается Библией. Но тут явно сгруппированы ее разные части, то есть, они явно имеют общность в этих треугольных словах.

Но что объединяет вообще все книги этого топа — это то, что они написаны много лет назад или, как в случае The Night Land, написаны относительно недавно в том же стиле, как много лет назад.

Кстати, среди этих книг светится An Introductorie for to Lerne to Read, To Pronounce, and to Speke French Trewly. Это учебник по французскому языку, написанный на английском языке времен Тюдоров (примерно 1530-е годы). Soverayn lorde kyng Henry the Eight. Написал его Жиль дю Гез (Gilles Du Guez) — учитель французского языка при английском дворе. Этот конкретный учебник был составлен для принцессы Марии (будущей королевы Марии I, известной как «Кровавая Мэри»), дочери Генриха VIII. Зацените страничку из учебника. Очень прикольный английский 🙂 …ye must pronounce it letyng your lippes jointe close, so that there be but a lyttell hole in the middes.

Так вот, я вчитался в этот учебник. Там упоминается фрукт под названием «openarses». Как вы понимаете, это «открытые задницы» по-английски. Так в тюдоровской Англии называли мушмулу (medlar). Если вы погуглите, как выглядит мушмула, у вас не будет вопросов почему это openarses 😉

В анатомическом разделе (MEMBRES LONGYNG TO MANNES BODY) автор рядом с глазами и ушами упоминает «the nether beerde» (дословно — «нижняя борода»).

Как Пиноккио избежал смерти: редакционное спасение и народный выбор | 2026-05-01T16:52:59

Оказалось, что изначально Карло Коллоди, написавший «Приключения Пиноккио», не собирался превращать своего героя из деревянной куклы в настоящего мальчика. Пиноккио ожидала судьба быть повешенным Котом и Лисой на дубе — в назидание всем детям, которые врут и не слушаются старших.

Продолжить приключения Пиноккио автора убедил редактор «Детской газеты», который сказал, что иначе это станет их последней публикацией. Читатели были настолько возмущены гибелью героя, что редакцию завалили письмами с требованиями продолжения.

В итоге через несколько месяцев автор был вынужден «воскресить» куклу. Именно так в истории появилась Голубая Фея, которая спасла Пиноккио из петли, а сама мрачная притча постепенно превратилась в привычную нам сказку с хорошим финалом.

Когда Пиноккио уже висел на дубе и задыхался, в окне домика неподалеку появилась Красивая Девочка с Лазоревыми Волосами. В тот момент она описывается не как добрая фея, а скорее как привидение или дух (она говорит, что в этом доме все умерли, и она тоже ждет своего гроба).

Увидев болтающуюся на дереве куклу, она сжалилась и организовала целую спасательную команду. Фея трижды хлопнула в ладоши. Прилетел огромный Сокол. Она приказала ему лететь к Большому Дубу, перегрызть веревку клювом и аккуратно опустить Пиноккио на траву. Затем она вызвала своего слугу — пуделя по имени Медоро. Он был одет в праздничную ливрею, в треуголке и с кудрявым париком. Медоро отправили за Пиноккио на роскошной карете, запряженной сотней пар белых мышей. Когда куклу привезли в замок, она была ни жива ни мертва. Чтобы решить, что делать дальше, Фея вызвала «светил» медицины. К постели Пиноккио пришли Ворон, Сыч, и Говорящий Сверчок (тот самый, которого Пиноккио «убил» в начале книги, но он вернулся в виде духа).

Жесть.

По сути, своим счастливым концом герой обязан не милосердию автора, а коммерческому успеху и давлению публики.

Глоссарий к «Лолите» Набокова: не просто словарь, а книга-путеводитель | 2026-04-08T11:24:22

Я наконец доделал до конца книгу The Reader’s Glossary — это по сути словарь на 5200 слов по «Лолите» Набокова, но организовыванный не в алфавитном порядке, как обычные словари, а в порядке встречаемости сложных слов, с разбивкой по главам и с указанием контекста слова или фразы. Сайт — readersglossary точка com (в первом комменте). Предполагается, что им будут пользоваться в том числе при чтении оригинала как книга-компаньон. Да, она вдвое больше 🙂

Словарь получился довольно толстым — на 600-700 страниц. Он доступен на четырех языках — русском, английском, французском и немецком. Также перевод (RU, FR, DE) или разъяснение (на англ) не абстрактные, а контекстные, да еще и с учетом того, как тот или иной фрагмент переводил сам Набоков с английского («Лолита» писал сначала на английском, потом переводил на русский).

У меня на сайте есть огромные фрагменты этих словарей RU,FR,DE,EN на ознакомление (каждая — около 1/3 полного объема).

Также полноценный интерактивный словарь на сайте, где можно вбить слово и посмотреть перевод или разъяснение. В словаре собраны в основном сложные слова, но мы знаем, что сложность для каждого имеет свое определение, поэтому все слова разбиты на три категории и выделены разными рамочками. Наверное, для начитанного англофона первая категория (пунктиром) вообще бесполезная (это около 50% словаря), для неначитанного, наверное, процентов 20 бесполезны. Но я решил дальше не резать, потому что книга не только для англофонов, но и для тех, кому английский второй язык, и там эти рамочки пунктирные очень даже кстати.

В целом, я это делал «для себя и друзей», just for fun, а не как коммерческий проект. Поэтому я совершенно трезво понимаю, что аудитория у нее супернишевая, и если хотя бы раз в неделю будет появляться кто-то, кому она может быть полезна, уже приятно.

Несмотря на то, что это было что-то типа хобби, времени книжки потребовали много. Для того, чтобы получить то, что получилось, я разработал с десяток приложений/скриптов, из которых пара имеют свой интерактивный UI, в котором я в общей сложности за два месяца работы провел много часов. И конечно, во многом разобрался, собственно, это и есть главный фан от процесса.

Итак, приходите на сайт — readersglossary точка ком. Ссылка в комментариях

P.S. На русском языке — только как PDF пока. Amazon не дает продавать книги на русском, только на небольшом количестве европейских языков в дополнение к английскому. Французская и немецкая версии словаря выйдут на Амазоне через неделю где-то.

Носов предвидел Инстаграм | 2026-04-07T13:04:23

Ещё в 1954 году Носов предвидел появление Инстаграмма

P.S. Не очень только понятно зачем разные шаблоны для разных цвет глаз и волос.

Лексическая карта «Лолиты» Набокова | 2026-04-02T15:56:00

Доделал первую версию книги-словаря по «Лолите» Набокова. На графике показано как распределяется сложность лексики по страницам книги. Нижний график усредняет 25 предложений, по вертикали — число сложных слов, цвета означают сложность/редкость (фиолетовые — самые сложные, красные — менее сложные, желтые — еще менее). Но это я уже убрал еще два уровня, и в целом для иностранца там все пять уровней непростые. В книге пунктиром отмечается уровень 3, простой рамкой — уровень 4, а двойной — уровень 5. Всего сейчас 5794 слова, из которых 541 пятого уровня, 1070 — четвертого, 1883 — третьего, 1393 — второго и 54 — первого (самые простые). Учитывая, что в первой версии получилось 1148 страниц, нужно будет очень сильно подчищать словарь, убирая оттуда то, без чего можно обойтись. Это в существенной степени слова первого и второго уровней, и отдельные из третьего и четвертого. Редкость слов рассчитывается тремя способами : через LLM, и через два списка частот слов англ языка в корпусе текстов (300К слов).

Не все слова сложные. Например, в предложении «With the ebb of lust, an ashen sense of awfulness, abetted by the realistic drabness of a gray neuralgic day, crept over me and hummed within my temples.» наверняка знающему неплохо английский не знакомы слова ebb, abet, drabness, а все остальное знакомо, но чуть снизь требования к читателю, и словарь может быть уже не очень полезным для таких.

Или вот предложение:

Homo pollex of science, with all its many sub-species and forms; the modest soldier, spic and span, quietly waiting, quietly conscious of khaki’s viatric appeal; the schoolboy wishing to go two blocks; the killer wishing to go two thousand miles; the mysterious, nervous, elderly gent, with brand-new suitcase and clipped mustache; a trio of optimistic Mexicans; the college student displaying the grime of vacational outdoor work as proudly as the name of the famous college arching across the front of his sweatshirt; the desperate lady whose battery has just died on her; the clean-cut, glossy-haired, shifty-eyed, white-faced young beasts in loud shirts and coats, vigorously, almost priapically thrusting out tense thumbs to tempt lone women or sadsack salesmen with fancy cravings.

У меня даже браузер подчеркивает тут четыре слова.

У меня есть определения слов на английском, немецком, французском, русском. Я столкнулся с тем, что для разных языков разные слова из текста считаются сложными, а они у меня единые. Так что придется отдельно помечать, например, французские слова в английском тексте, чтобы не включались во французскую версию, так как там читатель знает, например, что такое quel mot.

В общем, на выходных буду убирать, видимо, половину, в ручном режиме, и тогда можно делать обложку и выставлять на Amazon.

Эффективное изучение языка с электронным словарем Набокова | 2026-03-15T23:20:05

Блин, реально ж удобно. Сижу читаю.

Паттерн использования такой: держу телефон в руках. Там в apple books эта и книжка. Видишь незнакомое слово — оно с большой вероятностью будет в списке слов главы. Определение учитывает перевод самого Набокова. Дальше смотришь на пару слов вперёд, убираешь телефон, продолжаешь читать. Встречаешь те слова, и они ещё в кратковременной памяти, и ура, понимаешь. В паузу загружаешь в мозг следующие пару слов. В руках надо держать телефон и перелистывать, каждая страница содержит 4-5 определений.

Сейчас каждое слово имеет определения на английском (толкование), французском, и немецком. Соответственно, я могу издать четыре книжки.

В целом, мой уровень английского совпадает с предположениями моей программки о том , какие слова будут вызывать сложность. Но когда-нибудь мне надо такое для французского, и там понадобится для и каждого слова некоторую оценку уровня сложности, потому что мне будут непонятны и некоторые базовые слова тоже. Не уверен, что книжка с базовыми словами будет удобна. С редкими — точно удобна.