Преобразование чата в семантический поиск вопрос-ответ | 2026-04-30T04:05:37

За вечер сделал простую утилитку, которая вытаскивает чат Natural Language Processing за полтора года — там 65 тысяч сообщений, и переводит его в пары вопрос-ответ, по которым есть семантический поиск. При клике на результат поиска (слева) открывается диалог в чате. Подсвечиваются те сообщения, которые являются ответами на вопрос. Ну и сверху подсвечивается вопрос а оригинальной формулировке.

Как работает: система предполагает, что люди в основном делают reply to на сообщения, находящиеся относительно близко в прошлом. Если на одно сообщение делается несколько reply-to, то наверняка оно полезное, и зацепило в чате других. Система берет сообщения, начиная с того, на которое многие отвечали, и заканчивая последним в цепочке reply-to — и среди таких берет те, которые имеют минимум 3 reply-to к оригинальному вопросу. То есть, по сути, она вырезает из чата кусок, начинающийся популярным вопросом так, что после нижнего отреза скорее всего уже идет нерелевантное. Такие блоки могут накладываться друг на друга — например, если кто-то спросил, пока другие отвечали на что-то еще.

То есть, если пользователь А спросил какая погода, и ему ответили «хорошая», «плохая», «дождь», и еще было пять сообщений без reply-to, а потом кто-то ответил на «дождь» вопросом «почему дождь», и на этот вопрос ответили еще пятеро, то в систему попадет первый вопрос про погоду — кусок будет заканчиваться 13 сообщениями.

Дальше эти куски суммаризуются в вопрос-ответ.

Получается прикольно.

П. С. На скриншоте поисковый запрос не имеет отношения к результату поиска, потому что я сдуру сделал скриншот, когда запрос ещё поменял, а отправить ещё не нажал

Иллюзия скрытой линии | 2026-04-29T17:56:08

Пытаюсь понять, это у меня одного так глаза работают или нет 🙂 если смотреть на любое место, кроме слова «Омурбекова», то боковым зрением четко выделяется линия, показанная на втором скриншоте красным цветом (но конечно, она белая). Как только возвращаешь глаза на нее, линии нет. То есть, она видна только боковым зрением. Делитесь, как у вас 🙂

Не та раскладка: когда gremlin стал похуистом | 2026-04-28T20:33:08

Это я набрал слово gremlin, не переключив раскладку. Собрался блин почитать про язык запросов графовых баз данных, по работе надо. Удивляет гугл, удивляет

Откровения Ильи Ремесло: между идеями и реальностью | 2026-04-27T21:37:47

Интересное интервью Ильи Ремесло у Собчак. Но если бы я был политтехнологом у Ильи, я бы предложил гораздо более стройную историю: мол, проснулся одним утром, оглянулся на прошлое, и решил починить карму, вместо того, чтобы топиться. Всё, что делал до этого утра -моя прошлая жизнь. Мы можем о ней поговорить, но, мол, для меня это закрытая страница, мне за нее стыдно, и если когда-то нибудь решат меня за нее наказать — будет справедливо, буду готов. Если же накажут за сегодняшнюю позицию — будет несправедливо, но я тоже готов. Всяко любой из вариантов лучше, чем топиться, отсюда и смелость. Такая история была бы намного более стройной, и неважно, имеет ли она что-то общее с реальностью.

Из реалистичных объяснений я для себя держу то, что чуваку совершенно реально угрожали смертью, кто-то из властьприближенных, непонятно за что, варианты могут быть самые разные, и из всех опций что делать этот имел самые лучшие шансы остаться живым, потому что если реализуют угрозу сейчас, рейтинги упадут ещё больше. Ну если посадят, то это почти госзащита от угроз.

Есть ещё одно. Возможно, что этот товарищ дал знать кому надо, что если его закрывают, какой-то очень серьёзный компромат тут же уйдёт в СМИ, но если с ним ничего не случится, то будет тишина.

Взбираясь наверх: день в скалолазном зале | 2026-04-27T15:03:10

Сходили с Машей в горы. Жёлтенькие по жёлтеньким, красненькие — по красненьким. Организаторам надо наверх коробку конфет поставить. Выяснил, что мышцы в пальцах вообще никакие, а остальные на следующий день болят. Классный экспериенс (не в первый раз)

Синие лучи ядерной активности: Вавиловочеренковское излучение на САЭС | 2026-04-26T23:52:10

На картинке — вавиловочеренковское излучение. Это я в 2009 году был на САЭС, стою в зале с ядерным реактором. Вода на фото — для замедления нейтронов и охлаждения отработанных стержней с ядерным топливом. Свечение возникает, когда электроны вылетают из топлива со скоростью, превышающей фазовую скорость света в воде. Типа звукового барьера, только для света. По интенсивности этого свечения можно на глаз примерно определить, насколько «свежее» топливо находится в бассейне. Чем ярче и гуще синева, тем активнее идут процессы распада. Интересно, что черенковское излучение является причиной, по которой на многокилометровой глубине океанского дна не бывает абсолютной темноты.