Опечатка в меню: крабик превратился в нечто неожиданное | 2025-09-09T14:17:03

Зашли называется суши поесть

Это у них должен был быть крабик

Один день из жизни автономного такси | 2025-09-06T16:54:48

Отличная же идея. Мимо меня проехала коляска, довезла пассажира, возвращается на базу.

Секреты аэропортных сканеров: как технология распознает содержимое вашей сумки | 2025-09-02T20:29:43

Послезавтра лечу в Амстердам (а потом в Турцию), и вспомнил, что у меня остался неотвеченным вопрос самому к себе про то, как работают сканеры сумок в аэропорту. Ну конечно я знал, что это по сути компьютерная томография, рентгеновские лучи и все такое, но хотелось больше деталей. И ниже ответ, почему они просят вытаскивать воду, и почему иногда не просят.

Оказалось, что современные сканеры могут не просто видеть форму предметов, но и определять, из какого материала они сделаны. Обычный сканер как работает? Плотные материалы (например, металл) поглощают много излучения и на изображении выглядят светлыми или непрозрачными. Менее плотные материалы поглощают мало излучения и выглядят темными. И потому ноутбуки, например, приходилось вынимать — и не потому, что сканер не мог их распознать, а потому, что их плотные компоненты (аккумулятор, платы) могли быть использованы для того, чтобы спрятать за ними другие запрещенные предметы. Ну и поэтому давно уже там не просто сканеры, а компьютерная томография — по сути, сумка или чемодан сканируется со всех сторон, дальше создается 3D-изображение. Это вроде все знают.

Но я упомянул, что они понимают из каких материалов сделано. Как?

Оказывается, что сканер использует технологию двухэнергетического рентгена. Он просвечивает объект двумя пучками лучей разной энергии (высокой и низкой). Поскольку материалы по-разному поглощают излучение в зависимости от энергии луча и своего атомного состава, система анализирует эту разницу. По соотношению поглощения двух пучков вычисляется эффективный атомный номер Z — ключевая характеристика, своего рода «элементный отпечаток» вещества.

Проблема в том, что этот «отпечаток» у воды (~7.4) и многих взрывчатых веществ практически идентичен. Именно поэтому воду забанили. Опираться только на этот параметр — значит получать огромное количество ложных срабатываний.

Здесь в игру вступает компьютерная томография (КТ). Сканер создает точную трехмерную (3D) модель содержимого сумки. Из 3D-модели система получает точный объем (V) каждого объекта. На основе данных о поглощении рентгеновских лучей вычисляется его масса (m). Далее все просто: ρ=m/V.

То есть, система не принимает решение на основе одного параметра. Она строит для каждого обнаруженного вещества точку на двумерном графике с осями «Z — плотность». На этом графике вода и взрывчатка, имея почти одинаковый атомный номер, занимают совершенно разные положения из-за различной плотности.

И именно потому иногда воду можно провозить. Умные машины просто ее не помечают как нечто важное, но все-таки помечают как воду. А дальше вступают процедуры. Если в аэропорту машины обновили, а процедуры — нет, то воду попросят вылить. Но и машины много где не обновили, причем в одном и том же аэропорту это зависит от открытой в данный момент линии.

Цена такого сканера — 300-400 тысяч долларов.

А сканеры для людей работают иначе. Там миллиметровые волны. Они проходят сквозь одежду и отражаются обратно от кожи. Вода их сильно поглощает, поэтому они проникают на пару миллиметров. Система регистрирует отражённый сигнал и строит трёхмерную карту поверхности тела и объектов под одеждой. Но ее не показывает — вместо этого показывает упрощенный контур человечка и показывает на нем то, что ML нашел необычного. Поэтому, кстати, многие пытаются провозить всякое внутри себя, так как знают, что для такого сканера это абсолютно невидимо.

Ирония трекинга: кольцо, питающееся вашей энергией | 2025-08-20T20:01:08

Только купил Oura Ring 4, как фейсбук начал крутить скам-рекламу про первое кольцо, которое отбирает у тебя энергию для своего выживания. Мооя прееллесть!..

Борьба с искусственным интеллектом в изучении языков | 2025-08-19T23:43:35

Мне сегодня грок взорвал мозг. Говорю поучи меня французскому. Он: ок, как будет «книга»? Я говорю «лё ливр». Он говорит «неправильно! ля ливра». 😳Машина все равно сама едет, решил записать диалог. Не убеждается. Никак, стоит на своём. Ля ливра и всё. Боюсь, Грок так плохому научит в своём Language Tutor mode.

Вспомнилась история из «Воспоминание о Пушкине” М. Е. Юзефовича, относящееся к 1829 году:

«<Во время похода на Эрзерум> с ним было несколько книг, в том числе и Шекспир. Однажды он в нашей палатке переводил брату и мне некоторые из его сцен. Я когда-то учился английскому языку, но, недоучившись как следует, забыл его впоследствии. Однакож все-таки мне остались знакомы его звуки. В чтении же Пушкина английское произношение было до того уродливо, что я заподозрил его знание и решил подвергнуть его экспертизе. Для этого на другой день я зазвал к себе его родственника, Захара Чернышева, знавшего английский язык, как свой родной, и, предупредив его в чем было дело, позвал к себе и Пушкина с Шекспиром. Он охотно принялся переводить его нам. Чернышев при первых же словах, прочитанных Пушкиным, расхохотался: “Ты скажи прежде, на каком языке читаешь?” Расхохотался в свою очередь и Пушкин, объяснив, что он выучился по-английски самоучкой, а потому читает английскую грамоту, как латинскую. Но дело в том, что Чернышев нашел перевод совершенно правильным и понимание языка безукоризненным».

Anna Derevenitskaya

AI Search Agent: Революция в автоматизированном поиске и покупках | 2025-08-19T01:21:54

В дополнение к основному продукту для тестирования поиска я разрабатываю на досуге AI Search Agent. Вы даёте ей всего две вводные: сайт, на который нужно перейти, и цель (описанную в коротком абзаце). То есть, эта штука достаточно умная, чтобы совсем не требовать настройки — сайт и цель, а дальше типа я сама.

Как работает: Этот виртуальный агент сам генерирует поисковые запросы, перерабатывает их в зависимости от полученных результатов (например, упрощает), и анализирует, насколько они соответствуют заданному намерению. Если подходящие результаты найдены, агент может добавить товар в корзину и оформить заказ — если это предусмотрено в настройках.

Я об этом уже писал недавно — сегодня просто чуть более найс демо. Будет еще более найс, пока это вытащено из середины разработки, но уже видно, как анализируется страница и есть первые результаты, которые можно использовать.

Агент может использоваться для нескольких целей. Во-первых, это отличный способ создать ground truth — набор запросов с идеальными результатами. Эти данные потом можно применять для тестирования поиска без привлечения часто медленных и дорогих больших языковых моделей (LLM). Во-вторых, он помогает проверить поисковые функции перед запуском для пользователей. В-третьих, агент генерирует реалистичные данные использования, которые нужны для обучения моделей рекомендаций, требующих аутентичных взаимодействий.

Те цветные прямоугольники на видео — это язык взаимодействия агента с ИИ (или LLM). Чтобы понять, куда кликать, система размечает страницу и отправляет ИИ структурированное описание страницы — часто вместе со скриншотом, — чтобы он мог всё проанализировать и принять решение о следующем действии.

Виртуальный покупатель: Тестируем интернет-магазин на автопилоте | 2025-08-15T04:27:07

В рамках проекта TestMySearch.com я делаю систему «виртуальный покупатель», которая имитирует поведение реального пользователя в интернет-магазине: она начинает с абстрактной цели (например, «что-то яркое и сексуальное для спортзала»), превращает её в конкретный поисковый запрос, выполняет поиск на сайте и в зависимости от результата может либо продолжить просмотр, либо с определённой вероятностью переформулировать запрос, если найденное не соответствует исходной цели; далее система оценивает страницы по соответствию именно изначальной задумке, открывает карточки товаров, случайным образом меняет параметры вроде цвета или размера, принимает решение о добавлении в корзину и оформлении заказа, а также может покинуть сайт, что позволяет за одну ночь сгенерировать множество сессий, похожих на реальные, для тестирования поиска, фильтров и рекомендаций ещё до прихода живых пользователей.

Система полностью автоматическая. То есть, браузер на видео открывается сам, поле поиска там находится само (то есть, от сайта это не зависит), в него вбивается текст, который система придумывает сама на основе той самой изначальной цели, дальше выдаются фасеты и результаты поиска, которые тоже могут быть в совсем непредсказуемом для системы виде — но она все равно понимает где что, и принимает решение о том, перефразировать запрос, выбрать ли фасет или нажать на результат поиска. С какой-то вероятностью виртуальный пользователь покидает сайт. Если запрос перефразируется, например, то этот виртуальный пользователь не повторяет запросы, которые уже приводили к пустым или нерелеватным результатам, то есть, в пределах сессии есть «память».