Инстаграм рекламирует аккаунты для подростков девочкой, сильно напоминающей Лену Катину из t.A.T.u в молодости;-)


Инстаграм рекламирует аккаунты для подростков девочкой, сильно напоминающей Лену Катину из t.A.T.u в молодости;-)


У меня вышло электронное open source приложение к моей книжке Recommender Algorithms! Это «песочница», где можно «погонять» различные алгоритмы рекомендаций с разными настройками, и по каждому алгоритму посмотреть специфичную ему визуализацию, помогающую понять как он работает. Например, для таких алгоритмов как ItemKNN, SLIM или EASE ключевой визуализацией является heatmap, выученной матрицы схожести (item-item similarity matrix). Это позволяет увидеть, какие именно пары товаров модель считает «похожими» (или «влияющими» друг на друга). Для SLIM, например, полезна «Sparsity Plot» , показывающая, что матрица схожести действительно получилась разреженной. Для алгоритмов ассоциативных правил (Apriori, FP-Growth, Eclat) визуализация — это вообще не график, а интерактивные таблицы с найденными «Частотными наборами» (Frequent Itemsets) и сгенерированными «Правилами» (Association Rules) , которые можно фильтровать и сортировать.
Кроме этого, там есть параметрический механизм создания «игрового датасета» — Dataset Wizard. Работает он так — есть шаблонные датасеты, которые описывают items через характеристики. Например, рецепты через вкусы. Или фильмы через жанры. Система генерирует случайных пользователей со случайным набором характеристик из того же набора — причем там много ползунков, позволяющих это распределение сделать более контрастным или сложным. Далее создается уже матрица оценок пользователями айтемов — условно если совпадают характеристики пользователя и айтема, то оценка будет выше, так как «совпадают вкусы» и наоборот, если различаются, то оценка будет ниже. Тут тоже ползунки, добавляющие шум и scarcity — рандомно удаляется часть матрицы. На вход алгоритму рекомендаций характеристики товаров и пользователей не подаются, они скрыты, но они используются для визуализации результатов.
Третьим компонентом приложения является подбор гиперпараметров. По сути, это автоконфигуратор под конкретный датасет. Там используется итеративный подход, который намного эффективнее, чем полный перебор (Grid Search) или случайный поиск (Random Search). Если говорить кратко, система анализирует историю прошлых запусков (trials) и строит вероятностную «карту» (суррогатную модель) того, какие параметры, скорее всего, дадут лучший результат. Затем она использует эту карту, чтобы по-умному выбрать следующую комбинацию для проверки. Этот метод называется Последовательная оптимизация на основе суррогатных моделей (SMBO).
Код свободный, будет еще дополняться новыми алгоритмами и новыми визуализациями.
Ссылочка на код в комментариях.
Ссылочка на сайтик, где код развернут и где можно посмотреть на приложение, тоже в комментариях.














Мои яблоки почти поспели #нарисовалось


У нас в посёлке жесть какая-то происходит. Сначала хозяин двух хаски пишет на nextdoor, что они сбежали з дома и просит сообщить, если кто-то их видел, и предупреждает, что они пугливые. А часа через два хозяин чихуахуа пишет, что сбежавшие две хаски убили его собаку и ещё курицу соседа. Хозяин хаски удалил первый пост. В посёлке все насыпали себе попкорн. Собак жалко. Все время боюсь, что Юки так убежит, он ещё и драчун, и яро не любит всех собак на свете кроме себя


«Привет. Я албанский вирус, но в силу низкого уровня технологий в моей стране я ничего не могу сделать с вашим компьютером. Будьте добры, удалите один файл на своем компьютере и затем перешлите меня другим пользователям.»
Вот вам версия из 2025. Строчку, которую они просят вставить в терминал — echo «<…>» | base64 -d | bash
Эта строчка содержит curl, указывающий на 217.119.139.117 результат которого передается в `nohup bash`. А с этого адреса грузится скрипт, разумеется obfuscated.
Разумеется, ни одна LLM из доступных расшифровывать его не соглашается. Но Qwen оказался не против.
Скрипт при запуске собирает информацию из Chrome, Brave, Edge, Firefox и других, извлекая куки-файлы, историю автозаполнения форм и данные для входа в системы, собирает криптокошельки Electrum, Coinomi, Exodus, Atomic, Wasabi, Ledger Live и др., собирает содержимое приложения «Заметки» macOS с прикрепленными медиафайлами, данные из Keychain (пароли), а также сканирует рабочий стол и документы в поиске файлов определенных расширений. Собранные данные архивируются и отправляются на удаленный сервер с IP-адресом 217.119.139.117.
Для обеспечения постоянного доступа скрипт создает скрытые службы запуска (LaunchDaemons) со случайными именами, что затрудняет его обнаружение. Он может загружать и заменять легитимное приложение Ledger Live на модифицированную версию.
Вот такой албанский вирус)


Нашел полезный экстеншн к Chrome — SingleFile. Решает вот такую задачу — нужно поделиться страницей из браузера, которая не публичная, например, по iMessage или Telegram. Это не так тривиально сделать. Например, модно записать из браузера на лэптопе файл .mhtml, и его отправить, но открыть его не смогут только получатели на айфоне. Записать в обычный .html тоже не вариант, так как там не сохраняются картинки и стили. Сделать скриншот — попадет только небольшой фрагмент. Поставить экстеншн, который делает длинный большой PNG со всей страницей — этот PNG нельзя открыть на айфоне из телеграмма как минимум, отрисовывается только верх. Печать в PDF тоже не выход — результат очень плохой и очень зависящий от желания разработчиков делать print-friendly version.
SingleFile позволяет создать снэпшот страницы из браузера, обычный .html, который открывается где угодно, со встроенными стилями и изображениями. Но что особенно удобно, перед экспортом можно через WebInspector поудалять все, чем делиться не хочешь, и оно не попадет в финальный .html. У экстеншена свободный код на github, и он никуда ничего не отправляет. Судя по всему, если на странице была динамическая подгрузка через JS, то сохраняется не JS, а результат подгрузки, а JS вырезается.
В общем, удобно, хорошая штука, пользуйтесь.
(Это у меня сегодня интервью вышло на внутреннем портале, и мне нужно было им с семьей поделиться в нашем семейном чатике)

Кстати, в моей Тесле очень умная система понимания, кто водитель. Если я захожу первый в машину, но сажусь на пассажирское, сразу кладу телефон на зарядку в центральную консоль, а Надя вторая, но садится на водительское, и тоже кладет туда телефон, выбирается не мой, а ее профиль автоматом, она ж водитель. Хотя телефоны оба находятся на зарядке под центральной консолью.
То есть, там два варианта: или там стоит антенна, которая умеет четко определять, что телефон пересек водительскую дверь, а не попал в машину любым другим образом, или там задействована камера, смотрящая на водителя. В любом случае, очень приятно, что это «просто работает»
Интересно, почему этот республиканец для выборов в конгресс из нашего райончика хотя бы псевдоним не взял? Или у нормальных людей включается контекст и они просто не видят, что слово butt означает задница?


На «Рживописи» вышла картинка «Париж глазами Самуэля Морзе». Ну мол, точки и тире. Натолкнула меня на этот пост. Мало кто знает, но вообще Самуэль Морзе был художником, причем неплохим — посмотрите на пару картин, которые я прилагаю к посту. Но это по нашим критериям неплохим — вокруг него было много тоже неплохих художников и на фоне них он считал себя неудачником в этом деле и вторую часть жизни, 35 лет, посвятил только телеграфу. (Кстати, Гитлер тоже был художником, на глаз любителя неплохим, но более посредственным, чем Морзе на фоне окружающих его художников, но пошел в политику). На приложенных фото есть картина с картинами. Ее реальный размер метра два и там среди висящих на стене картин есть даже Джоконда (Мона Лиза) Леондардо да Винчи. Которая в то время не так ценилась как сейчас. Ее заметили главным образом после того, как ее спёрли из Лувра, и потом всем миром искали и нашли.
Кстати, «Азбуку Морзе» придумал не Морзе, а Альфред Вейл, его коллега — факт, который Морзе впоследствии всячески отрицал (а заодно приписывал себе изобретение телеграфа как такового). В 1848 году код Вейла/Морзе был усовершенствован немцем Фридрихом Герке. Код, усовершенствованный Герке, использовался до тех пор, пока не пришли новые технологии.
(Кстати, не понимаю, почему он Морзе, а не Морз. Он же американец, его никогда никто Морзе не звал. )
Вообще из людей, которые были художниками, про которых все уже забыли, что они художники, потому что не забыли что-то еще, стоит упомянуть кроме Гитлера еще Уинстона Черчилля и Джорджа Буша-младшего.




