Software — Being in America

Пророщенный чудо-хлеб на 100 баллов | 14 июля 2026 года, 19:18

Есть такое приложение, Yuka, и оно показывает насколько здоровая еда по штрихкоду от 0 до 100. Вот никогда не угадаете что с фото единственное набрало 100 из 100. Это не ягоды и не семга. Это — хлеб.

Ezekiel 4:9. Он правда не обычный хлеб. Там нет муки. Он полностью состоит из пророщенных зёрен, семян (вроде льна, подсолнечника и чиа) и псиллиума вместо связующего элемента. Sprouted Grain Bread. Ну по консистенции хлеб как хлеб. К слову бутербродный бело-жёлтый хлеб из того же магазина набрал 4 из 100.

Как Yuka оценивает продукты. Три критерия — питательная ценность по системе Nutri-score (60%), наличие добавок (30%), органический статус (10%). Алгоритм обожает продукты с высоким содержанием клетчатки и белка, но нещадно штрафует за калорийность, насыщенные жиры, сахар и соль. Сёмга из-за жиров и высокой калорийности набирает 78/100. При этом готовая картошка фри 66/100. А чипсы BBQ — 4/100.

Технологии против туриста: штраф за парковку в мгновение ока | 12 июля 2026 года, 13:09

Флорида, Cocoa Beach. Запарковал машину неподалёку от ресторана вдоль дороги. Знак говорит парковка платная, вот номер парковки, вот QR на скачивание приложения. Сфоткал QR, номер машины, номер парковки и думаю пока сто метров иду до ресторана, сейчас поставлю приложение и оплачу. Поставил, ввел номер парковки, и оно теперь спрашивает номер парковочного места! Чёрт, придётся возвращаться. А там меня уже ждет выписанный штраф… Вот блин оперативные

SQLite: База данных с духом монашеского кода | 18 июня 2026 года, 12:48

Сегодня я узнал крышесносящие и мозговрывательные факты про SQLite — самую распространённую базу данных в мире (Триллион установок. В каждом смартфоне, браузере, машине, самолёте A350, даже на Марсе). Так вот, родилась она на военном эсминце USS Oscar Austin. Пилят её ВТРОЁМ. Открытый код. Но. С улицы в этот опенсорс не зайти — только по приглашению и через аффидевит. Компания называется Hwaci («Hipp, Wyrick & Company»). Заодно занимается музыкой (жена главного -музыкант). Зацените сайт. Офис — в жилом доме в Шарлотте. 600+ строк тестов на каждую строку кода. 100% покрытие ветвлений и MC/DC. Тo есть симулируют падения ОС, отключения питания, ошибки I/O и нехватку памяти. Главный набор тестов — проприетарный и закрытый. Прикиньте, open source с платными закрытыми тестами. Хочешь доступ — вступай в консорциум за $120 000 в год.

И самое странное — дух у проекта почти монашеский. Вместо Code of Conduct у них Code of Ethics, выдранный из главы 4 Устава святого Бенедикта (буквально 1500-летние «инструменты добрых дел». В начале каждого исходника вместо правового уведомления — благословение: «May you do good and not evil…».

(Они ещё не нашли подходящей системы контроля версий и написали свою для себя — Fossil (на SQLite, конечно). И парсер-генератор Lemon тоже свой. Прям как Линус с Git.)

Инновационное самообучение: создание умной аудиозаписной системы | 18 июня 2026 года, 04:47

Сделал очень крутую штуку для себя. Запускаю программу, она включает микрофон и слушает. Я переключаюсь скажем в браузер, комментирую то, что вижу на экране, периодически нажимая на хоткей для снятия скриншота. В это время моя программа делает транскрипт моих комментариев с привязкой ко времени, сохраняет скриншоты тоже с привязкой ко времени, дальше она распознает скриншоты, вытаскивая оттуда то, как пишутся те или иные слова, бренды, идентификаторы, имена людей, для того, чтобы потом транскрипт моей речи преобразовать в корректный текст. И все это — локальные модели, запущенные на моем ноутбуке, то есть, абсолютно бесплатно.

После того, как я закончу разговаривать с компьютером, я запускаю обработку транскрипта, которая берет на вход сырой транскрипт и распознанные в текст скриншоты и выдает обработанный транскрипт, который выглядит уже достойно (тут уже используется Gemini API). Можно даже следующим шагом сделать автоматическое вырезание из скриншотов фрагментов, о которых шла речь, и вставка их в текст в то место, где о них упоминали.

Или вот я могу просто включить видео на колонки и программа тут же мне делает вот такой транскрипт. Загуглите в ютьюбе видео «Angular HttpClient Under The Hood. Design Patterns & Source Code Overview» с 3:51 — я просто поставил его на пару минут на автомат, а затем остановил свой скрипт.

Трансформация изображений с AI: растягиваем или дорисовываем? | 16 июня 2026 года, 10:08

Опубликовал статью про то, как трансформировать изображения с изменением пропорций. С использованием генеративного AI, конечно, потому что из квадратного прямоугольное можно получить либо с потерей данных, либо с их додумыванием, либо растягивая и сжимая само изображение. Вот я описываю вариант, когда выполняется умное дорисовывание. При обработке сотен и тысяч изображений такой подход не обходится без ошибок, но их число относительно небольшое, и получается значительно выгоднее сосредоточиться на ручном «допиле» ошибочных, чем делать всю работу вручную сразу.

Конкретно это нужно при редизайне, когда выясняется, что новый дизайн немного не совпадает со старым по размеру, скажем, баннеров, а число этих баннеров измеряется сотнями и тысячами.

https://hybrismart.com/2026/06/15/automating-banner-crop-resize-across-breakpoints-with-generative-ai/

Миграция данных CMS с использованием графовых БД | 10 июня 2026 года, 03:12

Опубликовал новую статью на Hybrismart — после долгого перерыва. Она о том, как мигрировать данные из старого сайта в новый с использованием graph db (конкретно я юзал neo4j и memgraph). Кейс такой: есть старый сайт и новый сайт, и нужно перенести CMS данные — компоненты, страницы, сетку из старого в новый, и по ходу сделать всякие трансформации — например, в новом стили другие, сетка другая, компоненты частично другие. Вот для этой задачи я и использовал graph db.

Давно не писал на свой блог про SAP Commerce Cloud. Работал на SAP два года, и считал некорректным писать про их продукты, формально имея доступ к внутренним документам. Сейчас работаю на двух проектах параллельно — один про миграцию SAP Commerce Cloud, а другой в существенной спепени про графовые БД. И на стыке этих миров и родилась статья.

https://hybrismart.com/2026/06/10/migrating-sap-commerce-content-with-a-graph-database/

Migrating SAP Commerce Content with a Graph Database

Трехмерные надписи: от идеи до печати | 27 мая 2026 года, 21:12

Сделал скрипт, который генерит надписи, читаемые как три разных слова слева, справа и сверху. В целом это развитие того, что у меня было в предыдущем посте. — там было только лево-право. Один скрипт генерит тройки слов по словарю, которые технически можно сделать. Другой делает 3D-модель, которую можно кинуть на принтер (может сегодня и кину), а третий делает визуализацию этой модели — см видео

Алгоритмическое искусство в большом формате: создание через сплайны и CMYK | 2026-05-24T22:40:31

Играюсь с алгоритмической обработкой изображений. Картинки интересно выглядят только будучи распечатанными на большом формате — потому что все эти тонкие линии при масштабировании на экран телефона сливаются. Приложу в комменты приближение.

Работает так: на вход дается изображение, оно разбивается на квадраты разных размеров. Каждый квадрат — одно число: насколько он тёмный. Чем темнее — тем больше линий рисуется внутри. Линии не прямые — это сплайны Безье. Они плавно перетекают из одного квадрата в соседний, потому что точки на границах — общие. Получается не сетка, а единая непрерывная нить. Цвет — изображение раскладывается на каналы CMYK (как в типографии). Каждый канал обрабатывается отдельно: своя сетка, свои линии. Потом слои накладываются друг на друга — и из трёх или четырёх чёрно-белых пластин появляется цветная картинка.

Изображение не выглядит блочным из-за того, что сплайны из квадратов плавно перетекают друг в друга, но есть проблема: разбиение картинки на квадраты 10×10 по сути понижает разрешение в 10 раз. Для коррекции производится несколько проходов с разными размерами квадратов и сдвинутыми

сетками. Первый проход — крупные клетки, второй — мельче и сдвинуты на 10 пикселей вправо, третий — ещё мельче и сдвинуты по диагонали.

Весь процесс управляется JSON-конфигом — для каждого канала свои параметры, для каждого прохода внутри канала свои. На выходе — SVG, который можно масштабировать до размера стены без потери качества, и PNG, в котором CMYK слои накладываются с полупрозрачностью.

Автоматизация кросс-постинга: боремся с трудностями API Facebook | 2026-05-23T14:28:22

Доделал в лучшем виде кросс-постинг из фейсбука на два моих сайта-блога [на которые почти никто не заходит] — beinginamerica точка com и raufaliev точка com. При публикации нового поста в фейсбуке по расписанию стартует механизм перевода поста на английский, разбор приложенных картинок, генерация описаний к ним, создание заголовка на основе текста поста и описания картинок, создание тегов на их же основе, запись поста в turso db — это облачная база, бесплатная до определенных лимитов, создание эмбеддингов через openai, запись в qdrant cloud — это тоже облачная база, но уже векторная, ну и загрузка изображений в wordpress по API, и публикация поста на английском и на русском по API.

Все бы хорошо, но из всех API самый дурацкий — у фейсбука. Во-первых, для страниц как у меня, переведенных в New Experience, нет возможности использовать почти все из этого API. Точнее, есть, но нужно долго доказывать фейсбуку, что это реально надо, показывая документы на стартап, демонстрируя приложение и т.д. Очевидно, им не хочется иметь дело с чем-то уносящим контент из их системы во вне. Кроме этого, токен, который дает доступ к последним сообщениям, относительно короткоживущий (возможно, несколько недель), и получать его заново нужно через браузер только. То есть, любая автоматика требует регулярного внимания, иначе она ломается.

Если протупил и вовремя не выгрузил последние посты через этот Facebook Graph API, они просто исчезают из списка последних и все, больше по API к ним не обратиться. Единственный способ — запросить выгрузку архива у фейсбука. Эта выгрузка тоже довольно дурацкая — там нужно много трансформаций делать и убирать лишнее. Например, в файле с постами, который я обрабатываю, там почему-то хранятся ссылки, которые я отправлял в комментариях без сопроводительного текста. А комментарии там идут в отдельном файле!

Чтобы назначить теги, пришлось решить отдельный челендж. Вот есть около 10000 постов за все время. Это большой кусок, и по нему теги построить нельзя, потому что он в контекстное окно LLM не помещается. А надо. Поэтому я делал так: скрипт берет случайные посты из 10000 в таком объеме, чтобы их суммарный размер был чуть меньше указанного лимита в токенах, и в конец этого блока добавляется промпт «сгенери мне наиболее частые теги, 30 штук» (промпт привожу упрощенно). В итоге я запустил это 10 раз и получил 10 наборов тегов по 30 штук, сгенерированных для разных срезов базы. Получилось 300 тегов, из которых конечно есть полные дубликаты, а есть синонимы и близкие по смыслу. Это все скармливается LLM, и получаем список тегов и иерархию тегов. Теперь у нас есть ограниченный набор тегов, которые максимально отражают 10000 постов. Так получилось, что за почти 20 лет на фейсбуке у меня расклад такой:

Тег Постов

==================================================

#Russia 3412

#Thoughts 3146

#Tech 3105

#Culture 2765

#Hobbies 2726

#AI 1603

#Science 1367

#Software 1358

#Travel 1298

#Learning 1138

#Society 1050

#Nature 958

#Education 915

#Business 902

#Art 894

#Programming 889

#Humor 840

#History 807

#Gadgets 750

#Moscow 713

#USA 614

#Cinema 567

#Webdev 493

#Music 476

#Sports 473

#Mindset 443

#Auto 400

#Books 386

…

ну и так далее. Этот список включает как теги из ограниченного списка, так и теги, которые LLM поставила материалу просто потому, что не нашла в ограниченном ничего подходящего.

Теги из ограниченного списка стали категориями на сайте. Остальные теги + эти стали просто тегами wordpress.

Поиск по картинкам. У меня было две идеи как его сделать. Первая — OpenCLIP. Это довольно просто, но требует хостинга модели где-нибудь. На своей машине легко, но каждый раз ее запускать неудобно, плюс я планировал переносить мигратор на дешевый сервер в амазон. В облачных моделях тоже нормально считать, но хоть немного за это надо платить, а это еще одна dependency. Но главное — что и без этого неплохо работает. Я с помощью OpenAI , который и так используется для перевода на английский, генерю описания к картинкам, и дальше по этим описаниям делаю embeddings с помощью large модели. Пока что все тесты на поиск проходят на ура. Особенно, когда на картинке есть текст, и большой вопрос разобрал бы ли его OpenCLIP.

В итоге:

1) вордпресс raufaliev точка com — бесплатный

2) вордпресс beinginamerica точка com — бесплатный

3) turso db где хранятся все посты — бесплатный

4) qdrant cloud где хранятся эмбеддинги — бесплатный

5) openai для перевода и описания картинок — не бесплатный, но недорогой (обработка постов за год потребовала 30 баксов).

Прикладываю два скриншота — как работает поиск по изображениям, и по текстам, а также дашборд мигратора.

Автоматизация документации больших данных: от анализа к действию | 2026-05-06T22:28:27

Интересно, а существует такой агент, который получает на вход таблицу (эксель), по размерам значительно превосходящую контекстное окно, и начинает ее документировать по сути. Вот есть несколько вкладок. Вот есть на вкладке 5 табличка в миллион строк и пять столбцов. Столбцы такие-то. Берем случайные данные из таблички, так, там вроде числа, а там — фамилии. Делаем предположение, что числа там везде — пишем код, который проверяет это предположение и заодно вычисляет мин/макс и набор уникальных значений. Так, значений немного, всего пять. Запишем. Проверяем теперь фамилии. Да, это просто строки, новый сэмплинг показал, что там фамилии правда. Тут формула. Смотрим куда она указывает. И т.д. А вот эта колонка — неясного назначения. Смотрим на данные — это какие-то числа от 0 до 1. Померяем среднее и разброс. Спросим у пользователя — может, даст какие комменты. Дал. Окалось это выданный kpi этого юзера из внешней системы. Запишем. И так далее. Получается документация. Дальше, когда есть документация, можно просить сделать какие-то операции со всем этим, поскольку LLM уже понимает плюс-минус назначение данных, и их связь, и может строить какие-то гипотезы на выявление outliers и их проверять.

	Rauf Aliev к записи Про магазины
	Rauf Aliev к записи Про магазины
	Михаил Едемский к записи Про магазины
	keht к записи Про магазины
	Vasiliy Bogin к записи Дневник Маши: 4-й класс Спринг…