Метка: AI
Биометрия сердца: ключ к умной разблокировке часов | 2025-08-06T16:43:51
Почему никто не сделал так, чтобы умные часы разблокировались только на руке своего владельца, считывая его уникальный сердечный ритм или другие биометрические данные? Ну в приложение к тому, что телефон хозяина рядом.
Официально в настройках Apple Watch запретить это нельзя — Apple намеренно сделала так, что при первом надевании часов за день они всегда требуют код, даже если iPhone рядом. Это связано с политикой безопасности: часы могут оказаться на руке другого человека, а телефон — просто неподалёку.
При этом, у каждого человека есть уникальные паттерны сердечного ритма, которые включают в себя, например, небольшие вариации в интервалах между ударами сердца, особенности формы сердечного сигнала, то, как сердце реагирует на разные нагрузки. Эти микроскопические отличия и создают уникальную «картину» сердечного ритма, которую сложно подделать или повторить. У часов, после того, как их надели, и до того, как они нужны разблокированными, есть довольно много времени, чтобы собрать, обработать, и принять решение разблокировать или нет.

Навыки программиста для работы с AI в генерации кода | 2025-08-04T14:28:45
Я сейчас ну очень много использую Gemini для генерации кода, и вижу скилл, который нужно иметь программистам, чтобы быть успешными на этом поприще. Это умение быстро читать и понимать чужой код, а также умение объяснить, почему генерацию AI нужно переделать и как. Для первого нужно просто очень хорошо знать язык и читать «с листа», потому что времени вдумываться будет мало. Для второго нужно хорошо знать паттерны и понимать, где они применимы, а где — нет. AI еще долго будет лажать с использованием паттернов не к месту.
Кроме этого, человеку все еще нужно будет понимать «как единое целое» на 90% код, который сгенерировал AI, и также успевать находить время на осознание каждой сгенерированной строки кода. Если расслабиться и упустить, то система может родить даже работающий, но очень плохо поддерживаемый код. Например, есть негласное правило, что отдельные файлы должны содержать не так много кода, и если он растет, то нужно делать рефакторинг, разбивая один большой на два или три. Иногда это требует переписывания логики, но это переписывание всегда направлено на одну задачу — упростить поддержку. А AI при переписывании еще и «улучшает» код заодно. И это довольно сложно запретить.
Кроме этого, сама концепция LLM предполагает ограниченность контекстного окна. Которое кодом забивается очень быстро. Чтобы была иллюзия у пользователя, что все работает даже при большом объеме кода, LLM умеют делать предварительную обработку, вытаскивая для процессинга только релевантные куски и откладывая в сторону нерелевантные, чтобы релевантные поместились в реальное контекстное окно. Но этот процесс очень ненадежный, и один раз он срабатывает, а во втором оказывается, что отложили в сторону важное, и в итоге система не увидела всю картину и сгенерировала код, в котором есть функция, очень похожая функции, отложенной в сторону, и вот у нас теперь есть две почти одинаковые.
Кроме этого, сейчас логика распределена между БД и кодом. То есть, данные часто управляют кодом. А данные в LLM просто часто не помещаются. Их слишком много. В итоге, без программистов пока с текущими архитектурами LLM не обойтись. Но вот требования к квалификации программистов только вырастут с LLM, а не упадут. Так что да, джуниорам надо волноваться, но лидам не очень 🙂
Сбой в системе: все рейсы Alaska Airlines приземлены | 2025-07-21T07:07:59
Аэропорт Сиэттла встал — какая-то ерунда с IT-системами, самолёты Alaska Airlines не взлетают (grounded).
UPDATE: помните у Боинга отвалилась дверь в полёте? Это были Alaska Airlines и Boeing 737 Max, в котором я сейчас сижу.


Технологии безопасности в коммерческом транспорте: дорого или необходимо? | 2025-07-18T20:33:57
Интересно, почему умные системы, камеры, системы помощи водителю в вождении, не используют на коммерческом транспорте типа грузовиков и автобусов? Просто одно дело встраивать такие статусы в машину стоимостью 35К долл, а другое — в грузовик или автобус, чьи цены начинаются как минимум с 100-150К, а в ряде случаев и больше. Автобусы покупают часто организации, которым плюс 5-10 тыс при цене в 100-150 может не сильно делать «погоду» в решении что брать. Хотя конечно понимая, что там тендер на минимальную цену наверняка, каждая тысяча может быть решающей. С другой стороны, может быть ниже страховка, и людям (пассажирам) можно продать это красиво. Также кажется, что засыпающие водители грузовиков тупо опаснее и дороже, чем засыпающие водители персональных машин
Вечные дроны: миф или реальность? | 2025-07-16T01:33:37
Интересно, почему мы до сих пор не видим автономных дронов, которые могли бы жить «вечной» жизнью: садиться на крыши, разворачивать солнечные панели, заряжаться от солнца и раз в день вылетать на задание, каким бы оно там ни было? Ведь если прикинуть энергетику, получается вполне рабочая схема. Например, тяжелый дрон весом около 8 кг может взять с собой складные солнечные панели площадью 1,5 м² и аккумулятор на 2 кВт·ч. За один солнечный день такие панели соберут около 1,2 кВт·ч энергии — этого хватит, чтобы он 20 минут летал со скоростью 40–50 км/ч, сделал фото и передал их по мобильной сети. И даже останется запас энергии на несколько пасмурных дней.
Даже легкий дрон весом 2 кг с небольшими панелями (0,5 м²) мог бы каждый день подниматься в воздух на 10–15 минут, если ему удается найти хорошую погоду и солнечную крышу. Мощность на зависание в воздухе для таких штук — около 150–200 Вт, а солнечные панели при эффективности 20% в средних широтах дают до 350–400 Вт*ч за день. Баланс вполне сходится, особенно если не гнаться за скоростью, и если на крыше некуда спешить.
Такой «солнечный кочевник» мог бы жить неделями и месяцами, перелетая с крыши на крышу и заряжаясь в ожидании миссий. На первый взгляд, технологии батарей и панелей уже позволяют это сделать. Или я где-то ошибаюсь?

Умные помощники на каждом шагу: будущее смарт-очков и AI в повседневном общении | 2025-07-15T20:19:45
Вот что было бы здорово сделать с AI — это систему, которая читает экран, слушает, что обсуждают на колле, в том числе то, что говоришь ты, и говорят тебе, и _на экране_, а лучше прямо на смарт-очки, дает всплывающие подсказки и хинты, которые помогают вовремя задать встречный вопрос или запросить пояснение или ответить на вопрос к тебе. Не для прохождения интервью, хотя тоже неплохо было бы, а для того, чтобы более эффективно проводить обсуждения — от технических до коммерческих.
В случае смарт-очков можно и в отсутствии компьютера перед глазами таким баловаться. Боюсь только, отправлять в облако вообще все, что происходит вокруг тебя, анализировать, и в реальном времени возвращать, пока технологически непросто (=дорого).
Для проведения интервью такое полезно не меньше, чем для его прохождения. Например, задаешь человеку вопрос, он начинает что-то отвечать, и тут система такая — ага, кажется, он плавает в такой-то теме. Давай спросим вот это. А ты уже решаешь спрашивать это или что-то другое. Why not? Удобно же. Правда, такую же систему может поставить интервьюируемый, и тогда будет непросто.
Я вот сейчас листаю книжку Иоханнеса Иттена про цвет, и думаю, как же мне не хватает динамических иллюстраций и комментариев. Вот дошел до Пьеро делла Франческа и хоть убей не могу вспомнить что у него за картины. Вот тут пригодились бы смарт-очки. Смотришь на какое-то слово, щелкнул пальцами, и вокруг него появились всплывающие окошки, где и контекстные иллюстрации, и комментарии, и ссылки на подробную информацию, на которые можно перейти сейчас, или положить их в «почитать потом». Чтобы можно было бы голосом спросить любой вопрос, смотря на фрагмент текста, к которому он относится и получить ответ уже не голосом, а в всплывающем окне, которое быстро закрыть, если не увидел там ничего нового, или же добавить голосом уточнение, после которого контент в окне обновится.
Вот были бы у меня смарт-очки, я бы поэкспериментировал с таким. Выглядит несложным.

| 2025-07-14T15:03:05
Технологическая утопия под контролем: цифровой мир Северной Кореи | 2025-07-13T00:58:24
В последнем видео о Северной Кореи от Ланькова услышал интересное: владелец устройства не может открыть ни на компьютере, ни на телефоне чужой файл, если тот не подписан специальной электронной подписью от государства. Заинтересовался деталями, накопал для себя и для вас детали.
На телефонах у них модифицированный старый «KitKat» Android (2013), а на компах — модифицированный Fedora линукс, Red Star OS 3, с оболочкой, имитирующей интерфейс macOS от Apple (предыдущая косила под Windows XP). Пишут, что этот выбор дизайна, возможно, был сделан под влиянием того, что лидер Ким Чен Ын был замечен с iMac на своем столе, и видимо, сказал сделайте так же.
Северокорейские смартфоны оснащены скрытыми функциями слежки, которые автоматически делают скриншоты каждые пять минут, сохраняя их в секретной папке, доступной только властям, а не пользователю. По другим данным, скриншоты делаются при старте приложений, видимо, псевдослучайно. Еще есть цензура: если вводишь в любом приложении “Южная Корея” (남조선), система автоматически заменяет это на “марионеточное государство” (괴뢰국가). Сто процентов телефонов, очевидно, китайские, доработанные Китаем под Корею. Кстати, собираемые скриншоты доступны пользователям, но удалить их нельзя. Это приложение Trace Viewer явно создано для того, чтобы напоминать пользователям: всё, что они делают на планшете или телефоне, может быть известно правительству,
Весь медиаконтент в Red Star OS, включая документы, изображения, аудио- и видеофайлы, автоматически помечается водяным знаком с уникальным серийным номером жесткого диска, что позволяет властям отслеживать его происхождение и распространение. То есть, вы не можете сделать фотку и кинуть ее кому-нибудь, потому что она либо просто не откроется на том телефоне, либо, видимо, в редких ситуациях, если шаринг разрешен, в новом месте будут следы как того, кто является автором фотки, так и того, кто является следующим владельцем. Но это недоработано, и прямой обмен файлов все-таки ограничен. Вы можете только использовать ее сами. Разумеется, ничего нельзя удалить с телефона бесследно. Не разрешено иметь более одного устройства на человека (кажется, распространяется на отдельно планшет и отдельно телефон).
Северокорейские мобильные устройства используют строгую систему цифровых подписей (NATISIGN для одобренного правительством контента и SELFSIGN для контента, созданного на устройстве), что означает, что любой файл без этих подписей не может быть открыт в принципе. Система подписи и проверки подписи находится на уровне операционной системы, а не приложений. Это относится вообще ко всем файлам, которые люди создают что на телефонах, что на компах. Я вижу тут огромное число edge cases, но информации мало, а спросить не у кого.
Наказания за доступ к несанкционированным иностранным медиа, таким как K-pop или южнокорейские драмы, исключительно суровы. Если на компакт-диске, вставленном в компьютер с Red Star OS, обнаружен «нежелательный файл», система извлечет компакт-диск, запишет путь к файлу, отобразит графическое предупреждение, сделает скриншоты, а затем принудительно перезагрузит систему через 1000 секунд.
Северная Корея управляет национальной интранет-сетью под названием Кванмён, «огороженным садом», который полностью изолирован от глобального интернета и доступен большинству граждан только для одобренных правительством веб-сайтов и систем электронной почты.
При первом запуске браузера Naenara (основан на Firefox 3.5) домашней страницей по умолчанию является IP-адрес «10.76.1.11». То есть их интернет — это по сути интранет.

Будущее автопилотирования: Tesla и новый уровень технологий FSD | 2025-07-11T03:59:25
Читаю всякие инженерные блоги про автопилот Tesla (FSD) — просто потому, что я последние полтора месяца почти постоянно езжу как на такси — указываешь место назначения и дальше практически никогда не нужно вмешиваться, машина едет из точки А в точку Б полностью самостоятельно. Это конечно будущее.
Такие системы есть не только у Tesla. Например, она есть у Мерседеса (Drive Pilot). У остальных только в лучшем случае в пробках помогает. Хотя Tesla кажется единственная, которая работает на всех дорогах.
Так вот, возвращаясь к инженерным интересностям. У Теслы есть производство AI-моделей на своей «ферме», которая называется Dojo — это экзафлопный суперкомпьютер на чипах Tesla. Туда скармливаются видео с камер, и он тренирует модели, которые дальше отправляются для автономной работы на весь парк машин Tesla.
Архитектура FSD состоит из порядка 48 специализированных нейросетей, обученных на Dojo, которые вместе формируют около 1000 разных тензоров-прогнозов. Tesla постепенно переходит с модульных сетей (распознавание объектов + планирование) к end‑to‑end-тренингу — прямое преобразование видеокадров в траекторию/момент рулевого управления. Это похоже на «черный ящик» — нейросеть учится прямо по поведению человека, без ручной установки регуляторов; очень крутое инженерное решение, но, предполагаю, сложное в отладке.
Кстати, заявляется, что Тесла пересела с С++ на питон. И что этот переход на end-to-end training сделал ненужным 300,000 строк кода на С++, где были учтены всякие корнер-кейсы и правила разруливания различных ситуаций — теперь это на уровне модели.
Tesla отказалась от радара и ультразвука, перейдя к полностью камерным решениям (Vision Only) с «Hardware 4» (HW4, FSD Computer 2): 16 ГБ RAM, 256 ГБ флеш‑памяти, производительность 3–8× выше HW3.
Оцените производительность: 22 миллисекунды на создание 3D сцены с машинками, пешеходами, велосипедистами вокруг — идет сбор информации с 8 камер 36 раз в секунду.
85 мс на весь цикл от получения картинки до изменения плана и команд колесам. Фантастика!
Более 4 млн Teslas на дорогах ежедневно собирают данные, а в версии FSD Beta зафиксировано более миллиарда миль автономного вождения. Этот «живой» датасет используется для обучения сетей на самых реальных сценариях, включая редкие «edge‑case» (странные аварии, дорогие условия и т. д.).
В июне 2025 Tesla впервые доставила Model Y из завода в Остине к дому клиента без водителя и удаленного оператора — полностью автономно. Это очень круто.
Vision‑сеть не только анализирует текущий кадр, но и хранит признаки от предыдущих (на расстоянии ≈1 м). Это позволяет запоминать недавно пересечённую разметку/знаки, даже если они уже вышли из поля зрения – очень похоже на человеческую память.


