Четыре чайника и умное кольцо: неожиданные подарки от роботов | 2026-05-22T19:21:14

Заказал чайник Breville. Сто баксов стоит. Да, можно было купить похожий за 30, но у меня все Breville, плюс чайник покупается на несколько лет. Прихожу домой — у двери стоит коробка мне по пояс. Удивило не сильно, потому что Amazon любит класть какую-то мелочь в дальний угол огромной коробки, им так проще. Но сомнения усилились после того, как я ее не поднял одной рукой. Заношу домой — а там четыре чайника.

Открываю Амазон, смотрю заказ — все правильно, один. Может, они за 100 баксов продают 4-pack? Нет, в описании один чайник. Жму на саппорт, отвечает робот. Выбираю пункт «привезли extra items». Робот говорит «наш фолт, оставьте себе». Ну ок, теперь у меня четыре чайника. Семья большая, по чайнику каждому.

У Нади есть умное кольцо Oura 4. Что-то часто приходится заряжать, говорит. Раньше подольше работало, говорит. Связываюсь с саппортом. Отвечает робот. Я открываю своего робота и прошу сформулировать хорошее письмо в саппорт. Их робот проникся, говорит, сейчас подключусь к вашему кольцу и все пойму. Подключился, понял. Говорит, ждите новое кольцо. Сегодня приехал невзрачный конвертик с кольцом внутри. Если бы не FedEx его душно было со спамом выбросить.

Люблю роботов, за эти два раза почти на семьсот баксов ништяков. Ну хорошо, с кольцом хоть гарантийный случай, хотя я ожидал, что меня с моими претензиями к батарее послали.

Ну раз так, попросил робота сделать иллюстрацию к посту.

Тесла роботы выходят на улицу | 2026-04-25T05:37:13

Роботов Тесла потихоньку выпинывает на улицу. Сегодня на велике проезжал мимо. Жаль не включают

Искусственный интеллект и нейроморфные процессоры: аналогии в обучении языку | 2026-02-15T15:41:53

Некоторые мысли по поводу LLM и искусственного интеллекта в целом. И в конце про нейроморфные процессоры и Intel Loihi.

Как вы все знаете, фундаментально LLM работают по принципу «предлагай вероятное следующее слово, используя контекст из предыдущих N слов», и затем слово попадает в контекст, и повторяется все заново для следующего слова. Ну еще и контекст там обрабатывается с учетом важности слов.

А теперь задумаемся, как в первобытных обществах учили языкам детей. Никаких азбук не было, как и грамматики. Но вот сама грамматика, по оценкам, была довольно сложной — по наблюдениям за малыми языками малых народов. Простая грамматика — это современное, когда язык распространился на миллионы и миллиарды.

То есть, мозг ребенка должен реконструировать в своих нейронах грамматику просто на потоке речи от окружающих и через тестирование на понимание сказанного. Возможно, ребенка поправляли, если он говорил неправильно, но как-то эта грамматика и звукоизвлечение должны были улечься в мозг — и вот тут используется тот же механизм, что и в LLM: какие слова/звуки идут рядом в каком контексте определяется латентными и не интерпретируемыми правилами, которые каждый человек в детстве создает в своем мозгу на свой лад. То есть, грубо говоря, тренирует модель ML каждый раз с нуля на потоке речи от окружающих. Ребенок не знает, что такое «падеж», но чувствует, какое окончание статистически более вероятно в данном контексте.

Собственно, современная когнитивистика (теория Карла Фристона) утверждает, что мозг — это буквально «машина предсказания». Мы постоянно генерируем гипотезы о следующем звуке или слове и корректируем их при несовпадении (ошибка предсказания).

Особенность LLM в том, что для нее учителя — это тексты и картинки, а для мозга ребенка — это живой мир вокруг, и если все тексты, которые он слышит, оцифровать, то объема не хватит даже на тренировку очень слабой модели. LLM видит слово «яблоко» рядом со словом «красное». Ребенок видит яблоко, чувствует его запах, вкус, вес и одновременно слышит звук. Эта «сшивка» разных сенсорных каналов позволяет выстраивать нейронные связи в тысячи раз быстрее, чем на чистом тексте. То есть, LLM современные берут брутфорсом — просто наблюдают за речью миллиардов, а не только своего ближайшего окружения. Хороший вопрос как мозг человека умудряется научиться на относительно маленьком датасете. Правда, большой вопрос маленький ли это датасет — например, движения губ, мимика, контекст дают очень много для построения этой нейронной сети в биологическом мозгу.

Про контекст: в отличие от LLM, ребенок понимает намерение говорящего. Если мама смотрит на чашку и говорит «горячо», мозг ребенка ограничивает пространство поиска смыслов одной чашкой. И если он не понял, то обожжется и запомнит.

Можно, конечно, предположить, что мозг уже при рождении имеет готовую сеть. Оно так, но наука пока это не может нормально объяснить. Вся наша генная программа насчитывает порядка 20 000 генов, кодирующих белки, и эти 20000 отвечают вообще за все — где и как должны быть построены легкие, сердце, кости, кровь, и сами по себе что ни возьми, все имеет запредельную сложность, и где-то среди 3 млрд нуклеотидов и 20 тыс генов эта информация должна быть записана.

Судя по всему, гены кодируют не карту, а алгоритм самосборки. Фактически, архитектура нейронной сети строится динамически, и начинается этот процесс задолго до рождения. Далее она калибруется по всем сигналам, которые принимает еще не родившийся ребенок, и к моменту рождения в мозгу уже есть как-то настроенная сеть.

Вероятно, что мозг ребенка — это миллионы нейросетей разных «архитектур», которые эволюционно усложняются, объединяются в процессе обучения. В отличие от LLM, где обучение и использование жестко разделены во времени. Но самое главное — мозг хоть и самый энергозатратный в организме, но в абсолютных значения он крайне мало потребляет энергии, особенно, если сравнивать с текущими «кандидатами на заменители в железе».

Последние годы активно идут разработки в области нейроморфных систем (например, процессоры старенький IBM TrueNorth и активно разивающийся Intel Loihi). В обычном AI нейроны передают числа (0.15, 0.88…). В нейроморфных системах они передают «спайки» (импульсы) — как в живом мозгу (и архитектура называется Spiking Neural Network — SNN). Несколько лет назад Intel выпустила Loihi 2. Полностью программируемая. Нейроны на Loihi могут менять свои связи (синапсы) прямо во время работы. Поддерживает пластичность — тот самый биологический механизм, когда связь между нейронами усиливается, если они часто «срабатывают» вместе. Но главное — потребляет очень мало.

В этой архитектуре модель может дообучаться «на лету» прямо во время работы, не забывая старые данные (Continual Learning). Кроме этого — экстремальная энергоэффективность.

Loihi 2 не умеет перемножать матрицы как это делают современные GPU, поэтому для них нужно вообще с нуля писать софт (и движется это очень медленно). Никакого PyTorch или Tensorflow — для Loihi есть только фреймворк Lava на сегодня. Ну и 1 млн нейронов от Loihi 2 для LLM очень мало. Поэтому Intel создает системы вроде Hala Point — это массив из 1152 процессоров Loihi 2. Он содержит до 1,15 миллиарда нейронов. Теоретически, по своей эффективности при работе с AI-моделями такая система может превосходить классические GPU в 10–50 раз по показателю «производительность на ватт».

На Loihi 2 уже запускают экспериментальные LLM (например, модели на 370 млн параметров). Они пока не заменят ChatGPT в облаке, но теоретически они — будущее для «умных» роботов и гаджетов, которым нужно понимать человеческую речь, работая от маленькой батарейки.

Понаблюдаем. Может оказаться пшиком, а может быть еще одной большой революцией.

Собери свой плоттер: от конструктора до первого рисунка | 2026-01-30T05:43:50

Собрал плоттер из набора. Практически лего набор — высыпаешь из коробки россыпью детали и дальше читаешь мануал. Заработало сразу. Есть идеи что с этой штукой делать, расскажу как-нибудь.

Навигация по магнитному полю: технология будущего | 2026-01-10T17:41:09

Узнал сегодня, что сейчас есть и активно используется технология навигации по магнитному полю Земли. Используется как замена или как расширение GPS.

Например, есть скандинавский паром Express 5 компании Bornholmslinjen, который страхуется от проблем с GPS (а они происходят) тем, что использует навигацию MagNav. В отличие от GPS, магнитное поле Земли невозможно заглушить или подменить — оно просто существует. Паром ездит по одному и тому же маршруту, и в целом, там можно навигацию даже через бытовые рыболовные эхолокаторы сделать.

Но вот есть несколько стартапов, которые используют эту технологию для навигации внутри помещения, куда сигнал от GPS не пробивается. Утверждается, что точность навигации — 1 метр. Вот это интереснее.

GiPStech, Oriient, Mapsted.

В основе этой технологии лежит процесс, называемый магнитным фингерпринтингом. Инженеры или роботы-картографы обходят здание со смартфоном, записывая уникальные искажения магнитного поля в каждой точке. Эти искажения создаются стальным каркасом здания, арматурой в стенах и крупным электрооборудованием. Формируется база данных, где каждой координате (x, y, z) соответствует свой уникальный вектор магнитного поля (интенсивность, наклон, отклонение).

Собранные данные загружаются в облачную платформу компании-провайдера. Там они проходят очистку от шумов и «сшиваются» с цифровым планом этажа (Floor Plan). Когда пользователь идет по ТЦ, его смартфон в реальном времени считывает данные со встроенного магнитометра. Специальное ПО (SDK) сравнивает текущие показания с теми, что хранятся в базе данных. Чтобы точность была 1–2 метра, система не полагается только на магниты. Она использует сенсорную фузию — объединяет данные магнитного поля с инерциальными датчиками (акселерометр считает шаги, гироскоп определяет повороты) и иногда сигналами Wi-Fi/Bluetooth для грубой привязки к зоне.

Для дронов эта технология наверняка сейчас активно внедряется. Главная техническая сложность там — собственные помехи и учет того, что магнитное поле меняется, и нужно постоянно обновлять карты. Электрика, двигатели создают сильные магнитные поля, которые «забивают» естественный фон Земли. Но пишут, что используются всякие алгоритмы фильтрации (включая нейросети), которые в реальном времени «вычитают» помехи от моторов из общих показаний датчика. Как я также понимаю, на большой высоте (километры) магнитное поле более «гладкое», поэтому точность ниже (около 1–5 км). Но если дронов несколько летит и они обмениваются сигналами, то в целом они вместе могут дать очень хорошую точность каждого. Кроме того, группа дронов может измерять градиент (скорость изменения) магнитного поля в пространстве, и привязывать местонахождение не к абсолютным значениям, а относительным. По сути, использование группы дронов превращает навигационную систему из набора отдельных приемников в распределенную фазированную антенную решетку, способную фильтровать глобальные помехи и работать с гораздо более слабыми полезными сигналами. Учитывая, что небольшие дроны, способные долго находиться в воздухе, могут выпускаться в воздух сотнями (и стоить копейки), это довольно перспективная область для военных.

Есть интересный стартап, Zerokey. Они выпускают QUANTUM RTLS 2.0. Эта штука дает пространственную точность в 1.5мм. Используется на производстве, например. Их ролик например показывает «часы» на руках рабочего, которые следят за корректностью сборки чего-то там на столе. Тут уже ультразвуковой принцип, и понятно, что к этим «часам» даются стационарные датчики и дальше мультилатерация.

Внутри ASML: Как создаются чипы будущего | 2026-01-02T00:47:51

У Veritasum вчера вышел очень крутой репортаж из ASML про оборудование, на котором печатают чипы для ваших телефончиков, фотиков и лэптопов.

Кто не в курсе процесса. Сначала из сверхчистого кремния выращивают монокристалл и разрезают его на тонкие пластины, затем на поверхность пластины многократно наносят тончайшие слои диэлектриков, проводников и полупроводников, каждый раз формируя нужные участки с помощью фотолитографии, травления и ионного легирования, в итоге получаются миллиарды транзисторов и соединяющих их металлических дорожек, а в финале пластину тестируют, разрезают на отдельные кристаллы и упаковывают в корпуса, превращая их в готовые микросхемы.

У этого процесса было ограничение — ширина дорожки и расстояние до соседней ограничено длиной волны используемого света, а сокращать ее сложно, потому что нечем такой поток фокусировать — линзы просто поглощают/отражают все. В EUV-литографии (экстремальный ультрафиолет) длина волны составляет 13,5 нм. Это практически мягкое рентгеновское излучение.

Вот в видео рассказываются детали про машину ASML ценой 400 миллионов долларов. Вместо преломляющих линз используются сложнейшие системы отражающих зеркал. Эти зеркала — самые гладкие поверхности, когда-либо созданные человечеством. Если увеличить зеркало этой машины до размеров Земли, то самый большой бугорок на нем будет не толще игральной карты. Чтобы зеркало могло отражать рентген, на него наносят до 76 чередующихся слоев вольфрама и углерода толщиной менее нанометра каждый. Это все делает Zeiss. Кроме этого, это зеркало имеет управляемую кривизну — оно постоянно корректируются роботами с точностью до пикорадиан. Точность управления зеркалом настолько высока, что если бы на нем был закреплен лазер, направленный на Луну, система могла бы выбирать, в какую именно сторону монеты достоинством в 10 центов, лежащей на лунной поверхности, попасть лучом.

Но. У нас нет «лампочки», которая светит в EUV-диапазоне.

Чтобы получить этот свет, лазер «выстреливает» в каплю расплавленного олова размером с белую кровяную клетку, которая летит со скоростью 250 км/ч. Первый импульс сплющивает каплю в блин, второй и третий — превращает «блин» в плазму — и все это в течение всего 20 микросекунд. При попадании лазера капля нагревается до 220 000 Кельвинов — это примерно в 40 раз горячее поверхности Солнца. Эта плазма и излучает тот самый нужный свет. И это происходит 50 000 раз в секунду. Говорят, уже довели до 100000. Прикиньте, при сотне тысяч выстрелов лазера в секунду она не промахивается ни разу. Все это происходит в глубоком вакууме. Чтобы очистить зеркала от частиц олова, камеру постоянно продувают водородом со скоростью 360 км/ч — это быстрее урагана 5-й категории. Этот процесс описывается той же формулой (Тейлора — фон Неймана), что и ядерный взрыв или взрыв сверхновой звезды.

Машина накладывает слои чипа друг на друга с погрешностью не более пяти атомов, при этом матрица двигается туда-сюда с перегрузкой 20G.

Одну машину High-NA перевозят в 250 контейнерах на 25 грузовиках и семи самолетах Boeing 747.

Ссылочка на видео — в комментариях. Или ищите на Youtube на канале veritasium.

Робомассаж Aescape: массаж будущего? | 2025-12-19T21:26:58

Сходили с Надей на робомассаж Aescape. Ну так, мне интересно было посмотреть на техническую сторону всего этого. В целом довольно интересно, но ехать 45 минут на машине вместо 15 и получать робота, пусть даже чуть дешевле.. ну так.. не уверен, что имеет смысл ходить туда регулярно. Другое дело, если ты уже там в зале занимаешься, и хочешь массаж прямо сейчас, без записи — это такой заменитель массажного кресла «на максималках». Да, в этом случае прям самое то.

Система сканирует тело четырьмя камерами под потолком, строит 3D-модель, и дальше в целом довольно неплохо эти роборуки отрабатывают, погружаясь в мышцы ровно так, как надо, где-то посильнее, где-то послабее — с учетом анатомии вообще, и конкретного массажируемого на столе. Кто-то может сказать, а не убьют ли они нафиг из-за какого-то бага, но мы и туда, и обратно ехали на автопилоте Теслы, и уж если машины решили бы нас убить, у них был бы шанс попроще.

Тесла: когда автопилот сюрпризирует | 2025-12-09T19:30:27

Пожил несколько месяцев без автопилота в машине, сейчас включил, а машина за это время научилась не просто приезжать на место через весь город и просёлки, но и находить парковку у места назначения и сама парковаться. Но вот когда я ей сказал домой приехать, прям указал, туда где тебя кормят (charger), она встала перед домом соседа. Заставляет задуматься;) но вообще очень круто, Тесла

Будущее продаж: когда AI стучится в дверь | 2025-10-16T15:47:32

Говорю сейчас менеджеру, а зачем нам презентовать наше AI-решение, оно ж AI, пусть само себя и презентует. Представилось, что в скором будущем в дверь будут стучаться боты, чтобы себя продавать (а может, не только себя), а в дверь будет вмонтирована защита от ботов.

Один день из жизни автономного такси | 2025-09-06T16:54:48

Отличная же идея. Мимо меня проехала коляска, довезла пассажира, возвращается на базу.