О, сколько нам открытий чудных приносит просвященья дух…
оказывается, Christmas tree в oil & gas industry — это фонтанная арматура. Это я по работе поиск тестирую

О, сколько нам открытий чудных приносит просвященья дух…
оказывается, Christmas tree в oil & gas industry — это фонтанная арматура. Это я по работе поиск тестирую

В советское время была хорошая школа анимации, на протяжении многих десятков лет она была ведущая в мире. Если сейчас набрать в youtube «Вовка в тридевятом царстве», то выдаются практически только реставрации 🤮 причем заодно выдаются такие же блевотные реставрации и кучи других мультиков, сделанные в том же духе (векторизацией, черные контуры). Если зайти на википедию, то там будет скриншот именно с реставрации, а не с оригинального мультика 1965 года. Оригинал можно найти например по запросу «вовка в тридевятом царстве мадина газиева», а вот по запросу «вовка в тридевятом царстве союзмультфильм 1965» не показывается он вообще.
Вообще поломали интернет.
P.S. Кстати, двое из ларца, исполняющие желания, и «так сойдет» очень резонирует с ChatGPT сегодняшнего дня 😉



Как смотреть сериал «Чайки», когда кончилось вино и скучаешь по Интерстеллару

Поскольку я периодически читаю научные статьи по своей теме, попробую сформулировать уровни постижения истины.
Уровень 0: «Папка «Read Later»» Скачал PDF, название звучит гениально, абстракт кажется решением всех моих проблем. Файл навсегда похоронен в папке ~/Downloads/Papers/ToRead.
Уровень 1: «Шумерская клинопись» Не понятно ни фига. Какие-то случайные значки, греческий алфавит закончился. «Ортогональная экстраполяция когнитивной энтропии в рамках квазистационарного дискурса неизбежно индуцирует бифуркацию трансцендентального синергизма». На таких материалах очень падает самооценка. Чаще всего, с этого уровня или падение на нулевой, или постепенно на 2-й.
Уровень 2: «Иллюзия компетентности» В Abstract всё понятно, Introduction читается как хороший детектив. Но как только начинается основной раздел, текст превращается в тыкву. Своими словами пересказать не могу, только общими фразами: «Ну, они там нейронку обучили… вроде».
Уровень 3: «Формулы где надо и где не надо» В Abstract всё понятно, первая половина статьи тоже норм (архитектура, картинки). Но потом идет формула (4), где происходит «магия». Я верю авторам на слово, что из уравнения (3) следует (4), потому что проверять это я, конечно же, не буду. Дальше — дикий ужас и вера в чудо.
Уровень 4: «Эффект золотой рыбки» Пока читаю — всё кристально понятно. Логика железная, выводы очевидны, авторы молодцы. Закрываю вкладку, меня спрашивают: «О чем статья?» — и я зависаю. В голове пустота. Если отнимите пейпер, я даже идею не воспроизведу. Потому что там по сути нет идеи, есть процесс.
Уровень 5: «Диванный эксперт» Всё понятно, могу пересказать суть за пивом. Знаю, что Input превращается в Output, но «черный ящик» внутри всё еще черный. Дай мне комп, воспроизвести не смогу даже скелетон, потому что оказывается, что в статье нет половины важных вещей.
Уровень 6: «Критик-практик» Все понятно, перескажу, понятно как воспроизвести (даже без их кода). Вижу, где они сжульничали. Точно знаю, что «state-of-the-art» результат получен только благодаря удачному сиду или датасету и вот этому странному трюку в препроцессинге, о котором упомянуто в сноске на 12-й странице.
Уровень 7: «Деконструктор» Ура, я все понял, и реализовал это сам. Оно работает хуже, чем в статье, но я знаю почему. Но понимаю эту работу лучше, чем второй соавтор (который просто графики строил). Я вижу, что вся эта сложная математика на 5 страниц сводится к двум параграфам в середине.
Уровень 8: «Нирвана» Статья тривиальна. Идея вторична, это всё было в 90-х у Шмидхубера, просто названо другими словами. Формулы переусложнены для важности. Я могу написать то же самое в 10 строк кода и это будет работать быстрее. Reject.
Если что — я завис где-то между 2 и 4.
Видимо, рекламу chatgpt сам и делал и размещал (висит в месте, где, кажется , вообще никто не ходит)

Вот что заметил. В США распространено ожидание, что сотрудник сам водит автомобиль, если работа предполагает разъезды. Компании часто выдают служебную машину или выплачивают компенсацию за использование личной. Это часто считается обычной частью должностных обязанностей, и наличие водительских прав нередко подразумевается по умолчанию. Например, Надя, волейбольный тренер, у нас периодически водит небольшой автобус.
Как я помню, в России традиция другая: в организациях, особенно государственных, крупных корпорациях или у руководящего состава, логичнее ожидать выделенного водителя.
Я ошибаюсь?
Меня занесло в тему стекла и столько всего интересного узнал, делюсь. Все началось с того, что я прочитал про суперкритическое состояние вещества — оказалось, что линия, разделяющая жидкое и газообразное состояние на графике давления и температуры в какой-то момент обрывается, и дальше находится состояние вещества, которое ни то, ни сё. Начал читать про состояния (фазы) веществ, и наткнулся на то, что стекло это по сути состояние между жидким и твердым. Мол, оно течет, просто медленно. Этот миф популярен благодаря наблюдениям за средневековыми окнами, где стекло часто толще внизу, что приписывали «течению» под действием гравитации, и он даже упоминался в школьных учебниках. На самом деле стекло — это аморфное твёрдое тело с чрезвычайно высокой вязкостью при комнатной температуре, и оно не течёт заметно даже за миллиарды лет; неравномерная толщина старых стёкол объясняется технологиями производства, когда более толстый край устанавливали вниз для устойчивости.
Дальше полез почитать про стекло еще. Оказалось, что причина, по которой стекло может быть прозрачным коренится в квантовой механике, конкретно в электронной структуре материала, а не из-за плотности частиц. Суть в том, что для поглощения фотона электрон должен перейти с одного энергетического уровня на другой, но в диоксиде кремния ширина запрещённой зоны (band gap) настолько велика, что энергии фотонов видимого света физически не хватает для совершения этого «прыжка». В результате свет просто не может взаимодействовать с электронами и проходит сквозь материал насквозь, в то время как более высокоэнергетичное ультрафиолетовое излучение уже способно преодолеть этот барьер и поэтому поглощается стеклом.
Еще оказалось, что расплавленное стекло проводит ток. Причем механизм проводимости принципиально отличается от того, как проводят ток металлы. В медном проводе ток — это поток свободных электронов. В холодном стекле (изоляторе) электроны жестко связаны, а ионы заблокированы в твердой решетке.Но когда вы нагреваете стекло до расплавленного состояния (обычно выше 1000 градусов для силикатных), тепловая энергия разрушает жесткие связи решетки и стекло становится жидкостью, и ионы получают свободу передвижения. Ток в расплавленном стекле — это физическое перемещение заряженных атомов (ионная проводимость), а не просто «перетекание» электронов.
Зеленый оттенок, который вы видите с торца обычного стекла (как на картинке приложенной), оказывается, вызван ионами железа, присутствующими в виде примесей (~0.1%). Песок — это природный материал, и «вычистить» из него железо до нуля сложно и дорого. Осветленное стекло, где в десятки раз меньше ионов железа, оказывается, используют в солнечных панелях, и не для того, чтобы оно просто было прозрачнее. Железо жадно поглощает инфракрасный спектр (тепловую энергию), снижая КПД панели. Убирая железо, мы позволяем максимуму энергии дойти до кремниевых ячеек.
Ну и напоследок, самое «взрывающее мозг» (в буквальном смысле). Существуют так называемые «Батавские слёзки» (Prince Rupert’s drops). Если капнуть расплавленным стеклом в ледяную воду, внешняя оболочка капли остывает и затвердевает мгновенно, в то время как внутренняя часть всё ещё остаётся жидкой. Остывая, сердцевина пытается сжаться, но застывшая корка ей не дает. В итоге внутри капли консервируется колоссальное механическое напряжение (до 700 МПа).
Физика этого процесса создает парадокс: «головку» такой капли можно бить молотком, и она выдержит, так как сжатие поверхности делает её невероятно прочной (тот же принцип используется в закаленном стекле смартфонов). Но стоит лишь надломить тонкий хвостик, как баланс сил нарушается, и волна разрушения проходит по капле со скоростью пули (около 1,5 км/с), превращая её в стеклянную пыль прямо в руках.
А еще в физике есть понятие «металлические стёкла» (amorphous metals). Если охладить расплавленный металл со скоростью миллион градусов в секунду, атомы не успеют выстроиться в кристаллическую решетку и застынут в хаосе. Такой «стеклянный металл» обладает уникальной магнитной проницаемостью и прочнее титана, потому что в нём нет дефектов кристаллической решетки, по которым обычно идет разрушение. Так что стекло — это гораздо более широкое понятие, чем просто прозрачная субстанция в наших окнах 🙂
Единственный пример штучки из этого материала, аморфного металла, Liquidmetal, который я встречал — не поверите , скрепка iPhone.
Кстати, та самая аморфная структура стекла, о которой я писал выше, даёт ему неожиданное преимущество — сверхъестественную остроту. Если взять скальпель из лучшей хирургической стали и посмотреть на него под электронным микроскопом, его лезвие будет похоже на рваную пилу. Это неизбежно: сталь состоит из кристаллических зерен, и заточить её ровнее размера зерна невозможно.
А вот обсидиан (вулканическое стекло) при раскалывании дает кромку толщиной всего в 3 нанометра (это примерно 1/30000 толщины человеческого волоса). В этом нет магии, просто у стекла нет кристаллической решетки, которая мешала бы сделать идеально ровный скол вплоть до молекулярного уровня. Поэтому обсидиановые скальпели до сих пор используют в сложнейших операциях на глазах — разрез получается настолько чистым, что клетки ткани травмируются минимально, и заживление идет быстрее.
И еще один мощный инженерный кейс — витрификация (остекловывание). Именно стекло человечество выбрало как самый надежный «сейф» для ядерных отходов. Жидкие радиоактивные отходы смешивают со специальными добавками, плавят и остужают в блоках. Хитрость в том, что опасные изотопы не просто залиты внутрь, они химически встраиваются в атомную сетку стекла. Стекло химически инертно, оно не ржавеет, как металл, и не разлагается тысячи лет. Это, пожалуй, единственный материал, которому инженеры доверяют хранение опасных веществ на геологических масштабах времени. Да, на разложение выброшенной вами бутылки уйдет где-то миллион лет.
Ну и последнее. Если копнуть в историю, выясняется, что римляне занимались нанотехнологиями за 1600 лет до того, как мы придумали само это слово. В Британском музее стоит «Кубок Ликурга» (IV век н.э.). Если смотреть на него при обычном освещении — он зеленоватый и непрозрачный. Но если поместить источник света внутрь кубка, стекло вспыхивает ярко-красным рубиновым цветом.
До 1990-х годов ученые не могли понять, как это сделано. Электронный микроскоп показал: римские мастера добавили в стекло золото и серебро, размолотые до наночастиц размером около 50 нанометров (это в 1000-1800 раз тоньше волоса). Именно такой размер частиц запускает квантовый эффект поверхностного плазмонного резонанса: электроны в металле начинают колебаться так, что поглощают одни длины волн и пропускают другие в зависимости от угла падения света. Самое смешное, что римляне сделали это эмпирически, «на глаз», а мы только сейчас научились повторять это сознательно в фотонике. Ну насколько можно на глаз оперировать золотой пылью 50 нм. Этот момент потребовал дополнительного гуглежа.
Римляне вряд ли могли механически размолоть металл до 50 нанометров — у них не было таких жерновов.
Вероятнее всего, они добавляли золото и серебро в виде солей или фольги в расплавленную стеклянную массу. Наночастицы образовывались не путем дробления, а путем кристаллизации и осаждения из расплава при очень точном температурном режиме («наводке» стекла). Это еще более сложная химия, чем просто помол.
Самое поразительное не то, что они это сделали, а то, что пропорция золота к серебру была выдержана идеально. Если изменить концентрацию золота всего на 1%, цвет уже не будет таким чистым рубиновым. Это говорит о том, что мастера владели технологией невероятно точно, хотя, вероятно, не понимали механизма. Ну и то, что у них было дохрена времени на всякую ерунду;) видимо, много поколений положили на это жизнь экспериментов. Потому что непонятно зачем это все.
Существует красивая гипотеза (не доказанная, но популярная), что кубок мог использоваться как детектор. Если налить в него другую жидкость (например, спирт с примесями или яд), коэффициент преломления меняется, и цвет «вспышки» может измениться.

Какая прелесть, Windows 95 в браузере copy.sh/v86.

Заумный пост сегодня. Пока писал книгу по RecSys, поймал себя на мысли, что современный data science — это, по сути, алхимия 21 века. За половиной «лучших практик» в алгоритмах нет хорошего математического аппарата. Это набор эвристик, которые «просто работают». Причем как в 17 веке смешивали все подряд, так и сейчас смешивают, и если что-то сработало лучше, все остальные начинают делать так же. Ответа на вопрос «почему» просто нет.
Возьмем, к примеру, алгоритм NCF/NeuMF (Neural Collaborative Filtering). Там такая логика. Есть, скажем, миллион оценок пользователями фильмов. И 100 миллионов оценок пользователями еще на даны — пользователи ж не могут посмотреть все фильмы на свете. Но из этих 100 миллионов для конкретного пользователя надо выбрать кандидатов для рекламы. У алгоритма, конечно, есть фаза тренировки, когда рассчитываются веса, и стадия предсказания, когда эти веса используются на входящих данных.
(Что делает алгоритм. Там по сути ансамбль из три подалгоритмов, два из которых генерят каждый свое заключение, а потом их решения поступают на новую нейронку, третий алгоритм, который дает финальную рекомендацию. По-умному это гибрид GMF (матричная факторизация) и MLP (многослойный персептрон) Первый из этих двух основан на разложении матриц, а второй представляет собой нейронную сеть из нескольких слоев. На тренировочных данных подбираются веса.)
На один позитивный пример он берет 4 негативных. Потому четыре? Да просто это «не много и не мало». Будет ли 8 лучше? Неизвестно, но учиться будет точно дольше.
Почему размерность эмбеддингов 32? или 64? Нет никакой формулы. Это «золотая середина» между «тупой» моделью (мало k) и «переобученной» (много k).
Теперь про нейронку. Почему MLP-блок строят «башней» (64 -> 32 -> 16)? Почему не (50 -> 25 -> 10)? Почему между ними ReLU (а не tanh например)? Чистая эмпирика. Число слоев в башне тоже подбирается.
Почему у GMF и MLP-частей разные эмбединги на входе? Потому что авторы статьи попробовали, и так «получилось лучше». Мат. доказательства нет. Почему на финальный слой они идут с равными весами? Потому что потому.
Почему выходы двух путей «склеиваются» (concat), а не складываются или перемножаются? «Опыт показал, что так результат точнее».
И так во всем, вплоть до выбора оптимизатора Adam или «магического» learning_rate=0.001, хотя с этими по крайней мере понятен матаппарат.
То есть, у одного алгоритма как минимум с десяток параметров подобрано эмпирически, при этом однозначной уверенности, что они независимые друг от друга — нет. Зато многие из них зависят от датасета, но никто не знает как 😉
В общем, алхимия.

Мои яблоки почти поспели #нарисовалось

