Радиоуглеродный анализ: наследие ядерных испытаний | 09 февраля 2025 года, 14:35

Оказалось, что ядерные испытания 1955-1963 года на всей Земле оставили отпечаток во всех живых организмах, и ученые могут таким образом определять возраст клеток любого живого (тогда) существа на Земле и частоту их обновления, что без ядерных испытаний было бы это сделать заметно сложнее. Есть даже специальный термин «C-14 bomb-pulse dating».

Вот как такой радиоуглеродный анализ работает. С 1955 по 1963 год использование атомных бомб удвоило количество углерода-14 в атмосфере. Атмосферный углерод-14, который обычно образуется только под воздействием космического излучения, реагирует с кислородом, образуя диоксид углерода (¹⁴CO₂). Этот ¹⁴CO₂ поглощается растениями в процессе фотосинтеза и передаётся в организм человека непосредственно через растительную пищу и опосредованно через мясо животных, при этом его количество примерно соответствует концентрации в атмосфере. Животные едят эти растения, мы едим этих животных – и углерод-14 оказывается в наших телах, встраиваясь в наши ткани.

Большинство тканей в живых организмах постепенно обновляются в течение недель или месяцев, поэтому содержание углерода-14 в них соответствует текущему уровню в атмосфере. Однако ткани, которые либо не обновляются, либо обновляются очень медленно, будут содержать уровень углерода-14, близкий к тому, который был в атмосфере на момент их формирования. Таким образом, измеряя содержание углерода-14 в тканях людей, живших во время и после пика «бомбового импульса», можно точно оценить скорость замены определённой ткани или её компонентов.

Это означает, что случайным образом ядерные испытания предоставили учёным способ понять, когда формируются ткани, как долго они сохраняются и с какой скоростью заменяются.

Оказывается, практически каждое дерево, жившее с 1954 года, содержит «всплеск» – своеобразный сувенир от атомных бомб. Где бы ботаники ни искали, они находят этот маркер. Есть исследования в Таиланде, исследования в Мексике, исследования в Бразилии – где бы вы ни измеряли уровень углерода-14, он там есть. Все деревья несут этот «маркер» – деревья северных широт, тропические деревья, деревья дождевых лесов – это общемировой феномен.

Но есть загвоздка. Каждые одиннадцать лет количество углерода-14 в атмосфере уменьшается наполовину. Как только уровень углерода-14 вернётся к исходному значению, этот метод станет бесполезным. Scientific American поясняет, что «у учёных есть возможность использовать этот уникальный метод датирования лишь несколько десятилетий, пока уровень углерода-14 не вернётся к норме». Это означает, что если они хотят воспользоваться этим методом, им нужно торопиться. Если только не произойдут новые ядерные взрывы – но этого никто не хочет.

Кроме прочего, это позволяет определять возраст человека по зубам и волосам. Как только зуб формируется, количество углерода-14 в его эмали остается неизменным, что делает его идеальным инструментом для датировки человека. Поскольку определенные зубы формируются в конкретные возрастные периоды, измерение содержания 14C в различных зубах может помочь исследователям оценить диапазон годов рождения. С волосами тоже самое, только они растут около 1 см в месяц, и по содержанию в разных частях волоса можно тоже делать выводы.

Для датировки углерода в зубах требуется около одной трети целого зуба, или 100 миллиграммов. Для подготовки образца его измельчают и растворяют в кислоте, что высвобождает CO2. При работе с волосами вместо растворения их в кислоте их сжигают. Поскольку волосы имеют высокое содержание углерода, требуется всего 3-4 миллиграмма волос. CO2 из образца зуба или волос затем восстанавливают до графита — кристаллической формы углерода — и помещают в ионный источник в CAMS, где нейтральные атомы графита превращаются в ионы путем придания им отрицательного заряда. Затем ускоритель может использовать этот отрицательный заряд для ускорения образца, что позволяет обнаруживать, подсчитывать и сравнивать соотношения атомов разных изотопов углерода. На графиках pMC — это отношение концентраций.

В 1960-х годах, когда концентрация C-14 резко менялась, метод позволял определять возраст тканей с точностью до ±1 года. Однако после 2000 года, по мере выравнивания уровня C-14, точность снизилась до ±2–4 лет.

Как ваши данные уходят к третьим сторонам через приложения | 08 февраля 2025 года, 16:20

Недавно наткнулся на интересное исследование на сайте Timsh org, где автор разобрал, как приложения собирают и передают ваши данные. В эксперименте использовалось старое устройство iPhone и перехват трафика. На телефон было установлено условно некоторое рандомное приложение — для эксперимента это был Stack от KetchApp. Автор перехватывал траффик и смотрел, что передается из приложения во внешний мир. А передавалось очень много всего даже при ответе «нет» на вопрос «Allow tracking?».

В частности, IP-адрес (что позволяет определить ваше местоположение через обратный DNS), приблизительная геолокация (даже с отключенными службами геопозиции),

модель устройства, уровень заряда батареи, уровень яркости экрана, количество свободной памяти и другие параметры.

Данные уходят конечно не в компанию-автор приложения, а неким третьим сторонам. То есть, эти третьи стороны собирают данные с большинства приложений на вашем телефоне, причем потоки идут каждый раз, когда приложение работает.

Автор пишет о двух крупных группах игроков — SSP и DSP.

К SSP (Supply-Side Platforms) относятся те, что собирают данные из приложения — Unity Ads, IronSource, Adjust. Есть также DSP (Demand-Side Platforms), которые управляют рекламными аукционами, это Moloco Ads, Criteo.

Рекламодатели получают доступ к данным через DSP. Брокеры данных — агрегируют и продают данные. Например, Redmob, AGR Marketing Solutions. Причем последний продает базы данных с PII, включая имя, адрес, телефон и даже рекламные идентификаторы (IDFA/MAID).

Какие данные отправляются? Вот к примеру тот Slack от KetchApp слал в Unity Ads геолокацию (широта, долгота), IP-адрес (включая серверные IP, например, Amazon AWS), уникальные идентификаторы устройства: IDFV (идентификатор для конкретного разработчика) и IDFA (рекламный идентификатор), а также такие доп параметры как модель телефона, уровень заряда, состояние памяти, яркость экрана, подключение наушников и даже точное время загрузки системы.

У DSP для продажи информации есть система RTB (real-time bidding). Данные из приложения передаются через SSP (например, Unity Ads), а затем в DSP (например, Moloco Ads), где в реальном времени проводятся аукционы для показа релевантной рекламы. На каждом этапе данные передаются десяткам, а то и сотням компаний.

Да, отвечая «Не хочу делиться данными», вы отключаете только отсылку IDFA (рекламный идентификатор), но при при этом другие данные, такие как IP-адрес, User-Agent и геолокация, и все эти модель телефона и свободная память, все равно передаются. Совместно они являются таким же фингерпринтом в моменте, как и рекламный идентификатор. Приложения при желании все равно могут вас идентифицировать по множеству параметров: IP-адресу, модели устройства, версии ОС, шрифтам, разрешению экрана, уровню батареи, часовому поясу и другим данным, так как получают эту информацию с сотни других мест. Другой вопрос, что «конечным приложениям» это не надо, это не бесплатно же, но тем, кто через них показывает вам рекламу это надо, и у них эта инфа есть. Ну и всякие спецслужбы легко могут получить доступ при необходимости, разумеется.

Если вы используете несколько приложений одного разработчика, идентификатор IDFV позволяет связать данные из всех приложений.

Наверное, это не секрет совсем, но в Facebook (Meta) отправляют данные почти все, при том, что у пользователя никто согласия не спрашивает. То есть, если у вас на телефоне есть фейсбук, то все, бинго, любые данные из любых других приложений начинают быть помеченными вашим профилем, даже, если вы в тех приложениях запретили делиться информацией.

Компании обмениваются пользовательскими данными друг с другом. Например, Facebook обменивается информацией с Amazon, Google, TikTok, а мобильные SDK (например, Appsflyer, Adjust) делают перекрестную привязку пользователей между разными сервисами, потому что такой обмен повышает цену и качество информации сразу у всех участников обмена. Таким образом, удаление одного приложения не мешает вашим данным «путешествовать» между разными платформами.

Заодно выяснилось, что Unity, который вообще-то 3D движками занимается для игр, в основном зарабатывает на продаже вот этих собираемых данных. Конкретно в 2023 году у них был доход с этого направления $2 млрд («Mobile Game Ad Network»). В 2022 году Unity поглотил IronSource — еще одного гиганта мобильной рекламы. IronSource занимается анализом поведения пользователей и оптимизацией монетизации, а также продажей данных рекламодателям. Теперь Unity через LevelPlay может управлять не только размещением рекламы, но и агрегацией данных, продавая их другим компаниям.

Большая часть мобильных игр создается на Unity, особенно free-to-play игры. Это позволяет Unity иметь доступ к данным с миллионов устройств по всему миру, даже без явного согласия пользователя. Разработчики часто не знают, насколько глубоко Unity отслеживает данные в их играх.

Вывод: отключение рекламы или запрет трекинга на уровне ОС — это всего лишь небольшое препятствие. Данные о вас все равно собираются, анализируются и передаются сотням компаний.

Ссылочку смотрите ниже

Гуляя с Юки: Зимний день у пруда | 08 февраля 2025 года, 15:13

Гуляю с Юки. Некоторые утки долго не шевелятся. Наверное, у них такая игра.

Прилетели нам пруд, а тут ещё лёд. Видимо, пёрышки грязные, и им грустно

Успех: Возможность, Талант или Просто Удача? | 08 февраля 2025 года, 00:51

Длинный пост про то, как достичь успеха! Бесплатно! без регистрации и смс! Я тут просто наткнулся на одну научную работу, которая доказывает, что роль случая в успехе выше, чем роль таланта. И это срезонировало с моим убеждением, что все успешные люди успешные, потому что им повезло, а не потому что они какие-то необыкновенно талантливые, умные, или необычные. Скорее даже наоборот, они такие, потому что им повезло. Заметьте, не потому что они «везунчики», а потому что им повезло. Это разные вещи.

Аргументирую. Есть исследование «Talent vs Luck: the role of randomness in success and failure», авторы Алессандро Плучино, Алессио Эмануэле Биондо и Андреа Рапизарда. Да, ржач в том, что Алессандро за эту работу получил Шнобелевскую премию («символическая награда за научные открытия, «сначала заставившие людей смеяться, а затем задуматься»»). Они использовали агентное моделирование для анализа вклада таланта и удачи в успех.

За исходные данные они взяли вроде как объективные вещи: талант и интеллект распределены среди населения по нормальному (гауссовскому) закону, где большинство людей имеют средний уровень этих качеств, а крайние значения встречаются редко, а богатство, часто рассматриваемое как показатель успеха, следует закону распределения Парето (степенному закону), при котором небольшое число людей владеет значительной частью ресурсов, а большинство — лишь малой долей.

Далее авторы разработали простую модель, в которой агенты (1000) с различным уровнем таланта подвергаются в течение условных 40 лет случайным событиям, которые могут быть как благоприятными (удача), так и неблагоприятными (неудача). Каждое такое событие влияет на «капитал» агента, служащий мерой его успеха.

Результат: Хотя определенный уровень таланта необходим для достижения успеха, наиболее успешными часто становятся не самые талантливые индивиды, а те, кто обладает средним уровнем таланта, но испытывает больше удачных событий. Существует сильная корреляция между количеством удачных событий и уровнем успеха: самые успешные агенты являются и самыми удачливыми.

Мое наблюдение за тем, «как работает мир», полностью с этими выводами согласуется. Нужно просто делать так, чтобы тебе больше везло. Всё. Не надо стараться быть самым умным — это не помогает настолько, насколько помогают следующие вещи:

1) Быть в среде, где случаются важные события. Кремниевая долина для стартаперов. Нью-Йорк для финансистов. Голливуд для актеров. Если окружение повышает вероятность знакомства с «ключевыми» людьми, то логично поместить себя в это окружение.

2) Создавать больше точек касания с миром и поддерживать их. Вести блог, писать статьи, давать интервью. Ходить на конференции, участвовать в сообществах. Звонить и писать знакомым и полузнакомым, особенно, когда такие звонки и письма им потенциально важны. Расширять количество контактов – даже если 99% бесполезны, 1% может изменить жизнь.

3) Увеличивать количество попыток. Чем больше проектов, тем выше шанс, что один из них «выстрелит». Лучший пример – венчурные фонды: они инвестируют в десятки стартапов, зная, что успех принесет лишь один. Художники, писатели, музыканты создают сотни работ, зная, что только одна станет хитом.

К сожалению, для этого пункта надо любить свое дело. Поэтому выбирайте такое дело, где попытки делать приятно.

Организационный психолог Томас Чаморро-Премузик в своей книге «Why Do So Many Incompetent Men Become Leaders?» утверждает, что удача составляет около 55% успеха, включая такие факторы, как место рождения и семейное благосостояние. Это так, но раз вы сидите в фейсбуке на айфончике за чашкой кофе, а не гоняете коров в набедренной повязке в Африке, у вас уже неплохие начальные условия.

Отсюда интересный вывод — нужно ли учиться в университете, чтобы тебя настиг успех в жизни? Смотрим на пункты выше. Быть в среде, создавать больше точек касания, увеличивать число попыток. Из этих трех пунктов два работают лучше в случае очного обучения, а третий работает не очень, потому что университет съедает 4-5 лет жизни (и университет — это одна попытка). Но зато два других критерия очень важны — за время обучения средний студент общается с сотнями сверстников, которые могут оказать существенный вклад в вероятность успеха этого студента.

Но вот сидеть эти пять лет дома с книжками — не соответствует ни одному критерию. Онлайн-образование находится где-то между, смотрите сами, оно разное бывает, но ближе к варианту «сидеть с учебниками».

Авторы исследования подтвердили концепцию «Эффекта Матфея». Это из Библии: «Ибо всякому имеющему дано будет, и приумножится; а у не имеющего отнимется и то, что имеет.» (Евангелие от Матфея, 25:29). Объясняют, почему успех накапливается, даже если он изначально случаен:

Люди, которым повезло на ранних этапах, получают больше ресурсов, возможностей и внимания. Это, в свою очередь, увеличивает их шансы на новые удачные события. В результате те, кто изначально оказался в выгодном положении, продолжают наращивать успех, а остальные остаются позади.

Это объясняет, почему богатые люди чаще получают выгодные инвестиции, популярные артисты становятся ещё популярнее, а менее известные остаются в тени, а компании, которые «попали в струю», привлекают больше клиентов и ресурсов, чем их менее удачливые конкуренты.

Именно поэтому для успеха еще нужно следовать принципу «Fake it till you make it». Успешный человек чаще преувеличивает свои навыки или достижения, а затем подтягивается до заявленного уровня. Общество такие штуки почему-то легко прощает и быстро забывает, но когда они срабатывают (а срабатывают часто), то человек уже в них особо не нуждается. Есть еще self-fulfilling prophecy — самореализующееся пророчество. Идея в том, что если человек заявляет что-то как факт (даже если это преувеличение), он и окружающие начинают вести себя так, будто это правда, и в итоге это действительно становится реальностью.

Есть еще принцип «за спрос денег не берут» (It doesn’t hurt to ask). Принцип в том, что если вероятность успеха поднимает заданный кому-то вопрос («а можете поднять мне зарплату с марта или включить главным вон в тот проект»), то надо спрашивать. You never know unless you ask.

И еще кое-что. Act now, apologize later. Actions speak louder than words. Как вы знаете, быть в нужное время в нужном месте имеет не только нужное место (это первый пункт из моего списка), но и нужное время. Поэтому just do it. Из людей, которые не мечтают, а делают, никогда никто не заканчивает бомжом на улице, потому что поторопился.

И последнее. Время — конечный ресурс. Хорошая идея была про листочек с клеточками — гуглите «90 лет жизни в неделях». Можно закрасить прожитые и посмотреть на оставшиеся.

Итак, резюмирую.

Успех определяется удачей, а не талантом. Талант помогает, но чаще формируется под влиянием успеха. Знания полезны, но опыт полезнее. Время — конечный ресурс. Планирование не работает, работают три вещи:

1) быть в среде, где случаются важные события,

2) создавать больше точек касания с миром и поддерживать их,

3) увеличивать количество попыток, где может сработать удача.

Три принципа:

1) Fake it till you make it

2) It doesn’t hurt to ask

3) Actions speak louder than words

Преодоление Legacy Paralysis: AI в борьбе с разложением ПО | 07 февраля 2025 года, 14:30

Так интересно наблюдать, что с ростом сложности и со временем софт переходит в состояние «вещь в себе», когда сами разработчики уже толком не понимают, как он работает, точнее, почему иногда и внезапно не работает, и предпочитают минимально его трогать, отчего они со временем еще меньше его понимают, и он застывает в том, как есть на годы. Этот процесс известен как software rot (разложение ПО) или legacy paralysis (паралич легаси-кода).

Но боссы и рынок требуют развития, поэтому вместо того, чтобы что-то по существу менять и улучшать, разработчики навешивают «свистелки и перделки», которые вырастают рядом, а не являются изменением основного продукта. Ведь всем понятно, что если начать лезть в основной продукт, можно встать на путь, который ведет к разочарованиям, срывам сроков, увольнениям и т.д.

Интересно, что с приходом AI эта проблема с одной стороны будет только усугубляться, потому что команда будет еще меньше понимать, как что работает, а с другой — сложность можно взять под контроль, так как для AI анализ сложных штук дается проще, чем для одного биологического мозга.

Например, AI можно использовать для создания тестов к существующему коду, а также выполнять поиск аномалий и потенциальных багов, для создания документации и объяснения структуры кода от простого к сложному, можно частично автоматизировать рефакторинг и обнаруживать узкие места производительности.

Думаю, что такие AI решения для работы с легаси должны быть крупным рынком скоро

Фрэнсис Белл | 06 февраля 2025 года, 20:59

(ENG) Очень классная английская художница, Frances Bell. На ее картинах или портреты, или люди у воды, но все сделано с колоссальным вниманием к деталям без собственно самих деталей — прямо по заветам Саржента. Традиционные техники, просто люди, живые, позируют. Frances говорит, что она работает исключительно с натуры, никаких фотографий. Посмотрите, как здорово переданы цвета, формы, буквально «одним штрихом».

Подобные посты группируются по тегу #artrauflikes, а на beinginamerica.com в разделе «Art Rauf Likes» есть все 145 (в отличие от Facebook, который забывает (забивает) на почти половину).

(ENG) An outstanding English artist, Frances Bell. Her paintings feature either portraits or people by the water, but everything is done with an incredible attention to detail—without actually depicting the details themselves—just as Sargent would have wanted. She uses traditional techniques, simply painting live models who pose for her, full of life. Frances says she works exclusively from life, never from photographs. Take a look at how beautifully she captures colors and forms, often with just a single stroke.

Similar posts are grouped under the hashtag , and you can find all 145 of them in the Art Rauf Likes section on beinginamerica.com—unlike Facebook, which forgets (or ignores) nearly half of them.

(/ENG)

Глубокое погружение в LLM с Андреем Карпати | 06 февраля 2025 года, 19:33

Очень интересная лекция Andrej Karpathy про детали LLM/ChatGPT

Помощники AI в моей повседневной жизни | 05 февраля 2025 года, 21:04

Короче, у меня теперь ChatGPT зависимость. Он обогнал уже гугл и фейсбук и лезет во все области жизни потихоньку.

(Конкретно я использую не только ChatGPT, потому что для определенных нужд нам нужно пользоваться аналогом, запущенном нашими инженерами во внутренней корпоративной сети, поэтому все ниже не только про ChatGPT, а в целом про AI помощников в целом. Но для личных нужд у меня это только ChatGPT)

(1) Итак, за последние полгода я создал, наверное, пару сотен скриптов на питоне для обработки данных. Ни один из скриптов я не писал сам (хотя могу; но спросите меня через годик-два, может уже не смогу). Чтобы написать скрипт для обработки данных, я просто формулирую очень четко что мне нужно, потом внимательно смотрю на результат, и если он мне нравится, я его запускаю. Если он не работает, и нужно что-то подправить, я подправляю сам. Если в принципе не то получилось, то я прошу переделать. Чаще всего получается то. Пример: прочитать CSV, создать эмбеддинги для всех строк, кластеризовать, результат записать в отдельные файлы с номером кластера в имени. Или сделать какую-то группировку данных хитрую.

Отдельно надо сказать про команды bash. Например, я не могу на память написать как через командную строку отсортировать строчки из файла по длине и дать мне самые длинные. Или мне влом вспоминать детальный синтаксис awk или jq, чтобы через pipe обработать что-то из файликов, проще спросить у ChatGPT.

(2) За последнее время я очень часто перевожу на английский и с английского с помощью LLM. То есть, вместо того, чтобы пойти написать что-то самому на английском, мне проще написать на русском, получить перевод, а потом его закинуть в письмо. Это тупо быстрее. Тут даже дело не в знании английского — я конечно, могу и сам написать все тоже самое. Дело в том, сколько времени тратится на формулировки. Аргумент «получается вдвое быстрее и более понятно» бьет все остальное. Из минусов — английский у меня лучше от этого не становится.

(3) В целом, я провожу через различные LLM — в зависимости того, что за текст — почти 100% текстов на английском, которые я пишу. Прошу поправить грамматику, результат копипасчу куда мне там надо копипастить. В письмо или в джиру. Кажется, у меня скоро будет комплекс, что я отправил что-то не проверив. Потому что исправляют меня, хоть и по мелочам, всегда. Где-то артикль не тот, где-то запятой нет.

(4) Когда лень читать большие куски текста на английском, я все чаще их закидываю в ChatGPT и прошу сделать саммари — иногда на русском. По работе так нельзя, потому что куски текста часто от клиента, но если очень надо, есть и локальная LLM.

(5) Я все чаще валидирую всякие дизайн-решения (не визуальный дизайн, а дизайн ПО) через ChatGPT/LLM. Предлагаю покритиковать или дополнить. Очень часто результат наводит на мысли, где что-то надо доработать, или добавить ассампшенов.

(6) А еще я использую для суммаризации видосов на Youtube. Просто скачиваешь через youtube subtitle downloader субтитры в формате TXT, и закидываешь в LLM, и дальше по ним можно задавать вопросы или суммаризацию запросить. Очень помогает понять, смотреть или нет видео.

А какие у вас паттерны использования?

Запретные завещания: Твен и Кафка против публикации | 05 февраля 2025 года, 05:00

Сегодня прочитал, что оказывается, Марк Твен завещал не публиковать его автобиографию (рукопись на 5000 страниц между прочим) в течение 100 лет после смерти, а потом делайте что хотите. В общем, что лет истекли в 2010 и три тома автобиографии увидели свет.

Ещё оказалось, что Процесс Кафки сам Кафка завещал уничтожить, но его взяли и опубликовали. Это тот самый, где чувак приходит в суд, а там его вдруг начинают судить

Эмануэле Аттадия | 05 февраля 2025 года, 02:29

Интересный художник — Эмануэле Аттадия (Италия, р.1986) . Сочетание старого с новым. Реализм, но при этом с какой-то особенной мягкостью. Мне очень нравится, как он использует цвет, а также его выбор тем.

Подобные посты группируются по тегу #artrauflikes, а на beinginamerica.com в разделе «Art Rauf Likes» есть все 144 (в отличие от Facebook, который забывает (забивает) на почти половину).