Оджибве: язык и культурное наследие | 22 февраля 2025 года, 20:55

Интересно, что в арт музее Торонто все надписи имеют не только английскую и французскую версию, но и версию на языке Оджибве, англ. Ojibwe или Anishinaabemowin (ᐊᓂᔑᓈᐯᒧᐎᓐ); в США язык называют чиппева. Этнонимы «чиппева» и «оджибве» происходят от одного слова с разным произношением, что значит «сморщенные». Это язык одного из самых крупных индейских народов в Северной Америке, по численности примерно равен кри и уступает чероки и навахо. Но говорит на нем всего около 10 000 человек в США и около 48 000 — в Канаде.

Chipmunk, wigwam, totem — это заимствования из этого языка. А географических названий — так вообще море. Illinois, Mississippi, Otttava, Michigan.

А вы знали, что половина (25) названий американских штатов, названы в честь коренных американцев? Меня это в свое время очень удивило.

Я вставил в картинку еще пример оригинальной, а не адаптивной под английский алфавит письменности. Вот эти кружочки и звездочки, треугольнички. Это слоговая система Эванса. Я не знаю, как это можно запомнить: она состояла всего из девяти символов, каждый из которых можно было записывать в четырех различных ориентациях, чтобы обозначать разные сочетания согласной с гласной. Это позволяло полноценно записывать язык оджибве, однако начальство Эванса не одобрило его изобретение и запретило ему его использовать. Позже он адаптировал свою систему для записи языка кри. Сегодня она по-прежнему встречается среди некоторых сообществ оджибве в Канаде, но её использование ограничено. В языке кри она встречается чаще. В США носители оджибве в основном предпочитают латинскую письменность.

ChatGPT узнает язык, но не способен перевести вообще ничего. Онлайн-переводчиков тоже нет, со онлайн-словарями очень плохо. Интересно, что в языке достаточно слов, чтобы описывать современные концепции.

Я пытался перевести индейские выражения, которые, по замыслу автора, должны означать «Европа» и «дилемма», но ничего похожего не получилось. Затем сравнил, как разные LLM переводят фрагмент об историческом периоде 1910–1930 годов, когда «Европу потрясли война и её последствия». У каждой системы получается своя версия текста: кто-то говорит о войне на Великих озёрах, кто-то о «большой бухте» или духовных практиках, где-то вообще про защиту индийского населения (я вообще про художников текст скормил). В итоге «война» распознается более-менее одинаково (видимо, для войны там пятьдесят слов есть), но общий смысл существенно варьируется.

Одиссея современного путешественника: аэропортовые приключения | 22 февраля 2025 года, 16:46

Я в итоге собрал бинго из двух аэропортов, в которых недавно разбились самолёты. В одном из них — инцидент был буквально днем ранее моего планируемого прилёта в Торонто, когда конечно отменили рейс. Узнал я об этом в аэропорту. Не проблема, поработал оттуда, вернулся домой, благо дом всего в 20 минутах. На следующий день улетел.

А вот обратно было интереснее. Сначала рейс бесчисленное число раз переносили, затем нас загрузили в самолёт, затем выгрузили обратно и сказали приходить за второй попыткой завтра. Особо забавно на выходе звучал вопрос пограничника про цель вашего визита в Канаду. Никто не знает где ждать багаж, да и вообще что должно быть на табло в месте откуда я прилетел? Из Торонто в Торонто? но говорят, что волноваться не надо, они ночью невостребованный собирают и завтра он со мной улетит. Приближается полночь, убер не ловится вообще ни за какие деньги, автобус от отеля уже час как едет (каждые десять минут обещают через десять минут максимум), но в итоге приезжает, и мы втроём с какой-то парой, отмечающей так 26 лет свадьбы, занимаем там последние два места. В автобусе я шучу, что осталась ещё узнать, что в отеле нет мест. Как ж нет, говорят мне попутчики, ты ж зарезервировал при нас (авиакомпания дала ваучер). Я достаю телефон, а там сообщение вместо thank you for reservation о том, что мест в comfort inn нет. Ну гостиница уровня «лучше любого мотеля». Я в холле гостиницы пытаюсь найти на сайте авиакомпании следующий отель, там три варианта, из т которых два типа в 70 км, и один есть, но там нет мест, хотя в списке он выводится. Пока звонил, там появился ещё один, Marriot residence inn, и там все получилось. Хорошие номера, двухкомнатные, с полноценной кухней, но ужасным завтраком с утра. Правда ваучера от авиакомпании хватило на хороший обед в ресторане днём.

На следующий день рейс на то же время, и приходит вновь сообщение о задержке. Ну в этом раз небольшой и наш Мицубиси довез до аэропорта Рейгана достаточно мягко. Багаж не потеряли;)

Третий срок в США: миссия невыполнима? | 21 февраля 2025 года, 20:46

Как пойти на третий срок в США? Задачка для конституционного суда.

1) stop being no person,

2) стать non-elected president

3) получить срок в другом месте, где нет глупых ограничений

Какой из путей проще?

#22 “No person shall be elected to the office of the President more than twice, and no person who has held the office of President, or acted as President, for more than two years of a term to which some other person was elected President shall be elected to the office of the President more than once.”

Торонто: аэропорт мечты | 20 февраля 2025 года, 21:33

Какой же классный международный аэропорт в Торонто! Прямо сказка. Занял у меня теперь первое место, вытеснив оттуда дубайский. Единственный минус — к торонтовскому метро нет. Только автобусы и такси.

Стратегия или хаос: разбор теорий Трампа | 20 февраля 2025 года, 10:40

У Андрея в посте интересная мысль. Мол, Трамп и его команда намеренно перегружают информационное поле, создавая хаос и “туман войны”, чтобы ослабить сопротивление и сломать существующий порядок. Я тоже так хотел бы думать. Но, с другой стороны, не находите ли вы, что есть и альтернатива?

Помните «бритву Хэнлона» — «Никогда не приписывайте злому умыслу то, что вполне можно объяснить обычной человеческой глупостью».

Ваш (и мой) мозг старается придать наблюдаемому хаосу хоть какую-то систему и придумать логичное объяснение, исходя из предположения, что «нормальные люди так не делают, тут определённо есть замысел и стратегия».

Но тут вопрос как в той песне Слепакова про Газпром — «а что %&я если нет?”.

Eсть же альтернативный вариант. Он называется: «Обезьяна с гранатой пытается создать на печатной машинке гениальный сонет с важным видом». И помня теорему об умножении вероятностей, она пытается много раз и часто.

Теоретически, если вломиться в дом крупных политиков и начать там переворачивать всё вверх дном, то случайная находка ведра с наркотой или чего-то покрупнее оправдает в глазах общественности весь беспредел — по принципу “победителей не судят”. А по сериалам типа «Во все тяжкие» мы знаем, что делать, если наломал дров: ломать с ещё большим рвением. Может не повезти, вот разворотил уже пятидесятый дом, а ведра все ещё нет. Но скорее всего повезёт, если действовать быстро и масштабно. Правда, может оказаться, что сопутствующий ущерб слишком велик, но популус считать не умеет. Запомнит победы.

Может, нас сложно понять, потому что Элон и Трамп умеют ва-банк , а мы осторожничаем?

Я не знаю, в каком из этих вариантов мы живём, потому что могу себе представить через несколько лет обсуждение в СМИ постфактум как первого (мудрый стратег всех переиграл и построил), так и второго плана (Cock-up before conspiracy). Просто обращаю внимание на «бритву Оккама».

Загадки французского: от истории букв до диалектов | 19 февраля 2025 года, 04:50

Забавно. Оказывается ù во французском языке существует ради одного единственного слова où (где). А еще интересно, что знак ^ над буквой, типа û, по сути является сокращением от S. Например, forêt, hôpital — это по сути forest, hospital, в котором s улетела как в письменной, так и устной речи, в небеса. Кстати, и croûton (от croûte), по сути это от слова crust. Сюда же île/isle, hôtel/hostel, bête/beste(beast), côte/coste(coast). Даже шато — château, это по сути родственное castel/castle. Также и в начале слова é по сути тоже самое. école/school, épice/species. А еще во французском почти нет слов, содержащих букву w (но буква есть!)

Еще интересно, что французский и итальянский имеют лексическую схожесть (lexical similarity) 89% — означает, что 89% слов в этих языках похожие очень друг на друга. Так вот, считается, что если лексическая схожесть больше 85%, то это не языки, а диалекты 🙂

Еще сейчас в тему вспомнил, что в 18 веке, по крайней мере в 1789 году, 50% французов на французском не говорили. Они говорили преимущественно на языках группы «langue d’oïl» и окситанских диалектах. Франции потребуется развитие школ, чтобы распространить французский язык. А еще интересно, что на французском говорят больше людей в Африке, чем во Франции.

Прогулка по истории: от Fortran до современных алгоритмов ML | 16 февраля 2025 года, 21:02

Разбираюсь сегодня с алгоритмами ML и с удивлением узнал, что библиотека numpy до недавних пор зависела от кода на Фортране (BLAS/LAPACK), но сейчас проверил, они перешли на OpenBLAS, где фортрана больше нет, а вот SciPy, это очень популярная библиотека для научных расчетов (используется в Scikit-Learn, который я сейчас изучаю, а также в PyTorch, TensorFlow, Keras, и др.), все еще зависит от кода на Fortran 77. Она использует ARPACK, например:

BLAS и LAPACK, которые все еще входят в OpenBLAS и много куда еще, разработаны в 70-х годах. Например, BLAS используется в Apple Accelerate. Очень много всего не изменялось с 1979 года, потому что там чистая математика, чего ее изменять. LAPACK появился чуть позже, в 1980-х. ARPACK, упомянутый выше, попозже, в 1992. Также питоновские библиотеки активно используют Фурье-анализ, а это библиотека FFTPACK на Fortran 77. MINPACK, для оптимизации параметров в ML, активно используется в SciPy и TensorFlow. Ну из 90-х там уже очень много кода на С перешло в современные фреймворки. Интересно было именно на Фортран посмотреть, который старее лет на 15.

Я пока разбирался, нашел, что есть алгоритм Simulated Annealing, который полезен в задачах, где градиентные методы плохо работают из-за множества локальных минимумов.

Представьте, что вам нужно найти самый большой гриб в лесу. В этом лесу на каждом шагу растут грибы разного размера, и вы можете двигаться в любом направлении, сравнивая их. Но как выбрать стратегию, чтобы не застрять на просто «большом» грибе, если где-то дальше растет еще больше?

Если вы сразу остановитесь на первом большом грибе, то можете упустить настоящий гигант. Но если будете бесконечно ходить по лесу, сравнивая каждый гриб, то так никогда и не закончите поиск. Simulated Annealing помогает найти баланс: сначала вы исследуете лес свободно, пробуя разные направления, даже если встречаете грибы поменьше. Со временем ваши шаги становятся осторожнее, и вы все реже соглашаетесь на худший вариант. В конце концов, это приводит вас к самому большому грибу в лесу.

Так вот, этот алгоритм, оказывается, 1953 года, и он почти без изменений используется в SciPy, ну и в целом в машинном обучении, статистике, распознавании образов, логистике, хотя, конечно, сейчас меню возможностей для таких задач сильно шире. Алгоритм в 1953 придумывался для моделирования движения атомов в расплавленных металлах. Металл, когда нагревается, становится жидким, а при медленном охлаждении его атомы постепенно находят идеальное расположение. Если охлаждать слишком быстро, материал становится неоднородным.

Что сделали ученые? Они придумали метод случайных изменений в модели атомов. Иногда принимали худшие изменения, чтобы не застрять в «неудачной» структуре. Это привело к появлению Метода Метрополиса – основного компонента Simulated Annealing. Алгоритм был создан для физики, но потом его поняли математики (гы) и начали использовать в оптимизации.

Максимальная мощность чистки: когда обычные средства не справляются | 16 февраля 2025 года, 02:16

Купил самое мощное в магазине средство для прочистки труб макс-макс-макс, которое даже нельзя выливать в унитаз, а на задней стороне написано, что если вы его выпили зачем-то, то запейте молочком. И не пытайтесь вызвать рвоту