Иногда в английском встречаются очень необычные слова, которые очень непросто перевести на русский. Вот, например, слово oblong. Как прилагательное оно переводится как «вытянутый, продолговатый», но в книге оба использования — существительные. Часто oblong относится к лицу — то есть, близко к овалу, но oblong — это более широкое понятие, которое описывает любую фигуру, имеющую растянутый вид. My mom bought an oblong tablecloth for her new table.
Как существительное оно тоже используется, и довольно часто (хотя реже, чем как прилагательное). Как существительное, oblong — это «прямоугольный объект или плоская фигура с неравными прилежащими сторонами». Линейки считаются продолговатыми предметами (oblongs). Ноутбуки, планшеты и плоские телевизоры — это oblongs разных размеров. Прямоугольник можно определить как oblong; однако не все продолговатые фигуры являются прямоугольниками. То же лицо, например. Ещё, в математике oblong number — это то, что на русском прямоугольное число (произведение двух последовательных чисел. Например, 12). В общем, чёрт ногу сломит.
С 15 века слово живет, между прочим. Так вот, в книжке оно у меня встречается два раза, и оба — существительные. В первом случае Набоков перевел его как «закут», а во втором — «a small oblong of smooth silver» как «кусочек».
Сегодня объявляли предупреждение о торнадо. Предупреждение выдается, если радары фиксируют условия, благоприятные для образования торнадо. В итоге был дождик в точно названное время (с томностью до минут 10). Прилетел, пролился, полетел дальше. Везде отменили все. Куча людей до сих пор стоят на ушах. Принцип в США: безопасность важнее всего, даже если вероятность околонулевая, если последствия угрожают жизни, маленькая вероятность уменьшается на высокую серьёзность и в итоге включаются максимальные протоколы. При оценке риска выбирается самое пессимистичное, потому что т если не угадал — останешься ответственным. Люди спускаются в подвалы, дети запираются в спортзалах и т.д.
Все вроде норм, но такая реакция на непогоду и похожие неприятности формирует поведение избыточной осторожности на всю жизнь, и люди просто выбирают комфорт и до смерти пугаются грозы и снегопада. Не уверен, правильно это или неправильно.
Зацените качели недельной температуры с 21 до 0 и обратно к 23.
Паттерн использования такой: держу телефон в руках. Там в apple books эта и книжка. Видишь незнакомое слово — оно с большой вероятностью будет в списке слов главы. Определение учитывает перевод самого Набокова. Дальше смотришь на пару слов вперёд, убираешь телефон, продолжаешь читать. Встречаешь те слова, и они ещё в кратковременной памяти, и ура, понимаешь. В паузу загружаешь в мозг следующие пару слов. В руках надо держать телефон и перелистывать, каждая страница содержит 4-5 определений.
Сейчас каждое слово имеет определения на английском (толкование), французском, и немецком. Соответственно, я могу издать четыре книжки.
В целом, мой уровень английского совпадает с предположениями моей программки о том , какие слова будут вызывать сложность. Но когда-нибудь мне надо такое для французского, и там понадобится для и каждого слова некоторую оценку уровня сложности, потому что мне будут непонятны и некоторые базовые слова тоже. Не уверен, что книжка с базовыми словами будет удобна. С редкими — точно удобна.
Читаю Набокова и решил отвлечься и сделать удобную программку «Словарь Набокова» и подумываю продавать его на Амазоне как книгу. По сути, выглядит это так (см скриншот) — определения сложных слов на английском, русском, немецком и французском, идущих в том же порядке, в каком они идут в оригинальной книге.
Вы бы купили такую книжку?
Для того, чтобы корректно сделать их определения, я также написал aligner — программу, которая сопоставляет предложения и абзацы на английском с их переводами (набоковским) на русский. И когда создается определение слова, используется не только знание LLM, но и перевод на русский автора. Отдельно стоит рассказать, как работает алгоритм (я его сам придумал, потому что все, что нашел в сети, не работало как мне надо). Он находит сначала длинные предложения, и находит для самых длинных предложений их пару через косинусное сходство embedding-векторов, созданных через модель multilingual e5. Эти предложения становятся якорями. Затем, предполагая, что для длинных предложений ошибка почти исключена, находится самое длинное предложение уже между якорями, и все повторяется заново рекурсивно. Там много ситуаций, когда у предложения на русском нет аналога на английском и наоборот, когда предложение разбито на два, или наоборот два слиты в одно. Алгоритм как может это обрабатывает. Результат — очень неплохое качество выравнивания. До такой степени, что ошибки выравнивания уже не получается находить (но наверняка они есть). Так или иначе, оно нужно только для контекста для перевода слов, даже если там и есть редкие ошибки, то не страшно.
В начале года купил умный замок NFC на входную дверь, за 170 баксов, недавно написал на Амазон отзыв, что батареек хватило на полтора месяца, и если так дальше будет, то почти столько же заплачу за год, и производитель написал, что вернут деньги. Отзыв удалять не просят, да я даже не знаю, можно ли это сделать.
Собеседник агентства, пресс-служба физтеха, разъясняет, как определять стороны света в случае, когда в Москве не работает навигация. Полярную звезду найти или по солнцу: встаёт на востоке, садится на западе. Напоминает про как определять стороны света по деревьям. Зяма, ты умеешь определять стороны света по деревьям? — А шо тут уметь? Елка — север, пальма — юг!
А вообще пресс-служба физтеха видимо не знает, что для Москвы годовая амплитуда движения точки восхода составляет почти 90 градусов. То есть, она только иногда (вот в марте сейчас) действительно совпадает с востоком. Зато она знает слово «астеризм». Думаю, большинство читателей поставит его куда-то рядом со словом метеоризм
За последнюю неделю Nadezhda Shulga нарисовала в первый раз в жизни картину маслом и в первый раз в жизни села играть на пианино одной рукой Умку! Надя, ты молодец!!! Она столько раз меня просила рисовать природу, что в итоге взяла и нарисовала сама
Ради развлечения решил сделать матрицу кто с кем друг и кто с кем враг. Для каждой пары страна-страна я спрашивал у Gemini, в какую из пяти категорий попадают отношения: «на ножах» (фиолетовые), «преимущественно недобрые» (красным), «никакие» (желтым), преимущественно добрые» (голубым), «друзья» (зеленым). Лиза сказала, что «никакие» должны быть фиолетовыми. В целом, качество оценок Gemini неплохое.
Из всех стран выделяются три красные линии. Это страны, у которых не очень с очень много кем. Ну Россию вы правильно угадали. А что за вторая страна? Израиль? Нет, это Беларусь и Венесуэла.
В пятерку стран, с которыми все дружат и которые много с кем дружат, LLM включил США, Великобританию, Канаду, Францию и Германию. Есть антирейтинг — это страны, у которых много с кем очень не ладится («на ножах»). В этом рейтинге на первом месте Россия с 21 страной, и на втором месте Израиль с 18 недругами. Дальше с большим отрывом идут Сирия и США с 9 недругами. Есть отдельный рейтинг Conflict zone — это по сумме красных с фиолетовыми. Россия, Венесуэла, Беларусь, Израиль, США, Иран, Украина.
Есть «клуб пацифистов». Эти те, у которых вообще нет врагов с сортировкой по числу друзей. Рейтинг: Багамы, Ватикан, Люксембург, Ангола, Сингапур, Исландия, Ямайка, Танзания, Замбия.
Мне было интересно, а что если применить формулу: враг моего врага — мой друг? Что поменяется? Это привело к новым краскам на матрице — logic friends.
Самым неожиданным лидером рейтинга Master Pragmatists стал Тайвань (25 логических связей). Почему так? В логике LLM, Тайвань — это страна, которая официально признана немногими, но из-за глобального противостояния с Китаем она автоматически становится «логическим другом» для всех, у кого с Пекином натянутые отношения. Это подтверждается и в разделе Shadow Bridges: у Тайваня 23 связи за пределами своего региона. Он буквально «сшивает» разные части света через общую проблему.
Отчет «Тайные партнеры» — список геополитических оксюморонов. Это пары, которые в официальных новостях «на ножах», но по расчету Gemini вынуждены дружить. Например, Афганистан — США/Великобритания. Несмотря на статус «rather bad relations», логика Gemini видит в них «логических друзей». Вероятно, из-за общих региональных угроз (например, ИГИЛ) или зависимости от гуманитарных и теневых каналов. Или вот странный союз «Беларусь — Венгрия». Номинально — разные лагеря, фактически — схожий стиль риторики и общие «недруги» в Брюсселе. Эритрея — Эфиопия: Статус «на ножах», но при этом они попали в логические друзья.
В отчете «наиболее противоречивые» первые места занимают США, и потом с большим отрывом Россия, и еще с большим — Великобритания, Канада, Украина. Это страны с наибольшим значением произведения Love x Hate. То есть, у которых одновременно много и друзей, и врагов.
Еще один отчет — пофигисты. Про них LLM не смогла много что сказать, видимо, потому, что они никого не волнуют (как в прямом, так и в переносном смысле). Там например Магадаскар и Гаити.
Еще я попробовал кластеризовать по силе друзей и получил четыре группы стран.
Самый масштабный кластер. Ядро: Китай, Россия, Иран, Индия и страны БРИКС+, а также почти весь африканский континент (от Египта до ЮАР) и значительная часть Ближнего Востока (ОАЭ, Саудовская Аравия, Катар).
Во второй кластер попали главным образом европейские страны. Ядро: Франция, Германия, Великобритания. Сюда алгоритм определил Украину и Израиль. Это логично: их выживание зависит от «преимущественно добрых отношений» с европейским ядром. В этом же клубе находятся Армения, Грузия и Сербия. Видимо, несмотря на все политические качели, их связи с Европой Gemini считает более фундаментальными, чем любые другие.
В третий кластер попали США, Канада, Бразилия, Мексика, а также, например, Тайвань. Официально он может быть «логическим другом» для всех врагов Китая, но по «силе друзей» он намертво пришит к американскому блоку. Сюда же попал Ватикан, что делает этот клуб не только экономическим, но и в некотором роде «ценностным».
В четвертый, самый компактный и специализированный клуб, попали страны Океании и Юго-Восточной Азии. Лидеры: Австралия, Япония, Новая Зеландия, Сингапур. Это получился клуб стран, которые пытаются балансировать в самом сложном регионе планеты. Здесь же находятся почти все островные государства (Фиджи, Самоа, Тонга).
Что еще можно попробовать вытащить из этой информации?
«Товарищи курсанты, в военное время значение косинуса может достигать 2, а в исключительных случаях, когда того требует сложившаяся на фронтах обстановка, даже 3!»