Этимологические родственники: от павлинов до гусаров | 11 апреля 2025 года, 17:22

Седьмой день этимологической раскопки. Возможно, последний — но кто знает. Скрипт по-прежнему гоняет словари, а я продолжаю удивляться, насколько далекие по смыслу слова могут быть близки по происхождению.

Начнём с яркого. Слова павлин и пунцовый — этимологические родственники. Павлин пришёл в русский через немецкий Pfäulein ← Pfau ← латинское pavō — «павлин». А пунцовый — это цвет мака во французском ponceau, производном от paon («павлин»), которое тоже от pavō. То есть пунцовый — это «павлиний» цвет. Кто бы мог подумать.

Аптека (apothecary) и бутик (boutique) — этимологические кузены. Аптека — от греческого ἀποθήκη («хранилище»). Boutique — через окситанский и французский, тоже от греческого, через латинское. Одна — про лекарства, другая — про платья. Но обе — про «место, где что-то хранится и продаётся», и обе имеют одного родителя.

Лассо и лацкан — два слова с противоположной эстетикой, но с общим латинским предком laqueus — «петля, аркан». Лассо пришло через испанский lazo → французский lasso — чистая ковбойская тематика. Лацкан — через немецкое Lätzchen, и тоже тянет ниточку от laqueus.

Костёл и шато звучат так, будто первый — про Вильнюс, второй — про Бордо. На деле — оба слова от латинского castellum («крепость»). Костёл пришёл через польский kościół — церковь как укреплённое сооружение. Шато — французский замок, из того же источника. Рыцари и батюшки — в одной этимологической лодке.

Шантаж и шансон — разные смыслы, но общее прошлое. Оба слова восходят к латинскому canō — «я пою». Шансон — напрямую: песня. Шантаж — через французское chantage, буквально «пение» в смысле «публичного обнародования» чего-то — т.е. компромата. Не знал, то есть связь.

Дефис и девиз — от латинского dīvidō («делить»), через разные языки. Дефис — «разделитель», заимствован через немецкий Divis. Девиз — «лозунг», пришёл из французского devise. Оба — изначально про деление, но один делит слова, другой — смыслы.

Подошва и почва — этимологические двойники. Оба слова происходят от древнеславянского подъшьва — «основание, низ». Одна — в обуви, другая — под ногами. По сути, это одно и то же: то, на чём ты стоишь. Впрочем, если подумать — логично.

Гусар и курс — неожиданные товарищи по этимологии. Гусар — через сербское gusar («разбойник»), от латинского cursus — «бег, курс». То есть сначала: «беглец», потом: «налётчик», потом: «гусар». Курс — уже напрямую от cursus. Всё от одного латинского глагола currō — «бежать». Рыцари, университеты, рынок валют — всё бежит.

Слова know, note, noble, cognition, notorious, gnosis и т.п. — все в той или иной форме восходят к праиндоевропейскому корню ǵneh₃- — «знать, узнавать».

Cow и beef — тоже двойники: одна от германского корня через англосаксонский, другая — от латинского bos через французское boeuf. Исторически из gʷṓws.

Решил поискать слова, заканчивающиеся на «аж», но не французские. Нашел с десяток, но проверку прошел только «Инструктаж». Никакого instructage, конечно, во французском нет. Французской морфологии — больше, чем французского смысла.

Спасибо, что читали эти посты все семь дней. Думаю, дальше можно продолжать уже порционно, по мере накопления.

Напомню, все это вытаскивалось через автоматическую обработку этимологического словаря. Скрипт находил оттуда слова, по смыслу максимально далекие друг от друга, но имеющие общего родителя, плюс фильтровал более-менее частотные слова. К сожалению, словарь не идеален по разметке и в процессе пропускалось очень много, но зато результат можно было неспешно и не без удовольствия обрабатывать.

Читайте больше такого добра кликая сюда –> #RaufLikesEtymology

Этимологический тур: от Biden до кретина | 09 апреля 2025 года, 19:25

Четвертый день занимательной этимологии! Я тут пишу скрипты по обработке этимологического словаря, и нахожу всякие интересности, делюсь каждый день.

Фамилия Biden — вероятно, происходит от глагола bide — «терпеть, ждать». Староанглийское bīdan, германский корень. Однако в этимологических словарях Biden также упоминается как фонетический doublet от корня bouter (через вариант beat, «бить»). Выбирайте что вам нравится больше.

Интересно, что слово кретин в русском происходит от немецкого слова «Kretin» (слабоумный человек). В свою очередь в немецкий язык это слово попало из французского «crétin». А французы уже заимствовали это слово из латыни, где оно обозначало христианина (Christiānus). Кстати, а Христос (Χριστός) буквально означает «помазанный».

Слова sovereign (правитель, монарх) и soprano (сопрано) происходят от одного и того же латинского корня super — «над, выше», но попали в английский язык через разные языки и культурные контексты, и приобрели разные значения.

Все знают, что слово «шедевр» — французское, от chef-d’œuvre — буквально «главный труд». Chef произошло из латинского caput — голова; отсюда же la capitale (столица), капитан и капитолий, я об этом писал пару дней назад. И сразу понятно, почему по-французски chapitre — это глава в книге, а capiteux — это опьяняющий, дурманящий. Так вот, Œuvre — это труд, работа. Интересно, что слово это восходит к латинскому opera (в именительном падеже opus). Modus operandi — образ действия. Наша операция тех же кровей. От этого же корня произошли и слова ouvrier (рабочий), а также les jours ouvrables (рабочие дни). То есть, opera — это труд, как и opus. Как раз сейчас слушаю «Самсона и Далилу», в тему.

А утром ездил сдавать амазоновские покупки назад в магазин Kohl. Там принимают. Так вот, не знаю, что там принимают, но Kohl — это тоже самое, что alcohol. Оба слова происходят от одного арабского корня — الكحل (al-kuḥl). Причем это первоначально «сурьма» — порошкообразный минерал (обычно антимон), использовавшийся как косметика для глаз. Позже значение расширилось в алхимии. Сначала — любой тонкий порошок, затем: концентрированное вещество, полученное путём перегонки, и наконец: спирт, как продукт перегонки вина. Kohl же в английском так и остался про косметику. Но магазин Kohl’s, конечно, от фамилии Kohl, немецкой, Maxwell Kohl, и фамилия его на немецком означает «капуста».

Слово bedlam (в значении “хаос”, “суматоха”) происходит от названия лондонской больницы «Сент-Мэри оф Бетлехем», которая с 1400-х годов была предназначена для лечения душевнобольных. Со временем произношение слова «Bethlehem» исказилось в bedlam, и этот термин стал обозначать любую ситуацию, где царит хаос и неразбериха.

Еще flask («фляжка») и fiasco («фиаско») тоже имеют общее происхождение — протогерманское *flaskǭ — «бутылка, сосуд, оплетённый сосуд». По-итальянски fiasco и есть бутылка. Выражение fare fiasco — «сделать бутылку» → «облажаться на сцене» (в театральном сленге). Метафорически: провал = «как разбитая бутылка» или «проигравший платит бутылку». Попало в английский с этим значением через французский.

Оказалось, что Alice и Adelaide — слова, произошедшие от одного староверхненемецкого имени Adalheidis (adal — «благородный», heid / heit — «характер, суть, состояние»).

Array и ready — это этимологически родственники, они происходят от одного и того же прагерманского корня *raidaz, означающего «готовый, упорядоченный, подготовленный».

Возвращаясь к нашим кретинам. Не стал детали упоминать выше, потому что тогда ломался бы «флоу». Слово «кретин» появилось в Швейцарии. Точнее, в речи франкоговорящих, живущих в Альпах (эту территорию называют Романдией). Потому что именно в гористых местностях часто сталкиваются с эндемическим кретинизмом. Болезнь развивается из-за недостаточного содержания йода в пище матери во время беременности.

В XVIII веке в Романдии больных кретинизмом называли «бедными христианами» (pauvre chrétien). Но говорили не chrétien, а crétin из-за региональных языковых особенностей. Другие регионы подхватили это искажённое слово и стали так называть людей, страдающих этой болезнью. Отсюда медицинский термин «кретинизм» (когда щитовидная железа выделяет недостаточно количество гормонов из-за дефицита йода, что приводит к серьёзным нарушениям в умственном и физическом развитии).

Получается, первоначально «кретин» — это «несчастный христианин» (юродивый, блаженный). В конце XVIII века термин «кретинизм» распространился по европейским языкам. Но в русский язык это слово попало в начале XIX века через немецкий!

Читайте больше такого добра кликая сюда —> #RaufLikesEtymology

Слова сквозь века: откуда происходят наши слова и имена | 09 апреля 2025 года, 03:51

Ну что, продолжим занимательную этимологию? Я тут пишу скрипты по обработке этимологического словаря, и нахожу всякие интересности.

Оказалось, что слово «чао» (ciao) происходит от слова «раб» (slave). Происходит от венецианского выражения s-ciào vostro или s-ciào su, что буквально означает «(я) ваш раб». Венецианское слово для обозначения «раба» — s-ciào [ˈstʃao] или s-ciàvo — происходит от средневекового латинского sclavus, которое, в свою очередь, заимствовано из средневекового греческого Σκλάβος («склавос»), которое в свою очередь связано с этнонимом «славяне», так как в то время большинство рабов происходили с Балкан.

А еще для меня было открытием, что слова Kubernetes, governor и cybernetics — этимологически родственны. Они все имеют корень κυβερνήτης (kubernḗtēs) — «рулевой, тот, кто управляет судном». В итоге, governor пришел через латинский и романские языки, cybernetics — научное заимствование через французский, а Kubernetes — прямая калька с древнегреческого, через латинскую транслитерацию.

Слова fuel и focus происходят от одного латинского слова focus («очаг»). Focus придумал вообще Иоганн Кеплер, он использовал focus как геометрический термин для эллипсов: «точка, в которой сходятся лучи».

Слова Madeira, mata, mater, matrix, matter, и mother — родственны и все восходят к одному и тому же праиндоевропейскому корню *méh₂tēr — «мать».

А madam и madonna происходят от одного латинского mea domina — «моя госпожа».

Сложно представить, но слова merry (веселый) и brief (краткий) происходят от одного и того же праиндоевропейского корня *mréǵʰus, который означает «короткий».

Слова lobby (лобби) и leaf (лист) тоже имеют общее происхождение — оба восходят к древнегерманскому *laubą или его производным, связанным с листвой, навесами из листвы и укрытиями. В старых постройках laubia/lobby — это была крытая галерея или беседка, буквально укрытие из листвы. То есть “lobby” изначально значило “листовой навес” или “беседка с листвой”.

Имеют общее происхождение или общий корень имена Юрий и Георгий, Étienne и Stephen/Steven, William и Guillermo, Зевс и Юпитер , Женя и Яна, Joel and Elijah, Hansel и John, а также Agnes, Nancy, and Inez, Диего и Яков, Dorothy и Theodore, а также Изабель, Элизабет и Лиза, Искандер и Александр, Патрокл и Клеопатра. Многие из них по сути обозначают одно и то же, просто модифицировались в разных культурах по-разному.

Читайте больше такого добра кликая сюда —> #RaufLikesEtymology

Словесные корни и происхождения: от «жёлтого» до «абрикоса» | 08 апреля 2025 года, 16:22

Продолжаю этимологические интересности. Третий пост подряд, #RaufLikesEtymology. Все началось с того, что мне под руки попался этимологический словарь, и я его программно обрабатываю, вытаскивая всякое разное.

Оказалось, что слова «жёлтый», «зелёный», и «золото» имеют общий индоевропейский корень, связанный с блеском и яркостью — *gьltъ, который в английском языке, например, стал основой и gold («золото»), и yellow («жёлтый»). В немецком «gelb» тоже оттуда же. На Руси «желтый» известно с XIII в. как прозвище, а в качестве прилагательного В письменных источниках встречается только с XIV в.

Оказалось, что «известь» и «асбест» от одного слова, греческого ἄσβεστος.

Оказалось, что слова шифр, цифра, и zero происходят от одного и того же слова — арабского صِفْر (ṣifr, «ничто, цифра»), которое само по себе является калькой из санскрита शून्य (śūnya, «пустота, ничто»).

Пушкин писал в «Полтаве»: «Во тьме ночной они, как воры… // Слагают цифр универсалов…». «Универсалами» на украинском языке тех дней именовались гетманские указы, а «цифр» тогда означало то, что мы теперь называем шифром – «тайное письмо».

Интересно, что слово «кантон» (Швейцария состоит из 26 кантонов) — китайского происхождения, от Guangdong.

Оказалось, что grotto и crypt — произошли от одного слова, латинского grupta/crypta. Ну про субботу и шабаш все знают (что это одно слово по происхождению).

Русское слово “колесо” и индийское “чакра” связаны по происхождению — оба происходят от одного и того же древнего корня в праиндоевропейском языке — *kʷékʷlos — “круг”, “колесо”, “вращающееся”. Только “колесо” пришло через славянскую ветвь, а “чакра” — через индийскую (ведийско-санскритскую) ветвь.

Слова cloak («плащ») и clock («часы») происходят от среднелатинского clocca — «колокол», но попали в английский по-разному. Cloak пришло в XIII веке через французское cloque, означавшее и «плащ», и «колокол» — по форме одежды. Clock появилось позже через голландское clocke, обозначавшее церковный колокол, отбивающий время; затем стало значить «часы». Слово bell («колокол») уже существовало в английском как обозначение металлического звенящего предмета, так что не было необходимости вводить ещё одно слово для этого.

Очень интересный путь проделал абрикос. Тут смотрите приложенную картинку. Заимствовано в начале XVIII в. из голландского языка, в котором появилось из романских языков (например, французское abricot). Любопытно проследить это слово еще дальше: оказывается, во французский оно попало из арабского, а в арабский из латыни. Латинское ргаесох означало «скороспелый». То есть, praecox стал abricot.

У меня скриптик выкатил около 2 тысяч примеров из wiktionary. Я беру самые интересные, но думаю еще постов на пять хватит того, чем стоит делиться 🙂 Плюс у меня есть еще мысли, как можно обработать, чтобы получить еще больше интересного.

Читайте больше такого добра кликая сюда —> #RaufLikesEtymology

Однокоренные слова: от хаоса до банкротства | 07 апреля 2025 года, 21:09

В прошлом посте писал, что сделал программку, которая ищет далекие друг от друга слова с общей этимологией. Она мне приносит новые и новые открытия. Делюсь!

Слова chaos и gas по сути одно и то же. Химик-датчанин Ян Баптиста ван Гельмонт ввел gas как смог прочитать на своем «датчанском» chaos, от греческого χάος. Буква g в голландском языке передаёт звук, отдалённо напоминающий современное греческое ch. «За неимением названия», писал он, «я назвал этот пар “gas”, поскольку он недалёк от древнего понятия хаоса». А вот слово gasoline вообще никакого отношения к gas не имеет. Оно происходит от Cazeline (возможно, под влиянием Gazeline — названия ирландской копии), торговой марки осветительного масла на основе нефти, происходящей от фамилии человека, впервые начавшего его продавать в 1862 году — Джона Касселла, — и суффикса -eline. Вот имя Cassell происходит от англо-нормандского castel (родственно английскому castle — «замок»), которое, в свою очередь, восходит к старофранцузскому castel.

Cattle, capital, и chattel — этимологические двойники друг друга, и также связаны с capital — всё через корень caput («голова»), отражающий древнюю практику считать богатство по головам скота. Кстати, от caput происходят и chief, и captain.

Такие же двойники bank и bench. “Банк” — это изначально “скамья”, на которой сидел меняла, либо “прилавок” обменщика денег. Сравните типологически со русским словом «лавка» — и как «скамейка», и как «магазин» (в старину — это было одно и то же), «прилавок» — место, где осуществляется торговля, то есть «при скамье». Слом прилавка — banca rotta — дал нам ещё и слово bankrupt («банкрот»), буквально «сломанная скамья».

Отдельно интересно про Chicago/skunk. Chicago происходит от французского Chécagou, транскрипции слова из языка народа Майами šikaakwa — «дикий лук» (или рамп, Allium tricoccum) и также «полосатый скунс». Скунс означает на том же языке дурно писающий или что-то типа, ну и означает скунса.

Hospital и hotel/hostel — тоже этимологические двойники. Уходят в hospes (“host, guest”).

Про то, что dress и director имеют общий корень, писать очень много, картинка приложена в помощь

Читайте больше такого добра кликая сюда —> #RaufLikesEtymology

Слова-далекие родственники: открытия лингвистического скрипта | 07 апреля 2025 года, 16:32

Написал скрипт, который находит пары слов, связанные общим происхождением, но при этом эти слова определяются как далекие друг от друга по современному значению.

Собственно, я этот проект придумал полтора часа назад, между встречами что-то набросал с помощью питона и ChatGPT и вот первые результаты. Важно, что результаты идут не из ChatGPT, а из скрипта, работающего со словарями.

Например, grammar – glamour. Слово glamour происходит от шотландского произношения слова grammar (в смысле «знание», особенно магическое). Ранняя ассоциация грамматики с тайным знанием трансформировалась в «гламур» как «волшебное очарование».

Оказалось, что Jack – это уменьшительная форма от John, эволюционировавшая через Jankin.

Оказалось, что espresso и sprain имеют общий корень —латинский exprimere — «выжимать, извлекать».

debut и butt. Имеют общий корень: старофранцузское but — «цель». Debut: от французского débuter — «начинать игру», буквально «делать первый удар по цели». Butt: в значении «мишень» (e.g. the butt of a joke), тоже от but — «цель, мишень».

Технические подробности: Что делает скрипт?

1. Сначала скачивает огромный массив данных английского Викисловаря (Kaikki) и большую языковую модель FastText, которая знает «смысл» слов в виде векторов.

2. Затем он анализирует этимологию (происхождение) слов, находя их общих «предков» – древние слова (этимоны), от которых произошли современные.

3. Затем он отбирает только те слова, которые являются полноценными словарными статьями в Викисловаре и достаточно часто встречаются в современном английском языке (отсеивая очень редкие или архаичные слова).

4. Затем измеряет «расстояние» между значениями, используя векторы слов (word embeddings) из FastText. Сравнивая эти векторы, скрипт вычисляет, насколько сильно разошлись значения у слов с общим корнем. Низкое сходство векторов означает большую разницу в значении.

5. Затем находит «дальних родственников»: В итоге скрипт ищет и выводит пары общеупотребительных слов, которые когда-то были «родственниками», но сегодня их значения максимально далеки друг от друга.

Скрипт пока все еще генерит довольно много «шума», но который понятно как очищать.

Читайте больше такого добра кликая сюда —> #RaufLikesEtymology

Тени великих: Монте Дэвидофф и неизвестные герои IT | 05 апреля 2025 года, 16:22

Интересно как складывается судьба разных людей. У Гейтса на бложике выложены исходные коды первого Altair Basic. Кроме всем известных Гейтса (состояние >$100 млрд) и Аллена (он уже умер, но было что-то типа 20 млрд) там фигурирует имя Monte Davidoff, о котором почти ничего не известно.

Монте писал для Microsoft Basic всю «математику» с плавающей точкой. Она правда просуществовала только до версии 4.0, после чего лет через 10 уже подоспел стандарт IEEE 754, и все немножко изменилось.

С 2000 года у него своя консалтинговая компания, сайт (на пхп) которой кажется не менялся с 2000 года (но год на 2025 в футере обновил).

В сети вообще нет его фотографий, почти нет информации о том, чем занимается, есть два интервью, одно в тексте, другое на Floppy days как подкаст. Видимо просто спокойно «починяет свой примус».

Среди же сотрудников первой команды Microsoft — помните, iconic photo? — есть Bob O’Rear, который занимал должность главного математика. Он сыграл ключевую роль в разработке MS-DOS для IBM PC. О’Рир покинул компанию в 1993 году и вернулся в Техас, где занялся разведением крупного рогатого скота на собственной ферме.

Мировые имена «Собачьего вальса» | 05 апреля 2025 года, 14:01

С удивлением узнал, что наш «Собачий вальс» почему-то тут массово называют «Shave and a haircut», хотя на самом деле Shave and a haircut — это очень известное «тук! туту-тук-тук… ТУК-ТУК!».

Начал копать. В Германии, Бельгии, Нидерландах и Норвегии это «Блошиный вальс» (Flea Waltz, Flohwalzer). В Болгарии — «Кошачий марш» (болг. Котешки марш), в Финляндии — «Кошачья полька» (фин. Kissanpolkka), в Корее — «Кошачий танец» (кор. 고양이 춤 Koyangi Chum), в Японии — «Я наступил на кошку» (яп. 猫踏んじゃった Нэко-фундзятта), в Мексике — «Маленькие обезьянки» (исп. Los Changuitos), в Венгрии — «Ослиный марш» (венг. Szamárinduló), на Майорке — «Полька дураков» (исп. Polca de los Tontos), в Китае — «Марш воров» (кит. упр. 小偷进行曲, палл. Xiǎotōu jìnxíngqǔ), в Испании — «Шоколадница (посуда)» (исп. La Chocolatera), во Франции и в Польше — «Котлеты (отбивные)» (фр. Côtelettes, пол. Kotlety), в Швейцарии — «Котлетный вальс» (нем. Kotelett-Walzer), в Дании — «Фрикадельки убегают через забор» (дат. Frikadellens flugt over plankeværket), в Швеции — «Калле Юханссон» (швед. Kalle Johansson) и т. д.

В размере четыре четверти кстати. Так что это что-то типа польки или галопа. А вот в фильме «Джентельмены удачи» звучит как раз трехдольная версия

Зачем хлеб становится черствым: неожиданное объяснение | 31 марта 2025 года, 23:12

Узнал только что, что, оказывается, хлеб черствеет не столько из-за того, что из него уходит влага, а из-за процесса, называемого ретроградацией крахмала. При выпечке хлеба крахмал в муке желатинизируется — его гранулы впитывают воду, разбухают, и структура становится более мягкой и пластичной. После остывания и с течением времени крахмал начинает реорганизовываться в более кристаллическую структуру — это и есть ретроградация. Влага действительно уходит, но не вся и не обязательно наружу. В холодильнике, кстати, черствение происходит быстрее именно из-за ускоренной ретроградации крахмала при температуре около 0–5°C.

Поэтому если нагреть черствый хлеб (например, в тостере или духовке), крахмал снова частично желатинизируется, и хлеб на короткое время возвращает свежесть. Но этот эффект временный. С картошкой фри так не получается, там влага вытесняется сильнее, и крахмал там чуть другой. Поэтому повторный нагрев не разрушает кристаллы без воды, а влага уже ушла. В итоге — резиновая, «пенопластовая» текстура, особенно у фри, который жарился в масле.

Пойду картошечки пожарю и с хлебушком поем

Революция в 3D-сканировании: новое устройство на основе ультразвука | 31 марта 2025 года, 14:53

Придумал новое устройство, которое в будущем может быть частью телефона, а до этого может быть устройством для нишевого применения в промышленности и науке. Выглядит так: кладешь на любую поверхность, типа бумаги с текстом, двигаешь как мышкой, в итоге имеешь на экране 3D-сканирование поверхности, и если там, например, текст, его можно распознать, даже если он в конверте. Но вообще, наверное, есть лучшие применения такого в промышленности.

Технически: матрица высокочастотных ультразвуковых сенсоров (100–300 МГц), способная различать микрорельеф бумаги и чернил с разрешением до 20 микрон — как это сейчас делается в сканерах отпечатков пальцев. Типичный пьезосканер Qualcomm 3D Sonic Gen 2 имеет размер 8х8 мм. Разрешение у сенсоров до 500 dpi. Данные движения собираются с IMU и оптического энкодера (как в мышке), чтобы точно сшить фрагменты сканирования в единое изображение. Будет работать даже в темноте, при плохом контрасте, на полупрозрачной бумаге, ноль зависимости от освещения. Можно обнаруживать скрытые записи, отпечатки или подчищенные участки. По сути, будет делать анализ на глубину, вплоть до выявления следов продавленного карандаша.