Кстати, люди используют для генерации бессмысленных текстов цепи Маркова. Современные смартфоны используют статистику пар слов в чужих и ваших предложениях, чтобы подсказать следующее слово. Попробуйте написать что угодно матом- она правильно продолжит;) так вот, цепь Маркова – это последовательность таких предположений, основанных на статистике сочетаний. В моем практически детстве так пытались обманывать поисковики генерацией страниц-заглушек с типа реальным текстом и рекламными ссылками внутри ( они уже секут давно этот прием). А ещё я использовал этот механизм для создания случайных слов, которые можно читать без напряга (заполнял ими словарь и обфускировал по словарю данные с реальных логов для публикации на блоге).
Есть ещё интересное применение. Вы наверняка не знали, что марковские цепи лежат в основе способа сортировки результатов поиска Гугла. Если проводить параллели со словами, то пары часто используемых слов тут – пары сайтов, связанных ссылками. Есть интересное свойство марковской цепи : если она достаточно длинна, и данных достаточно много , то на “длинной дистанции” вероятность исхода (слова в случае подсказок) не зависит от того, с какого слова вы начали писать, предполагая, что речь идёт о длиной цепочке. Так вот, чем выше вероятность, тем выше pgerank, тем ближе к началу будет результат. Ну понятно, что гугл уже серьезно модифицировал алгоритм, но принципы этой фигни по ссылке и гугловского Pagerank очень близки;)
https://meduza.io/shapito/2018/07/13/prochital-na-meduze-chto
https://meduza.io/shapito/2018/07/13/prochital-na-meduze-chto
