andrzejn: (Curious)
Андрій Новосьолов ([personal profile] andrzejn) wrote2011-02-16 04:56 pm

Архивалингвистика

[livejournal.com profile] mi3ch напомнил, что из 100 самых часто употребляемых слов в английском языке 94 состоят из одного слога.

В связи с этим я вспомнил чьё-то наблюдение, что в мультиязычной компании (в которой все более-менее прилично владеют одним и тем же набором нескольких языков, и регулярно ими всеми пользуются) достаточно быстро вырабатывается внутренний жаргон (см. суржик, программистский жаргон, брайтонское наречие, жаргон MMORPG), состоящий из наиболее кратких слов разных языков. В смысле, "пересобрать весь проект" заменяется на "билдолить" просто потому, что в "build all" меньше слогов. При этом, что естественно, первым делом жаргонизируется самые часто употребляемые слова.

Тем временем архиваторы, которыми все мы так или иначе пользуемся, по разным алгоритмам заменяют в файлах длинные повторяющиеся последовательности короткими эквивалентами - и тоже, чем чаще встречается фрагмент, тем обычно короче его ужимают. В чистом виде этот принцип реализует, например, алгоритм Хаффмена.

Я вижу здесь подозрительное сходство.

Post a comment in response:

This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting