Wednesday, 16 February 2011
Архивалингвистика
Wednesday, 16 February 2011 16:56![[livejournal.com profile]](https://www.dreamwidth.org/img/external/lj-userinfo.gif)
В связи с этим я вспомнил чьё-то наблюдение, что в мультиязычной компании (в которой все более-менее прилично владеют одним и тем же набором нескольких языков, и регулярно ими всеми пользуются) достаточно быстро вырабатывается внутренний жаргон (см. суржик, программистский жаргон, брайтонское наречие, жаргон MMORPG), состоящий из наиболее кратких слов разных языков. В смысле, "пересобрать весь проект" заменяется на "билдолить" просто потому, что в "build all" меньше слогов. При этом, что естественно, первым делом жаргонизируется самые часто употребляемые слова.
Тем временем архиваторы, которыми все мы так или иначе пользуемся, по разным алгоритмам заменяют в файлах длинные повторяющиеся последовательности короткими эквивалентами - и тоже, чем чаще встречается фрагмент, тем обычно короче его ужимают. В чистом виде этот принцип реализует, например, алгоритм Хаффмена.
Я вижу здесь подозрительное сходство.