|
От
|
K
|
|
К
|
Игорь
|
|
Дата
|
25.04.2013 18:26:43
|
|
Рубрики
|
Россия-СССР; Идеология;
|
|
Нет, нет и еще раз нет
> Для любых представлений данных высчитывается теоретический предел
> упаковки при наличии конкретного интерпретатора. Только надо заранее
> уточнять - данные какого рода будут паковаться.
>
> Вы путаетие вычисления с теоретическим анализом. Для теоретического
> анализа квантовый компьютер не нужен. Да и не для всяких вычислений
> квантовый компьютер сгодится.
1. что такое алгоритм Шеннона.
Если вы передаете сообщения используя три буквы А,Б,В, при этом буква А чаще
используется, чем буквы Б и В, то А лучше передавать как одиночный бит 0, а
Б как два бита 10, В как биты 11. Зашифрованное таким образом сообщение и
будет иметь <наименьшую длину>, <теоретический придел сжатия>. Все остальные
алгоритмы сжатия основаны на этой же идее - часто встречаемые буквы и
сочетания букв кодировать коротким набором битов, а редко встречающееся.-
более длинным набором битов. Сама идея взята из азбуки Морзе, там разные
буквы кодируются разным количеством точек и тире, так что сама идея далеко
не нова, она старее Капитала
Говорит ли это о пределе сжатия вообще? Нет, конечно, это теоретический
предел сжатия для этих конкретных алгоритмов, не более того, и его научились
достигать. Если в тексте перебрать все наборы всех слов, не обязательно
идущих подряд, а разнесенных по тексту (чем-то подобным и занимается
алгоритм на основе фракталов), то никто не знает, какая степень сжатия
возможна. Но. . . все переборы втыкаются в количество переборов, во время
работы алгоритма. Скажем, ваш коротенький ответ в 1 килобайт потребует 2 в
степени 8*1024 переборов, или в десятичной системе это больше 10 в степени
800. Всей времени жизни вселенной не хватит на решение подобной задачки для
любой ЭВМ.
Так что <теоретически оптимальное кодирование> невозможно, никак. Как и
никто не знает, где сколько информации на самом деле.
2. главное свинство вселенной
Вселенная живет законами, и при этом не сложными, что и удивляло Эйнштейна.
А теперь представьте себе (пример как физику), что Вы решили передать
морзянкой результаты наблюдений Тихо Браге, вам потребуются не дни, и даже
не недели, а месяцы и годы. Но используя законы Кеплера все те же наблюдения
можно было передать в нескольких строчках кода, за минуты. По строчке на
планету - несколько координат и время. Все остальное выводится из законов
Кеплера. Так сколько на самом деле информации о положении планет в
наблюдениях Тихо Браге? Принцип максимального сжатия тут столь же применим,
как и принцип максимальной полезности в Экономикс, никто не знает сколько
это конкретно, никто. Сегодня мы считаем, что окрестности нашей звезды
впуклые (по Эйнштейну), а завтра выяснится, что они немножко выпуклее, и
тогда отношение к законам Кеплера резко изменится, а информационная ценность
наблюдений Тихо Браге возрастет на порядки.
Что можно сказать о геноме? А черт его знает сколько там информации. Скорее
всего очень много. Учитывая, что это не просто <абстрактная информация>, а
некие ключи к биохимическим процессам, то конечно полезной информации может
оказать еще на порядки больше.