「冗長性」という言葉

「冗長」というのは「退屈、余分」といった決していい意味の言葉ではない。情報理論の世界では重要な概念であるこの言葉は、「リダンダンシー(Redundancy)」という英語の直訳なのだろう。

当然のことだが、情報の伝達には、不可避的に誤りや事故がともなう。しかしその「誤り」のあり方は、アナログとデジタルで大きく異なる。写真が水に濡れてぶよぶよになってしまって、顔がよくわからなくなってしまった、紙に書いた文字がちぎれて読めなくなってしまった、これらの「アナログ事故」は、しかし、どうやらそこには人の顔が映っていたらしい、もしくは文章が途中で切れているが大体こんなことを言っていたのだろう、というように、人間の想像力によって「復元」することが、比較的たやすいことが多い。

しかし、情報を一度徹底的に細分化し「コード化」してしまっているデジタルの場合、通常機械にしか読めないコードなのだから、それを人間が見て直ちに復元することは、ほぼ不可能だ。それらはまったく意味不明な記号の羅列となる。
8桁の数字が一つの「意味」に対応するとして、膨大な数字が並んでいたとしよう。どこか一つの数字が「欠損」しただけで、その後の8個ずつの「区切り方」がすべてずれてしまう。この種の「デジタル」的な事故を、「生命」もしょっちゅう起こしているらしい。DNAの塩基配列の3個ずつの区切りも、どこかで一つずれれば、とんでもないタンパク質が出来上がってしまう。

必然的にともなうこの種の「事故」に対して、生命もコンピュータも、またしても同様な「防御システム」を備えている。
重要な書類は「写し」を取って保存する、誰もがおこなっている普通の安全策だ。情報の欠損、誤りに対する最も初歩的な対策は、まったく同じものを「複製」することに他ならない。しかし、これはもとの情報とまったく同じ分量の「資源」を必要とする、非常に無駄の多い方法だ。この「無駄さ」の度合いを「冗長性・リダンダンシー」という。
一般的に「冗長性」が高い、すなわち無駄が多いほど、情報は「安全」になる。これが「情報」のもつ一つの「背理」。
8桁の数字を、8桁使ってもう一度書けば、確かに一方が消えても復旧できる。しかし情報量は倍になり、事故が起こらない通常の場合には、それは単なる無駄だ。しかもコピーを増やせばどっちが「原本」かわからなくなってしまった、という新たな問題が生じる。こちらが本物で、こちらがコピーだという「印」をつけるなど、新たな「情報」が発生する。情報が増えれば増えるほど、それを「管理」する「情報」が必要になってきて「雪だるま式」に情報が増えてしまう。「情報が多い」ということが、伝達の安全性を保証するために必ずしも役に立つとは限らない、むしろ一方で、「希釈」されてしまって、一つ一つの情報の「信頼度」や「価値」が低下してしまう。これまた「情報」にともなう、もう一つの「背理」。
「冗長性」のイメージを持っていただくために、一つのたとえ話。受験番号や銀行の口座番号など、人の人生左右しそうなきわめて重要な数字でありながら、見た目は単なる無秩序な数の羅列であり、従って、伝達過程で間違いが生じやすい。こういったものの安全性のために実際に採用されているのが、「パリティ」という方法。「偶奇性」という意味だが、簡単に言えば、たとえば8桁の数字があったとしよう。9桁目を設けてそこにその数のすべての桁の数字を足した数が偶数なら0、奇数なら1を記入するとしたら、8桁のうちの一桁が欠損したり、汚くて読めなかったりしても、そこにどんな数が書かれていたのかの可能性の幅は狭まる。せっかく一桁使うのなら偶数か奇数かだけではなく、たとえばすべての桁の数字を足した数の1の位の数を書くことにしたら、事故に対する「安全性」はもっと高まる。
実際には「二進数」にした後、それより一桁多い二進数の最小の数から引いた「2の補数」と呼ばれるものなどが用いられているが、いずれにしても、意味内容を伝えるには8桁で十分であった情報を、あえて「無駄」な一桁を付け加えることで、事故に対する安全性が飛躍的に高まる、「冗長性」の一例である。
つづく・・・・・? 戻る