ヒット カウンタ

大学の講義

 

大学の講義もだんだん本題に入るようになり、テーマもコンピュータそのものを対象にしたものになってきた。
学生も教職課程を取るための必修科目ということもあり熱心な者が多い。

先週は、情報量がテーマで、情報量の単位の意味を確率論との関係から解説した。
情報というのは、ある事象が起きる確率が小さければ小さい程、その事象を知ったときの価値は高まるのである。
「神様からたった一つ未来に起きる事を聞けたとしたら皆は何を聞く?」という質問をしてみた。

「明日の競馬の勝ち馬を知りたい」とか「試験問題」とか大体似たような解答が返ってくる。
確かに明日の勝ち馬を知ればそれは大変な大もうけができる。

しかし、その勝ち馬が本命の馬だったらどうだろう。
確かにその馬の馬券を買えば必ず儲かるのだが、他の大勢の人もその馬券を買っているので配当は大したものではない。

誰もが予測できることは予め結果を知ったとしても情報としての価値は低いのである。
それが例えば今連敗を続けていることで話題になっている「ハルウララ」のような馬の勝利を予め知ることができれば、これは大変な価値になる。

社会は「物質」「エネルギー」「情報」の3大要素で構成されていると言われる。
この中の物質とエネルギーはその実態もその量を測る単位も分かりやすい。

物質は形があるし大きさもあり重さもある。
エネルギーも形こそないがガソリンや電気、原子力といったパワーは概念が掴みやすい。

しかるに情報に関しては、現在これだけ日常会話やニュースその他あらゆる所で口にし耳にするのだが、実態に関してはきわめて曖昧である。
まず、形もなければ大きさや重量もない、熱もなければパワーもない。

そもそも情報とはいった何なのか。
これが単に感覚的なものではないということ「ハルウララ」の勝利を知ることと本命の馬の勝利を知ることの違いからもわかる。

何らかの実態と量があり、それは計測できるはずのものである。
そしてその量は通常の物質と同じように足し算や引き算ができそうな気がする。

この足し算ができるという性質を数学的に言うと加法性があるという。
世の中の数字は加法性のあるものと無いものに分類することができる。

加法性のある数字は物質やエネルギーを測る数字は全てそうである。
重さや長さ、電力や熱量全てそうである。お金もそうだ。

加法性のない数字は、例えば運動会のかけっこの順位とか、空手の段、級といったものがそうである。
初段(1段)と2段の人の力量を合わせたら3段の人と一致するといった性質のものではない。
だからといってこれら加法性のない数字が無意味かと言えば決してそんなことはない。
かけっこの1等と2等では1等の方が速いのであり、その数字の列とその価値には順序に関しては厳密な整合性がある。(数学的には単調性という)

我々は日常このような二つの性質の数字をこういった加法性の有る無しをあまり考えずに使っている。
乱暴に言えば、加法性の有る数字で議論されていることは科学的で、加法性のない数字をあたかも加法性のある数字のように展開されている議論はマヤカシが多いと思って良い。(乱暴に言えばだよ)

では情報はどうなのだろうか。
情報を量として扱いにくい原因の第一は最初に述べたように確率というもう一つ曖昧な数値が関係することにある。

コインを投げて裏か表かという確率は1/2である。
さいころをふってそれが1の目である確率は1/6である。

これで賭けをしているとして、神様に結果を教えてもらうとすればどちらを教えてもらうほうが価値があるのだろうか。
当然さいころの目であることはわかる。

コインの裏、表であれば、結果を知らない人でも半分は当たるのであり、賭けをして勝ってもたいしたことはない。
しかし、さいころの方はあてずっぽうの人は1/6しか当たる確率がなく賭けをした場合の有利さは全然違うからだ。このコインの場合つまり1/2の確率で起きる事象を知る情報が情報量を計る基準になっている。
この情報量の単位をビットという。

確率1/2の事象を知ったとき1ビットの情報を得たと言うわけだ。
では情報量には加法性があるのか。

じつは、これはなかなか難しい議論になるのである。
数学的に扱う量としては加法性があることはまちがいない。

そもそも、確率論自体は加法性のある数字(測度)で成り立っている。
しかし、社会の中で使う確率は、その論理の中の加法性ではなく、結果の不定性が目立ってしまうからだ。

コインの裏表の情報を知っている者と知らない者が勝負しても、一回や二回の勝負では、あてずっぽうの者でも偶然にあててしまうことがある。

全ての賭け事(合法のものも非合法のものも含めて)はこの結果が一定しないことで成り立っている。
しかし、回数が増えると確率論にしたがった結果に収束することになり、胴元以外は損をする事になるのだが、少数の例外がいることがこうした賭け事が消滅しない大きな原因になっている。

「万が一」という言葉を我々はよく使う。
めったに起きない事の例えと言うか枕詞としてだ。

実際一万回に一回という事象はそれを知ったときの情報量はどれくらいなのだろうか。
大変な情報量のような気がするが、それはせいぜい13ビットから14ビットとに過ぎない。

なぜなら、1/2の確率の情報が1ビットであるから、1/4の確率の情報が2ビットであり、更に1/8の確率の情報は3ビットである。
こうして計算していけば1/10000の情報がわかる。

8ビットを一つにまとめた1バイトという単位がある。
コンピュータの記憶容量なんかで使うので馴染みのある言い方だ。
「万が一」はバイトで表すと2バイトでおつりが来る程度の情報なのだ。

我々の会話や新聞雑誌の記事、テレビのニュースや音楽、その他人間が活動する場では、お互い情報を発信しあっている。
その情報量は一体どれくらいなのだろうか。

ここに面白い統計データがある。
米カリフォルニア大学バークレー校のSchool of Information Management and Systemsが2000年以来毎年発表しているもので、ちょっと古いのであるが2002年に全世界で生産された情報量が、合計で約2万3,000PB(ペタバイト)にも達するとの調査結果が発表された。
これは、、印刷物などのいわゆる「ストック」データと、電話などの「フロー」データに分類し、適当なサンプルをとって総データ量を推定しているということだ。なお、1PBは1,000TB(テラバイト)に相当する。

1PB(ペタバイト)=1000TB
1TB(テラバイト)=1000GB
1GB(ギガバイト)=1000MB
1MB(メガバイト)=1000KB
1KB(キロバイト)=1000B
1B(バイト)=8BIT(ビット)
※1000は正確には1024

この話を講義の最後にしたのであるが、二人の女子学生から面白い質問を受けた。
「同じ話をくどくど言った場合と、簡潔に言った場合情報量は同じなのですか」

いや実に鋭い質問だ。
これは、内容が同じであれば受信した側での情報量は同じである。
従って情報量は同じであるといえる。

しかし発信した側は、あきらかに文字数が違うのであるから情報の量は異なる。
これは受側と発信側の情報量が異なることになる。

これは矛盾ではないのかというのが彼女たちが言いたいことだった。
この主張は一面正しく一面正しくない。

彼女達には昼休みに食い込みながら詳しく解説したのだが、こうした質問が出るからには、来週もう少し全員に詳しく解説しなければならないと思った。

この話を詳しくすると情報の冗長度とエントロピーの概念を避けることができない。
冗長度の議論は通信のセキュリィー理論にも関係してくるし無駄にはならない。
でも、前期の範囲はまだまだあるしな。

あまり冗長にならない程度に面白くまとめることができれば良いのだが。

トップページへ