データはウソをつく

データはウソをつく 科学的な社会調査の方法 谷岡一郎 ちくまプリマー新書
の感想ですが、まずは、これは面白いという部分の引用です。

第二章から
『むかし、連合軍の戦闘機スピットファイアが独軍のメッサーシュミットにバタバタと撃ち落とされ、命からがら帰ってきた機体のダメージをたくさん調べた将軍がいたそうです。そして尾翼のダメージが特にひどいことを発見。本国に「スピットファイアの尾翼を強化するように」と打電したそうな。幸い、本国には脳ミソのシワのちょっと多い人がいて、こう返事がきたという。「尾翼をやられた戦闘機は一応帰ってきたのではないのかね。他の場所を撃たれた機が帰ってこなかったとすれば、強化するのは別の所ではないのかね」と。』
こういう話はうれしいですね。こんな間違いはいっぱいありそうです。でも、この本国の人のような人に恵まれるのは幸運かもね。

第三章から
『社会科学の分野では、偶然の範囲が二十回に一回(つまり五?)以内なら、「かなりの蓋然性をもって偶然ではない」と結論を出すのが慣例になっています。』
3シグマとかもね。でも1?とか1割ぐらいの場合も使うかもしれない。

(前略)『酒の消費量と健康に関する調査』(中略)、『お酒をぜんぜん飲まない人より、毎日少量飲む人の方が健康だった』(中略)。
『私などはヘソ曲がりなので、「適量の酒が体に良い」と考えるより先に、酒を飲まない人々の中に「体をこわして酒を飲めなくなった人間(医者に止められた人間)」はどれくらい含まれているのか、などと考えてしまうのです。』(後略

なるほど。ところでこれは秘密なのですけど、実は私のヘソ曲がりからは、「タバコは実は健康に良かった」という説が20年後に明らかになるのでは、と期待しています(なお、わたくしは、タバコを止めて6年かになりますが、止めてよかったと思っています)。

(コーヒーと健康の関係についての文脈で)
『多変量解析によって「カフェインの摂りすぎの人は、心臓病による死亡率が高まる」ことを、さらに高次のレベルで証明したものとします。しかしそれでもなお、次のような可能性を指摘できるのです。
「カフェインはガンや脳卒中を抑える効果があるのではないか?心臓病による死亡率の上昇は、他の死因を抑制したことの結果なのではないか?」と。』
そうなんですよ。しっかり考えないとね。

第四章から
『ニューヨーク大学の物理学者、アラン・ソーカル(および共著者ブリクモン)はつぎのように述べています。「多くの例において、テクストが理解不能に見えるのは、他でもない、中身がないという見事な理由のためだ」と。』
それが分かっていたとしても、なかなか言い切るには勇気が要ります。

第五章から
『間違いを認めることは、研究者にとって自説の死を意味します。短期的には恥をかくし、プライドを傷つけます。しかしそれができない人間は、そもそも研究者になろうなどと考えるべきでないのです。長期的勝者は、正しいものを正しいと認めることのできる人間だと信じて下さい。』
そのような態度が尊いとする雰囲気があって欲しいものです。

『年に一回、国公私立の大学長七百五十人のうち、招待された三十人ほどが伊豆の山荘に集まって、二泊三日でいろいろな問題を忌憚なく話し合う会議があります。そこにゲスト・スピーカーとして招かれた情報学に詳しいある経済評論家が、現在世の中に存在するすべての情報の九七?九八?は、インターネットで検索が可能であると述べていました。話の内容に疑問を持った私は、早速尋ねてみました。「残りの二?三?の情報の中に、本当に有用で新しいものへのヒントが隠されているのではないですか」と。』
評論家の意見を私なりに解釈しますと、こうです。多くを検索可能にするという言い方だけでは言葉足らずで、谷岡先生のご意見のとおりです。ネット進展の利点は、情報を出すコストの低減化と、誰もが発信者になれるという点にあります。従って、極めて少数の意見であっても発信でき、それを検索可能になる、というのが、多くを検索可能に、ということの真の意味です。多数派に埋もれる欠点もありえますが、少数派が出てくる可能性もあるのです。その少数を出すには、もっと多数のゴミを出さないといけないかもしれないのです。そして情報化の真の意味は、大量のゴミの山から稀な宝を見つけられるという能力にあるのです。(結局、ロングテールの話ですね。)

今日は雪の予報でバス通勤。おかげで読書がわずかですが進みました。

カテゴリー: パーマリンク

コメントを残す