entrepreneur-1340649_640_e

 「かなりの研究から、性的な傾向は指の長さで判断できることが判明」。これは英エセックス大学の高名な研究者による査読された研究をもとにした最近の記事の見出しだ。

 統計になれた人の目から見れば、それはナンセンスの塊だろう。

 査読された論文であるか、サンプルサイズは十分か、誰から助成を受けているのか――こうしたことを知ることは騙されないためには必要なことだ。

 このケースでは、信頼区間が鍵となる。普通なら素人が懸命に学ばなくてもいいはずの統計用語だ。しかし、数字が嫌いな人にとって統計の数字の裏を読むことは至難の業だ。

 だが次にあげる統計の3つの原則を知ることで、ニュースの数字に隠された真実を見つけることができる。
スポンサードリンク

1.本来のリスク「相対リスク」を考える


 たとえば、「8年間におよぶ研究で、フライドポテト好きは死亡率が2倍」というニュースを挙げよう。

 ポテトをつまみながら飲んでいたビールを思わず吹き出しそうになってしまうだろう。「嘘だろ!」って感じに。

 『American Journal of Clinical Nutrition』に掲載された査読済み研究によれば、これは本当のことだ。

 フライドポテトを多く食べれば死亡率が2倍になるらしい。

 だが、いったいどのくらい食べるとなのだろうか? それから、そもそもその人の元々の死亡リスクはどのくらいなのか?

 それによると、1週間以上あたりで3倍のフライドポテトを食べると、死亡リスクが2倍になるらしい。

 ちなみにこの研究に参加した被験者は、平均年齢60歳の男性だ。

 ポテトを食べなかった場合の死亡率は1パーセントである。すなわち60歳の男性が100人いたとしたら、その翌年には99人に減っているだろうということだ。

 その100人が全員、週に3倍以上のフライドポテトを食べたとすると、死亡率は2倍――2パーセントになる。よって翌年の生き残りは98人だ。

 なお、彼らが生涯その状況に陥るためには一生涯フライドポテトを3倍食べ続けねばならないことになる。

iStock-936886268_e
istock

 これは統計学でいう「相対リスク」の話だ。

 仮にある病気にかかる確率が10億人に1人だったとして、何らかの要因によってそれが4倍になったとする。すると10億人に4人が病気になる。ほぼそんなことにはならない。

 したがって今度、リスクがどうだといった記事を見かけたら、まず「増減がある前の本来のリスクは?」と考えるべきだ。


2.相関関係は因果関係を含意しない


 新しく赤ちゃんを授かろうとしている夫婦に、赤ちゃんが安心して眠れるグッズのセットが贈られる。このベビーボックスは、1930年代末に睡眠中の乳幼児の突然死を防ごうとフィンランドで始められた制度だ。

 フィンランドの乳幼児の死亡率は、これが広まるようになってから急激に低下。今では同国は世界有数の赤ちゃんが死なない国である。よってベビーボックスには、乳幼児の死亡率を大きく改善したという手柄が与えられている。

 だが、ほかにも何か変化はなかったのだろうか?
 それは妊婦健診だ。

 ベビーボックスを手にするための条件として、妊婦は妊娠して最初の4ヶ月の間に検診を受けねばならない。

 1944年、フィンランドでは、妊婦の31パーセントが妊婦教育を受けた。1945年、それは86パーセントに急増。乳幼児の死亡率が改善したのは、ベビーボックスではなく、むしろこの教育と早期の健診のためだった。

 これは「相関関係は因果関係を含意しない」ことを示す古典的な事例だ。ベビーボックスと死亡率の改善には相関があるが、片方が片方の原因になっているわけではない。

2_e11
フィンランド政府から贈られるベビーボックス image credit:Kopu/Flickr, CC BY-NC-ND

 しかし、このちょっとした事実によって、ベビーボックスの人気に歯止めがかかることはなかった。フィンランド生まれのこの贈り物はアメリカでも大流行し、新しくお母さんになる人への人気のギフトである。

 だからもし、「寝る前にチーズを食べると、シーツに絡まって死ぬ」といった見出しを見つけたら、「ほかに何か原因になることがあるのでは?」と疑ってみよう。


3.許容誤差によって結果が曖昧になる


 アメリカ労働統計局が最近発表したデータは、8月から9月の失業率がの3.9パーセントから3.7パーセントに減少したことを示している。

 もちろん、統計局はこの数字を得るために一人一人に仕事があるかどうか訊いて回ったわけではない。ほんの一握りの人たちに質問し、その結果を一般化して全国の状況を推定したのである。

 それは優れた推定であるが、推定は推定だ。そのときに生じる誤差は、統計学でいう「信頼区間」というものによって定義される。

 先ほどのデータは、アメリカ全土で失業者が27万人減少したということだが、そこには信頼区間によって定義される「許容誤差」というものがある

 ――現実はこれを中心とした26.3万人の誤差の範囲があると考えられるのだ。

 1つの数値をはっきり提示できればいいのだが、統計の結果はある範囲を表していると考えた方が正確だろう。失業率の事例で言えば、最大で53.3万人減った可能性もあるし、最低では7000人しか減っていない可能性もあると統計学者は考える。

 冒頭で述べた指の長さで性的な傾向が分かるという問題もこの類のものだ。これらの推定値に関係する範囲のことを考えれば、それが確かな結論であるなどとはとても言えないのだ。
 
iStock-824126076_e
istock

 信頼区間が混乱を与える格好の事例が投票の世論調査だ。

 調査会社は、人口全体を代表すると考えられるサンプルを抽出し、サンプルとして選ばれた人に誰に投票するかと尋ねる。

 そして、その結果から、投票日に有権者全体が誰に票を入れるだろうかと推定する。もし結果が接戦と出れば、誤差があるために誰が当選するのかほとんど分からないも同然だ。

 だから関係者一人一人に質問できるはずがない規模の人口に関する数字を見たら、許容誤差について思い出そう。

References:Numbers in the news? Make sure you don't fall for these 3 statistical tricks/ written by hiroching / edited by parumo

あわせて読みたい
統計学者の4人に1人が、科学者が望む研究結果になるようにデータの操作、改ざんを求められたことがあると回答(アメリカ調査)


情報改ざん・隠ぺい・ねつ造、冤罪はこうして起きる。杜撰で悪質な10の犯罪調査


ニュースを読むにあたって注意しなければならない10のこと(アメリカの場合)


フェイクニュースや意見の偏りがあるウェブサイトを見破るAIが開発される(米研究)


独断的な人、原理主義者の方がフェイクニュースを信じやすいという研究結果(米研究)

この記事が気に入ったら
いいね!しよう
カラパイアの最新記事をお届けします
この記事をシェア :    

Facebook

コメント

1

1. 匿名処理班

  • 2018年11月07日 20:44
  • ID:bUsYb2yk0 #

統計よりひどい確率で彼女ができないんですけどどうしたらいいんでしょうか…

2

2. 匿名処理班

  • 2018年11月07日 20:46
  • ID:NfkYsID30 #

テレビ局が都合の良いように報道するもんね。
街頭アンケートがまさにそう

3

3.

  • 2018年11月07日 21:03
  • ID:xPeG8BW.0 #
4

4. 匿名処理班

  • 2018年11月07日 21:21
  • ID:6ES71M7P0 #

正確に言うと統計学者は範囲ではなくて分布で考えるね。
良い記事だと思うけど普通の人にはなかなか伝わらないだろうなぁ。

5

5.

  • 2018年11月07日 21:23
  • ID:N46o5Eh60 #
6

6. 匿名処理班

  • 2018年11月07日 22:16
  • ID:Djdm21hy0 #

たとえば、
”病院の滞在時間が長い人ほど死亡のリスクが高いので、長生きするには病院に行かない方がよい”
とかそういうのではなく、グラフに単位ついてないとか、n=いくつだよとか、個人的にはそっちのほうがモヤッとするんだよね

7

7. 匿名処理班

  • 2018年11月07日 22:20
  • ID:X76q1bHW0 #

真実は揺るがないが、統計は融通がきく。

8

8. 匿名処理班

  • 2018年11月07日 22:24
  • ID:irYMAVfn0 #

統計学はわかれば面白そうだな

9

9. 匿名処理班

  • 2018年11月07日 22:31
  • ID:NtmdOoRy0 #

統計って正しく使うとすごく便利なんだけど、現実には相手を騙すために使われる場合がほとんどなので、まずは疑ってかかるのが正解。

10

10. 匿名処理班

  • 2018年11月07日 22:31
  • ID:EV0eMPwa0 #

統計屋です。こういう記事、わかりやすくてイイネ!
大体のマスメディアや”煽り”商売は、こういった統計詐欺を使って
危機感を捏造するからねー
みんな冷静に数字見てねー

11

11. 匿名処理班

  • 2018年11月07日 22:39
  • ID:S4ODQ33x0 #

これは良い記事。両親に百回読ませたい。

12

12. 匿名処理班

  • 2018年11月07日 23:22
  • ID:Y2QqxHCU0 #

100%がMAXの棒グラフで統計の最大値(20%とか)を画面端に持ってきて
20%と15%みたいな誤差レベルの差を大差に見せかけるやっすい手法すら
マスメディアのみならずネットニュースでまで使われてるの溜息しか出ない
またそれに踊らされるユーザーが一定数存在するっていうのがさあ…

13

13. 匿名処理班

  • 2018年11月08日 00:06
  • ID:Y0DOE5zG0 #

TVの情報系(笑)番組に良くある手口だな
何かを食べ続けて此の結果が出ました!
食べる以外にやったことも全部検証しなきゃ断言出来ないでしょって何時も突っ込んでる

14

14. 匿名処理班

  • 2018年11月08日 00:51
  • ID:Atb3ehM80 #

3つめをもっとわかりやすく
上ふたつは常識の範囲と思うけど許容誤差ってどういうもんなのか

15

15. 匿名処理班

  • 2018年11月08日 01:43
  • ID:95BzeRaY0 #

10億人に1人の病気が〜のくだりがよくわからん
発生確率が4倍になったら発症者も4倍になるのは当然に想える
元々の確率がいくらだろうと、4倍は4倍では‥?

16

16. 匿名処理班

  • 2018年11月08日 03:09
  • ID:z5Z2nzWz0 #

※1
統計を信じるんだ。
貴方は上で言う信頼区間の最悪を極めている可能性がある。
統計的に好意を持たれる行動を増やし、異性への攻撃回数を上げ、統計上の母数を増やすんだ。

そうすれば、統計の神の恩寵をもって、貴方に彼女ができるのはほぼ確実!

17

17. 匿名処理班

  • 2018年11月08日 05:53
  • ID:7b8Gia050 #

※15
「10億人に1人」のような極めて低い確率の場合は、数学的に4倍になったところで
感覚的には殆ど変わらないから意味がないということでは?

18

18. 匿名処理班

  • 2018年11月08日 06:50
  • ID:NKtQ8fmh0 #

人間は都合のいい数字だけ利用するから大半の人にとってはどうでもいい事だね
統計上の数字が正しいか正しくないかなんて人が生きる上では実際何の関係も無いんだから

19

19. 匿名処理班

  • 2018年11月08日 07:25
  • ID:2vZR1.cR0 #

※2
該当インタビューなどは統計以前の問題。

ここに紹介されてるのは、「統計的に正しくて、査読論文として出版された論文の内容も鵜呑みにできない」ということ。

都合のいいインタビューだけ集めて流すなんてのは、世論操作以外のなにものでもない犯罪的行為。これがまかり通っている日本のTV、新聞は恐ろしい。

20

20. 匿名処理班

  • 2018年11月08日 07:27
  • ID:xfbUCAdL0 #

タバコの副流煙よりひじきを食べる方が圧倒的にガンになりやすいらしい(笑)

21

21. 匿名処理班

  • 2018年11月08日 07:34
  • ID:2vZR1.cR0 #

※14

例えば45%の結果が出たとしても、いつでも45%の結果が出るとは限らない。
100回調査しても95回は(例えば)41%から49%の間に収まるよ、というのが95%信頼区間。
だからこの場合4%の許容誤差があるよ、この誤差の範囲内なら「より高い」とか「より低い」とか言っても意味ないよ、という話。

22

22. 匿名処理班

  • 2018年11月08日 07:35
  • ID:0pBLBwsa0 #

指の長さとホルモンの関係なんて常識じゃないの?

23

23. 匿名処理班

  • 2018年11月08日 07:37
  • ID:2vZR1.cR0 #

※15

それは正しいけど、だからってその確率で「大変だ、気をつけなきゃ!」て思うか?
100人に10人が100人に40人なった場合と天と地との差だろ?
そういうこと。

24

24. 匿名処理班

  • 2018年11月08日 08:14
  • ID:J9CCIcsA0 #

ttps://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q10198689995?__ysp=6YeR5rKiIOecn%2BWGrOaXpQ%3D%3D
金沢市民のように
一シーズンにおける真冬日
という謎指標を使う人もいる
しかもそれが
ゼロだった回数
を調べるとは

25

25. 匿名処理班

  • 2018年11月08日 08:24
  • ID:Xlzj.eag0 #

※14
例えば「30代」という分類に対して20代のアラサーを含めることね。
四捨五入すれば30歳になるし、体質や生活習慣も近い「だろう」という考え。
これが許容誤差だよ。

26

26. 匿名処理班

  • 2018年11月08日 08:41
  • ID:cw4yGa1p0 #

ベビーボックス・・・・カリン様の超聖水みたいなあれか・・・
ドラゴンボール(無印)の

27

27. 匿名処理班

  • 2018年11月08日 09:49
  • ID:txyJxY8U0 #

政府発表で堂々とこれやられる国

28

28. 匿名処理班

  • 2018年11月08日 10:25
  • ID:GTxEI.2P0 #

ベビーボックスのくだりを読んで、
「連続殺人犯は過去1年間に朝食にパンを食べていた。パンを食べる人は危険だ」
みたいな話を思い出した。

29

29. 匿名処理班

  • 2018年11月08日 10:29
  • ID:YSw.am2V0 #

統計数字だっていくらでも誘導できるし
統計学は結局、心理学と同じレベルの似非学問だよな…

30

30. 匿名処理班

  • 2018年11月08日 10:48
  • ID:AVilMU0U0 #

※13
殆どの人はある意味どうでもいいと思ってるというか
悪いものじゃないし身体にいいってなら試すかって程度
だから情報系番組で知るってCM程度の効果であって長続きしない

その手の情報ってネタとして使ったりするけどそれだけ
一時期寝てる間に人は虫を食ってるとか流れてたけどあれと同じかな

31

31. 匿名処理班

  • 2018年11月08日 11:30
  • ID:wMBm3SoD0 #

相関関係と因果関係の話は、いわゆる優生学についての話のなかでよく見かける

優生学ってのは、例えばひとつの家系について調べて、アル中・犯罪者・難病の罹患者の数を数える。そうして、これらが際立って多い家系には「悪い因子」が遺伝しているってことだから、これを断絶することが国全体の利益につながるっていう
そんなことを真面目に唱えた、学問の顔した何かがかつて欧米や北欧、あと日本でも流行った時期があって

少し考えると地域とか環境とか教育とかその他諸々が考慮されてなくて、そりゃ家系との相関は認められるかもですけど因果関係の立証はどうなってんですか、って突っ込めるんだけど、突っ込みが少なすぎてナチスが人気を集めたりしちゃった

これと同じような論法をいまだに見かけることがあって、憂鬱になる

だまされそうになる自分にも憂鬱になる

提示された情報は事実かもしれないけど、提示された情報だけが事実じゃないってこと、覚えておきたいものです

32

32. 匿名処理班

  • 2018年11月08日 11:32
  • ID:wMBm3SoD0 #

※16
つまり手当たり次第にナンパしろ、と・・・・・・

わりと真理

がんばれイッチ、でもセクハラだけはカンベンな!

33

33. 匿名処理班

  • 2018年11月08日 15:28
  • ID:jpBW78J10 #

統計って面白いよね
確率論と違っておおくの人の興味を引く魅力がある
まあそのせいでこういう落とし穴もあるんだろうけど
だいたい疑念は常に横においておくべきだよね

34

34. 匿名処理班

  • 2018年11月08日 15:43
  • ID:1G.MvdEi0 #

※7
揺るがないのは「事実」であって、「真実」は人によって変わるものだよ。
真実はいつも一つっていう決めセリフは耳障りをよくするために敢えてそう言ってるものなので、本来の言葉の使い方では事実の方が正しい。

35

35. 匿名処理班

  • 2018年11月08日 16:05
  • ID:NlxwaxS70 #

※4
統計の世界は、日常の思考ではなかなかイメージするのが難しいのが難点。

36

36. 匿名処理班

  • 2018年11月08日 16:10
  • ID:JeM2d6hx0 #

>>1
たとえその確率が天文学的数字でも0にはならない。
例えば君が住宅街をたまたま朝歩いていて、たまたま曲がり角からパンをくわえて遅刻遅刻〜!と言いながら走ってきた女の子にぶつかってそこから発展する恋も可能性としては0ではない。

自信を持つんだ。

37

37. じょん・すみす

  • 2018年11月08日 19:09
  • ID:c4BzZcq60 #

科学屋さんの言う事には、
「誤差範囲が書かれてないグラフは、信用してはいけない」
「スケールが書かれてない写真は、信用してはいけない」
と言う鉄則があるんだな。

38

38. 匿名処理班

  • 2018年11月08日 19:48
  • ID:0POxxhzO0 #

※10
そもそも統計なんて一般向けに出すときは騙そうとしてるか偏らせようとしているかのどっちかだし
数字を冷静に見ろというのはまさにその通りなんだけど、より一般向けにはそもそも出されてない数字を考えろって方が合ってる気がするわ

39

39. 匿名処理班

  • 2018年11月08日 19:54
  • ID:8YelPAnO0 #

自分の専門分野でもないと統計なんて正しく読み取れない

40

40. 匿名処理班

  • 2018年11月09日 04:11
  • ID:V3eIz4xF0 #

義務教育課程の授業をサボったり上の空で聞いていなければ、この程度のことは言われないでも解る頭が作られるはずなのだが。現実は残念なことに、サボってたか、オウム返しにしてテストの点数を稼いでただけのが大勢いるらしい。

41

41. 匿名処理班

  • 2018年11月09日 09:54
  • ID:jegL6CuM0 #

統計学は数学ので最も身近な、生活に密接した分野と言っていいだろう
よくパーセント表示で論じることがあるが、サンプル数が母数に対してどれほどの数か?という視点は必ず持っておいた方がいい。割合データにすることで失われてしまう情報は案外大きなものだ。

42

42. 匿名処理班

  • 2018年11月09日 15:05
  • ID:IeMQ1Did0 #

サンプルの取り方ひとつで全く違った結果が出るしだいたい信用をしないなぁ、話半分って感じ
TVなんかのだとサンプルの取り方いい加減すぎて絶対に信用しないけどね。TVだと統計に限らず出てくるあらゆるデータが信じられないけど

43

43.

  • 2018年11月10日 07:54
  • ID:S0.TnZTS0 #
お名前
スポンサードリンク
記事検索
月別アーカイブ
スマートフォン版
スマートフォン版QRコード
「カラパイア」で検索!!
スポンサードリンク