平均値と中央値

 こんにちは、さつき台動物病院の院長多田です。最近の小学生は平均値だけでなく、中央値についても学校で学ぶらしいです。おじさんは小学生から大学生まで平均値の一本槍で駆け抜けたけど(標準偏差とかp値とかもあったけど、そのp値も今ではどうでも良いみたいな扱いになってきてるみたいで、よくわからない方はp値は統計界の浜崎あゆみだと思ってもらえば良いと思います。昔はギャルは皆あゆを目指していたのと同じで、研究者はp値<0.05に憧れていたのです。)、今の子供たちは小学生から平均値と中央値の二刀流で戦うみたいです。野球だけじゃなく、データの読み取りも二刀流の時代なんだと関心します。

 

 さて、「A病を◯◯という薬で治療したときの生存期間の平均値は8ヶ月で、中央値は5ヶ月です」というような文章を読む仕事をしていると、平均値と中央値のどちらの数値を患者さんに説明すべきだろう?とよく考えます。私と同年代から上の人であれば中央値を理解していない可能性はあるし、若い世代であっても中央値と平均値の両方を説明しても実は本当に必要なのは、治療の結果得られる生存期間の期待値を最大化させる選択肢を選ぶ事なので、平均値と中央値を伝えただけではそれはできないので説明としては不十分ということになる。

 

 つまり、飼い主さんは「うちの動物はどれくらい生きられるのか?」と質問してくるのだが、文献に書かれているのは平均値と中央値が書かれているだけなので、それの答えではない。さらに治療の選択によって得られる生存期間の期待値が変わるので、飼い主さんの質問に答えるにはまず「どの治療を選択する予定ですか?」というこちらからの質問に答えてもらわないといけない。そんな中で飼い主さんが上記の質問をしてしまうのは、どう考えてもテレビドラマの影響である。私はテレビドラマで上記の質問に即答している役者をみると「こんな複雑な問に対して即答する(=適当な答えを述べる)ような人間にはなりたくないな」と感じている。それくらいこの問には、平均値と中央値を自由にあやつる医療界の大谷翔平だったとしてもも即答できないのである。

 

 話を平均値と中央値の話に戻すと、私は生存期間で言えば中央値の方が圧倒的に信頼できると考えている。中央値はぶっ飛んだ値

・治療したかしてないかわからないレベルですぐに死んでしまった例

・そもそも診断が間違っている例

・再発もせずに長生きした例(診断が間違っている可能性もある)

・全然治療していないのにデータに乗ってしまった例

上記のような治療の効果を反映していないであろう例やそもそも統計の対象にすべきでない例やどことなく怪しさを感じる例は排除されやすいからである。一方で平均値は治療がとてもうまく行った例を反映しますが、自分が治療している動物がそんなスーパーラッキーな例に当たる可能性は低いことを考えると、やはり中央値を説明した方が良いのだろうと思います(真面目に治療していると意外と長生きする例には当たるけど、そういった例はもともと薬に対する反応が良いとかそういった背景があり、本来は診断時点で同じA病であっても、〇〇という薬への反応が良いA1病と反応が悪いA2病の2つに分類できるのが理想的な診断なのだと思う。

 

〜まとめ〜

病気を診断した際に「うちの動物はどれくらい生きられるのか?」と聞かれたら、医療ドラマみたいにビシッと即答すると、上記の理由で自らをインチキ獣医師におとしめる(ビシッと応えると飼い主さんからするとすごくデキる獣医師みたいに見えると思うが)事になるため、「一番お金と手間のかかるけど、報告されている生存期間が一番長い治療をしたとして、3つ論文が報告されていて、それぞれの生存中央値という平均みたいな値が〜と〜と〜と報告されていますが個々ですごくばらつくのでこの数値はあくまであくまであくまで目安です。また、これらは米国での報告でアメリカ人は調子が悪くなるとすぐに安楽死してしまい、一方で日本人は安楽死をせず看取ることが多いため、論文の数値より多少伸びることが多いと思います。」という誠意いっぱいなのかどうなのかわからない答えをすることになります。どうしてそういう話になってしまうかを説明すると、上記の話になり、平均中央p値だけでなくあゆも出てきてしまうので、ここまで話すと確実に誠意ない人の答えになってしまいます。最大限の誠意をもって説明をすると、いつの間にか怪しい誠意大将軍になってしまうのでした。