第８回：観察研究と反事実（Counterfactual）について

前回はコホート研究において、暴露因子や治療を評価する際に、

Induction Time
Immortal Person Time

という２つの概念が重要であることを説明してきました。

第７回：コホート研究における暴露の評価【グループ化、時間依存性の暴露、Induction Time, Immortal Person Time】今回はコホート研究における暴露因子（Exposure of Interest）の評価方法について解説していきます。コホート研究ときく...

今回は、

理想的なコントロールについて
Counterfactual（反事実）
Exchangeability (交換可能性 )

の３点を説明していきます。

これらの考え方が、実際の解析とどう関わってくるかも、イメージが湧くように記載してみました。

Dr.KID

どうしたら理想的なコントロールが手に入るかを考えることが、疫学研究の入り口です。

理想的なコントロールとは？

まずは、ランダム化比較試験（RCT）を例に考えてみましょう。
RCTでは、治療をランダムに割りつけることで、治療グループとコントロール・グループの患者背景は均一になります。このため、この２グループでは

年齢
性別
重症度
既往歴

など、は基本的に均一になっています。論文ではTable 1に、このサマリーが載っていますよね。

「ランダム化」という介入をすることで、２つのグループが似た者同士になったと言えます。この状況は理想的なコントロールを見つけたと言い換えても良いでしょう。

この状況を、疫学用語で「Exchangeability」があると言います。
特にRCTではグループ全体（Marginal）でExchangeabilityがあるため「Marginal Exchangeability」ということもあります。

Dr.KID

ランダム化をすれば、理想的なコントロール群が作り出せる！

RCTとコホート研究の決定的な違い

RCTとコホート研究での決定的な違いは、「治療をランダムに割りつけるか否か」でした。

別の言葉で説明すると、RCTでは治療グループとコントロール・グループは似た者同士になるが、コホート研究では治療グループとコントロールグループは似た者同士にはまずなり得ないといえます。

なぜなら、現実の診療では、とある治療を受ける人と、そうでない人は、ほとんどのケースで同じ条件ではないからです。
つまり、治療を受ける人の方が、病気が重症であったり、経済的に恵まれていたり、医療へのアクセスがよかったり、と様々な違いが生じます。

治療の例以外にも、

環境汚染物質への暴露のある/なし
異なる性別・人種・出身
社会経済的な背景（収入など）

などでグループ分けをしても、単純にこの２〜３グループでの比較はできません。
なぜなら、それぞれのグループの背景が異なってしまうからです。

Dr.KID

コホート研究では、RCTみたいに２グループを単純比較してはいけませんよ

コホート研究で理想的なコントロールを見つけるには

コホート研究を開始する前に「理想的なコントロールは何か？」を考えることから始めます。
つまり「このグループ（暴露や治療あり）」と「コントロール」はどうしたら比較できるようになるのか？と思いを馳せます。

例えば、

同じ年齢
同じ性別
同じ人種
同じ地域に住む
同じ収入レベル

であれば、２者は比較できるかもしれません。

つまり、「とある条件下（Conditional）であれば、比較可能になった」と前提を置くことで、「Exchangeability（交換可能性）」を仮定しているといえます。
このことを、「Conditional Exchangeability」といいます。

Dr.KID

観察研究でグループ比較をする場合、ほとんどのケースで「Conditional Exchangeability」という仮定が必要になります

コホート研究で複雑な解析をしている理由

RCTと比較して、コホート研究の論文では「Method」のところに難しい統計用語が沢山の出てきます。
時に数式が登場してきたりして、あまり統計や疫学に詳しくない方がと、「なんのこっちゃ」と読み飛ばしてしまうと思います。

Conditional Exchangeabilityを作り出すために…

代表的な手法として、

Regression (回帰分析)
層別化やマッチング
Propensity Score (傾向スコア）

などが近年はよく使用されていますが、これらの手法は２つのグループを比較可能な状況に持ち込む手法です。
例えば、層別化や回帰分析では、「同じ年齢・同じ性別・同じ地域なら…」と条件を絞り込むことで比較をしています。
傾向スコアでは、「治療を受ける確率(Propensity score)」を計算し、この確率が一緒なら、絞り込んで比較をしています。

また、（特に）疫学者は「g-method」と言われる手法を好んで使用することもあります（私もそうです）。具体的には、