遺伝疫学

Twin Studyにおけるsimilarityとheritabilityの評価方法について

今回は遺伝疫学(genetic epidemiology)でよく行われるTwin Studyの研究手法について少し踏み込んで説明していこうとおもいます。

前回、Twin Studyの手法について表面的なことを解説しました。

  1. 双子の方に研究の参加をお願いする
  2. 一卵性or 二卵性を評価する
  3. 表現型(phenotype)を評価する
  4. 一卵性と二卵性双生児でのcorrelationやconcordanceを評価する

の順になります。

今回は、この最後の軽量的な評価、つまりcorrelationやconcordanceの評価や、heritabilityの評価について解説していければと思います。

オススメの教科書はこちらになります。遺伝疫学(genetic epidemiology)に興味のある方は、一読をお勧めします。

類似性(similarity)を評価する:
Measure of similarity

Twin studyでは最終的には類似性を評価するわけですが、具体的には

  • Intraclass correlation coefficient
  • Concordance rate

を使用します。
前者は連続変数(continuous variable)の場合に、後者は二項変数(dichotomous variable)の場合に使用します。

Intraclass correlation coefficientについて

まずはintraclass correlation coefficient (ri)について解説していきます。

Intraclass correlation coefficientを平たくいうと、双子同士のペアのアウトカムの相関係数(ri)を算出します。

例えば、双子の身長の相関をみたければ、

  • 一卵性双生児同士の身長の相関係数(r1)
  • 二卵性双生児同士の身長の相関係数(r0)

の2つを比較することになります。

左の図が一卵性双生児の身長の相関係数ですが、r = 0.96となります。非常に似通っており、強い相関であるのがわかると思います。

右の図は、二卵性双生児の身長の相関係数になります。r = 0.32と、一卵性双生児に比べると、弱い相関です。

相関係数を使用するので、rは0〜1の間になります。

1に近ければ、双子のペアは完璧に類似性のあることがしさされます。逆に、0に近ければそれぞれのペアの類似性は低く、ランダムに二人を抽出した場合と変わらないことをいいます。

Concordance rateについて

Concordance rateでは、ペアの片方(A1)がアウトカムを認めた場合(例:A病がある)、もう片方が(A2)同じ疾患を認める確率をいいます。

二人が一致している確率を計算するので、一致率(concordance rate)と呼ばれています。

表現型 = 遺伝 + 環境
Phenotype (P) = Genotype (G) + Environment (E)

ほとんどの疾患は遺伝的な要素(G)と環境的な要素(E)で決まることを留意する必要があります。

遺伝的な要素(Genotype)にも2つの種類があり、

  • Additive genetics (A)
  • Non-additive (dominance) genetics (D)

の2種類があります。

また、環境的な要素(Environment)には、

  • Shared environment(C)
  • Unique environmeet and measurement error (E)

の2つがあります。

Additive vs. Dominance Genetic Variation

まずはadditive genetic variationとdomestic genetic variationについて理解していきましょう。

Additive genetic variation (VA)

Additiveとは足し算のことをいいます。

例えば、とうもろこしの成長率が遺伝子1(A or a)と遺伝子2(B or b)によって決定されるとします。そして、

  • A = 4 bu/ac
  • a = 2 bu/ac
  • B = 6 bu/ac
  • b = 3 bu/ac

とします。

(*bu/acはbushles/acreの略でして、1acreあたり何bushles(1bu ≒35L)の穀物が育つのかの指標です)

AABBのgenotypeのとうもろこしはどうでしょうか?

Additive genetic variationでは、4 + 4 + 6 + 6 = 20 bu/acになります。Additive(足し算)ですよね?

AaBbのgenotypeの場合はどうでしょうか?

4 + 2 + 6 + 3 = 15 bu/ac となります。

このような考え方で計測されたvariationがadditive genetic varianceになります。

Dominance (non-additive) genetic variation (VD)

Dominance (non-additive) genetic variationの場合、どうなるでしょうか?

Dominanceの場合、遺伝子の強いほうに(A or aであれば、A)表現型が影響されます。このため、AABBでは4 + 4 + 6 + 6 = 20 bu/acになります。

また、AaBbでも、4 + 4 + 6 + 6 = 20bu/acになります。

このような考え方で計測されたvariationを、dominance genetic varianceといいます。

おまけ:Interactions between genes (VI)

じつはadditiveとdominance genetic variation以外にも、遺伝子同士の相互作用(interaction)を考慮する必要があります。

AAとBBの遺伝子が揃うと、足し算以上の効果がでたり、相殺しあってしまう場合にinteraction(相互作用)があるといいます。

今回の例でいうと、additiveやdominanceの場合はAABB = 20が理論値でしたが、AABB = 30 (>20)と出た場合などにinteractionを疑います。

 

Heritability analysis

Heritabilityとは、日本語で「遺伝率」などと呼ばれています。わりとラフに使われてしまっている場合もあります。

しかし、Heritabilityとは統計学的意味でして、基本的にはadditive polygenic modelに基づいて、疾患の表現型(P: phenotype)のばらつきが、遺伝子(G)と環境(E)に分けられることをいいます。

ここで、P, G, Eを使用して数式にすると、

            P = μ+ G + E

となります。μは母集団での平均、Gは遺伝的な影響、Eは環境からの影響を指します。

Pの分散(ばらつき:variance)をみると、以下のようになります:

  • P)2= (σG)2+ (σE)2

となります。ここでは、遺伝的な影響と環境からの影響は独立していると仮定しています。

ここでHeritability(H2)を定義すると、

            H2= (σG)2/ (σP)2

となります。

この数式からわかるように、Heritability(H2)とは、疾患の表現型のばらつきのうち、遺伝子によるばらつきで説明される割合のことをいいます。Heritability(H2)は0〜1の間になります。

英語では「heritability is the proportion of variance in phenotype that is attributable to genetic influence」など解説されています。

Heritability(H2)の誤解

Heritability(H2)の意味をよく誤解されてしまっていることがあります。先ほども記載したとおり、Heritability(H2)とは、疾患の表現型のばらつきのうち、遺伝子によるばらつきで説明される割合のことです。

よくある解釈の間違いとして、

  • 表現型が次の世代へ浸透する割合
  • Heritabilityが高いほど、遺伝子が決定因子である
  • Heritabilityが低いから、additive genetic varianceはない
  • Heritabilityが高いから、遺伝子の影響が大きい

などがよくある誤解です。

例えばheritability = 0.7と計算された場合、「とある疾患(や特性)の70%が遺伝的な影響である」とは言えません。
集団における疾患のばらつきの70%が遺伝的な違いによるもの、という意味だからです。

GをさらにAとDで細分化する

ここで、genetic variability (G)をadditive (A) + dominance (D) variabilityに分けてみましょう。
先ほど説明したinteractionはないと仮定します。この場合、genetic variabilityは、

  • G)2= (σA)2+ (σD)2

となります。

さらに、heritabilityは、

  • H2= (σG)2/ (σP)2=((σA)2+ (σD)2)/ (σP)

となります。

Twin studyでHeritabilityを計測する方法

本題のtwin studyでheritabilityを計算する方法を考えてみましょう。twin studyでは、

  • 一卵性双生児(MZ):遺伝情報は100%共有
  • 二卵性双生児(DZ):遺伝情報は50%共有

と仮定をして計算していきます。

Additive effectのみの場合

次に、additive effectしかない(dominance effect = 0)と仮定をすると

  • G)2= (σA)2

となります。

さらに、双子は同じ環境で暮らしていると考慮すると、双子間での共分散は、

  • Cov(MZ) = 1.0(σA)2 + 0(σE)2
  • Cov(MZ) = 0.5(σA)2 + 0(σE)2

となります。すると、

  • 2[Cov(MZ) – Cov(DZ)] = (σA)2

となります。そして最終的に、

  • H2= (σA)2/ (σP)2

となります。

ACE modelについて

ACE modelのACEそれぞれは、

  • A: additive genetic effect
  • C: common or shared environmental effects
  • E: unique or non-shared environment for co-twins

となります。この場合、分母のPは、

  • P)2= (σA)2+ (σC)2+ (σE)2

となります。

Intraclass correlationの値がわかっている場合

Intraclass correlation(rMZやrDZ)の値がわかっている場合、以下の等式を使用することができます:

  • h2(ACE) = 2(rMZ– rDZ)

例えばこちらのデータを見てみましょう(Silventoinen et al., 2003):

オーストラリアの男女における身長のheritabilityを計算すると、

  •  男性:            2x(0.87 – 0.42) = 0.90
  •  女性:          2x(0.84 – 0.49) = 0.70

となります。

デンマークの男女における身長のheritabilityを計算すると、

  • 男性:            2x(0.89 – 0.47) = 0.84
  • 女性:            2x(0.89 – 0.55) = 0.68

となります。

Intraclass correlationsを使用した上のheritabilityの計算は、近年は使用されなくなってきている

この公式は2000年代中盤くらいまではよく利用されていましたが、近年は使用されなくなってきています。

統計や疫学手法が近年画期的に進歩しています。例えばGWASからheritabilityを推定する際には、LD score regression (LDSR)など、様々な手法が使用されています(Czajkowski et al., 2018; Suggs et al., 2018)。

最後に

今回はTwin studyにおけるconcordance, intraclass correlationや、heritabilityについて解説してきました。

次回は、Faimily studyについて解説できればと思います。

 

参考文献

  • Czajkowski, N., Aggen, S. H., Krueger, R. F., Kendler, K. S., Neale, M. C., Knudsen, G. P., … Reichborn-Kjennerud, T. (2018). A Twin Study of Normative Personality and DSM-IV Personality Disorder Criterion Counts: Evidence for Separate Genetic Influences. The American Journal of Psychiatry, 175(7), 649–656. https://doi.org/10.1176/appi.ajp.2017.17050493
  • Silventoinen, K., Sammalisto, S., Perola, M., Boomsma, D. I., Cornes, B. K., Davis, C., … Kaprio, J. (2003). Heritability of adult body height: a comparative study of twin cohorts in eight countries. Twin Research : The Official Journal of the International Society for Twin Studies, 6(5), 399–408. https://doi.org/10.1375/136905203770326402
  • Suggs, A., Loesch, M., Ezaldein, H., Christensen, L., Dawes, D., & Baron, E. (2018). An Acne Survey from the World’s Largest Annual Gathering of Twins. Journal of Drugs in Dermatology : JDD, 17(4), 380–382. Retrieved from http://www.ncbi.nlm.nih.gov/pubmed/29601613

 

ABOUT ME
Dr-KID
このブログ(https://www.dr-kid.net )を書いてる小児科専門医・疫学者。 小児医療の研究で、英語論文を年5〜10本執筆、査読は年30-50本。 趣味は中長期投資、旅・散策、サッカー観戦。note (https://note.mu/drkid)もやってます。