全ゲノムシーケンスと全エクソームシーケンスの比較

バックグラウンド

様々な研究課題に答えるために使用される DNAシーケンス 技術には、全ゲノムシーケンス(Whole genome sequencing、 WGS )と全エクソームシーケンス(Whole exome sequencing、 WES )という2つの主要なタイプがあります。WGSとWESはどちらも、遺伝子バリアント(変異)の検出、大規模コホートの広範な表現型決定(すなわち、ある種における特定の形質の根底にある遺伝の決定が可能)、稀な腫瘍型体細胞変異の分類、薬理遺伝学分野の革新などに重要です(Novogene、2011a)。どのアプローチを用いるかは、研究に関わるパラメータと必要な情報の種類によって異なります(Novogene、2011b)。図1に、WGSとWESの概要を示します。

両手法とも個人の遺伝的構成を包括的に解析するものですが、両手法にはいくつかの重要な相違点があります。WGSはタンパク質コード領域と非コード領域を含むゲノム全体を解析するのに対し、WESはゲノムのタンパク質コード領域のみを調査します。このテクニカルノートでは、科学者が遺伝学的研究にどちらの方法を使用するかを選択する際に役立つように、両手法の利点と欠点について説明しています。

全エクソームシーケンス:仕様、メリット・デメリット

全エクソームシーケンスの仕様を表 1に示します。

表 1. 全エクソームシーケンスの仕様(Novogene、2011c)。

Sequencing platformIllumina NovaSeq 6000
Read lengthPaired-end 150 bp
Sequencing depthFor Mendelian disorder/rare disease: effective sequencing depth > 50x (6G)
Data analysisData quality controlAlignment to a reference genomeSNP1 and InDel2 callingSomatic SNP1/InDel2/CNV3 mutation detection (tumor-normal paired samples)

1SNP = single nucleotide polymorphism; 2InDel = insertions and deletions; 3CNV = copy number variant. 

全ゲノムシーケンスと比較して、全エクソームシーケンスの大きな利点の1つは費用対効果が高いことです。全エクソームシーケンスはゲノムのタンパク質コード領域(またはエクソーム)のみを配列するため、生成されるデータ量が大幅に少なく、したがってシーケンスおよび解析のコストが低くなります。全エクソームシーケンスのもう一つの利点は、エクソームがゲノムの2%未満であるにもかかわらず、既知の疾患関連遺伝子変異の85%が含まれていることです(Illumina、2023)。例えば、全エクソームシーケンスは遺伝性代謝異常などの疾患の遺伝的原因を特定するのに有効であることが示されている(Delanne et al.、2021)。また、全エクソームシーケンスは臨床診断に有用なツールであることが示されており、Retterer et al.(2016)が実施した研究では、~30%の診断収率が確認され、がん研究では特に腫瘍の進行に役割を果たすバリアントや変異を特定するために用いられています(Novogene、2011c)。

全エクソームシーケンスの欠点として、エクソームの外にある重要なバリアント、特に遺伝子発現や制御に重要な制御領域にあるバリアントを見逃す可能性があります。全ゲノムシーケンスとは異なり、全エクソームシーケンスでは大規模な 挿入欠失 、構造的な変異を特定することができません(Novogene、2011c)。

全ゲノムシーケンス:仕様、メリット・デメリット

全ゲノムシーケンスの仕様を表 2に示します。

表 2. 全ゲノムシーケンスの仕様(Novogene、2011c)。

Sequencing platformIllumina NovaSeq 6000PacBio Sequel II/IIeNanopore PromethION
Read lengthPair-end 15- bp>15 kb for Sequel II (Average)>17 kb (Average)
Sequencing depthFor rare disease: 30-50xFor genetic diseases: 10-20xFor genetic diseases: 10-20x
For tumor tissues: 50x; For adjacent normal tissues and blood: 30xFor tumor tissues: ≥20xFor tumor tissues: ≥20x
Standard data analysisData quality controlAlignment with reference genomeSNP1/ InDel2/ SV3/ CNV4detection Somatic SNP1/ InDel2/ SV3/ CNV4 detection (For tumor-normal paired samples)Data quality controlSequence alignmentSV detectionVariation annotation

1SNP = single nucleotide polymorphism; 2InDel = insertions and deletions; 3SV = structural variant; 4CNV = copy number variant. 

全ゲノムシーケンスの大きな利点は、全エクソームシーケンスと比較して、個人の遺伝的構成をより包括的に見ることができることにあります。全ゲノムシーケンスは、非コード領域や構造的なバリアントを含め、エクソームには存在しないバリアントを特定することができます。これは、全エクソームシーケンスで見逃された希少なバリアントや新規バリアントを特定するのに特に有用です。全ゲノムシーケンスはまた、家系や集団遺伝学に関する情報も提供することができます(Novogene、2011c)。

全ゲノムシーケンスの大きな欠点は、大量のデータが生成されるため、全エクソームシーケンスと比較して費用対効果が低いことです。データ解析のために、より多くの計算資源と専門知識が必要になります。また、全ゲノムシーケンスでは、特に低頻度のバリアントについて偽陽性の結果が出やすく、結果の解釈が困難になる可能性があります(Novogene、2011c)。

全エクソームシーケンスと全ゲノムシーケンスのどちらを選ぶか

全エクソームシーケンスと全ゲノムシーケンスのどちらを選ぶかは、研究目的、利用可能なリソース、研究予算によって異なります。例えば、研究目的がタンパク質コード領域における疾患の原因となるバリアントを特定することであれば、全エクソームシーケンスが最も適切なシーケンス方法であると言えます。全ゲノムシーケンスと比較して生成されるデータが少ないため費用対効果が高いだけでなく、既知の遺伝子や遺伝子セット、タンパク質コード領域に関連する疾患を対象とする場合に特に有効です。しかし、研究目的がより広範で、個人の遺伝子構成のより包括的な分析が必要な場合は、全ゲノムシーケンスの方が適している場合があります。全ゲノムシーケンスでは、ゲノムのタンパク質コード領域と非コード領域の両方において、 一塩基変異 、インデル、構造変異、コピー数変異の同定など、全エクソームシーケンスで提供できる以上のゲノムの検査が可能です。これは、ゲノムの非コード領域に関連する疾患を研究する上で特に重要です。また、全ゲノムシーケンスは全エクソームシーケンスと比較して、より信頼性の高いシーケンスカバレッジとカバレッジの均一性を有しています。

全体として、全エクソームシーケンスと全ゲノムシーケンスのどちらにも利点と欠点があります。2つの方法のどちらを選択するかは、研究目的、手持ちのリソース、研究予算によって決まります。しかし、どちらの方法も、遺伝学研究を加速させ、画期的な発見をするために科学者によって広く利用されてきました。

参考文献

Delanne, J., Bruel, A.L., Huet, F., et al. (2021). The diagnostic rate of inherited metabolic disorders by exome sequencing in a cohort of 547 individuals with developmental disorders. Mol. Genet, 29: 100812. doi: 10.1016/j.ymgmr.2021.100812. https://pubmed.ncbi.nlm.nih.gov/34712575/

Illumina. (2023). What is exome sequencing?. Illumina, Inc. https://www.illumina.com/techniques/sequencing/dna-sequencing/targeted-resequencing/exome-sequencing.html

Novogene. (2011a). Data analysis: the perks and fruits of next generation sequencing. Novogene Co., Ltd. https://www.novogene.com/us-en/resources/blog/data-analysis-next-generation-sequencing/

Novogene. (2011b). A beginner’s guide to DNA sequencing. Novogene Co., Ltd. https://www.novogene.com/us-en/resources/blog/a-beginners-guide-to-dna-sequencing-blog/

Novogene. (2011c). WGS vs WES: which genetic sequencing method is right for you?. Novogene Co., Ltd. https://www.novogene.com/us-en/resources/blog/wgs-vs-wes-which-genetic-sequencing-method-is-right-for-you/

Retterer, K., Juusola, J., Cho, M.T., et al. (2016). Clinical application of whole-exome sequencing across clinical indications. Genet Med, 18(7): 696-704. doi: 10.1038/gim.2015.148. https://pubmed.ncbi.nlm.nih.gov/26633542/