次世代シーケンス実験ワークフロー

このテクニカルノートは、 次世代シーケンス (NGS)のワークフローについて解説しています。

典型的なIllumina NGSのワークフローは、4つのステップを含みます: 1) ライブラリー 調製、2)ブリッジ増幅とクラスター生成、3)シーケンス、4)アライメントとデータ解析です。イルミナNGSのワークフローの模式図を図1に示します。

ステップ1:DNAシーケンスライブラリーの調製

抽出した DNA または cDNA (出発物質が RNA の場合)のDNAサンプルは、まず200-500 bpのDNA断片に細断されます(Novogene、2011)。この断片の両端に、還元サイクル増幅法により アダプター がライゲーションされます(図1a)。各アダプターは、シーケンシングプライマー結合部位、インデックス配列、ライブラリーフラグメントをフローセルに付着させる部位を備えています。アダプターは5’末端と3’末端に特異的であり、同じインデックスを共有しながら、シーケンス結合部位とフラグメント結合部位が異なっています。二本鎖DNA断片は、一本鎖を形成するために変性され、フローセルに加えられます(Choudhuri、2014)。

ステップ2:ブリッジ増幅とクラスター生成

フローセルは、アダプターに相補的な2種類の表面固定型 オリゴヌクレオチド (オリゴ)を塗布したガラス製セルです(図1b)。1種類の表面固定型オリゴに固定化された鎖がハイブリダイゼーション鎖です(図1b)。

固定化された断片は、標準的な PCR 増幅を行うことで、元の断片のコピーが多数生成され、密なクラスターに局在するようになる(図1c)。その後、二本鎖のPCR産物が変性し、元の鎖(表面に固定されたプライマーにハイブリダイズして増幅のための鋳型となる)が洗い流され、新たに合成された鎖が表面に固定されます(図1d)。この表面に固定された一本鎖が折り返され、アダプター領域がフローセル上の2種類目のオリゴとハイブリダイズしてブリッジを形成します(図1e)。相補的な鎖が合成され、二本鎖のブリッジが形成されます(図1f)。このようなPCR増幅の過程をブリッジ増幅と呼びます。その後、二本鎖のブリッジは変性し、2本の一本鎖のコピーとなり、それぞれのブリッジは表面に固定されます(図1g)。ブリッジ増幅PCRサイクルを繰り返すと、一本鎖の増幅産物が密集したクラスターが得られます(図1h)。このようにして、数百万個のユニークなクラスターが生成されます。逆鎖は切断され、洗い流され、順鎖のクラスターが残ります(図1h)。3’末端は、不要なプライミングを防ぐためにブロックされます(Choudhuri、2014)。

ステップ3:シーケンシング

シーケンシング プライマー を用いて、鎖の塩基配列を決定する。最初のシーケンスサイクルは、蛍光標識された4つの可逆的ターミネーター塩基(各塩基は異なる蛍光標識を含んでいます)、シーケンスプライマー、および DNAポリメラーゼ をフローセルに加えることで開始されます。ポリメラーゼは一塩基伸長しかできないため、鋳型鎖に相補的な塩基のみが組み込まれ、追加された塩基の3’末端がブロックされるため伸長は停止します。その後、取り込まれなかった塩基は除去され、付加された塩基はレーザーで励起され、蛍光をCCDカメラで撮影します。こうして、最初の塩基が画像化されます。各フラグメントの第1塩基も同様に記録され、画像化されます。同様に、付加された第2塩基はすべてのフラグメントについて画像化されます(Choudhuri、2014)。

このサイクルを繰り返し、各フラグメントの塩基配列を1塩基ずつ決定します(図1i)(Choudhuri、2014)。このプロセスは数百万個の断片に対して行われるため、超並列配列決定と呼ばれます。順鎖のシーケンシングが完了すると、3′末端がブロックされなくなり、逆鎖を生成するためにブリッジ増幅の別のサイクルが実行されます。順鎖は切断され除去され、逆鎖も同様に配列決定される。順鎖の配列決定のみが行われる場合、 シングルエンドシーケンス と呼ばれます。逆鎖もシーケンスする場合は、 ペアエンドシーケンス と呼ばれます。シーケンス結果は、FastaQファイル(Novogene、2011)に保存されます。

ステップ4:アライメントとデータ解析

品質管理チェックが行われ、配列は固有のインデックスを使用して正しいライブラリに割り当てられます。その後、類似の塩基配列を持つ リード をクラスタリングし、フォワードリードとリバースリード(ある場合)をペアリングして、連続した配列(コンティグ)を生成します。これらのコンティグは、参照ゲノムとアライメントされます。参照ゲノムがなく、配列が新しい場合は、de novoアセンブリ 法(Choudhuri、2014; Novogene、2011)によって配列アライメントが行われます。

1. IlluminaのNGSワークフロー(Choudhuri、2014から改変)。

参考文献

Bunnik, E. M., Le Roch, K. G. (2013). An introduction to functional genomics and systems biology. Adv Wound Care (New Rochelle), 2(9): 490-498. doi: 10.1089/wound.2012.0379. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3816999/

Choudhuri, S. (2014). Bioinformatics for beginners: Genes, genomes, molecular evolution, databases and analytical tools. Elsevier Inc. https://www.sciencedirect.com/book/9780124104716/bioinformatics-for-beginners

Novogene. (2011). Next generation sequencing (NGS): a beginner’s guide. Novogene Co., Ltd. https://www.novogene.com/us-en/resources/blog/ngs-beginners-guide/