精密医療電脳書

分子標的薬 コンパニオン診断 リキッドバイオプシー 肺がん 乳がん ウイルス

非重複統合リード塩基配列決定システム:non-overlapping integrated read sequencing system (NOIR-SS)

非重複統合リード塩基配列決定システム:non-overlapping integrated read sequencing system (NOIR-SS) は分子バーコード技術を用いた高精度塩基配列決定システムである。血中腫瘍DNAの塩基配列決定のためにつくった技術である。複数の遺伝子を同時解析する、すなわち遺伝子検査パネルになるシステムだが、2つの大きな特徴がある:1)DNA断片にアダプターを付加、アダプタープライマーと一つの遺伝子特異的プライマーでPCR増幅(anchored PCR);2)分子バーコード内のエラー処理。

 

Anchored PCR

遺伝子検査パネルでは、がん関連遺伝子のみに解析対象を限定するために遺伝子を選択するが、multiplex PCRとhybridization captureの2つのアプローチがある。NOIR-SSではmultiplex PCRで多数の遺伝子を一回の反応で増幅してシーケンサーの鋳型DNAを調製する。NOIR-SSのmultiplex PCRでは、DNA断片にアダプターを付加、アダプタープライマーと一つの遺伝子特異的プライマーでPCR増幅を行ういわゆるanchored PCRを採用している(図1)。理由は、アンカーPCRはもともと私自身が開発した方法であること、また通常のPCRプライマーに分子バーコードを埋め込むと増幅効率が低下するためである。

f:id:kkatogo13:20201003110210p:plain

図1. NOIR-SSにおけるanchored PCR。

 注. ジョンスホプキンス大学のグループは通常のPCRプライマーの片側に12塩基の分子バーコードを埋め込む方法(Safe-SeqS)を開発して自身のリキッドバイオプシー研究に用いている。私達もNOIR-SS開発前にこの方法を検討したが、だいたい3分の2のプライマーペアは増幅しなかった。ASCOで当該グループの研究者と会ったときに、この問題について訊いてみたところ、「そのとおり、すべての遺伝子のプライマーセットを用意するのに大変な労力がかかった」という答えであった。NOIR-SSでは通常のPCRと変わらない成功率である。なお、Thermo Fisherも分子バーコードを用いたリキッドバイオプシー用パネルを販売しているが、彼らのシステムでは両側のプライマーに短いバーコード配列を埋め込む事により、バーコード配列による増幅障害の問題を回避している。キアゲンのシステムではNOIR-SSと同じくanchored PCRを用いている。

 

エラー入り分子バーコードの除去

エラー入りバーコードはリード数が少なく、リード数の多いバーコードにはエラーがないので、バーコードあたりのリード数に閾値を設定して、その閾値以下をエラー入りバーコードとして除去すれば良い(「分子バーコード技術:バーコードに入ったエラーの処理」参照)。NOIR-SSはもともとサーモフィッシャー社製のシーケンサー(PGM, Proton, S5)のために開発しており、これらのシーケンサーは塩基置換よりも挿入欠失の方がずっと多い(およそ10倍)。従って、エラーはバーコードのサイズで検出可能である。イルミナのシーケンサーのように3塩基からなるバーコード配列を用いる必要はない。図2の実験では12塩基のバーコードを用いている。

リード数の少ないバーコードが多いが、バーコードあたりのリード数が増えると減少する(図2A)。サイズが12塩基でないバーコードはリード数/バーコードの小さい領域に集中している(図2C)。リード数/バーコードが増加するに従いエラーの無いバーコードの比率が上昇する(図3D)。適切な閾値(このグラフの場合は100)以下のものをエラー入りバーコードとして除去する。なお、図2Bは累積リード数だが、リード数の少ないバーコードの領域の総リード数は少ない。この操作によって破棄するリードは全体の10−20%程度であり、シーケンシングコストの損失は少ない。

f:id:kkatogo13:20201003110300p:plain

図2.分子バーコード内エラー(挿入欠失)のモニタリングと標的遺伝子の分子数計測。正常バーコードのサイズは12塩基。A) バーコードあたりのリード数の分布。縦軸、バーコード数;横軸、リード数/バーコード。B) 累積リード数。C) バーコードのサイズ分布。D) 12塩基バーコードの比率。E) エラー入りバーコード除去後の推定標的遺伝子分子数。F) 推定分子数と鋳型DNA量間の相関。

エラー入りバーコードを除去により、分子数計測が可能になる。リード数が少ない間は、リード数増加により推定分子数は増加するが、あるポイントからプラトーに達する(図2E)。プラトー後の推定分子数と反応系に加えた鋳型DNA量と高い相関がある(図2F)。

 

シーケンサー読み取り精度の向上

分子バーコード使用によりシーケンサー読み取り精度は20から50倍向上する(エラー発生頻度が20分の1から50分の1になる)(図3)。分子バーコード使用による精度、エラー発生頻度は10万塩基に1娘程度であり、耐熱性DNAポリメラーゼの違いは影響しない。

f:id:kkatogo13:20201003110352p:plain

図3.PCR増幅酵素のシークエンスエラー率への影響。Tag(+)、バーコード使用;Tag(-)、バーコード使用せず;Q5、Q5 DNAポリメラーゼ(NEB);Pt、Platinum Taq DNA polymerase High Fidelity kit(サーモフィッシャー);DS、両鎖に分子バーコードを付加した場合(Q5 DNAポリメラーゼ使用)。

f:id:kkatogo13:20201003110422p:plain

図4.NOIR-SSと通常の次世代シーケンシングの比較。縦軸、正常配列とことなる塩基の比率;横軸、TP53塩基配列部位。747位のGがCに置換している。


胃癌患者DNAのTP53の配列をNOIR-SS(図4上段)と通常の次世代シーケンシング(図4下段)で行った。変異以外のバックグラウンドエラーが完全に抑えられた。

 

Availability

株式会社DNAチップ研究所がNOIR-SSの研究受託サービスを提供している。

 

NOIR-SSの文献

Kukita, Y., Matoba, R., Uchida, J., Hamakawa, T., Doki, Y., Imamura, F. and Kato, K. High-fidelity target sequencing of individual molecules identified using barcode sequences: de novo detection and absolute quantitation of mutations in plasma cell-free DNA from cancer patients. DNA Research. 22 (2015) 269-277. DOI: 10.1093/dnares/dsv010

 

Anchored PCRの文献

Kato, K. Adaptor-tagged competitive PCR: a novel method for measuring relative gene expression. Nucleic Acids Res. 25 (1997) 4694-4696.

Kato, K. RNA fingerprinting by molecular indexing.   Nucleic Acids Res. 24 (1996) 394-395.

Kato, K. Description of the entire mRNA population by a 3’ end cDNA fragment generated by class IIS restriction enzymes. Nucleic Acids Res. 23 (1995) 3685-3690.