精密医療電脳書

分子標的薬 コンパニオン診断 リキッドバイオプシー 肺がん 乳がん ウイルス

次世代シーケンサーの読み取り精度向上:DNA損傷対策、耐熱性DNAポリメラーぜ、分子バーコード技術

次世代シーケンサー技術の主な課題は、一つは長い領域の配列決定、もう一つは読み取り精度の向上である。読み取り精度についてはリキッドバイオプシーに応用するために、徹底的に研究が行われた。その研究成果をふまえ、3つのトピックスについて解説する。

 

DNA損傷:酸化(8-オキソグアニン)と脱アミノ化

そもそも鋳型DNAに損傷があって塩基置換が起こると、正確には読めない。主なDNA損傷の原因の一つは酸化である。8位のアミノ基が酸化されて8-オキソグアニン 8-oxoguanine できる。グアニン guanine はシトシン  cytosine と塩基対をつくるが(図1A下)8-オキソグアニンはアデニンと塩基対をつくるため(図1A上)、G-C→A-Tの置換がおこる。もう一つは脱アミノ化で、シトシン cytosine のウラシル uracil への変換である(図1B)。

f:id:kkatogo13:20200908155430p:plain

図1.DNA損傷。A、酸化、赤丸は損傷部位。B、脱アミノ化。

これらのDNA損傷は、およそ10万塩基に1箇所の頻度である。リキッドバイオプシーの技術開発時にDNA損傷が頻発する、という問題が発生した。遺伝子検査パネルでは、がん関連遺伝子を選択するが、選択方法として2つのアプローチがある。ひとつはmultiplex PCRで、一つの反応系で多数の遺伝子断片を増幅する。もう一つは hybridization capture で、集めたい遺伝子配列の人工核酸(ベイト bait)をつくり、hybridization で遺伝子断片を収集する。hybridization capture は高温(〜65°C)でDNAを長時間保温するため、その間にDNA損傷が起こる。ガーダント・ヘルス社等は正常DNAの配列を多数配列決定してDNA損傷の起こりやすい塩基部位を同定、その部位を変異から除く、という方法でこの問題を解決してる。

 

耐熱性DNAポリメラーゼ

代表的な耐熱性DNAポリメラーゼにはTaq DNAポリメラーゼと KOD DNAポリメラーゼがあるが(「PCRに必要なアイテム 〜 耐熱性DNAポリメラーゼと遺伝子増幅装置」)、前者は好熱細菌 Thermus aquaticus 由来だが、後者は古細菌Thermococcus kodakarensis 由来で系統が全く異なる(生物は細菌、古細菌、真核生物の3つの系統に分けられる)。DNA ポリメラーゼの酵素学的性質は両者で大きく異なり、一般に細菌由来のポリメラーゼはポリメラーゼ活性(正確には5’→3’DNAポリメラーゼ活性)のみだが、古細菌由来のポリメラーゼは5’→3’DNAポリメラーゼ活性以外に3’→5’エクソヌクレアーゼ活性を持っている。DNA合成における3’→5’エクソヌクレアーゼ活性の役割を図2に示した。ポリメラーゼが間違った塩基を取り込んだ場合Taq DNAポリメラーゼはそのまま合成を続ける(図2上)。しかしKOD DNAポリメラーゼの場合は、3’→5’エクソヌクレアーゼが誤って取り込まれた塩基を除去して、その後でポリメラーゼが正しい塩基を取り込んで合成を継続する(図2下)。

f:id:kkatogo13:20200908155934p:plain

図2.Taq DNAポリメラーゼ(上)とKOD DNAポリメラーゼ(下)の違い。

これがDNA合成における校正 proof reading であり、KOD DNAポリメラーゼは校正機能を持っているが、Taq DNAポリメラーゼは持っていない。そのため正確性はKOD DNAポリメラーゼのほうが10〜50倍ほど高い。正確性は測定条件によって異なるが、Taq DNAポリメラーゼは1000塩基に1回程間違えるので、KOD DNAポリメラーゼは1万塩基あるいは5万塩基に1回程度の間違いである。

耐熱性DNAポリメラーゼでは正確性だけではなく処理能力(一回のDNA分子への結合でとりこまれる塩基数で評価する)も重要である。Taq DNAポリメラーゼは高い処理能力を持っている。校正機能付耐熱性DNAポリメラーゼは一般に処理能力は低いが、KOD DNAポリメラーゼは例外的に高い処理能力を持っている。Taq DNAポリメラーゼと校正機能付き耐熱性DNAポリメラーゼを混合すれば、高い処理能力と高い正確性を兼ね備える耐熱性DNAポリメラーゼをつくる事ができる。開発初期の頃は、この方法が効果的であった。最近では、いろいろな校正機能付き耐熱性DNAポリメラーゼが単離され、また遺伝子改変で高機能化したポリメラーゼが開発されており、選択肢は豊富である。自身が経験のあるものでは、NEBのQ5 DNA polymeraseは非常に優れた酵素である。技術の実用化を考えた場合は、KOD DNAポリメラーゼが国産であるため扱いやすい。KOD DNAポリメラーゼにもいろいろな改良型が市販されているが、プロトタイプの KOD –plus- で大体満足した結果が得られる。

 

分子バーコード技術

次世代シーケンサーを用いた塩基配列決定では、同じ領域を多数回読んでコンセンサス配列をつくると、エラーが相殺されて正確な配列を決定することができる。生殖体系列のヒトゲノム配列解析の場合は、2つのアレルが1:1の比率であるため、この方法で両方のアレルの配列を正確に決定できる。ところが、がんゲノムの場合は変異アレルの比率が低いケースが多い。特に血中腫瘍DNA(circulating tumor DNA, ctDNA)の場合は1%以下のケースも多く、単純なコンセンサス配列決定では変異を検出できない。

この問題を解決するために導入されたのが分子バーコード技術である(図3)。例えば、それぞれの塩基がA, C, G, Tの混合物である12塩基の配列を血漿DNAに付着させると各分子は別々の12塩基配列で標識(分子バーコード)される(図3上)。そのあとでPCRをおこなうと各分子由来の増幅物は同一の分子バーコードを持つことになる。分子バーコードにより塩基配列をグループ化すると、変異はすべての塩基配列に出現するが、読み取りエラーは一部の配列にしか現れないので、区別することができる(図3下)。

f:id:kkatogo13:20200908160043p:plain

図3.分子バーコード技術。


この技術により実験操作過程(PCRとシークエンシング)のエラーをほぼ完全に除去できるようになった。分子バーコード技術を用いたどの報告でも、エラー率は大体10万分の1であり、この低頻度エラーは鋳型DNA分子の損傷によるものと思われる。また耐熱性ポリメラーゼのエラーに関してもかなり頑強で、KODNAポリメラーゼとQ5 DNAポリメラーゼ(正確性はKOD DNAポリメラーゼのおよそ10−50倍と云われている)でもエラー率はあまり変わらない。Taq DNAポリメラーゼに関してはデータをとっていないが、流石にエラーが増加する、と思われる。なお、分子バーコード技術の発明者はシドニー・ブレンナー Sydney Brenner 博士(2002年ノーベル賞受賞、1987−2019)である。

 

塩基配列決定の精度に関してはリキッドバイオプシーへの応用のために極限まで技術開発が行われ、短いDNA断片(<400塩基対)については解決した感がある。より長いDNA断片に関しては改良の余地はあるが、長い領域の精度向上に関しては特に大きなニーズはないので、別方向の技術開発、たとえばスループットの向上、を行うべきであろう。