分子バーコードによる分子数計測の説明がわかりにくい、という指摘があったので、別の説明を試みた。
precision-medicine.jp
分子バーコード技術
分子バーコード技術ではランダムな配列の合成DNAをPCR前に鋳型DNAに付着させる(図1)。

図1.分子バーコード。
その後でPCR及びシーケンシングを行い、得られた塩基配列をバーコードによりグループ化、配列の異なるバーコード数から鋳型DNAの分子数を計測する。問題はPCR及びシーケンシングで発生するバーコード内のエラーである。エラーの入ったバーコードを別分子としてカウントすることになるので正確な分子数計測ができない(図2)。

図2.この例では真の分子数は3だが、エラー入バーコードのため4と計測される。
2つの解決方法がある:1)あらかじめエラーの入ったバーコードを検出できるようにバーコードのセットをつくる、2)エラー入バーコード数をモニターする。
エラー検出可能な限定数のバーコードセット
この方法では、少数のエラーがバーコード配列に入った場合、そのようなバーコード配列は、予め用意したバーコードのセットの中に存在しないようにバーコードを設計する(図3)。

図3.エラー検出可能な限定数のバーコードセット。
前述したランダム配列合成DNA を用いる方法と異なり、それぞれのバーコード配列を別々に合成する必要があるため、高コストになる。したがって使用対象は細菌、ウイルスなどの小さなゲノムに限定される。
エラー入りバーコード数をモニターする方法
図4に示すような3種類の塩基のランダム配列の場合は、エラー入バーコード配列の一部は、使用していない塩基が出現するために検出できる(図4)。

図4.3塩基のランダム配列による分子バーコード。
エラー入バーコードは、そのバーコードが付着した塩基配列が少なく、エラーの入っていないバーコードは塩基配列数が多い傾向がある。エラーはPCRやシークエンシングの操作中にはいるため、操作の最初から存在する本物のバーコードより塩基配列数が少なくなるのは当然である。図5にはバーコードあたりの塩基配列数(横軸)とエラーのないバーコードの割合(縦軸)の関係を示している。バーコードが3種類の塩基のランダム配列の場合(図4)は、検出されたエラー入りバーコード数に3を掛ければ、エラー入バーコード数の総数が得られる。図5のプロットで閾値以上のバーコードを回収すれば、正確な分子数が計測できる。

図5.バーコードあたりの塩基配列数(横軸)とエラーのないバーコードの割合(縦軸)の関係。
以上はイルミナ社のシーケンサーの場合だが、サーモフィッシャー社の場合は挿入欠失エラーが大部分であるため、鎖長でエラーを検出できる。