単一のプライマー拡張は、ss-dsDNAsを作成しました。 (下)4サイクルのPCRは、過剰なssDNA産生を最小限に抑えながら、最適量の1 6 0ntのss−dsDNAを生成した。 (右)DNAゲルは、1:10ssDNA:プライマー比以下のss-dsdnaの生成の顕著な増加を示した。 b個々のファイルは、one-pot single primer extensionによって作成された三つのファイルデータベースから分離することができます。 各ファイルは、官能化された磁気ビーズを用いた非PCRベースの分離に続いて、その対応するビオチン結合オリゴによってバインドされました。 ファイル分離特異性は、qPCRによって測定されたファイルA、B、またはCのいずれかであることによって分離されたDNAの割合である。 c(左)PCRではなく、DORISは、オリゴが内部のオフターゲット部位に結合し、望ましくない産物を産生することを可能にする。 (中央)DNAゲルと(右)それらの定量蛍光(PCRのための青、DORISのためのピンク)は、PCRベースのアクセスは、dorisが所望の鎖のみにアクセスしたのに対し、切り捨てられ、不所望のアンプリコンをもたらしたことを示した。 d(左)モンテカルロシミュレーションでは、互いに相互作用しないオリゴの数やデータペイロードを推定しました。 400,000オリゴは、異なる密度エンコードに対してテストされました。 X軸は密度を表します(Eq. (4))は、離散1バイトのデータ値を格納するために使用されるコードワードの長さに反比例します。 12から4のコードワード長を評価しました。 DORISの場合、オリゴとデータペイロードとの間の望ましくない結合を防ぐ必要がないため、エンコード密度は影響を受けませんでした。 (右)PCRの場合、ストランド密度が増加するにつれてデータペイロードを結合しないオリゴの数が減少するため、保存できるファイルが少なくなり、システム全体 DORISの場合、オリゴの利用可能性はエンコードとは無関係であり、したがって容量はより高密度のエンコードとともに増加する。 プロットされた値は算術平均を表し、エラーバーは三つの複製ファイルの分離またはシミュレーションのs.dを表します。 ゲル像はRT-QPCRによって測定された三つの独立した実験の代表である。 ソースデータは、ソースデータファイルとして提供されます。 *容量は、ここでは説明されていない合成および配列決定の制限によって制限される場合があります。次に、この方法を使用してワンポット反応で3つの異なるss-dsdnaを作成できるかどうか、および各ss-dsDNAを混合物から特異的に分離できるかどうかをテス 2b)。 3つの異なるssdna”A”、”B”、および”C”を一緒に混合し、共通のプライマーを追加し、4つのPCRサイクルを実行してss-dsdnaを作成しました(ここでは、それぞれ一つの一意の鎖で構成されるファイルと呼ばれます)。 その後、ビオチンリンク20nt DNAオリゴを使用して、各ss-dsDNAを結合しました(すなわち ファイル、A、B、Cはそれぞれ別個のオーバーハングシーケンスまたはファイルアドレスを持ち、ストレプトアビジンで官能化された磁気ビーズを用いて混合物から分離される。 これらのオリゴのそれぞれは、他の二つなしで対応するファイルのみを具体的に分離することができた(図。 2b,bottom,Eq. (1)). 重要なことに、この分離ステップは、室温(25℃)で実行することができ、35または45℃のより高いオリゴアニーリング温度で観察される最小限の利益のみ(補 2、Eq. (2)). このステップの室温および等温性は、実用的なDNA貯蔵システムおよびDNA分解を低減するのに有用である。
20ntは標準的なPCRプライマー長ですが、分離効率は異なるオーバーハング長と分離温度によって調節できるかどうかを尋ねました。
20ntは標準的なPCRプライマー長ですが、分離効率 我々は、5-25ntオーバーハングを有する5ss-dsdnaを設計した(補足図。 3). 我々はその後、15-55℃でその特定のビオチンリンクオリゴを使用して各鎖を分離しました。 我々は、より長いオリゴ(20mersおよび25mers)およびより低い温度(15°Cおよび25°C、補足図)での分離効率の向上を観察した。 3b)。 これは、オリゴヌクレオチド特性計算機(補足図)を用いた熱力学的分析と一致した。 3c、方法、Eqs。 (3)–(5))28,29,30.
DORISは密度と容量の制限を増加させます
ファイルの室温分離の一つの潜在的な利点は、ss-dsdnaの二本鎖部分が一緒にアニールされたままであり、データペイロード領域内の任意の同様の配列への望ましくないオリゴ結合をブロックする可能性があることである。 データペイロード領域は、格納された情報を含むs s−dsDNAの中央にある配列の大部分である。 この仮説を検証するために、本発明者らは、2つのss−dsDNAを作成した(図1 0B)。 2c)。 一つのss−dsDNAは、オリゴA’とオリゴB’の内部結合部位とを結合する突出部を有していた。 DORISを用いることにより,オリゴA’のみがオリゴB’ではなく鎖を分離できることを実験的に検証した。 比較のために、PCRベースのシステムは、各サイクルでdsdnaを溶融し、プライマーがデータペイロード内でオフターゲットに結合することを可能にする。 予想されるように、PCRを使用した場合、オリゴA’およびオリゴB’の両方が結合し、オリゴB’は望ましくない切断産物を産生する。 我々が試験した第二の鎖は、両方ともオリゴC’に相補的であった内部結合部位および突出部を有していた。 我々は、DORISを使用して、oligo C’は完全長の鎖のみをもたらしたことを示した。 対照的に、PCRを使用する場合、oligo C’は、全長および切断された鎖の両方を生成した。
次に、DORISのこのブロッキング特性がDNAベースの情報記憶にどのような影響を与えているかを尋ねました。 データベースのサイズが大きくなるにつれて、直感的には、データペイロード領域に現れるアドレス配列(DORISのオーバーハングまたはPCRのプライマーサイトのいずれか)と同一の配列の可能性が高くなる。 DORISでは、オリゴがdsDNAデータペイロード領域を結合するのをブロックされるため、これは問題ではありません。 しかし、PCRではプライマーはこれらのデータペイロード領域を結合するため、これまでのアプローチでは、プライマー配列(アドレス)がデータペイロード11,12内の同一または類似の配列と重複することを制限するエンコーディングアルゴリズムが開発されている11,12、一般的に~<6内のハミング距離を回避する。 これにより、本質的に、データペイロードシーケンススペースの制限によりデータベースをエンコードできる密度、または使用できる固有のプライマーシーケンスの数 密度は、ntあたりに格納される情報の量である(Eq。 (6))、ペイロード領域(低いダイバーシチシーケンス空間)で使用できるシーケンスを制限する符号化制限が置かれるにつれて減少し、容量はシステムに格納できる情報の総量である(Eq. (7))およびそれらが貯えることができるファイルの数を定めると同時に利用できる住所の数に依存しています。
これらの関係を定量的に示すために、適度なサイズのデータベースであっても、データペイロード領域と対話しない利用可能なアドレスの数を解析的に解 そこで,モンテカルロシミュレーションを行い,達成可能なアドレスの総数と総容量を推定した。 アドレス配列が1 0 9個の異なるDNA鎖を有するデータベースのデータペイロード領域に出現した場合、アドレス配列は除外された(PCR)か、または除外されなかった(DORIS)。 2d、メソッド)。 解析を簡単にするために,計算コードワードを使用してデータペイロード領域を符号化した。 各符号語は別個のntシーケンスであり、1バイト(B)のデジタル情報を保持する。 データペイロード領域は、コードワードのサイズを小さくすることによって、より多くのコードワード(およびバイト)が各固定長ストランド内に収まるように、より多くのコードワード(およびバイト)を高密度にすることができる。 トレードオフは、コードワードが小さいほど、ストランドあたりのコードワード-コードワードジャンクションが多いため、ストランドの配列多様性(ストランド長あたりの可能な別個の配列の数)も増加するということである。 これにより、アドレスシーケンスと競合する類似のシーケンスがペイロードに表示される可能性が高くなります。
シミュレーションでは、アドレスシーケンスがペイロード内の任意のシーケンスと競合するかどうかを評価しました。 しかし、DORISでは、アドレスシーケンスがペイロードと競合していても、これらのアドレスは許可されていました。 したがって、シミュレーションでは、コードワード長を縮小することによってペイロード情報密度が増加するにつれて、DORISでは、他のアドレスと同様にすることができない以外のアドレスに制限が設けられていないため、利用可能なアドレス数は変化しないことが示された(図。 2d、左、ピンク)。 また、予想通り、ペイロード情報密度が増加するにつれて、ファイルアドレスの数がファイルあたりのストランドの総数と同じままであるため、データベース容量は単調に増加しました(図1)。 2d、右、ピンク)。 対照的に、PCRでは、任意のデータペイロードシーケンスに出現するアドレスは除外され、その結果、ペイロード情報密度を増加させることは、当初、全体的な容量に 2d、右、青)しかし、最終的には、ペイロードシーケンスと競合しなかったアドレスの数がすぐにゼロに低下したため、容量の壊滅的な低下につながった(図。 2d、左、青)。 アドレスあたりの個別のストランドの数を増やすことは可能ですが(つまり、 アドレスの損失を補うために、これは単一のシーケンスrun17でシーケンスされ、デコードされるには大きすぎるファイルになります。 また、我々のシミュレーションは非常に保守的なコードワード密度と109DNA鎖のみのデータベースサイズに基づいていたが、将来のストレージシステムは1012鎖以上を超える可能性が高いことに注意することも重要である。 データベースの密度とDNA配列スペースが増加するにつれて、PCRベースのシステムで使用可能なアドレスの数はさらに減少し、DORISは影響を受けません。 したがって、DORISが提供する理論的な容量と密度の改善は、シミュレーションで推定されているものよりも一桁大きい可能性があります。 さらに、DORISはアドレス設計を大幅に簡素化し、データペイロードシーケンスと相互作用しないPCRベースのシステム用の直交アドレスのセットを設計することは、大規模なデータベースサイズではすぐに計算上難治性になる。 要約すると、ss-dsdnaで構成されるデータベースは、ワンポット反応で効率的に作成することができ、ssDNAオーバーハングは、アドレス特異性を高め、理論的なデータベースの密度と容量を増加させる非PCRベースの分離方法を容易にする。
DORISは反復可能なファイルアクセスを可能にします
重要な要件ですが、ストレージシステムに動的プロパティを設計するための主な課題は、シ この研究では、ゲノムDNAの単一の永久コピーから転写のプロセスを介して情報が繰り返しアクセスされる自然の生物学的システムからインスピレーションを 図に示すように。 図3aに示すように、DORISでのダイナミックアクセスは、ビオチン連結オリゴとストレプトアビジンベースの磁気分離を用いて関心のあるファイル(ss-dsDNAsが同じオーバーハングアドレスを共有する)を物理的に分離し、DNAをRNA31にIN vitro転写(IVT)し、ファイルをデータベースに戻し、下流の分析または配列決定のためにRNAをcDNAに逆転写することから始まる。
このシステムは、三つのファイルデータベースを総称して表す三つの異なるss-dsdna(A、B、およびC)で実装され、ビオチン化オリゴA’でファ 3b&補足図。 4). 次に、「保持データベース」(光シェーディング)および「保持ファイル」(暗シェーディング)の量および組成を、qPCRによって測定した(Eq. (8)). 保存されたデータベースは、ファイルAのストランドの一部が磁気分離で削除されたため、Aと比較してファイルBとCのレベルが高かった。 保持されたファイルには、ほとんどがファイルAストランドが含まれており、最小のBまたはCが含まれていました。 ファイルAの高い保持率は、ファイルが複数回再アクセスされる可能性があることを示唆していました。 ファイルAに5回繰り返しアクセスすることでこれをテストし、各アクセス後にデータベース内のファイルA、B、Cの量と組成を測定しました(図10)。 3c&補足図。 4c)。 予想されるように、ファイルBとCの全体的な量は、データベース内で比較的安定したレベルに維持されました。 ファイルAストランドの約50%が五回のアクセス後に残った。 DNAストレージシステムのための実用的な意味は、(鎖分布の影響を無視して)アクセスされるすべての5回のための最初のデータベースに必要とされる各 これはデータベースの小さいaliquotsが取られ、増幅されるPCRベースのファイルアクセス上の改善である。 この場合、アクセスごとに個別のシーケンスのコピーが1つ必要になります; さらに、DORISとは異なり、他のすべてのデータベースファイルは、アクセスされていなくても、同様に豊富に減少します。 従って、DORISはDNAのデータベースの寿命を拡張し、総合されるDNAの同じ総質量のためのより頻繁なアクセスを可能にするかもしれません。次に、IVT反応は37℃の高温で行われ、ss-dsDNAを分解する可能性があるため、IVT反応がデータベースの安定性にどのように影響するかを尋ねました。
次に、IVT反応は、37℃の高温で行われ、ss-dsDNAを分解する可能性があります。 保持されたデータベースはIVTに公開されていませんが、アクセスされたファイルはivtに公開されており、保持されているss-dsDNAの量はIVTの長さに影響され 実際、RNAポリメラーゼの存在自体は、保持されたファイルに影響を及ぼさなかったが、IVT時間の長さは、保持されたファイルの量を減少させた(図1 0A)。 3b&補足図。 4a)。 興味深いことに、保持されたファイルを45℃で再アニールし、室温に戻すことを可能にすることは、保持率を改善したが、IVT時間を長くすると、全体的なファ 4b)。 これは、いくつかの損失は、いくつかの損失は、DNA分解によるものであるが、いくつかの損失は、ビーズリンクされたオリゴまたはSs-dsDNAと競合するRnaからの 転写されたRNAから生成されたcDNAをss−dsDNAが汚染していないことを確認するための対照として、RNAポリメラーゼがIVT反応に含まれた場合にのみcDNAが得られた( 4d)。次に、IVTの品質と効率を評価することに焦点を当てました。
RNAポリメラーゼが望ましくない切断または伸長された転写物を生成するかどうかを確認するために、本発明者らは、1 1 0〜1 8 0ntの範囲の長さを有する一連の6つのssDNAを注文した(図1 0A)。 図4a&補足図。 5). これらをs s−dsDNAに変換し、RNAに転写し、逆転写してdsdnaに増幅した。 S s-dsdna,RNA,およびdsdnaについては明確な均一なバンドが見られた。 IVT時間を増加させることは、全ての鋳型についてRNAの収率を増加させた(図1 0A)。 明確なRNAバンドを得るには、わずか2hで十分であったが(図4B)、(図4B)。 IVT時間は、生成されたRNAの長さに影響しなかった。 要約すると、情報は、オリゴベースの分離およびIVTによって、ss−dsDNAから繰り返しアクセスすることができる。