Dinâmico e escalável baseada em DNA de armazenamento de informação

ss-dsDNA vertentes podem ser eficientemente criado em um pote

Como futuros bancos de dados de DNA seria composto de mais de 1015 distintas strands17, primeiro perguntou se ss-dsDNAs poderia ser criado em uma alta taxa de transferência e de forma paralelizada. Nós ordenamos 160 nucleótidos (nt) DNAs de cadeia simples (ssDNA) com uma sequência comum de 23 nt que foi inset 20 nt do fim de 3′ (Fig. 1C e 2a, quadro Complementar 1). Esta sequência de 23 nt continha o promotor de RNA polimerase T7, mas também foi usado para ligar um primário comum para preencher e converter o ssDNA em um ss-dsDNA. Isto foi conseguido por vários ciclos de recozimento térmico e extensão da DNA polimerase (por exemplo, ciclos PCR, mas com apenas um iniciador). Isto resultou em fios ss-dsDNA com um 20 NT overhang (Fig. 2a, top). Nós otimizamos a razão de ssDNA para primer, o número de ciclos, juntamente com outros parâmetros ambientais(Fig. 2a, Suplemento Fig. 1) para maximizar a quantidade de ssDNA convertido para ss-dsDNA. Descobrimos que diminuir o ssDNA:a relação de primer passou de 1: 10 e conduziu a uma alteração gradual da quantidade de ss-dsDNA produzida quantificada pela electroforese em gel (Fig. suplementar. 1b). Decidimos trabalhar de forma conservadora com uma razão de 1:20 ssDNA: primer. Nessa proporção, descobrimos que apenas 4 ciclos PCR eram necessários para converter o ssDNA em ss-dsDNA, como visto pela mudança para cima no gel de DNA (Fig. 2a).

Fig. 2: DORIS elimina interações não específicas e aumenta a densidade e os limites de capacidade.
figure2

uma única extensão de primer criou ss-dsDNAs. (Bottom) 4 ciclos de PCR geraram a quantidade ideal de 160 NT ss-dsDNAs ao mesmo tempo em que minimizam o excesso de produção de ssDNA. O gel de ADN mostrou um aumento marcado na geração de ss-dsDNAs abaixo de 1:10 razões de primer de ssDNA. B os arquivos individuais podem ser separados de um banco de dados de três arquivos criado por uma extensão de um pote único primer. Cada arquivo estava vinculado por sua correspondente oligo ligado à biotina, seguido por uma separação não baseada em PCR usando contas magnéticas funcionalizadas. Especificidade de separação de arquivos é a porcentagem do DNA separado por que ou é arquivo a, B, ou C como medida por qPCR. a PCR C (esquerda), mas não a DORIS, permitirá que oligos vinculem locais internos fora do alvo e produzam produtos indesejáveis. Géis de ADN e fluorescência quantificada (azul para PCR, cor-de-rosa para DORIS) mostraram que o acesso à PCR resultou em amplicons truncados e indesejáveis, enquanto DORIS acedia apenas aos fios desejados. D (Esquerda) as simulações de Monte Carlo estimaram o número de oligos encontrados que não interagem entre si ou a carga útil de dados. 400.000 oligos foram testados contra diferentes codificações de densidade. O eixo x representa densidade (Eq. (4)), que está inversamente relacionado com o comprimento das palavras-Código utilizadas para armazenar valores discretos de dados de um byte. Avaliamos comprimentos de palavras de código de 12 a 4. Para DORIS, a densidade de codificação não foi impactada porque não precisa se proteger contra a ligação indesejada entre os oligos e cargas de dados. (Direito) para a PCR, o número de oligos que não irão vincular a carga útil de dados diminui à medida que a densidade da cadeia aumenta, o que significa que menos arquivos podem ser armazenados, levando a uma menor capacidade global do sistema. Para DORIS, a disponibilidade de oligos é independente da codificação, e a capacidade, portanto, aumenta com codificações mais densas. Os valores plotados representam a média aritmética e as barras de erro representam a S. D. de três separações ou simulações de ficheiros replicados. As imagens de Gel são representativas de três experimentos independentes medidos por RT-QPCR. Os dados de fonte são fornecidos como um arquivo de dados de fonte. * As capacidades podem ser limitadas por limitações de síntese e sequenciação não contabilizadas aqui.

a seguir, testamos se este método poderia ser usado para criar 3 ss-dsDNAs distintas em reações de um pote e se cada ss-dsDNA poderia então ser especificamente separado da mistura (Fig. 2b). Nós misturamos 3 ssDNAs distintas” A”,” B”, E ” C ” juntos, adicionamos o primer comum, e realizamos 4 ciclos PCR para criar os ss-dsDNAs (aqui referidos como arquivos compostos de apenas uma única cadeia cada). Usámos 20 oligos de ADN ligados à biotina para ligar cada ss-dsDNA (i.e., cada arquivo, a, B, E C tem uma sequência de overhang distinta ou endereço de arquivo) e separou – os da mistura usando contas magnéticas funcionalizadas com streptavidin. Cada um destes oligos foram capazes de separar especificamente apenas seu arquivo correspondente sem os outros dois(Fig. 2b, bottom, Eq. (1)). Importante, esta etapa de separação poderia ser realizada à temperatura ambiente (25 ° C) com apenas ganhos mínimos observados a temperaturas de recozimento oligo mais elevadas de 35 ou 45 °C (Fig. suplementar. 2, Eq. (2)). A temperatura ambiente e a natureza isotérmica desta etapa é útil para sistemas práticos de armazenamento de DNA e para reduzir a degradação do DNA.

enquanto 20 nt é um comprimento padrão da primer PCR, perguntamos se a eficiência de separação poderia ser modulada por diferentes comprimentos e temperaturas de separação. Nós projetamos 5 ss-dsDNAs com 5-25 NT overhangs (Supplementary Fig. 3). Em seguida, separamos cada cadeia usando o seu oligo específico ligado à biotina a 15-55 ° C. Observamos maior eficiência de separação para oligos maiores (20mers e 25mers) e a temperaturas mais baixas (15 °C e 25 °C, Figo suplementar. 3b). This was in agreement with a thermodynamic analysis using the Oligonucleotide Properties Calculator(Supplementary Fig. 3c, Methods, Eqs. (3)–(5))28,29,30.

DORIS aumenta a densidade e os limites de capacidade

uma vantagem potencial das separações de temperatura ambiente de arquivos é que as porções de cadeia dupla das ss-dsDNAs permanecem recozidas juntas e podem bloquear a ligação oligo indesejado a quaisquer sequências semelhantes nas regiões de carga de dados. A região de carga útil de dados é a maior parte da sequência no meio do ss-dsDNAs que contém a informação armazenada. Para testar esta hipótese, criamos duas ss-dsDNAs (Fig. 2c). Um ss-dsDNA tinha um overhang que ligava oligo a’ e um local de ligação interno para oligo B’. Verificámos experimentalmente que, usando a DORIS, só o oligo A’ mas não o oligo B’ poderia separar a cadeia. Para comparação, sistemas baseados em PCR derretem dsDNAs em cada ciclo, permitindo que os iniciadores se vinculem ao off-target dentro da carga útil de dados. Tal como previsto, quando foi utilizada a PCR, tanto a oligo a’ como a oligo B’ ligavam-se, com a oligo B’ produzindo produtos truncados indesejáveis. A segunda vertente que testámos tinha um local de ligação interno e um overhang que ambos eram complementares ao oligo C’. Nós mostramos que usando DORIS, oligo c ‘ rendeu apenas o fio de comprimento completo. Em contrapartida, ao utilizar PCR, o oligo c’ criou cadeias de comprimento total e truncadas.em seguida, perguntamos quais as implicações que esta propriedade de bloqueio de DORIS tinha para o armazenamento de informações baseadas no DNA. À medida que as bases de dados aumentam de tamanho, intuitivamente a probabilidade de sequências idênticas a sequências de endereçamento (tanto overhangs para DORIS quanto primer sites para PCR) aparecendo em regiões de carga de dados aumenta. Com DORIS, este não é um problema, pois oligos são bloqueados de vincular as regiões de carga de dados dsDNA. No entanto, em PCR, os iniciadores ligam essas regiões de carga de dados, então abordagens anteriores desenvolveram algoritmos de codificação que restringem sequências de iniciadores (endereços) de sobreposição com qualquer sequência idêntica ou similar nos dados payloads11,12, tipicamente evitando distâncias de Hamming dentro ~<6. Isto reduz inerentemente a densidade com que as bases de dados podem ser codificadas devido a restrições no espaço de sequência de carga de dados, ou a sua capacidade devido a uma redução no número de sequências de iniciadores únicas que podem ser usadas. Densidade é a quantidade de informação armazenada por nt (Eq. (6)), e diminui à medida que as restrições de codificação são colocadas limitando as sequências que podem ser usadas na região de carga útil (espaço de sequência de menor diversidade), enquanto a capacidade é a quantidade total de informação que pode ser armazenada em um sistema (Eq. (7)) e depende do número de endereços disponíveis como eles ditam o número de arquivos que podem ser armazenados.

para mostrar quantitativamente essas relações, é atualmente intratável para resolver analiticamente ou computar de forma abrangente o número de endereços disponíveis que não interagem com a região de carga de dados, mesmo para bases de dados de tamanho moderado. Portanto, realizamos simulações de Monte Carlo para estimar o número total de endereços e capacidades totais alcançáveis. Sequências de endereços foram (PCR) ou não foram (DORIS) excluídas se elas apareceram nas regiões de carga útil de dados de uma base de dados com 109 cadeias de DNA distintas (Fig. 2d, Methods). Para simplificar a análise, usamos códigos computacionais para codificar a região de carga útil de dados. Cada palavra de código é uma sequência nt distinta e possui um byte (B) de informação digital. A região de carga útil de dados pode ser feita mais informação densa, reduzindo o tamanho das palavras-código para que mais palavras-código (e bytes) se encaixem dentro de cada cadeia de comprimento fixo. O tradeoff é que as palavras-Código menores também aumentarão a diversidade sequencial das cadeias (o número de possíveis sequências distintas por comprimento da cadeia) devido a mais junções de palavra-código por cadeia. Isso aumenta a chance de sequências similares aparecerem na carga que entram em conflito com sequências de endereços.

a simulação avaliou se as sequências de endereços entrariam em conflito com quaisquer sequências na carga útil. No entanto, para DORIS, mesmo que sequências de endereços entrem em conflito com a carga útil, esses endereços foram permitidos. A simulação, portanto, mostrou que como a densidade de informação da carga útil foi aumentada pela encolhimento do comprimento da palavra de código, o número de endereços disponíveis não mudou para DORIS como nenhuma restrição foi colocada em endereços que não foram autorizados a ser semelhantes a outros endereços (Fig. 2d, esquerda, rosa). Também como esperado, como a densidade de informação da carga útil aumentou, a capacidade da base de dados aumentou monotonicamente, como o número de endereços de arquivo permaneceu o mesmo que o número total de cadeias por arquivo (Fig. 2d, direita, rosa). Em contraste, para PCR, endereços que apareceram em qualquer sequência de carga útil de dados foram excluídos; o resultado foi que o aumento da densidade de informação de carga útil inicialmente forneceu um benefício menor para a capacidade global (Fig. 2d, direito, azul) mas eventualmente levou a uma queda catastrófica na capacidade como o número de endereços que não entra em conflito com qualquer sequência de carga rapidamente caiu para zero (Fig. 2d, left, blue). Embora seja possível aumentar o número de linhas distintas por endereço (i.e., informações por arquivo) para compensar a perda de endereços, isso resultaria em arquivos muito grandes para serem sequenciados e descodificados em uma única sequência run17. É também importante notar que as nossas simulações se basearam em densidades de palavras-Código muito conservadoras e num tamanho de base de dados de apenas 109 cadeias de ADN, enquanto os futuros sistemas de armazenamento são susceptíveis de exceder 1012 cadeias ou mais. À medida que as densidades de banco de dados e os espaços de sequência de DNA aumentam, o número de endereços disponíveis para sistemas baseados em PCR irá cair ainda mais, enquanto DORIS não será afetada. Portanto, a capacidade teórica e as melhorias de densidade que DORIS fornece podem ser ordens de magnitude maior do que o estimado em nossas simulações. Além disso, DORIS simplifica muito o design de endereços; projetar conjuntos de endereços ortogonais para sistemas baseados em PCR que não interagem com sequências de carga de dados irá rapidamente se tornar computacionalmente intratável em grandes tamanhos de banco de dados. Em resumo, um banco de dados composto por ss-dsDNAs pode ser eficientemente criado em reações de um pote, e os overhangs ssDNA facilitam um método de separação não baseado em PCR que aumenta a especificidade de endereço e aumenta as densidades e capacidades teóricas do banco de dados.

DORIS permite o acesso repetível a arquivos

uma exigência chave, mas o maior desafio para a engenharia de propriedades dinâmicas em sistemas de armazenamento é a reutilização do sistema. Neste trabalho, nós nos inspiramos em sistemas biológicos naturais onde a informação é repetidamente acessada a partir de uma única cópia permanente de DNA genômico através do processo de transcrição. Como mostrado na Fig. 3a, acesso dinâmico em DORIS começa separando fisicamente um arquivo de interesse (ss-dsDNAs compartilhando o mesmo balanço endereço) usando biotina ligada oligos e estreptavidina-com base separação magnética, in vitro transcrever (FPI) o DNA para RNA31, retornando o arquivo para o banco de dados, e inversa transcrever o RNA em cDNA para fins de análise ou de seqüenciamento.

Fig. 3: DORIS imita a transcrição natural para acessar repetidamente a informação.
figueiraura3

um Arquivo foi separado para uso não-baseados em PCR separação magnética enquanto o banco de dados foi recuperado (Mantido Banco de dados) (n = 3 para cada condição). A transcrição in vitro, baseada em T7, foi realizada directamente no ficheiro imobilizado em contas, até 48 h para gerar ARN. A transcrição reversa converteu o RNA em DNA complementar (cDNA) enquanto o arquivo a imobilizado foi liberado de volta para o banco de dados (Arquivo retido) (n = 3 para cada condição). b a quantidade de banco de dados retido (sombreamento de luz) e arquivo retido (sombreamento escuro) após o arquivo A foi acessado por oligo a’ foi medido por qPCR e plotado como uma porcentagem da quantidade original de cada arquivo que estava na base de dados. A especificidade do acesso aos ficheiros é evidente pela ausência dos ficheiros B E C no ficheiro retido. A presença de ARN polimerase T7 (RNAP) não afectou a retenção do ficheiro A. C File A foi acessado repetidamente 5 vezes. As quantidades de arquivo A, B e C no banco de dados foram medidos por acordo com pcr e plotados como a quantidade de cada arquivo no banco de dados após cada execução (n = 3 para cada condição), normalizada para o valor original de cada arquivo antes de 1º de acesso. Os valores representam a média aritmética. As barras de erro são s. d., n = O número de acessos de ficheiros replicados. Os dados de fonte são fornecidos como um arquivo de dados de fonte.

implementámos este sistema com três ss-dsDNAs distintas (A, B E C) representando colectivamente uma base de dados de três ficheiros, e acedemos ao ficheiro a com um oligo biotinilado a’ (Fig. 3b & Figo suplementar. 4). Em seguida, medimos as quantidades e composições do ” retained database “(sombreamento de luz) e” retained file ” (sombreamento escuro) por qPCR (Eq. (8)). O banco de dados retido tinha níveis mais elevados de arquivos B E C em comparação com a, como alguns dos fios de arquivo A foram removidos na separação magnética. O arquivo retido continha principalmente arquivo a cadeias, com mínimo B ou C. A melhor quantidade total líquida de arquivo a recuperado do banco de dados retido e arquivo retido foi de aproximadamente 90% do que estava originalmente no banco de dados. A alta taxa de retenção do arquivo a sugeriu que um arquivo poderia ser re-acessado várias vezes. Testamos isso acessando repetidamente o arquivo cinco vezes, e medimos as quantidades e composições do arquivo a, B E C no banco de dados após cada acesso (Fig. 3c & Figo suplementar. 4c). Como previsto, os montantes globais dos ficheiros B E C foram mantidos a níveis relativamente estáveis na base de dados. Cerca de 50% dos fios file A permaneceram após cinco acessos. As implicações práticas para os sistemas de armazenamento de DNA é que apenas 2 cópias de cada sequência distinta são necessárias no banco de dados inicial para cada 5 vezes que é acessado (ignorando os efeitos das distribuições de strand). Isto é uma melhoria em relação ao acesso de arquivos baseados em PCR, onde pequenas alíquotas da base de dados são tomadas e amplificadas. Neste caso, é necessária uma cópia de cada sequência distinta para cada acesso; além disso, ao contrário de DORIS, todos os outros arquivos de banco de dados serão igualmente reduzidos em abundância, mesmo que eles não foram acessados. Assim, DORIS pode estender o tempo de vida das bases de dados de DNA e permitir um acesso mais frequente para a mesma massa total de DNA sintetizado.

We next asked how the IVT reaction might affect database stability, as it is performed at an elevated temperature of 37 °C and could degrade the ss-dsDNA. Embora a base de dados retida não esteja exposta ao IVT, o arquivo acessado é, e a quantidade de ss-dsDNA retida pode ser afetada pelo comprimento do IVT. De facto, embora a presença da ARN polimerase em si não tenha tido qualquer efeito no ficheiro retido, o período de tempo de FIV diminuiu a quantidade de ficheiro retido (Fig. 3b & Figo suplementar. 4a). Curiosamente, reanalisar o arquivo retido a 45 ° C e permitir que ele arrefeça de volta para a temperatura ambiente melhorou a taxa de retenção, mas tempos mais longos IVT ainda reduziu a retenção geral de arquivos (Fig. suplementar. 4b). Isto sugere que alguma perda é devido às cadeias de arquivo desanuviando a partir de oligos ligados à bead ou RNAs competindo com ss-dsDNA, enquanto alguma perda é devido à degradação do DNA. Como um controle para confirmar que ss-dsDNA não estava contaminando cDNA gerado a partir do RNA transcrito, cDNA foi obtido apenas quando a RNA polimerase foi incluída na reação IVT (Fig. suplementar. 4d).em seguida, concentrámo-nos na avaliação da qualidade e eficiência da FIV. Para verificar se a RNA polimerase pode estar criando transcrições truncadas ou alongadas indesejáveis, ordenamos uma série de seis ssDNAs com uma gama de comprimentos abrangendo 110-180 nt (Fig. 4a & Supplementary Fig. 5). Estes foram convertidos em ss-dsDNA, transcritos em RNA, e transcritos reversos e amplificados em dsDNA. Bandas uniformes claras foram vistas para ss-dsDNA, RNA e dsDNA. O aumento do tempo de FIV aumentou a produção de RNA para todos os modelos (Fig. 4b), embora apenas 2 h fosse suficiente para obter Bandas de RNA claras(Fig. 4c), e o tempo de FIV não afetou o comprimento do RNA gerado. Em resumo, a informação pode ser acessada repetidamente a partir de ss-dsDNAs por separação baseada em oligo e IVT.

Fig. 4: a transcrição baseada em T7 gera produtos de tamanho uniforme.
figura4

Seis ssDNA oligos com diferentes comprimentos foram projetados para gerar seis ss-dsDNA modelos com comprimentos de 180 bp, 160 bp, 140 bp, 130 bp, 120 bp e 110 bp, respectivamente. Cada ss-dsDNA compreendia uma sequência de ligação reversa consensual, sequência de ligação de primer T7, sequência de ligação de primer forward, e uma sequência de carga útil com diferentes comprimentos. Estes modelos ss-dsDNA foram transcritos in vitro para 8 h, seguido de RT-PCR. As dimensões dos produtos foram examinadas pela electroforese em gel de agarose. B Curso de tempo de FIV para até 48 h (N = 3 replicar reacções de FIV para cada condição). A quantidade de moléculas template de RNA e DNA foram medidas por Nanodrope e plotadas como sua razão. c electroforese em Gel de produtos ARN e dsDNA após 2-48 h de IVT, seguida de RT-PCR. Os valores plotados representam a média aritmética, e as barras de erro representam a S. D., de três reacções IVT independentes. Imagens de Gel são representativas para três experimentos independentes medidos por RT-QPCR. Os dados de fonte são fornecidos como um arquivo de dados de fonte.

a Transcrição pode ser ajustado pelo promotor sequência

trabalhos Recentes sobre molecular de armazenamento de informação têm demonstrado a utilidade de armazenar informações adicionais sobre a composição de misturas de diferentes moléculas, incluindo DNA32,33. Como a informação acessada por DORIS se baseia na polimerase de RNA T7, e existem evidências de que as variantes promotoras de T7 podem afetar a eficiência de transcrição 34,35,36,37,38, perguntamos se o Rendimento da transcrição baseada em T7 poderia ser modulado por sequências nucleotídicas específicas em torno da região promotora de T7, mantendo o próprio promotor constante para permitir a geração ss-dsDNA de um pote (Fig. 2a, b). Para abordar esta questão de forma abrangente, nós projetamos e encomendamos 1088 diferentes 160 nt como um pool de oligo. As primeiras 1024 cadeias continham todas as possíveis 5 variantes nt sequências a montante da sequência do promotor (nnnn-Promotor, n é cada um dos quatro nucleótidos), e as últimas 64 sequências eram todas as 3 variantes nt sequências a jusante do promotor (Promotor-NNN, Fig. 5a). Como os nucleotídeos nnnn estavam localizados no ssDNA overhang, nós também perguntamos se esta região de cadeia única versus dupla cadeia teve qualquer impacto sobre as eficiências transcritionais relativas. Nós criamos ss-dsDNA pela Primer extension e dsDNA pela PCR do ssDNA oligo pool. Ambas as bases de dados ss-dsDNA e dsDNA foram processadas com IVT a 37 ° C por 8 h, seguido por RT-PCR e sequenciação de próxima geração. Códigos de barras curtos foram projetados na região de carga útil para identificar qual variante promotor cada transcrição sequenciada foi derivada.

Fig. 5: a eficiência de transcrição baseada em T7 pode ser controlada por sequências circundantes.
a figura5

um oligo piscina que tinha 1088 distintas sequências foi projetado para gerar ss-dsDNA modelos. As primeiras 1024 sequências continham todas as combinações possíveis de nucleótidos a montante da sequência Promotora (NNNNN-T7, em que N é um dos quatro nucleótidos do ADN), enquanto as últimas 64 sequências tinham todas as combinações possíveis de nucleótidos a jusante da região promotora (T7-NNN). Cada sequência continha um código de barras para identificar a sequência dos nucleótidos variantes. O modelo ss-dsDNAs foi processado com IVT por 8 h, seguido por RT-PCR e sequenciação de próxima geração (n = 3 para cada condição). as eficiências de transcrição b de ambos os projetos de seqüência foram traçadas normalizando a contagem de leitura de cada cadeia transcrita para a sua abundância na biblioteca original. Os dados foram organizados da menor para a maior abundância normalizada para ambos os projetos. c As sequências foram ainda divididas em quatro quartis com base na abundância de transcrições normalizadas e analisadas pela ferramenta WebLogo. d A abundância normalizada de cada sequência foi organizada por uma porcentagem de A / T. Os valores de P entre cada grupo foram calculados usando uma ANOVA de ida com Tukey-Kramer post-hoc e listados aqui para significância estatística. NNNNN-T7: valores de p menor que 0,01 para comparações entre 0%-100%, 80%-100% e 20%-80%; os valores de p menor que 0,001 para comparação entre 20%-100%, 40%-80%, 40%-100%, 60%-80% e 60%-100%; T7-NNN, os valores de p menor que 0,05 para a comparação entre 33%-100%, 0%-100% e 0%-66%. e o erro percentual para cada posição de sequência de DNA para o banco de dados sintetizado original (esquerda) e banco de dados transcrito (direita). A taxa de erro foi calculada dividindo o número de erros de um dado tipo ocorrendo em uma posição nucleotídica pelo número total de leituras para essa sequência (método suplementar). Os valores plotados representam a média aritmética, e as barras de erro representam a S. D., de três amostras independentes de IVT-RT-PCR-NGS. Os dados de fonte são fornecidos como um arquivo de dados de fonte.

a abundância de cada sequência transcrita distinta foi normalizada à sua abundância no ss-dsDNA original (Fig. 5b) ou dsDNA (Figo suplementar. 6A) base de dados (NQA) (9)). Uma ampla e quase contínua gama de abundâncias normalizadas foi obtida, indicando que esta abordagem poderia ser aproveitada para criar misturas complexas de composição de DNA no futuro. Para determinar se pode haver princípios de design simples descrito promotor de eficiência, nós segmentado o 1088 sequências em quartis, com base em transcrição abundância e importados os dados para o WebLogo tool39. Descobrimos que G ou A na 5ª posição diretamente a montante e C ou T na 3ª posição diretamente a jusante do promotor T7 geralmente resultou na maior abundância de RNA(Fig. 5c). A segmentação dos dados por um conteúdo a/T mostrou que havia uma ligeira preferência por ~50% A/T A Montante do promotor T7 e preferência por um conteúdo a/T globalmente baixo a jusante do promotor T7 (Fig. 5d).

esta experiência de sequenciamento de próxima geração também forneceu confiança de que DORIS é escalável para grandes e complexas piscinas ss-dsDNA. Além disso, a análise de erro das leituras de sequenciamento indicou que não houve deleções sistemáticas, truncações ou substituições, e os níveis de erro globais estavam bem abaixo dos já presentes a partir da síntese de DNA (Fig. 5e).

DORIS permite operações de arquivos de armazenamento

muitos sistemas de armazenamento de informação inorgânicos, mesmo arquivos de armazenamento frio, manter a capacidade de manipular dinamicamente arquivos. Capacidades semelhantes em sistemas baseados no ADN aumentariam significativamente o seu valor e competitividade. ssDNA overhangs têm sido usados anteriormente para executar computações no contexto de toehold switches40,41,42, 43, e, portanto, hipotetizamos que eles poderiam ser usados para implementar operações de arquivos em armazenamento. Como prova de princípio, implementamos o bloqueio, desbloqueio, renomeação e exclusão de arquivos e mostramos que essas operações poderiam ser realizadas à temperatura ambiente (Fig. 6).

Fig. 6: Os suportes permitem as operações dos ficheiros de armazenamento.
figure6

a (Top) esquemático de bloquear e desbloquear as operações dos ficheiros de armazenamento. (Bottom) tenta acessar arquivo A por DORIS sem bloqueio (Sem bloqueio), com bloqueio mas sem chave( sem chave), ou com bloqueio e chave adicionados a diferentes temperaturas (laranja) (n = 3 para cada condição). A fechadura foi adicionada a 98 ° C. A chave foi adicionada a diferentes temperaturas (laranja) e depois arrefecida a 14 °C (n = 3 para cada condição). Oligo a’ foi adicionado a diferentes temperaturas de acesso de 25, 35, 45 ou 75 ° C durante 2 minutos, seguido de uma queda de temperatura de 1 °C/min para 25 °C (n = 3 para cada condição). Eficiência de separação é a quantidade de arquivo a recuperado em relação à sua quantidade original, medida por qPCR. esquema b (superior) das operações de mudança de nome e remoção. O ficheiro a foi modificado ao mudar o nome ou apagar oligos. (Bottom) a conclusão de cada operação foi testada medindo a quantidade do arquivo separado por cada oligoeligo individual: A’, B’, ou C’. Eficiência de separação é a quantidade de arquivo a separado em relação à sua quantidade original na base de dados, como medida por qPCR. Sem Mod (sem modificação/operação do ficheiro). Os valores plotados representam a média aritmética e as barras de erro representam a S. D. de três operações/separações de ficheiros replicados independentes. Os dados de fonte são fornecidos como um arquivo de dados de fonte.

começámos com a base de dados de três ficheiros e testámos a capacidade de um oligo A ligado à biotina ligar e separar o ficheiro a a uma gama de temperaturas de 25 a 75 °C (Fig. 6a, bottom, no lock). Cerca de 50% do arquivo a foram separados com sucesso da base de dados. Para bloquear o arquivo A, separamos o arquivo A do banco de dados de três arquivos e misturamos em um longo 50 nt ssDNA (lock) que tinha uma seqüência complementar de 20 nt para o overhang ssDNA do arquivo A. Com o lock no lugar, oligo a’ não era mais capaz de separar o arquivo, exceto a temperaturas superiores a 45 °C (Fig. 6a, bottom, no-key), presumably because the lock was melted from the overhang, allowing for oligo a’ to competing to bind the overhang. Para desbloquear o arquivo, adicionamos a chave que era um ssDNA 50 nt totalmente complementar ao bloqueio. Testamos diferentes temperaturas de desbloqueio e descobrimos que a chave foi capaz de remover a fechadura à temperatura ambiente com a mesma eficiência que em temperaturas mais altas. Isto é provável devido ao longo 30 nt toehold apresentado pelo bloqueio, permitindo a chave para abrir o bloqueio do arquivo A. Nós também otimizamos as razões molar relativas (arquivo a: lock: chave: oligo A’ = 1: 10: 10: 15) para minimizar a separação fora do alvo e garantir o bloqueio adequado. Observamos que a temperatura a que o bloqueio foi adicionado influenciou a fidelidade do processo de bloqueio. A 98 ° C, o processo de bloqueio funcionou bem. Quando a fechadura foi adicionada a 25 ° C, houve separação por fuga mesmo quando nenhuma chave foi adicionada (Fig. suplementar. 7). Isto pode ser devido a estruturas secundárias impedindo alguns file a cadeias de hibridação com fechaduras a baixas temperaturas. Felizmente, fecho a 45 °C teve um desempenho razoável, evitando, assim, a necessidade de elevar o sistema para 98 °C. No contexto de um futuro de DNA sistema de armazenamento de arquivos pode primeiro ser separados, em seguida, bloqueado em uma temperatura elevada, em seguida, voltou para o banco de dados, evitando, assim, a exposição do banco de dados inteiro para temperaturas elevadas. De outra forma, todo o processo poderia ser realizado à temperatura ambiente.

também implementámos a mudança de nome e remoção de ficheiros. Para mudar o nome de um arquivo com o endereço A para ter o endereço B, misturamos o arquivo a com um ssDNA 40 nt que se liga a A, com o overhang resultante sendo o endereço B(Fig. 6b). Adicionamos todos os componentes em proporções similares ao processo de bloqueio (arquivo: renomeando oligo: acessando oligo = 1: 10: 15) e o oligo renomeado foi adicionado a 45 ° C. Nós testamos então quantos fios de arquivo cada oligo A’, B’, ou C’ poderia separar e descobriu que o processo de renomeação completamente bloqueado oligos A’ ou C’ de separar o arquivo (Fig. 6b, bottom). Somente oligo B ‘ foi capaz de separar o arquivo sugerindo que quase todas as cadeias foram renomeadas com sucesso de A Para B. similarmente, nós renomeamos com sucesso file A Para C. Baseado na capacidade de oligos para renomear arquivos com quase 100% de completação, nós hipotetizamos e de fato descobrimos que um pequeno 20 nt oligo totalmente complementar A A poderia ser usado para bloquear completamente o overhang do arquivo a e essencialmente excluí-lo do banco de dados (Fig. 6b, bottom). Um arquivo também pode ser simplesmente extraído de um banco de dados para apagá-lo também. No entanto, esta forma alternativa de eliminação baseada em bloqueio sugere uma maneira de garantir que quaisquer sobras de arquivos que não foram completamente extraídos não seria acessado com espúria no futuro.

Related Posts

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *