dynaaminen ja skaalautuva DNA-pohjainen tiedon tallennus

SS-dsDNA-säikeet voidaan tehokkaasti luoda yhdellä potilla

koska tulevat DNA-tietokannat koostuisivat ylöspäin 1015 erillisestä strands17: stä, kysyimme ensin, voisiko SS-dsdnat luoda suurella läpimenokyvyllä ja parallelized tavalla. Tilasimme 160 nukleotidi (nt) yksijuosteinen DNAs (ssDNA) yhteinen 23 nt sekvenssi, joka oli inset 20 nt alkaen 3′ loppuun (kuva. 1c ja 2a, täydentävä Taulukko 1). Tämä 23 nt-sekvenssi sisälsi T7 – RNA-polymeraasipromoottorin, mutta sitä käytettiin myös yhteisen primerin sitomiseen ssDNA: n täyttämiseksi ja muuntamiseksi SS-dsDNA: ksi. Tämä saavutettiin useilla lämpöhehkutus-ja DNA-polymeraasilaajennussykleillä (esim.PCR-sykleillä, mutta vain yhdellä primerilla). Tämä johti SS-dsDNA-säikeisiin, joissa oli 20 nt ylitys (Kuva. 2A, ylhäällä). Olemme optimoitu suhde ssDNA pohjamaali, syklien määrä, yhdessä muiden ympäristöparametrit (Kuva. 2a, täydentävä Kuva. 1)maksimoida ssDNA muunnetaan SS-dsDNA. Löysimme, että vähentämällä ssDNA:primer suhde ohi 1: 10 johti vaiheen muutos määrä SS-dsDNA tuotettu quantified geelielektroforeesilla (täydentävä Kuva. 1b). Päätimme varovaisesti työskennellä 1:20 ssDNA: primer suhde. Tässä suhteessa havaitsimme, että ssDNA: n muuttamiseen SS-dsDNA: ksi tarvittiin vain 4 PCR-sykliä, mikä näkyy DNA-geelin ylöspäin suuntautuvana muutoksena (Kuva. 2 a).

Fig. 2: DORIS poistaa epäspesifiset vuorovaikutukset ja lisää tiheyden ja kapasiteetin rajoja.
figure2

yksi primer-laajennus loi ss-dsdnat. (Bottom) 4 sykliä PCR tuotti optimaalisen määrän 160 nt ss-dsDNAs minimoiden ylimääräinen ssDNA tuotanto. (Oikealla) DNA geeli osoitti huomattavaa kasvua sukupolven SS-dsDNAs alle 1:10 ssDNA:primer suhteet. B yksittäiset tiedostot voidaan erottaa kolmen tiedoston tietokannasta, joka on luotu yhden potin yhden primer-laajennuksella. Jokainen tiedosto sidottiin vastaavalla biotiinisidoksisella oligolla, jota seurasi ei-PCR-pohjainen erottaminen funktionalisoiduilla magneettihelmillä. File separation specificity on prosenttiosuus DNA erotettu, joka on joko tiedosto A, B tai C mitattuna qPCR. c (vasemmalla) PCR, mutta ei DORIS, antaa oligoille mahdollisuuden sitoa sisäisiä kohteita ja tuottaa ei-toivottuja tuotteita. (Keskellä) DNA-geelit ja (oikealla) niiden määritellyt fluoresenssit (sininen PCR: lle, vaaleanpunainen DORIKSELLE) osoittivat, että PCR: ään perustuva käyttö johti typistettyihin ja ei-toivottuihin amplikoneihin, kun taas DORIS käytti vain haluttuja säikeitä. d (vas.) Monte Carlon simulaatiot arvioivat löydettyjen oligojen määrän, jotka eivät ole vuorovaikutuksessa keskenään tai datan hyötykuorman kanssa. 400 000 oligoa testattiin erilaisia tiheyskoodauksia vastaan. X-akseli edustaa tiheyttä (ekv. (4)), joka on kääntäen verrannollinen niiden koodisanojen pituuteen, joita käytetään erillisten yhden tavun tietojen tallentamiseen. Arvioimme koodisanojen pituudet 12: sta 4: ään. Doriksen osalta koodaustiheyteen ei ollut vaikutusta, koska sen ei tarvitse varoa oligojen ja datan hyötykuormien välistä epätoivottua sidontaa. (Right) PCR: ssä niiden oligojen määrä, jotka eivät sido tietojen hyötykuormaa, laskee, kun säikeiden tiheys kasvaa, mikä tarkoittaa, että vähemmän tiedostoja voidaan tallentaa, mikä johtaa alhaisempaan järjestelmän kokonaiskapasiteettiin. DORIKSELLA oligosin saatavuus on riippumaton koodauksesta, ja kapasiteetti siis kasvaa tiheämmillä koodauksilla. Piirretyt arvot edustavat aritmeettista keskiarvoa, ja virhepalkit edustavat s.D.: tä, kolmesta toistettavasta tiedostoerotuksesta tai simulaatiosta. Geelikuvat edustavat kolmea RT-QPCR: n mittaamaa riippumatonta koetta. Lähdeaineisto annetaan lähdeaineistona. * Kapasiteettia voidaan rajoittaa synteesi-ja sekvensointirajoituksilla, joita ei ole otettu tässä huomioon.

seuraavaksi testasimme, voitaisiinko tällä menetelmällä luoda 3 erillistä SS-dsdnaa yhden potin reaktioissa ja voitaisiinko jokainen SS-dsDNA sitten erikseen erottaa seoksesta (Kuva. 2b). Sekoitimme 3 erillistä ssDNAs ”A”, ”B”, ja ” C ” yhdessä, lisätään yhteinen primer, ja suoritetaan 4 PCR syklit luoda ss-dsDNAs (tässä kutsutaan tiedostoja koostuu vain yksi ainutlaatuinen strand kukin). Tämän jälkeen käytimme biotiinisidonnaisia 20 nt DNA-oligoja jokaisen SS-dsDNA: n sitomiseen (ts., jokaisella tiedostolla, A, B ja C on erillinen ylitysjärjestys tai tiedoston osoite) ja erotti ne seoksesta käyttämällä magneettisia helmiä, jotka on funktionalisoitu streptavidiinilla. Kukin näistä oligoista pystyi erikseen erottamaan vain vastaavan tiedostonsa ilman kahta muuta (Fig. 2B, pohja, ekv. (1)). Tärkeää on, että tämä erotteluvaihe voidaan suorittaa huoneenlämmössä (25 °C) vain minimaalisilla voitoilla, joita havaitaan korkeammissa oligo-hehkutuslämpötiloissa 35 tai 45 °C (täydentävä Kuva. 2, ekv. (2)). Tämän vaiheen huoneenlämpötilasta ja isotermisestä luonteesta on hyötyä käytännön DNA: n varastointijärjestelmissä ja DNA: n hajoamisen vähentämisessä.

vaikka 20 nt on tavallinen PCR-pohjuspituus, kysyimme, voisiko erotustehokkuutta moduloida erilaisilla ylityspituuksilla ja erotuslämpötiloilla. Suunnittelimme 5 SS-dsdnaa, joissa oli 5-25 nt-ylitys (Supplementary Fig. 3). Sen jälkeen erotimme jokaisen juosteen käyttäen sen spesifistä biotiinisidonnaista oligoa 15-55 °C: n lämpötilassa. Havaitsimme parannettu erotustehokkuus enää oligos (20mers ja 25mers) ja alemmissa lämpötiloissa (15 °C ja 25 °C, täydentävä Kuva. 3b). Tämä oli yhtäpitävä oligonukleotidiominaisuuslaskimella tehdyn termodynaamisen analyysin kanssa (Supplementary Fig. 3c, menetelmät, ympäristönlaatunormit. (3)–(5))28,29,30.

DORIS lisää tiheys-ja kapasiteettirajoja

yksi mahdollinen etu tiedostojen huoneenlämpöerotuksessa on se, että SS-dsdnojen kaksijuosteiset osat pysyvät hehkutettuina yhteen ja voivat estää ei-toivotun oligon sitoutumisen vastaaviin sekvensseihin datan hyötykuorma-alueilla. Data hyötykuorma alue on suurin sekvenssi keskellä SS-dsDNAs, joka sisältää tallennetut tiedot. Tämän hypoteesin testaamiseksi loimme kaksi SS-dsdnaa (Kuva. 2c). Yhdessä SS-dsDNA: ssa oli ylitys, joka sitoi oligo A: ta ”ja sisäinen sidontapaikka oligo B: tä”. Olemme kokeellisesti todennettu, että käyttämällä DORIS, vain oligo A’ mutta ei oligo B’ voisi erottaa pois strand. Vertailun vuoksi PCR-pohjaiset järjestelmät sulattavat dsdnoja jokaisessa syklissä, jolloin alukkeet voivat sitoa off-Targetin datan hyötykuormassa. Kuten oletettiin, PCR: ää käytettäessä sekä oligo A ”että oligo B ” sitoivat oligo B”: n tuottaessa ei-toivottuja tynkätuotteita. Toisessa testaamassamme säikeessä oli sisäinen sidontapaikka ja ylitys, jotka molemmat täydentävät oligo C’: tä. Osoitimme, että Doriksen avulla oligo C’ tuotti vain täyspitkän nauhan. Sen sijaan PCR: ää käytettäessä oligo C’ loi sekä täyspitkiä että katkaistuja säikeitä.

seuraavaksi kysyimme, mitä vaikutuksia tällä Doriksen esto-ominaisuudella oli DNA-pohjaiseen tiedon tallennukseen. Kun tietokannat kasvavat, intuitiivisesti todennäköisyys osoitesekvenssien kanssa identtisille sekvensseille (joko Doriksen ylitykset tai PCR: n primer-sivustot), jotka esiintyvät datan hyötykuorma-alueilla, kasvaa. Doriksen kanssa tämä ei ole ongelma, sillä oligoja estetään sitomasta dsDNA: n hyötykuorma-alueita. PCR: ssä alukkeet kuitenkin sitovat näitä tiedon hyötykuorma-alueita, joten aiemmissa lähestymistavoissa on kehitetty koodausalgoritmeja,jotka rajoittavat alukesekvenssejä (osoitteita) päällekkäisyydestä minkä tahansa identtisen tai samankaltaisen sekvenssin kanssa datan hyötykuormassa 11, 12, tyypillisesti välttäen Hamming-etäisyydet ~<6. Tämä vähentää luonnostaan joko tiheyttä, jolla tietokannat voidaan koodata tietojen hyötykuorman sekvenssiavaruutta koskevien rajoitusten vuoksi, tai niiden kapasiteettia, koska voidaan käyttää vähemmän ainutlaatuisia primer-sekvenssejä. Tiheys on tallennetun tiedon määrä nt: tä kohti (ekv. (6)), ja se pienenee, kun koodausrajoitukset asetetaan rajoittamalla, mitä sekvenssejä voidaan käyttää hyötykuorma-alueella (alempi diversiteettisekvenssiavaruus), kun taas kapasiteetti on tietojen kokonaismäärä, joka voidaan tallentaa järjestelmään (Eq. (7)) ja riippuu käytettävissä olevien osoitteiden määrästä, koska ne sanelevat tallennettavien tiedostojen määrän.

näiden suhteiden osoittamiseksi kvantitatiivisesti on tällä hetkellä vaikeaa ratkaista analyyttisesti tai laskea kattavasti sellaisten käytettävissä olevien osoitteiden lukumäärä, jotka eivät ole vuorovaikutuksessa datan hyötykuorma-alueen kanssa, jopa kohtalaisen kokoisissa tietokannoissa. Siksi teimme Monte Carlo-simulaatioita arvioidaksemme saavutettavissa olevien osoitteiden kokonaismäärän ja kokonaiskapasiteetin. Osoitesekvenssit olivat (PCR) tai niitä ei (DORIS) suljettu pois, jos ne esiintyivät datahyötykuorma-alueilla tietokannassa, jossa on 109 erillistä DNA-juostetta (Fig. 2D, menetelmät). Yksinkertaistaaksemme analyysiä, käytimme laskennallisia koodisanoja koodaamaan datan hyötykuorma-aluetta. Jokainen koodisana on erillinen nt-sekvenssi, ja siinä on yksi tavu (B) digitaalista tietoa. Datahyötykuorma-alueesta voidaan tehdä informaatiota tiheämpi pienentämällä koodisanojen kokoa niin, että enemmän koodisanoja (ja tavuja) mahtuu jokaiseen kiinteämittaiseen säikeeseen. Tradeoff on, että pienemmät koodisanat lisäävät myös sekvenssin monimuotoisuutta säikeiden (määrä mahdollisia erillisiä sekvenssejä per säikeen pituus), koska enemmän koodisana-koodisana liittymiä per säie. Tämä lisää mahdollisuutta samanlaisten sekvenssien ilmestymiseen hyötykuormaan, jotka ovat ristiriidassa osoitesekvenssien kanssa.

simulaatiossa arvioitiin, ovatko osoitesekvenssit ristiriidassa hyötykuormassa olevien sekvenssien kanssa. DORIKSELLE nämä osoitteet olivat kuitenkin sallittuja, vaikka osoitesarjat olisivat ristiriidassa hyötykuorman kanssa. Simulaatio osoitti siis, että koska hyötykuorman tietotiheys kasvoi koodisanojen pituuden kutistumisen vuoksi, käytettävissä olevien osoitteiden määrä ei muuttunut Doriksen osalta, koska muita osoitteita ei rajoitettu kuin että niiden ei sallittu olevan samanlaisia kuin muiden osoitteiden (Fig. 2D, vasen, vaaleanpunainen). Myös odotetusti, koska hyötykuorman tiedon tiheys kasvoi, tietokannan kapasiteetti kasvoi monotonisesti, koska tiedostojen osoitteiden määrä pysyi samana kuin säikeiden kokonaismäärä tiedostoa kohti (Fig. 2D, oik. vaaleanpunainen). Sen sijaan PCR: n osalta ei otettu huomioon osoitteita, jotka esiintyivät missä tahansa datahyötykuormasekvenssissä; tuloksena oli, että hyötykuorman tiheyden lisääminen tarjosi aluksi vähäistä hyötyä kokonaiskapasiteettiin (Fig. 2d, oikea, sininen), mutta johti lopulta katastrofaaliseen kapasiteetin laskuun, kun osoitteiden määrä, joka ei ollut ristiriidassa minkään hyötykuorman sekvenssin kanssa, putosi nopeasti nollaan (Kuva. 2d, vasen, sininen). Vaikka on mahdollista lisätä eri säikeiden määrää osoitetta kohti (ts., tiedot per tiedosto) osoitteiden menetyksen korvaamiseksi, tämä johtaisi tiedostoihin, jotka ovat liian suuria sekvensoitaviksi ja dekoodattaviksi yhdellä sekvensointijaksolla 17. On myös tärkeää huomata, että simulaatiomme perustuivat hyvin konservatiivisiin koodisanatiheyksiin ja tietokannan koko oli vain 109 DNA-juostetta, kun taas tulevat tallennusjärjestelmät todennäköisesti ylittävät 1012 juostetta tai enemmän. Kun tietokantatiheydet ja DNA-sekvenssiavaruudet kasvavat, PCR-pohjaisten järjestelmien käytettävissä olevien osoitteiden määrä vähenee entisestään, kun taas DORIS-järjestelmä säilyy ennallaan. Siksi Doriksen tarjoamat teoreettiset kapasiteetin ja tiheyden parannukset voivat olla suuruusluokkaa suurempia kuin simulaatioissa on arvioitu. Lisäksi DORIS yksinkertaistaa huomattavasti osoitesuunnittelua; sellaisten ortogonaalisten osoitteiden suunnittelu PCR-pohjaisille järjestelmille, jotka eivät ole vuorovaikutuksessa tietojen hyötykuormasarjojen kanssa, tulee nopeasti laskennallisesti hankalaksi suurissa tietokantakooissa. Yhteenvetona voidaan todeta, että SS-dsdnoista koostuva tietokanta voidaan tehokkaasti luoda yhden potin reaktioissa, ja ssDNA-ylitykset helpottavat ei-PCR-pohjaista erotusmenetelmää, joka parantaa osoitteen spesifisyyttä ja lisää teoreettisia tietokantatiheyksiä ja-valmiuksia.

DORIS mahdollistaa toistettavan tiedostojen käytön

keskeinen vaatimus, mutta suuri haaste tallennusjärjestelmien dynaamisille ominaisuuksille on järjestelmän uudelleenkäytettävyys. Tässä teoksessa inspiroiduimme luonnon biologisista järjestelmistä, joissa informaatioon pääsee toistuvasti käsiksi yhdestä perimän pysyvästä kopiosta transkriptioprosessin kautta. Kuten kuvassa. 3a, dynamic access in DORIS alkaa erottamalla fyysisesti kiinnostavan tiedoston (SS-dsdnat, joilla on sama ylitysosoite) käyttäen biotiini-linkitettyjä oligoja ja streptavidiinipohjaista magneettista erottelua, in vitro transkriboimalla (IVT) DNA: ta rna31: een, palauttamalla tiedosto tietokantaan ja käänteiskopioimalla RNA: ta cDNA: ksi myöhempää analyysiä tai sekvensointia varten.

Fig. 3: DORIS jäljittelee luonnollista transkriptiota päästäkseen toistuvasti käsiksi tietoihin.
kuva3

tiedosto a erotettiin käyttäen ei-PCR-pohjaista magneettista erottelua, kun taas tietokanta otettiin talteen (säilytetty tietokanta) (N = 3 kunkin ehdon osalta). T7-pohjainen in vitro transkriptio tehtiin suoraan helmi-immobilisoituun tiedostoon jopa 48 tunnin ajan RNA: n tuottamiseksi. Käänteinen transkriptio muutti RNA: n komplementaariseksi DNA: ksi (cDNA), kun taas immobilisoitu tiedosto a vapautettiin takaisin tietokantaan (säilytetty tiedosto) (N = 3 kullekin ehdolle). b säilytetyn tietokannan (kevyt varjostus) ja säilytetyn tiedoston (tumma varjostus) määrä sen jälkeen, kun oligo a’ oli käyttänyt tiedostoa a, mitattiin qPCR: llä ja piirrettiin prosenttiosuutena kunkin tietokannassa olleen tiedoston alkuperäisestä määrästä. Tiedostoihin pääsyn erityisyys käy ilmi siitä, että säilytettävässä tiedostossa ei ole B-ja C-tiedostoja. T7-RNA-polymeraasin (rnap) esiintyminen ei vaikuttanut tiedoston a retentioon. C-tiedostoa a käytettiin toistuvasti 5 kertaa. Tietokannassa olevien tiedostojen A, B ja C määrät mitattiin qPCR: llä ja piirrettiin kunkin tietokannan tiedoston määränä jokaisen ajon jälkeen (N = 3 kunkin ehdon osalta), normalisoituna kunkin tiedoston alkuperäiseen määrään ennen ensimmäistä pääsyä. Arvot edustavat aritmeettista keskiarvoa. Virhepalkit ovat s. d., n = monistettujen tiedostokäyntien määrä. Lähdeaineisto annetaan lähdeaineistona.

toteutimme tämän järjestelmän kolmella erillisellä SS-dsdnalla (A, B ja C), jotka yhdessä edustavat kolmen tiedoston tietokantaa, ja pääsimme tiedostoon a biotinyloidulla oligo A: lla ” (Kuva. 3b & täydentävä Kuva. 4). Tämän jälkeen mittasimme qPCR: n (Eq) ”säilytetyn tietokannan” (light shading) ja ”säilytetyn tiedoston” (dark shading) määrät ja koostumukset. (8)). Säilytetyssä tietokannassa oli enemmän tiedostoja B ja C verrattuna A: han, sillä osa tiedoston a säikeistä poistettiin magneettisessa erotuksessa. Säilytetty tiedosto sisälsi enimmäkseen tiedoston a säikeet, minimaalinen B tai C. paras netto kokonaismäärä tiedoston a talteen säilytetystä tietokannasta ja säilyttänyt tiedosto oli noin 90% siitä, mitä oli alun perin tietokantaan. Tiedoston a korkea säilyttämisaste viittasi siihen, että tiedostoa voitaisiin käyttää uudelleen useita kertoja. Testasimme tätä avaamalla toistuvasti tiedostoa a viisi kertaa ja mittasimme tiedostojen A, B ja C määrät ja koostumukset tietokannassa jokaisen käytön jälkeen (kuva. 3c & täydentävä Kuva. 4c). B-ja C-tiedostojen kokonaismäärät säilyivät odotetusti suhteellisen vakaina tietokannassa. Noin 50% tiedoston A osa jäi jälkeen viisi pääsyä. Käytännön vaikutuksia DNA tallennusjärjestelmät on, että vain 2 kopiota kunkin erillisen sekvenssin tarvitaan alkuperäisen tietokannan jokaista 5 kertaa se on käytetty (huomiotta vaikutukset juosteen jakaumat). Tämä on parannus PCR-pohjainen tiedosto pääsy, jossa pienet osuudet tietokannan otetaan ja monistetaan. Tässä tapauksessa tarvitaan yksi kappale jokaisesta erillisestä sekvenssistä jokaista käyttöoikeutta varten.; lisäksi, toisin kuin DORIKSESSA, kaikki muut tietokantatiedostot vähenevät vastaavasti runsaasti, vaikka niitä ei käytettäisi. Näin DORIS voi pidentää DNA-tietokantojen elinikää ja mahdollistaa tiheämmän pääsyn samalle synteettisen DNA: n kokonaismassalle.

seuraavaksi kysyimme, miten IVT-reaktio voi vaikuttaa tietokannan stabiiliuteen, koska se suoritetaan korotetussa 37 °C: n lämpötilassa ja se voi hajottaa SS-dsDNA: ta. Vaikka säilytetty tietokanta ei altistu IVT, käytetty tiedosto on, ja määrä SS-dsDNA säilyttää voisi vaikuttaa pituus IVT. Vaikka itse RNA-polymeraasin läsnäololla ei ollut vaikutusta säilytettyyn tiedostoon, IVT-ajan pituus vähensi säilytetyn tiedoston määrää (Fig. 3b & täydentävä Kuva. 4 A). Mielenkiintoista on, että säilytetyn tiedoston uudelleenjatkaminen 45 °C: ssa ja sen salliminen jäähtyä takaisin huoneenlämpöön paransi retentioastetta, mutta pidemmät IVT-ajat vähensivät edelleen tiedostojen yleistä säilyttämistä (täydentävä Kuva. 4b). Tämä viittaa siihen, että osa tappiosta johtuu siitä, että SS-dsDNA: n kanssa kilpailevista helmi-linkitetyistä oligoista tai Rnoista vapautuvat tiedostonauhat, kun taas osa tappiosta johtuu DNA: n hajoamisesta. Kontrollina sen varmistamiseksi, että SS-dsDNA ei kontaminoinut transkriboidusta RNA: sta syntynyttä cDNA: ta, cDNA saatiin vasta, kun RNA-polymeraasi sisällytettiin IVT-reaktioon (Supplementary Fig. 4d).

keskityimme seuraavaksi arvioimaan ammatillisen peruskoulutuksen laatua ja tehokkuutta. Tarkistaaksemme, onko RNA polymeraasi mahdollisesti luomassa ei-toivottuja typistettyjä tai pitkänomaisia transkriptejä, tilasimme kuuden ssDNAs-sarjan, jonka pituusalue ulottuu 110-180 nt: hen (Kuva. 4a & täydentävä Kuva. 5). Nämä muunnettiin ss-dsDNA: ksi, transkriboitiin RNA: ksi ja käänteiskopioitiin ja monistettiin dsDNA: ksi. SS-dsDNA: lle, RNA: lle ja dsDNA: lle nähtiin selkeät yhtenäiset kaistat. IVT-ajan lisääminen lisäsi RNA: n saantoa kaikilla malleilla (Kuva. 4b), joskin vain 2 h riitti selkeiden RNA-ryhmien muodostamiseen (Kuva. 4c), eikä IVT-aika vaikuttanut tuotetun RNA: n pituuteen. Yhteenvetona, tietoja voidaan toistuvasti päästä SS-dsDNAs oligo-pohjainen erottaminen ja IVT.

Fig. 4: T7-pohjainen transkriptio tuottaa tasaisen kokoisia tuotteita.
figure4

a kuusi eripituista ssDNA-oligoa suunniteltiin tuottamaan kuusi SS-dsDNA-mallia, joiden pituudet olivat vastaavasti 180 bp, 160 bp, 140 BP, 130 bp, 120 bp ja 110 bp. Jokainen SS-dsDNA koostui konsensus Käänteinen primer sidontasekvenssi, T7 primer sidontasekvenssi, forward primer sidontasekvenssi, ja hyötykuorma sekvenssi eripituisia. Nämä SS-dsDNA-mallit transkriboitiin in vitro 8 h: lle ja sen jälkeen RT-PCR: lle. Tuotekokoja tutkittiin agaroosigeelielektroforeesilla. B IVT-aika enintään 48 tunnin ajan (N = 3 toistuvaa IVT-reaktiota kussakin tilassa). Sekä RNA-että DNA-templaattimolekyylien määrä mitattiin Nanodropilla ja piirrettiin niiden suhteeksi. C RNA: n ja dsDNA: n tuotteiden geelielektroforeesi 2-48 tunnin IVT: n jälkeen, jota seuraa RT-PCR. Piirretyt arvot edustavat kolmen riippumattoman IVT-reaktion aritmeettista keskiarvoa ja virhetangot s.d.: tä. Geelikuvat edustavat kolmea RT-QPCR: n mittaamaa riippumatonta koetta. Lähdeaineisto annetaan lähdeaineistona.

transkriptio voidaan virittää promoottorisekvenssillä

Viimeaikaiset molekyylitietojen tallennusta koskevat teokset ovat osoittaneet, että lisätietojen tallentaminen erillisten molekyylien seosten koostumukseen,mukaan lukien DNA32, 33, on hyödyllistä. Koska Doriksen käyttämä tieto perustuu T7 – RNA-polymeraasiin ja on näyttöä siitä,että T7-promoottorivariantit voivat vaikuttaa transkription tehokkuuteen 34,35,36,37, 38, kysyimme, voisiko T7-pohjaisen transkription saantoa moduloida T7-promoottorin alueen ympärillä olevilla spesifisillä nukleotidisekvensseillä pitäen samalla promoottorin itsensä vakiona yhden potin SS-dsDNA-sukupolven mahdollistamiseksi (Kuva. 2 A, b). Kattavasti käsitellä tätä kysymystä, suunnittelimme ja tilasimme 1088 erillistä 160 nt säikeitä oligo pool. Ensimmäiset 1024 juostetta sisälsivät kaikki mahdolliset 5 nt: n muunnossekvenssit promoottorin sekvenssiin nähden (NNN-promoottori, n on kukin neljästä nukleotidista), ja jälkimmäiset 64 sekvenssiä olivat kaikki 3 NT: n muunnossekvenssejä promoottorin alavirtaan (promoottori-NNN, Kuva. 5 a). Koska nnnn-nukleotidit sijaitsivat ssDNA-ylängöllä, kysyimme myös, vaikuttiko tämä alue yksijuosteisella vai kaksijuosteisella tavalla suhteelliseen transkriptiotehokkuuteen. Loimme ensin SS-dsDNA primer extension ja dsDNA PCR ssDNA oligo pool. Sekä ss-dsDNA että dsDNA-tietokantoja käsiteltiin IVT: llä 37 °C: ssa 8 tunnin ajan, jota seurasi RT-PCR ja seuraavan sukupolven sekvensointi. Lyhyet viivakoodit suunniteltiin hyötykuorma-alueelle tunnistamaan, mistä promoottorimuunnoksesta kukin sekvensoitu transkriptio on johdettu.

Fig. 5: T7-pohjaista transkription tehokkuutta voidaan hallita ympäröivillä sekvensseillä.
figure5

a oligo-pooli, jossa oli 1088 erillistä sekvenssiä, suunniteltiin SS-dsDNA-mallien tuottamiseksi. Ensimmäiset 1024-sekvenssit sisälsivät kaikki mahdolliset nukleotidien yhdistelmät promoottorisekvenssin yläjuoksulla (nnnn-T7, missä N on yksi neljästä DNA-nukleotidista), kun taas 64-sekvenssit sisälsivät kaikki mahdolliset nukleotidien yhdistelmät promoottorisekvenssin alajuoksulla (T7-NNN). Jokainen sekvenssi sisälsi viivakoodin, jolla voitiin tunnistaa muunnosten nukleotidien sekvenssi. Malli SS-dsDNAs käsiteltiin IVT 8 h, jonka jälkeen RT-PCR ja seuraavan sukupolven sekvensointi (N = 3 kunkin ehdon). B Transkriptiotehokkuus molemmissa sekvenssimalleissa piirrettiin normalisoimalla kunkin transkriboidun juosteen lukuluku sen runsauteen alkuperäisessä kirjastossa. Tiedot oli järjestetty alimmasta korkeimpaan normalisoituneeseen runsauteen molempien mallien osalta. C sekvenssit jaettiin edelleen neljään kvartiileihin perustuen normalisoituun transkriptioiden runsauteen ja analysoitiin WebLogo-työkalulla. d normalisoitu runsaus kunkin sekvenssin oli järjestetty A / T prosenttiosuus. P-arvot kunkin ryhmän välillä laskettiin yksisuuntaisella Anovalla Tukey-Kramer post-hoc-menetelmällä ja lueteltu tässä tilastollisen merkitsevyyden vuoksi. Nnnn-T7: p-arvot alle 0,01, kun verrataan 0% -100%: n, 80% -100%: n ja 20% -80%: n välisiä vertailuja; p-arvot alle 0,001: n vertailuja 20%-100%, 40%-80%, 40%-100%, 60%-80% ja 60% -100%; T7-NNN, p-arvot alle 0,05, kun verrataan 33% -100%, 0% -100% ja 0% -66%. e alkuperäisen syntetisoidun tietokannan (vasen) ja transkriboidun tietokannan (oikea) kunkin DNA-sekvenssin sijainnin prosentuaalinen virhe. Virhetaso laskettiin jakamalla nukleotidiasennossa esiintyvien tietyntyyppisten virheiden määrä kyseisen sekvenssin lukujen kokonaismäärällä (täydentävä menetelmä). Piirretyt arvot edustavat kolmen riippumattoman IVT-RT-PCR-NGS-näytteen aritmeettista keskiarvoa ja virhetangot s.d.: tä. Lähdeaineisto annetaan lähdeaineistona.

jokaisen erillisen transkriptiosekvenssin runsaus normalisoitui sen runsauteen alkuperäisessä SS-dsDNA: ssa (Kuva. 5b)tai dsDNA (täydentävä Kuva. 6a) tietokanta (Eq. (9)). Saatiin laaja ja lähes jatkuva valikoima normalisoituja pitoisuuksia, mikä osoittaa, että tätä lähestymistapaa voitaisiin tulevaisuudessa hyödyntää monimutkaisten DNA: n koostumusseosten luomiseen. Selvittääksemme, onko olemassa yksinkertaisia suunnitteluperiaatteita, jotka kuvasivat promoottorin tehokkuutta, segmentoimme 1088-sekvenssit kvartiileiksi transkriptioiden runsauden perusteella ja toimme tiedot WebLogo-työkaluun39. Havaitsimme, että G tai a 5.asemassa suoraan ylävirtaan ja C tai T 3. asemassa suoraan alavirtaan T7-promoottorin jälkeen johtivat yleensä korkeimpiin RNA-pitoisuuksiin (Fig. 5c). Tietojen segmentointi A / T-sisällön mukaan osoitti, että T7-promoottorin yläjuoksulla oli hieman ~50% A/T-sisältöä ja T7-promoottorin alajuoksulla yleistä alhaista a/t-sisältöä (Kuva. 5d).

Tämä seuraavan sukupolven sekvensointikoe antoi myös varmuuden siitä, että DORIS on skaalattavissa suuriin ja monimutkaisiin SS-dsDNA-altaisiin. Lisäksi sekvensointilukujen virheanalyysi ei osoittanut systemaattisia poistoja, katkennuksia tai substituutioita, ja yleinen virhetaso oli selvästi alhaisempi kuin jo DNA-synteesissä (Fig. 5 e).

DORIS mahdollistaa tallennustiedostojen käytön

monet epäorgaaniset tiedontallennusjärjestelmät, jopa kylmätallennusarkistot, ylläpitävät kykyä käsitellä tiedostoja dynaamisesti. Vastaavat valmiudet DNA-pohjaisissa järjestelmissä lisäisivät merkittävästi niiden arvoa ja kilpailukykyä. ssDNA overhangs on aiemmin käytetty suorittaa laskutoimituksia yhteydessä toehold switches40, 41, 42, 43, ja siksi oletimme, että niitä voitaisiin käyttää toteuttamaan tallennustilassa tiedoston toimintaa. Koska proof-of-periaate, toteutimme lukitus, lukituksen, uudelleennimeäminen, ja poistamalla tiedostoja ja osoitti nämä toiminnot voidaan suorittaa huoneenlämmössä (Kuva. 6).

Fig. 6:Toeholds Ota käyttöön tallennustiedoston toiminnot.
kuva6

a (Top) kaavamainen lukitus-ja avauskaavio tallennustilan tiedostotoiminnoista. (Alhaalla) Doris yrittää käyttää tiedostoa a lukitsematta (no-Lock), lukitsemalla mutta ilman avainta (No-Key) tai lukitsemalla ja lisäämällä avainta eri lämpötiloissa (orange) (N = 3 kaikissa olosuhteissa). Lukko lisättiin 98 °C: ssa.avain lisättiin eri lämpötiloissa (oranssi) ja jäähdytettiin sitten 14 °C: seen (N = 3 kullekin ehdolle). Oligo a’ lisättiin 25, 35, 45 tai 75 °C: n eri astelämpötiloissa 2 minuutin ajan, minkä jälkeen lämpötila laski 1 °c/min 25 °C: een (N = 3 kunkin ehdon osalta). Erotustehokkuus on talteen otetun tiedoston määrä suhteessa sen alkuperäiseen määrään mitattuna qPCR: llä. b (Top) kaavamainen nimetä ja poistaa toimintoja. Tiedostoa A muokattiin nimeämällä tai poistamalla oligos uudelleen. (Bottom) kunkin toiminnon loppuunsaattamista testattiin mittaamalla, kuinka suuri osa tiedostosta erotettiin kunkin yksittäisen oligon mukaan: A’, B’ tai C’. Erotustehokkuus on erotetun tiedoston määrä suhteessa sen alkuperäiseen määrään tietokannassa mitattuna qPCR: llä. Ei modia (ei tiedoston muokkausta/operaatiota). Piirretyt arvot edustavat aritmeettista keskiarvoa, ja virhetangot edustavat s.D.: tä kolmesta itsenäisestä toisintotiedoston operaatiosta/erotuksesta. Lähdeaineisto annetaan lähdeaineistona.

aloitimme kolmen tiedoston tietokannasta ja testasimme biotiinisidonnaisen oligo A’: n kykyä sitoa ja erottaa tiedosto a lämpötilassa 25-75 °c (kuva. 6a, pohja, ei lukkoa). Noin 50% tiedoston säikeistä erotettiin onnistuneesti tietokannasta. Lukita tiedosto a, erotimme tiedoston a kolmen tiedoston tietokantaan ja sekoitetaan pitkä 50 nt ssDNA (lukko), joka oli 20 NT täydentävä sekvenssi ssDNA ylitys tiedoston A. Lukko paikallaan, oligo a’ ei enää voinut erottaa tiedoston paitsi korkeammissa lämpötiloissa yli 45 °C (Kuva. 6a, pohja, ei-avain), oletettavasti siksi, että lukko oli sulanut ylityksestä, jolloin oligo A’ pystyi kilpailemaan ylityksen sitomisesta. Avata tiedoston, lisäsimme avain, joka oli 50 nt ssDNA täysin täydentävä Lukko. Testasimme erilaisia avauslämpötiloja ja huomasimme avaimen pystyvän irrottamaan lukon huoneenlämmössä samalla tehokkuudella kuin korkeammissa lämpötiloissa. Tämä johtuu todennäköisesti pitkä 30 nt toehold esittämä Lukko, jolloin avain purkaa Lukko tiedostosta A. olemme myös optimoitu suhteellinen moolisuhteet (tiedosto a: lock: key: oligo A’ = 1: 10: 10: 15) minimoi kohteen ulkopuolinen erottaminen ja varmista oikea lukitus. Huomasimme, että lämpötila, jossa Lukko lisättiin, vaikutti lukitusprosessin uskollisuuteen. 98 °C: ssa lukitus toimi hyvin. Kun lukkoa lisättiin 25 °C: n lämpötilassa, oli vuotoerotus silloinkin, kun avainta ei lisätty (täydentävä Kuva. 7). Tämä voi johtua sekundaarirakenteista, jotka estävät joitakin tiedoston a säikeitä hybridisoitumasta lukkojen kanssa alhaisissa lämpötiloissa. Onneksi lukitus 45 °C: ssa oli kohtuullinen suorituskyky, jolloin vältettiin tarve nostaa järjestelmä 98 °C: seen.tulevan DNA-tallennusjärjestelmän yhteydessä tiedostot voitiin ensin erottaa ja lukita sitten korotetussa lämpötilassa, minkä jälkeen ne palautettiin tietokantaan, jolloin vältettiin koko tietokannan altistuminen kohonneille lämpötiloille. Koko prosessi voidaan muuten suorittaa huoneenlämmössä.

toteutimme myös tiedostojen uudelleennimeämisen ja poiston. Nimetä tiedoston osoite A on osoite B, Me sekoitettu tiedosto a 40 nt ssDNA, joka sitoutuu A, jonka tuloksena overhang on osoite B (Kuva. 6b). Lisäsimme kaikki komponentit samanlaisilla suhteilla lukitusprosessiin (tiedosto: uudelleennimeäminen oligo: pääsy oligo = 1: 10: 15) ja uudelleennimeäminen oligo lisättiin 45 °C: ssa. Sitten testasimme, kuinka monta tiedoston osa kunkin oligo A’, B’ tai C’ voisi erottaa ja totesi, että uudelleennimeämisprosessi täysin estänyt oligos A’ tai C ’ erottamasta tiedostoa (Fig. 6B, pohja). Vain oligo B’ pystyi erottamaan tiedoston, mikä viittaa siihen, että lähes kaikki säikeet nimettiin uudelleen A: sta B: hen. vastaavasti nimesimme tiedoston A: sta C: hen. Perustuu oligosin kykyyn nimetä tiedostoja, joilla on lähes 100% valmistuminen, oletimme ja totesimme, että lyhyt 20 nt-oligo, joka täydentää täysin A: ta, voidaan käyttää täysin estämään tiedoston a ylitys ja olennaisesti poistamaan se tietokannasta (Fig. 6B, pohja). Tiedosto voidaan myös yksinkertaisesti purkaa tietokannasta sen poistamiseksi samoin. Kuitenkin, tämä vaihtoehtoinen muoto esto-pohjainen poisto ehdottaa yksi tapa varmistaa, että kaikki ylijäämä tiedoston säikeet, joita ei ole täysin purettu ei spuriously käyttää tulevaisuudessa.

Related Posts

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *