ss-dsDNA 가닥 수 있습을 효율적으로 만들어진 중 하나에서 냄비
으로 미래의 DNA 에 데이터베이스로 구성된 위의 1015 뚜렷한 strands17,우리는 첫 번째 요청하는 경우 ss-dsDNAs 만들 수 있습에서 높은 처리량과 병렬화된 방식이다. 우리는 3’말단에서 20nt 를 삽입 한 공통 23nt 서열로 160 개의 뉴클레오티드(nt)단일 가닥 DNAs(ssDNA)를 주문했다(도 1). 1c 및 2a,보충 표 1). 이 23nt 순서를 포함 T7RNA 발기인이지만,또한 바인딩하는 데 사용되는 일반적인 프라이머를 채우기 및 변환 ssDNA 로 ss-dsDNA. 이것은 열 어닐링 및 DNA 중합 효소 확장의 여러 사이클(예:PCR 사이클이지만 프라이머 하나만 사용)에 의해 달성되었습니다. 이로 인해 20nt 오버행을 갖는 ss-dsDNA 가닥이 생성되었다(그림 1). 2a,상단). 우리는 ssDNA 대 프라이머의 비율,사이클 수를 다른 환경 매개 변수와 함께 최적화했습니다(그림 1). 2a,보충도. 1)ss-dsDNA 로 변환 된 ssDNA 의 양을 최대화합니다. 우리는 ssDNA 를 줄이는 것을 발견했다:1:10 을 지난 프라이머 비율은 겔 전기 영동(Supplementary Fig. 1b). 우리는 1:20ssDNA:프라이머 비율로 보수적으로 작업하기로 결정했습니다. 에서는 비율이 우리가 발견되는 4PCR 주기가 필요로 변환하 ssDNA 로 ss-dsDNA 는 것으로 볼 때 위쪽으로 이동에서 DNA gel(Fig. 2a).
다음에,우리는지 여부를 테스트는 이 방법이 될 수 있을 만드는 데 사용한 3 가지 ss-dsDNAs 에서비 반응과하는 경우 각 ss-dsDNA 할 수 있음 구체적으로 분리된 혼합물에서(그림. 2b). 우리는 혼합된 3 가지 ssDNAs”A”,”B”,”C”,함께 추가되는 일반적인 프라이머,수행 4PCR 사이클을 만들 ss-dsDNAs(여기에 참조로 파일 구성의 단지 하나의 고유 한 가닥 각). 그런 다음 비오틴 연결 20nt DNA 올리고를 사용하여 각 ss-dsDNA 를 결합했습니다(즉 각 파일,A,B 및 C 는 별개의 오버행 시퀀스 또는 파일 주소를 가짐)및 streptavidin 으로 기능화 된 자기 비드를 사용하여 혼합물로부터 분리 하였다. 이들 올리고 각각은 다른 두 개없이 해당 파일 만 구체적으로 분리 할 수 있었다(도 1). 2b,바닥,Eq. (1)). 중요한 것은,이 분리 단계를 수행할 수 있습에 상온(25°C)로 최소한의 이익을 관찰 올리고 높은 annealing 온도의 35~45°C(보충 Fig. 2,Eq. (2)). 이 단계의 실내 온도 및 등온 특성은 실용적인 DNA 저장 시스템 및 DNA 분해를 감소시키는 데 유용합니다.
20nt 표준 PCR primer 길이,우리가 묻는 경우에는 분리 효율성이 될 수 있을 조절해서 다른 걸 길이와 분리온입니다. 우리는 5-25nt 오버행으로 5 개의 ss-dsDNAs 를 설계했습니다(보충 그림. 3). 그런 다음 15-55℃에서 특정 비오틴 연결 올리고를 사용하여 각 가닥을 분리했습니다. 우리는 더 긴 올리고스(20mers 및 25mers)와 더 낮은 온도(15°c 및 25°C,보충 도 2)에서 향상된 분리 효율을 관찰했다. 3b). 이것은 올리고 뉴클레오타이드 특성 계산기를 사용한 열역학적 분석과 합의했다(보충 도 2). 3 기음,방법,Eqs. (3)–(5))28,29,30.
DORIS 증가한 밀도와 수용량 한계
중 하나 잠재력을 활용하의 실내 온도 분리용의 파일은 두 가닥의 부분 ss-dsDNAs 남아 있을 단련을 함께하고 차단할 수 있습니다 원하지 않는 올리고 바인딩을 비슷한 시퀀스에서는 데이터 페이로드 지역이다. 데이터 페이로드 영역은 저장된 정보를 포함하는 ss-dsDNAs 의 중간에있는 시퀀스의 대부분입니다. 이 가설을 테스트하기 위해 두 개의 ss-dsdna 를 만들었습니다(그림 1). 2 기음). 하나의 ss-dsDNA 에는 oligo a’와 oligo B’에 대한 내부 결합 부위를 묶는 오버행이있었습니다. 우리는 실험적으로 DORIS 를 사용함으로써 oligo a’가 아니라 oligo B’만이 가닥을 분리 할 수 있음을 확인했습니다. 비교를 위해 PCR 기반 시스템은 각 사이클에서 dsdna 를 녹여 프라이머가 데이터 페이로드 내에서 오프 타겟을 결합 할 수있게합니다. 예상대로,PCR 이 사용되었을 때 oligo A’와 oligo B’가 모두 결합되어 oligo B’가 원하지 않는 잘린 제품을 생성합니다. 우리가 테스트 한 두 번째 가닥은 모두 oligo C’와 보완 적이었던 내부 결합 부위와 오버행을 가졌다. 우리는 DORIS 를 사용하여 oligo C’가 전체 길이의 가닥만을 산출했음을 보여주었습니다. 대조적으로,PCR 을 사용할 때 oligo C’는 전체 길이와 잘린 가닥을 모두 만들었습니다.
우리는 다음으로 DORIS 의이 차단 특성이 DNA 기반 정보 저장에 어떤 영향을 미치는지 물었습니다. 으로 데이터베이스 크기가 증가,직관적으로 가능성에 대한 시퀀스와 동일한 주소 순서(중 오버행에 대한 도리스 또는 프라이머 사이트 PCR)에 나오는 데이터 페이로드 지역이 증가합니다. Doris 에서는 oligos 가 dsDNA 데이터 페이로드 영역을 바인딩하지 못하도록 차단되므로 문제가되지 않습니다. 그러나,PCR,프라이머를 할 수 바인딩은 이러한 데이터 페이로드 영역,그 이전의 접근 방식이 개발한 인코딩 알고리즘을 제한하는 프라이머는 순서(주소)에서 겹치는 어떤의 동일한 또는 유사한 시퀀스에서 데이터 payloads11,12,일반적으로 피 Hamming 거리 내에서~<6. 이 본질적으로 줄이거나 밀도있는 데이터베이스를 인코딩할 수 있으로 인해 데이터에 대한 제한 페이로드 순서 공간,또는 그들의 수용량 감소로 인해 고유한 프라이머 시퀀스는 사용할 수 있습니다. 밀도는 nt(Eq. (6)),그리고 그것을 감소로 인코딩한 것을 제한 시퀀스에서 사용할 수 있습 페이로드 영역(낮은 다양성을 순서 공간)동안 수용량 총량의 정보를 저장할 수 있는 시스템에서(Eq. (7))및 저장 될 수있는 파일의 수를 지시로 사용할 수있는 주소의 수에 의존한다.
하여 이러한 관계를 정량적으로,그것은 현재 다루기 어려하는 분석적으로 해결하기 위하거나 종합적으로 계산하는 수의 주소를 사용할 수 있는 상호 작용하지 않는 데이터 페이로드 영역,심지어는 적당한 크기의 데이터베이스가 있습니다. 따라서 몬테카를로 시뮬레이션을 수행하여 달성 가능한 총 주소 수와 총 용량을 추정했습니다. 주소 시퀀스(PCR)나지 않았(DORIS)지 않는 경우에 나타난 데이터 페이로드 영역의 데이터베이스로 109 별 가닥 DNA(Fig. 2d,방법). 분석을 단순화하기 위해 전산 코드 워드를 사용하여 데이터 페이로드 영역을 인코딩했습니다. 각 코드 워드는 별개의 nt 시퀀스이며 1 바이트(B)의 디지털 정보를 보유합니다. 데이터 페이로드 영역을 만들 수 있습니다 더 많은 정보를 밀도의 크기를 줄여 이 단어서 더 많은 단어(와 바이트)적합 내에서 각 고정 길이드도 있습니다. 는 단점이 더 작은 단어 또한 증가할 것이 순서 다양성의 가닥(가능한 뚜렷한 시퀀스당 가닥 길이)때문에 더 코드 워드-워드 접합 당시킵니다. 이렇게하면 주소 시퀀스와 충돌하는 페이로드에 유사한 시퀀스가 나타날 확률이 높아집니다.
시뮬레이션은 주소 시퀀스가 페이로드의 임의의 시퀀스와 충돌하는지 여부를 평가했습니다. 그러나 도리스의 경우 주소 시퀀스가 페이로드와 충돌하더라도 이러한 주소가 허용되었습니다. 시뮬레이션 따라서 보여주는으로 페이로드 정보를 밀도 증가를 축소하여 워드 길이의 숫자를 사용할 수 있는 주소를 변경하지 않았을 위한 도리스로 제한 없음에 배치했 주소로 다른 것보다 그들이 허용되지 않습와 유사한 것 기타 주소(Fig. 2d,왼쪽,분홍색). 도로 예상으로 페이로드 정보를 밀도 증가하고,데이터베이스 용량 증가하는 단조로 파일 주소에 동일하게 유지하지 못했 총 수의 가닥당 파일(그림. 2d,오른쪽,분홍색). 반면에,PCR,주소 등장하는 모든 데이터는 페이로드 순서 제외하며 결과는 증가 탑재한 정보를 밀도 처음에는 작은 혜택을 제공하여 전반적인 수용량(Fig. 2d,오른쪽 파란색)하지만 결국 비극적인 드롭에서는 수용량 숫자로의 주소는 충돌하지 않으로 모든 페이로드 순서를 신속하게 떨어지 제로(그림. 2d,왼쪽,파란색). 주소 당 별개의 가닥 수를 늘리는 것이 가능하지만(즉, 고,정당 파일)를 만들의 손실 주소,이 결과를 파일에서 너무 큰 시퀀스와 디코딩에 단일 시퀀싱 run17. 그것은 또한 중요하다고 하는 우리의 시뮬레이션에 따라 매우 보수적인 코드의 밀도 및 데이터베이스의 크기만 109DNA 가닥면,미래의 스토리지 시스템을 초과할 가능성이 있 1012 가닥이나 더 크다. 으로 데이터베이스 밀도와 DNA sequence 공간,증가 번호를 사용할 수 있는 주소에 대한 PCR 기반 시스템이 드롭도 추가하는 동안 DORIS 영향을 받지 않습니다. 따라서 도리스가 제공하는 이론적 용량과 밀도 향상은 우리의 시뮬레이션에서 추정 된 것보다 큰 크기의 주문 일 수 있습니다. 또한,DORIS 히 단순하게 주는 디자인,디자인의 세트를 직각 주소 PCR 기반의 시스템은 상호 작용하지 않는 데이터 페이로드 시퀀스가 신속하게 다루기 힘든 계산에 큰 데이터베이스 크기입니다. 요약하면,데이터베이스의 구성 ss-dsDNAs 수 있습을 효율적으로 만들어진 중 하나에서 냄비 반응,ssDNA 오버행을 용이하게 비 PCR 기반 분리하는 방법을 향상시킵 주소성이 증가한 이론적인 데이터베이스 밀도 및 용량으로 제공됩니다.
DORIS 할 수 있습 반복 가능한 파일 접근
키를 요구 하지만 주요 도전을 위해 엔지니어링은 동적 특성으로 저장 시스템은 재사용의 시스템입니다. 이 작품에서,우리는 우리에서 영감을했 자연적인 생물학적 시스템이 정보를 반복적으로 접근에서 하나의 영원한 복사의 genomic DNA 을 통해 전사 프로세스. 도에 도시 된 바와 같이. 3a,동적 접근에서 도리스가 시작하여 육체적으로 분리하는 파일의자(ss-dsDNAs 공유 같은 걸 주소)를 사용하여 바이오틴-연결되어 올리고 와 streptavidin 기반으로 자기 분리,체외 전사(IVT)DNA RNA31,반환하는 파일을 데이터베이스 역-베 끼 RNA 로 cDNA 다운스트림에 대한 분석이나 시퀀싱.
우리는 우리 구현이 시스템과 함께 세 가지 ss-dsDNAs(A,B,C)공동으로 나타내는 세 개의 파일 데이터베이스,그리고 우리에 액세스하는 파일과 biotinylated 올리고 A'(Fig. 3b&보충도. 4). 그런 다음 qPCR(Eq)에 의해”유지 된 데이터베이스”(밝은 음영)및”유지 된 파일”(어두운 음영)의 양과 조성을 측정했습니다. (8)). 유지 된 데이터베이스는 파일 a 가닥 중 일부가 자기 분리에서 제거됨에 따라 a 와 비교하여 파일 B 와 C 의 수준이 더 높았다. 보존 파일에 포함된 대부분일 가닥을 최소화하거나 최고의 총 금액의 파일을 복구에서 보관된 데이터베이스 및 보존 파일의 약 90%무엇을 원래 있던 데이터베이스에서. 파일 a 의 높은 유지율은 파일을 여러 번 다시 액세스 할 수 있다고 제안했습니다. 우리는 파일 A 에 5 번 반복적으로 액세스하여이를 테스트하고 각 액세스 후 데이터베이스에서 파일 A,B 및 C 의 양과 조성을 측정했습니다(그림 1). 3c&보충 그림. 4 기음). 예상대로 파일 B 와 C 의 전체 양은 데이터베이스에서 비교적 안정적인 수준으로 유지되었습니다. 파일 a 가닥의 약 50%는 다섯 번의 액세스 후에 남아있었습니다. 실제적인 의미에 대한 DNA 스토리지 시스템은 2 장의 각각의 순서에 필요한 데이터베이스를 초기에 대한 모든 5 시간 그것은에 액세스(을 무시하고 효과의 가닥 배포). 이것은 데이터베이스의 작은 aliquots 가 취해지고 증폭되는 PCR 기반 파일 액세스에 비해 개선 된 것입니다. 이 경우 각 액세스에 대해 각 고유 시퀀스의 사본 하나가 필요합니다; 또한,도리스 달리,다른 데이터베이스 파일의 모든 유사하게 액세스되지 않은 경우에도 풍부 감소 될 것이다. 따라서 DORIS 는 DNA 데이터베이스의 수명을 연장하고 합성 된 DNA 의 동일한 총 질량에 대해 더 자주 액세스 할 수 있습니다.
우리는 다음는 방법을 묻는 IVT 반응에 영향을 미칠 수 있는 데이터베이스의 안정성,그것은에서 수행되는 높은 온도 37°C 이 저하될 수 있습 ss-dsDNA. 유지 된 데이터베이스가 ivt 에 노출되지는 않지만 액세스 된 파일이며 유지 된 ss-dsDNA 의 양은 IVT 의 길이에 영향을받을 수 있습니다. 실제로의 존재하지만,RNA 자체에 영향을 끼치지 않았다고 보관된 파일의 길이 IVT 시간 감소의 양을 유지하는 파일(그림. 3b&보충도. 4a). 흥미롭게도,reannealing 보존 파일에서 45°C 할 수 있도록 차가운 뒤 실온으로 향상 유지율이지만,더 이상 IVT 시간은 여전히 감소 전반적인 파일을 보존(부가 Fig. 4b). 이는 어떤 손실로 인해 파일 가닥을 해제하는에서 구슬을 연결 올리고 또 RNAs 과 경쟁 ss-dsDNA,일부 손실로 인해 DNA 저하될 수 있습니다. 으로 제어하는지 확인하 ss-dsDNA 되지 않았 오염 cDNA 에서 생성된 전사 RNA,cDNA 얻은 경우에만 RNA 에 포함되었 IVT 반응(보충 Fig. 4d).
우리는 다음으로 IVT 의 품질과 효율성을 평가하는 데 중점을 두었습니다. 지 확인하려면 RNA 수 있습을 만드는 원하지 않는 잘리는 길쭉한 성적 증명서,우리는 주문의 일련의 여섯 ssDNAs 의 범위와 길이에 걸쳐 110-180nt(Fig. 4a&보충도. 5). 이들은 ss-dsDNA 로 변환되고,RNA 로 전사되고,dsDNA 로 역전사되고 증폭되었다. Ss-dsDNA,RNA 및 dsDNA 에 대해 명확한 균일 한 밴드가 보였다. Ivt 시간을 늘리면 모든 템플릿에 대한 RNA 의 수율이 증가했습니다(그림 1). 도 4b),단지 2h 가 명확한 RNA 밴드를 얻기에 충분했지만(도 4b). 4c),및 IVT 시간은 생성 된 RNA 의 길이에 영향을 미치지 않았다. 요약하면,oligo 기반 분리 및 IVT 에 의해 ss-dsDNAs 에서 정보에 반복적으로 액세스 할 수 있습니다.
전사 조정할 수 있습니다에 의해 발기인 sequence
최근 작품에서는 분자 정보를 저장을 설명했 유틸리티의 추가 정보를 저장하기에는 성분의 혼합물의 고유 분자 포함,DNA32,33. 으로 정보를 액세스하여 도리스에 의존합 T7RNA,그리고 증거가 있다는 T7 발기인 개에 영향을 미칠 수 있 전사 efficiency34,35,36,37,38,우리는지 여부를 묻는 질문 수익률 T7-기반으로 전송될 수 있 변조방식에 의 특정 염기서열을 주 T7-발기인 영역을 유지하면서 발기인 자체 일정을 허용하는 한 냄비 ss-dsDNA 세대(Fig. 2a,비). 이 질문을 포괄적으로 다루기 위해 우리는 oligo pool 으로 1088 개의 별개의 160nt 가닥을 설계하고 주문했습니다. 첫 번째 1024 가닥이 포함된 모든 가능한 5nt 변종 순서류는 발기인 시퀀스(NNNNN-발기인,N 은 각각의 네 개의 뉴클레오티드),그리고 후기 64 시퀀스는 모든 3nt 변종 순서 하류의 프로모터(발기인-NNN,Fig. 5a). 로 NNNNN 뉴클레오티드에 위치 했 ssDNA 오버행,우리 또한 요청하는 경우 이 지역이 단순 좌초된 대중 좌초에 어떤 영향을 미쳤 상대 transcriptional 효율을 높일 수 있습니다. 우리는 먼저 프라이머 확장에 의한 ss-dsDNA 와 ssDNA oligo 풀의 PCR 에 의한 dsDNA 를 만들었습니다. Ss-dsDNA 및 dsDNA 데이터베이스는 모두 8h 에 대해 37°c 에서 IVT 로 처리되었고,RT-PCR 및 차세대 시퀀싱이 뒤 따랐다. 페이로드 영역에서 짧은 바코드를 설계하여 각 시퀀싱 된 성적표가 파생 된 프로모터 변이체를 식별했습니다.
의 풍부한 고유한 각본 시퀀스가 정상화하는 데에 original ss-dsDNA(Fig. 5b)또는 dsDNA(보충 그림. 6a)데이터베이스(Eq. (9)). 넓은 거의 지속적인 범위의 표준화 나타났는데 얻은 것을 나타내는 접근이 무력화 될 수 있을 만드는 복잡한 작곡 혼합물의 DNA 에서는 미래입니다. 있는지 결정하기 위하여할 수 있는 간단한 디자인의 원리를 설명하는 발기인 효율성에,우리는 분단의 1088 시퀀스로 사분위수를 기반으로 성적증명서 풍부와 수입된 데이터로 WebLogo tool39. 우리가 발견 G 나에서 5 위에 직접 업스트림 및 C T 에서는 3 위에 직접 다운스트림 T7 발기인은 일반적으로 결과에서 가장 높은 RNA 나타났는데(그림. 5 기음). 구분하여 데이터는 A/T 콘텐츠가 있다는 것을 보여주었던 약간의 설정에 대한~50%A/T 컨텐츠의 업스트림 T7 발기인과 환경에 대한 전반적인 저렴한 A/T 콘텐츠 다운스트림 T7 프로모터(Fig. 5d).
이 차세대 시퀀싱 실험은 또한 DORIS 가 크고 복잡한 ss-dsDNA 풀에 확장 가능하다는 확신을 제공했습니다. 또한 오류 분석의 순서를 읽고 표시된 체계적인 삭제,잘림,또는 대체,및 전반적인 오류가 수준이었다 잘 아래에 이미 존재하에서 DNA 를 합성(Fig. 5e).
DORIS 할 수 있습에 저장 파일 작업
많은 종류의 무기물 정보 저장 시스템에도,냉장 보관,유지하는 능력을 동적으로 조작하는 파일이 있습니다. DNA 기반 시스템에서 유사한 기능을 사용하면 가치와 경쟁력이 크게 향상됩니다. ssDNA 오버행 이전에 실행하는 데 사용하는 계산의 컨텍스트에서 발 switches40,41,42,43,그러므로 우리는 가설들이 사용될 수 있습에서 구현-저장 파일 작업입니다. 으로 증명서는 원칙적으로 구현 잠금,해제,이름 변경,그리고 파일을 삭제하여 이러한 작업을 수행할 수 있습온에서(그림. 6).
우리가 시작으로 세 개의 파일 데이터베이스와의 기능을 테스트 biotin 연결되어 올리고는’이 결합하여 별도의 파일 에서의 범위에서 온도는 25~75°C(Fig. 6a,바닥,잠금 없음). 파일 a 가닥의 약 50%가 데이터베이스에서 성공적으로 분리되었습니다. 잠 파일에,우리는 분리된 파일에서 세 개의 파일 데이터베이스 및 혼합에서 오랜 50nt ssDNA(lock)있는 20nt 보완적인 순서를 ssDNA 의 오버행 파일 A. 잠금 장소에 올리고는’더 이상 할 수 있는 별도의 파일을 제외하고 더 이상의 온도 45°C(Fig. 6a,하단,no-key),아마도 잠금 장치가 오버행에서 녹아서 oligo a’가 오버행을 묶기 위해 경쟁 할 수 있기 때문일 것입니다. 파일의 잠금을 해제하기 위해,우리는 잠금을 완전히 보완 50nt ssDNA 이었다 키를 추가했습니다. 우리가 테스트는 다른 해제하는 온도 및 열쇠를 찾을 수 있었 잠금을 제거에서 실온으로 동일한 효율성 높은 온도에서. 이것은 가능성으로 인해 오랜 30nt 발에 의해 제시 잠금할 수 있도록,키 압축을 잠금에서 파일 A. 우리는 또한 최적화된 상대 몰 비율(파일 잠금:중요:올리고 A’ = 1: 10: 10: 15) 을 최소화하는 대상에서 분리 및 적절한 잠그고 있습니다. 우리는 잠금 장치가 추가 된 온도가 잠금 프로세스의 충실도에 영향을 미친다는 것을 관찰했습니다. 98°C 에서 잠금 프로세스가 잘 작동했습니다. 잠금 장치가 25°C 에서 추가되었을 때,키가 추가되지 않은 경우에도 새는 분리가 있었다(보충 그림 2). 7). 이것은 일부 파일 가닥이 저온에서 자물쇠와 하이브리드 화되는 것을 방지하는 2 차 구조 때문일 수 있습니다. 다행히도,잠금 45°C 야 합 성능,따라서 피하는 필요를 상승시키는 시스템 98°C 의 컨텍스트에서는 향후 DNA 스토리지 시스템,파일을 수 있는 첫 번째 분리되 고정은 높은 온도에서,그 반환되는 데이터베이스,따라서 피하 노출 전체 데이터베이스의 높은 온도. 전체 과정은 그렇지 않으면 실내 온도에 실행될 수 있었습니다.
우리는 또한 파일 이름 변경 및 삭제를 구현했습니다. 주소 A 가있는 파일의 이름을 주소 B 로 바꾸려면 결과 오버행이 주소 B 인 상태에서 파일 A 를 a 에 바인딩하는 40nt ssDNA 와 혼합했습니다(그림 1). 6b). 우리는 우리가 모든 구성요소에서 유사한 비율을 잠그기 프로세스(파일 이름을 바꾸는 올리고:액세스하는 올리고=1:10:15)그리고 이름을 바꾸는 올리고 추가되었 45°C. 우리는 다음 테스트 얼마나 많은 파일이 가닥의 각 올리고 A’,B’,C’분리 할 수 있다는 것을 발견하고 이름을 바꾸는 프로세스를 완전히 차단되 올리고 A’C’에서 밖으로 분리하는 파일(그림. 6b,바닥). Oligo B’만이 거의 모든 가닥이 A 에서 B 로 성공적으로 이름이 바뀌 었음을 암시하는 파일을 분리 할 수있었습니다. 의 능력을 기반으로 올리고를 가진 파일 이름을 바꾸는 100%가까이 완료되면,우리는 가설과 실제로 발견되는 짧은 20nt 올리고 완벽하게 보완해 사용될 수 있습을 완벽하게 차단하는의 오버행 파일이 있고 본질적으로 삭제 데이터베이스에서(그림. 6b,바닥). 또한 파일을 단순히 데이터베이스에서 추출하여 삭제할 수도 있습니다. 그러나,이것은 다른 형태의 차단하는 기반이 삭제를 제안을 보장 하기 위해 한 가지 방법은 남아 있는 모든 파일 가닥을 완전히 추출되지 않을 것 spuriously 접근하는 방식을 일컫습니다.