예시적인 실시형태들의 상세한 설명
일반 정의
달리 정의하지 않으면, 본 명세서에서 사용되는 기술 및 과학 용어는 본 개시가 속하는 분야의 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 분자 생물학의 공통 용어 및 기술의 정의는 다음의 문헌들에서 확인할 수 있다: [Molecular Cloning: A Laboratory Manual, 2nd edition (1989) (Sambrook, Fritsch, and Maniatis)]; [Molecular Cloning: A Laboratory Manual, 4th edition (2012) (Green and Sambrook)]; [Current Protocols in Molecular Biology (1987) (F.M. Ausubel et al. eds.)]; [the series Methods in Enzymology (Academic Press, Inc.): PCR 2: A Practical Approach (1995) (M.J. MacPherson, B.D. Hames, and G.R. Taylor eds.): Antibodies, A Laboratory Manual (1988) (Harlow and Lane, eds.): Antibodies A Laboratory Manual, 2nd edition 2013 (E.A. Greenfield ed.)]; [Animal Cell Culture (1987) (R.I. Freshney, ed.)]; [Benjamin Lewin, Genes IX, published by Jones and Bartlet, 2008 (ISBN 0763752223)]; [Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, published by Blackwell Science Ltd., 1994 (ISBN 0632021829)]; [Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 9780471185710)]; [Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons (New York, N.Y. 1994), March, Advanced Organic Chemistry Reactions, Mechanisms and Structure 4th ed., John Wiley & Sons (New York, N.Y. 1992)]; 및 [Marten H. Hofker and Jan van Deursen, Transgenic Mouse Methods and Protocols, 2nd edition (2011)].
본 명세서에서 사용되는 단수 형태 "한", "하나", 및 "그"는 문맥에서 달리 명확하게 명시하지 않으면, 단수 및 복수 대상 둘 모두를 포함한다.
용어 "임의의" 또는 "임의로는"은 후술되는 사건, 상황 또는 치환기가 존재하지 않을 수도 있거나 또는 존재할 수도 있고, 그 설명은 사건 또는 상황이 일어나는 예 및 일어나지 않는 예를 포함한다는 것을 의미한다.
종료점에 의한 수치 범위의 설명은 언급된 종료점을 비롯하여, 각 범위 내에 포함된 모든 수 및 분수를 포함한다.
측정가능한 값 예컨대 매개변수, 양, 시간적 지속기간 등을 언급할 때 본 명세서에서 사용되는 용어 "약" 또는 "대략"은 명시된 값과 그로부터의 변동, 예컨대 그러한 변동이 개시된 발명에서 수행하기에 적절하다면, 명시된 값과 그로부터의 +/-10% 이하, +/-5% 이하, +/-1% 이하, 및 +/-0.1% 이하의 변동을 포괄한다는 것을 의미한다. 수식어 "약" 또는 "대략"이 언급되는 값은 그 자체로 또한 특별히, 그리고 바람직하게 개시된다는 것을 이해해야 한다.
본 명세서 전반에서 "하나의 실시형태", "일 실시형태", "일례의 실시형태"에 대한 언급은 실시형태와 함께 기술된 특정한 특성, 구조 또는 특징이 본 발명의 적어도 하나의 실시형태에 포함된다는 것을 의미한다. 따라서, 본 명세서 전반의 다양한 위치에서 어구 "하나의 실시형태에서", "일 실시형태에서", 또는 "일례의 실시형태"의 출현은 반드시 모두 동일한 실시형태를 언급하지 않지만, 그럴 수도 있다. 더 나아가서, 특정한 특성, 구조 또는 특징은 하나 이상의 실시형태에서, 본 개시로부터 당업자에게 자명하게 되는 바와 같이, 임의의 적합한 방식으로 조합될 수 있다. 더 나아가서, 본 명세서에 기술된 일부 실시형태가 다른 실시형태에 포함된 다른 특성이 아닌 일부 특성을 포함하지만, 상이한 실시형태의 특성의 조합은 본 발명의 범주 내에 두고자 한다. 예를 들어, 첨부된 청구항에서, 임의의 청구된 실시형태들은 임의 조합으로 사용될 수 있다.
본 명세서에서 인용되는 모든 출판물, 공개 특허 문서, 및 특허 출원은 각각의 개별 출판물, 공개 특허 문서, 또는 특허 출원이 참조로 편입된다고 특별히 개별적으로 표시한 바와 동일한 정도로 참조로 본 명세서에 편입된다.
개요
개시된 실시형태는 핵산 검출 조성물, 시스템, 및 방법을 제공한다. 일정 실시형태에서 핵산 검출 조성물은 적어도 2종의 CRISPR 단백질을 포함한다. 일정 예의 실시형태에서, 조성물 및 시스템은 하나 이상의 검출 단백질 및 하나 이상의 신호 증폭 단백질을 포함한다. 검출 단백질은 해당 가이드 서열과 함께, 표적 서열에 결합하여 활성화되고, 상기 활성화는 궁극적으로 검출가능한 신호의 발생을 야기시킨다. 신호 증폭 단백질은 검출 단백질의 활성화를 통해서 활성화되고 검출가능한 신호를 더 증폭시킨다. 일정 예의 실시형태에서, 핵산 검출 조성물은 적어도 하나를 포함한다.
일 양상에서, 본 명세서에 개시된 실시형태는 핵산 검출 조성물에 관한 것이다. 조성물은 적어도 하나의 CRISPR 검출 이펙터 단백질 및 적어도 하나의 CRISPR 신호 증폭 이펙터 단백질을 포함한다. 일례의 실시형태에서, CRISPR 검출 이펙터 단백질은 VI형 CRISPR 이펙터 단백질이다. 일례의 실시형태에서, VI형 CRISPR 이펙터 단백질은 Cas13a 이펙터 단백질이다. 다른 예의 실시형태에서, VI형 CRISPR 이펙터 단백질은 Cas13b 이펙터 단백질이다. 일정 예의 실시형태에서, CRISPR 신호 증폭 단백질은 III형 CRISPR 단백질이다. 일정 예의 실시형태에서, III형 CRISPR 단백질은 Csm6 단백질이다. 일정 예의 실시형태에서, 조성물은 검출 CRISPR 이펙터 단백질에 대한 하나 이상의 가이드 서열을 더 포함하고, 가이드 서열은 하나 이상의 표적 서열에 결합하도록 디자인된다. 일정 예의 실시형태에서, 조성물은 신호 증폭 CRISPR 단백질을 활성화시키는 활성화 서열을 더 포함할 수 있다. 활성화 서열은 가이드 서열 및 표적 서열과 구별된다. 일정 예의 실시형태에서, 활성화 서열은 폴리-A 뉴클레오티드 서열이다. 폴리-A 뉴클레오티드 서열은 사용되는 CRISPR 신호 증폭 이펙터 단백질의 유형에 따라서 가변적인 길이일 수 있다. 일정 예의 실시형태에서, 폴리-A 활성화 서열은 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개 뉴클레오티드의 길이일 수 있다. 일정 예의 실시형태에서, 조성물은 가이드 서열 및 활성화 서열 둘 모두를 포함한다. 일정 예의 실시형태에서, 조성물은 하기 더욱 상술되는 바와 같은 리포터 구성체를 더 포함할 수 있다.
일정한 다른 양상에서, 본 명세서에 개시된 실시형태는 적어도 하나의 검출 CRISPR 이펙터 단백질 및 적어도 하나의 신호 증폭 CRISPR 검출 단백질, 하나 이상의 가이드 서열, 하나 이상의 가이드 활성화 서열, 및 하나 이상의 리포터 구성체를 포함하는 시스템에 관한 것이다. 각각의 상기 엘리먼트는 하기에 더욱 상술된다.
일정한 다른 양상에서, 본 명세서에 기술된 조성물 및 시스템은 통합 장치일 수 있다. 적합한 장치 플랫폼은 하기에 더욱 상술된다.
일정한 다른 양상에서, 본 명세서에 개시된 실시형태는 일정 예의 실시형태에서, 본 명세서에 개시된 조성물, 시스템 및 장치를 사용하여, 표적 핵산 서열, 및/또는 단백질을 검출하는 방법에 관한 것이다.
참고의 편의를 위해서, 본 명세서에 개시된 실시형태는 또한 SHERLOCK (Specific High-sensitivity Enzymatic Reporter unLOCKing)라고도 할 수 있다.
CRISPR 검출 이펙터 단백질
일반적으로, 본 명세서, 및 문헌 예컨대 WO 2014/093622 (PCT/US2013/074667)에서 사용되는 CRISPR-Cas 또는 CRISPR 시스템은 Cas 유전자를 코딩하는 서열, tracr (trans-activating CRISPR) 서열 (예를 들어, tracrRNA 또는 활성 부분 tracrRNA), tracr-mate 서열 (내생성 CRISPR 시스템의 경우에 "직접 반복부" 및 tracrRNA-프로세싱된 부분 직접 반복부 포괄), 가이드 서열 (내생성 CRISPR 시스템의 경우에 "스페이서"라고도 함), 또는 그 용어가 본 명세서에서 사용되는 바와 같은 "RNA(들)" (예를 들어, Cas를 가이드하는 RNA(들), 예컨대 Cas9, 예를 들어 CRISPR RNA 및 트랜스활성화 (tracr) RNA 또는 단일 가이드 RNA (sgRNA) (키메라 RNA)) 또는 CRISPR 유전자좌 유래 다른 서열 및 전사물을 포함하여, CRISPR-연관 ("Cas") 유전자의 발현 또는 활성 유도에 관여되는 전사물 및 다른 엘리먼트를 집합적으로 언급한다. 일반적으로, CRISPR 시스템은 표적 서열 (내생성 CRISPR 시스템의 경우 프로토스페이서라고도 함)의 부위에서 CRISPR 복합체의 형성을 촉진하는 엘리먼트를 특징으로 한다. CRISPR 단백질이 C2c2 단백질인 경우에, tracrRNA는 요구되지 않는다. C2c2는 [Abudayyeh et al. (2016) "C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector"; Science; DOI: 10.1126/science.aaf5573]; 및 [Shmakov et al. (2015) "Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas systems", Molecular Cell, DOI: dx.doi.org/10.1016/j.molcel.2015.10.008]에 기술되어 있고, 그들 전문을 참조로 본 명세서에 편입시킨다. Cas13b는 [Smargon et al. (2017) "Cas13b Is a Type VI-B CRISPR-Associated RNA-guided RNases Differentially Regulated by Accessory Proteins Csx27 and Csx28," Molecular Cell. 65, 1-13; dx.doi.org/10.1016/j.molcel.2016.12.023]에 기술되었고, 이의 전문을 참조로 본 명세서에 편입시킨다.
일정 실시형태에서 프로토스페이서 인접 모티프 (PAM) 또는 PAM-유사 모티프는 관심 표적 유전자좌로 본 명세서에 개시된 바와 같은 이펙터 단백질 복합체의 결합을 유도한다. 일부 실시형태에서, PAM은 5' PAM (프로토스페이서의 5' 말단 상류에 위치)일 수 있다. 다른 실시형태에서, PAM은 3' PAM (즉, 프로토스페이서의 5' 말단 하류에 위치)일 수 있다. 용어 "PAM"은 용어 "PFS" 또는 "프로토스페이서 측접 부위" 또는 "프로토스페이서 측접 서열"과 상호교환적으로 사용될 수 있다.
바람직한 실시형태에서, CRISPR 이펙터 단백질은 3' PAM을 인식할 수 있다. 일정 실시형태에서 CRISPR 이펙터 단백질은 5'H인 3' PAM을 인식할 수 있고, 여기서 H는 A, C 또는 U이다. 일정 실시형태에서 이펙터 단백질은 렙토트리키아 샤히 C2c2p, 보다 바람직하게는 렙토트리키아 샤히 DSM 19757 C2c2일 수 있고, 3' PAM은 5' H이다.
CRISPR 복합체의 형성의 경우에, "표적 서열"은 표적 서열과 가이드 서열 간 하이브리드화가 CRISPR 복합체의 형성을 촉진하는 경우에, 가이드 서열이 상보성을 갖도록 디자인된 서열을 의미한다. 표적 서열은 RNA 폴리뉴클레오티드를 포함할 수 있다. 용어 "표적 RNA"는 표적 서열이거나 또는 그를 포함하는 RNA 폴리뉴클레오티드를 의미한다. 다른 말로, 표적 RNA는 gRNA, 즉 가이드 서열의 일부가 상보성을 갖도록 디자인되고 CRISPR 이펙터 단백질 및 gRNA를 포함하는 복합체에 의해 매개되는 이펙터 기능이 유도되어지는 RNA 폴리뉴클레오티드 또는 RNA 폴리뉴클레오티드의 일부일 수 있다. 일부 실시형태에서, 표적 서열은 세포의 핵 또는 세포질에 위치된다.
CRISPR 이펙터 단백질, 특히 C2c2를 코딩하는 핵산 분자는 유리하게 코돈 최적화된 CRISPR 이펙터 단백질이다. 코돈 최적화 서열의 예는 이러한 예에서, 진핵생물, 예를 들어 인간 (인간에서 발현에 최적화), 또는 본 명세서에 기술된 바와 같은 다른 진핵생물, 동물 또는 포유동물에서의 발현을 위해 최적화된 서열이고, 예를 들어, WO 2014/093622 (PCT/US2013/074667)의 SaCas9 인간 코돈 최적화 서열을 참조한다. 이것이 바람직하지만, 다른 예가 가능하고 인간 이외의 숙주종에 대한 코돈 최적화, 또는 특별한 장기에 대한 코돈 최적화가 공지되어 있다는 것을 이해하게 될 것이다. 일부 실시형태에서, CRISPR 이펙터 단백질을 코딩하는 효소 코딩 서열은 특히 세포, 예컨대 진핵생물 세포에서의 발현을 위해 코돈 최적화된다. 진핵생물 세포는 제한없이, 인간, 또는 본 명세서에 기술된 바와 같은 인간이외의 진핵생물 또는 동물 또는 포유동물, 예를 들어 마우스, 래트, 토끼, 개, 가축 또는 인간이외의 포유동물 또는 영장류를 포함하여, 포유동물 또는 식물과 같은 특정한 유기체의 것일 수 있거나 또는 그로부터 유래될 수 있다. 일부 실시형태에서, 인간의 배선 유전자 정체성 (identity)을 변형시키는 방법 및/또는 인간 또는 동물에게 임의의 실질적인 의학적 이득없이 고통을 야기시킬 수도 있는 동물의 유전자 정체성을 변형시키는 방법, 및 그러한 방법으로 얻어진 동물은 배제할 수 있다. 일반적으로, 코돈 최적화는 천연 서열의 적어도 하나의 코돈 (예를 들어, 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50개 이상의 코돈)을 천연 아미노산 서열을 유지하면서 숙주 세포의 유전자에서 보다 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 치환시켜 관심 숙주 세포에서 증강된 발현을 위해 핵산 서열을 변형시키는 방법을 의미한다. 다양한 종은 특정한 아미노산의 일정 코돈에 대한 특정 편향성을 나타닌다. 코돈 편향성 (유기체 간 코돈 용법의 차이)은 종종 메신저 RNA (mRNA)의 번역 효율과 상관있고, 이것은 결과적으로 특히, 번역되는 코돈의 성질 및 특정한 전달 RNA (tRNA) 분자의 이용가능성에 의존한다고 여겨진다. 세포에서 선택된 tRNA의 우위성은 일반적으로 펩티드 합성에서 가장 빈번하게 사용되는 코돈의 반영이다. 따라서, 유전자는 코돈 최적화를 기반으로 소정 유기체에서 최적 유전자 발현을 위해 재단될 수 있다. 코돈 용법 표는 예를 들어 kazusa.orjp/codon/에서 입수가능한 "코돈 용법 데이타베이스"에서 쉽게 이용가능하고, 이들 표는 다양한 방식으로 개조될 수 있다. [Nakamura, Y., et al. "codon usage tabulated from the international DNA Sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)]를 참조한다. 특정한 숙주 세포에서 발현을 위해 특정 서열을 코돈 최적화하기 위한 컴퓨터 알고리즘이 또한 이용가능한데, 예컨대 Gene Forge (Aptagen; Jacobus, PA)가 또한 이용가능하다. 일부 실시형태에서, Cas를 코딩하는 서열의 하나 이상의 코돈 (예를 들어, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50개 이상, 또는 모든 코돈)은 특정 아미노산에 대해 가장 빈번하게 사용되는 코돈에 상응한다. 본 발명은 하기 실시예에서 더욱 설명되지만, 이것이 청구항에 기술된 본 발명의 범주를 제한하지는 않는다.
일례의 실시형태에서, 검출 이펙터 단백질은 RxxxxH 모티프 서열을 포함하는 하나 이상의 HEPN 도메인을 포함한다. RxxxxH 모티프 서열은 제한없이, 본 명세서에 기술된 HEPN 도메인 또는 당분야에 공지된 HEPN 도메인 유래일 수 있다. RxxxxH 모티프 서열은 둘 이상의 HEPN 도메인의 일부분을 조합하여 생성된 모티프 서열을 더 포함한다. 언급된 바와 같이, 공통 서열은 발명의 명칭 "Novel CRISPR Enzymes and Systems"의 미국 가출원 번호 62/432,240, 발명의 명칭 "Novel Type VI CRISPR Orthologs and Systems"로 2017년 3월 15일 출원된 미국 가출원 번호62/471,710, 및 발명의 명칭 "Novel VI형 CRISPR Orthologs and Systmes"로 2017년 4월 12일 출원되고 대리인 문서 번호 47627-05-2133으로 표지된 미국 가출원에 개시된 오솔로그의 서열로부터 유래될 수 있다.
본 발명의 일 실시형태에서, HEPN 도메인은 R{N/H/K}X1X2X3H (SEQ ID NO:571)의 서열을 포함하는 적어도 하나의 RxxxxH 모티프를 포함한다. 본 발명의 일 실시형태에서, HEPN 도메인은 R{N/H}X1X2X3H (SEQ ID NO:572)의 서열을 포함하는 RxxxxH 모티프를 포함한다. 본 발명의 일 실시형태에서, HEPN 도메인은 R{N/K}X1X2X3H (SEQ ID NO:573)의 서열을 포함한다. 일정 실시형태에서 X1은 R, S, D, E, Q, N, G, Y, 또는 H이다. 일정 실시형태에서 X2는 I, S, T, V, 또는 L이다. 일정 실시형태에서 X3은 L, F, N, Y, V, I, S, D, E, 또는 A이다.
본 발명에 따라 사용을 위한 추가의 이펙터는 예를 들어, 제한없이, cas1 유전자의 출발점으로부터 20 kb 및 cas1 유전자의 종료점으로부터 20 kb 영역 이내에서, cas1 유전자와 그들 근접성에 의해 확인될 수 있다. 일정 실시형태에서 이펙터 단백질은 적어도 하나의 HEPN 도메인 및 적어도 500개 아미노산을 포함하고, C2c2 이펙터 단백질은 Cas 유전자 또는 CRISPR 어레이의 상류 또는 하류 20 kb 이내의 원핵생물 게놈에 천연적으로 존재한다. Cas 단백질의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (Csn1 및 Csx12라고도 공지됨), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 이의 상동체, 또는 이의 변형된 형태를 포함한다. 일정 예의 실시형태에서, C2c2 이펙터 단백질은 Cas 1 유전자의 상류 또는 하류 20 kb 이내 원핵생물 게놈에 천연적으로 존재한다. 용어 "오솔로그" (orthologue 또는 ortholog라고도 함) 및 "상동체" (homologue 또는 homolog라고도 함)는 당분야에 충분히 공지되어 있다. 추가 지침에 의해서, 본 명세서에서 사용되는 단백질의 "상동체"는 상동성인 단백질과 동일하거나 또는 유사한 기능을 수행하는 동일 종의 단백질이다. 상동성 단백질은 구조적으로 관련될 필요가 없거나, 또는 오직 부분적으로 구조적으로 관련된다. 본 명세서에서 사용되는 단백질의 "오솔로그"는 오솔로그인 단백질과 동일하거나 또는 유사한 기능을 수행하는 상이한 종의 단백질이다. 오솔로그 단백질은 구조적으로 관련될 필요가 없거나, 또는 오직 부분적으로 구조적으로 관련된다.
특정한 실시형태에서, CRISPR 검출 이펙터 단백질은 VI형 RNA-표적화 Cas 효소이다. 일정 예의 실시형태에서, VI형 RNA-표적화 Cas 효소는 본 명세서에서 C2cs라고도 하는 Cas 13a이다. 다른 예시적인 실시형태에서, VI형 RNA-표적화 Cas 효소는 Cas 13b이다. 특정한 실시형태에서, VI형 단백질, 예컨대 C2c2의 상동체 또는 오솔로그는 VI형 단백질 예컨대 C2c2 (임의의 렙토트리키아 샤히 C2c2, 라크노스피라과 박테리아 MA2020 C2c2, 라크노스피라과 박테리아 NK4A179 C2c2, 클로스트리듐 아미노필럼 (DSM 10710) C2c2, 카르노박테리움 갈리나럼 (DSM 4847) C2c2, 팔루디박터 프로피오니시게네스 (WB4) C2c2, 리스테리아 웨이헨스테파넨시스 (FSL R9-0317) C2c2, 리스테리아과 박테리아 (FSL M6-0635) C2c2, 리스테리아 뉴요켄시스 (Listeria newyorkensis) (FSL M6-0635) C2c2, 렙토트리키아 웨이데이 (F0279) C2c2, 로도박터 캡슐라터스 (SB 1003) C2c2, 로도박터 캡슐라터스 (R121) C2c2, 로도박터 캡슐라터스 (DE442) C2c2, 렙토트리키아 웨이데이 (Lw2) C2c2, 또는 리스테리아 실리게리 C2c2의 야생형 서열 기반)와 적어도 30%, 또는 적어도 40%, 또는 적어도 50%, 또는 적어도 60%, 또는 적어도 70%, 또는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 상동성 또는 동일성을 갖는다. 추가 실시형태에서, 본 명세서에 언급된 바와 같은 C2c2와 같은 VI형 단백질의 상동체 또는 오솔로그는 야생형 C2c2 (임의의 렙토트리키아 샤히 C2c2, 라크노스피라과 박테리아 MA2020 C2c2, 라크노스피라과 박테리아 NK4A179 C2c2, 클로스트리듐 아미노필럼 (DSM 10710) C2c2, 카르노박테리움 갈리나럼 (DSM 4847) C2c2, 팔루디박터 프로피오니시게네스 (WB4) C2c2, 리스테리아 웨이헨스테파넨시스 (FSL R9-0317) C2c2, 리스테리아과 박테리아 (FSL M6-0635) C2c2, 리스테리아 뉴요켄시스 (FSL M6-0635) C2c2, 렙토트리키아 웨이데이 (F0279) C2c2, 로도박터 캡슐라터스 (SB 1003) C2c2, 로도박터 캡슐라터스 (R121) C2c2, 로도박터 캡슐라터스 (DE442) C2c2, 렙토트리키아 웨이데이 (Lw2) C2c2, 또는 리스테리아 실리게리 C2c2의 야생형 서열 기반)와 적어도 30%, 또는 적어도 40%, 또는 적어도 50%, 또는 적어도 60%, 또는 적어도 70%, 또는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 예컨대 예를 들어, 적어도 95%의 서열 동일성을 갖는다.
일정한 다른 예의 실시형태에서, CRISPR 이펙터 단백질은 C2c2 뉴클레아제이다. C2c2의 활성은 2개 HEPN 도메인의 존재에 의존할 수 있다. 이들은 RNase 도메인, 즉 RNA를 절단하는 뉴클레아제 (특히 엔도뉴클레아제)인 것으로 확인되었다. C2c2 HEPN은 또한 DNA, 또는 잠재적으로 DNA 및/또는 RNA를 표적화할 수 있다. C2c2의 HEPN 도메인이 그들의 야생형 형태로, 적어도 RNA에 결합하여 절단시킬 수 있다는 것을 기초로, C2c2 이펙터 단백질이 RNase 기능을 갖는 것이 바람직하다. C2c2 CRISPR 시스템과 관련하여, 2016년 6월 17일에 출원된 미국 가출원 번호 62/351,662 및 2016년 8월 17일에 출원된 미국 가출원 번호62/376,377을 참조한다. 또한 2016년 6월 17일 출원된 미국 가출원 62/351,803을 참조한다. 또한, 브로드 연구소 번호 10035.PA4 및 대리인 서류 번호 47627.03.2133을 보유하는 2016년 12월 8일 출원된 발명의 명칭 "Novel Crispr Enzymes and Systems"의 미국 가출원을 참조한다. 문헌 [East-Seletsky et al. "Two distinct RNase activities of CRISPR-C2c2 enable guide-RNA processing and RNA detection" Nature doi:10/1038/nature19802] 및 [Abudayyeh et al. "C2c2 is a single-component programmable RNA-guided RNA targeting CRISPR effector" bioRxiv doi:10.1101/054742]을 더 참조한다.
CRISPR 시스템에서 RNase 기능은 공지되어 있으며, 예를 들어 mRNA 표적화는 일정 III형 CRISPR-Cas 시스템의 경우에 보고되었고 (Hale et al., 2014, Genes Dev, vol. 28, 2432-2443; Hale et al., 2009, Cell, vol. 139, 945-956; Peng et al., 2015, Nucleic Aids research, vol. 43, 406-417) 상당한 장점을 제공한다. 스타필로코커스 에피더미스 (Staphylococcus epidermis) III-A형 시스템에서, 표적 전역의 전사는 그 결과로 Cas10-Csm 리보뉴클레오단백질 이펙터 단백질 복합체 내의 독립적인 활성 부위에 의해 매개되는, 표적 DNA 및 이의 전사물의 절단을 야기시킨다 (Samai et al., 2015, Cell, vol. 151, 1164-1174). 따라서 본 이펙터 단백질을 통한 CRISPR-Cas 시스템, 조성물 또는 RNA 표적화 방법이 제공된다.
일 실시형태에서, Cas 단백질은 제한없이 렙토트리키아, 리스테리아, 코리네박터, 수테렐라, 레지오넬라, 트레포네마, 필리팍토르, 유박테리움, 스트렙토코커스, 락토바실러스, 마이코플라스마, 박테로이데스, 플라비이볼라, 플라보박테리움, 스파에로차에타, 아조스피릴럼, 글루콘아세토박터, 네이세리아, 로세부리아, 파르비바큘럼, 스타필로코커스, 니트라티프락토, 마이코플라스마 및 캄필로박터를 포함하는 속의 유기체의 C2c2 오솔로그일 수 있다. 이러한 속의 유기체 종은 달리 본 명세서에서 논의될 수 있다.
CRISPR-Cas 시스템 효소의 오솔로그를 식별하는 일부 방법은 관심 게놈에서 tracr 서열을 식별하는 단계를 포함할 수 있다. tracr 서열의 식별은 하기의 단계들과 관련될 수 있다: CRISPR 효소를 포함하는 CRISPR 영역을 식별하기 위해 데이타베이스에서 직접 반복부 또는 tracr 메이트 서열에 대한 검색 단계. 센스 및 안티센스 양쪽 방향으로 CRISPR 효소에 측접하는 CRISPR 영역에서 상동성 서열의 검색 단계. 전사 종결인자 및 2차 구조의 조사. 직접 반복부 또는 tracr 메이트 서열은 아니지만 직접 반복부 또는 tracr 메이트 서열과 50% 초과의 동일성을 갖는 잠재적 tracr 서열로서 임의 서열을 식별하는 단계. 잠재적 tracr 서열을 선택하고 그와 회합되는 전사 종결인자 서열을 분석하는 단계.
본 명세서에 기술된 임의의 기능성이 다수의 오솔로그 유래 단편을 포함하는 키메라 효소를 포함하여, 다른 오솔로그 유래 CRISPR 효소로 조작될 수 있다는 것을 이해하게 될 것이다. 이러한 오솔로그의 예는 본 명세서의 다른 부분에 기술되어 있다. 따라서, 키메라 효소는 제한없이 렙토트리키아, 리스테리아, 코리네박터, 수테렐라, 레지오넬라, 트레포네마, 필리팍토르, 유박테리움, 스트렙토코커스, 락토바실러스, 마이코플라스마, 박테로이데스, 플라비이볼라, 플라보박테리움, 스파에로차에타, 아조스피릴룸, 글루콘아세토박터, 네이세리아, 로세부리아, 파르비바큘럼, 스타필로코커스, 니트라티프락토, 마이코플라스마 및 캄필로박터를 포함하는 유기체의 CRISPR 효소 오솔로그의 단편을 포함할 수 있다. 키메라 효소는 제1 단편 및 제2 단편을 포함할 수 있고, 단편은 본 명세서에 언급된 속의 유기체 또는 본 명세서에 언급된 종의 유기체의 CRISPR 효소 오솔로그의 것일 수 있으며, 유리하게 단편은 상이한 종의 CRISPR 효소 오솔로그로부터 유래된다.
실시형태에서, 본 명세서에서 언급되는 바와 같은 C2c2 단백질은 또한 C2c2의 기능성 변이체 또는 이의 상동체 또는 오솔로그를 포괄한다. 본 명세서에서 사용 시 단백질의 "기능성 변이체"는 그 단백질의 활성을 적어도 부분적으로 보유하는 그러한 단백질의 변이체를 의미한다. 기능성 변이체는 다형체 등을 포함하여, 돌연변이체 (삽입, 결실, 또는 치환 돌연변이체일 수 있음)를 포함할 수 있다. 기능성 변이체에는 또한 다른, 일반적으로 미관련된, 핵산, 단백질, 폴리펩티드 또는 펩티드와 이러한 단백질의 융합 생성물이 포함된다. 기능성 변이체는 천연 발생일 수 있거나 또는 만들어 진 것일 수 있다. 유리한 실시형태는 조작되거나 또는 비천연 발생된 VI형 RNA-표적화 이펙터 단백질을 포함할 수 있다.
일 실시형태에서, C2c2 또는 이의 오솔로그 또는 상동체를 코딩하는 핵산 분자(들)는 진핵생물 세포에서 발현을 위해 코돈-최적화될 수 있다. 진핵생물은 본 명세서에서 논의되는 바와 같을 수 있다. 핵산 분자(들)는 조작될 수 있거나 또는 비천연 발생일 수 있다.
일 실시형태에서, C2c2 또는 이의 오솔로그 또는 상동체는 하나 이상의 돌연변이를 가질 수 있다 (그에 따라 이를 코딩하는 핵산 분자(들)는 돌연변이(들)를 가질 수 있음). 돌연변이는 인공적으로 도입된 돌연변이일 수 있고 제한없이 촉매성 도메인에 하나 이상의 돌연변이를 포함할 수 있다. Cas9 효소에 대한 촉매성 도메인의 예는 제한없이 RuvC I, RuvC II, RuvC III 및 HNH 도메인을 포함할 수 있다.
일 실시형태에서, C2c2 또는 이의 오솔로그 또는 상동체는 하나 이상의 돌연변이를 포함할 수 있다. 돌연변이는 인공적으로 도입된 돌연변이일 수 있고 제한없이 촉매성 도메인에 하나 이상의 돌연변이를 포함할 수 있다. Cas 효소에 대한 촉매성 도메인의 예는 제한없이 HEPN 도메인을 포함할 수 있다.
일 실시형태에서, C2c2 또는 이의 오솔로그 또는 상동체는 기능성 도메인에 작동적으로 연결되거나 또는 융합된 일반 핵산 결합 단백질로서 사용될 수 있다. 예시적인 기능성 도메인은 제한없이 번역 개시인자, 번역 활성인자, 번역 억제인자, 뉴클레아제, 특히 리보뉴클레아제, 스플라이시오솜, 비드, 광 유도성/제어성 도메인 또는 화학 유도성/제어성 도메인을 포함할 수 있다.
일정한 예의 실시형태에서, C2c2 이펙터 단백질은 렙토트리키아, 리스테리아, 코리네박터, 수테렐라, 레지오넬라, 트레포네마, 필리팩토르, 유박테리움, 스트렙토코커스, 락토바실러스, 마이코플라스마, 박테로이데스, 플라비이볼라, 플라보박테리움, 스파에로차에타, 아조스피릴룸, 글루콘아세토박터, 네이세리아, 로세부리아, 파르비바큘럼, 스타필로코커스, 니트라티프락토, 마이코플라스마, 및 캄필로박터로 이루어진 군으로부터 선택된 유기체로부터 유래될 수 있다.
일정 실시형태에서, 이펙터 단백질은 리스테리아 sp. C2c2p, 바람직하게 리스테리아 실리게리아 C2c2p, 보다 바람직하게 리스테리아 실리게리아 혈청형 1/2b str. SLCC3954 C2c2p일 수 있고 crRNA 서열은 5' 29-nt 직접 반복부 (DR) 및 15-nt 내지 18-nt 스페이서를 갖는 44 내지 47개 뉴클레오티드 길이일 수 있다.
일정 실시형태에서, 이펙터 단백질은 렙토트리키아 sp. C2c2p, 바람직하게 렙토트리키아 샤히 C2c2p, 보다 바람직하게 렙토트리키아 샤히 DSM 19757 C2c2p일 수 있고, crRNA 서열은 적어도 24 nt의 5' 직접 반복부, 예컨대 5' 24-28-nt 직접 반복부 (DR) 및 적어도 14 nt의 스페이서, 예컨대 14-nt 내지 28-nt 스페이서, 또는 적어도 18 nt의 스페이서, 예컨대 19 nt, 20 nt, 21 nt, 22 nt, 또는 그 이상의 nt, 예컨대 18-28 nt, 19-28 nt, 20-28 nt, 21-28 nt, 또는 22-28 nt의 스페이서를 갖는, 42 내지 58개 뉴클레오티드 길이일 수 있다.
일정한 예의 실시형태에서, 이펙터 단백질은 렙토트리키아 sp., 렙토트리키아 웨이데이 F0279, 또는 리스테리아 sp., 바람직하게 리스테리아 뉴요켄시스 FSL M6-0635일 수 있다.
일정한 예의 실시형태에서, 본 발명의 C2c2 이펙터 단백질은 제한없이, 하기의 21개 오솔로그 종 (다수 CRISPR 유전자좌 포함): 렙토트리키아 샤히; 렙토트리키아 웨이데이 (Lw2); 리스테리아 실리게리 라크노스피라과 박테리아 MA2020; 라크노스피라과 박테리아 NK4A179; [클로스트리듐] 아미노필럼 DSM 10710; 카르노박테리움 갈리나럼 DSM 4847; 카르노박테리움 갈리나럼 DSM 4847 (제2 CRISPR 유전자좌); 팔루디박터 프로피오니시게네스 WB4; 리스테리아 웨이헨스테파넨시스 FSL R9-0317; 리스테리아과 박테리아 FSL M6-0635; 렙토트리키아 웨이데이 F0279; 로도박터 캡슐라터스 SB 1003; 로도박터 캡슐라터스 R121; 로도박터 캡슐라터스 DE442; 렙토트리키아 부칼리스 C-1013-b; 허르비닉스 헤미셀룰로실리티카; [유박테리움] 렉탈레; 유박테리아과 박테리아 CHKCI004; 블라우티아 sp. 마르세이유-P2398; 및 렙토트리키아 sp. 경구 분류군 879 str. F0557을 포함한다. 12종의 추가의 비제한적인 예는 라크노스피라과 박테리아 NK4A144; 클로로플렉서스 아그레간스; 데메퀴나 아우란티아카; 탈라소스피라 sp. TSL5-1; 슈도부티리비브리오 sp. OR37; 부티리비브리오 sp. YAB3001; 블라우티아 sp. 마르세이유-P2398; 렙토트리키아 sp. 마르세이유-P3007; 박테로이데스 이후아에; 포르피로모나다과 박테리아 KH3CP3RA; 리스테리아 리파리아; 및 인솔리티스피릴럼 페레그리넘이다.
일정 실시형태에서, 본 발명에 따른 C2c2 단백질은 하기 표에 기술된 바와 같은 오솔로그 중 하나이거나 또는 그로부터 유래되거나, 또는 하기 표에 기술된 바와 같은 오솔로그 중 둘 이상의 키메라 단백질이거나, 또는 이종성/기능성 도메인과 융합되거나 또는 융합되지 않고, 본 명세서의 다른 곳에 정의된 바와 같은 데드 C2c2, 분할 C2c2, 탈안정화 C2c2 등을 포함한, 하기 표에 기술된 바와 같은 오솔로그 중 하나의 돌연변이체 또는 변이체 (또는 키메라 돌연변이체 또는 변이체)이다.
일정한 예의 실시형태에서, C2c2 이펙터 단백질은 하기 표 1로부터 선택된다.
표 1
상기 종의 야생형 단백질 서열은 하기 표 2에 열거되어 있다. 일정 실시형태에서 C2c2 단백질을 코딩하는 핵산 서열이 제공된다.
표 2
본 발명의 일 실시형태에서, 렙토트리키아 샤히 C2c2, 라크노스피라과 박테리아 MA2020 C2c2, 라크노스피라과 박테리아 NK4A179 C2c2, 클로스트리듐 아미노필럼 (DSM 10710) C2c2, 카르노박테리움 갈리나럼 (DSM 4847) C2c2, 팔루디박터 프로피오니시게네스 (WB4) C2c2, 리스테리아 웨이헨스테파넨시스 (FSL R9-0317) C2c2, 리스테리아과 박테리아 (FSL M6-0635) C2c2, 리스테리아 뉴요켄시스 (FSL M6-0635) C2c2, 렙토트리키아 웨이데이 (F0279) C2c2, 로도박터 캡슐라터스 (SB 1003) C2c2, 로도박터 캡슐라터스 (R121) C2c2, 로도박터 캡슐라터스 (DE442) C2c2, 렙토트리키아 웨이데이 (Lw2) C2c2, 또는 리스테리아 실리게리 C2c2 중 임의의 야생형 서열과 적어도 80% 서열 상동성을 갖는 아미노산 서열을 포함하는 이펙터 단백질이 제공된다.
본 발명의 일 실시형태에서, 이펙터 단백질은 제한없이 본 명세서에 기술된 공통 서열을 포함하는 VI형 이펙터 단백질 공통 서열과 적어도 80% 서열 상동성을 갖는 아미노산 서열을 포함한다.
본 발명에 따라서, 공통 서열은 제한없이 C2c2 기능을 매개하는 C2c2 오솔로그의 촉매성 잔기 및 HEPN 모티프를 포함하여, 보존된 아미노산 잔기 및 모티프의 위치를 찾는데 도움이 될 수 있는, 다수의 C2c2 오솔로그로부터 생성될 수 있다. Geneious 정렬을 사용하여 상기 언급된 33종 오솔로그로부터 생성시킨, 하나의 이러한 공통 서열은 SEQ ID NO: 32이다.
다른 비제한적인 예에서, 공통 서열의 생성 및 보존된 잔기의 식별을 보조하기 위한 서열 정렬 도구는 MUSCLE 정렬 도구 (www.ebi.ac.uk/Tools/msa/muscle/)이다. 예를 들어, MUSCLE을 사용하여, C2c2 오솔로그 중에서 보존된 하기 아미노산이 렙토트리키아 웨이데이 C2c2:K2에서 식별될 수 있다; K5; V6; E301; L331; I335; N341; G351; K352; E375; L392; L396; D403; F446; I466; I470; R474 (HEPN); H475; H479 (HEPN), E508; P556; L561; I595; Y596; F600; Y669; I673; F681; L685; Y761; L676; L779; Y782; L836; D847; Y863; L869; I872; K879; I933; L954; I958; R961; Y965; E970; R971; D972; R1046 (HEPN), H1051 (HEPN), Y1075; D1076; K1078; K1080; I1083; I1090
일정한 예의 실시형태에서, RNA-표적화 이펙터 단백질은 VI형-B 이펙터 단백질, 예컨대 Cas13b 및 그룹 29 또는 그룹 30 단백질이다. 일정한 예의 실시형태에서, RNA-표적화 이펙터 단백질은 하나 이상의 HEPN 도메인을 포함한다. 일정한 예의 실시형태에서, RNA-표적화 이펙터 단백질은 C-말단 HEPN 도메인, N-말단 HEPN 도메인, 또는 둘 모두를 포함한다. 본 발명의 문맥에서 사용될 수 있는 예로서 VI형-B 이펙터 단백질과 관련하여, 2016년 10월 21일에 출원된 발명의 명칭 "Novel CRISPR Enzymes and Systems"의 US 출원 번호 15/331,792, 및 2016년 10월 21일 출원된 발명의 명칭 "Novel CRISPR Enzymes and Systems"의 국제 특허 출원 번호 PCT/US2016/058302, 및 [Smargon et al. "Cas13b is a Type VI-B CRISPR-associated RNA-Guided RNase differentially regulated by accessory proteins Csx27 and Csx28" Molecular Cell, 65, 1-13 (2017); dx.doi.org/10.1016/j.molcel.2016.12.023], 및 2017년 3월 15일 출원된 발명의 명칭 "Cas13b Orthologues CRISPR Enzymes and Systems"로 양도된 미국 가출원 번호를 참조한다. 특정한 실시형태에서, Cas13b 효소는 베르게이엘라 주헬컴으로부터 유래된다. 일정한 다른 예의 실시형태에서, 검출 이펙터 단백질은 표 3에 열거된 임의 서열과 적어도 80%의 서열 상동성을 갖는 아미노산 서열이거나, 또는 그를 포함한다.
표 3
가이드 서열
본 명세서에서 사용되는 용어 "crRNA" 또는 "가이드 RNA" 또는 "단일 가이드 RNA", "gRNA"는 표적 핵산 서열과 하이브리드화하고 표적 핵산 서열에 대한 gRNA 및 CRISPR 이펙터 단백질을 포함하는 RNA-표적화 복합체의 서열-특이적 결합을 유도하는 표적 핵산 서열과 충분한 상보성을 갖는 임의의 폴리뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 의미한다. 일반적으로, gRNA는 (i) CRISPR 이펙터 단백질과 복합체를 형성할 수 있고, (ii) 표적 서열과 하이브리드화하고, 표적 서열에 대해 CRISPR 복합체의 서열-특이적 결합을 유도하기 위해 표적 폴리뉴클레오티드 서열과 충분한 상보성을 갖는 서열을 포함하는 임의의 폴리뉴클레오티드 서열일 수 있다. 본 명세서에서 사용시 용어 "CRISPR 이펙터 단백질과 복합체를 형성할 수 있는"은 표적 RNA와 서열 특이적 방식으로 결합할 수 있고 상기 표적 RNA에 대해 기능을 발휘할 수 있는 복합체를 형성하도록 gRNA와 CRISPR 이펙터 단백질에 의해 특이적 결합을 허용하는 구조를 갖는 gRNA를 의미한다. gRNA의 구조적 성분은 직접 반복부 및 가이드 서열 (또는 스페이서)을 포함할 수 있다. 표적 RNA와의 서열 특이적 결합은 표적 RNA와 상보적인 "가이드 서열", gRNA의 일부에 의해 매개된다. 본 발명의 실시형태에서, 용어 가이드 RNA, 즉 표적 유전자좌로 Cas를 가이딩할 수 있는 RNA는 상기에 인용된 문서 예컨대 WO 2014/093622 (PCT/US2013/074667)에서 처럼 사용된다. 본 명세서에서 사용되는 용어 "여기서 가이드 서열이 하이브리드화할 수 있는"은 그와 하이브리드화하고 표적 RNA와 CRISPR 복합체의 결합을 매개하기 위해 표적 서열과 충분한 상보성을 갖는 gRNA의 세부항목을 의미한다. 일반적으로, 가이드 서열은 표적 서열과 하이브리드화하고 표적 서열에 대한 CRISPR 복합체의 서열-특이적 결합을 유도하도록 표적 폴리뉴클레오티드 서열과 충분한 상보성을 갖는 임의의 폴리뉴클레오티드 서열이다. 일부 실시형태에서, 적합한 정렬 알고리즘을 사용해 최적으로 정렬시, 가이드 서열과 이의 상응하는 표적 서열 간 상보성 정도는 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 또는 그 이상이다. 최적 정렬은 서열을 정렬하기 위한 임의의 적합한 알고리즘의 사용으로 결정될 수 있고, 이의 비제한적인 예는 스미스-워터만 (Smith-Waterman) 알고리즘, 니들만-분취 (Needleman-Wunsch) 알고리즘, 버로우스-윌러 (Burrows-Wheeler) 전환 기반 알고리즘 (예를 들어, 버로우 윌러 얼라이너), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies; novocraft.com에서 이용가능), ELAND (Illumina, San Diego, CA), SOAP (soap.genomics.org.cn에서 이용가능), 및 Maq (maq.sourceforge.net에서 이용가능)을 포함한다.
일정한 실시형태에서, 본 명세서에서 제공하는 CRISPR 시스템은 가이드 서열을 포함하는 crRNA 또는 유사한 폴리뉴클레오티드를 사용할 수 있고, 여기서 폴리뉴클레오티드는 RNA, DNA 또는 RNA 및 DNA의 혼합물이고/이거나, 폴리뉴클레오티드는 하나 이상의 뉴클레오티드 유사체를 포함한다. 서열은 제한없이 천연 crRNA의 구조, 예컨대 벌지, 헤어핀 또는 스템 루프 구조를 포함하는, 임의의 구조를 포함할 수 있다. 일정한 실시형태에서, 가이드 서열을 포함하는 폴리뉴클레오티드는 RNA 또는 DNA 서열일 수 있는 제2 폴리뉴클레오티드 서열과 듀플렉스를 형성한다.
일정한 실시형태에서, 화학적으로 변형된 가이드 RNA가 사용된다. 가이드 RNA의 화학적 변형의 예는 제한없이 하나 이상의 말단 뉴클레오티드에서 2'-O-메틸 (M), 2'-O-메틸 3'포스포로티오에이트 (MS), 또는 2'-O-메틸 3'티오PACE (MSP)의 도입을 포함한다. 이러한 화학적으로 변형된 가이드 RNA는 온-표적 (on-target) 대 오프-표적 (off-target) 특이성이 예측가능하지 않지만, 비변형된 가이드 RNA와 비교하여 증가된 안정성 및 증가된 활성을 포함할 수 있다. (2015년 6월 29일자로 온라인 공개된 [Hendel, 2015, Nat Biotechnol. 33(9):985-9, doi: 10.1038/nbt.3290] 참조). 화학적으로 변형된 가이드 RNA는 제한없이, 리보스 고리의 2' 및 4' 탄소 사이에 메틸렌 브릿지를 포함하는 잠김 핵산 (LNA) 및 포스포로티오에이트 연결을 갖는 RNA를 더 포함한다.
일부 실시형태에서, 가이드 서열은 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75개 뉴클레오티드 길이, 또는 그 이상의 뉴클레오티드 길이이다. 일부 실시형태에서, 가이드 서열은 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12개 미만의 뉴클레오티드 길이, 또는 그 이하의 뉴클레오티드 길이이다. 바람직하게, 가이드 서열은 10 내지 30개 뉴클레오티드 길이이다. 표적 서열과 CRISPR 복합체의 서열-특이적 결합을 유도하는 가이드 서열의 능력은 임의의 적합한 어세이를 통해 평가될 수 있다. 예를 들어, 시험하려는 가이드 서열을 포함하여, CRISPR 복합체를 형성하는데 충분한 CRISPR 시스템의 성분은 예컨대 CRISPR 서열의 성분을 코딩하는 벡터로 형질감염시킨 후에, 표적 서열 내에서 우선적인 절단의 평가, 예컨대 서베이어 (Surveyor) 어세이에 의해서 상응하는 표적 서열을 갖는 숙주 세포에 제공될 수 있다. 유사하게, 표적 RNA의 절단은 표적 서열, 시험하려는 가이드 서열을 포함하는 CRISPR 복합체의 성분 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 제공하고, 시험 및 대조군 가이드 서열 반응 간에 표적 서열의 결합 또는 절단 속도를 비교하여 시험관에서 평가될 수 있다. 다른 어세이가 가능하고, 당업자에게 존재할 수 있다.
가이드 서열, 및 그리하여 핵산-표적화 가이드 RNA는 임의의 표적 핵산 서열을 표적화하기 위해 선택될 수 있다. CRISPR 복합체의 형성 상황에서, "표적 서열"은 가이드 서열이 상보성을 갖도록 디자인되는 서열을 의미하고, 여기서 표적 서열과 가이드 서열 간 하이브리드화는 CRISPR 복합체의 형성을 촉진한다. 표적 서열은 RNA 폴리뉴클레오티드를 포함할 수 있다. 용어 "표적 RNA"는 표적 서열이거나 또는 그를 포함하는 RNA 폴리뉴클레오티드를 의미한다. 달리 말해서, 표적 RNA는 gRNA, 즉 가이드 서열의 일부분이 상보성을 갖도록 디자인되고 CRISPR 이펙터 단백질 및 gRNA를 포함하는 복합체에 의해 매개되는 이펙터 기능이 유도되게 하는 RNA 폴리뉴클레오티드 또는 RNA 폴리뉴클레오티드의 일부분일 수 있다. 일부 실시형태에서, 표적 서열은 세포의 핵 또는 세포질에 위치된다. 표적 서열은 DNA일 수 있다. 표적 서열은 임의의 RNA 서열일 수 있다. 일부 실시형태에서, 표적 서열은 메신저 RNA (mRNA), 프리-mRNA, 리보솜 RNA (rRNA), 전달 RNA (tRNA), 마이크로-RNA (miRNA), 소형 간섭 RNA (siRNA), 소형 핵 RNA (snRNA), 소형 핵 RNA (snoRNA), 이중 가닥 RNA (dsRNA), 넌코딩 RNA (ncRNA), 긴 넌코딩 RNA (lncRNA), 및 소형 세포질 RNA (scRNA)로 이루어진 군으로부터 선택되는 RNA 분자 내 서열일 수 있다. 일부 바람직한 실시형태에서, 표적 서열은 mRNA, 프리-mRNA, 및 rRNA로 이루어진 군으로부터 선택되는 RNA 분자 내 서열일 수 있다. 일부 바람직한 실시형태에서, 표적 서열은 ncRNA, 및 lncRNA로 이루어진 군으로부터 선택되는 RNA 분자 내 서열일 수 있다. 일부 보다 바람직한 실시형태에서, 표적 서열은 mRNA 분자 또는 프리-mRNA 분자 내 서열일 수 있다.
일부 실시형태에서, 핵산-표적화 가이드 RNA는 RNA-표적화 가이드 RNA 내 2차 구조의 정도를 감소시키도록 선택된다. 일부 실시형태에서, 핵산-표적화 가이드 RNA의 약 75%, 50%, 40%, 30%, 25%, 20%, 15%, 10%, 5%, 1% 미만, 또는 그 이하의 뉴클레오티드가 최적으로 폴딩될 때 자기-상보적 염기 쌍형성에 참여한다. 최적 폴딩은 임의의 적합한 폴리뉴클레오티드 폴딩 알고리즘에 의해 결정될 수 있다. 일부 프로그램은 깁스 (Gibbs) 자유 에너지의 계산을 기반으로 한다. 한가지 이러한 알고리즘의 예는 Zuker 및 Stiegler (Nucleic Acids Res. 9 (1981), 133-148)가 기술한 바와 같은 mFold이다. 다른 예의 폴딩 알고리즘은 중심 구조 예측 알고리즘을 사용하여, 비엔나 대학의 이론 화학 연구소 (Institute for Theoretical Chemistry at the University of Vienna)에서 개발한 온라인 웹서버 RNAfold이다 (예를 들어, [A.R. Gruber et al., 2008, Cell 106(1): 23-24]; 및 [PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62] 참조).
일정한 실시형태에서, 가이드 RNA 또는 crRNA는 직접 반복 (DR) 서열 및 가이드 서열 또는 스페이서 서열을 포함할 수 있거나, 그로 본질적으로 이루어질 수 있거나, 또는 그로 이루어진다. 일정한 실시형태에서, 가이드 RNA 또는 crRNA는 가이스 서열 또는 스페이서 서열에 융합되거나 또는 연결된 직접 반복 서열을 포함할 수 있거나, 본질적으로 그로 이루어질 수 있거나, 또는 그로 이루어질 수 있다. 일정한 실시형태에서, 직접 반복 서열은 가이드 서열 또는 스페이서 서열의 상류 (즉, 5')에 위치될 수 있다. 다른 실시형태에서, 직접 반복 서열은 가이드 서열 또는 스페이서 서열의 하류 (즉, 3')에 위치될 수 있다.
일정한 실시형태에서, crRNA는 스템 루프, 바람직하게 단일 스템 루프를 포함한다. 일정한 실시형태에서, 직접 반복 서열은 스템 루프, 바람직하게 단일 스템 루프를 형성한다.
일정한 실시형태에서, 가이드 RNA의 스페이서 길이는 15 내지 35 nt이다. 일정한 실시형태에서, 가이드 RNA의 스페이서 길이는 적어도 15개 뉴클레오티드, 바람직하게 적어도 18 nt, 예컨대 적어도 19, 20, 21, 22 nt 이상이다. 일정한 실시형태에서, 스페이서 길이는 15 내지 17 nt, 예를 들어, 15, 16, 또는 17 nt,17 내지 20 nt, 예를 들어, 17, 18, 19, 또는 20 nt, 20 내지 24 nt, 예를 들어, 20, 21, 22, 23, 또는 24 nt, 23 내지 25 nt, 예를 들어, 23, 24, 또는 25 nt, 24 내지 27 nt, 예를 들어, 24, 25, 26, 또는 27 nt, 27-30 nt, 예를 들어, 27, 28, 29, 또는 30 nt, 30-35 nt, 예를 들어, 30, 31, 32, 33, 34, 또는 35 nt, 또는 35 nt 이상의 길이이다.
일정한 실시형태에서, 가이드 RNA의 스페이서 길이는 28개 미만의 뉴클레오티드이다. 일정한 실시형태에서, 가이드 RNA의 스페이서 길이는 적어도 18개 뉴클레오티드 및 28개 미만의 뉴클레오티드이다. 일정한 실시형태에서, 가이드 RNA의 스페이서 길이는 19 내지 28개 뉴클레오티드이다. 일정한 실시형태에서, 가이드 RNA의 스페이서 길이는 19 내지 25개 뉴클레오티드이다. 일정한 실시형태에서, 가이드 RNA의 스페이서 길이는 20개 뉴클레오티드이다. 일정한 실시형태에서, 가이드 RNA의 스페이서 길이는 23개 뉴클레오티드이다. 일정한 실시형태에서, 가이드 RNA의 스페이서 길이는 25개 뉴클레오티드이다.
고전적인 CRISPR-Cas 시스템에서, 가이드 서열과 이의 상응하는 표적 서열 간 상보성 정도는 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, 또는 100% 이상일 수 있거나; 가이드 또는 RNA 또는 sgRNA는 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75개, 또는 그 이상의 뉴클레오티드 길이일 수 있거나; 또는 가이드 또는 RNA 또는 sgRNA는 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12개 미만의 뉴클레오티드 길이, 또는 그 이하의 뉴클레오티드 길이일 수 있다. 그러나, 본 발명의 양상은 오프-표적 상호작용을 감소시키는 것이고, 예를 들어 낮은 상보성을 갖는 표적 서열과 상호작용하는 가이드를 감소시키는 것이다. 실제로, 예에서, 80% 내지 약 95% 상보성, 예를 들어, 83%-84% 또는 88-89% 또는 94-95% 초과의 상보성을 갖는 오프-표적 서열 및 표적 서열을 구별할 수 있는 CRISPR-Cas 시스템을 생성시키는 돌연변이를 포함한다는 것을 보여준다 (예를 들어, 18개 뉴클레오티드를 갖는 표적과 1, 2 또는 3개 미스매치를 갖는 18개 뉴클레오티드의 오프-표적을 구별함). 따라서, 본 발명의 문맥에서, 가이드 서열과 이의 상응하는 표적 서열 간 상보성의 정도는 94.5% 또는 95% 또는 95.5% 또는 96% 또는 96.5% 또는 97% 또는 97.5% 또는 98% 또는 98.5% 또는 99% 또는 99.5% 또는 99.9%, 또는 100%를 초과한다. 비표적은 그 서열과 가이드 간에 100% 또는 99.9% 또는 99.5% 또는 99% 또는 99% 또는 98.5% 또는 98% 또는 97.5% 또는 97% 또는 96.5% 또는 96% 또는 95.5% 또는 95% 또는 94.5% 또는 94% 또는 93% 또는 92% 또는 91% 또는 90% 또는 89% 또는 88% 또는 87% 또는 86% 또는 85% 또는 84% 또는 83% 또는 82% 또는 81% 또는 80% 미만의 상보성이고, 비표적은 그 서열과 가이드 간에 100% 또는 99.9% 또는 99.5% 또는 99% 또는 99% 또는 98.5% 또는 98% 또는 97.5% 또는 97% 또는 96.5% 또는 96% 또는 95.5% 또는 95% 또는 94.5%의 상보성인 것이 유리하다.
일정한 실시형태에서, 절단 효율의 조절은 스페이서/표적을 따라 미스매치의 위치를 포함하여, 스페이서 서열 및 표적 서열 간에 미스매치, 예를 들어 하나 이상의 미스매치, 예컨대 1 또는 2개 미스매치의 도입에 의해 활용할 수 있다. 예를 들어 보다 중심 (즉, 3' 또는 5'이 아님)에 이중 미스매치가 존재할수록, 절단 효율이 보다 영향받는다. 따라서, 스페이서를 따라서 미스매치 위치를 선택함으로써, 절단 효율이 조절될 수 있다. 예로서, 표적의 100% 미만의 절단이 바람직하면 (예를 들어, 세포 개체군에서), 스페이서 및 표적 서열 간에 하나 이상, 예컨대 바람직하게 2개 미스매치가 스페이서 서열에 도입될 수 있다. 미스매치 위치의 스페이서를 따라서 보다 중심일수록, 절단 비율은 더 낮다.
일정한 예의 실시형태에서, 절단 효율은 단일 뉴클레오티드, 예컨대 단일 뉴클레오티드 다형성 (SNP), 변이, 또는 (점) 돌연변이가 다른 둘 이상의 표적을 구별할 수 있는 단일 가이드를 디자인하기 위해 활용될 수 있다. CRISPR 이펙터는 SNP (또는 다른 단일 뉴클레오티드 변이)에 대한 감도를 감소시킬 수 있고 일정한 수준의 효율로 SNP 표적을 계속 절달할 수 있다. 따라서, 2개 표적, 또는 표적 세트의 경우에, 가이드 RNA는 표적 중 하나와 상보적인 뉴클레오티드 서열, 즉 온-표적 SNP를 갖도록 디자인될 수 있다. 가이드 RNA는 합성 미스매치를 갖도록 더욱 디자인된다. 본 명세서에서 사용되는 "합성 미스매치"는 천연 발생 SNP의 상류 또는 하류에 도입되는 비천연 발생 미스매치, 예컨대 상류 또는 하류에 5개 이하의 뉴클레오티드, 예를 들어 상류 또는 하류에 4, 3, 2, 또는 1개의 뉴클레오티드, 바람직하게 상류 또는 하류에 3개 이하의 뉴클레오티드, 더 바람직하게 상류 또는 하류에 2개 이하의 뉴클레오티드, 가장 바람직하게 상류 또는 하류에 1개 뉴클레오티드 (즉, SNP에 인접)를 의미한다. CRISPR 이펙터는 온-표적 SNP에 결합할 때, 오직 단일 미스매치가 합성 미스매치와 함께 형성될 것이고 CRISPR 이펙터는 계속 활성화될 것이고 검출가능한 신호가 생성될 것이다. 가이드 RNA가 오프-표적 SNP와 하이브리드화될 때, SNP로부터의 미스매치 및 합성 미스매치의, 2개 미스매치가 형성될 것이고, 검출가능한 신호는 발생되지 않을 것이다. 따라서, 본 명세서에 개시된 시스템은 개체군 내에서 SNP를 구별하도록 디자인될 것이다. 예를 들어, 시스템은 단일 SNP가 상이한 병원성 균주를 구별하거나 또는 일정한 질환 특이적 SNP, 예컨대 제한없이 질환 연관된 SNP, 예컨대 제한없이 암 연관된 SNP를 검출하는데 사용될 수 있다.
일정한 실시형태에서, 가이드 RNA는 SNP가 스페이서 서열의 (5' 말단에서 시작하여) 위치 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30에 위치되도록 디자인된다. 일정한 실시형태에서, 가이드 RNA는 SNP가 스페이서 서열의 (5' 말단에서 시작하여) 위치 1, 2, 3, 4, 5, 6, 7, 8, 또는 9에 위치되도록 디자인된다. 일정한 실시형태에서, 가이드 RNA는 SNP가 스페이서 서열의 (5' 말단에서 시작하여) 위치 2, 3, 4, 5, 6, 또는 7에 위치되도록 디자인된다. 일정한 실시형태에서, 가이드 RNA는 SNP가 스페이서 서열의 (5' 말단에서 시작하여) 위치 3, 4, 5, 또는 6에 위치되도록 디자인된다. 일정한 실시형태에서, 가이드 RNA는 SNP가 스페이서 서열의 (5' 말단에서 시작하여) 위치 3에 위치되도록 디자인된다.
일정한 실시형태에서, 가이드 RNA는 미스매치 (예를 들어, 합성 미스매치, 즉 SNP 이외의 추가 돌연변이)가 스페이서 서열의 (5' 말단에서 시작하여) 위치 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30에 위치되도록 디자인된다. 일정한 실시형태에서, 가이드 RNA는 미스매치가 스페이서 서열의 (5' 말단에서 시작하여) 위치 1, 2, 3, 4, 5, 6, 7, 8, 또는 9에 위치되도록 디자인된다. 일정한 실시형태에서, 가이드 RNA는 미스매치가 스페이서 서열의 (5' 말단에서 시작하여) 위치 4, 5, 6, 또는 7에 위치되도록 디자인된다. 일정한 실시형태에서, 가이드 RNA는 미스매치가 스페이서 서열의 (5' 말단에서 시작하여) 위치 5에 위치하도록 디자인된다.
일정한 실시형태에서, 가이드 RNA는 미스매치가 SNP의 상류 2개 뉴클레오티드 (즉, 하나의 개재 뉴클레오티드)에 위치되도록 디자인된다.
일정한 실시형태에서, 가이드 RNA는 미스매치가 SNP의 하류 2개 뉴클레오티드 (즉, 하나의 개재 뉴클레오티드)에 위치되도록 디자인된다.
일정한 실시형태에서, 가이드 RNA는 미스매치가 스페이서 서열의 (5' 말단에서 시작하여) 위치 5에 위치되록 SNP가 스페이서 서열의 (5' 말단에서 시작하여) 위치 3에 위치되도록 디자인된다.
본 명세서에 기술된 실시형태는 본 명세서에 기술된 바와 같이 벡터를 세포에 전달하는 단계를 포함하는 본 명세서에 기술된 바와 같은 진핵생물 세포 (시험관내, 즉 단리된 진핵생물 세포)에서 하나 이상의 뉴클레오티드 변형을 유도하는 것을 이해한다. 돌연변이(들)는 가이드(들) RNA(들)를 통해서 세포(들)의 각 표적 서열에서 하나 이상의 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해서 상기 세포(들)의 각 표적 서열에서 1-75개 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해서 상기 세포(들)의 각 표적 서열에서 1, 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해서 상기 세포(들)의 각 표적 서열에서 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해서 상기 세포(들)의 각 표적 서열에 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실 또는 치환을 포함한다. 돌연변이는 가이드(들) RNA(들)를 통해서 상기 세포(들)의 각 표적 서열에 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해서 상기 세포(들)의 각 표적 서열에 40, 45, 50, 75, 100, 200, 300, 400 또는 500개 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다.
전형적으로, 내생성 CRISPR 시스템의 상황에서, CRISPR 복합체 (표적 서열과 하이브리드화하고 하나 이상의 Cas 단백질과 복합체를 형성하는 가이드 서열 포함)의 형성은 그 결과로 표적 서열 내 또는 그 근처 (예를 들어, 표적 서열로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50개 이상의 염기쌍 이내)에서 절단을 일으키지만, 특히 RNA 표적의 경우에, 예를 들어 2차 구조에 의존적일 수 있다.
신호 증폭 CRISPR 이펙터 단백질
일정 예의 실시형태에서, 신호 증폭 CRISPR 이펙터 단백질은 III-A형 CRISPR-Cas 시스템 이펙터 단백질이다. 일정 예의 실시형태에서, III-A형 CRISPR-Cas 이펙터 단백질은 Csm6이다. Csm6은 다중단백질 Csm 이펙터 복합체와 함께 기능하지만, 그 복합체의 일부는 아니다 (예를 들어, US20170198286 A1; WO2016035044A1; [M. Kazlauskiene et al., Science 10.1126/science.aao0100 (2017)]; 및 [Niewoehner et al. 2017, 2017년 6월 23일에 최초로 bioRxiv에 프리프린트가 온라인 게재; doi: dx.doi.org/10.1101/153262).
스타필로코커스 에피더미디스 (Staphylococcus epidermidis)에서, Csm 복합체 (SeCsm)는 Cas10, Csm2, Csm3, Csm4, 및 Csm5 단백질로 구성된다. III-A형 CRISPR-Cas 시스템은 스트렙토코커스 써모필러스 (Streptococcus thermophilus) (St)에 대한 Csm 복합체를 사용하여 시험관내 및 세포 둘 모두에서 RNA 절단 활성을 갖는다는 것이 입증되었다 (예를 들어, US20170198286 A1 참조).
III-A형 CRISPR-Cas 시스템은 스트렙토코커스 써모필러스 (GenBank KM222358), DGCC7710 (GenBank AWVZ01000003), LMD-9 (GenBank NC008532), 스타필로코커스 에피더미디스 RP62a (GenBank NC002976), 엔테로코커스 이탈리커스 (Enterococcus italicus) DSM15952 (GenBank AEPV01000074), 락토코커스 락티스 (Lactococcus lactis) DGCC7167 (GenBank JX524189) 및 술폴로버스 솔파타리커스 (Sulfolobus solfataricus) P2 (GenBank AE006641)를 포함한다. DGCC8004의 III-A형 시스템은 CRISPR2 어레이에 측접된 10개 Cas 유전자를 함유하고 cast, cas2, cas6, cas10, csm2, csm3, csm4, csm5, csm6 and csm6' 유전자를 포함한다. DGCC8004 CRISPR2 유전자좌는 DGCC7710 (GenBank AWVZ00000000, (Horvath and Barrangou, 2010)) 및 LMD-9 (GenBank NC_008532, (Makarova et al., 2006))의 것과 유사한 유전자 배열을 공유한다. 주요한 차이는 DGCC8004의 추가 csm6' 유전자이다. DGCC8004의 Csm6' 단백질은 386 aa을 포함하고 428 aa Csm6 단백질과 34% 아미노산 동일성을 보여서, 서열 분기 이후 가능한 고대 유전자 복제 사건을 시사한다. 대조적으로, DGCC7710은 csm6의 전방에 오직 짧은 117-nt ORF만을 함유한다. DGCC8004의 CRISPR2와 연관된 Cas/Csm 단백질은 DGCC7710 및 LMD-9의 상응하는 단백질과 상동성 (∼70% 동일성을 공유하는, Csm2 단백질을 제외하고, 90% 초과의 aa 동일성)이다. 스타필로코커스 에피더미디스 RP62a (GenBank NC002976, (Marraffini and Sontheimer, 2008)), 엔테로코커스 이탈리커스 DSM15952 (GenBank AEPV01000074, (Millen et al., 2012)) 및 락토코커스 락티스 DGCC7167 (GenBank JX524189, (Millen et al., 2012))를 포함하여, 다른 실험적으로 특징규명된 III-A형 시스템은 DGCC8004와 cas10-csm2-csm3-csm4-csm5-csm6 유전자 클러스터의 보존된 배열을 공유하는 반면, cas6 및 cast/cas2 유전자의 위치는 일부 균주에서 상이하다. 술폴로버스 솔파타리커스 P2 (GenBank AE006641)의 III-A형 CRISPR-Cas는 상이한 유전자 구성을 가지며 DGCC8004의 Cas/Csm 오솔로그와 낮은 단백질 서열 유사성을 보인다. 주목할만하게, Csm3 단백질은 상이한 균주에 걸쳐 Cas/Csm 단백질 간에 가장 보존적이며 5 카피수의 Csm3 파라로그가 술폴로버스 솔파타리커스에 존재한다. 스타필로코커스 에피더미디스, 디. 이탈리커스 및 락토코커스 락티스의 반복 서열은 동일한 길이 (36 nt)이지만, 뉴클레오티드 보존은 반복부의 3' 말단 및 팔린드롬 부분에 국한된다. crRNA 5'-핸들에 기여할 수 있는, 반복부의 8 nt 3'-말단 서열은 스트렙토코커스 써모필러스, 스타필로코커스 에피더미디스, 엔테로코커스 이탈리커스 및 락토코커스 락티스 간에 ACGRRAAC 공통부를 보이지만 술폴로버스 솔파타리커스와는 상이하다 (AUUGAAG (Rouillon et al., 2013)).
Csm6은 ssRNA-특이적 엔도리보뉴클레아제인 것으로 확인되었고 이러한 활성의 구조적 기초가 결정되었다 (Niewoehner and Jinek, 2016, Structural basis for the endoribonuclease activity of the type III-A CRISPR-associated protein Csm6. RNA 22:318-329).
일부 실시형태에서, 본 발명의 핵산-표적화 시스템의 하나 이상의 엘리먼트는 내생성 CRISPR RNA-표적화 시스템을 포함하는 특정 유기체로부터 유래된다. 일정 실시형태에서 CRISPR RNA-표적화 시스템은 Csm6 단백질, Csm6 오솔로그, 또는 Csm6-유사 단백질을 포함한다. 본 명세서에서 사용시, Csm6의 논의는 또한 Csm6 단백질, Csm6 오솔로그, 또는 Csm6-유사 단백질을 의미한다. Csm6 오솔로그는 본 명세서에 기술되고 당분야에 공지된 바와 같은 유기체에 존재할 수 있다 (예를 들어, WO2016035044A1 및 [Niewoehner and Jinek, 2016] 참조). 예시적인 Csm6 오솔로그는 제한없이, 써머스 써모필러스 (TtCsm6, GI:55978335), 스타필로코커스 에피더미디스 (SeCsm6, GI:488416649), 스트렙토코커스 뮤탄스 (Streptococcus mutans) (SmCsm6, GI:24379650), 스트렙토코커스 써모필러스 (Streptococcus thermophiles) (StCsm6, GI:585230687), 및 피. 퓨리오서스 (P. furiosus) Csx1 (PfCsx1, GI:33359545)을 포함한다. 일정 실시형태에서 본 발명에 유용한 Csm6 단백질은 적어도 하나의 N-말단 CARF (CRISPR-associated Rossman fold) 도메인 및 적어도 하나의 C-말단 HEPN 도메인 (higher eukaryotes and prokaryotes nucleotide-binding domain)을 포함한다. 일정 실시형태에서 Csm6 단백질은 이량체를 형성한다. 일정 실시형태에서 HEPN 도메인의 이량체화는 리보뉴클레아제 활성 부위의 형성을 야기시킨다. 일정 실시형태에서 CARF 도메인의 이량체 계면은 양전기 포켓을 포함한다. 이론에 국한하지 않지만, 포켓은 리보뉴클레아제 활성의 알로스테릭 제어를 위한 리간드-결합 부위로서 기능할 수 있다.
일정 예의 실시형태에서, 본 명세서에 기술된 CRISPR-기반 검출 시스템은 제한없이 본 명세서에 기술된 HEPN 도메인, 당분야에 공지 (Niewoehner and Jinek, 2016)된 HEPN 도메인, 및 공통 서열 모티프와 비교에 의해 HEPN 도메인으로 인식되는 도메인을 포함하여, 적어도 하나의 HEPN 도메인을 포함하는 Csm6 단백질을 포함한다. 몇몇 이러한 도메인이 본 명세서에서 제공된다. 비제한적인 한 예에서, 공통 서열은 본 명세서에서 제공하는 C2c2 또는 Cas13b 오솔로그의 서열로부터 유래될 수 있다. 일정 예의 실시형태에서, Csm6 단백질은 단일 HEPN 도메인을 포함한다. 일정한 다른 예의 실시형태에서, Csm6 단백질은 2개의 HEPN 도메인을 포함한다.
일례의 실시형태에서, Csm6 단백질은 RxxxxH 모티프 서열을 포함하는 하나 이상의 HEPN 도메인을 포함한다. RxxxxH 모티프 서열은 제한없이 본 명세서에 기술된 HEPN 도메인 또는 당분야에 공지된 HEPN 도메인 유래일 수 있다. RxxxxH 모티프 서열은 둘 이상의 HEPN 도메인을 조합하여 생성된 모티프 서열을 더 포함한다. 언급된 바와 같이, 공통 서열은 본 명세서에 개시된 오솔로그의 서열로부터 유래될 수 있다. 일정 실시형태에서 HEPN 도메인은 보존된 R-X4-6-H 모티프를 포함한다 ([Anantharaman et al., Biol Direct. 2013 Jun 15; 8:15]; 및 [Kim et al., Proteins. 2013 Feb; 81(2):261-70]).
본 발명의 일 실시형태에서, HEPN 도메인은 R{N/H/K}X1X2X3H의 서열 (SEQ ID NO:571)을 포함하는 적어도 하나의 RxxxxH 모티프를 포함한다. 본 발명의 일 실시형태에서, HEPN 도메인은 R{N/H}X1X2X3H의 서열 (SEQ ID NO:572)을 포함하는 RxxxxH 모티프를 포함한다. 본 발명의 일 실시형태에서, HEPN 도메인은 R{N/K}X1X2X3H의 서열 (SEQ ID NO:573)을 포함한다. 일정 실시형태에서 X1은 R, S, D, E, Q, N, G, Y, 또는 H이다. 일정 실시형태에서 X2는 I, S, T, V, 또는 L이다. 일정 실시형태에서 X3은 L, F, N, Y, V, I, S, D, E, 또는 A이다.
CARF 도메인 및 CARF 도메인에 대한 공통 서열이 기술된 바 있다 (see, e.g., Makarova et al., Front Genet. 2014; 5: 102). 일정 실시형태에서 Csm6은 β-헤어핀을 형성하는 코어 가닥-5 및 가닥-6을 갖는 6-가닥 로스만 (Rossmann)-유사 폴드를 포함하는 코어 도메인을 포함하는 적어도 하나의 CARF 도메인을 포함한다. 주요한 서열 보존 영역은 코어 도메인의 가닥-1 및 가닥-4와 연관된다. 일정 실시형태에서 가닥-1의 말단은 전형적으로 알콜 측쇄 (S/T)를 갖는, 극성 잔기를 특징으로 한다. 일정 실시형태에서 가닥-4의 바로 하류는 바람직하게는 [DN]X[ST]XXX[RK] (SEQ ID NO:574) 서명과 연관된, 고도로 보존된 염기성 잔기 (K/R)이다. 일정 실시형태에서 Csm6은 절두되어서 N-말단 CARF 도메인 (예를 들어, TtCsm6의 아미노산 1-190 또는 오솔로그 Csm6 단백질의 균등한 잔기)이 제거된다.
일정 실시형태에서 Csm6은 적어도 하나의 6H 도메인을 포함한다 (Niewoehner and Jinek, 2016). TtCsm6 폴리펩티드 사슬의 6H 도메인 (잔기 191-292)은 5개 α-헬릭스로 이루어지고 시계-방향 솔레노이드 도메인을 형성한다. 이론에 국한되지 않지만, 일부 오솔로그는 6H 도메인을 갖지 않을 수 있으므로, 이러한 도메인은 본 발명의 Csm6 단백질의 활성에 요구되지 않는다.
Csm6은 침략자 RNA 전사물을 분해하는 독립형 리보뉴클레아제로서 기능하여 간섭에 기여하는 것으로 확인되었다. Csm6 단백질은 III형 간섭 복합체에 의해 생성되는 제2 메신저를 통해 활성화된다. III형 간섭 복합체에 의한 표적 RNA 결합 시에, Cas10 서브유닛은 ATP를 사이클릭 올리고아데닐레이트 생성물로 전환시키고, 이의 CARF 도메인에 결합하여 Csm6을 알로스테릭하게 활성화시킨다. 알로스테릭 활성화를 제거한 CARF 도메인 돌연변이는 생체내에서 Csm6 활성, 및 Csm6의 Cas10 Palm 도메인 표현형 모사 (phenocopy) 상실의 돌연변이를 억제한다 ([M. Kazlauskiene et al., 2017]; 및 [Niewoehner et al. 2017]).
일정 예의 실시형태에서, 신호 증폭 CRISPR 이펙터 단백질은 활성화된 CRISPR 검출 단백질이 활성화 서열을 절단시킬 때 활성화된다. 활성화 서열은 하기에 더욱 구체적으로 상술된다. 활성화 서열의 절단 생성물은 신호 증폭 CRISPR 이펙터 단백질의 별개 활성, 예컨대 RNA 뉴클레아제 활성을 활성화시킨다. 예를 들어, Csm6은 활성화되면, Cas13 효소의 부차적 효과와 무차별적으로 유사하게 RNA를 절단한다. 따라서, 리포터 구성체의 검출 이펙터 변형 이외에도, 활성화된 신호 증폭 CRISPR 이펙터 단백질은 또는 신호 발생을 더 증강시키기 위해 리포터 구성체를 변형시킨다. 일정 실시형태에서 Csm6은 다른 CRISPR 효소 (예를 들어, Cas13)와 함께 제공될 때 활성화된다. 일정 실시형태에서 Csm6은 Cas13과 함께 사용될 대 상승 효과를 생성시킬 수 있어서, Cas13 부차적 활성이 상당히 증가된다. 이론에 국한하지 않지만, Cas13의 농도는 Csm6가 또한 어세이 (예를 들어, 현장 진단 어세이)에 포함될 때 어세이에서 상당히 감소될 수 있다. 따라서, Cas13 진단 어세이에 Csm6 첨가는 어세이의 감도를 증가시키고 비용을 감소시키기 위해 사용될 수 있다.
일정 예의 실시형태에서, 하나 이상의 신호 증폭 이펙터 단백질은 표 4로부터 선택된다.
표 4
활성화 서열
활성화 서열은 CRISPR 신호 증폭 이펙터 단백질과 함께 사용된다. 일정 예의 실시형태에서, 활성화 서열은 CRISPR 검출 이펙터 단백질이 활성화되면 CRISPR 검출 이펙터 단백질에 의해 절단된다. 활성화 서열의 절단은 그 결과로 CRISPR 신호 증폭 이펙터 단백질을 활성화시키는 절단 단편을 야기시킨다. 상기 언급된 바와 같이, 일정 예의 실시형태에서, CRISPR 신호 증폭 이펙터 단백질의 활성화는 검출가능한 신호의 상승적 발생을 야기시킨다. 일정 예의 실시형태에서, 활성화 서열은 동종중합체 올리고뉴클레오티드이다. 일정 예의 실시형태에서, 동종중합체 올리고뉴클레오티드의 절단은 CRISPR 신호 증폭 이펙터 단백질의 활성화를 자극하는 3'-2,3 사이클릭 포스페이트를 갖는 적어도 하나의 절단 생성물을 생성시킨다. 일정 예의 실시형태에서, 동종중합체는 폴리-A 올리고뉴클레오티드이다. 일정 예의 실시형태에서, 활성화 서열은 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개 뉴클레오티드 길이이다. 일정 예의 실시형태에서, 활성화 서열은 5 내지 10개 뉴클레오티 길이, 5 내지 15개 뉴클레오티드 길이, 5 내지 20개 뉴클레오티드 길이, 5 내지 25개 뉴클레오티드 길이, 5 내지 30개 뉴클레오티드 길이, 10 내지 15개 뉴클레오티드 길이, 10 내지 20개 뉴클레오티드 길이, 10 내지 25개 뉴클레오티드 길이, 10 내지 30개 뉴클레오티드 길이, 15 내지 20개 뉴클레오티드 길이, 15 내지 25개 뉴클레오티드 길이, 15 내지 30개 뉴클레오티드 길이, 20 내지 25개 뉴클레오티드 길이, 20 내지 30개 뉴클레오티드 길이, 또는 25 내지 30개 뉴클레오티드 길이이다.
예시적인 활성화 서열은 표 5에 표시되어 있다.
표 5
리포터 구성체
본 명세서에서 사용되는, "리포터 구성체"는 본 명세서에 기술된 활성화된 CRISPR 시스템 이펙터 단백질에 의해 절단될 수 있거나 또는 달리 탈활성화될 수 있는 분자이다. 용어 "리포터 구성체"는 또한 "검출 구성체" 또는 "차폐성 구성체"로서 대체하여 언급될 수있다. 일정 예의 실시형태에서, 리포터 구성체는 RNA-기반 리포터 구성체이다. 리포터 구성체는 양성 검출가능한 신호의 발생 또는 검출이 CRISPR 이펙터 시스템이 활성화되지 않으면 활성화되지 않도록 구성된다. 양성 검출가능한 신호는 광학, 형광, 화학발광, 전기화학 또는 다른 당분야에 공지된 검출 방법을 사용해 검출될 수 있는 임의 신호일 수 있다. 리포터 구성체는 리포터 구성체가 CRISPR 이펙터 단백질 활성에 의해 변형될 때까지 검출가능한 양성 신호의 존재를 차폐하거나 또는 검출가능한 양성 신호의 발생을 방지할 수 있다. 용어 "양성 검출가능한 신호"는 리포터 구성체의 존재 하에서 검출할 수 있는 다른 검출가능한 신호를 구별하는데 사용된다. 예를 들어, 일정한 실시형태에서, 제1 신호 (즉, 음성 검출가능한 신호)는 미변형된 리포터 구성체가 존재할 때 검출될 수 있고, 그 이후에 활성화된 CRISPR 이펙터 단백질에 의해 리포터 구성체의 변형 시 제2 신호 (예를 들어, 양성 검출가능한 신호)로 전환된다.
일정한 예의 실시형태에서, 차폐성 구성체는 유전자 생성물의 발생을 억제할 수 있다. 유전자 생성물은 샘플에 첨가되는 리포터 구성체에 의해 코딩될 수 있다. 차폐성 구성체는 RNA 간섭 경로에 관여하는 간섭 RNA, 예컨대 shRHN 또는 siRNA일 수 있다. 차폐성 구성체는 또한 마이크로RNA (miRNA)를 포함할 수 있다. 존재하지만, 차폐성 구성체는 유전자 생성물의 발현을 억제한다. 유전자 생성물은 형광성 단백질 또는 다른 RNA 전사물 또는 달리 표지화된 프로브 또는 항체에 의해서 검출가능하지만 차폐성 구성체의 존재를 위한 단백질일 수 있다. 이펙터 단백질의 활성화 시에 차폐성 구성체는 절단되거나 또는 달리 침묵화되어서 양성 검출가능한 신호로서 유전자 생성물의 발현 및 검출이 가능하게 된다.
일정한 예의 실시형태에서, 차폐성 구성체는 차폐성 구성체로부터 하나 이상의 시약의 방출이 검출가능한 양성 신호의 발생을 일으키도록 검출가능한 양성 신호를 발생시키는데 필요한 하나 이상의 시약을 격리시킬 수 있다. 하나 이상의 시약은 비색 신호, 화학발광 신호, 형광 신호 또는 임의의 다른 검출가능한 신호를 생성시키도록 조합될 수 있고 이러한 목적에 적합한 것으로 알려진 임의의 시약을 포함할 수 있다. 일정한 예의 실시형태에서, 하나 이상의 시약은 하나 이상의 시약에 결합하는 RNA 압타머에 의해 격리된다. 하나 이상의 시약은 이펙터 단백질이 표적 분자의 검출 시에 활성화될 때 방출된다. 일정한 예의 실시형태에서, 하나 이상의 시약은 단백질이 단백질에 하나 이상의 RNA 압타머의 결합에 의해 검출가능한 신호를 발생시킬 수 없도록 억제되거나 또는 격리되는, 검출가능한 신호, 예컨대 비색, 화학발광 또는 형광발광 신호의 발생을 촉진할 수 있는, 단백질, 예컨대 효소이다. 본 명세서에 개시된 이펙터 단백질의 활성화 시에, RNA 압타머는 그들이 더 이상 검출가능한 신호를 발생시키는 단백질의 능력을 억제하지 않는 정도로 절단되거나 또는 분해된다. 일정한 예의 실시형태에서, 압타머는 트롬빈 억제제 압타머이다. 일정한 예의 실시형태에서, 트롬빈 억제제 압타머는 GGGAACAAAGCUGAAGUACUUACCC (SEQ ID NO: 131)의 서열을 갖는다. 이러한 압타머가 절단될 때, 트롬빈은 활성화될 것이고 펩티드 비색 또는 형광 기질을 절단할 것이다. 일정한 예의 실시형태에서, 비색 기질은 트롬빈에 대한 펩티드 기질에 공유적으로 연결된 파라-니트로아닐리드 (pNA)이다. 트롬빈에 의해 절단 시, pNA가 방출되고 노란 색상이 되어 쉽게 육안으로 볼 수 있다. 일정한 예의 실시형태에서, 형광 기질은 형광도 검출기를 사용하여 검출할 수 있는 7-아미노-4-메틸쿠마린이다. 억제성 압타머는 또한 상기에 제시된 일반 원리 내에서 홀스래디쉬 퍼옥시다제 (HRP), 베타-갈락토시다제, 또는 송아지 알칼리 포스파타제 (CAP)에 대해 사용될 수 있다.
일정한 실시형태에서, RNAse 활성은 효소-억제성 압타머의 절단을 통해 비색적으로 검출된다. RNAse 활성을 비색 신호로 전환시키는 하나의 잠재적인 방식은 비색 출력을 생성시킬 수 있는 효소의 재활성화와 RNA 압타머의 절단을 커플링시키는 것이다. RNA 절단의 부재 하에서, 온전한 압타머는 효소 표적에 결합하여 이의 활성을 억제하게 될 것이다. 이러한 판독 시스템의 장점은 효소가 추가 증폭 단계를 제공한다는 것이다: 부차적 활성 (예를 들어, Cas13a 부차적 활성)을 통해서 압타머로부터 유리되면, 비색 효소는 비색 생성물을 계속 생성시켜서, 신호의 배가를 일으키게 될 것이다.
일정한 실시형태에서, 비색 판독의 효소를 억제하는 현존 압타머가 사용된다. 비색 판독되는 몇몇 압타머/효소 쌍에는 예컨대 트롬빈, 단백질 C, 호중구 엘라스타제 및 서브스틸리신이 존재한다. 이들 프로테아제는 pNA를 기반으로 비색 기질을 가지며 상업적으로 입수가능하다. 일정한 실시형태에서, 일반적인 비색 효소를 표적화하는 신규한 압타머가 사용된다. 일반적인 강건한 효소, 예컨대 베타-갈락토시다제, 홀스래디쉬 퍼옥시다제 또는 송아지 장 알칼리 포스파타제는 선택 전략 예컨대 SELEX에 의해 디자인된 조작된 압타머에 의해 표적화될 수 있다. 이러한 전략은 나노몰 결합 효율로 압타머의 신속한 선택을 가능하게 하고 비색 판독을 위한 추가의 효소/압타머 쌍의 개발에 사용될 수 있다.
일정한 실시형태에서, RNAse 활성은 RNA-테더드 억제제의 절단을 통해서 비색으로 검출된다. 많은 일반 비색 효소는 경쟁적, 가역적 억제제를 가지며, 예를 들어 베타-갈락토시다제는 갈락토스에 의해 억제될 수 있다. 많은 이들 억제제는 약하지만, 그들의 효과는 국소 농도를 증가시켜서 증가될 수 있다. 억제제의 국소 농도를 RNAse 활성과 연결시킴으로써, 비색 효소 및 억제제 쌍은 RNAse 센서에 조작될 수 있다. 소형-분자 억제제를 기반으로 하는 비색 RNAse 센서는 3종의 성분을 포함하는데, 비색 효소, 억제제, 및 억제제를 효소에 속박시키는, 억제제와 효소 둘 모두에 공유적으로 연결된 브릿징 RNA이다. 미절단된 구성에서, 효소는 소형 분자의 증가된 국소 농도에 의해 억제되고, RNA가 (예를 들어, Cas13a 부차적 절단에 의해) 절단될 때, 억제제가 방출될 것이고 비색 효소가 활성화될 것이다.
일정한 실시형태에서, RNAse 활성은 G-사중체의 형성 및/또는 활성화를 통해 비색적으로 검출된다. DNA의 G 사중체는 헴 (heme) (철 (III)-프로토폴피린 IX)과 복합체를 형성하여 퍼옥시다제 활성을 갖는 DNAzyme을 형성할 수 있다. 퍼옥시다제 기질 (예를 들어, ABTS: (2,2'-아지노비스 [3-에틸벤조티아졸린-6-술폰산]-디암모늄 염))이 공급될 때, 과산화수소의 존재 하에서 G-사중체-헴 복합체가 기질의 산화를 야기하고, 그 다음에 용액 중에서 녹색을 형성시킨다. G-사중체 형성 DNA 서열의 예는 GGGTAGGGCGGGTTGGGA (SEQ ID NO: 132)이다. 이러한 DNA 압타머와 RNA 서열을 하이브리드화시킴으로써, G-사중체 구조의 형성은 제한될 것이다. RNAse 부차적 활성화 (예를 들어, C2c2-복합체 부차적 활성화) 시에, RNA 스테이플은 절단되어서 G 사중체가 형성되고 헴이 결합할 수 있게 될 것이다. 이러한 전략은 RNAse 활성화 이후에 추가 증폭이 존재한다는 것을 의미하는, 색상 형성이 효소적이기 때문에 특히 매력적이다.
일정한 예의 실시형태에서, 차폐성 구성체는 개별 이산 부피 (하기에 더욱 정의됨) 내에 고형 기재 상에 고정화될 수 있고 단일 시약을 격리시킬 수 있다. 예를 들어, 시약은 염료를 포함하는 비드일 수 있다. 고정화 시약에 의해 격리될 때, 개별 비드는 너무 확산되어 검출가능한 신호를 발생시키지 못하지만, 차폐성 구성체로부터 방출 시에 예를 들어 응집에 의해서 또는 용액 농도의 단순 증가에 의해서 검출가능한 신호를 발생시킬 수 있다. 일정한 예의 실시형태에서, 고정된 차폐제는 표적 분자의 검출 시에 활성화된 이펙터 단백질에 의해 절단될 수 있는 RNA-기반 압타머이다.
일정한 다른 예의 실시형태에서, 차폐성 구성체는 용액 중 고정화 시약에 결합하여서 용액 중에 유리된 별개의 표지된 결합 파트너에 결합하는 시약의 능력을 차단한다. 따라서, 샘플에 세척 단계의 적용 시, 표지된 결합 파트너는 표적 분자의 부재 하에서 샘플을 세척해 낼 수 있다. 그러나, 이펙터 단백질이 활성화되면, 차폐성 구성체는 시약에 결합하는 차폐성 구성체의 능력을 방해하도록 충분한 정도로 절단되어서 표지된 결합 파트너가 고정화 시약과 결합할 수 있게 한다. 따라서, 표지된 결합 파트너는 세척 단계 후에 남아서 샘플 중에 표적 분자의 존재를 의미한다. 일정한 양상에서, 고정화 시약에 결합하는 차폐성 구성체는 RNA 압타머이다. 고정화 시약은 단백질일 수 있고 표지된 결합 파트너는 표지된 항체일 수 있다. 대안적으로, 고정화 시약은 스트렙타비딘일 수 있고 표지된 결합 파트너는 표지된 바이오틴일 수 있다. 상기 실시형태에서 사용되는 결합 파트너 상의 표지는 당분야에 공지된 임의의 검출가능한 표지일 수 있다. 또한, 다른 공지된 결합 파트너는 여기에 기술된 전체 디자인에 따라서 사용될 수 있다.
일정한 예의 실시형태에서, 차폐성 구성체는 리보자임을 포함할 수 있다. 리보자임은 촉매적 특성을 갖는 RNA 분자이다. 천연 및 조작 리보자임은 본 명세서에 개시된 이펙터 단백질에 의해 표적화될 수 있는, RNA를 포함하거나, 또는 그로 이루어진다. 리보자임은 음성 검출가능한 신호를 발생시키거나 또는 양성 대조군 신호의 발생을 방지하는 반응을 촉매하도록 선택될 수 있거나 또는 조작될 수 있다. 활성화된 이펙터 단백질 분자에 의한 리보자임의 탈활성화 시에 반응 음성 대조군 신호를 발생시키거나 또는 양성 검출가능한 신호의 발생을 방지하는 반응을 제거하여서, 양성 검출가능한 신호를 검출가능하게 한다. 일례의 실시형태에서, 리보자임은 용액이 제1 색상을 나타내게 하는 비색 반응을 촉매할 수 있다. 리보자임이 탈활성화될 때 용액은 제2 색상으로 바뀌고, 제2 색상은 검출가능한 양성 신호이다. 리보자임이 비색 반응을 촉매하는데 어떻게 사용될 수 있는가에 대한 예는 [Zhao et al. "Signal amplification of glucosamine-6-phosphate based on ribozyme glmS," Biosens Bioelectron. 2014; 16:337-42]에 기술되어 있고, 본 명세서에 개시된 실시형태의 문맥에서 이러한 시스템이 작용하도록 어떻게 변형될 수 있는가에 대한 예를 제공한다. 대안적으로, 리보자임은 존재하는 경우에, 예를 들어 RNA 전사물의 절단 생성물을 발생시킬 수 있다. 따라서, 양성 검출가능한 신호의 검출은 오직 리보자임의 부재 하에서만 발생되는 비절단된 RNA 전사물의 검출을 포함할 수 있다.
일례의 실시형태에서, 차폐성 구성체는 검출제가 응집되는지 또는 용액에 분산되는지 여부에 따라서 생상을 변화시키는 검출제를 포함한다. 예를 들어, 일정한 나노입자, 예컨대 콜로이드 금은 그들이 응집물로부터 분산된 입자로 이동하면서 가시적인 보라색에서 붉은 색으로 색상 이동을 겪는다. 따라서, 일정한 예의 실시형태에서, 이러한 검출제는 하나 이상의 브릿지 분자에 의해 응집물로 유지될 수 있다. 브릿지 분자의 적어도 일부분은 RNA를 포함한다. 본 명세서에 개시된 이펙터 단백질의 활성화 시에, 브릿지 분자의 RNA 일부분은 절단되어서 검출제가 분산될 수 있게 하고 색상의 상응하는 변화를 일으킬 수 있다. 일정한 예의 실시형태에서, 브릿지 분자는 RNA 분자이다. 일정한 예의 실시형태에서, 검출제는 콜로이드 금속이다. 콜로이드 금속 재료는 액체, 히드로졸 또는 금속 졸에 분산된 수불용성 금속 입자 또는 금속 화합물을 포함할 수 있다. 콜로이드 금속은 주기율표의 그룹 IA, IB, IIB 및 IIIB의 금속을 비롯하여, 전이 금속, 특히 그룹 VIII의 것으로부터 선택될 수 있다. 바람직한 금속은 금, 은, 알루미늄, 루테늄, 아연, 철, 니켈 및 칼슘을 포함한다. 다른 적합한 금속은 또한 모든 그들의 다양한 산화 상태의 하기의 것들을 포함한다: 리튬, 소듐, 마그네슘, 포타슘, 스칸듐, 티타늄, 바나듐, 크롬, 망간, 코발트, 구리, 갈륨, 스트론튬, 니오븀, 몰리브데늄, 팔라듐, 인듐, 주석, 텅스텐, 레늄, 플래티늄, 및 가돌리늄. 금속은 바람직하게 적절한 금속 화합물로부터 유래된 이온 형태, 예를 들어 A13+, Ru3+, Zn2+, Fe3+, Ni2+ 및 Ca2+ 이온으로 제공된다.
일정한 다른 예의 실시형태에서, 차폐성 구성체는 검출가능한 표지 및 그 검출가능한 표지의 차폐제가 부착되는 RNA 올리고뉴클레오티드를 포함할 수 있다. 이러한 검출가능한 표지/차폐제 쌍의 예는 형광단 및 형광단의 소광제가 있다. 형광단의 소광은 형광단 및 다른 형광단 또는 비형광 분자 간 비형광성 복합체의 형성 결과로서 일어날 수 있다. 이러한 기전은 바닥-상태 복합체 형성, 정적 소광, 또는 접촉 소광으로서 알려져 있다. 따라서, RNA 올리고뉴클레오티드는 형광단 및 소광제가 접촉 소광이 일어나도록 충분히 근접하도록 디자인될 수 있다. 형광단 및 그들의 동족 소광제는 당분야에 공지되어 있고, 당업자에 의해서 이러한 목적을 위해 선택될 수 있다. 특정한 형광단/소광제 쌍은 본 발명의 상황에서 핵심적이지 않고, 오직 형광단/소광제 쌍의 선택이 형광단의 차폐를 보장한다. 본 명세서에 개시된 이펙터 단백질의 활성화 시에, RNA 올리고뉴클레오티드는 절단되고 그리하여 접촉 소광 효과를 유지하는데 필요한 형광단 및 소광제 간 근접성을 잘라낸다. 따라서, 형광단의 검출은 샘플 중 표적 분자의 존재를 결정하는데 사용될 수 있다.
일정한 다른 예의 실시형태에서, 차폐성 구성체는 하나 이상의 금속 나노입자, 예컨대 금 나노입자가 부착되는 하나 이상의 RNA 올리고뉴클레오티드를 포함할 수 있다. 일부 실시형태에서, 차폐성 구성체는 닫힌 루프를 형성하는 다수의 RNA 올리고뉴클레오티드에 의해 가교된 다수의 금속 나노입자를 포함한다. 일 실시형태에서, 차폐성 구성체는 닫힌 루프를 형성하는 3개의 RNA 올리고뉴클레오티드에 의해 교차된 3개의 금 나노입자를 포함한다. 일부 실시형태에서, CRISPR 이펙터 단백질에 의한 RNA 올리고뉴클레오티드의 절단은 금속 나노입자에 의해 생성되는 검출가능한 신호를 야기시킨다.
일정한 다른 예의 실시형태에서, 차폐성 구성체는 하나 이상의 퀀텀 도트가 부착되는 하나 이상의 RNA 올리고뉴클레오티드를 포함할 수 있다. 일부 실시형태에서, CRISPR 이펙터 단백질에 의한 RNA 올리고뉴클레오티드의 절단은 퀀텀 도트에 의해 생성되는 검출가능한 신호를 야기시킨다.
일례의 실시형태에서, 차폐성 구성체는 퀀텀 도트를 포함할 수 있다. 퀀텀 도트는 표면에 부착되는 다수의 링커 분자를 가질 수 있다. 링커 분자의 적어도 일부분은 RNA를 포함한다. 링커 분자는 한쪽 말단에서 퀀텀 도트에 부착되고 링커의 길이를 따라서 또는 말단부에서 하나 이상의 소광제에 부착되어서 소광제가 퀀텀 도트의 소광이 일어나도록 충분히 근접하게 유지된다. 링커는 분지될 수 있다. 상기처럼, 퀀텀 도트/소광제 쌍은 핵심적이지 않고, 오직 퀀텀 도트/소광제 쌍의 선택이 형광단의 차폐를 보장한다. 퀀텀 도트 및 그들의 동족 소광제는 당분야에 공지되어 있고 당업자에 의해서 이러한 목적을 위해 선택될 수 있다. 본 명세서에 개시된 이펙터 단백질의 활성화 시, 링커 분자의 RNA 부분은 절단되어서 소광 효과를 유지하는데 필요한 하나 이상의 소광제 및 퀀텀 도트 간 근접성을 제거한다. 일정한 예의 실시형태에서, 퀀텀 도트는 스트렙타비딘 접합된다. RNA는 바이오틴 링커를 통해서 부착되고 서열 /5Biosg/UCUCGUACGUUC/3IAbRQSp/ (SEQ ID NO: 133) 또는 /5Biosg/UCUCGUACGUUCUCUCGUACGUUC/3IAbRQSp/ (SEQ ID NO: 134)을 갖는 소광 분자를 동원하며, 여기서 /5Biosg/는 바이오틴 태그이고 /3lAbRQSp/는 아이오와 블랙 소광제이다. 절단 시, 본 명세서에 개시된 활성화된 이펙터에 의해서 퀀텀 도트는 가시적으로 형광발광할 것이다.
유사한 방식으로, 형광 에너지 전달 (FRET)은 검출가능한 양성 신호를 발생시키기 위해 사용될 수 있다. FRET는 에너지 여기된 형광단 (즉, "도너 형광단")으로부터의 광자가 다른 분자 (즉, "억셉터") 내 전자의 에너지 상태를 더 높은 진동 수준의 여기된 단일항 상태로 상승시키는 비복사 과정이다. 도너 형광단은 그 형광단의 특징적인 형광을 발광하지 않고 바닥 상태로 되돌아간다. 억셉터는 다른 형광단일 수 있거나 또는 비형광성 분자일 수 있다. 억셉터가 형광단이면, 전달된 에너지는 그 형광단의 특징적인 형광으로서 발광된다. 억셉터가 비형광성 분자라면 흡수된 에너지는 열로서 소실된다. 따라서, 본 명세서에 개시된 실시형태의 상황에서, 형광단/소광제 쌍은 올리고뉴클레오티드 분자에 부착된 도너 형광단/억셉터 쌍으로 교체된다. 온전할 때, 차폐성 구성체는 억셉터로부터 방출되는 열 또는 형광에 의해 검출되는 제1 신호 (음성 검출가능한 신호)를 발생시킨다. 본 명세서에 개시된 이펙터 단백질의 활성화 시 RNA 올리고뉴클레오티드는 절단되고 FRET은 파괴되어서 도너 형광단의 형광이 이제 검출된다 (양성 검출가능한 신호).
일정한 예의 실시형태에서, 차폐성 구성체는 짧은 뉴클레오티드로 긴 RNA의 절단에 대응하여 그들 흡광도를 변화시키는 인터컬레이팅 염료의 사용을 포함한다. 몇몇 이러한 염료가 존재한다. 예를 들어, 파이로닌-Y는 RNA와 복합체를 형성하게 될 것이고, 572 nm에서 흡광도를 갖는 복합체를 형성하게 될 것이다. RNA의 절단은 그 결과로 흡광도의 소실 및 색상 변화를 일으킨다. 메틸렌 블루는 유사한 방식으로 사용될 수 있고, RNA 절단 시 688 nm에서의 흡광도가 변화한다. 따라서, 일정한 예의 실시형태에서, 차폐성 구성체는 본 명세서에 개시된 이펙터 단백질에 의한 RNA의 절단 시에 흡광도를 변화시키는 RNA 및 인터컬레이트 염료 복합체를 포함한다.
증폭
일정 예의 실시형태에서, 표적 RNA 및/또는 DNA는 CRISPR 이펙터 단백질을 활성화시키기 전에 증폭될 수 있다. 임의의 적합한 RNA 또는 DNA 증폭 기술이 사용될 수 있다. 일정 예의 실시형태에서, RNA 또는 DNA 증폭은 등온 증폭이다. 일정 예의 실시형태에서, 등온 증폭은 핵산 서열-기반 증폭 (NASBA), 리콤비나제 중합효소 증폭 (RPA), 루프-매개 등온 증폭 (LAMP), 가닥 전위 증폭 (SDA), 헬리카제-의존적 증폭 (HDA), 또는 닉킹 효소 증폭 반응 (NEAR)일 수 있다. 일정 예의 실시형태에서, 비-등온 증폭 방법은 제한없이 PCR, 다중 전위 증폭 (MDA), 롤링 써클 증폭 (RCA), 리가제 연쇄 반응 (LCR), 또는 세분화 증폭 방법 (RAM)를 포함한 것이 사용될 수 있다.
일정한 예의 실시형태에서, RNA 또는 DNA 증폭은 RNA/DNA 듀플렉스를 형성하기 위해 서열-특이적 역방향 프라이머에 의한 표적 RNA의 역전사에 의해 개시되는 NASBA이다. 그 다음으로 RNase H는 RNA 주형을 분해하는데 사용되어서, 프로모터, 예컨대 T7 프로모터를 함유하는 전방향 프라이머가 결합되어 상보성 가닥의 연장을 개시할 수 있고, 이중-가닥 DNA 생성물이 생성된다. DNA 주형의 RNA 중합효소 프로모터-매개 전사가 표적 RNA 서열의 카피를 생성시킨다. 중요한 것은, 신규 표적 RNA 각각이 가이드 RNA에 의해 검출될 수 있고 그리하여 어세이의 감도를 더 증강시킬 수 있다는 것이다. 그러고 나서, 가이드 RNA에 의한 표적 RNA의 결합이 CRISPR 이펙터 단백질의 활성화를 야기시키고 방법은 상기 약술된 대로 진행된다. NASBA 반응은 예를 들어 대략 41℃의 중간 등온 조건 하에서 진행될 수 있다는 추가의 장점을 가져서, 임상 실험실로부터 멀리 떨어진 현장에서 조기 및 직접 검출을 위해 배치된 시스템 및 장치에 적합하다.
일정한 다른 일례의 실시형태에서, 리콤비나제 중합효소 증폭 (RPA) 반응은 표적 핵산을 증폭시키는데 사용될 수 있다. RPA 반응은 듀플렉스 DNA의 상동성 서열과 서열-특이적 프라이머의 쌍을 형성할 수 있는 리콤비나제를 적용한다. 표적 DNA가 존재하면, DNA 증폭이 개시되고 다른 샘플 조작 예컨대 열 순환 또는 화학적 용융이 필요하지 않다. 전체 RPA 증폭 시스템은 건조된 제제로서 안정하고 냉동없이 안전하게 수송될 수 있다. RPA 반응은 또한 37-42℃의 최적 반응 온도로 등온 온도에서 수행될 수 있다. 서열 특이적 프라이머는 검출하려는 표적 핵산 서열을 포함하는 서열을 증폭시키도록 디자인된다. 일정한 예의 실시형태에서, RNA 중합효소 프로모터, 예컨대 T7 프로모터는 프라이머 중 하나에 첨가된다. 그 결과로 표적 서열 및 RNA 중합효소 프로모터를 포함하는 증폭된 이중-가닥 DNA 생성물이 얻어진다. RPA 반응 이후, 또는 그 동안, RNA 중합효소가 첨가되어 이중-가닥 DNA 주형으로부터 RNA를 생성시키게 될 것이다. 이어서, 증폭된 표적 RNA가 그 다음으로 CRISPR 이펙터 시스템에 의해 검출될 수 있다. 이러한 방식으로 표적 DNA는 본 명세서에 개시된 실시형태를 사용하여 검출될 수 있다. RPA 반응은 또한 표적 RNA를 증폭시키는데 사용될 수 있다. 표적 RNA는 먼저 역전사효소를 사용해 cDNA로 전환되고, 그 다음으로 제2 가닥 DNA 합성이 후속되며, 이 시점에 RPA 반응은 상기 약술된 대로 진행된다.
따라서, 일정한 예의 실시형태에서, 본 명세서에 개시된 시스템은 증폭 시약을 포함할 수 있다. 핵산의 증폭에 유용한 상이한 성분 또는 시약은 본 명세서에 기술되어 있다. 예를 들어, 본 명세서에 기술된 바와 같은 증폭 시약은 완충제, 예컨대 Tris 완충제를 포함할 수 있다. Tris 완충제는 예를 들어, 제한없이, 1 mM, 2 mM, 3 mM, 4 mM, 5 mM, 6 mM, 7 mM, 8 mM, 9 mM, 10 mM, 11 mM, 12 mM, 13 mM, 14 mM, 15 mM, 25 mM, 50 mM, 75 mM, 1 M 등의 농도를 포함하여, 바람직한 적용 또는 용도에 적절한 임의 농도로 사용될 수 있다. 당업자는 완충제 예컨대 본 발명에서 사용을 위한 Tris의 적절한 농도를 결정할 수 있을 것이다.
염, 예컨대 마그네슘 클로라이드 (MgCl2), 포타슘 클로라이드 (KCl), 또는 소듐 클로라이드 (NaCl)가 핵산 단편의 증폭을 개선시키기 위해서, 증폭 반응, 예컨대 PCR에 포함될 수 있다. 염 농도가 특정한 반응 및 적용분야에 의존적일 것이지만, 일부 실시형태에서, 특정한 크기의 핵산 단편은 특정한 염 농도에서 최적 결과를 생성시킬 수 있을 것이다. 바람직한 결과를 생성시키기 위해서, 더 큰 생성물은 변경된 염 농도, 전형적으로 더 낮은 염을 요구할 수 있는 한편, 더 작은 생성물의 증폭은 더 높은 염 농도에서 보다 양호한 결과를 생성시킬 수 있을 것이다. 당업자는 염 농도의 변경과 함께, 염의 존재 및/또는 농도가 생물학적 또는 화학적 반응의 엄격도를 변경시킬 수 있고, 그러므로 본 명세서에 기술된 바와 같이 본 발명의 반응을 위해 적절한 조건을 제공하는 임의의 염을 사용할 수 있다는 것을 이해하게 될 것이다.
생물학적 또는 화학적 반응의 다른 성분은 세포 안의 물질의 분석을 위해 세포를 파쇄하거나 또는 용해시키기 위해 세포 용해 성분을 포함할 수 있다. 세포 용해 성분은 제한없이, 세제, 상기 기술된 바와 같은 염, 예컨대 NaCl, KCl, 암모늄 술페이트 [(NH4)2SO4], 또는 다른 것들을 포함할 수 있다. 본 발명에 적절할 수 있는 세제는 Triton X-100, 소듐 도데실 술페이트 (SDS), CHAPS (3-[(3-콜아미도프로필)디메틸암모니오]-1-프로판술포네이트), 에틸 트리메틸 암모늄 브로마이드, 노닐 페녹시폴리에톡실에탄올 (NP-40)을 포함할 수 있다. 세제의 농도는 특정 적용분야에 의존적일 수 있고, 일부 경우에서 반응에 특이적일 수 있다. 증폭 반응은 예컨대 제한없이, 100 nM, 150 nM, 200 nM, 250 nM, 300 nM, 350 nM, 400 nM, 450 nM, 500 nM, 550 nM, 600 nM, 650 nM, 700 nM, 750 nM, 800 nM, 850 nM, 900 nM, 950 nM, 1 mM, 2 mM, 3 mM, 4 mM, 5 mM, 6 mM, 7 mM, 8 mM, 9 mM, 10 mM, 20 mM, 30 mM, 40 mM, 50 mM, 60 mM, 70 mM, 80 mM, 90 mM, 100 mM, 150 mM, 200 mM, 250 mM, 300 mM, 350 mM, 400 mM, 450 mM, 500 mM 등의 농도를 포함하여, 본 발명에 적절한 임의 농도로 사용되는 dNTP 및 핵산 프라이머를 포함할 수 있다. 유사하게, 본 발명에 따라서 유용한 중합효소는 Taq 중합효소, Q5 중합효소 등을 포함하는, 당분야에 공지되어 있고 본 발명에서 유용한 임의의 특이적이거나 또는 일반적인 중합효소일 수 있다.
일부 실시형태에서, 본 명세서에 기술된 바와 같은 증폭 시약은 핫-스타트 증폭에서 사용에 적절할 수 있다. 핫 스타트 증폭은 어댑터 분자 또는 올리고의 이량체화를 감소시키거나 또는 제거시키기 위해서, 또는 달리 원치않는 증폭 생성물 또는 인공물을 방지하고 바람직한 생성물의 최적 증폭을 수득하기 위해서 일부 실시형태에서 유리할 수 있다. 증폭에 사용을 위한 본 발명에 기술된 많은 성분이 또한 핫-스타트 증폭에서 사용될 수 있다. 일부 실시형태에서, 핫-스타트 증폭에서 사용하기에 적절한 시약 또는 성분은 적절하다면 조성물 성분 중 하나 이상 대신에 사용될 수 있다. 예를 들어, 중합효소 또는 다른 시약은 특정한 온도 또는 다른 반응 조건에서 바람직한 활성을 나타내는 것이 사용될 수 있다. 일부 실시형태에서, 시약은 핫-스타트 증폭에서 사용을 위해 디자인되거나 또는 최적화된 것을 사용할 수 있으며, 예를 들어, 중합효소는 전위 이후 또는 특정한 온도에 도달 이후에 활성화될 수 있다. 이러한 중합효소는 항체-기반 또는 압타머-기반일 수 있다. 본 명세서에 기술된 바와 같은 중합효소는 당분야에 공지되어 있다. 이러한 시약의 예는 제한없이, 핫-스타트 중합효소, 핫-스타트 dNTP, 및 광-케이징된 dNTP를 포함할 수 있다. 이러한 시약은 공지되어 있고 당분야에서 입수가능하다. 당업자는 개별 시약에 적절하게 최적 온도를 결정할 수 있을 것이다.
핵산의 증폭은 특별한 열 순환 기계 또는 장비를 사용해 수행될 수 있고, 단일 반응으로 또는 대량으로 수행될 수 있어, 임의의 바람직한 횟수의 반응이 동시에 수행될 수 있다. 일부 실시형태에서, 증폭은 미세유체 또는 로봇식 장치를 사용해 수행될 수 있거나, 또는 바람직한 증폭을 달성하도록 온도의 수동 변경을 사용해 수행될 수도 있다. 일부 실시형태에서, 특정한 적용분야 또는 재료를 위한 최적 반응 조건을 수득하기 위해 최적화가 수행될 수 있다. 당업자는 충분한 증폭을 수득하도록 반응 조건을 이해하게 될 것이고 최적화시킬 수 있을 것이다.
일정 실시형태에서, 본 발명의 방법 또는 시스템에 의한 DNA의 검출은 검출 전에 (증폭된) DNA를 RNA로 전사시키는 것을 필요로 한다.
가이드 방출 및 표적 발생 기반 신호 증폭
일정 예의 실시형태에서, 본 명세서에 개시된 조성물, 시스템, 및 방법은 2차 표적의 첨가를 더 포함할 수 있다. 2차 표적은 1차 표적과 구별되고 어세이들에서 일반적일 수 있다. 2차 표적은 고농도로 각 어세이에 첨가될 수 있다. 2차 표적에 대한 해당 가이드 서열은 각 어세이 부피에 포함된다. 2차 표적 가이드 서열은 2차 표적 또는 검출 CRISPR 이펙터 단백질, 예컨대 Cas13 단백질에 결합할 수 없도록 보호될 것이다. 보호 기 또는 구조체는 검출 CRISPR 이펙터 단백질의 활성화 시에 절단될 수 있도록 구성된다. 보호 기 또는 구조체가 제거되면, 방출된 가이드 서열은 용액 중에서 검출 CRISPR 이펙터 단백질과 복합체를 형성할 수 있고 검출 CRISPR 이펙터 단백질의 활성화를 더 촉발하여서 리포터 구성체의 변형에 의한 검출가능한 신호의 발생을 더욱 야기시킨다.
대안적으로, 2차 가이드 서열은 보호된 표적과 함께 각 어세이 부피에 첨가될 수 있다. 활성화된 검출 CRISPR 이펙터 단백질에 의한 표적으로부터의 보호 기 또는 구조체의 절단은 추가적인 CRISPR 이펙터 단백질/가이드 서열/2차 표적 서열 복합체의 형성을 허용하여, 부차적 효과를 더욱 증가시키게 된다.
일정 예의 실시형태에서, 보호 기 또는 구조체는 부차적 활성에 의해 절단되는 차단성 2차 구조 루프일 수 있다.
다른 양상에서, 활성화된 부차적 효과는 가이드 서열, 표적 서열 또는 둘 모두에 대해서 주형 상에서 증폭 반응을 수행하도록 방출되어지는 보호성 또는 원형 프라이머를 절단할 수 있다. 일정 예의 실시형태에서, 증폭 반응은 등온 증폭 반응, 예컨대 리콤비나제 중합효소 증폭, 또는 롤링 써클 증폭이다. 증폭된 주형의 후속 전사는 가이드 서열 및/또는 표적을 더 많이 생성시켜서, 추가적인 검출 CRISPR 이펙터 단백질 활성화를 허용한다.
표적 RNA/DNA 농축
일정한 예의 실시형태에서, 표적 RNA 또는 DNA는 먼저 표적 RNA 또는 DNA의 검출 또는 증폭 전에 농축될 수 있다. 일정한 예의 실시형태에서, 이러한 농축은 CRISPR 이펙터 시스템에 의한 표적 핵산의 결합에 의해 획득될 수 있다.
현재의 표적-특이적 농축 프로토콜은 프로브와의 하이브리드화 이전에 단일-가닥 핵산을 필요로 한다. 다양한 장점 중에서, 본 발명의 실시형태는 이러한 단계를 생략할 수 있고 이중 가닥 (부분 또는 완전 이중 가닥) DNA를 직접 표적화할 수 있다. 또한, 본 명세서에서 개시된 실시형태는 등온 농축을 허용하는 보다 빠른 운동학 및 보다 용이한 작업흐름을 제공하는 효소-구동 표적화 방법이다. 일정한 예의 실시형태에서, 농축은 20-37℃ 정도로 낮은 온도에서 일어날 수 있다. 일정한 예의 실시형태에서, 상이한 표적 핵산에 대한 가이드 RNA의 세트가 단일 어세이에서 사용되어, 다수의 표적 및/또는 단일 표적의 다수 변이체의 검출을 가능하게 한다.
일정한 예의 실시형태에서, 데드 CRISPR 이펙터 단백질은 용액 중에서 표적 핵산에 결합할 수 있고 그 이후에 상기 용액으로부터 단리될 수 있다. 예를 들어, 표적 핵산에 결합된 데드 CRISPR 이펙터 단백질은 데드 CRISPR 이펙터 단백질에 특이적으로 결합하는, 항체 또는 다른 분자, 예컨대 압타머를 사용해 용액으로부터 단리될 수 있다.
다른 일례의 실시형태에서, 데드 CRISPR 이펙터 단백질은 고형 기재에 결합될 수 있다. 고정된 기재는 폴리펩티드 또는 폴리뉴클레오티드의 부착에 적절하거나 또는 적절하도록 변형될 수 있는 임의 재료를 의미할 수 있다. 가능한 기재는 제한없이, 유리 및 변형된 기능성 유리, 플라스틱 (아크릴, 폴리스티렌 및 스티렌과 다른 재료의 공중합체, 폴리프로필렌, 폴리에틸렌, 폴리부틸렌, 폴리우레탄, Teflon™ 등 포함), 다당류, 나일론 또는 니트로셀룰로스, 세라믹, 레진, 규소 및 변형 규소를 포함하는 실리카 또는 실리카-기반 재료, 탄소, 금속, 무기 유리, 플라스틱, 광학 섬유 번들 및 다양한 다른 중합체를 포함한다. 일부 실시형태에서, 고형 지지체는 규칙적인 패턴으로 분자의 고정에 적합한 패턴화된 표면을 포함한다. 일정한 실시형태에서, 패턴화된 표면은 고형 지지체의 노출된 층 내 또는 그 위의 상이한 영역의 배열을 의미한다. 일부 실시형태에서, 고형 지지체는 표면의 웰 또는 오목부의 어레이를 포함한다. 고형 지지체의 조성 및 기하학적 구조는 이의 용도에 따라 다양할 수 있다. 일부 실시형태에서, 고형 지지체는 평면 구조 예컨대 슬라이드, 칩, 마이크로칩 및/또는 어레이이다. 이와 같이, 기재의 표면은 평면층의 형태일 수 있다. 일부 실시형태에서, 일부 지지체는 플로우셀의 하나 이상의 표면을 포함한다. 본 명세서에서 사용되는 용어 "플로우셀"은 하나 이상의 유체 시약이 흐를 수 있는 고형 표면을 포함하는 챔버를 의미한다. 본 개시 내용의 방법에서 쉽게 사용할 수 있는 예시적인 플로우셀 및 관련 유체 시스템 및 검출 플랫폼은 예를 들어, 문헌 [Bentley et al. Nature 456:53-59 (2008)], WO 04/0918497, US 7,057,026; WO 91/06678; WO 07/123744; US 7,329,492; US 7,211,414; US 7,315,019; US 7,405,281, 및 US 2008/0108082에 기술되어 있다. 일부 실시형태에서, 고형 지지체 또는 이의 표면은 비평면, 예컨대 튜브 또는 용기의 내부 또는 외부 표면이다. 일부 실시형태에서, 고형 지지체는 미세구 또는 비드를 포함한다. "미세구", "비드", "입자"는 제한없이, 플라스틱, 세라믹, 유리 및 폴리스티렌을 포함하는 다양한 재료로 만들어진 소형 개별 입자를 의미하는 것으로 고형 기재의 상황 내에서 의미하고자 한다. 일정 실시형태에서, 미세구는 자성 미세구 또는 비드이다. 대안적으로 또는 추가적으로, 비드는 다공성일 수 있다. 비드 크기는 나노미터, 예를 들어 100 nm에서 밀리미터, 예를 들어 1 mm의 범위이다.
다음으로, 표적 핵산을 함유하거나, 또는 함유하는 것으로 의심되는 샘플을 기재에 노출시켜서 결합된 데드 CRISPR 이펙터 단백질에 표적 핵산이 결합할 수 있게 할 수 있다. 비-표적 분자는 세척해 버릴 수 있다. 일정한 예의 실시형태에서, 이후에, 표적 핵산은 본 명세서에 개시된 방법을 사용하여 추가 검출을 위해 CRISPR 이펙터 단백질/가이드 RNA 복합체로부터 방출될 수 있다. 일정한 예의 실시형태에서, 표적 핵산은 본 명세서에 기술된 바와 같이 먼저 증폭될 수 있다.
일정한 예의 실시형태에서, CRISPR 이펙터는 결합 태그로 표지될 수 있다. 일정한 예의 실시형태에서, CRISPR 이펙터는 화학적으로 태그화될 수 있다. 예를 들어, CRISPR 이펙터는 화학적으로 바이오틴화될 수 있다. 다른 일례의 실시형태에서 CRISPR 이펙터에 융합체를 코딩하는 추가 서열을 첨가하여 융합체를 생성시킬 수 있다. 이러한 융합체의 일례는 고유한 15개 아미노산 펩티드 태그 상에 단일 바이오틴의 고도로 표적화된 효소 접합을 적용하는 AviTag™ 이다. 일정 실시형태에서, CRISPR 이펙터는 포획 태그 예컨대, 제한없이, GST, Myc, 헤마글루티닌 (HA), 녹색 형광성 단백질 (GFP), flag, His 태그, TAP 태그, 및 Fc 태그로 표지될 수 있다. 결합 태그는 융합체, 화학적 태그, 또는 포획 태그인지 여부와 무관하게, 표적 핵산에 결합되면 CRISPR 이펙터 시스템을 풀다운하거나 또는 고형 기재 상에 CRISPR 이펙터 시스템을 고정시키는데 사용될 수 있다.
일정한 예의 실시형태에서, 가이드 RNA는 결합 태그로 표지될 수 있다. 일정한 예의 실시형태에서, 전체 가이드 RNA는 하나 이상의 바이오틴화된 뉴클레오티드, 예컨대, 바이오틴화된 우라실을 도입시킨 시험관내 전사 (IVT)를 사용하여 표지될 수 있다. 일부 실시형태에서, 바이오틴은 화학적으로 또는 효소적으로 가이드 RNA에 첨가될 수 있고, 예컨대 가이드 RNA의 3' 말단에 하나 이상의 바이오틴 기의 첨가일 수 있다. 결합 태그는 예를 들어, 가이드 RNA/표적 핵산을 스트렙타비딘 코팅된 고형 기재에 노출시켜서, 결합이 발생된 이후 가이드 RNA/표적 핵산 복합체를 풀다운하는데 사용될 수 있다.
따라서, 일정한 예의 실시형태에서, 조작되거나 또는 비천연 발생된 CRISPR 이펙터는 농축 목적에 사용될 수 있다. 일 실시형태에서, 변형은 이펙터 단백질의 하나 이상의 아미노산 잔기의 돌연변이를 포함할 수 있다. 하나 이상의 돌연변이는 이펙터 단백질의 하나 이상의 촉매적으로 활성인 도메인에 존재할 수 있다. 이펙터 단백질은 상기 하나 이상의 돌연변이가 결여된 이펙터 단백질과 비교하여 뉴클레아제 활성이 감소될 수 있거나 또는 제거될 수 있다. 이펙터 단백질은 관심 표적 유전자좌에서 RNA 가닥의 절단을 유도하지 않을 수 있다. 바람직한 실시형태에서, 하나 이상의 돌연변이는 2개의 돌연변이를 포함할 수 있다. 바람직한 실시형태에서, 하나 이상의 아미노산 잔기는 C2c2 이펙터 단백질, 예를 들어, 조작되거나 또는 비천연 발생된 이펙터 단백질 또는 C2c2에서 변형된다. 특히 실시형태, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는 R597, H602, R1278 및 H1283 (Lsh C2c2 아미노산이라고 함)에 상응하는 C2c2에서의 것 중 하나 이상, 예컨대 돌연변이 R597A, H602A, R1278A 및 H1283A, 또는 Lsh C2c2 오솔로그의 상응하는 아미노산 잔기 중이다.
특히 실시형태, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는 C2c2 공통 번호매김에 따라서 K2, K39, V40, E479, L514, V518, N524, G534, K535, E580, L597, V602, D630, F676, L709, I713, R717 (HEPN), N718, H722 (HEPN), E773, P823, V828, I879, Y880, F884, Y997, L1001, F1009, L1013, Y1093, L1099, L1111, Y1114, L1203, D1222, Y1244, L1250, L1253, K1261, I1334, L1355, L1359, R1362, Y1366, E1371, R1372, D1373, R1509 (HEPN), H1514 (HEPN), Y1543, D1544, K1546, K1548, V1551, I1558에 상응하는 C2c2의 것들 중 하나이다. 일정 실시형태에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는 R717 및 R1509에 상응하는 C2c2의 것들 중 하나 이상이다. 일정 실시형태에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는 K2, K39, K535, K1261, R1362, R1372, K1546 및 K1548에 상응하는 C2c2의 것 중 하나 이상이다. 일정 실시형태에서, 상기 돌연변이는 그 결과로 변경되거나 또는 변형된 활성을 갖는 단백질을 야기시킨다. 일정 실시형태에서, 상기 돌연변이는 감소된 활성, 예컨대 감소된 특이성을 갖는 단백질을 야기시킨다. 일정 실시형태에서, 상기 돌연변이는 촉매 활성이 없는 단백질 (즉, "데드" C2c2)을 야기시킨다. 일 실시형태에서, 상기 아미노산 잔기는 Lsh C2c2 아미노산 잔기에 상응하거나, 또는 상이한 종 유래 C2c2 단백질의 상응하는 아미노산 잔기에 해당된다. 장치는 이들 단계를 용이하게 할 수 있다.
상기 농축 시스템은 또한 일정한 핵산의 샘플을 감손시키는데 사용될 수 있다. 예를 들어, 가이드 RNA는 샘플로부터 비-표적 RNA를 제거하기 위해 비-표적 RNA에 결합하도록 디자인될 수 있다. 일례의 실시형태에서 가이드 RNA는 특정한 핵산 변이를 보유하는 핵산에 결합하도록 디자인될 수 있다. 예를 들어, 소정 샘플에서 더 높은 카피수의 비-변이체 핵산이 예상될 수 있다. 따라서, 본 명세서에 개시된 실시형태는 또한 검출 CRISPR 이펙터 시스템이 소정 샘플에서 표적 변이체 서열을 검출할 수 있는 효율을 증가시키도록, 샘플로부터 비-변이체 핵산을 제거시키는데 사용될 수 있다.
단백질의 검출
본 명세서에 개시된 시스템, 장치, 및 방법은 또한 특이적으로 구성된 폴리펩티드 검출 압타머의 도입을 통해서 핵산의 검출 이외에도 폴리펩티드 (또는 다른 분자)의 검출에 적합화될 수 있다. 폴리펩티드 검출 압타머는 상기 기술된 차폐성 구성체 압타머와 별개이다. 첫번째로, 압타머는 하나 이상의 표적 분자에 특이적으로 결합하도록 디자인된다. 일례의 실시형태에서 표적 분자는 표적 폴리펩티드이다. 다른 일례의 실시형태에서 표적 분자는 표적 화학적 화합물, 예컨대 표적 치료 분자이다. 소정 표적에 대한 특이성으로 압타머를 디자인하고 선택하기 위한 방법, 예컨대 SELEX는 당분야에 공지되어 있다. 소정 표적에 대한 특이성이외에도, 압타머는 RNA 중합효소 프로모터 결합 부위를 도입시키도록 더욱 디자인된다. 일정한 예의 실시형태에서, RNA 중합효소 프로모터는 T7 프로모터이다. 표적에 결합 이전에, RNA 중합효소 부위는 RNA 중합효소에 접근가능하지 않거나 또는 달리 인식가능하지 않다. 그러나, 압타머는 표적의 결합 시 압타머의 구조가 입체형태 변화를 겪어서 RNA 중합효소 프로모터가 노출되도록 구성된다. RNA 중합효소 프로모터의 하류의 압타머 서열은 RNA 중합효소에 의한 트리거 RNA 올리고뉴클레오티드의 생성을 위한 주형으로서 작용한다. 따라서, 압타머의 주형 부분은 소정 압타머 및 이의 표적을 식별하는 바코드 또는 다른 식별 서열을 더 도입시킬 수 있다. 상기 기술된 바와 같은 가이드 RNA는 이들 특이적 기폭제 올리고뉴클레오티드 서열을 인식하도록 디자인될 수 있다. 기폭제 올리고뉴클레오티드에 가이드 RNA의 결합은 CRISPR 이펙터 단백질을 활성화시키고, 이전에 기술된 바와 같이 차폐성 구성체를 탈활성화시켜서 양성 검출가능한 신호를 발생시키도록 진행된다.
따라서, 일정한 예의 실시형태에서, 본 명세서에 개시된 방법은 샘플 또는 샘플의 세트를 개별 이산 부피의 세트에 분배시키는 단계로서, 각각의 개별 이산 부피는 펩티드 검출 압타머, CRISPR 이펙터 단백질, 하나 이상의 가이드 RNA, 차폐성 구성체를 포함하는 것인 단계, 및 샘플 또는 샘플의 세트를 하나 이상의 표적 분자와 펩티드 검출 압타머의 결합을 허용하기 위해 충분한 조건 하에서 인큐베이션시키는 단계로서, 상응하는 표적에 대한 압타머의 결합은 RNA 중합효소 프로모터 결합 부위를 노출시켜서 RNA 중합효소 프로모터 결합 부위에 RNA 중합효소의 결합을 통해 트리거 RNA의 합성이 일어나는 것인 단계의 추가 단계를 포함한다.
다른 일례의 실시형태에서 압타머의 결합은 표적 폴리펩티드에 압타머의 결합 시 프라이머 결합 부위를 노출시킬 수 있다. 예를 들어, 압타머는 RPA 프라이머 결합 부위를 노출시킬 수 있다. 따라서, 프라이머의 첨가 또는 포함은 증폭 반응, 예컨대 상기 약술된 바와 같은 RPA 반응에 공급되어 질 것이다.
장치
본 명세서에 기술된 장치는 진단 장치 상에서 구현될 수 있다. 장치 내에 다수의 개별 이산 부피를 한정할 수 있는 수많은 기재 및 장치의 구성이 사용될 수 있다. 본 명세서에서 사용되는 "개별 이산 부피"는 별개의 공간, 예컨대 용기, 리셉타클, 또는 표적 분자의 이동을 방지 및/또는 억제하는 특성에 의해 한정할 수 있는 다른 임의의 한정된 부피 또는 공간, 예를 들어 물리적 특성 예컨대 불투과성 또는 반투과성일 수 있는, 벽, 예를 들어 웰의 벽, 튜브 또는 액적의 표면에 의해 한정되거나, 또는 다른 수단 예컨대 표적 분자 및 색인가능한 핵산 식별확인자 (예를 들어, 핵산 바코드)를 함유할 수 있는 화학적, 확산 속도 제한된, 전자기, 또는 광조사, 또는 이의 임의 조합에 의해 한정되는 부피 또는 공간을 의미한다. "확산 속도 제한" (확산 한정 부피)이란 확산이 한 스트림에서 다른 스트림으로 표적 분자의 이동을 제한하게 되는 2개의 평행한 층류 스트림의 경우에서 처럼 확산 제한이 효과적으로 공간 또는 부피를 한정하기 때문에 일정한 분자 또는 반응에만 접근가능한 공간을 의미한다. "화학적" 한정된 부피 또는 공간이란 예를 들어 겔 비드가 예컨대 비드의 내부로 진입할 수 있는 종의 선택을 가능하게 할 수 있는 비드의 표면 전하, 매트릭스 크기 또는 다른 물리적 특성에 의해서, 다른 것들은 아니지만, 비드로의 진입에 일정한 종을 배제할 수 있는 경우에, 그들의 화학적 또는 분자적 특성, 예컨대 크기때문에, 오직 일정한 표적 분자가 존재할 수 있는 공간을 의미한다. "전자기적으로" 한정된 부피 또는 공간이란 표적 분자 또는 그들 지지체의 전자기 특성 예컨대 전하 또는 자성이 자기장 내에서 또는 직접적으로 자석 상에서 자성 입자를 포획하는 것과 같이, 공간에서 일정한 영역을 한정하는데 사용될 수 있는 공간을 의미한다. "광학적으로" 한정된 부피란 한정된 공간 또는 부피내 표적 분자만이 표지될 수 있도록 가시광, 자외선, 적외선, 또는 다른 파장의 광으로 조사하여 한정될 수 있는 임의의 공간 영역을 의미한다. 무벽, 또는 반투과성 이산 부피의 사용의 한가지 장점은 일부 시약, 예컨대 완충제, 화학적 활성인자, 또는 다른 작용제가 이산 부피를 통해서 통과할 수 있는 한편, 다른 재료, 예컨대 표적 분자는 이산 부피 또는 공간에 유지될 수 있다는 것이다. 전형적으로, 이산 부피는 표지화를 가능하게 하는 조건 하에서 색인가능한 핵산 식별자로 표적 분자의 표지화에 적합한 유체 매질 (예를 들어, 수용액, 오일, 완충제, 및/또는 세포 성장을 지지할 수 있는 배지)을 포함할 수 있다. 개시된 방법에서 유용한 예시적인 이산 부피 또는 공간은 특히 액적 (예를 들어, 미세유체 액적 및/또는 에멀션 액적), 히드로겔 비드 또는 다른 중합체 구조 (예를 들어, 폴리에틸렌 글리콜 디아크릴레이트 비드 또는 아가로스 비드), 조직 슬라이드 (예를 들어, 화학적, 광학적, 또는 물리적 수단으로 한정된 특정한 영역, 부피 또는 공간을 갖는 고정 포르말린 파라핀 포매된 슬라이드), 정돈된 어레이 또는 무작위 패턴으로 시약을 배치하여 한정된 영역을 갖는 현미경 슬라이드, 튜브 (예컨대, 원심분리 튜브, 미세원심분리 튜브, 시험관, 큐벳, 코니칼 튜브 등), 병 (예컨대 유리병, 플라스틱병, 세라믹 병, 엘렌메이어 플라스크, 섬광 바이알 등), 웰 (예컨대 플레이트의 웰), 플레이트, 파이펫, 또는 파이펫 팁을 포함한다. 일정한 실시형태에서, 구획은 유중수 에멀션 중 수성 액적이다. 특정한 실시형태에서, 정확하고 균일한 부피를 요구하는 본 명세서에 기술된 임의의 적용, 방법, 또는 시스템은 음향 액체 분배기의 사용을 채택할 수 있다.
일정한 예의 실시형태에서, 장치는 많은 스폿이 한정될 수 있는 가요성 재료 기재를 포함한다. 진단 및 바이오센싱에서 사용이 적합한 가요성 기재 재료는 당분야에 공지되어 있다. 가요성 기재 재료는 식물 유래 섬유, 예컨대 셀룰로스계 섬유로 만들어질 수 있거나, 또는 가요성 중합체 예컨대 가요성 폴리에스테르 필름 및 다른 중합체 유형으로 제조될 수 있다. 각각의 한정된 스폿 내에서, 본 명세서에 기술된 시스템의 시약은 개별 스폿에 적용된다. 각각의 스폿은 상이한 가이드 RNA 또는 가이드 RNA의 세트를 제외하고, 동일한 시약을 함유할 수 있거나, 또는 적용가능한 경우에, 한번에 다수의 표적을 스크리닝하기 위한 상이한 검출 압타머를 함유할 수 있다. 따라서, 본 명세서의 시스템 및 장치는 동일 표적의 존재에 대해서 다수의 공급원 (예를 들어, 상이한 개체 유래의 다수 임상 샘플) 유래 샘플을 스크리닝할 수 있거나, 또는 샘플 중 다수의 상이한 표적의 존재에 대해서 제한된 수의 표적, 또는 단일 샘플의 분취액 (또는 동일 공급원 유래 다수의 샘플)에 대해 스크리닝할 수 있다. 일정한 예의 실시형태에서, 본 명세서에 기술된 시스템의 엘리먼트는 종이 또는 직물 기재 상에서 동결 건조된다. 일정한 예의 장치에서 사용할 수 있는 예시적인 가요성 재료 기반 기재는 문헌 [Pardee et al. Cell. 2016, 165(5):1255-66] 및 [Pardee et al. Cell. 2014, 159(4):950-54]에 개시되어 있다. 혈액을 포함한, 생물학적 유체에 사용을 위한 적합한 가요성 재료-기반 기재는 Shevkoplyas 등의 발명의 명칭 "Paper based diagnostic test"의 국제 공개 특허 출원 WO/2013/071301, Siegel 등의 발명의 명칭 "Paper-based microfluidic systems"의 미국 공개 특허 출원 번호 2011/0111517, 및 문헌 [Shafiee et al. "Paper and Flexible Substrates as Materials for Biosensing Platforms to Detect Multiple Biotargets" Scientific Reports 5:8719 (2015)]에 개시되어 있다. 착용형 진단 장치에서 사용에 적합한 것들을 포함하여, 추가의 가요성 기반 재료는 문헌 [Wang et al. "Flexible Substrate-Based Devices for Point-of-Care Diagnostics" Cell 34(11):909-21 (2016)]에 개시되어 있다. 추가의 가요성 기반 재료는 니트로셀룰로스, 폴리카보네이트, 메틸에틸 셀룰로스, 폴리비닐리덴 플루오라이드 (PVDF), 폴리스티렌, 또는 유리 (예를 들어, US20120238008 참조)를 포함할 수 있다. 일정한 실시형태에서, 이산 부피는 소수성 표면, 예컨대 제한없이, 왁스, 포토레지스트, 또는 고형 잉크에 의해 이격된다.
일부 실시형태에서, 선량계 또는 뱃지는 사용자가 일정한 미생물 또는 다른 작용제에 노출을 통지하게 하는 센서 또는 지시자로서 제공하는 것이 제공될 수 있다. 예를 들어, 본 명세서에 기술된 시스템은 특정한 병원체를 검출하는데 사용될 수 있다. 유사하게, 상기 개시된 압타머 기반 실시형태는 폴리펩티드를 비롯하여, 특이적 압타머가 결합할 수 있는, 다른 작용제, 예컨대 화학제 둘 모두를 검출하는데 사용될 수 있다. 이러한 장치는 예를 들어, 생물전 또는 화학전 작용제 검출을 위해, 가능한 신속하게 잠재적으로 위험한 미생물에 노출에 관한 정보를 제공하기 위해서, 군인 또는 다른 병사를 비롯하여, 임상의, 연구자, 병원 의료진 등의 감시에 유용할 수 있다. 다른 실시형태에서, 이러한 감시 뱃지는 면역약화 환자, 화상 환자, 화학요법을 겪은 환자, 어린이, 또는 노령 개체에서 위험한 미생물 또는 병원체에 노출을 방지하기 위해 사용될 수 있다.
본 명세서에 기술된 시스템 및 장치를 사용하여 분석할 수 있는 샘플 공급원은 대상체의 생물학적 샘플 또는 환경적 샘플을 포함한다. 환경적 샘플은 표면 또는 유체를 포함할 수 있다. 생물학적 샘플은 제한없이, 타액, 혈액, 혈장, 혈청, 대변, 소변, 객담, 점액질, 림프, 활액, 척수액, 뇌척수액, 피부 또는 점막의 스왑, 또는 이의 조합을 포함할 수 있다. 일례의 실시형태에서, 환경적 샘플은 식품 또는 다른 민감한 조성물 및 재료의 제조에서 사용되는 표면과 같은, 고형 표면으로부터 채취된다.
다른 일례의 실시형태에서, 본 명세서에 기술된 시스템의 엘리먼트는 일회용 기재, 예컨대 표면 또는 샘플 유체를 면봉으로 닦는데 사용되는 면봉 또는 직물 상에 위치될 수 있다. 예를 들어, 시스템은 식품, 예컨대 과일 또는 야채의 표면을 면봉으로 닦아서 식품 상에 병원체의 존재에 대해 시험하는데 사용될 수 있다. 유사하게, 일회용 기재는 일정한 미생물 또는 작용제의 검출을 위해서, 예컨대 검색 스크리닝에서 사용을 위해서 다른 표면을 면봉으로 닦는데 사용될 수 있다. 일회용 기재는 또한 포렌식에서 적용을 가질 수 있고, 여기서 CRISPR 시스템은 샘플에 존재하는 생물학적 물질의 유형을 결정하기 위해서 의심되거나, 또는 일정한 조직 또는 세포 마커를 식별하는데 사용할 수 있는, 예를 들어 식별 DNA SNP를 검출하도록 디자인된다. 유사하게, 일회용 기재는 환자 유래 샘플 - 예컨대 구강 유래 타액 샘플 - 또는 피부의 스왑을 수집하는데 사용될 수 있다. 다른 실시형태에서, 샘플 또는 스왑은 육류 제품 상에 또는 그 내에 오염물의 존재 또는 부재를 검출하기 위해서 육류 제품에서 채취될 수 있다.
식품, 임상, 산업, 및 다른 환경 상황의 경우 근실시간 미생물 진단이 필요하다 (예를 들어, [Lu TK, Bowers J, and Koeris MS., Trends Biotechnol. 2013 Jun;31(6):325-7] 참조). 일정 실시형태에서, 본 발명은 병원체 (예를 들어, 캄필로박터 제주니 (Campylobacter jejuni), 클로스트리듐 퍼프린젠스 (Clostridium perfringens), 살모넬라 (Salmonella) spp., 에스케리치아 콜라이 (Escherichia coli), 바실러스 세레우스 (Bacillus cereus), 리스테리아 모노시토게네스 (Listeria monocytogenes), 시겔라 (Shigella) spp., 스타필로코커스 아우레우스 (Staphylococcal aureus), 스타필로코커스 엔테리티스 (Staphylococcal enteritis), 스트렙토코커스 (Streptococcus), 비브리오 콜레라 (Vibrio cholerae), 비브리오 파라해몰리티커스 (Vibrio parahaemolyticus), 비브리오 벌니피커스 (Vibrio vulnificus), 여시니아 엔테로콜리티카 (Yersinia enterocolitica) 및 여시니아 슈도튜버큘로시스 (Yersinia pseudotuberculosis), 브루셀라 (Brucella) spp., 코리네박테리움 울세란스 (Corynebacterium ulcerans), 콕시엘라 부르네티이 (Coxiella burnetii), 또는 플레시오모나스 시겔로이데스 (Plesiomonas shigelloides))에 특이적인 가이드 RNA를 사용하는 식품유래 병원체의 신속한 검출을 위해 사용된다.
일정 실시형태에서, 장치는 플로우 스트립이거나 또는 그를 포함한다. 예를 들면, 측류 스트립은 색상을 통해 RNAse (예를 들어, C2c2) 검출을 가능하게 한다. RNA 리포터는 5' 말단에 부착된 제1 분자 (예컨대 예를 들면 FITC) 및 3' 말단에 부착된 제2 분자 (예컨대 예를 들면 바이오틴)를 갖도록 변형된다 (또는 반대도 같음). 측류 스트립은 항-제1 분자 (예를 들어, 항-FITC) 항체가 제1 라인에서 하이브리드화되고 항-제2 분자 (예를 들어, 항-바이오틴) 항체는 제2 하류 라인에서 하이브리드화되는 2개 포획 라인을 갖도록 디자인된다. SHERLOCK 반응물이 스트립 아래로 흐르면서, 미절단된 리포터는 제1 포획 라인에서 항-제1 분자 항체에 결합하게 되는 한편, 절단된 리포터는 제2 분자를 방출하게 되고 제2 포획 라인에서 제2 분자 결합을 가능하게 한다. 예를 들면 나노입자, 예컨대 금 나노입자에 접합된, 제2 분자 샌드위치 항체는 제1 또는 제2 라인에서 임의의 제2 분자에 결합하게 될 것이고 그 결과 강력한 판독치/신호 (예를 들어, 색상)를 야기시키게 될 것이다. 리포터가 더 절단되면서, 더 많은 신호가 제2 포획 라인에서 축적되어지고 적은 신호가 제1 라인에서 나타나게 될 것이다. 일정한 양상에서, 본 발명은 핵산 또는 폴리펩티드를 검출하기 위해서 본 명세서에 기술된 바와 같은 플로우 스트립의 사용에 관한 것이다. 일정한 양상에서, 본 발명은 본 명세서에 정의된 바와 같은 플로우 스트립으로 핵산 또는 폴리펩티드를 검출하기 위한 방법, 예를 들어 (측면) 흐름 시험법 또는 (측면) 흐름 면역크로마토그래피 어세이에 관한 것이다.
일정한 예의 실시형태에서, 장치는 상이한 액적 (즉, 개별 이산 부피)을 생성시키고/시키거나 병합시키는 미세유체 장치이다. 예를 들어, 액적의 제1 세트는 스크리닝하려는 샘플을 함유하게 형성될 수 있고 액적의 제2 세트는 본 명세서에 기술된 시스템의 엘리먼트를 함유하게 형성된다. 그 다음으로, 액적의 제1 및 제2 세트를 병합시키고 나서 본 명세서에 기술된 바와 같은 진단 방법은 병합된 액적 세트 상에서 수행된다. 본 명세서에 개시된 미세유체 장치는 실리콘-기반 칩일 수 있고 제한없이, 핫 엠보싱, 엘라스토머의 성형, 사출 성형, LIGA, 소프트 리쏘그라피, 규소 제작 및 관련 박막 프로세싱 기술을 포함한, 다양한 기술을 사용하여 제작될 수 있다. 미세유체 장치를 제작하기 위한 적합한 재료는 제한없이, 환형 올레핀 공중합체 (COC), 폴리카보네이트, 폴리(디메틸실록산) (PDMS), 및 폴리(메틸아크릴레이트) (PMMA)를 포함한다. 일 실시형태에서, PDMS의 소프트 리쏘그라피는 미세유체 장치를 제조하는데 사용될 수 있다. 예를 들어, 몰드는 기재 내에서 흐름 채널, 밸브 및 필터의 위치를 한정하는 포토리쏘그라피를 사용해 제조될 수 있다. 기재 재료를 몰드에 붓고 경화되게 하여 스탬프를 생성시킨다. 그 다음으로, 스탬프는 고형 지지체, 예컨대 제한없이, 유리에 밀봉된다. 일부 단백질을 흡착하고 일정한 생물학적 프로세스를 억제할 수 있는, 일부 중합체, 예컨대 PDMS의 소수성 성질에 기인하여, 부동태화제가 필요할 수 있다 (Schoffner et al. Nucleic Acids Research, 1996, 24:375-379). 적합한 부동태화제는 당분야에 공지되어 있고, 제한없이, 실란, 파릴렌, n-도데실-b-D-마토시드 (DDM), 플루론산, Tween-20, 다른 유사한 계면활성제, 폴리에틸렌 글리콜 (PEG), 알부민, 콜라겐, 및 다른 유사한 단백질 및 펩티드를 포함한다.
일정한 예의 실시형태에서, 시스템 및/또는 장치는 유세포측정 판독으로의 전환 및/또는 단일 실험에서 수백만 세포의 민감하고 정량적인 측정의 허용 및 현행 흐름-기반 방법, 예컨대 PrimeFlow 어세이에 비해 개선되도록 적합화된다. 일정한 예의 실시형태에서, 세포는 이후에 유세포측정에 의한 분석에 적합한 단일-세포 액적으로 캐스팅될 수 있는, 미중합된 겔 단량체를 함유하는 액적에 캐스팅될 수 있다. 형광성 검출가능한 표지를 포함하는 검출 구성체는 액적 내에 비드를 형성하기 위해 겔 단량체의 중합 시에 미중합된 겔 단량체를 포함하는 액적으로 캐스팅될 수 있다. 겔 중합은 자유-라디칼 형성을 통하기 때문에, 형광성 리포터는 겔에 공유 결합된다. 검출 구성체는 링커, 예컨대 아민을 포함하도록 더욱 변형될 수 있다. 소광제는 겔 형성 후에 첨가될 수 있고 링커를 통해서 리포터 구성체에 결합하게 될 것이다. 따라서, 소광제는 겔에 결합되지 않고, CRISPR 이펙터 단백질에 의해서 리포터가 절단될 때 자유롭게 확산된다. 액적에서 신호의 증폭은 하이브리드화 연쇄 반응 (HCR 개시제) 증폭의 검출 구성체를 커플링하여 획득될 수 있다. DNA/RNA 하이브리드 헤어핀은 RNase 민감성 도메인을 갖는 헤어핀 루프를 포함할 수 있는 겔에 도입될 수 있다. RNase 민감성 도메인을 갖는 헤어핀 루프 내에서 가닥 치환 토우홀드를 보호함으로써, HCR 개시제는 CRISPR 이펙터 단백질에 의한 헤어핀 루프의 절단 이후에 선택적으로 탈보호될 수 있다. 토우홀드 매개된 가닥 치환을 통해서 HCR 개시제의 탈보호 이후, 형광성 HCR 단량체는 겔로 세척되어서 개시제가 탈보호되는 경우에 신호를 증폭시킬 수 있게 한다.
본 발명이 상황에서 사용할 수 있는 미세유체 장치의 예는 문헌 [Hou et al. "Direct Dectection and drug-resistance profiling of bacteremias using inertial microfluidics" Lap Chip. 15(10):2297-2307 (2016)]에 기술되어 있다.
본 명세서에 기술된 시스템은 대상체의 생물학적 샘플, 예컨대 생물학적 유체를 클리닉 환경 외부에서 평가하고 의료 전문가가 접속할 수 있는 중심 서버에 원격으로 어세이의 결과를 보고하는 착용형 의료 장치에 더 도입될 수 있다. 장치는 Peeters 등의 발명의 명칭 "Needle-free Blood Draw"의 미국 공개 특허 출원 번호2015/0342509, Andrew Conrad의 발명의 명칭 "Nanoparticle Phoresis"의 미국 공개 특허 출원 번호 2015/0065821에 개시된 장치와 같은, 혈액을 자가-샘플채취하는 능력을 포함할 수 있다.
일정한 예의 실시형태에서, 장치는 개별 웰, 예컨대 마이크로플레이트 웰을 포함할 수 있다. 마이크로플레이트 웰의 크기는 표준 6, 24, 96, 384, 1536, 3456, 또는 9600 크기 웰의 크기일 수 있다. 일정한 예의 실시형태에서, 본 명세서에 기술된 시스템의 엘리먼트는 동결 건조될 수 있고 유통 및 사용 전에 웰의 표면 상에 적용될 수 있다.
본 명세서에 개시된 장치는 입구 및 출구 포트를 더 포함할 수 있고, 이들은 차례로 밸브, 튜브, 채널, 챔버, 및 시린지 및/또는 장치 내부 및 외부로 유체의 유입 및 추출을 위한 펌프에 이후에 연결될 수 있다. 장치는 미세유체 장치 내에서 유체의 지향성 움직임을 가능하게 하는 유체 흐름 액츄에이터에 연결될 수 있다. 예시적인 액츄에이터는 제한없이, 시린지 펌프, 기계 작동식 재순환 펌프, 전기삼투 펌프, 벌브, 벨로우, 다이어프램, 또는 유체를 움직이게 하려는 버블을 포함한다. 일정한 예의 실시형태에서, 장치는 장치를 통해서 유체를 움직이게 함께 작동하는 프로그램가능한 밸브를 갖는 제어기에 연결된다. 일정한 예의 실시형태에서, 장치는 하기에 더욱 상세하게 기술되는 제어기에 연결된다. 장치는 장치 상의 입구 포트에 삽입을 위한 금속 핀으로 종결되는 튜빙에 의해서 흐름 액츄에이터, 제어기, 및 샘플 로딩 장치에 연결될 수 있다.
본 명세서에 도시된 바와 같이, 시스템의 엘리먼트는 동결건조될 때 안정하고, 그러므로, 지지 장치를 필요로 하지 않는 실시형태가 또한 고려되며, 즉, 시스템은 본 명세서에 개시된 반응을 지지하게 되는 임의의 표면 또는 유체에 적용될 수 있고, 그 표면 또는 용액으로부터 양성 검출가능한 신호의 검출을 가능하게 한다. 동결-건조 이외에도, 시스템은 또한 펠렛화된 형태로 안정하게 저장되고 이용될 수 있다. 적합한 펠렛화 형태를 형성하는데 유용한 중합체는 당분야에 공지되어 있다.
일정 실시형태에서, CRISPR 이펙터 단백질은 장치에서 각각의 이산 부피에 결합된다. 각각의 이산 부피는 상이한 표적 분자에 특이적인 상이한 가이드 RNA를 포함할 수 있다. 일정 실시형태에서, 샘플은 각각이 표적 분자에 특이적인 가이드 RNA를 포함하는 하나를 초과하는 이산 부피를 포함하는 고형 기재에 노출된다. 이론에 국한하지 않으나, 각각의 가이드 RNA는 샘플 유래의 이의 표적 분자를 포획하게 될 것이고 샘플은 개별 어세이로 나뉘어질 필요가 없다. 따라서, 중요한 샘플을 보존할 수 있다. 이펙터 단백질은 친화성 태그를 포함하는 융합 단백질일 수 있다. 친화성 태그는 당분야에 충분히 공지되어 있다 (예를 들어, HA 태그, Myc 태그, Flag 태그, His 태그, 바이오틴). 이펙터 단백질은 바이오틴 분자에 연결될 수 있고 이산 부피는 스트렙타비딘을 포함할 수 있다. 다른 실시형태에서, CRISPR 이펙터 단백질은 이펙터 단백질에 특이적인 항체에 의해 결합된다. CRISPR 효소에 결합하는 방법은 이전에 기술된 바 있다 (예를 들어, US20140356867A1 참조).
본 명세서에 개시된 장치는 또한 다른 방법에 의해 샘플을 분석하기 위해 당분야에 공지된 현장진단 (POC) 장치의 엘리먼트를 포함할 수 있다. 예를 들어, 문헌 [St John and Price, "Existing and Emerging Technologies for Point-of-Care Testing" (Clin Biochem Rev. 2014 Aug; 35(3): 155-167)]을 참조한다.
본 발명은 무선 랩-온-칩 (LOC) 진단 센서 시스템에 의해 사용될 수 있다 (예를 들어, 미국 특허 번호 9,470,699 "Diagnostic radio frequency identification sensors and applications thereof" 참조). 일정한 실시형태에서, 본 발명은 무선 장치 (예를 들어, 휴대폰, 개인 정보용 단말기 (PDA), 타블렛)에 의해 제어되는 LOC에서 수행되고 결과가 상기 장치에 보고된다.
RFID (Radio frequency identification) 태그 시스템은 RFID 판독기 (인터로게이트라고도 함)에 의한 수신을 위해 데이타를 전송하는 RFID 태그를 포함한다. 전형적인 RFID 시스템에서, 개별 객체 (예를 들어, 상점 상품)는 트랜스폰더를 함유하는 상대적으로 소형의 태그가 장착된다. 트랜스폰더는 고유한 전자 제품 코드가 제공되는 메모리 칩을 갖는다. RFID 판독기는 통신 프로토콜의 사용을 통해서 태그 내 트랜스폰더를 활성화시키는 신호를 방출한다. 따라서, RFID 판독기는 태그에 대한 데이타를 읽고 쓸 수 있다. 추가적으로, RFID 태그 판독기는 RFID 태그 시스템 어플리케이션에 따라서 데이타를 처리한다. 현재, 수동형 및 능동형 RFID 태그가 존재한다. 수동형 RFID 태그 내부 전력원을 함유하지 않지만, FRID 판독기로부터 수신된 라디오 주파수 신호에 의해 작동된다. 대안적으로, 능동형 RFID 태그는 이 활성형 RFID 태그가 더 큰 전파 범위 및 메모리 용량을 보유할 수 있게 하는 내부 전력원을 함유한다. 수동형 대 능동형 태그의 사용은 특정한 적용 분야에 따라 좌우된다.
랩-온-더 칩 기술은 과학 문헌에 충분히 설명되어 있고, 다수의 미세유체 채널, 투입 또는 화학적 웰로 이루어진다. 웰 내에서의 반응은 RFID 전자 칩으로부터의 전도성 리드가 시험 웰 각각에 직접 연결될 수 있으므로 RFID 태그 기술을 사용하여 측정될 수 있다. 안테나는 장치의 후면 상에 직접적으로 또는 전자 칩의 다른 층에 장착되거나 또는 인쇄될 수 있다. 더 나아가서, 리드, 안테나 및 전자 칩은 LOC 칩에 내장될 수 있고, 그리하여 전극 또는 전자 장치의 단락을 방지한다. LOC가 복합체 샘플 분리 및 분석을 가능하게 하므로, 이러한 기술은 LOC 시험을 복잡하거나 또는 값비싼 판독기와 독립적으로 수행하는 것을 가능하게 한다. 대신 단순 무선 장치 예컨대 휴대폰 또는 PDA를 사용할 수 있다. 일 실시형태에서, 무선 장치는 또한 보다 복잡한 LOC 분석을 위한 미세유체 채널의 분리 및 제어를 통제한다. 일 실시형태에서, LED 및 다른 전자 측정 또는 감지 장치는 LOC-RFID 칩에 포함된다. 이론에 국한하려는 것이 아니나, 이러한 기술은 일회성이어서 분리 및 혼합을 요구하는 복잡한 시험을 실험실 밖에서 수행하는 것을 가능하게 한다.
바람직한 실시형태에서, LOC는 미세유체 장치일 수 있다. LOC는 수동형 칩일 수 있고, 여기서 칩은 무선 장치를 통해서 작동되고 제어된다. 일정 실시형태에서, LOC는 시약을 수용하기 위한 미세유체 채널 및 샘플을 도입시키기 위한 채널을 포함한다. 일정 실시형태에서, 무선 장치로부터의 신호는 전력을 LOC에 전달하여 샘플 및 어세이 시약의 혼합을 활성화시킨다. 특히, 본 발명의 경우에서, 시스템은 차폐제, CRISPR 이펙터 단백질, 및 표적 분자에 특이적인 가이드 RNA를 포함할 수 있다. LOC의 활성화 시, 미세유체 장치는 샘플 및 어세이 시약을 혼합할 수 있다. 혼합 시, 센서는 신호를 검출하고 결과를 무선 장치로 전송한다. 일정 실시형태에서, 비차폐제는 전도성 RNA 분자이다. 전도성 RNA 분자는 전도성 재료에 부착될 수 있다. 전도성 분자는 전도성 나노입자, 전도성 단백질, 단백질 또는 라텍스에 부착되는 금속 입자 또는 전도성인 다른 비드일 수 있다. 일정 실시형태에서, DNA 또는 RNA가 사용되면 전도성 분자는 부응하는 DNA 또는 RNA 가닥에 직접 부착될 수 있다. 전도성 분자의 방출은 센서에 걸쳐 검출될 수 있다. 어세이는 단일 단계 과정일 수 있다.
표면 면적의 전기 전도성은 측정할 수 있으므로 정밀하게 정량된 결과가 일회용 무선 RFID 전기-어세이에서 가능하다. 더 나아가서, 시험 면적은 매우 작아서 소정 면적에서 더 많은 시험을 수행할 수 있게 하여 그 결과로 비용이 절감될 수 있다. 일정 실시형태에서, 각각이 센서에 고정된 상이한 CRISPR 이펙터 단백질 및 가이드 RNA와 연합된 별개의 센서가 다수의 표적 분사를 검출하는데 사용된다. 이론에 국한하려는 것은 아니나, 상이한 센서의 활성화는 무선 장치에 의해 구별될 수 있다.
본 명세서에 기술된 전도성 방법이외에도, 일회용 RFID 어세이를 위한 기본적인 저비용 통신 및 전력 플랫폼 때문에 RFID 또는 블루투스에 의존하는 다른 방법이 사용될 수 있다. 예를 들어, 광학 수단을 사용하여 소정 표적 분자의 존재 및 수준을 평가할 수 있다. 일정 실시형태에서, 광학 센서는 형광성 차폐제의 탈차폐를 검출한다.
일정 실시형태에서, 본 발명의 장치는 어세이의 진단 판독을 위한 소형 휴대용 장치를 포함할 수 있다 (예를 들어, 문헌 [Vashist et al., Commercial Smartphone-Based Devices and Smart Applications for Personalized Healthcare Monitoring and Management, Diagnostics 2014, 4(3), 104-128]; mReader from Mobile Assay; 및 Holomic Rapid Diagnostic Test Reader 참조).
본 명세서에 언급된 바와 같이, 일정한 실시형태는 실시형태가 신호를 판독하기 위해 보다 복잡한 검출 장비로의 접근이 제한될 수 있는 자원 부족 환경 및/또는 POC 상황에서 이용될 때 일부 부수적인 이득을 갖는 비색성 변화를 통한 검출을 가능하게 한다. 그러나, 본 명세서에 개시된 휴대용 실시형태는 또한 가시 범위 밖의 신호의 검출할 수 있게 하는 소형 분광광도계와 커플링될 수 있다. 본 발명과 조합하여 사용할 수 있는 소형 분광광도계 장치의 예는 문헌 [Das et al. "Ultra-portable, wireless smartphone spectrophotometer for rapid, non-destructive testing of fruit ripeness." Nature Scientific Reports. 2016, 6:32504, DOI: 10.1038/srep32504]에 기술되어 있다. 마지막으로, 퀀텀 도트-기반 차폐성 구성체를 이용하는 일정한 실시형태에서, 소형 UV 광, 또는 다른 적합한 장치는 퀀텀 도트에 의해 제공되는 거의 완전한 퀀텀 수율 덕분에 신호를 검출하는데 성공적으로 사용될 수 있다.
예시적인 방법 및 적용분야
어세이 플랫폼의 저비용 및 적응성은 그 자체로 (i) 일반적인 RNA/DNA/단백질 정량, (ii) 신속한, 복합 RNA/DNA 및 단백질 발현 검출, 및 (iii) 임상 및 환경적 샘플 둘 모두에서 표적 핵산, 펩티드 및 단백질의 민감한 검출을 포함하는 수많은 적용성을 부여한다. 추가적으로, 본 명세서에 개시된 시스템은 생물학적 환경, 예컨대 세포 내에서 전사물의 검출을 위해 개조될 수 있다. 본 명세서에 기술된 CRISPR 이펙터의 고도로 특이적인 성질을 고려하면, 살아있는 세포에서 전사물 또는 질환-연관 돌연변이의 대립유전자 특이적 발현을 추적하는 것이 가능할 수 있다.
일정한 예의 실시형태에서, 단일 표적에 특이적인 단일 가이드 RNA가 개별 부피에 위치된다. 각 부피는 상이한 샘플 또는 동일한 샘플의 분취액을 수용할 수 있다. 일정한 예의 실시형태에서, 개별 표적에 대한 각각의 다수의 가이드 RNA는 단일 웰에 위치될 수 있어서, 다수의 표적이 상이한 웰에서 스크리닝될 수 있다. 단일 부피에서 다수의 가이드 RNA를 검출하기 위해서, 일정한 예의 실시형태에서, 상이한 특이성을 갖는 다수의 이펙터 단백질이 사용될 수 있다. 예를 들어, 상이한 서열 특이성을 갖는 상이한 오솔로그가 사용될 수 있다. 예를 들어, 하나의 오솔로그는 A를 우선적으로 절단할 수 있는 한편, 다른 것은 C, U, 또는 T를 우선적으로 절단할 수 있다. 따라서, 단일 뉴클레오티드의 전부이거나, 또는 그의 실질적으로 일부분을 포함하는 가이드 RNA는 각각 상이한 형광단을 갖는 것이 발생될 수 있다. 이러한 방식으로 최대 4종의 상이한 표적이 단일 개별 이산 부피에서 스크리닝될 수 있다.
본 명세서에서 입증하는 바와 같이, CRISPR 이펙터 시스템은 표적 분자의 아토몰라 농도에 이르기까지 검출할 수 있다. 예를 들어, 하기에 기술된 실시예를 참조한다. 상기 시스템의 감도 덕분에, 신속하고 민감한 검출이 요구되는 많은 적용분야가 본 명세서에 개시된 실시형태로부터 이득을 얻을 수 있고, 본 발명의 범주 내에 속하는 것으로 간주된다. 예시적인 어세이 및 적용분야는 하기에 더욱 상세하게 기술된다.
미생물 적용분야
일정한 예의 실시형태에서, 본 명세서에 개시된 시스템, 장치 및 방법은 샘플, 예컨대 대상체로부터 수득된 생물학적 샘플 중 하나 이상의 미생물원의 존재를 검출하는 것에 관한 것이다. 일정한 예의 실시형태에서, 미생물은 박테리아, 진균, 효모, 원충, 기생충, 또는 바이러스일 수 있다. 따라서, 본 명세서에 개시된 방법은 미생물 종의 신속한 식별, 미생물 단백질 (항원), 항체, 항체 유전자의 존재의 모니터링, 일정 표현형 (예를 들어, 박테리아 내성)의 검출, 질환 진행 및/또는 대발생의 모니터링, 및 항생제 스크리닝을 요구하는 다른 방법과 (또는 조합하여) 다른 방법에서 사용을 위해 적합화될 수 있다. 본 명세서에 개시된 실시형태의 신속하고 민감한 진단 능력, 단일 뉴클레오티드 편차에 이르는, 미생물 종 유형의 검출, 및 POC 장치로서 배치되는 능력 때문에, 본 명세서에서 개시된 실시형태는 가이드 치료 계획, 예컨대 적절한 항생제 또는 항바이러스제의 선택에 사용될 수 있다. 본 명세서에서 개시된 실시형태는 또한 미생물 오염의 존재에 대해 환경적 샘플 (공기, 물, 표면, 식품 등)을 스크리닝하는데 사용될 수 있다.
미생물 종, 예컨대 박테리아, 바이러스, 진균, 효모 또는 기생충 종 등을 식확인하는 방법을 개시한다. 특히 본 명세서에서 개시된 실시형태는 단일 샘플 내에서, 또는 다수 샘플에 걸쳐서 미생물 종을 식별하고 구별하여, 많은 상이한 미생물의 인식을 가능하게 하는 방법 및 시스템을 기술한다. 본 발명은 샘플 중 표적 핵산 서열의 존재를 검출하여, 생물학적 또는 환경적 샘플 중에서 하나 이상의 유기체, 예를 들어, 박테리아, 바이러스, 효모, 원충, 및 진균 또는 이의 조합 중 2종 이상을 구별하고, 병원체의 검출을 가능하게 한다. 샘플로부터 수득된 양성 신호는 미생물의 존재를 의미한다. 다수 미생물은 하나를 초과하는 이펙터 단백질의 사용을 적용하여, 본 발명의 방법 및 시스템을 사용해 동시에 식별될 수 있고, 여기서 각각의 이펙터 단백질 표적은 특이적 미생물 표적 서열이다. 이러한 방식으로, 임의 수의 미생물을 한번에 검출할 수 있는 다층 분석을 특정한 대상체에 대해 수행할 수 있다. 일부 실시형태에서, 다수 미생물의 동시 검출은 하나 이상의 미생물 종을 식별할 수 있는 프로브의 세트를 사용하여 수행할 수 있다.
샘플의 다중복합 분석은 샘플의 대규모 검출을 가능하게 하여 분석 시간 및 비용을 절감한다. 그러나, 다중복합 분석은 종종 생물학적 샘플의 이용가능성에 의해 제한된다. 그러나, 본 발명에 따라서, 다중복합 분석의 대안은 다수 이펙터 단백질을 단일 샘플에 첨가할 수 있고 각각의 차폐성 구성체는 개별 소광제 염료와 조합할 수 있도록 수행될 수 있다. 이러한 경우에서, 양성 신호는 단일 샘플 중 복합 검출을 위해 개별적으로 각각의 소광제 염료로부터 수득될 수 있다.
본 명세서는 샘플 중 하나 이상의 유기체의 둘 이상의 종을 구별하기 위한 방법을 개시한다. 이 방법은 또한 샘플 중 하나 이상의 유기체의 하나 이상의 종을 검출할 수 있게 한다.
미생물 검출
일부 실시형태에서, 샘플 중 미생물을 검출하기 위한 방법은 샘플 또는 샘플의 세트를 하나 이상의 개별 이산 부피에 분배하는 단계로서, 개별 이산 부피는 본 명세서에 기술된 바와 같은 CRISPR 시스템을 포함하는 것인 단계; 하나 이상의 가이드 RNA와 하나 이상의 미생물-특이적 표적의 결합을 허용하기 위해 충분한 조건 하에서 샘플 또는 샘플의 세트를 인큐베이션시키는 단계; 하나 이상의 가이드 RNA와 하나 이상의 표적 분자의 결합을 통해서 CRISPR 이펙터 단백질을 활성화시키는 단계로서, CRISPR 이펙터 단백질의 활성화는 그 결과로 RNA-기반 차폐성 구성체의 변형을 야기하여 검출가능한 양성 신호가 발생되는 것인 단계; 및 검출가능한 양성 신호를 검출하는 단계로서, 검출가능한 양성 신호의 검출은 샘플 중 하나 이상의 표적 분자의 존재를 의미하는 것인 단계를 포함한다. 하나 이상의 표적 분자는 둘 이상의 미생물 종/균주를 서로 구별하는데 사용될 수 있는 표적 뉴클레오티드 타이드 서열을 포함하는 mRNA, gDNA (코딩 또는 넌코딩), trRNA, 또는 RNA일 수 있다. 가이드 RNA는 표적 서열을 검출하도록 디자인될 수 있다. 본 명세서에서 개시된 실시형태는 또한 가이드 RNA와 표적 RNA 서열 간 하이브리드화를 개선시키는 일정 단계들을 또한 이용할 수 있다. 리보핵산 하이브리드화를 향상시키는 방법은 참조로 본 명세서에 편입시킨 발명의 명칭 "Enhanced Methods of Ribonucleic Acid Hybridization"의 WO 2015/085194에 개시되어 있다. 미생물-특이적 표적은 RNA 또는 DNA 또는 단백질일 수 있다. DNA 방법은 본 명세서에 기술된 바와 같은 RNA 중합효소 프로모터를 도입한 DNA 프라이머의 사용을 더 포함할 수 있다. 표적이 단백질이면 방법은 본 명세서에 기술된 단백질에 특이적인 단계 및 압타머를 이용하게 될 것이다.
단일 뉴클레오티드 변이체의 검출
일부 실시형태에서, 하나 이상의 식별된 표적 서열은 본 명세서에 기술된 바와 같은 표적 서열에 특이적이고 그에 결합하는 가이드 RNA를 사용해 검출될 수 있다. 본 발명의 시스템 및 방법은 상이한 미생물 종에 존재하는 단일 뉴클레오티드 다형성을 구별할 수 있고, 그러므로, 본 발명에 따라서 다수 가이드 RNA의 사용은 종 간 구별하는데 사용될 수 있는 표적 서열의 수를 더 확장시키거나 또는 개선시킬 수 있다. 예를 들어, 일부 실시형태에서, 하나 이상의 가이드 RNA는 종, 속, 과, 목, 강, 문, 계, 또는 표현형, 또는 이의 조합으로 미생물들을 구별을 할 수 있다.
rRNA 서열 기반 검출
일정한 예의 실시형태에서, 본 명세서에 개시된 장치, 시스템, 및 방법은 샘플 중 다수 미생물 종을 구별하는데 사용될 수 있다. 일정한 예의 실시형태에서, 식별은 16S, 23S, 및 5S 서브유닛을 포함하는, 리보솜 RNA 서열을 기반으로 할 수 있다. 관련 rRNA 서열을 식별하기 위한 방법은 미국 공개 특허 출원 번호 2017/0029872에 개시되어 있다. 일정한 예의 실시형태에서, 가이드 RNA의 세트는 각각의 종 또는 균주에 고유한 가변 영역에 의해 각각의 종을 구별하도록 디자인될 수 있다. 가이드 RNA는 속, 과, 목, 강, 문, 계 수준, 또는 이의 조합으로 미생물을 구별하는 RNA 유전자를 표적화하도록 디자인될 수 있다. 증폭이 사용되는 일정한 예의 실시형태에서, 증폭 프라이머의 세트는 리보솜 RNA 서열의 불변 영역에 측접하도록 디자인될 수 있고 가이드 RNA는 가변 내부 영역에 의해 각각의 종을 구별하도록 디자인될 수 있다. 일정한 예의 실시형태에서, 프라이머 및 가이드 RNA는 각각 16S 서브유닛 내 보존 및 가변 영역에 대해 디자인될 수 있다. 종 또는 종의 서브셋에 걸쳐 고유하게 가변적인 다른 유전자 또는 게놈 영역 예컨대 RecA 유전자 패밀리, RNA 중합효소 β 서브유닛이 역시 사용될 수 있다. 다른 적합한 계통 마커, 및 이를 식별하기 위한 방법은 예를 들어, 문헌 [Wu et al. arXiv:1307.8690 [q-bio.GN]]에 기술되어 있다.
일정한 예의 실시형태에서, 방법 또는 진단은 동시에 다수의 계통 및/또는 표현형 수준에 걸쳐 미생물을 스크리닝하도록 디자인된다. 예를 들어, 방법 또는 진단은 상이한 가이드 RNA와 다수의 CRISPR 시스템의 사용을 포함할 수 있다. 가이드 RNA의 제1 세트는 예를 들어 마이코박테리아, 그람 양성, 및 그람 음성 박테리아를 구별할 수 있다. 이들 일반적인 부류들은 더욱 세분화될 수 있다. 예를 들어, 가이드 RNA는 그람 음성 박테리아 내에서 장내 및 비장내 박테리아를 구별하는 방법 또는 진단에서 디자인되어 사용될 수 있다. 가이드 RNA의 제2 세트는 속 또는 종 수준에서 미생물을 구별하도록 디자인될 수 있다. 따라서, 그들 부류 중 하나 내에 속하는 소정 샘플 중에서 식별되는 박테리아 종의 각각의 속에 대해 모든 마이코박테리아, 그람 양성, 그람 음성 (장내 및 비장내로 더 분류됨)을 식별하는 매트릭스가 생성될 수 있다. 전술한 것은 단지 예시적인 목적을 위한 것이다. 다른 미생물 유형을 분류하기 위한 다른 수단이 또한 고려되고 상기 기술된 일반 구조를 따르게 될 것이다.
약제 내성에 대한 스크리닝
일정한 예의 실시형태에서, 본 명세서에 개시된 장치, 시스템 및 방법은 관심 미생물 유전자, 예를 들어 항생제 및/또는 항바이러스 내성 유전자에 대해 스크리닝하는데 사용될 수 있다. 가이드 RNA는 기지의 관심 유전자들을 구별하도록 디자인될 수 있다. 이후에, 임상 샘플을 포함한 샘플들은 이러한 유전자의 검출을 위해서 본 명세서에서 개시된 실시형태를 사용하여 스크리닝될 수 있다. POC에서 약제 내성에 대해 스크리닝하는 능력은 적절한 치료 계획을 선택하는데 있어 대단한 이득을 가지게 된다. 일정한 예의 실시형태에서, 항생제 내성 유전자는 KPC, NDM1, CTX-M15, OXA-48를 포함하는, 카르바페네마제이다. 다른 항생제 내성 유전자가 공지되어 있고 예를 들어 종합 항생체 내성 데이타베이스 (Comprehensive Antibiotic Resistance Database)에서 확인할 수 있다 (Jia et al. "CARD 2017: expansion and model-centric curation of the Comprehensive Antibiotic Resistance Database." Nucleic Acids Research, 45, D566-573).
리바비린은 수많은 RNA 바이러스를 공격하는 효과적인 항바이러스제이다. 몇몇 임상적으로 중요한 바이러스는 구제역 바이러스 (doi:10.1128/JVI.03594-13); 폴리오 바이러스 (Pfeifer and Kirkegaard. PNAS, 100(12):7289-7294, 2003); 및 C형 간염 바이러스 (Pfeiffer and Kirkegaard, J. Virol. 79(4):2346-2355, 2005)를 포함하는 리바비린 내성을 진화시켜왔다. 많은 다른 지속성 RNA 바이러스, 예컨대 간염 바이러스 및 HIV는 현존하는 항바이러스 약제에 대한 내성을 진화시켜왔다: B형 간염 바이러스 (라미부딘, 테노포비어, 엔테카비어) (doi:10/1002/hep22900); C형 간염 바이러스 (텔라프레비어, BILN2061, ITMN-191, SCh6, 보세프레비어, AG-021541, ACH-806) (doi:10.1002/hep.22549); 및 HIV (다제 내성 돌연변이) (hivb.standford.edu). 본 명세서에서 개시된 실시형태는 특히 이러한 변이체를 검출하는데 사용될 수 있다.
약제 내성이외에도, 본 명세서에서 개시된 실시형태로 검출할 수 있는 수많은 임상적으로 관련된 돌연변이, 예컨대 LCMV의 지속성 대 급성 감염 (doi:10.1073/pnas.1019304108), 및 에볼라의 증가된 감염성 (Diehl et al. Cell. 2016, 167(4):1088-1098) 등이 존재한다.
본 명세서의 다른 곳에 기술된 바와 같이, 밀접하게 관련된 미생물 종 (예를 들어, 소정 표적 서열에 오직 단일 뉴클레오티드 편차만 가짐)은 gRNA에 합성 미스매치의 도입에 의해 구별될 수 있다.
세트 커버 접근법
특정 실시형태에서, 예를 들어, 미생물의 정의된 세트 내의 모든 미생물 종을 식별할 수 있는 가이드 RNA의 세트가 디자인된다. 이러한 방법이 기술되는 일정한 예의 실시형태에서, 본 명세서에 기술된 바와 같은 가이드 RNA를 생성시키기 위한 방법은 참조로 본 명세서에 편입시킨, WO 2017/040316에 개시된 방법과 비교할 수 있다. WO 2017040316에 기술된 바와 같이, 세트 커버 해법은 전체 표적 서열 또는 표적 서열의 세트, 예를 들어 게놈 서열의 세트를 포괄하는데 필요한 최소 수의 표적 서열 프로브 또는 가이드 RNA를 식별할 수 있다. 세트 커버 접근법은 전형적으로 20 내지 50개 염기쌍 범위에서, 프라이머 및/또는 마이크로어레이 프로브를 식별하기 위해 이전에 사용되었었다. 예를 들어, 하기의 문헌들을 참조한다: [Pearson et al., cs.virginia.edu/∼robins/papers/primers_dam11_final.pdf.], [Jabado et al. Nucleic Acids Res. 2006 34(22):6605-11], [Jabado et al. Nucleic Acids Res. 2008, 36(1):e3 doi10.1093/nar/gkm1106], [Duitama et al. Nucleic Acids Res. 2009, 37(8):2483-2492], [Phillippy et al. BMC Bioinformatics. 2009, 10:293 doi:10.1186/1471-2105-10-293]. 그러나, 이러한 접근법은 일반적으로 각각의 프라이머/프로브를 k-량체로서 처리하는 단계 및 정확한 매치를 검색하는 단계 또는 접미사 어레이를 사용하여 부정확한 매치를 허용하는 단계를 포함하였다. 또한, 방법은 일반적으로 각각의 투입 서열이 오직 하나의 프라이머 또는 프로브에 의해 결합되는 것을 필요로 하고, 서열을 따라서 이러한 결합의 위치가 비관련적이도록 프라이머 또는 프로브를 선택하여 하이브리드화를 검출하는 2원 접근법을 취한다. 대안적인 방법은 표적 게놈을 사전 정해진 창으로 나누고 효과적으로 이들 창을 이원 접근법 하에서 개별 투입 서열로서 처리할 수 있으며, 즉, 그들은 소정 프로브 또는 가이드 RNA가 각각의 창 내에서 결합하는지 여부를 결정하고 모든 창이 일부 프로브 또는 가이드 RNA의 상태에 의해 결합되는 것을 요구한다. 효과적으로, 이들 접근법은 전체 투입 서열 또는 투입 서열의 사전-정의된 창으로서 세트 포괄 문제 내 "유니버스"의 각 엘리먼트를 처리하고, 각각의 엘리먼트는 엘리먼트 내에서 프로브 또는 가이드 RNA의 시작이 결합되면 "포괄됨"으로 간주된다. 이들 접근법은 상이한 프로브 또는 가이드 RNA 디자인이 소정 표적 서열을 포괄하도록 허용하는 유동성을 제한한다.
대조적으로, 본 명세서에 개시된 실시형태는 더 긴 프로브 또는 가이드 RNA 길이, 예를 들어, 하이브리드 선택 시퀀싱에 적합한 70 bp 내지 200 bp의 범위를 검출하는 것에 관한 것이다. 또한, 본 명세서에 개시된 방법은 대량 및/또는 가변적 표적 서열 세트에서 모든 종 및/또는 균주 서열의 검출 시퀀싱을 식별하고 용이하게 할 수 있는 프로브 또는 가이드 RNA 세트를 한정할 수 있는 범-표적 서열 접근법을 취하도록 적용될 수 있다. 예를 들어, 본 명세서에 개시된 방법은 단일 어세이에서 다수의 상이한 바이러스, 또는 소정 바이러스의 모든 변이체를 식별하는데 사용될 수 있다. 더 나아가서, 본 명세서에 개시된 방법은 세트 커버 문제에서 "유니버스"의 각 엘리먼트를 표적 서열의 뉴클레오티드인 것으로 처리하고, 각 엘리먼트는 엘리먼트를 포함하는 표적 게놈의 일부 절편에 프로브 또는 가이드 RNA가 결합하는 한 "포괄됨"으로 간주된다. 이들 유형의 세트 커버 방법은 이전 방법의 이원 접근법 대신에 사용될 수 있고, 본 명세서에 개시된 방법은 어떻게 프로브 또는 가이드 RNA가 표적 서열과 하이브리드화할 수 있는가에 대한 더 나은 모델이 된다. 단지 소정 가이드 RNA 서열이 소정 창에 결합하는지 또는 결합하지 않는지를 질문하기 보다는, 이러한 접근법은 하이브리드화 패턴을 검출하는데 사용될 수 있으며, 즉, 소정 프로브 또는 가이드 RNA가 표적 서열 또는 표적 서열들에 결합하는 경우라면, 샘플로부터의 농축 및 임의의 그리고 모든 표적 서열의 시퀀싱을 할 수 있기에 충분한 정도로 표적 서열의 세트를 포괄하기 위해 필요한 프로브 또는 가이드 RNA의 최소 개수를 그들 하이브리드화 패턴으로부터 결정한다. 이들 하이브리드화 패턴은 기능 상실을 최소화하는 일정 매개변수를 한정하고, 그리하여 예를 들어, 각각의 종의 다양성을 반영하기 위해서, 매개변수를 각 종에 대해 다양화시킬 수 있는 방식을 비롯하여, 프로브 또는 가이드 RNA 디자인 상황에서 이전에 적용된 것과 같은, 세트 커버 해법의 간단한 적용을 사용해 획득할 수 없는 계산적으로 효율적인 방식으로 최소의 프로브 또는 가이드 RNA의 식별을 가능하게 한다.
다수 전사물 존재도를 검출하는 능력은 특정한 표현형을 의미하는 고유한 미생물 서명의 생성을 가능하게 할 수 있다. 다양한 기계 학습 기술은 유전자 서명을 유래시키는데 사용될 수 있다. 따라서, CRISPR 시스템의 가이드 RNA는 일정한 표현형을 검출하기 위해서 유전자 서명에 의해 한정되는 바이오마커의 상대적 수준을 식별 및/또는 정량하는데 사용될 수 있다. 일정한 예의 실시형태에서, 유전자 서명은 항생제에 대한 감수성, 항생제에 대한 내성, 또는 이의 조합을 의미한다.
본 발명의 일 양상에서, 방법은 하나 이상의 병원체를 검출하는 단계를 포함한다. 이러한 방식으로, 개별 미생물에 의한 대상체의 감염 간 구별이 얻어질 수 있다. 일부 실시형태에서, 이러한 구별은 특별한 질환, 예를 들어, 질환의 상이한 변이형의 임상의에 의한 검출 또는 진단을 가능하게 할 수 있다. 바람직하게 병원체 서열은 병원체의 게놈 또는 이의 단편이다. 방법은 병원체의 진화를 결정하는 단계를 더 포함할 수 있다. 병원체의 진화를 결정하는 단계는 병원체 돌연변이, 예를 들어 뉴클레오티드 결실, 뉴클레오티드 삽입, 뉴클레오티드 치환의 식별을 포함할 수 있다. 후자의 경우, 비동의성, 동의성, 및 넌코딩 치환이 존재한다. 돌연변이는 대발생 동안 보다 빈번하게 비동의성이다. 방법은 상기 기술된 바와 같이 분석된 2개 병원체 서열 간 치환율을 결정하는 단계를 더 포함할 수 있다. 돌연변이가 유해하거나 또는 심지어 적응성인지 여부는 기능적 분석을 필요로 하지만, 비동의성 돌연변이의 속도는 이러한 유행병의 계속적인 진행이 병원체 적응의 기회를 제공할 수 있다는 것을 시사하므로, 신속한 격리의 필요성을 강조한다. 따라서, 방법은 바이러스 적응의 위험성을 평가하는 단계를 더 포함할 수 있고, 여기서 비동의성 돌연변이의 수를 결정한다 (Gire, et al., Science 345, 1369, 2014).
미생물 대발생의 모니터링
일부 실시형태에서, 본 명세서에 기술된 바와 같은 CRISPR 시스템 또는 이의 사용 방법은 병원체 대발생의 진화를 결정하기 위해 사용될 수 있다. 방법은 하나 이상의 대상체 유래의 다수개의 샘플로부터 하나 이상의 표적 서열을 검출하는 단계를 포함할 수 있고, 여기서 표적 서열은 대발생을 야기하는 미생물 유래의 서열이다. 이러한 방법은 병원체 전파의 패턴, 또는 병원체에 의해 야기되는 질병 대발생에 관여하는 기전을 결정하는 단계를 더 포함할 수 있다.
병원체 전파의 패턴은 병원체의 천연 병원소로부터의 계속적인 신규 전파 또는 천연 병원소로부터의 단일 전파 후 대상체 대 대상체 전파 (예를 들어, 인간 대 인간 전파) 또는 이 둘의 혼합을 포함할 수 있다. 일 실시형태에서, 병원체 전파는 박테리아 또는 바이러스 전파일 수 있고, 이러한 경우에, 표적 서열은 바람직하게 미생물 게놈 또는 이의 단편일 수 있다. 일 실시형태에서, 병원체 전파의 패턴은 병원체 전파의 조기 패턴, 즉 병원체 대발생의 시작 시의 패턴이다. 대발생의 시작 시 병원체 전파의 패턴 결정은 가능한 가장 빠른 시점에 대발생을 중단시킬 가능성을 증가시키고 그리하여 지역 및 국가간 전파 확률을 감소시킨다.
병원체 전파의 패턴을 결정하는 단계는 본 명세서에 기술된 방법에 따라서 병원체 서열을 검출하는 단계를 포함할 수 있다. 병원체 전파의 패턴을 결정하는 단계는 대상체 간 병원체 서열의 공유된 숙주 내 변이를 검출하는 단계 및 공유된 숙주내 변이가 시간적 패턴을 보이는지 여부를 결정하는 단계를 더 포함할 수 있다. 관찰된 숙주내 및 숙주간 변이의 패턴은 전파 및 역학에 관한 중요한 통찰력을 제공한다 (Gire, et al., 2014).
시간적 패턴을 보이는 대상체 간 공유된 숙주내 변이의 검출은 다수 공급원으로부터의 대상체 감염 (중복감염), 샘플 오염 재발성 돌연변이 (돌연변이의 강화를 위한 균형 선택의 유무와 무관), 또는 전파 사슬의 초기에 돌연변이에 의해 발생된 약간의 발산된 바이러스의 동시-전파에 의해 설명될 수 있기 때문에 대상체 간 (특히 인간 사이)에 전파 관련성을 의미한다 (Park, et al., Cell 161(7):1516-1526, 2015). 대상체 간 공유된 숙주내 변이의 검출은 공통 단일 뉴클레오티드 다형성 (SNP) 위치에 위치하는 숙주내 변이체의 검출을 포함할 수 있다. 공통 (SNP) 위치에 위치된 숙주내 변이체의 양성 검출은 숙주내 변이체에 대한 주요 설명으로서 중복감염 및 오염을 의미한다. 중복감염 및 오염은 숙주간 변이체로서 나타나는 SNP 빈도를 기반으로 구별될 수 있다 (Park, et al., 2015). 그렇지 않으면 중복감염 및 오염은 배제시킬 수 있다. 이 후자의 경우에, 대상체 간 공유된 숙주내 변이의 검출은 동의성 및 비동의성 변이체의 빈도를 평가하는 단계 및 동의성 및 비동의성 변이체의 빈도를 서로 비교하는 단계를 더 포함할 수 있다. 비동의성 돌연변이는 단백질의 아미노산을 변경시키는 돌연변이이고, 아마도 그 결과로 자연 선택을 겪은 미생물에서 생물학적 변화를 야기시킬 듯 하다. 동의성 치환은 아미노산 서열을 변경시키지 않는다. 동의성 및 비동의성 변이체의 동일한 빈도는 중성적으로 진화하는 숙주내 변이체를 의미한다. 동의성 및 비동의성 변이체의 빈도가 다르면, 숙주내 변이체는 아마도 균형 선택에 의해 유지될 것이다. 동의성 및 비동의성 변이체의 빈도가 낮으면, 이것은 재발성 돌연변이를 의미한다. 동의성 및 비동의성 변이체의 빈도가 높으면, 이것은 동시-전파를 의미한다 (Park, et al., 2015).
에볼라 바이러스처럼, 라싸 바이러스 (LASV)는 사망률이 높은 출혈열을 야기시킬 수 있다. Andersen 등은 임상 및 설치류 저장 샘플로부터 거의 200종의 LASV 서열의 게놈 카탈로그를 생성시켰다 (Andersen, et al., Cell Volume 162, Issue 4, p 738-750, 13 August 2015). Andersen 등은 2013-2015년 EVD 광역유행이 인간-대-인간 전파에 의해 자극된데 반해, LASV 감염은 주로 병원소-대-인간 감염에 의한다는 것을 보여준다. Andersen 등은 서아프리카 전역에서 LASV의 확산을 밝혀주었고 이러한 이동은 LASV 게놈 존재비, 사망률, 코돈 적응, 및 번역 효율의 변화가 수반되었다는 것을 보여준다. 방법은 제1 병원체 서열을 제2 병원체 서열과 계통발생적으로 비교하는 단계, 및 제1 및 제2 병원체 서열 간 계통발생적 연결성이 존재하는지 여부를 결정하는 단계를 더 포함할 수 있다. 제2 병원체 서열이 초기 기준 서열일 수 있다. 계통발생적 연결성이 존재하면, 방법은 제1 병원체 서열의 계통발생을 제2 병원체 서열에 기원시키는 단계를 더 포함할 수 있다. 따라서, 제1 병원체 서열의 계통을 구축하는 것이 가능하다 (Park, et al., 2015).
방법은 돌연변이가 유해성 또는 적응성인지 여부를 결정하는 단계를 더 포함할 수 있다. 유해성 돌연변이는 전파-손상 바이러스 및 실활성 감염을 의미하고, 따라서 정상적으로 오직 개별 대상체에만 존재한다. 하나의 개별 대상체에 고유한 돌연변이는 계통수의 외부 분지에서 발생되는 것인데 반해, 내부 분지 돌연변이는 다수 샘플 (즉, 다수 대상체)에 존재하는 것이다. 더 높은 비율의 비동의성 치환은 계통수의 외부 분지를 특징으로 한다 (Park, et al., 2015).
계통수의 내부 분지에서, 선택은 유해성 돌연변이를 여과시켜 버릴 더 많은 기회를 가졌었다. 정의에 의해 내부 분지는 다수의 후손 계통을 생성시켰고 그러므로 아마도 적응 비용으로 돌연변이를 포함시킬 가능성이 덜할 것이다. 따라서, 더 낮은 비율의 비동의성 치환은 내부 분지를 의미한다 (Park, et al., 2015).
아마도 적응도에 대한 영향이 덜한, 동의성 돌연변이는 내부 및 외부 분지상에서 보다 비슷한 빈도로 발생하였다 (Park, et al., 2015).
시퀀싱된 표적 서열, 예컨대 바이러스 게놈을 분석하여, 2014년 에볼라 대발생 동안과 같은 광역유행 에피소드의 중증도에 대한 원인이 되는 기전을 발견하는 것이 가능하다. 예를 들어, 이전 대발생 유래의 모든 20종 게놈에 대해서 2014년 대발생의 게놈의 계통발생적 비교를 만든 Gire 등은 2014년 서아프리카 바이러스가 아마도 지난 십여년 내에 중앙 아프리카로부터 확산된 것 같다고 제안한다. 다른 에볼라 바이러스 게놈으로부터의 분기를 이용하여 계통발생을 기원시키는 것은 문제가 있었다. 그러나, 가장 오래된 대발생에 대해 계통수를 기원시키는 것은 샘플 날짜와 뿌리부터 첨단까지의 거리 사이에 강력한 상관성을 밝혀주었고, 치환율은 년간 부위 당 8 × 10-4 였다. 이것은 가장 최근의 대발생 3건의 계통이 모두 대략 2004년 경에, 대체로 동일한 시점에 공통 조상으로부터 분기되었다는 것을 시사하고, 각각의 대발생이 이의 천연 병원소의 동일한 유전적으로 다양한 바이러스 개체군으로부터의 독립적인 동물원성 감염 사건을 나타낸다는 가설을 뒷받침한다. 그들은 또한 2014년 EBOV 대발생이 천연 병원소로부터의 단일 전파와 그 이후 대발생 동안 인간 대 인간 전파에 의해 야기되었을 것임을 발견하였다. 그들 결과는 또한 시에라리온에서의 유행병 에피소드가 대략 동일 시점에 기니로부터의 2종의 유전적으로 별개인 바이러스의 유입에 기인하였을 것이라고 시사한다 (Gire, et al., 2014).
특히 인간 대 인간 전파 덕분에, 라싸 바이러스가 이의 원점으로부터 어떻게 확산되었는가를 결정하고 심지어 이러한 확산 400년의 역사를 역추적하는 것이 또한 가능하였다 (Andersen, et al., Cell 162(4):738-50, 2015).
2013-2015년 EBOV 대발생 동안 필요했던 작업 및 대발생 현장에서 의료진이 직면했던 어려움과 관련하여, 보다 일반적으로, 본 발명의 방법은 소수의 선택된 프로브를 사용하여 시퀀싱을 수행하는 것을 가능하게 만들어서 시퀀싱을 가속화시킬 수 있고, 따라서 샘플 채취부터 결과 입수까지 필요한 시간을 단축시킬 수 있다. 뿐만 아니라, 키트 및 시스템은 현장에서 사용가능하게 디자인될 수 있어서 환자의 진단이 샘플을 국가 또는 세계의 다른 부분으로 수송하거나 또는 발송할 필요없이 쉽게 수행될 수 있다.
상기 기술된 임의의 방법에서, 표적 서열 또는 이의 단편의 시퀀싱은 상기 기술된 임의의 시퀀싱 방법을 사용할 수 있다. 뿐만 아니라, 표적 서열 또는 이의 단편의 시퀀싱은 근실시간 시퀀싱일 수 있다. 표적 서열 또는 이의 단편의 시퀀싱은 이전에 기술된 방법에 따라서 수행될 수 있다 (실험 과정: [Matranga et al., 2014]; 및 [Gire, et al., 2014]). 표적 서열 또는 이의 단편의 시퀀싱은 다수개의 표적 서열의 병행 시퀀싱을 포함할 수 있다. 표적 서열 또는 이의 단편의 시퀀싱은 Illumina 시퀀싱을 포함할 수 있다.
선택된 프로브의 하나 이상과 하이브리드화하는 표적 서역 또는 이의 단편의 분석은 식별 분석일 수 있는데, 표적 서열 또는 이의 단편과 선택된 프로브의 하이브리드화는 샘플 내에 표적 서열의 존재를 의미한다.
현재, 1차 진단은 환자가 갖고 있는 증상을 기반으로 한다. 그러나, 다양한 질환은 동일한 증상을 공유할 수 있으므로 진단은 통계에 많이 의존한다. 예를 들어, 말라리아는 감기-유사 증상: 두통, 발열, 오한, 관절통, 구토, 용혈성 빈혈, 황달, 소변 중 헤모글로빈, 망막 손상, 및 경련을 촉발시킨다. 이들 증상은 또한 패혈증, 위장염, 및 바이러스 질환에서 공통이다. 그들 중에서, 에볼라 출혈열은 하기의 증상, 발열, 인후염, 근육통, 두통, 구토, 설사, 발진, 간 및 신장 기능 감소, 내부 및 외부 출혈을 갖는다.
환자가 예를 들어 열대 아프리카의 의료단에 출석했을 때, 기초 진단은 통계적으로 아프리카의 그 지역 내에서 말라리아가 가장 개연성있는 질환이기 때문에 말라리아로 결론내릴 것이다. 그러한 결과로 환자가 실제로 그 질환에 걸리지 않았을지라도 말라리아에 대해 치료받게 되어 결국 환자는 올바르게 치료되지 않게 된다. 이러한 올바른 치료의 부족은 특히 환자가 걸린 질환이 빠른 진화를 나타낼 때 생명 위협적일 수 있다. 환자에게 제공된 치료가 비효과적이고, 올바른 진단을 해서 환자에게 적절한 치료를 투여하는 것을 의료진이 깨닫기 전에 너무 늦을 수도 있다.
본 발명의 방법은 이러한 상황에 대한 해결책을 제공한다. 실제로, 가이드 RNA의 개수는 극적으로 감소될 수 있기 때문에, 다수의 질환, 예를 들어 바이러스 감염을 동시에 진단할 수 있도록, 단일 칩 상에, 각각의 그룹이 하나의 질환에 대해 특이적인, 그룹들에 분배되는 선택된 프로브를 제공하는 것을 가능하게 만든다. 본 발명 덕분에, 3종이 넘는 질환을 단일 칩 상에서 진단할 수 있고, 바람직하게, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20종을 초과하는 질환을 동시에 진단할 수 있으며, 바람직하게 질환은 소정 지리적 영역의 개체군 내에서 가장 일반적으로 발병되는 것이다. 선택된 프로브의 각 그룹이 진단된 질환 중 하나에 대해 특이적이므로, 보다 정확한 진단을 수행할 수 있고, 따라서 환자에게 부적절한 치료를 투여할 위험성이 감소된다.
다른 경우에서, 바이러스 감염과 같은 질환은 임의의 증상없이 발병될 수 있거나, 또는 증상을 야기하지만 환자가 의료진에게 나타나기 전에 소멸되었다. 이러한 경우에, 환자는 임의의 의료 지원을 찾지 않거나 또는 출석날 증상의 부재로 인해 진단이 복잡해 진다.
본 발명은 또한 핵산, 예컨대 미가공, 비정제 샘플 중 mRNA의 검출을 기반으로 질환의 진단, 병원체의 식별 및 치료의 최적화를 위한 다른 방법과 함께 사용될 수 있다.
본 발명의 방법은 또한 이러한 상황을 해결하기 위한 강력한 도구를 제공한다. 실제로, 각각의 그룹이 소정 지역의 집단 내에서 발병된 가장 일반적인 질환 중 하나에 특이적인, 선택된 가이드 RNA의 다수 그룹이 단일 진단에 포함되므로, 의료진은 오직 환자로부터 채취된 생물학적 샘플을 칩과 접촉시키는 것만을 필요로 한다. 칩의 판독은 환자가 걸린 질환을 밝혀준다.
일부 경우에서, 환자는 특정 증상의 진단을 위해 의료진에게 출석한다. 본 발명의 방법은 어떠한 질환이 이들 증상을 야기시켰는지를 식별할뿐만 아니라 동시에 환자가 자각하지 못한 다른 질환을 앓고 있는지 여부를 결정하는 것을 가능하게 만든다.
이러한 정보는 대발생의 기전을 찾을 때 최고로 중요할 것이다. 실제로, 동일한 바이러스를 갖는 환자 그룹은 또한 대상체 대 대상체 전파 연결성을 시사하는 시간적 패턴을 보인다.
미생물 유전자 교란 스크리닝
일정한 예의 실시형태에서, 본 명세서에 개시된 CRISPR 시스템은 미생물의 유전적 교란을 스크리닝하는데 사용될 수 있다. 이러한 방법은 예를 들어 미생물 경로 및 기능적 네트워크를 설계하기 위해 유용할 수 있다. 미생물 세포는 유전자 변형될 수 있고 그런 후에 상이한 실험 조건 하에서 스크리닝될 수 있다. 상기 기술된 바와 같이, 본 명세서에서 개시된 실시형태는 복합적 방식으로 단일 개별 이산 부피에서 단일 표적, 또는 단일 샘플에서 다수 표적 분자에 대해 스크리닝될 수 있다. 유전자 변형된 미생물은 특정한 미생물 세포 또는 미생물 세포의 개체군에 의해 운반되는 특정한 유전자 변형을 식별하는 핵산 바코드 서열을 포함하도록 변형될 수 있다. 바코드는 식별자로서 사용되는 뉴클레오티드의 짧은 서열 (예를 들어, DNA, RNA, 또는 이의 조합)이다. 핵산 바코드는 4-100개 뉴클레오티드의 길이를 가질 수 있고 단일-가닥 또는 이중-가닥일 수 있다. 바코드로 세포를 식별하기 위한 방법은 당분야에 공지되어 있다. 따라서, 본 명세서에 기술된 CRISPR 이펙터 시스템의 가이드 RNA는 바코드를 검출하는데 사용될 수 있다. 양성 검출가능한 신호의 검출은 샘플에서 특정한 유전자 변형의 존재를 의미한다. 본 명세서에 개시된 방법은 시험되는 실험 조건 하에서 유전자 변형의 효과를 의미하는 상보성 유전자형 또는 표현형 판독을 검출하는 다른 방법과 조합될 수 있다. 스크리닝하려는 유전자 변형은 제한없이, 유전자 넉-인, 유전자 넉-아웃, 역위, 전좌, 전이, 또는 하나 이상의 뉴클레오티드 삽입, 결실, 치환, 돌연변이, 또는 기능적 결과 예컨대 변경된 단백질 안정성 또는 검출을 갖는 에피토프를 코딩하는 핵산의 첨가를 포함한다. 유사한 방식으로, 본 명세서에 기술된 방법은 유전자 조절 엘리먼트 및 유전자 발현 모듈의 특별한 배열의 기능성을 스크리닝하기 위해 합성 생물학 적용분야에서 사용될 수 있다.
일정한 예의 실시형태에서, 방법은 하이포모프를 스크리닝하는데 사용될 수 있다. 하이포모프의 생성 및 핵심 박테리아 기능성 유전자의 식별에서 그들의 용도 및 신규 항생제 치료제의 식별은 참조로 본 명세서에 편입시킨, 2016년 11월 4일 출원된 발명의 명칭 "Multiplex High-Resolution Detection of Micro-organism Strains, Related Kits, Diagnostic Methods and Screening Assays"의 PCT/US2016/060730에 개시된 바와 같다.
상이한 실험 조건은 상이한 화학제, 화학제의 조합, 상이한 농도의 화학제 또는 화학제의 조합, 화학제 또는 화학제의 조합에 대한 상이한 노출 기간, 상이한 물리적 변수, 또는 모두에 미생물의 노출을 포함할 수 있다. 일정한 예의 실시형태에서, 화학제는 항생제 또는 항바이러스제이다. 스크리닝하려는 상이한 물리적 매개변수는 상이한 온도, 대기압, 상이한 대기 및 비대기 가스 농도, 상이한 pH 수준, 상이한 배양 배지 조성, 또는 이의 조합을 포함할 수 있다.
환경적 샘플의 스크리닝
본 명세서에 개시된 방법은 표적 핵산 또는 폴리펩티드의 존재를 검출하여 오염에 대해 환경적 샘플을 스크리닝하는데 사용될 수 있다. 예를 들어, 일부 실시형태에서, 본 발명은 미생물을 검출하는 방법을 제공하고, 이 방법은 본 명세서에 기술된 바와 같은 CRISPR 시스템을 샘플에 노출시키는 단계; 하나 이상의 가이드 RNA와 하나 이상의 미생물-특이적 표적 RNA 또는 하나 이상의 트리거 RNA의 결합을 통해서 RNA 이펙터 단백질을 활성화시켜 검출가능한 양성 신호를 생성시키는 단계를 포함한다. 양성 신호가 검출될 수 있고 샘플 중 하나 이상의 미생물의 존재를 의미한다. 일부 실시형태에서, CRISPR 시스템은 본 명세서에 기술된 바와 같이 기재 상에 존재할 수 있고, 기재는 샘플에 노출될 수 있다. 다른 실시형태에서, 동일한 CRISPR 시스템, 및/또는 상이한 CRISPR 시스템이 기재 상의 다수의 별개 위치에 적용될 수 있다. 추가 실시형태에서, 상이한 CRISPR 시스템은 각 위치에서 상이한 미생물을 검출할 수 있다. 상기에 더욱 상술한 바와 같이, 기재는 예를 들어 제한없이, 종이 기재, 파브릭 기재, 또는 가요성 중합체-기반 기재를 포함하는, 가요성 재료 기재일 수 있다.
본 발명에 따라서, 기재는 샘플채취하려는 유체 중에 기재를 일시적으로 함침시키거나, 기재에 시험하려는 유체를 도포하거나, 또는 시험하려는 표면을 기재와 접촉시켜서, 수동적으로 샘플에 노출될 수 있다. 기재에 샘플을 유입시키는 임의의 수단이 적절하게 사용될 수 있다.
본 명세서에 기술된 바와 같이, 본 발명에서 사용을 위한 샘플은 생물학적 또는 환경적 샘플, 예컨대 식품 샘플 (신선 과일 또는 채소, 육류), 음료 샘플, 종이 표면, 파브릭 표면, 금속 표면, 목재 표면, 플라스틱 표면, 토양 샘플, 담수 샘플, 폐수 샘플, 염수 샘플, 대기 공기 또는 다른 가스 샘플에의 노출, 또는 이의 조합일 수 있다. 예를 들어, 제한없이 금속, 목재, 플라스틱, 고무 등을 포함하는 임의의 재료로 만들어진 가정용/상업적/산업적 표면을 면봉으로 닦아서 오염을 시험할 수 있다. 토양 샘플은 병원성 박테리아 또는 기생충, 또는 다른 미생물의 존재, 환경적 목적 및/또는 인간, 동물 또는 식물 질환 검사를 위해 시험될 수 있다. 물 샘플 예컨대 담수 샘플, 폐수 샘플, 또는 염수 샘플은 예를 들어, 크립토스포리듐 파르븀, 지아르디아 람블리아, 또는 다른 미생물 오염의 존재를 검출하기 위해, 청정도 및 안정성, 및/또는 휴대성에 대해 평가될 수 있다. 추가 실시형태에서, 생물학적 샘플은 제한없이 조직 샘플, 타액, 혈액, 혈장, 혈청, 대변, 소변, 객담, 점액질, 림프, 활액, 뇌척수액, 복수, 흉수, 혈청종, 고름, 또는 피부 또는 점막 표면의 스왑을 포함하는 공급원으로부터 수득될 수 있다. 일부 특정한 실시형태에서, 환경적 샘플 또는 생물학적 샘플은 미가공 샘플일 수 있고/있거나 하나 이상의 표적 분자는 방법의 적용 이전에 샘플로부터 정제되지 않을 수 있거나 또는 증폭되지 않을 수 있다. 미생물의 식별은 임의의 많은 적용분야에서 유용하고/하거나 필요할 수 있고, 따라서 당업자가 적절하다고 여기는 임의 출처 유래의 임의 유형의 샘플이 본 발명에 따라서 사용될 수 있다.
일부 실시형태에서, 레스토랑 또는 다른 식품 제공처에서 박테리아, 예컨대 에스케리치아 콜라이에 의한 식품 오염의 점검; 식품 표면; 살모넬라, 캄필로박터, 또는 에스케리치아 콜라이와 같은 병원체에 대한 물 검사; 또한 제조사 및 규제 기관이 육류원의 순도를 결정하기 위해 식품 품질 점검; 병원체 예컨대 레지오넬라에 의한 공기 오염의 확인; 페디오코커스 및 락토바실러스와 같은 병원체에 의한 맥주의 오염 또는 부패 여부 점검; 제조 동안 박테리아 또는 진균에 의한 살균 또는 미살균 치즈의 오염.
본 발명에 따라서 미생물은 식품 또는 소모성 제품 부패를 초래하는 미생물 또는 병원성 미생물일 수 있다. 병원성 미생물은 병원성일 수 있거나 또는 아니면 인간, 동물 또는 식물에게 바람직하지 않을 수 있다. 인간 또는 동물 목적을 위해, 미생물은 질환을 야기할 수 있거나 또는 질병을 일으킬 수 있다. 본 발명의 동물 또는 수의학적 적용은 미생물에 감염된 동물을 식별할 수 있다. 예를 들어, 본 발명의 방법 및 시스템은 제한없이, 켄넬 코프, 공수병 바이러스, 및 심장사상충을 포함하는 병원체로 반려동물을 식별할 수 있다. 다른 실시형태에서, 본 발명의 방법 및 시스템은 육종 목적으로 친자 감별에 사용될 수 있다. 식물 미생물은 식물에 유해하거나 또는 질환을 초래할 수 있고, 수확량을 감소시킬 수 있거나 또는 색상, 맛, 견실성, 냄새와 같은 특성을 변경시킬 수 있다. 식품 또는 소비성 오염 목적의 경우, 미생물은 식품 또는 소모성 제품의 맛, 냄새, 색상, 견실성 또는 다른 상업적 특성에 부정적으로 영향을 미칠 수 있다. 일정한 예의 실시형태에서, 미생물은 박테리아 종이다. 박테리아는 정신친화성 (psychotroph), 대장균형, 락트산 박테리아, 또는 포자-형성 박테리아일 수 있다. 일정한 예의 실시형태에서, 박테리아는 질환 또는 질병을 야기하는 임의의 박테리아 종일 수 있거나, 또는 아니면 원치않는 생성물 또는 특성을 일으킨다. 본 발명에 따라서 박테리아는 인간, 동물 또는 식물에 병원성일 수 있다.
샘플 유형
본 명세서에 개시된 방법에서 사용하기에 적절한 샘플은 유기체 또는 이의 일부분, 예컨대 식물, 동물, 박테리아 등으로부터 수득된 임의의 통상적인 생물학적 샘플을 포함한다. 특정 실시형태에서, 생물학적 샘플은 동물 대상체, 예컨대 인간 대상체로부터 수득된다. 생물학적 샘플은 제한없이, 단일 세포 유기체, 예컨대 박테리아, 효모, 원충, 및 아메바 등, 다세포 유기체 (예컨대 식물 또는 동물로서, 건강하거나 또는 외관상 건강한 인간 대상체 또는 진단 또는 검사해야 하는 병태 또는 질환, 예컨대 병원성 미생물, 예컨대 병원성 박테리아 또는 바이러스에 의한 감염에 걸린 인간 환자 유래 샘플 포함)를 포함한 임의의 살아있는 유기체로부터 수득되거나, 그로부터 배출되거나, 또는 분비되는 임의의 고형 또는 유체 샘플이다. 예를 들어, 생물학적 샘플은 예를 들어, 혈액, 혈장, 혈청, 소변, 대변, 객담, 점액질, 림프액, 활액, 담즙, 복수, 흉수, 혈청종, 타액, 뇌척수액, 수양액 또는 유리체액, 또는 임의의 신체 분비물, 여출액, 삼출액 (예를 들어, 농양 또는 감염 또는 염증의 임의의 다른 부위로부터 수득된 유체), 또는 관절로부터 수득된 유체 (예를 들어, 정상 관절 또는 질환, 예컨대 류마티스성 관절염, 골관절염, 통풍성 또는 화농성 관절염에 걸린 관절), 또는 피부 또는 점막 표면의 스왑으로부터 수득된 생물학적 유체일 수 있다.
샘플은 또한 임의의 장기 또는 조직으로부터 수득된 샘플 (생검 또는 부검 표본, 예컨대 종양 생검 포함)일 수 있거나 또는 세포 (초대 세포 또는 배양 세포이건 무관) 또는 임의 세포, 조직 또는 장기에 의해 조건화된 배지를 포함할 수 있다. 예시적인 샘플은 제한없이, 세포, 세포 용해물, 혈액 도말 샘플, 세포원심분리 제조물, 세포학 도말 샘플, 체액 (예를 들어, 혈액, 혈장, 혈청, 타액, 객담, 소변, 기관지폐포 세척액, 정액 등), 조직 생검 (예를 들어, 종양 생검), 세침 흡인물, 및/또는 조직 절편 (예를 들어, 크라이오스태트 조직 절편 및/또는 파라핀-포매 조직 절편)을 포함한다. 다른 예에서, 샘플은 순환성 종양 세포 (세포 표면 마커로 식별할 수 있음)를 포함한다. 특정한 예에서, 샘플은 직접적으로 (예를 들어, 신선 또는 냉동) 사용되거나, 또는 사용 전에, 예를 들어 고정 (예를 들어, 포르말린 사용) 및/또는 왁스 포매 (예컨대 포르말린-고정 파라핀-포매 (FFPE) 조직 샘플)에 의해 조작될 수 있다. 대상체로부터 조직을 수득하는 임의 방법이 이용될 수 있고, 사용되는 방법의 선택은 다양한 인자들 예컨대 조직의 유형, 대상체의 연령, 또는 의사가 이용가능한 절차에 의존하게 된다는 것을 이해하게 될 것이다. 이러한 샘플의 획득을 위한 표준 기술은 당분야에서 입수가능하다. 예를 들어, 문헌 [Schluger et al., J. Exp. Med. 176:1327-33 (1992)]; [Bigby et al., Am. Rev. Respir. Dis. 133:515-18 (1986)]; [Kovacs et al., NEJM 318:589-93 (1988)]; 및 [Ognibene et al., Am. Rev. Respir. Dis. 129:929-32 (1984)]을 참조한다.
다른 실시형태에서, 샘플은 환경적 샘플, 예컨대 물, 토양, 또는 표면 예컨대 산업적 또는 의학적 표면일 수 있다. 일부 실시형태에서, 미국 공개 특허 출원 번호 2013/0190196에 개시된 바와 같은 방법은 고도의 감도 및 특이도로 미가공 세포 샘플로부터 직접적으로 유래된, 핵산 서명, 특히 RNA 수준의 검출에 적용될 수 있다. 각각의 관심 병원체에 특이적인 서열은 BLAST 소프트웨어에 의해서 다른 유기체의 모든 코딩 서열과 관심 병원체 유래 코딩 서열을 비교하여 식별확인될 수 있거나 또는 선택될 수 있다.
본 개시 내용의 몇몇 실시형태는 임상적 혈액 샘플을 성공적으로 분획화하기 위해 당분야에 공지된 절차 및 접근법의 사용을 포함한다. 예를 들어, 문헌 [Han Wei Hou et al., Microfluidic Devices for Blood Fractionation, Micromachines 2011, 2, 319-343]; [Ali Asgar S. Bhagat et al., Dean Flow Fractionation (DFF) Isolation of Circulating Tumor Cells (CTCs) from Blood, 15th International Conference on Miniaturized Systems for Chemistry and Life Sciences, October 2-6, 2011, Seattle, WA]; 및 국제 공개 특허 출원 번호 WO2011109762에 기술된 절차를 참조하고, 이들의 개시 내용은 본 명세서에 그들 전체로 참조로 편입된다. 혈액 샘플은 검사 목적을 위해 샘플 크기를 증가시키도록 일반적으로 배양으로 확장된다. 본 발명의 일부 실시형태에서, 혈액 또는 다른 생물학적 샘플은 배양에 의한 확장 필요없이 본 명세서에 기술된 바와 같은 방법에서 사용될 수 있다.
또한, 본 개시 내용의 몇몇 실시형태는 그 개시 내용이 전체로 참조로 본 명세서에 편입되는, [Han Wei Hou et al., Pathogen Isolation from Whole Blood Using Spiral Microchannel, Case No. 15995JR, Massachusetts Institute of Technology, 원고 준비중]에 기술된 바와 같이, 나선형 마이크로채널을 사용하여 전혈로부터 병원체를 성공적으로 단리하기 위해 당분야에 공지된 절차 및 접근법의 사용을 포함한다.
본 명세서에서 개시된 실시형태의 증가된 감도때문에, 일정한 예의 실시형태에서, 어세이 및 방법은 검출하려는 표적 분자를 샘플로부터 더 분획화시키거나 또는 정제시키지 않는 샘플 또는 미가공 샘플에 대해 수행될 수 있다.
미생물의 예
본 명세서에 개시된 실시형태는 수많은 상이한 미생물을 검출하는데 사용될 수 있다. 본 명세서에서 사용되는 용어 미생물은 박테리아, 진균, 원충, 기생충 및 바이러스를 포함한다.
박테리아
다음은 본 명세서에서 개시된 실시형태를 사용하여 검출될 수 있는 미생물 유형의 예시적인 목록을 제공한다. 일정한 예의 실시형태에서, 미생물은 박테리아이다. 개시된 방법에 따라서 검출할 수 있는 박테리아의 예는 제한없이 특히 아시네토박터 바우만니 (Acinetobacter baumanii), 악티노바실러스 (Actinobacillus) sp., 악티노마이세테스 (Actinomycetes), 악티노마이세트 (Actinomyces) sp. (예컨대 악티노마이세스 이스라엘리 (Actinomyces israelii) 및 악티노마이세스 나에스룬디 (Actinomyces naeslundii)), 애로모나스 (Aeromonas) sp. (예컨대 애로모나스 히드로필라 (Aeromonas hydrophila), 애로모나스 베로니 (Aeromonas veronii) 생물형 소브리아 (애로모나스 소브리아 (Aeromonas sobria), 및 애로모나스 카비아에 (Aeromonas caviae)), 아나플라스마 파고시토필럼 (Anaplasma phagocytophilum), 아나플라스마 마르기날레 (Anaplasma marginale), 알칼리게네스 실로소시단스 (Alcaligenes xylosoxidans), 아시네토박터 바우마니이 (Acinetobacter baumanii), 악티노바실러스 악티노마이세템코미탄스 (Actinobacillus actinomycetemcomitans), 바실러스 (Bacillus) sp. (예컨대, 바실러스 안트라시스 (Bacillus anthracis), 바실러스 세레우스 (Bacillus cereus), 바실러스 서브틸리스 (Bacillus subtilis), 바실러스 투린지엔시스 (Bacillus thuringiensis), 및 바실러스 스테아로써모필러스 (Bacillus stearothermophilus)), 박테로이데스 (Bacteroides) sp. (예컨대, 박테로이데스 프라길리스 (Bacteroides fragilis)), 바르토넬라 (Bartonella) sp. (예컨대, 바르토넬라 바실리포르미스 (Bartonella bacilliformis) 및 바르토넬라 헨셀라에 (Bartonella henselae), 비피도박테리움 (Bifidobacterium) sp., 보르데텔라 (Bordetella) sp. (예컨대, 보르데텔라 퍼투시스 (Bordetella pertussis), 보르데텔라 파라퍼투시스 (Bordetella parapertussis), 및 포르데텔라 브론치셉티카 (Bordetella bronchiseptica)), 보렐리아 (Borrelia) sp. (예컨대, 보렐리아 레쿠렌티스 (Borrelia recurrentis), 및 보렐리아 부르그도르페리 (Borrelia burgdorferi)), 브루셀라 (Brucella) sp. (예컨대, 브루셀라 아보르투스 (Brucella abortus), 브루셀라 카니스 (Brucella canis), 브루셀라 멜린텐시스 (Brucella melintensis) 및 브루셀라 수이스 (Brucella suis)), 버크홀데리아 (Burkholderia) sp. (예컨대, 버크홀데리아 슈도말레이 (Burkholderia pseudomallei) 및 버크홀데리아 세파시아 (Burkholderia cepacia)), 캄필로박터 (Campylobacter) sp. (예컨대, 캄필로박터 제주니 (Campylobacter jejuni), 캄필로박터 콜라이 (Campylobacter coli), 캄필로박터 라리 (Campylobacter lari) 및 캄필로박터 페투스 (Campylobacter fetus)), 카프노사이토파가 (Capnocytophaga) sp., 카디오박테리움 호미니스 (Cardiobacterium hominis), 클라미디아 트라코마티스 (Chlamydia trachomatis), 클라미도필라 뉴모니아에 (Chlamydophila pneumoniae), 클라미도필라 프시타시 (Chlamydophila psittaci), 시트로박터 (Citrobacter) sp. 콕시엘라 부르네티이 (Coxiella burnetii), 코리네박테리움 (Corynebacterium) sp. (예컨대, 코리네박테리움 디프테리아에 (Corynebacterium diphtheriae), 코리네박테리움 제이케움 (Corynebacterium jeikeum) 및 코리네박테리움 (Corynebacterium)), 클로스트리듐 (Clostridium) sp. (예컨대 클로스트리듐 퍼프린젠스 (Clostridium perfringens), 클로스트리듐 디피실 (Clostridium difficile), 클로스트리듐 보툴리늄 (Clostridium botulinum) 및 클로스트리듐 테타니 (Clostridium tetani)), 에이케넬라 코로덴스 (Eikenella corrodens), 엔테로박터 (Enterobacter) sp. (예컨대, 엔테로박터 애로제네스 (Enterobacter aerogenes), 엔테로박터 아글로머란스 (Enterobacter agglomerans), 엔테로박터 클로아카에 (Enterobacter cloacae) 및 기회감염성 에스케리치아 콜라이 (Escherichia coli), 예컨대 장독소원성 에스케리치아 콜라이 (Escherichia coli), 장침습성 에스케리치아 콜라이, 장병원성 에스케리치아 콜라이, 장출혈성 에스케리치아 콜라이, 장응집성 에스케리치아 콜라이 및 요로병원성 에스케리치아 콜라이를 포함한, 에스케리치아 콜라이), 엔테로코커스 (Enterococcus) sp. (예컨대, 엔테로코커스 패칼리스 (Enterococcus faecalis) 및 엔테로코커스 패시움 (Enterococcus faecium)), 엘리키아 (Ehrlichia) sp. (예컨대, 엘리키아 카페엔시아 (Ehrlichia chafeensia) 및 엘리키아 카니스 (Ehrlichia canis)), 에피더모피톤 플로코섬 (Epidermophyton floccosum), 에리시펠로트릭스 루시오파티아에 (Erysipelothrix rhusiopathiae), 유박테리움 (Eubacterium) sp., 프란시셀라 툴라렌시스 (Francisella tularensis), 푸소박테리움 뉴클레아텀 (Fusobacterium nucleatum), 가드네렐라 바지날리스 (Gardnerella vaginalis), 게멜라 모빌로럼 (Gemella morbillorum), 해모필러스 (Haemophilus) sp. (예컨대, 해모필러스 인플루엔자 (Haemophilus Influenzae), 해모필러스 두크레이이 (Haemophilus ducreyi), 해모필러스 애집티우스 (Haemophilus aegyptius), 해모필러스 파라인플루엔자에 (Haemophilus Parainfluenzae), 해모필러스 해몰리티커스 (Haemophilus haemolyticus) 및 해모필러스 파라해몰리티커스 (Haemophilus parahaemolyticus), 헬리코박터 (Helicobacter) sp. (예컨대, 헬리코박터 필로리 (Helicobacter pylori), 헬리코박터 시나에디 (Helicobacter cinaedi) 및 헬리코박터 펜넬리아에 (Helicobacter fennelliae)), 킨겔라 킨기이 (Kingella kingii), 클렙시엘라 (Klebsiella) sp. (예컨대, 클렙시엘라 뉴모니아 (Klebsiella pneumoniae), 클렙시엘라 그라눌로마티스 (Klebsiella granulomatis) 및 클렙시엘라 옥시토카 (Klebsiella oxytoca)), 락토바실러스 (Lactobacillus) sp., 리스테리아 모노시토제네스 (Listeria monocytogenes), 렙토스피라 인테로간스 (Leptospira interrogans), 레지오넬라 뉴모필라 (Legionella pneumophila), 렙토스피라 인테로간스 (Leptospira interrogans), 펩토스트렙토코커스 (Peptostreptococcus) sp., 만헤이미아 헤몰리티카 (Mannheimia hemolytica), 마이크로스포럼 카니스 (Microsporum canis), 모라셀라 카타랄리스 (Moraxella catarrhalis), 모르가넬라 (Morganella) sp., 모빌룬커스 (Mobiluncus) sp., 마이크로코커스 (Micrococcus) sp., 마이코박테리움 (Mycobacterium) sp. (예컨대, 마이코박테리움 레프라에 (Mycobacterium leprae), 마이코박테리움 튜버큘로시스 (Mycobacterium tuberculosis), 마이코박테리움 파라튜버큘로시스 (Mycobacterium paratuberculosis), 마이코박테리움 인트라셀룰라레 (Mycobacterium intracellulare), 마이코박테리움 아비움 (Mycobacterium avium), 마이코박테리움 보비스 (Mycobacterium bovis), 및 마이코박테리움 마리넘 (Mycobacterium marinum)), 마이코플라즘 (Mycoplasm) sp. (예컨대, 마이코플라스마 뉴모니아에 (Mycoplasma pneumoniae), 마이코플라스마 호미니스 (Mycoplasma hominis) 및 마이코플라스마 제니탈리움 (Mycoplalsma genitalium)), 노카르디아 (Nocardia) sp. (예컨대, 노카르디아 아스테로이데스 (Nocardia asteroides), 노카르디아 시리아시제오르기카 (Nocardia cyriacigeorgica) 및 노카르디아 브라실리엔시스 (Nocardia brasiliensis)), 네이세리아 (Neisseria) sp. (예컨대, 네이세리아 고노레아 (Neisseria gonorrhoeae) 및 네이세리아 메닌지티디스 (Neisseria meningitidis)), 파스퇴렐라 멀토시다 (Pasteurella multocida), 피티로스포럼 오르비쿨라레 (Pityrosporum orbiculare) (말라세지아 푸르푸르 (Malassezia furfur)), 플레시오모나스 시겔로이데스 (Plesiomonas shigelloides), 프레보텔라 (Prevotella) sp., 폴피로모나스 (Porphyromonas) sp., 프레보텔라 멜라니노제니카 (Prevotella melaninogenica), 프로테우스 (Proteus) sp. (예컨대, 프로테우스 불가리스 (Proteus vulgaris) 및 프로테우스 미라빌리스 (Proteus mirabilis)), 프로비덴시아 (Providencia) sp. (예컨대, 프로비덴시아 알칼리파시엔스 (Providencia alcalifaciens), 프로비덴시아 레트게리 (Providencia rettgeri) 및 프로비덴시아 스투아르티 (Providencia stuartii)), 슈도모나스 애루지노사 (Pseudomonas aeruginosa), 프로피오니박테리움 아크네스 (Propionibacterium acnes), 로도코커스 에쿠이 (Rhodococcus equi), 리켓치아 (Rickettsia) sp. (예컨대, 리켓치아 리켓치이 (Rickettsia rickettsii), 리켓치아 아카리 (Rickettsia akari) 및 리켓치아 프로와제키이 (Rickettsia prowazekii), 오리엔티아 쯔쯔가무시 (Orientia tsutsugamushi) (이전명: 리켓치아 쯔쯔가무시 (Rickettsia tsutsugamushi)) 및 리켓치아 티피 (Rickettsia typhi)), 로도코커스 (Rhodococcus) sp., 세라티아 마르세센스 (Serratia marcescens), 스테노트로포모나스 말토필라 (Stenotrophomonas maltophilia), 살모넬라 (Salmonella) sp. (예컨대, 살모넬라 엔테리카 (Salmonella enterica), 살모넬라 티피 (Salmonella typhi), 살모넬라 파라티피 (Salmonella paratyphi), 살모넬라 엔테리티디스 (Salmonella enteritidis), 살모넬라 콜레라수이스 (Salmonella cholerasuis) 및 살모넬라 티피뮤리움 (Salmonella typhimurium)), 세라티아 (Serratia) sp. (예컨대, 세라티아 마르세산스 (Serratia marcesans) 및 세라티아 리퀴파시엔스 (Serratia liquifaciens)), 시겔라 (Shigella) sp. (예컨대, 시겔라 디센테리아에 (Shigella dysenteriae), 시겔라 프렉스네리 (Shigella flexneri), 시겔라 보이디이 (Shigella boydii) 및 시겔라 손네이 (Shigella sonnei)), 스타필로코커스 (Staphylococcus) sp. (예컨대 스타필로코커스 아우레우스 (Staphylococcus aureus), 스타필로코커스 에피더미디스 (Staphylococcus epidermidis), 스타필로코커스 헤몰리티커스 (Staphylococcus hemolyticus), 스타필로코커스 사프로피티커스 (Staphylococcus saprophyticus)), 스트렙토코커스 (Streptococcus) sp. (예컨대, 스트렙토코커스 뉴모니아 (Streptococcus pneumoniae) (예를 들어, 클로람페니콜-내성 혈청형 4 스트렙토코커스 뉴모니아, 스펙티노마이신-내성 혈청형 6B 스트렙토코커스 뉴모니아, 스트렙토마이신-내성 혈청형 9V 스트렙토코커스 뉴모니아, 에리쓰로마이신-내성 혈청형 14 스트렙토코커스 뉴모니아, 옵토킨-내성 혈청형 14 스트렙토코커스 뉴모니아, 리팜피신-내성 혈청형 18C 스트렙토코커스 뉴모니아, 테트라사이클린-내성 혈청형 19F 스트렙토코커스 뉴모니아, 페니실린-내성 혈청형 19F 스트렙토코커스 뉴모니아, 및 트리메토프림-내성 혈청형 23F 스트렙토코커스 뉴모니아, 클로람페니콜-내성 혈청형 4 스트렙토코커스 뉴모니아, 스펙티노마이신-내성 혈청형 6B 스트렙토코커스 뉴모니아, 스트렙토마이신-내성 혈청형 9V 스트렙토코커스 뉴모니아, 옵토킨-내성 혈청형 14 스트렙토코커스 뉴모니아, 리팜피신-내성 혈청형 18C 스트렙토코커스 뉴모니아, 페니실린-내성 혈청형 19F 스트렙토코커스 뉴모니아, 또는 트리메토프림-내성 혈청형 23F 스트렙토코커스 뉴모니아), 스트렙토코커스 아갈락티아 (Streptococcus agalactiae), 스트렙토코커스 뮤탄스 (Streptococcus mutans), 스트렙토코커스 피로제네스 (Streptococcus pyogenes), 그룹 A 스트렙토코커스, 스트렙토코커스 피로제네스, 그룹 B 스트렙토코커스, 스트렙토코커스 아갈락티아, 그룹 C 스트렙토코커스, 스트렙토코커스 안지노서스 (Streptococcus anginosus), 스트렙토코커스 에퀴스밀리스 (Streptococcus equismilis), 그룹 D 스트렙토코커스, 스트렙토코커스 보비스 (Streptococcus bovis), 그룹 F 스트렙토코커스, 및 스트렙토코커스 안지노서스 그룹 G 스트렙토코커스), 스피릴럼 미너스 (Spirillum minus), 스트렙토바실러스 모닐리포르미 (Streptobacillus moniliformi), 트레포네마 (Treponema) sp. (예컨대, 트레포네마 카라테움 (Treponema carateum), 트레포네마 페테누에 (Treponema petenue), 트레포네마 팔리둠 (Treponema pallidum) 및 트레포네마 엔데미컴 (Treponema endemicum), 트리코피톤 루브럼 (Trichophyton rubrum), 트리코피톤 멘타그로피테스 (Trichophyton mentagrophytes), 프로테리마 위펠리이 (Tropheryma whippelii), 우레아플라스마 우레아리티컴 (Ureaplasma urealyticum), 베일로넬라 (Veillonella) sp., 비브리오 (Vibrio) sp. (예컨대, 비브리오 콜레라에 (Vibrio cholerae), 비브리오 파라헤몰리티커스 (Vibrio parahemolyticus), 비브리오 벌니피커스 (Vibrio vulnificus), 비브리오 파라해몰리티커스 (Vibrio parahaemolyticus), 비브리오 벌니피커스 (Vibrio vulnificus), 비브리오 알기놀리티커스 (Vibrio alginolyticus), 비브리오 미미커스 (Vibrio mimicus), 비브리오 홀리사에 (Vibrio hollisae), 비브리오 플루비알리스 (Vibrio fluvialis), 비브리오 멧치니코비이 (Vibrio metchnikovii), 비브리오 담셀라 (Vibrio damsela) 및 비브리오 퍼니시이 (Vibrio furnisii)), 여시니아 (Yersinia) sp. (예컨대, 여시니아 엔테로콜리티카 (Yersinia enterocolitica), 여시니아 페스티스 (Yersinia pestis), 및 여시니아 슈도튜버큘로시스 (Yersinia pseudotuberculosis)) 및 잔토모나스 말토필리아 (Xanthomonas maltophilia) 중 어느 하나 이상 (또는 이의 임의 조합)을 포함한다.
진균
일정한 예의 실시형태에서, 미생물은 진균 또는 진균 종이다. 개시된 방법에 따라서 검출할 수 있는 진균의 예는 제한없이 아스퍼질러스 (Aspergillus), 블라스토마이세스 (Blastomyces), 칸디다증 (Candidiasis), 콕시디오이데스 진균증 (Coccidiodomycosis), 크립토코커스 네오포르만스 (Cryptococcus neoformans), 크립토코커스 가티 (Cryptococcus gatti), sp., 히스토플라스마 (Histoplasma) sp. (예컨대, 히스토플라스마 캡술라텀 (Histoplasma capsulatum), 뉴모시스티스 (Pneumocystis) sp. (예컨대, 뉴모시스티스 지로벡시이 (Pneumocystis jirovecii)), 스타키보트리스 (Stachybotrys) (예컨대, 스타키보트리스 카르타럼 (Stachybotrys chartarum)), 모균증 (Mucroymcosis), 스포로트릭스 (Sporothrix), 진균성 안구 감염 백선, 엑세로힐럼 (Exserohilum), 클라도스포리움 (Cladosporium) 중 어느 하나 이상 (또는 이의 임의 조합)을 포함한다.
일정한 예의 실시형태에서, 진균은 효모이다. 개시된 방법에 따라서 검출할 수 있는 효모의 예는 제한없이 아스퍼질러스 (Aspergillus) 종 (예컨대, 아스퍼질러스 푸미가터스 (Aspergillus fumigatus), 아스퍼질러스 플라버스 (Aspergillus flavus) 및 아스퍼질러스 클라바터스 (Aspergillus clavatus)), 크립토코커스 (Cryptococcus) sp. (예컨대, 크립토코커스 네오포르만스 (Cryptococcus neoformans), 크립토코커스 가티 (Cryptococcus gattii), 크립토코커스 라우렌티이 (Cryptococcus laurentii) 및 크립토코커스 알비더스 (Cryptococcus albidus), 제오트리컴 (Geotrichum) 종, 사카로마이세스 (Saccharomyces) 종, 한세눌라 (Hansenula) 종, 칸디다 종 (예컨대 칸디다 알비칸스 (Candida albicans), 클루이베로마이세스 (Kluyveromyces) 종, 데바리오마이세스 (Debaryomyces) 종, 피키아 (Pichia) 종, 또는 이의 조합 중 하나 이상 (또는 이의 조합)을 포함한다. 일정한 예의 실시형태에서, 진균은 곰팡이이다. 곰팡이의 예는 제한없이, 제한없이, 페니실리움 (Penicillium) 종, 클라도스포리움 (Cladosporium) 종, 비소클라미스 (Byssochlamys) 종, 또는 이의 조합을 포함한다.
원충
일정한 예의 실시형태에서, 미생물은 원충이다. 개시된 방법 및 장치에 따라서 검출할 수 있는 원충의 예는 제한없이 유글레노조아 (Euglenozoa), 헤테로로보세아 (Heterolobosea), 디플로모나디다 (Diplomonadida), 아메보조아 (Amoebozoa), 블라스토시스틱 (Blastocystic), 및 아피콤플렉사 (Apicomplexa) 중 어느 하나 이상 (또는 이의 임의 조합)을 포함한다. 예시적인 유글레노조아는 제한없이, 트리파노소마 크루지 (Trypanosoma cruzi) (샤가스 병), 트리파노소마 브루세이 감비엔스 (Trypanosoma brucei gambiense), 트리파노소마 브루세이 로데시엔스 (Trypanosoma brucei rhodesiense), 리슈마니아 브라질리엔시스 (Leishmania braziliensis), 리슈마니아 인판텀 (Leishmania infantum), 리슈마니아 멕시카나 (Leishmania mexicana), 리슈마니아 마조르 (Leishmania major), 리슈마니아 트로피카 (Leishmania tropica), 및 리슈마니아 도노바니 (Leishmania donovani)를 포함한다. 예시적인 헤테로로보세아는 제한없이, 내글레리아 파울러리 (Naegleria fowleri)를 포함한다. 예시적인 디플로모나디드는 제한없이, 지아르디아 인테스티날리스 (Giardia intestinalis) (지아르디아 람블리아 (Giardia lamblia), 지아르디아 듀오데날리스 (Giardia duodenalis))를 포함한다. 예시적인 아메보조아는 제한없이, 아칸타메바 카스텔라니이 (Acanthamoeba castellanii), 발라무티아 마드릴라리스 (Balamuthia madrillaris), 엔타메바 히스톨리티카 (Entamoeba histolytica)를 포함한다. 예시적인 블라스토시스트는 제한없이, 블라스토시스틱 호미니스 (Blastocystic hominis)를 포함한다. 예시적인 아피콤플렉사는 제한없이, 바베시아 미크로티 (Babesia microti), 크립토스포리듐 파르븀 (Cryptosporidium parvum), 시클로스포라 카이에타넨시스 (Cyclospora cayetanensis), 플라스모듐 팔시파럼 (Plasmodium falciparum), 플라스모듐 비박스 (Plasmodium vivax), 플라스모듐 오발레 (Plasmodium ovale), 플라스모듐 말라리아에 (Plasmodium malariae), 및 톡소플라스마 곤디 (Toxoplasma gondii)를 포함한다.
기생충
일정한 예의 실시형태에서, 미생물은 기생충이다. 개시된 방법에 따라서 검출할 수 있는 기생충의 예는 제한없이 온코세르카 (Onchocerca) 종 및 플라스모듐 (Plasmodium) 종 중 하나 이상 (또는 이의 임의 조합)을 포함한다.
바이러스
일정한 예의 실시형태에서, 본 명세서에 개시된 시스템, 장치, 및 방법은 샘플에서 바이러스를 검출하는 것에 관한 것이다. 본 명세서에서 개시된 실시형태는 (예를 들어, 대상체 또는 식물의) 바이러스 감염을 검출하거나, 또는 단일 뉴클레오티드 다형성이 상이한 바이러스 균주를 포함하여, 바이러스 균주의 결정에 사용될 수 있다. 바이러스는 DNA 바이러스, RNA 바이러스, 또는 레트로바이러스일 수 있다. 본 발명에서 유용한 바이러스의 비제한적인 예는 제한없이, 에볼라, 홍역, SARS, 치쿤구니아, 간염, 마르부르크, 황열, MERS, 뎅기, 라싸, 인플루엔자, 라브도바이러스 또는 HIV를 포함한다. 간염 바이러스는 A형 간염 바이러스, B형 간염 바이러스, 또는 C형 간염 바이러스를 포함할 수 있다. 인플루엔자 바이러스는 예를 들어, A형 인플루엔자 또는 B형 인플루엔자를 포함할 수 있다. HIV는 HIV 1 또는 HIV 2를 포함할 수 있다. 일정한 예의 실시형태에서, 바이러스 서열은 인간 호흡기 세포융합 바이러스, 수단 에볼라 바이러스, 분디분교 바이러스, 타이 포레스트 에볼라 바이러스, 레스톤 에볼라 바이러스, 아키모타, 애데스 플라비바이러스, 아구아카테 바이러스, 아까바네 바이러스, 알레티노피드 렙타레나바이러스, 알파우아요 맘마레나바이러스, 아마파리 엠마레나 바이러스, 안데스 바이러스, 아포이 바이러스, 아라반 바이러스, 아로아 바이러스, 아룸워트 바이러스, 대서양 연어 파라믹소바이러스, 오스트레일리아 박쥐 릿사바이러스, 조류 보르나바이러스, 조류 메타뉴모바이러스, 조류 파라믹소바이러스, 펭귄 또는 포클랜드섬 바이러스, BK 폴리오마바이러스, 바가자 바이러스, 반나 바이러스, 박쥐 헤페바이러스, 박쥐 사포바이러스, 베어 캐년 맘마레나바이러스, 베일롱 바이러스, 베타코로노아바이러스, 베타파필로마바이러스 1-6, 반자 바이러스, 보켈로 박쥐 릿사바이러스, 보르나병 바이러스, 버번 바이러스, 소 헤파시바이러스, 소 파라인플루엔자 바이러스 3, 소 호흡기 세포융합 바이러스, 브라조란 바이러스, 부니암웨라 바이러스, 칼리시바이러스과 바이러스, 캘리포니아 뇌염 바이러스, 칸디루 바이러스, 개 디스템퍼 바이러스, 개 뉴모바이러스, 체다 바이러스, 세포융합제 바이러스, 세타시안 모르빌리바이러스, 찬디푸라 바이러스, 챠오양 바이러스, 차파레 맘마레나바이러스, 치쿤구니아 바이러스, 콜로버스 원숭이 파필로마바이러스, 콜로라도 진드기열 바이러스, 우두 바이러스, 크림-콩고 출혈열 바이러스, 쿨렉스 플라비바이러스, 쿠픽시 맘마레나바이러스, 뎅기 바이러스, 도브라바-벨그라데 바이러스, 동강 바이러스, 두그베 바이러스, 듀벤헤이즈 바이러스, 동부 말 뇌염 바이러스, 엔테베 박쥐 바이러스, 장바이러스 A-D, 유럽 박쥐 릿사바이러스 1-2, 이야크 바이러스, 고양이 모빌리바이러스, 페르-드-랑스 파라믹소바이러스, 피츠로이 리버 바이러스, 플라비바이러스과 바이러스, 플렉살 맘마레나바이러스, GB 바이러스 C, 가이로 바이러스, 제미서큘러바이러스, 거위 파라믹소바이러스 SF02, 그레이트 아일랜드 바이러스, 구아나리토 맘마레나바이러스, 한탄 바이러스, 한타바이러스 Z10, 하트랜드 바이러스, 헨드라 바이러스, A/B/C/E형 간염 바이러스, 델타형 간염 바이러스, 인간 보카바이러스, 인간 코로나바이러스, 인간 내생성 레트로바이러스 K, 인간 장 코로나바이러스, 인간 생식기-연관 원형 DNA 바이러스-1, 인간 헤르페스바이러스 1-8, 인간 면역결핍 바이러스 1/2, 인간 마스타데노바이러스 A-G, 인간 파필로마바이러스, 인간 파라인플루엔자 바이러스 1-4, 인간 파라에코바이러스, 인간 피코비르나바이러스, 인간 스마코바이러스, 이코마 릿사바이러스, 일헤우스 바이러스, 인플루엔자 A-C, 입피 맘마레나바이러스, 이르쿠트 바이러스, J-바이러스, JC 폴리오마바이러스, 일본 뇌염 바이러스, 후닌 맘마레나바이러스, KI 폴리오마바이러스, 카디피로 바이러스, 카미티 리버 바이러스, 케두구 바이러스, 후잔트 바이러스, 코코베라 바이러스, 키아사누 삼림병 바이러스, 라고스 박쥐 바이러스, 란가트 바이러스, 라싸 맘마레나바이러스, 라티노 맘마레나바이러스, 레오파즈 힐 바이러스, 랴오닝 바이러스, 류간 바이러스, 로우비 바이러스, 루핑 일 바이러스, 룰요 맘마레나바이러스, 루나 맘마레나바이러스, 렁크 바이러스, 림프구성 맥락수막염 맘마레나바이러스, 릿사바이러스 오테르노, MSSI2\.225 바이러스, 마츄포 맘마레나바이러스, 마마스트로바이러스 1, 만자닐라 바이러스, 마푸에라 바이러스, 마르부르그 바이러스, 마야로 바이러스, 홍역 바이러스, 메낭글 바이러스, 메르카데오 바이러스, 메르켈 세포 폴리오마바이러스, 중동 호흡기 증후군 코로나바이러스, 모발라 맘마레나바이러스, 모독 바이러스, 모이장 바이러스, 모콜로 바이러스, 원두증 바이러스, 몬타나 미오티스 류코엔찰리티스 바이러스, 모페이아 라사 바이러스 재편성체 29, 모페이아 맘마레나바이러스, 모로고로 바이러스, 모스만 바이러스, 유행성이하선염 바이러스, 쥐과 폐렴 바이러스, 머레이 밸리 뇌염 바이러스, 나리바 바이러스, 뉴캐슬병 바이러스, 니파 바이러스, 노르워크 바이러스, 노르웨이 박쥐 헤파시바이러스, 은타야 바이러스, 오니옹-니옹 바이러스, 올리베로스 맘마레나바이러스, 옴스크 출혈열 바이러스, 오로퓨스 바이러스, 파라인플루엔자 바이러스 5, 파라나 맘마레나바이러스, 파라마타 리버 바이러스, 가성 우역 바이러스, 피찬드 맘마레나바이러스, 피코르나바이러스과 바이러스, 피리탈 맘마레나바이러스, 피시헤페바이러스 A, 돼지 파라인플루엔자 바이러스 1, 돼지 루불라바이러스, 파와산 바이러스, 영장류 T-림프친화성 바이러스 1-2, 영장류 적혈파보바이러스 1, 푼타 토로 바이러스, 푸울말라 바이러스, 꽝빈 바이러스, 공수병 바이러스, 라즈단 바이러스, 파충류 보르나바이러스 1, 리노바이러스 A-B, 리프트 밸리 발열 바이러스, 우역 바이러스, 리오 브라보 바이러스, 설치류 토크 테노 바이러스, 설치류 헤파시바이러스, 로스 리버 바이러스, 로타바이러스 A-I, 로얄 팜 바이러스, 루벨라 바이러스, 사비아 맘마레나바이러스, 세일럼 바이러스, 모래파리열 나폴리 바이러스, 모래파리열 시칠리아 바이러스, 사포로 바이러스, 사투페리 바이러스, 물개 아넬로바이러스, 셈리키 포레스트 바이러스, 센다이 바이러스, 서울 바이러스, 세픽 바이러스, 중증 급성 호흡기 증후군-관련 코로나바이러스, 혈소판감소증 증후군 수반 중증 발열 바이러스, 샤몬다 바이러스, 시모니 박쥐 바이러스, 슈니 바이러스, 심부 바이러스, 원숭이 토크 테노 바이러스, 시미언 바이러스 40-41, 신 놈브레 바이러스, 신드비스 바이러스, 소형 아넬로바이러스, 소수가 바이러스, 스페인 염소 뇌염 바이러스, 스폰드웨니 바이러스, 세인트 루이스 뇌염 바이러스, 선샤인 바이러스, TTV-유사 미니 바이러스, 타카리브 맘마레나바이러스, 타일라 바이러스, 타마나 박쥐 바이러스, 타미아미 맘마레나바이러스, 템부수 바이러스, 토고토 바이러스, 토타팔라얌 바이러스, 진드기-매개 뇌염 바이러스, 티오만 바이러스, 토가바이러스과 바이러스, 토크 테노 카니스 바이러스, 토크 테노 두루쿨리 바이러스, 토크 테노 펠리스 바이러스, 토크 테노 미디 바이러스, 토크 테노 수스 바이러스, 토크테노 타카린 바이러스, 토크 테노 바이러스, 토크 테노 잘로퍼스 바이러스, 투호코 바이러스, 툴라 바이러스, 투파이아 파라믹소바이러스, 우수투 바이러스, 유우쿠니에미 바이러스, 백시니아 바이러스, 바리올라 바이러스, 베네수엘라 말 뇌염 바이러스, 수포성 구내염 인디아나 바이러스, WU 폴리오마바이러스, 웨셀스브론 바이러스, 서부 코카시안 박쥐 바이러스, 웨스트나일 바이러스, 서부 말 뇌염 바이러스, 화이트워터 아로요 맘마레나바이러스, 황열병 바이러스, 요코세 바이러스, 유그 보그다노박 바이러스, 자이르 에볼라바이러스, 지카 바이러스, 또는 자이고사카로마이세스 바일리 바이러스 Z 바이러스 서열일 수 있다. 검출할 수 있는 RNA 바이러스의 예는 코로나바이러스과 바이러스, 피코르나바이러스과 바이러스, 칼리시바이러스과 바이러스, 플라비바이러스과 바이러스, 토가바이러스과 바이러스, 보르나바이러스과, 필로바이러스과, 파라믹소바이러스과, 뉴모바이러스과, 라브도바이러스과, 아레나바이러스과, 부니아바이러스과, 오르쏘믹소바이러스과, 또는 델타바이러스 중 하나 이상 (또는 이의 임의 조합)을 포함한다. 일정한 예의 실시형태에서, 바이러스는 코로나바이러스, SARS, 폴리오바이러스, 리노바이러스, A형 간염 바이러스, 노르워크 바이러스, 황열병 바이러스, 웨스트나일 바이러스, C형 간염 바이러스, 뎅기열 바이러스, 지카 바이러스, 루벨라 바이러스, 로스 리버 바이러스, 신드비스 바이러스, 치쿤구니아 바이러스, 보르나병 바이러스, 에볼라 바이러스, 마르부르그 바이러스, 홍역 바이러스, 유행성이하선염 바이러스, 니파 바이러스, 헨드라 바이러스, 뉴캐슬병 바이러스, 인간 호흡기 세포융합 바이러스, 공수병 바이러스, 라싸 바이러스, 한타바이러스, 크림-콩고 출혈열 바이러스, 인플루엔자, 또는 D형 간염 바이러스이다.
일정한 예의 실시형태에서, 바이러스는 담배 모자이크 바이러스 (TMV), 토마토 반점 위조 바이러스 (TSWV), 오이 모자이크 바이러스 (CMV), 감자 바이러스 Y (PVY), RT 바이러스 콜리플라워 모자이크 바이러스 (CaMV), 자두 곰보 바이러스 (PPV), 브롬 모자이크 바이러스 (BMV), 감자 바이러스 X (PVX), 감귤 트리스테자 바이러스 (CTV), 보리 황화 위축 바이러스 (BYDV), 감자 잎말림 바이러스 (PLRV), 토마토 덤불 위축 바이러스 (TBSV), 벼 퉁그로 구형 바이러스 (RTSV), 벼 누렁 얼룩 바이러스 (RYMV), 흰잎 벼 바이러스 (RHBV), 옥수수 라야도 피노 바이러스 (MRFV), 옥수수 난장이 모자이크 바이러스 (MDMV), 사탕수수 모자이크 바이러스 (SCMV), 고구마 모틀 바이러스 (SPFMV), 고구마 선켄 베인 클로스테로바이러스 (SPSVV), 포도 부채잎 바이러스 (GFLV), 포도 바이러스 A (GVA), 포도 바이러스 B (GVB), 포도 잎반점 바이러스 (GFkV), 포도 잎말림-연관 바이러스-1, 포도 잎말림-연관 바이러스-2, 및 포도 잎말림-연관 바이러스-3 (GLRaV-1, GLRaV-2, 및 GLRaV-3), 아라비스 모자이크 바이러스 (ArMV), 또는 루페스트리스 고접병-연관 바이러스 (RSPaV)를 포함하는 군으로부터 선택되는 식물 바이러스일 수 있다. 바람직한 실시형태에서, 표적 RNA 분자는 상기 병원체의 일부이거나 또는 상기 병원체의 DNA 분자로부터 전사된다. 예를 들어, 표적 서열은 RNA 바이러스의 게놈에 포함될 수 있다. CRISPR 이펙터 단백질은 상기 병원체가 상기 식물을 감염시키거나 또는 감염시켰다면 상기 식물 중 상기 병원체의 상기 표적 RNA 분자를 가수분해시키는 것이 더 바람직하다. 따라서 CRISPR 시스템 (또는 이의 완료에 필요한 부분)이 치료적으로, 즉 감염이 일어난 이후에, 또는 예방적으로, 즉 감염이 일어나기 전에 적용되는 경우 둘 모두에서 식물 병원체 유래 표적 RNA 분자를 절단할 수 있는 것이 바람직하다.
일정한 예의 실시형태에서, 바이러스는 레트로바이러스일 수 있다. 본 명세서에서 개시된 실시형태를 사용하여 검출할 수 있는 예시적인 레트로바이러스는 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 렌티바이러스, 스푸마바이러스의 바이러스 속, 또는 메타바이러스과, 슈도바이러스과, 및 레트로바이로스과 (HIV 포함), 헤파드나바이러스과 (B형 간염 바이러스 바이러스 포함), 및 콜리모바이러스과 (콜리플라워 모자이크 바이러스 포함)의 바이러스과 중 하나 이상 또는 이의 임의 조합을 포함한다.
일정한 예의 실시형태에서, 바이러스는 DNA 바이러스이다. 본 명세서에서 개시된 실시형태를 사용하여 검출할 수 있는 예시적인 DNA 바이러스는 특히 미오바이러스과, 포도바이러스과, 시포바이러스과, 알로헤르페스바이러스과, 헤르페스바이러스과 (인간 헤르페스 바이러스 및 바리셀라 조스터 바이러스 포함), 말로코헤르페스바이러스과, 리포트릭스바이러스과, 루디바이러스과, 아데노바이러스과, 암풀라바이러스과, 아스코바이러스과, 아스파르바이러스과 (아프리카 돼지 열병 바이러스 포함), 배큘로바이러스과, 시카우다바이러스과, 클라바바이러스과, 코르티코바이러스과, 푸셀로바이러스과, 글로불로바이러스과, 굿타바이러스과, 히트로사바이러스과, 이리도바이러스과, 마르세이유바이러스과, 미미바이러스과, 누디바이러스과, 니마바이러스과, 판도라바이러스과, 파필로마바이러스과, 피코드나바이러스과, 플라스마바이러스과, 폴리드나바이러스, 폴리오마바이러스과 (시미언 바이러스 40, JC 바이러스, BK 바이러스 포함), 폭스바이러스과 (우두 및 천연두 포함), 스파에롤리포바이러스과, 텍티바이러스과, 투리바이러스과, 디노드나바이러스, 살터프로바이러스, 리지도바이러스의 바이러스과 중 하나 이상 (또는 이의 임의 조합)을 포함한다. 일부 실시형태에서, 박테리아 감염을 갖는 것으로 의심되는 대상체에서 종-특이적 박테리아 감염을 진단하는 방법은 대상체로부터 박테리아 리보솜 리보핵산을 포함하는 샘플을 수득하는 단계; 샘플을 기술된 하나 이상의 프로브와 접촉시키는 단계, 및 샘플에 존재하는 박테리아 리보솜 리보핵산 서열과 프로브 간 하이브리드화를 검출하는 단계로서 설명되고, 여기서 하이브리드화의 검출은 대상체가 에스케리치아 콜라이 (Escherichia coli), 클렙시엘라 뉴모니아 (Klebsiella pneumoniae), 슈도모나스 애루지노사 (Pseudomonas aeruginosa), 스타필로코커스 아우레우스 (Staphylococcus aureus), 아시네토박터 바우만니 (Acinetobacter baumannii), 칸디다 알비칸스 (Candida albicans), 엔테로박터 클로아카에 (Enterobacter cloacae), 엔테로코커스 패칼리스 (Enterococcus faecalis), 엔테로코커스 패시움 (Enterococcus faecium), 프로테우스 미라빌리스 (Proteus mirabilis), 스타필로코커스 아갈락티아 (Staphylococcus agalactiae), 또는 스타필로코커스 말토필리아 (Staphylococcus maltophilia) 또는 이의 조합으로 감염된 것을 의미한다.
말라리아 검출 및 모니터링
말라리아는 플라스모듐 (Plasmodium) 기생충에 의해 야기되는 모기-매개 병상이다. 이 기생충은 감염된 암컷 아노펠레스 (Anopheles) 모기에게 물려서 사람에게 확산된다. 5종의 플라스모듐 종이 인간에서 말라리아를 야기시킨다: 플라스모듐 팔시파럼 (Plasmodium falciparum), 플라스모듐 비박스 (Plasmodium vivax), 플라스모듐 오발레 (Plasmodium ovale), 플라스모듐 말라리아에 (Plasmodium malariae), 및 플라스모듐 크노우레시 (Plasmodium knowlesi). 그들 중에서, 세계 보건 기구 (WHO)에 따라서, 플라스모듐 팔시파럼 및 플라스모듐 비박스가 가장 큰 위협의 원인이다. 플라스모듐 팔시파럼은 아프리카 대륙에서 가장 우세한 말라리아 기생충이고 전세계적으로 대부분의 말라리아-관련 사망의 원인이다. 플라스모듐 비박스는 사하라 사막 남부 아프리카 밖의 대부분의 국가에서 우세한 말라리아 기생충이다.
2015년에, 91개 국가 및 지역에서 말라리아 전파가 계속 진행되었었다. 최근 WHO가 추산한 바에 따르면, 2억 1,200만 건의 말라리아가 발생하였고, 429 000명이 사망하였다. 말라리아 전파가 높은 지역에서, 5세 이하의 어린이가 특히 감염, 질병 및 사망에 감수성이고, 전체 말라리아 사망 중 2/3 (70%) 이상이 이 연령군에서 발생한다. 2010년 내지 2015년 사이에, 5세 이하 말라리아 사망률은 전세계적으로 29%로 감소되었다. 그러나, 말라리아는 2분마다 어린이의 생명을 앗아가서, 여전히 5세 이하 어린이의 주요 사망인자로 남아있다.
WHO가 설명하는 바와 같이, 말라리아는 급성 열병이다. 비면역 개체에서, 증상은 감염성 모기 물림 이후 7일 또는 그 이후에 나타난다. 최초 증상 - 발열, 두통, 오한 및 구토 - 은 약할 수 있어서 말라리아로 인식하는 것이 어려울 수 있지만, 24시간 이내에 치료하지 않으면, 플라스모듐 팔시파럼 말라리아는 중증 질병으로 진행될 수 있고, 종종 사망을 초래할 수 있다.
중증 말라리아에 걸린 어린이는 빈번하게 하기 증상 중 하나 이상이 발생된다: 중증 빈혈증, 대사성 산증과 관련된 호흡 곤란, 또는 뇌 말라리아. 성인에서, 다기관 관여가 또한 빈번하다. 말라리아 풍토병 지역에서, 사람들은 부분 면역성이 생겨서, 무증상성 감염이 발생될 수 있다.
신속하고 효율적인 진단 검사의 개발은 공중 위생과 높은 관련성이 있다. 실제로, 말라리아의 조기 진단 및 치료는 질환을 감소시키고 사망을 방지할 뿐만 아니라 말라리아 전파를 감소시키는데 기여한다. WHO 권고에 따라서, 의심되는 말라리아의 모든 사례는 치료 투여 전에 기생충-기반 진단 검사 (특히 신속한 진단 검사 사용)를 사용해 확진해야만 한다 (["WHO Guidelines for the treatment of malaria", 3판, 2015년 5월 출간] 참고).
항말라리아 요법에 대한 내성은 치료 전략을 대폭적으로 감소시키는 중대한 건강 문제를 의미한다. 실제로, WHO 웹사이트에 보고된 바와 같이, 이전 세대 약물, 예컨대 클로로퀸 및 술파독신/피리메타민 (SP)에 대한 플라스모듐 팔시파럼의 내성은 1950년대 및 1960년대에 널리 퍼지게 되었고, 말라리아 방제 노력을 약화시키고 어린이 생존 획득을 후퇴시켰다. 따라서, WHO는 항말라리아 약제 내성의 일상적인 모니터링을 권고한다. 실제로, 정확한 진단은 부적절한 치료를 피할 수 있고 항말라리아 약제에 대한 내성 확대를 제한할 수 있다.
이러한 맥락에서, 2015년 5월에 세계 보건 총회가 채택한 - 말라리아 2016-2030에 대한 WHO 세계 기술 전략 (WHO Global Technical Strategy for Malaria 2016-2030)은 모든 말라리아-풍토병 국가에 기술적 체계를 제공한다. 이것은 그들이 말라리아 방제 및 박멸에 대한 작업을 하면서 지역 및 국가 프로그램을 안내 및 지원하고자 하는 것이다. 전략은 다음을 포함하여, 야심적이지만 달성가능한 세계적 목표를 설정한다:
. 2030년까지 적어도 90%까지 말라리아 사례 발병률 감소.
. 2030년까지 적어도 90%까지 말라리아 사망률 감소.
. 2030년까지 적어도 35개 국가에서 말라리아 박멸.
. 모든 말라리아 청정 국가에서 말라리아의 부활 방지.
이러한 전략은 2년에 걸친 광범위한 협의 과정의 결과였고 70개 회원국의 400명이 넘는 기술 전문가의 참여가 수반되었다. 이것은 3가지 핵심 축을 기반으로 한다:
. 말라리아, 예방, 진단 및 치료에 대한 보편적 접근 보장;
. 말라리아-청정 상태의 달성 및 박멸에 대한 노력 가속화; 및
. 말라리아 감시를 핵심 개입으로 전환.
플라스모듐에 대한 치료는 아릴-아미노 알콜 예컨대 퀴닌 또는 퀴닌 유도체 예컨대 클로로퀸, 아모디아퀸, 메플로퀸, 피페라퀸, 루메판트린, 프리마퀸; 친지성 히드록시나프토퀴논 유사체, 예컨대 아토바퀴온; 항엽산 약제, 예컨대 술파 약제 술파독신, 답손 및 피리메타민; 프로구아닐; 아토바퀴온/프로구아닐 병용; 아테미신 약제; 및 이의 조합을 포함한다.
모기-매개 병원체의 존재에 대해 진단하는 표적 서열은 그 게놈 유래 서열을 포함하여, 플라스모듐, 특히 인간에 영향을 미치는 플라스모디아 종 예컨대 플라스모듐 팔시파럼, 플라스모듐 비박스, 플라스모듐 오발레, 플라스모듐 말라리아에, 및 플라스모듐 크노우레시의 존재에 대해 진단하는 서열을 포함한다.
플라스모듐, 특히 인간에 영향을 미치는 플라스모디아 종, 예컨대 플라스모듐 팔시파럼, 플라스모듐 비박스, 플라스모듐 오발레, 플라스모듐 말라리아에, 및 플라스모듐 노우레시에 대한 치료에 대한 약제 내성을 모니터링하기 위한 진단하는 표적 서열.
추가 표적 서열은 플라스모듐 기생충에게 필수적인 생물학적 과정에 관여되는 단백질 및 특히 수송체 단백질, 예컨대 약제/대사산물 수송체 패밀리 유래 단백질, 기질 전좌에 관여되는 ATP-결합 카세트 (ABC) 단백질, 예컨대 ABC 수송체 C 서브패밀리 또는 Na+/H+ 교환체, 막 글루타티온 S-트랜스퍼라제; 폴레이트 경로에 관여되는 단백질, 예컨대 디히드롭테로에이트신타제, 디히드로폴레이트 리덕타제 활성 또는 디히드로폴레이트 리덕타제-티미딜레이트 신타제; 및 내부 미토콘트리아 막에 걸친 양자의 전좌에 관여되는 단백질 및 특히 시토크롬 b 복합체를 코딩하는 표적 분자/핵산 분자를 포함하는 서열을 포함한다. 추가의 표적은 또한 헴 중합효소를 코딩하는 유전자(들)를 포함할 수 있다.
추가 표적 서열은 플라스모듐 팔시파럼 클로로퀸 내성 수송체 유전자 (pfcrt), 플라스모듐 팔시파럼 다제 내성 수송체 1 (pfmdr1), 플라스모듐 팔시파럼 다제 내성-연관된 단백질 유전자 (Pfmrp), 플라스모듐 팔시파럼 Na+/H+ 교환체 유전자 (pfnhe), 플라스모듐 팔시파럼 이출 단백질 1을 코딩하는 유전자, 플라스모듐 팔시파럼 Ca2+ 수송 6 (pfatp6); 플라스모듐 팔시파럼 디히드롭테로에이트 신타제 (pfdhps), 디히드로폴레이트 리덕타제 활성 (pfdhpr) 및 디히드로폴레이트 리덕타제-티미딜레이트 신타제 (pfdhfr) 유전자, 시토크롬 b 유전자, gtp 시클로히드롤라제 및 Kelch13 (K13) 유전자를 비롯하여 다른 플라스모듐 종에서 그들의 기능적 이종성 유전자로부터 선택될 수 있는, 필수적인 생물학적 과정에 관여되는 단백질을 코딩하는 표적 분자/핵산 분자를 포함한다.
수많은 돌연변이, 특히 단일 점 돌연변이는 현행 치료의 표적이고 특별한 내성 표현형과 연관된 단백질에서 식별되었다. 따라서, 본 발명은 모기-매개 기생충, 예컨대 플라스모듐의 다양한 내성 표현형의 검출을 가능하게 한다.
본 발명은 표적 핵산/분자에서 하나 이상의 돌연변이(들) 및 특히 하나 이상의 단일 뉴클레오티드 다형성을 검출하는 것을 가능하게 한다. 따라서, 하기의 돌연변이 중 어느 하나 또는 그들의 조합은 약제 내성 마커로서 사용될 수 있고 본 발명에 따라서 검출될 수 있다.
플라스모듐 팔시파럼 K13의 단일 점 돌연변이는 위치 252, 441, 446, 449, 458, 493, 539, 543, 553, 561, 568, 574, 578, 580, 675, 476, 469, 481, 522, 537, 538, 579, 584 및 719에서 하기의 단일 점 돌연변이, 및 특히 돌연변이 E252Q, P441L, F446I, G449A, N458Y, Y493H, R539T, I543T, P553L, R561H, V568G, P574L, A578S, C580Y, A675V, M476I; C469Y; A481V; S522C; N537I; N537D; G538V; M579I; D584V; 및 H719N을 포함한다. 이들 돌연변이는 일반적으로 아르테미신 약제 내성 표현형과 연관된다 (Artemisinin and artemisinin-based combination therapy resistance April 2016 WHO/HTM/GMP/2016.5).
플라스모듐 팔시파럼 디히드로폴레이트 리덕타제 (DHFR) (PfDHFR-TS, PFD0830w)에서, 중요한 다형성은 위치 108, 51, 59 및 164에 돌연변이, 특히 피리메타민에 대한 내성을 조정하는 108D, 164L, 51I 및 59R을 포함한다. 다른 다형성은 또한 술파독신에 대한 내성과 연관된 437G, 581G, 540E, 436A 및 613S를 포함한다. 추가의 관찰된 돌연변이는 Ser108Asn, Asn51Ile, Cys59Arg, Ile164Leu, Cys50Arg, Ile164Leu, Asn188Lys, Ser189Arg 및 Val213Ala, Ser108Thr 및 Ala16Val을 포함한다. 돌연변이 Ser108Asn, Asn51Ile, Cys59Arg, Ile164Leu, Cys50Arg, Ile164Leu은 피리메타민 기반 요법 및/또는 클로로구아닌-답손 병용 요법 내성과 연관된다. 시클로구아닐 내성은 이중 돌연변이 Ser108Thr 및 Ala16Val과 연관되는 것으로 보인다. dhfr의 증폭은 또한 내성 특히 피리메타민 내성과 높은 관련성이 있을 수 있다.
플라스모듐 팔시파럼 디히드롭테로에이트 신타제 (DHPS) (PfDHPS, PF08_0095)에서, 중요한 다형성은 위치 436, 437, 581 및 613에서의 돌연변이 Ser436Ala/Phe, Ala437Gly, Lys540Glu, Ala581Gly 및 Ala613Thr/Ser을 포함한다. 위치 581 및/또는 613의 다형성은 또한 술파독신-피리메타민 기반 요법에 대한 내성과 연관되었다.
플라스모듐 팔시파럼 클로로퀸-내성 수송체 (PfCRT)에서, 위치 76의 다형성, 특히 돌연변이 Lys76Thr은 클로로퀸에 대한 내성과 연관된다. 추가 다형성은 클로로퀸 내성과 연관될 수 있는 Cys72Ser, Met74Ile, Asn75Glu, Ala220Ser, Gln271Glu, Asn326Ser, Ile356Thr 및 Arg371Ile를 포함한다. PfCRT는 또한 잔기 S33, S411 및 T416에서 인산화되고, 이것은 단백질의 특이성 또는 수송 활성을 조절할 수 있다.
플라스모듐 팔시파럼 다제-내성 수송체 1 (PfMDR1) (PFE1150w)에서, 위치 86, 184, 1034, 1042에서의 다형성, 특히 Asn86Tyr, Tyr184-Phe, Ser1034Cys, Asn1042Asp 및 Asp1246Tyr이 식별되었고 루메판트린, 아르테미시닌, 퀴닌, 메오퀸, 할로판트린 및 클로로퀸에 대한 감수성에 영향을 미친다고 보고되었다. 추가적으로, PfMDR1의 증폭은 루메판트린, 아르테미시닌, 퀴닌, 메오퀸 및 할로판트린에 대한 감소된 감수성과 연관되고, PfMDR1의 탈증폭은 클로로퀸 내성의 증가를 초래한다. pfmdr1의 증폭이 또한 검출될 수 있다. PfMDR1의 인산화 상태가 또한 높은 관련성이 있다.
플라스모듐 팔시파럼 다제-내성 연관 단백질 (PfMRP) (유전자 참조 PFA0590w)에서, 위치 191 및/또는 437에서의 다형성, 예컨대 Y191H 및 A437S가 식별되었고 클로로퀸 내성 표현형과 연관되었다.
플라스모듐 팔시파럼 NA+/H+ 교환체 (PfNHE) (ref PF13_0019)에서, 미세부수체 ms4670에서 DNNND의 증가된 반복성은 퀴닌 내성에 대한 마커일 수 있다.
시토크롬 be 유전자 (cytb, mal_mito_3)에 의해 코딩되는 시토크롬 b 단백질의 유비퀴놀 결합 부위를 변경시키는 돌연변이는 아토바퀴온 내성과 연관된다. 위치 26, 268, 276, 133 및 280의 돌연변이, 특히 Tyr26Asn, Tyr268Ser, M1331 및 G280D는 아토바퀴온 내성과 연관될 수 있다.
예를 들어 플라스모듐 비박스에서 Pf MDR1의 상동체인 PvMDR1의 돌연변이는 클로로퀸 내성와 연관되는데, 특히 위치 976의 다형성 예컨대 돌연변이 Y976F이다.
상기 돌연변이는 단백질 서열과 관련하여 정의된다. 그러나, 당업자는 또한 핵산 표적 서열로서 식별되는, SNPS를 포함하는, 상응하는 돌연변이를 결정할 수 있다.
다른 식별된 약제-내성 마커는 예를 들어 그 내용이 참조로 본 명세서에 편입되는, 문헌 ["Susceptibility of Plasmodium falciparum to antimalarial drugs (1996-2004)"; WHO; Artemisinin and artemisinin-based combination therapy resistance (April 2016 WHO/HTM/GMP/2016.5)]; ["Drug-resistant malaria: molecular mechanisms and implications for public health" FEBS Lett. 2011 Jun 6;585(11):1551-62. doi:10.1016/j.febslet.2011.04.042. Epub 2011 Apr 23. Review. PubMed PMID: 21530510]에 기술된 바와 같이 당분야에 공지되어 있다.
본 발명에 따라서 검출할 수 있는 폴리펩티드와 관련하여, 본 명세서에 언급된 모든 유전자의 유전자 생성물은 표적으로서 사용될 수 있다. 상응하게, 이러한 폴리펩티드는 종 식별, 유형분석 및/또는 약제 내성의 검출에 사용될 수 있다는 것을 고려한다.
일정한 예의 실시형태에서, 본 명세서에 개시된 시스템, 장치 및 방법은 샘플, 예컨대 대상체로부터 수득된 생물학적 샘플 중에 하나 이상의 모기-매개 기생충의 존재를 검출하는 것에 관한 것이다. 일정한 예의 실시형태에서, 기생충은 종 플라스모듐 팔시파럼, 플라스모듐 비박스, 플라스모듐 오발레, 플라스모듐 말라리아에 또는 플라스모듐 노우레시로부터 선택될 수 있다. 따라서, 본 명세서에 개시된 방법은 기생충 종의 신속 식별, 기생충의 존재 및 기생충 형태 (예를 들어 다양한 단계의 감염 및 기생충 생활-주기, 예컨대 적혈구-외부 주기, 적혈구내 주기, 포자생식 주기에 상응; 기생충 형태는 메로조이트, 스포로조이트, 스키존트, 가메토사이트를 포함)의 모니터링; 일정 표현형 (예를 들어, 병원체 약제 내성)의 검출, 질환 진행 및/또는 대발생의 모니터링, 및 치료 (약제) 스크리닝을 필요로 하는 다른 방법과 함께 다른 방법에서 (또는 조합으로) 사용을 위해 적합화될 수 있다. 또한, 말라리아의 경우에, 감염성 물림 이후에 장시간이 지나갈 수 있는데, 즉 환자가 증상을 보이지 않는 긴 인큐베이션 기간이 지날 수 있다. 유사하게, 예방적 처치는 증상의 출현을 지연시킬 수 있고, 장기간의 무증상 기간이 또한 재발 전에 관찰될 수 있다. 이러한 지연은 오진단 또는 지연 진단을 쉽게 초래할 수 있고, 따라서 치료의 유효성을 손상시킬 수 있다.
본 명세서에 개시된 실시형태의 신속하고 민감한 진단 능력, 단일 뉴클레오티드 편차에 이르는, 기생충 유형의 검출, 및 POC 장치로서 배치되는 능력 때문에, 본 명세서에 개시된 실시형태는 치료 계획, 예컨대 적절한 치료 과정의 선택을 가이드하는데 사용될 수 있다. 본 명세서에서 개시된 실시형태는 또한 기생충의 존재 및 유형분석을 위해 환경적 샘플 (모기 개체군 등)을 스크리닝하는데 사용될 수 있다. 실시형태는 또한 모기-매개 기생충 및 다른 모기-매개 병원체를 동시에 검출하도록 변형시킬 수 있다. 일부 예에서, 말라리아 및 다른 모기-매개 병원체는 초기에 유사한 증상으로 존재할 수 있다. 따라서, 신속하게 감염 유형을 구별하는 능력은 중요한 치료 결정을 가이드할 수 있다. 말라리아와 함께 검출될 수 있는 다른 모기-매개 병원체는 뎅기, 웨스트나일 바이러스, 치쿤구니아, 황열, 필라리아증, 일본 뇌염, 세인트 루이스 뇌염, 서부 말 뇌염, 동부 말 뇌염, 베네수엘라 말 뇌염, 라크로스 뇌염, 및 지카를 포함한다.
일정한 예의 실시형태에서, 본 명세서에 개시된 장치, 시스템 및 방법은 샘플 중에서 다수의 모기-매개 기생충 종을 구별하는데 사용될 수 있다. 일정한 예의 실시형태에서, 식별은 18S, 16S, 23S, 및 5S 서브유닛을 포함하는, 리보솜 RNA 서열을 기반으로 할 수 있다. 일정한 예의 실시형태에서, 식별은 게놈에 다수 카피로 존재하는 유전자, 예컨대 CYTB와 같은 미토콘트리아 유전자의 서열을 기반으로 할 수 있다. 일정한 예의 실시형태에서, 식별은 고도로 발현되고/되거나 고도로 보존된 유전자 예컨대 GAPDH, 히스톤 H2B, 에놀라제, 또는 LDH의 서열을 기반으로 할 수 있다. 관련 rRNA 서열을 식별하기 위한 방법은 미국 공개 특허 출원 번호 2017/0029872에 개시되어 있다. 일정한 예의 실시형태에서, 가이드 RNA의 세트는 각각의 종 또는 균주에 고유한 가변 영역에 의해 각각의 종을 구별하도록 디자인될 수 있다. 가이드 RNA는 또한 속, 과, 문, 강, 문계 수준, 또는 이의 조합으로 미생물을 구별하는 RNA 유전자를 표적화하도록 디자인될 수 있다. 증폭이 사용되는 일정한 예의 실시형태에서, 증폭 프라이머의 세트는 리보솜 RNA 서열의 측접하는 불변 영역에 대해 디자인될 수 있고 가이드 RNA는 가변 내부 영역에 의해 각각의 종을 구별하도록 디자인될 수 있다. 일정한 예의 실시형태에서, 프라이머 및 가이드 RNA는 개별적으로 16S 서브유닛 내의 보존 및 가변 영역에 대해 디자인될 수 있다. 종 또는 종의 서브유닛에 걸쳐서 고유하게 가변적인 다른 유전자 또는 게놈 영역 예컨대 RecA 유전자 패밀리, RNA 중합효소 β 서브유닛이 역시 사용될 수 있다. 다른 적합한 계통발생적 마커, 및 이를 식별하기 위한 방법은 예를 들어, [Wu et al. arXiv:1307.8690 [q-bio.GN]]에 기술되어 있다.
일정한 예의 실시형태에서, 종 식별은 게놈에 다수 카피로 존재하는 유전자, 예컨대 CYTB와 같은 미토콘드리아 유전자를 기반으로 수행될 수 있다. 일정한 예의 실시형태에서, 종 식별은 고도로 발현되고/되거나 고도로 보존된 유전자 예컨대 GAPDH, 히스톤 H2B, 에놀라제, 또는 LDH를 기반으로 수행될 수 있다.
일정한 예의 실시형태에서, 방법 또는 진단은 다수의 계통발생 및/또는 표현형 수준에 걸쳐서 동시에 모기-매개 기생충을 스크리닝하도록 디자인된다. 예를 들어, 방법 또는 진단은 상이한 가이드 RNA와 다수의 CRISPR 시스템의 사용을 포함할 수 있다. 가이드 RNA의 제1 세트는 예를 들어 플라스모듐 팔시파럼 또는 플라스모듐 비박스를 구별할 수 있다. 이들 일반 부류는 더욱 세분화될 수 있다. 예를 들어, 가이드 RNA는 일반적으로 또는 특별한 약제 또는 약제의 조합에 대해서, 약제-내성 균주를 구별하는 방법 또는 진단으로 디자인되어 사용될 수 있다. 가이드 RNA의 제2 세트는 종 수준에서 미생물을 구별하도록 디자인될 수 있다. 따라서, 매트릭스는 약제 내성에 따라서 더욱 분류되는, 모든 모기-매개 기생충 종 또는 하위종을 식별하도록 생성될 수 있다. 전술한 내용은 단지 예시의 목적이다. 모기-매개 기생충의 다른 유형을 분류하기 위한 다른 수단이 또한 고려되고 상기 기술된 일반 구조를 따를 수 있다.
일정한 예의 실시형태에서, 본 명세서에 개시된 장치, 시스템 및 방법은 관심 모기-매개 기생충 유전자, 예를 들어 약제 내성 유전자에 대해서 스크리닝하는데 사용될 수 있다. 가이드 RNA는 기지의 관심 유전자를 구별하도록 디자인될 수 있다. 임상 샘플을 포함하는, 샘플들은 이후에 하나 이상의 이러한 유전자의 검출을 위해 본 명세서에 개시된 실시형태를 사용하여 스크리닝될 수 있다. POC에서 약제 내성에 대해 스크리닝하는 능력은 적절한 치료 계획을 선택하는데 엄청난 이득을 가지게 된다. 일정한 예의 실시형태에서, 약제 내성 유전자는 단백질 예컨대 수송체 단백질, 예컨대 약제/대사산물 수송체 패밀리 유래 단백질, 기질 전좌에 관여하는 ATP-결합 카세트 (ABC) 단백질, 예컨대 ABC 수송체 C 서브패밀리 또는 Na+/H+ 교환체; 폴레이트 경로에 관여하는 단백질, 예컨대 디히드롭테로에이트 신타제, 디히드로폴레이트 리덕타제 활성 또는 디히드로폴레이트 리덕타제-티미딜레이트 신타제; 및 내부 미토콘트리아 막에 걸쳐 양자의 전좌에 관여하는 단백질, 특히 시토크롬 b 복합체를 코딩하는 유전자이다. 추가의 표적은 또한 헴 중합효소를 코딩하는 유전자(들)를 포함할 수 있다. 일정한 예의 실시형태에서, 약제 내성 유전자는 플라스모듐 팔시파럼 클로로퀸 내성 수송체 유전자 (pfcrt), 플라스모듐 팔시파럼 다제 내성 수송체 1 (pfmdr1), 플라스모듐 팔시파럼 다제 내성-연관된 단백질 유전자 (Pfmrp), 플라스모듐 팔시파럼 Na+/H+ 교환체 유전자 (pfnhe), 플라스모듐 팔시파럼 Ca2+ 수성 ATPase 6 (pfatp6), 플라스모듐 팔시파럼 디히드롭테로에이트 신타제 (pfdhps), 디히드로폴레이트 리덕타제 활성 (pfdhpr) 및 디히드로폴레이트 리덕타제-티미딜레이트 신타제 (pfdhfr) 유전자, 시토크롬 b 유전자, GTP 시클로히드롤라제 및 Kelch13 (K13) 유전자를 비롯하여 다른 플라스모듐 종의 그들의 기능적 이종성 유전자로부터 선택된다. 다른 식별된 약제-내성 마커는 예를 들어, 그 내용이 참조로 본 명세서에 편입되는, ["Susceptibility of Plasmodium falciparum to antimalarial drugs (1996-2004)"; WHO; Artemisinin and artemisinin-based combination therapy resistance (April 2016 WHO/HTM/GMP/2016.5)]; ["Drug-resistant malaria: molecular mechanisms and implications for public health" FEBS Lett. 2011 Jun 6;585(11):1551-62. doi:10.1016/j.febslet.2011.04.042. Epub 2011 Apr 23. Review. PubMed PMID: 21530510]에 기술된 바와 같이, 당분야에 공지되어 있다.
일부 실시형태에서, 본 명세서에 기술된 바와 같은 CRISPR 시스템, 검출 시스템 또는 이의 사용 방법은 모기-매개 기생충 대발생의 진화를 결정하기 위해 사용될 수 있다. 방법은 하나 이상의 대상체 유래의 다수개 샘플로부터 하나 이상의 표적 서열을 검출하는 단계로서, 표적 서열은 모기-매개 기생충 확산 또는 대발생을 야기하는 서열인 단계를 포함할 수 있다. 이러한 방법은 모기-매개 기생충 전파의 패턴, 또는 모기-매개 기생충에 의해 야기된 질환 대발생에 관여하는 기전을 결정하는 단계를 더 포함할 수 있다. 샘플은 하나 이상의 인간으로부터 유래될 수 있고/있거나, 하나 이상의 모기로부터 유래될 수 있다.
병원체 전파의 패턴은 모기-매개 기생충의 천연 병원소로부터 계속되는 신규 전파 또는 천연 병원소로부터 단일 전파 이후 다른 전파 (예를 들어, 모기에 교차로) 또는 이 둘의 혼합을 포함할 수 있다. 일 실시형태에서, 표적 서열은 바람직하게 모기-매개 기생충 게놈 내 서열 또는 이의 단편이다. 일 실시형태에서, 모기-매개 기생충 전파의 패턴은 모기-매개 기생충 전파의 초기 패턴, 즉 모기-매개 기생충 대발생의 시작시의 것이다. 대발생의 시작 시에 모기-매개 기생충 전파의 패턴 결정은 가능한 가장 빠른 시간에 대발생을 중단시킬 가능성을 증가시키고 그리하여 지역 및 국가간 전파 확률을 감소시킨다.
모기-매개 기생충 전파의 패턴 결정은 본 명세서에 기술된 방법에 따라서 모기-매개 기생충 서열을 결정하는 단계를 포함할 수 있다. 병원체 전파의 패턴을 결정하는 단계는 대상체 내에서 모기-매개 기생충 서열의 공유된 숙주내 변이를 검출하는 단계 및 공유된 숙주내 변이가 시간적 패턴을 보이는지 여부를 결정하는 단계를 더 포함할 수 있다. 관찰된 숙주내 및 숙주간 변이의 패턴은 전파 및 역학에 관한 중요한 통찰을 제공한다 (Gire, et al., 2014).
본 명세서에 개시된 다른 샘플 유형 이외에도, 샘플은 하나 이상의 모기로부터 유래될 수 있고, 예를 들어 샘플은 모기 타액을 포함할 수 있다.
바이오마커 검출
일정한 예의 실시형태에서, 본 명세서에 개시된 시스템, 장치 및 방법은 바이오마커 검출에 사용될 수 있다. 예를 들어, 본 명세서에 개시된 시스템, 장치 및 방법은 SNP 검출 및/또는 유전자형 분석에 사용될 수 있다. 본 명세서에 개시된 시스템, 장치 및 방법은 또한 이상 유전자 발현을 특징으로 하는 임의의 질환 상태 또는 장애의 검출에 사용될 수 있다. 이상 유전자 발현은 발현된 유전자, 발현의 위치 및 발현도에서의 이상성을 포함한다. 다른 질환 중에서도 심혈관, 면역 장애, 및 암과 관련된 다수의 전사물 또는 단백질 마커가 검출될 수 있다. 일정한 예의 실시형태에서, 본 명세서에서 개시된 실시형태는 용해를 포함하는 질환, 예컨대 간 섬유증 및 억제성/폐색성 폐 질환의 세포-무함유 DNA 검출에 사용될 수 있다. 일정한 예의 실시형태에서, 실시형태는 세포-무함유 DNA의 태아기 검사를 위한 보다 빠르고 보다 휴대가능한 검출에 이용될 수 있다. 본 명세서에서 개시된 실시형태는 특히 심혈관 건강, 지질/대사성 서명, 인종성 식별, 친자 일치, 인간 ID (예를 들어, SNP 서명의 범죄 데이타베이스에 용의자 대조)와 연관된 상이한 SNP의 패널을 스크리닝하기 위해 사용될 수 있다. 본 명세서에서 개시된 실시형태는 또한 암 종양과 관련되고 그로부터 방출되는 돌연변이의 세포-무함유 DNA 검출에 사용될 수 있다. 본 명세서에서 개시된 실시형태는 또한 예를 들어, 소정 육류 제품에서 상이한 동물원의 신속한 검출을 제공하여, 육류 품질의 검출에도 사용될 수 있다. 본 명세서에서 개시된 실시형태는 DNA와 관련된 유전자 편집 또는 GMO의 검출을 위해 사용될 수 있다. 본 명세서의 다른 곳에 기술된 바와 같이, 밀접하게 관련된 유전자형/대립유전자 또는 바이오마커 (예를 들어, 소정 표적 서열에 오직 단일 뉴클레오티드 편차를 가짐)는 gRNA에 합성 미스매치의 도입에 의해 구별될 수 있다.
일 양상에서, 본 발명은 샘플에서 표적 핵산을 검출하기 위한 방법에 관한 것으로서, 이 방법은
샘플 또는 샘플의 세트를 하나 이상의 개별 이산 부피에 분배하는 단계로서, 개별 이산 부피는 본 명세서에 기술된 바와 같이 본 발명에 따른 CRISPR 시스템을 포함하는 것인 단계;
샘플 또는 샘플의 세트를 하나 이상의 가이드 RNA와 하나 이상의 표적 분자의 결합을 허용하기 위해 충분한 조건 하에서 인큐베이션시키는 단계;
하나 이상의 가이드 RNA와 하나 이상의 표적 분자의 결합을 통해서 CRISPR 이펙터 단백질을 활성화시키는 단계로서, CRISPR 이펙터 단백질의 활성화는 그 결과로 RNA-기반 차폐성 구성체의 변형을 야기시켜 검출가능한 양성 신호가 발생되는 것인 단계; 및
검출가능한 양성 신호를 검출하는 단계로서, 검출가능한 양성 신호의 검출은 샘플 중 하나 이상의 표적 분자의 존재를 의미하는 것인 단계를 포함한다.
바이오마커 샘플 유형
본 명세서에 기술된 어세이의 감도는 표적 핵산이 희석되거나 샘플 재료가 제한적인 샘플을 포함하여, 광범위하게 다양한 생물학적 샘플 중 표적 핵산의 검출에 충분히 적합하다. 바이오마커 스크리닝은 제한없이, 타액, 소변, 혈액, 대변, 객담, 및 뇌척수 유체를 포함하는, 수많은 샘플 유형에 대해 수행될 수 있다. 본 명세서에서 개시된 실시형태는 또한 유전자의 상향조절 및/또는 하향조절을 검출하기 위해 사용될 수 있다. 예를 들어, 샘플은 오직 과발현된 유전자만 어세이의 검출 한계값 이상으로 남도록 연속 희석될 수 있다.
일정 실시형태에서, 본 발명은 생물학적 유체 (예를 들어, 소변, 혈액 혈청 또는 혈청, 객담, 뇌척수 유체)의 샘플을 수득하는 단계, 및 DNA를 추출하는 단계를 제공한다. 검출하려는 돌연변이체 뉴클레오티드 서열은 거대 분자의 분획일 수 있거나, 또는 초기에 별개 분자로서 존재할 수 있다.
일정 실시형태에서, DNA는 암 환자의 혈장/혈청으로부터 단리된다. 비교를 위해서, DNA 샘플은 신생물 조직으로부터 단리되고 제2 샘플은 동일 환자 유래 비신생물성 조직 (대조군), 예를 들어 림프구로부터 단리될 수 있다. 비신생물성 조직은 상이한 장기 출처로부터 유래될 수 있거나 또는 신생물성 조직과 동일한 유형일 수 있다. 일정 실시형태에서, 혈액 샘플을 채혈하고 혈장은 원심분리를 통해서 혈액 세포로부터 즉시 분리시킨다. 혈청은 여과될 수 있고 DNA 추출 전에 동결 저장될 수 있다.
일정한 예의 실시형태에서, 표적 핵산은 미가공 또는 미처리된 샘플, 예컨대 혈청, 혈청, 타액, 뇌척수액, 객담, 또는 소변으로부터 직접 검출된다. 일정한 예의 실시형태에서, 표적 핵산은 세포-무함유 DNA이다.
순환성 종양 세포
일 실시형태에서, 순환성 세포 (예를 들어, 순환성 종양 세포 (CTC))는 본 발명으로 어세이될 수 있다. 본 명세서에 기술된 임의 방법에서 사용을 위한 순환성 종양 세포 (CTC)의 단리가 수행될 수 있다. 본 발명에서 사용할 수 있는 순환성 세포의 특이적이고 민감한 검출 및 포획을 달성하는 예시적인 기술은 설명된 바 있다 ([Mostert B, et al., Circulating tumor cells (CTCs): detection methods and their clinical relevance in breast cancer. Cancer Treat Rev. 2009;35:463-474]; 및 [Talasaz AH, et al., Isolating highly enriched populations of circulating epithelial cells and other rare cells from blood using a magnetic sweeper device. Proc Natl Acad Sci U S A. 2009; 106:3970-3975]). 105-106 말초 혈액 단핵 세포의 배경에서 하나 정도로 적은 CTC가 존재할 수 있다 (Ross A A, et al., Detection and viability of tumor cells in peripheral blood stem cell collections from breast cancer patients using immunocytochemical and clonogenic assay techniques. Blood. 1993,82:2605-2610). CellSearch® 플랫폼은 EPCAM-발현 상피 세포를 농축하기 위해 상피 세포 부착 분자 (EpCAM)에 대한 항체로 코팅된 면역자성 비드를 사용하고, 그 이후에 면역 염색하여 사이토케라틴 염색의 존재 및 백혈구 마커 CD45의 부재를 확인하여 포획 세포가 상피 종양 세포인 것을 확인한다 ([Momburg F, et al., Immunohistochemical study of the expression of a Mr 34,000 human epithelium-specific surface glycoprotein in normal and malignant tissues. Cancer Res. 1987;47:2883-2891]; 및 [Allard WJ, et al., Tumor cells circulate in the peripheral blood of all major carcinomas but not in healthy subjects or patients with nonmalignant diseases. Clin Cancer Res. 2004; 10:6897-6904]). 포획된 세포의 수는 진행성 질환을 갖는 유방, 직결장 및 전립선 암 환자에 대한 예후 중요성을 갖는 것을 유망하게 입증하였다 ([Cohen SJ, et al., J Clin Oncol. 2008;26:3213-3221]; [Cristofanilli M, et al. N Engl J Med. 2004;351:781-791]; [Cristofanilli M, et al., J Clin Oncol. 2005;23: 1420-1430]; 및 [de Bono JS, et al. Clin Cancer Res. 2008; 14:6302-6309]).
본 발명은 또한 CTC-칩 기술로 CTC를 단리하기 위해 제공된다. CTC-칩은 CTC가 결합하는 항-EpCAM 항체가 코팅된 수천개의 마이크로포스트를 함유하는 챔버를 통해서 혈액이 흐르는 미세유체 기반 CTC 포획 장치이다 (Nagrath S, et al. Isolation of rare circulating tumor cells in Cancer patients by microchip technology. Nature. 2007;450: 1235-1239). CTC-칩은 CellSearch® 시스템과 비교하여 CTC 계측치 및 순도의 유의한 증가를 제공하고 (Maheswaran S, et al. Detection of mutations in EGFR in circulating lung-cancer cells, N Engl J Med. 2008;359:366-377), 양쪽 플랫폼은 후속 분자 분석에 사용될 수 있다.
세포-무함유 염색질
일정 실시형태에서, 세포-무함유 크로마틴 단편을 본 발명에 따라서 단리하고 분석한다. 뉴클레오솜은 건강한 개체를 비롯하여 질환 상태에 의해 영향받은 개체의 혈청에서 검출될 수 있다 (Stroun et al., Annals of the New York Academy of Sciences 906: 161-168 (2000)). 게다가, 뉴클레오솜의 혈청 농도는 양성 및 악성 질환, 예컨대 암 및 자가면역 질환을 앓는 환자에서 상당히 더 높다 (Holdenrieder et al (2001) Int J Cancer 95, 1 14-120, Trejo-Becerril et al (2003) Int J Cancer 104, 663-668; Kuroi et al 1999 Breast Cancer 6, 361-364; Kuroi et al (2001) Int j Oncology 19, 143-148; Amoura et al (1997) Arth Rheum 40, 2217-2225; Williams et al (2001) J Rheumatol 28, 81-94). 이론에 국한하려는 것은 아니나, 종양 보유 환자에서 뉴클레오솜의 고농도는 증식하는 종양에서 자발적으로 발생되는, 아폽토시스로부터 유래된다. 혈액에서 순환하는 뉴클레오솜은 고유하게 변형된 히스톤을 함유한다. 예를 들어, 미국 공개 특허 출원 번호 2005/0069931 (2005년 3월 31일)은 질환의 진단 지시자로서 특이적 히스톤 N-말단 변형에 대해 유도된 항체의 사용에 관한 것으로서, 진단/스크리닝 목적을 위해 수반된 DNA의 정제 및 분석을 촉진하기 위해 환자의 혈액 또는 혈청 샘플로부터 뉴클레오솜을 단리하기 위해 이러한 히스톤-특이적 항체를 적용한다. 따라서, 본 발명은 예를 들어, 종양 돌연변이를 검출하고 모니터링하기 위해서 염색질 결합된 DNA를 사용할 수 있다. 변형된 히스톤과 회합된 DNA의 식별은 질환 및 선천적 결함의 진단 마커로서 제공될 수 있다.
따라서, 다른 실시형태에서, 단리된 염색질 단편은 순환성 염색질, 바람직하게 순환성 모노 및 올리고뉴클레오솜으로부터 유래된다. 단리된 염색질 단편은 생물학적 샘플로부터 유래될 수 있다. 생물학적 샘플은 이를 필요로 하는 대상체 또는 환자로부터 유래될 수 있다. 생물학적 샘플은 혈청, 혈장, 림프, 혈액, 혈액 분획, 소변, 활액, 척추액, 타액, 순환성 종양 세포 또는 점액일 수 있다.
세포-무함유 DNA (cfDNA)
일정 실시형태에서, 본 발명은 세포 무함유 DNA (cfDNA)를 검출하는데 사용될 수 있다. 혈장 또는 혈청 중 세포 무함유 DNA는 비침습성 진단 도구로서 사용될 수 있다. 예를 들어, 세포 무함유 태아 DNA를 연구하였고 비호환성 RhD 인자의 검사, X-연결된 유전자 질병에 대한 성별 결정, 단일 유전자 질병에 대한 검사, 자간전증의 식별에 대해 최적화되었다. 예를 들어, 모계 혈장에서 cfDNA의 태아 세포 분획의 시퀀싱은 태아 염색체 이수성과 연관된 카피수 변화를 검출하기 위한 신뢰할만한 접근법이다. 다른 예의 경우, 암 환자로부터 단리된 cfDNA는 치료 결정과 관련된 핵심 유전자에서 돌연변이를 검출하는데 사용되었다.
일정한 예의 실시형태에서, 본 개시 내용은 환자 샘플로부터 직접적으로 cfDNA를 검출하는 것을 제공한다. 일정한 다른 예의 실시형태에서, 본 개시 내용은 표적 cfDNA를 검출하기 전에 상기 개시된 농축 실시형태를 사용하여 cfDNA를 농축시키는 것을 제공한다.
엑소솜
일 실시형태에서, 엑소솜은 본 발명에 의해 어세이될 수 있다. 엑소솜은 RNA를 함유하는 것으로 확인된 소형 세포외 소포체이다. 초원심분리, 여과, 화학적 침전, 크기 배제 크로마토그래피, 및 미세유체학에 의한 엑소솜의 단리는 당분야에 공지되어 있다. 일 실시형태에서 엑소솜은 엑소솜 바이오마커를 사용해 정제된다. 생물학적 샘플로부터 엑소솜의 단리 및 정제는 임의의 공지 방법으로 수행될 수 있다 (예를 들어, WO2016172598A1 참조).
SNP 검출 및 유전자형 분석
일정 실시형태에서, 본 발명은 생물학적 샘플 중에 단일 뉴클레오티드 다형성 (SNP)의 존재를 검출하는데 사용될 수 있다. SNP는 출산 검사 (예를 들어, 성별 결정, 태아 결함)에 관한 것일 수 있다. 그들은 범죄 수사에 관한 것일 수 있다. 일 실시형태에서, 범죄 수사의 용의자는 본 발명에 의해 식별될 수 있다. 이론에 국한하려는 것은 아니나, 핵산 기반 법의학 증거는 검사되는 샘플이 제한적일 수 있으므로 용의자 또는 피해자의 유전 물질을 검출하는데 이용할 수 있는 가장 민감한 어세이를 요구할 수 있다.
다른 실시형태에서, 질환과 연관된 SNP는 본 발명에 의해 포괄된다. 질환과 연관된 SNP는 당분야에서 충분히 공지되어 있고 당업자가 적합한 가이드 RNA를 디자인하기 위해 본 발명의 방법을 적용할 수 있다 (예를 들어, www.ncbi.nlm.nih.gov/clinvar?term=human%5Borgn%5D 참조).
일 양상에서, 본 발명은 유전자형 분석, 예컨대 SNP 유전자형 분석을 위한 방법에 관한 것으로서, 이 방법은
샘플 또는 샘플의 세트를 하나 이상의 개별 이산 부피에 분배시키는 단계로서, 개별 이산 부피는 본 명세서에 기술된 바와 같은 본 발명에 따른 CRISPR 시스템을 포함하는 것인 단계;
샘플 또는 샘플의 세트를 하나 이상의 가이드 RNA와 하나 이상의 표적 분자와 결합을 허용하기 위해 충분한 조건 하에서 인큐베이션시키는 단계;
하나 이상의 가이드 RNA와 하나 이상의 표적 분자의 결합을 통해서 CRISPR 이펙터 단백질을 활성화시키는 단계로서, CRISPR 이펙터 단백질의 활성화는 그 결과로 RNA-기반 차폐성 구성체의 변형을 야기시켜서 검출가능한 양성 신호가 발생되는 것인 단계; 및
검출가능한 양성 신호를 검출하는 단계로서, 검출가능한 양성 신호의 검출은 샘플 중에 특정한 유전자형을 특징으로 하는 하나 이상의 표적 분자의 존재를 의미하는 것인 단계를 포함한다.
일정 실시형태에서, 검출가능한 신호는 예컨대 예를 들면 도 60의 일례의 실시형태에 예시된 바와 같은, 하나 이상의 표준 신호, 바람직하게 합성 표준 신호와 (예를 들어, 신호 강도의 비교에 의해) 비교된다. 일정 실시형태에서, 표준물은 특정한 유전자형이거나 또는 그에 상응한다. 일정 실시형태에서, 표준물은 특정한 SNP 또는 다른 (단일) 뉴클레오티드 변이를 포함한다. 일정 실시형태에서, 표준물은 (PCR-증폭된) 유전자형 표준물이다. 일정 실시형태에서, 표준물은 DNA이거나 또는 그를 포함한다. 일정 실시형태에서, 표준물은 RNA이거나 또는 그를 포함한다. 일정 실시형태에서, 표준물은 DNA로부터 전사된 RNA이거나 또는 그를 포함한다. 일정 실시형태에서, 표준물은 RNA로부터 역전사된 DNA이거나 또는 그를 포함한다. 일정 실시형태에서, 검출가능한 신호는 하나 이상의 표준물과 비교되고, 그 각각은 기지의 유전자형, 예컨대 SNP 또는 다른 (단일) 뉴클레오티드 변이에 상응한다. 일정 실시형태에서, 검출가능한 신호는 하나 이상의 표준 신호와 비교되고 비교는 단측 또는 양측 ANOVA 등에 의한, 통계 분석, 예컨대 모수 또는 비모수 통계 분석을 포함한다. 일정 실시형태에서, 검출가능한 신호는 하나 이상의 표준 신호와 비교되고 검출가능한 신호가 표준으로부터 (통계적으로) 유의하게 벗어나지 않는 경우에, 그 표현형은 상기 표준에 상응하는 유전자형으로서 결정된다.
다른 실시형태에서, 본 발명은 응급 약물유전체학에 대한 신속한 유전자형 분석을 가능하게 한다. 일 실시형태에서, 단일 현장 어세이가 응급실로 옮겨온 환자를 유전자분석하는데 사용될 수 있다. 환자는 혈액 응고를 갖는 것으로 의심될 수 있고 응급의는 투여하기 위한 혈액 희석제의 용량을 결정하는 것이 필요하다. 예시적인 실시형태에서, 본 발명은 마커 예컨대 VKORC1, CYP2C9, 및 CYP2C19의 유전자분석을 기반으로 심근경색 또는 졸중 치료 동안 혈액 희석제의 투여를 위한 지침을 제공할 수 있다. 일 실시형태에서, 혈액 희석제는 항응고제 와파린이다 (Holford, NH (December 1986). "Clinical Pharmacokinetics and Pharmacodynamics of Warfarin Understanding the Dose-Effect Relationship". Clinical Pharmacokinetics. Springer International Publishing. 11 (6): 483-504). 혈액 응고와 연관된 유전자는 당분야에 공지되어 있다 (예를 들어, US20060166239A1; [Litin SC, Gastineau DA (1995) "Current concepts in anticoagulant therapy". Mayo Clin. Proc. 70 (3): 266-72]; 및 [Rusdiana et al., Responsiveness to low-dose warfarin associated with genetic variants of VKORC1, CYP2C9, CYP2C19, and CYP4F2 in an Indonesian population. Eur J Clin Pharmacol. 2013 Mar;69(3):395-405] 참조). 특히, VKORC1 1639 (또는 3673) 단일-뉴클레오티드 다형성에서, 공통 ("야생형") G 대립유전자는 A 대립유전자로 치환된다. A 대립유전자 (또는 "A 일배체형")를 갖는 사람은 G 대립유전자 (또는 "비-A 일배체형")를 갖는 사람보다 덜 VKORC1을 생성시킨다. 이들 변이체의 출현율은 또한 인종에 따라 다양하며, 백인 중 37% 및 아프리카인의 14%가 A 대립유전자를 보유한다. 최종 결과는 응고 인자의 감소된 수이고, 그에 따라 응고 능력의 감소이다.
일정한 예의 실시형태에서, 환자에서 SNP를 검출하기 위한 유전 물질의 이용가능성은 DNA 또는 RNA 샘플의 증폭없이 SNP를 검출하는 것을 가능하게 한다. 유전자형 분석의 경우에서, 시험되는 생물학적 샘플은 쉽게 수득된다. 일정한 예의 실시형태에서, 본 발명의 인큐베이션 시간은 단축될 수 있다. 어세이는 효소 반응이 발생되는데 필요한 시간 기간에 수행될 수 있다. 당업자는 5분 동안 생물학적 반응 (예를 들어, 5분 결찰)을 수행할 수 있다. 본 발명은 혈액으로부터 DNA를 수득하기 위해서 자동화 DNA 추출 장치를 사용할 수 있다. 다음으로 DNA는 이펙터 단백질에 대한 표적 분자를 생성시키는 반응에 첨가될 수 있다. 표적 분자가 생성되면 즉시, 차폐제가 절단되어 신호가 검출될 수 있다. 예시적인 실시형태에서, 본 발명은 약제 (예를 들어, 혈액 희석제)를 투여하기 전에 유전자형을 결정하기 위해 PCR 신속 진단을 가능하게 한다. 증폭 단계가 사용되는 경우에서, 모든 반응은 한 단계 과정으로 동일 반응에서 일어난다. 바람직한 실시형태에서, POC 어세이는 시간 미만, 바람직하게 10분, 20분, 30분, 40분, 또는 50분으로 수행될 수 있다.
일정 실시형태에서, 본 명세서에 개시된 시스템, 장치 및 방법은 장형 넌코딩 RNA (lncRNA)의 존재 또는 발현도를 검출하기 위해 사용될 수 있다. 일정한 lncRNA의 발현은 질환 상태 및/또는 약제 내성과 연관된다. 특히 일정한 lncRNA (예를 들어, TCONS_00011252, NR_034078, TCONS_00010506, TCONS_00026344, TCONS_00015940, TCONS_00028298, TCONS_00026380, TCONS_0009861, TCONS_00026521, TCONS_00016127, NR_125939, NR_033834, TCONS_00021026, TCONS_00006579, NR_109890, 및 NR_026873)는 암 치료에 대한 내성, 예컨대 흑색종 (예를 들어, 결절성 흑색종, 악성 흑색점, 악성 흑색점 흑색종, 말단 흑자 흑색종, 표재 확산 흑색종, 점막 흑색종, 용종양 흑색종, 섬유조직형성 흑색종, 무멜라닌성 흑색종, 및 연조직 흑색종)을 치료하기 위한 하나 이상의 BRAF 억제제 (예를 들어, 베무라페닙, 다브라페닙, 소라페닙, GDC-0879, PLX-4720, 및 LGX818)에 대한 내성과 연관된다. 본 명세서에 기술된 다양한 실시형태를 사용하는 lncRNA의 검출은 질환 진단 및/또는 치료 옵션의 선택을 용이하게 할 수 있다.
일 실시형태에서, 본 발명은 특히 요법의 신속한 투여가 치료 결과에 중요한 상황에서, 가이드 DNA- 또는 RNA-표적화 요법 (예를 들어, CRISPR, TALE, 징크 핑커 단백질, RNAi)을 가이드할 수 있다.
LOH 검출
암 세포는 정상 세포와 비교했을 때 유전 물질 (DNA)의 상실을 겪는다. 전부는 아니지만, 거의 전부의 암이 겪는 유전자 물질의 이러한 결실은 "이형접합성의 상실" (LOH)이라고 한다. 이형접합성의 상실 (LOH)은 전체 유전자 및 주변 염색체 영역의 상실을 일으키는 총 염색체 사건이다. 이형접합성의 상실은 암에서의 일반적인 발생이고, 이것은 상실된 영역의 기능적 종양 억제인자 유전자의 부재를 의미할 수 있다. 그러나, 상실은 여전히 염색체 쌍의 나머지 염색체 상에 남은 하나의 기능성 유전자가 존재하기 때문에 침묵될 수 있다. 종양 억제인자 유전자의 나머지 카피는 점 돌연변이에 의해 불활성화될 수 있어서, 종양 억제인자 유전자의 상실을 초래할 수 있다. 암 세포 유래 유전 물질의 상실은 그 결과로 염색체 상의 특정한 유전자좌에서 세포 생존능 또는 세포 성장에 필수적인 유전자의 둘 이상의 대립유전자 중 하나의 선택적 상실을 야기시킬 수 있다.
"LOH 마커"는 정상 세포와 비교했을 때, 암 또는 다른 질환과 연관된 결실, 변경, 또는 증폭의, 미세부수체 유전자좌로부터의 DNA이다. LOH 마커는 종종 종양 억제인자 유전자 또는 다른, 일반적으로 종양 관련 유전자의 상실과 연관된다.
용어 "미세부수체"은 인간 게놈에 광범위하게 분포된 DNA의 짧은 반복 서열을 의미한다. 미세부수체는 2 내지 5개 뉴클레오티드 길이의 범위인 직렬로 반복되는 (즉, 인접한) DNA 모티프의 부분이고, 전형적으로 5-50회 반복된다. 예를 들어, 서열 TATATATATA (SEQ ID NO: 135)은 디뉴클레오티드 미세부수체이고, GTCGTCGTCGTCGTC (SEQ ID NO: 136)는 트리뉴클레오티드 미세부수체이다 (A는 아데닌이고, G는 구아닌이고, C는 시토신이고, T는 티민임). 이러한 미세부수체의 반복 길이에서 체세포 변경은 종양의 특징적인 특성을 대표하는 것으로 확인되었다. 가이드 RNA는 이러한 미세부수체를 검출하도록 디자인될 수 있다. 뿐만 아니라, 본 발명은 검출가능한 신호의 정량을 기반으로 증폭 및 결실뿐만 아니라, 반복 길이에서의 변경을 검출하는데 사용될 수 있다. 일정한 미세부수체는 유전자의 조절 측접 또는 인트론 영역에, 또는 직접적으로 유전자의 코돈에 위치된다. 이러한 경우에서 미세부수체 돌연변이는 표현형 변화 및 질환, 특히 트리플렛 확장 질환, 예컨대 취약 X 증후군 및 헌팅톤 질환을 초래할 수 있다.
특별한 염색체 영역 상의 빈번한 이형접합성의 상실 (LOH)는 많은 종류의 악성종에서 보고되었다. 특별한 염색체 영역 상의 대립유전자 상실은 다양한 악성종에서 관찰되는 가장 일반적인 유전자 변형이며, 따라서 미세부수체 분석은 체액 유래 시료, 예컨대 폐암의 경우 객담 및 방광암의 경우 소변에서 암 세포의 DNA를 검출하기 위해 적용되었다 (Rouleau, et al. Nature 363, 515-521 (1993); and Latif, et al. Science 260, 1317-1320 (1993)). 더욱이, 가용성 DNA의 두드러지게 증가된 농도가 암 및 일부 다른 질환을 갖는 개체의 혈장에 존재하고, 이것은 세포 무함유 혈청 또는 혈장이 미세부수체 비정상성을 갖는 암 DNA를 검출하는데 사용될 수 있다는 것이 확고해졌다 ([Kamp, et al. Science 264, 436-440 (1994)]; 및 [Steck, et al. Nat Genet. 15(4), 356-362 (1997)]). 2개 그룹은 소세포 폐암 또는 두경부 암을 갖는 제한된 수의 환자의 혈장 또는 혈청에서 미세부수체 변경을 보고하였다 ([Hahn, et al. Science 271, 350-353 (1996)]; 및 [Miozzo, et al. Cancer Res. 56, 2285-2288 (1996)]). 흑색종 환자의 혈청 및 종양에서 이형접합성의 상실의 검출이 또한 이전에 확인되었다 (예를 들어, 미국 특허 번호 US6465177B1 참조).
따라서, 암을 앓고 있거나 또는 암의 위험성이 있는 대상체에서 LOH 마커를 검출하는 것이 유리하다. 본 발명은 종양 세포에서 LOH를 검출하는데 사용될 수 있다. 일 실시형태에서, 순환성 종양 세포는 생물학적 샘플로서 사용될 수 있다. 바람직한 실시형태에서, 혈청 또는 혈장으로부터 수득된 세포 무함유 DNA는 LOH를 비침습적으로 검출 및/또는 모니터링하는데 사용된다. 다른 실시형태에서, 생물학적 샘플은 본 명세서에 기술된 임의 샘플 (예를 들어, 방광암에 대한 소변 샘플)일 수 있다. 이론에 국한하려는 것은 아니나, 본 발명은 임의의 종래 방법과 비교하여 개선된 감도로 LOH 마커를 검출하는데 사용될 수 있고, 따라서, 돌연변이 사건의 조기 검출을 제공한다. 일 실시형태에서, LOH는 생물학적 유체에서 검출되는 반면, LOH의 존재는 암의 발생과 연관된다. 본 명세서에 기술된 방법 및 시스템은 암과 연관된 특별한 대립유전자의 LOH를 검출하기 위한 비침습성의 신속하고 정확한 방법을 제공함으로써, 종래 기술, 예컨대 PCR 또는 조직 생검에 비해 상당한 진보를 나타낸다. 따라서, 본 발명은 화학예방, 화학요법, 면역요법 또는 다른 치료를 겪은 고위험 환자를 모니터링하고 고위험 집단을 스크리닝하기 위해 사용할 수 있는 방법 및 시스템을 제공한다.
본 발명의 방법은 오직 체액 예컨대 혈액으로부터의 DNA 추출만을 필요로 하기 때문에, 임의 시점에 반복적으로 한 환자에 대해 수행될 수 있다. 혈액은 수술 이전 또는 이후; 치료, 예컨대 화학요법, 방사선 요법, 유전자 요법 또는 면역요법 이전, 그 동안, 및 이후; 또는 질환 진행, 안정, 또는 재발에 대한 치료 후 추적 조사 동안 채혈되어 LOH에 대해 모니터링된다. 이론에 국한하려는 것은 아니지만, 본 발명의 방법은 또한 LOH 마커가 개별 환자의 종양에 특이적이므로 그 환자에게 특이적인 LOH 마커에 의해 준임상 질환 존재 또는 재발을 검출하는데 사용될 수 있다. 본 발명은 또한 다수 전이가 존재한다면 종양 특이적 LOH 마커를 사용해 검출될 수 있다.
후성적 변형의 검출
암 또는 암 진행을 의미하는 히스톤 변이, DNA 변형, 및 히스톤 변형이 본 발명에서 사용될 수 있다. 예를 들어, 미국 공개 특허 출원 20140206014는 암 샘플이 건강한 대상체와 비교하여 상승된 뉴클레오솜 H2AZ, 마크로H2A1.1, 5-메틸시토신, P-H2AX(Ser139) 수준을 갖는다고 기술하고 있다. 개체에 암 세포의 존재는 암 세포의 증가된 아폽토시스의 결과로서 혈중 세포 무함유 뉴클레오솜의 더 높은 수준을 생성시킬 수 있다. 일 실시형태에서, 아폽토시스와 연관된 마커에 대해 유도된 항체, 예컨대 H2B Ser 14(P)가 아폽토시스된 신생물 세포로부터 방출된 단일 뉴클레오솜을 확인하는데 사용될 수 있다. 따라서, 종양 세포로부터 발생된 DNA는 높은 감도 및 정확도로 본 발명에 따라 유리하게 분석될 수 있다.
태아기 스크리닝
일정 실시형태에서, 본 발명의 방법 및 시스템은 태아기 스크리닝에서 사용될 수 있다. 일정 실시형태에서, 세포-무함유 DNA는 태아기 스크리닝의 방법에서 사용된다. 일정 실시형태에서, 단일 뉴클레오솜 또는 올리고뉴클레오솜과 연관된 DNA는 본 발명으로 검출될 수 있다. 바람직한 실시형태에서, 단일 뉴클레오솜 또는 올리고뉴클레오솜과 연관된 DNA의 검출은 태아기 스크리닝을 위해 사용된다. 일정 실시형태에서, 세포-무함유 염색질 단편은 태아기 스크리닝의 방법에서 사용된다.
태아기 진단 또는 태아기 스크리닝은 태어나기 전 태아 또는 배아에서 질환 또는 병태의 검사를 의미한다. 목적은 선천성 결손증 예컨대 신경관 결손, 다운 증후군, 염색체 이상, 유전적 장애 및 다른 병태, 예컨대 이분 척추, 구개열, 테이 삭스 병, 겸상 적혈구 빈혈증, 탈라세미아, 낭포성 섬유증, 근이영양증, 및 취약 X 증후군을 검출하는 것이다. 스크리닝은 또한 태아 성별 판별에 사용될 수도 있다. 공통 검사 절차는 양수천자, 목덜미 투명대 초음파를 포함한 초음파검사, 혈청 마커 검사, 또는 유전자 스크리닝을 포함한다. 일부 경우에서, 검사는 태아가 유산될 것인지 여부를 결정하도록 투여되지만, 의사 및 환자는 이것이 또한 고위험 임신을 조기에 진단하는데 유용하다는 것을 확인하여 신생아가 적절한 관리를 받을 수 있는 3차 요양 병원에서 출산 일정을 잡을 수 있다.
산모의 혈액에 존재하는 태아 세포가 있고, 이들 세포는 태아 DNA-기반 진단을 위한 태아 염색체의 잠재적인 공급원이 존재한다는 것은 알려져 있었다. 추가적으로, 태아 DNA는 산모 혈액 중 총 DNA의 약 2 내지 10% 범위이다. 현재 이용가능한 태아 유전자 검사는 일반적으로 침습성 시술이 관여된다. 예를 들어, 임신 대략 10 내지 12주인 임산부에게 수행된 융모막 채취법 (CVS) 및 대략 14-16주에 수행된 양수천자는 모두 태아에서 염색체 이상성을 검사하기 위한 샘플을 수득하기 위해 침습성 시술을 포함한다. 이들 채취 시술을 통해 수득된 태아 세포는 일반적으로 세포유전 또는 형광성 제자리 하이브리드화 (FISH) 분석을 사용해 염색체 이상성에 대해 검사된다. 세포-무함유 태아 DNA는 임신 6주정도로 조기에 임산부의 혈장 및 혈청에 존재하는 것으로 확인되었고, 농도는 임신 동안 상승하여 출산전에 최고이다. 이들 세포는 임신 초기에 나타나므로, 그들은 정확하고, 비침습적인, 제1 삼분기 검사의 기초를 형성할 수 있다. 이론에 국한하려는 것은 아니나, 본 발명은 소량의 태아 DNA를 검출하는데 전례없는 감도를 제공한다. 이록에 국한하려는 것은 아니나, 풍부한 양의 산모 DNA가 일반적으로 관심 태아 DNA와 함께 부수적으로 회수되므로, 태아 DNA 정량 및 돌연변이 검출에서 감도가 감소된다. 본 발명은 예상치않게 높은 감도의 어세이를 통해서 이러한 문제를 극복한다.
히스톤의 H3 부류는 4종의 상이한 단백질 유형으로 이루어진다: 주요 유형, H3.1 및 H3.2; 대체 유형, H3.3; 및 고환 특이적 변이, H3t. H3.1 및 H3.2은 밀접하게 관련되지만, 오직 Ser96에서만 상이하고, H3.1은 적어도 5개 아미노산 위치에서 H3.3과 상이하다. 또한, H3.1은 간, 신장 및 심장을 포함한 성인 조직에서 이의 존재와 비교하여, 태아 간에 고도로 농축되어 있다. 성인 인간 조직에서, H3.3 변이체는 H3.1 변이체보다 더 풍부한데 반해, 태아 간의 경우 그 반대가 사실이다. 본 발명은 태아 및 산모 세포 및/또는 태아 핵산을 모두 포함하는 산모의 생물학적 샘플에서 태아 뉴클레오솜 및 태아 핵산을 검출하기 위해 이들 차이를 이용할 수 있다.
일 실시형태에서, 태아 뉴클레오솜은 혈액으로부터 수득될 수 있다. 다른 실시형태에서, 태아 뉴클레오솜은 자궁경관 점액성 샘플로부터 수득된다. 일정 실시형태에서, 자궁경관 점액성 샘플은 임신의 제2 삼분기의 초기 또는 임신의 제1 삼분기의 후기에 임산부로부터의 세척액 또는 면봉으로 닦아서 수득된다. 샘플은 점액에 포획된 DNA를 방출시키기 위해 인큐베이터에 놓여질 수 있다. 인큐베이터는 37℃로 설정될 수 있다. 샘플은 대략 15분 내지 30분 동안 흔들어줄 수 있다. 점액은 DNA를 방출시키는 목적을 위해 뮤시나제로 더 용해될 수 있다. 샘플은 또한 태아뉴클레오솜을 방출시키도록 아폽토시스를 유도하기 위해서, 당분야에 충분히 공지된 바와 같이, 화학적 처리와 같은 조건이 가해질 수 있다. 따라서, 자궁경관 점액성 샘플은 아폽토시스를 유도하는 작용제로 처리될 수 있고, 그리하여 태아 뉴클레오솜이 방출된다. 순환성 태아 DNA의 농축과 관련하여, 미국 공개 특허 출원 번호 20070243549 및 20100240054를 참조한다. 본 발명은 오직 소량의 뉴클레오솜 또는 DNA가 태아로부터 기원할 수 있는 경우에 태아기 스크리닝에 방법 및 시스템을 적용할 때 특히 유리하다.
본 발명에 따른 태아기 스크리닝은 제한없이, 세염색체증 13, 세염색체증 16, 세염색체증 18, 클라인펠터 증후군 (47, XXY), (47, XYY) 및 (47, XXX), 터너 증후군, 다운 증후군 (세염색체증 21), 낭포성 섬유증, 헌팅톤 질환, 베타 탈라세미아, 근긴장성 이영양증, 겸상 적혈구 빈혈증, 포르피린증, 취약-X 염색체-증후군, 로버트슨 전좌증, 안젤만 증후군, 디조지 증후군 및 울프-허쉬호른 증후군을 포함하는 질환을 위한 것일 수 있다.
본 발명의 몇몇 추가 양상은 미국 국립 보건원의 웹사이트 상에 주제 세부 항목 유전적 장애 (health.nih.gov/topic/Genetic Disorders의 웹사이트)에 기술된 광범위한 유전 질환과 연관된 결손을 진단, 예후 및/또는 치료하는 것에 관한 것이다.
암 및 암 약제 내성 검출
일정 실시형태에서, 본 발명은 암과 연관된 유전자 및 돌연변이를 검출하는데 사용될 수 있다. 일정 실시형태에서, 내성과 연관된 돌연변이가 검출된다. 내성 종양 세포의 증폭 또는 종양 세포의 클론 개체군에서 내성 돌연변이의 출현이 치료 동안 발생될 수 있다 (예를 들어, [Burger JA, et al., Clonal evolution in patients with chronic lymphocytic leukaemia developing resistance to BTK inhibition. Nat Commun. 2016 May 20;7:11589]; [Landau DA, et al., mutations driving CLL and their evolution in progression and relapse. Nature. 2015 Oct 22;526(7574):525-30]; [Landau DA, et al., Clonal evolution in hematological malignancies and therapeutic implications. Leukemia. 2014 Jan;28(1):34-43]; 및 [Landau DA, et al., Evolution and impact of subclonal mutations in chronic lymphocytic leukemia. Cell. 2013 Feb 14;152(4):714-26] 참조). 따라서, 이러한 돌연변이의 검출은 고도로 민감한 어세이를 요구하고 모니터링은 반복적인 생검을 필요로한다. 반복적인 생검은 불편하고, 침습적이며 값비싸다. 내성 돌연변이는 당분야에 공지된 종래 방법을 사용하여 혈액 샘플 또는 다른 비침습적으로 채취된 생물학적 샘플 (예를 들어, 혈액, 타액, 소변)에서 검출하는 것이 어려울 수 있다. 내성 돌연변이는 화학요법, 표적화 요법, 또는 면역요법에 대한 내성과 연관된 돌연변이를 의미할 수 있다.
일정 실시형태에서, 돌연변이는 암 진행을 검출하는데 사용될 수 있는 개별 암에서 발생된다. 일 실시형태에서, 종양에 대항하는 T-세포 세포용해성 활성과 관련된 돌연변이가 특징규명되었고 본 발명에 의해 검출될 수 있다 (예를 들어, [Rooney et al., Molecular and genetic properties of tumors associated with local immune cytolytic activity, Cell. 2015 January 15; 160(1-2): 48-61] 참조). 개별 맞춤 요법이 이들 돌연변이의 검출을 기반으로 환자를 위해 개발될 수 있다 (예를 들어, WO2016100975A1 참조). 일정 실시형태에서, 세포용해성 활성과 연관된 암 특이적 돌연변이는 CASP8, B2M, PIK3CA, SMC1A, ARID5B, TET2, ALPK2, COL5A1, TP53, DNER, NCOR1, MORC4, CIC, IRF6, MYOCD, ANKLE1, CNKSR1, NF1, SOS1, ARID2, CUL4B, DDX3X, FUBP1, TCP11L2, HLA-A, B 또는 C, CSNK2A1, MET, ASXL1, PD-L1, PD-L2, IDO1, IDO2, ALOX12B 및 ALOX15B로 이루어진 군으로부터 선택된 유전자 내 돌연변이, 또는 카피수 획득일 수 있고, 임의의 하기 염색체 밴드에 영향을 미치는 전체-염색체 사건은 배제시킨다: 6q16.1q21, 6q22.31q24.1, 6q25.1q26, 7p11.2q11.1, 8p23.1, 8p11.23p11.21 (IDO1, IDO2 함유), 9p24.2p23 (PDL1, PDL2 함유), 10p15.3, 10p15.1p13, 11p14.1, 12p13.32p13.2, 17p13.1 (ALOX12B, ALOX15B 함유), 및 22q11.1q11.21.
일정 실시형태에서, 본 발명은 치료 과정 동안 및 치료가 완료된 후 암 돌연변이 (예를 들어, 내성 돌연변이)를 검출하기 위해 사용된다. 본 발명의 감도는 치료 동안 발생된 클론 돌연변이의 비침습성 검출을 가능하게 할 수 있고 질환의 재발을 검출하는데 사용될 수 있다.
일정한 예의 실시형태에서, 마이크로RNA (miRNA) 및/또는 차등적으로 발현된 miRNA의 miRNA 서명의 검출은 암의 진행을 검출하거나 또는 모니터링하고/하거나 암 요법에 대한 약제 내성을 검출하는데 사용될 수 있다. 예로서, Nadal 등 (Nature Scientific Reports, (2015) doi:10.1038/srep12464)은 미소세포 폐암 (NSCLC)을 검출하는데 사용할 수 있는 mRNA 서명을 기술하고 있다.
일정한 예의 실시형태에서, 세포의 클론 하위개체군 내 내성 돌연변이의 존재는 치료 계획을 결정하는데 사용될 수 있다. 다른 실시형태에서, 환자를 치료하기 위한 개별 맞춤 요법은 공통 종양 돌연변이를 기반으로 투여될 수 있다. 일정 실시형태에서, 공통 돌연변이는 치료에 대응하여 발생되고 약제 내성을 초래한다. 일정 실시형태에서, 본 발명은 돌연변이를 획득한 세포 또는 이러한 약제 내성 돌연변이를 보유하는 세포의 증폭에 대해 환자를 모니터링하는데 사용될 수 있다.
다양한 화학요법제, 특히 표적화 요법 예컨대 티로신 키나제 억제제에 의한 치료는 빈번하게 치료제의 활성에 저항하는 표적 분자 내 신규 돌연변이를 초래한다. 이러한 내성을 극복하기 위한 다중 전략은 이들 돌연변이에 의해 영향받지 않는 2세대 요법의 개발 및 내성 돌연변이의 하류에서 작용하는 것들을 포함하는 다중 작용제에 의한 치료를 포함하는 것들이 평가 중에 있다. 일례의 실시형태에서, 표적화 브루톤 티로신 키나제 (BTK)를 표적화하고 CLL 및 일정 림프종에 사용되는 분자인, 이브루티닙에 대한 공통 돌연변이는 위치 481 (BTK/C481S)에서 시스테인의 세린으로의 변화이다. 상피 성장 인자 수용체 (EGFR)의 티로신 키나제 도메인을 표적으로 하는 엘로티닙은 폐암의 치료에서 일반적으로 사용되며, 내성 종양이 요법 이후에 변함없이 발생된다. 내성 클론에서 발견되는 공통 돌연변이는 위치 790에서 트레오닌의 메티오닌으로의 돌연변이이다.
본 발명으로 검출될 수 있는 공통 내성 돌연변이 및 암 환자의 개체군 간에 공유되는 비침묵 돌연변이는 당분야에 공지되어 있다 (예를 들어, WO/2016/187508 참조). 일정 실시형태에서, 약제 내성 돌연변이는 이브루티닙, 엘로티닙, 이마티닙, 제피티닙, 크리조티닙, 트라스투주맙, 베무라페닙, RAF/MEK, 체크 포인트 차단 요법, 또는 항에스트로겐 요법을 사용한 치료에 의해 유도될 수 있다. 일정 실시형태에서, 암 특이적 돌연변이는 프로그램된 사멸-리간드 1 (PD-L1), 안드로겐 수용체 (AR), 브루톤 티로신 키나제 (BTK), 상피 성장 인자 수용체 (EGFR), BCR-Abl, c-kit, PIK3CA, HER2, EML4-ALK, KRAS, ALK, ROS1, AKT1, BRAF, MEK1, MEK2, NRAS, RAC1, 및 ESR1로 이루어진 군으로부터 선택되는 단백질을 코딩하는 하나 이상의 유전자에 존재한다.
면역 체크포인트는 면역 반응을 둔화시키거나 또는 중지시키고 면역 세포의 비제어 활성에 의한 과도한 조직 손상을 방지하는 억제성 경로이다. 일정 실시형태에서, 표적화된 면역 체크포인트는 프로그램된 사멸-1 (PD-1 또는 CD279) 유전자 (PDCD1)이다. 다른 실시형태에서, 표적화된 면역 체크포인트는 세포독성 T-림프구-연관 항원 (CTLA-4)이다. 추가의 실시형태에서, 표적화된 면역 체크포인트는 CD28 및 CTLA4 Ig 수퍼패밀리의 다른 구성원 예컨대 BTLA, LAG3, ICOS, PDL1 또는 KIR이다. 더욱 추가의 실시형태에서, 표적화된 면역 체크포인트는 TNFR 수퍼패밀리의 구성원 예컨대 CD40, OX40, CD137, GITR, CD27 또는 TIM-3이다.
최근에, 종양 및 그들 미세환경에서 유전자 발현은 단일 세포 수준에서 특징규명되었다 (예를 들어, [Tirosh, et al. Dissecting the multicellular ecosystem of metastatic melanoma by single cell RNA-seq. Science 352, 189-196, doi:10.1126/science.aad0501 (2016))]; [Tirosh et al., Single-cell RNA-seq supports a developmental hierarchy in human oligodendroglioma. Nature. 2016 Nov 10;539(7628):309-313. doi: 10.1038/nature20123. Epub 2016 Nov 2]; 및 국제 공개 특허 출원 번호 WO 2017004153 A1 참조). 일정 실시형태에서, 유전자 서명은 본 발명을 사용해 검출될 수 있다. 일 실시형태에서, 보체 유전자가 종양 미세환경에서 모니터링되거나 또는 검출된다. 일 실시형태에서 MITF 및 AXL 프로그램이 모니터링되거나 또는 검출된다. 일 실시형태에서, 종양 특이적 줄기 세포 또는 전구체 세포 서명이 검출된다. 이러한 서명은 면역 반응의 상태 및 종양의 상태를 의미한다. 일정 실시형태에서, 증식, 치료에 대한 내성 및 면역 세포의 존재비 관점에서 종양의 상태를 검출할 수 있다.
따라서, 일정 실시형태에서, 본 발명은 특히 질환 재발 또는 공통 내성 돌 연변이의 발생을 모니터링하기 위해, 순환성 DNA, 예컨대 종양 DNA에 대한 저비용의 신속한, 복합 암 검출 패널을 제공한다.
면역요법 적용분야
본 명세서에서 개시된 실시형태는 또한 추가 면역요법 상황에서 유용할 수 있다. 예를 들면, 일부 실시형태에서, 대상체에서 면역 반응을 진단, 예후화 및/또는 병기구분하는 방법은 하나 이상의 바이오마커의 발현, 활성 및/또는 기능의 제1 수준을 검출하는 단계 및 검출된 수준을 대조군 수준과 비교하는 단계를 포함하고 여기서 검출된 수준과 대조군 수준의 차이는 대상체에서 면역 반응의 존재를 의미한다.
일정 실시형태에서, 본 발명은 종양 침윤성 림프구 (TIL)의 기능이상 또는 활성화를 결정하는데 사용될 수 있다. TIL은 기지 방법을 사용하여 종양으로부터 단리될 수 있다. TIL은 양자 세포 전달 요법에서 그들을 사용할 수 있는지 여부를 결정하기 위해 분석될 수 있다. 추가적으로, 키메라 항원 수용체 T 세포 (CAR T 세포)는 그들을 대상체에게 투여하기 전에 기능이상 또는 활성화의 서명에 대해 분석될 수 있다. 기능이상 및 활성화된 T 세포에 대한 예시적인 서명은 기술되어 있다 (예를 들어, [Singer M, et al., A Distinct Gene Module for Dysfunction Uncoupled from Activation in Tumor-Infiltrating T Cells. Cell. 2016 Sep 8;166(6):1500-1511.e9. doi: 10.1016/j.cell.2016.08.052] 참조).
일부 실시형태에서, C2c2는 면역 세포, 예컨대 T 세포 (예를 들어, CD8+ 및/또는 CD4+ T 세포)의 상태를 평가하는데 사용된다. 특히, T 세포 활성화 및/또는 기능이상은 예를 들어 T 세포 상태 중 하나 이상과 연관된 유전자 또는 유전자 서명을 기반으로 결정될 수 있다. 이러한 방식으로, C2c2는 T 세포의 하나 이상의 하위개체군의 존재를 결정하는데 사용될 수 있다.
일부 실시형태에서, C2c2는 진단 어세이에서 사용될 수 있거나 또는 환자가 면역요법 또는 다른 유형의 요법을 투여하기에 적합한지 여부를 결정하는 방법으로서 사용될 수 있다. 예를 들어, 유전자 또는 바이오마커 서명의 검출은 환자가 소정 치료에 반응하는지 여부, 또는 환자가 반응하지 않으면, 이것이 T 세포 기능이상에 기인하는 것인지 여부를 결정하기 위해 C2c2를 통해서 수행할 수 있다. 이러한 검출은 환자가 수용하기에 최고로 적합한 유형의 요법에 관해 유용한 정보를 준다. 예를 들어, 환자가 면역요법을 수용하는지 여부.
일부 실시형태에서, 본 명세서에 개시된 시스템 및 어세이는 임상의가 요법 (예를 들어, 양자 세포 전달 (ACT) 요법)에 대한 환자의 반응이 세포 기능이상에 기인하는지 여부, 및 그렇다면 바이오마커 서명에 걸친 상향조절 및 하향조절의 수준이 문제를 해결할 수 있게 할 것인지 여부를 확인할 수 있게 한다. 예를 들어, ACT를 받은 환자가 비반응성이면, ACT의 일부로서 투여된 세포는 세포 활성화 및/또는 기능이상 상태와 연관된 것으로 알려진 바이오마커 서명의 상대적 발현도를 결정하기 위해 본 명세서에 개시된 어세이를 통해 어세이될 수 있다. 특정한 억제성 수용체 또는 분자가 ACT 세포에서 상향조절되면, 환자는 그 수용체 또는 분자의 억제제로 처치될 수 있다. 특정한 자극성 수용체 또는 분자가 ACT 세포에서 하향 조절되면, 환자는 그 수용체 또는 분자의 효현제로 처치될 수 있다.
일정한 예의 실시형태에서, 본 명세서에 기술된 시스템, 방법 및 장치는 특정한 세포 유형, 세포 표현형, 또는 세포 상태를 식별하는 유전자 서명을 스크리닝하는데 사용될 수 있다. 유사하게, 압축적 감지와 같은 방법의 사용을 통해서, 본 명세서에서 개시된 실시형태는 전사체를 검출하는데 사용될 수 있다. 유전자 발현 데이타는 고도로 구조화되어서, 일부 유전자의 발현도는 다른 것들의 발현도를 예측한다. 유전자 발현 데이타가 고도로 구조적이라는 지식은 시스템에서 자유도의 수가 적다는 가정을 가능하게 하고, 이것은 상대적 유전자 존재비의 계산을 위한 기초가 희박하다고 가정하는 것을 가능케 한다. 어떠한 유전자가 상호작용할 것인가에 대한 임의의 특별한 지식없이 출원인이 언더샘플링하면서 비선형 상호작용 조건을 회복할 수 있게 하는 몇몇 생물학적 동기 부여 가설을 만드는 것이 가능하다. 특히, 출원인이 유전자 상호작용을 저순위, 희박, 또는 이들의 조합이라고 가정한다면, 자유도의 진짜 수가 완전한 조합적 확장에 비해 작고, 이것은 출원인이 상대적으로 작은 수의 교란으로 지표를 추론할 수 있게 한다. 이들 가정으로 작업하여, 압축 감지 및 매트릭스 완성의 분석 이론을 사용하여 언더샘플링된 조합적 교란 실험을 디자인할 수 있다. 또한, 커넬-학습 프레임워크를 사용하여 임의의 개별 상호작용 계수를 직접적으로 학습하지 않고 조합적 교란의 예측 함수를 구축하여 언더샘플링을 적용할 수 있다. 압축 감지는 포괄적인 유전자-발현 프로파일을 수득하기 위해서 검출하려는 표적 전사물의 최소 수를 확인하기 위한 방식을 제공한다. 압축 감지를 위한 방법은 참조로 본 명세서에 편입시킨, 2016년 10월 27일 출원된 PCT/US2016/059230 "Systems and Methods for Determining Relative Abundances of Biomolecules"에 개시되어 있다. 최소 전사물 표적 세트를 식별하기 위해 압축 감지와 같은 방법을 사용하게 되는 경우라면, 상응하는 가이드 RNA의 세트는 상기 전사물을 검출하도록 디자인될 수 있다. 따라서, 일정한 예의 실시형태에서, 세포의 유전자-발현 프로파일을 수득하기 위한 방법은 본 명세서에 개시된 실시형태를 사용하여, 세포 또는 세포 개체군의 유전자-발현 프로파일을 제공하는 최소 전사물 세트를 검출하는 단계를 포함한다.
핵산 태그화된 항목 검출
대안적으로, 본 명세서에 기술된 실시형태는 핵산 식별자를 검출하는데 사용될 수 있다. 핵산 식별자는 특정한 물품을 식별하는데 사용될 수 있는 넌-코딩 핵산이다. 일례의 핵산 식별자, 예컨대 DNA 워터마크는 [Heider and Barnekow. "DNA watermarks: A proof of concept" BMC Molecular Biology 9:40 (2008)]에 기술되어 있다. 핵산 식별자는 또한 핵산 바코드일 수 있다. 핵산 기반 바코드는 회합된 분자, 예컨대 표적 분자 및/또는 표적 핵산에 대한 식별자로서 사용되는 짧은 뉴클레오티드 서열 (예를 들어, DNA, RNA, 또는 이의 조합)이다. 핵산 바코드는 적어도, 예를 들어, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 60, 70, 80, 90, 또는 100개 뉴클레오티드의 길이를 가질 수 있고, 단일-가닥 형태일 수 있거나 또는 이중-가닥 형태일 수 있다. 하나 이상의 핵산 바코드는 표적 분자 및/또는 표적 핵산에 부착, 또는 "태그화"될 수 있다. 이러한 부착은 직접적 (예를 들어, 표적 분자에 바코드의 공유 또는 비공유 결합)일 수 있거나 또는 간접적 (예를 들어, 추가 분자, 예를 들어, 특이적 결합제, 예컨대 항체 (또는 다른 단백질) 또는 바코드 수용 어댑터 (또는 다른 핵산 분자)를 통해서) 일 수 있다. 표적 분자 및/또는 표적 핵산은 조합적인 방식으로 다수 핵산 바코드, 예컨대 핵산 바코드 콘카테머로 표지될 수 있다. 전형적으로, 핵산 바코드는 특정한 구획 (예를 들어, 이산 부피)으로부터, 특정한 물리적 특성 (예를 들어, 친화성, 길이, 서열 등)을 갖는 것으로, 또는 일정한 치료 조건을 겪은 것으로, 표적 분자 및/또는 표적 핵산을 식별하는데 사용된다. 표적 분자 및/또는 표적 핵산은 모든 이들 특성 (및 그 이상)에 관한 정보를 제공하도록 다수의 핵산 바코드와 회합될 수 있다. 핵산-바코드를 생성시키는 방법은 예를 들어, 국제 공개 특허 출원 번호 WO/2014/047561에 개시되어 있다.
효소
본 출원은 RNA 절단 및 검출의 상이한 적용분야에 특히 적합하게 만드는 강건한 활성을 입증한 C2c2의 오솔로그를 더 제공한다. 이들 적용분아는 제한없이 본 명세서에 기술된 것들을 포함한다. 보다 특히, 시험된 다른 것들보다 강력한 활성을 갖는것으로 입증된 오솔로그는 렙토트리키아 와데이 (LwC2c2) 유기체로부터 식별된 C2c2 오솔로그이다. 따라서 본 출원은 관심 표적 유전자좌를 변형시키기 위한 방법을 제공하고, 이 방법은 C2c2 이펙터 단백질, 보다 특히 본 명세서에 기술된 바와 같이 증가된 활성을 갖는 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비천연 발생되거나 또는 조작된 조성물을 상기 유전자좌에 전달하는 단계를 포함하고, 여기서 적어도 하나 이상의 핵산 성분은 조작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 유도시키고 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하며 복합체는 관심 표적 유전자좌에 결합한다. 특정한 실시형태에서, 관심 표적 유전자좌는 RNA를 포함한다. 본 출원은 RNA 서열 특이적 간섭, RNA 서열 특이적 유전자 조절, RNA 또는 RNA 생성물 또는 lincRNA 또는 넌-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝, 돌연변이유발법, 형광 제자리 하이브리드화, 또는 브리딩에서 증가된 활성을 갖는 C2c2 이펙터 단백질의 용도를 더 제공한다.
실시예
실시예 1 - 추가의 CRISPR-연관 단백질에 따라 증가되는 CAS13 활성
CRISPR 이펙터는 종종 활성을 조절하기 위해 추가 성분과 상호작용하며, 출원인은 SHERLOCK의 감도 및 속도를 증가시키기 위해 이들 상호작용에 영향을 주고자 하였다. VI-B형 CRISPR 시스템은 종종 간섭-조절 단백질 Csx27 및 Csx28을 보유하고, Csx28 공발현은 생체내 Cas13b 단백질의 간섭 활성을 증가시키는 것으로 입증되어서, 그들이 시험관내에서 Cas13b의 엔도뉴클레아제 활성을 증가시킬 수 있다는 것을 암시한다. Csx28은 우리 손에서 불안정했으므로, 출원인은 3종의 VI-B형 시스템으로부터 Csx28-Sumo 융합 단백질을 정제하였고 (도 5A) Csx28 보충이 Cas13a 및 Cas13b 단백질의 활성을 증가시켰는지를 시험하였다. 출원인은 Csx28 단백질이 Cas13의 활성을 감소시켰거나 또는 표적-독립적 절단을 증가시켰다는 것을 확인하였다 (도 6A-F).
실시예 2 - CSM6 절단 활성의 특징규명
CRISPR III형 이펙터 뉴클레아제 Csm6의 핵산-기반 알로스테릭 활성을 입증한 최근 연구가 흥미로워서, 출원인은 2,3 사이클릭 포스페이트 말단을 갖는 선형 RNA 아데닐레이트로 구성된 강력한 Csm6 활성제를 생성시킬 수 있는지 여부가 궁금하였다 (도 7C, 7D). 그러므로 출원인은 A 또는 U 동종중합체-루프 함유 합성 ssRNA 2에 대해서 Cas13 시험관내 절단 어세이를 수행하여 Cas13 유래 절단 생성물의 RNA-말단 화학을 특징규명하고자 하였다 (도 7A). 시헌관내 절단 반응의 절단후 형광 표지화는 LwCas13a 및 PsmCas13b가 5'히드록실화 및 2'3' 사이클릭 포스페이트 RNA 말단을 갖는 절단 생성물을 생성시킨다는 것을 입증하였다 (도 7B). 이러한 결과는 우리로 하여금 양성-피드백 신호 증폭을 위해 Cas13과 함께 Csm6의 사용을 조사하기 위해서 기지 및 신규 Csm6 오솔로그 둘 모두를 발현시키고 정제하게 하였다 (도 7C 및 8). 상이한 길이 및 3' 말단 변형을 갖는 RNA 아데닐레이트를 시험함으로써, 출원인은 2'3' 사이클릭 포스페이트 말단을 함유하는 헥사아데닐레이트에 의해 효율적으로 활성화된다는 것을 확인하였다 (도 7D 및 10). 게다가, 출원인은 Csm6 오솔로그가 A 및 C 동종중합체 RNA 센서에 대해 강력한 절단 선호도를 갖는다는 것을 확인하였다 (도 7D). Csm6의 절단 특이도에 대해 보다 종합적인 통찰력을 얻기 위해서, 출원인은 Cas13에 대해 사용된 동일한 6-량체 축퇴성 RNA 리포터 라이브러리에 대해서 시험관내 절단 어세이 및 RNA 시퀀싱을 수행하였다. 놀랍게도, 감소된 서열 모티프 분석은 구아노신에 대한 강력한 선호도를 밝혀주었는데 (도 7F-7G 및 12-14), 이 결과는 동종중합체 G-RNA 센서의 비효율적인 절단으로 인해서 출원인이 예상하지 못하였다. 그러나, 동종중합체 A-RNA 센서에 대한 강력한 절단 활성을 고려하여, 출원인은 이러한 디자인을 향후 Csm6 실험에서 사용하였고 그들의 구별되는 절단 선호도에 기인하여 역시 독립적으로 LwCas13a 및 EiCsm6을 측정할 수 있었다.
실시예 3 - CRISPR-CSM6에 의한 양성 피드백 신호 증폭
Cas13의 활성을 Csm6 활성화와 커플링시키기 위해서, 출원인은 Cas13 절단 시 최적 Csm6 자극을 생성시키게 되는 RNA 활성제를 디자인하였다. 출원인은 PsmCas13b를 보다 긴 폴리-A 활성제와 인큐베이션시켜서 절단으로 길이를 감소시켜 짧은 사이클릭-포스페이트 종결된 활성제를 생성시켰다. 활성제의 PsmCas13b 분해는 아마도 절단으로 생성된 다양한 하위-활성제로 인해서, LsCsm6 활성에 완만한 증가가 야기되었다 (도 14A).
출원인은 2 염기 동일성을 함유한 RNA 활성제를 디자인하여 이러한 접근법을 개선시켰다: 최적 활성제 길이의 폴리-A 스트레치와 이후에, U-표적화 Cas13 효소에 의해 절단될 수 있는 폴리-U 스트레치. 출원인은 표적의 첨가시에, LwaCas13a가 이들 활성제를 분해시킬 수 있고 EiCsm6 및 LsCsm6에 대해 최적 활성제를 생성시킬 수 있으며, 이러한 활성화는 올바른 길이의 폴리-A를 요구한다는 것을 확인하였다 (도 7H). 질량 분광법을 사용하여, 출원인은 LwaCas13a가 Csm6 활성화에 대해 예상되는 시클릭-포스페이트 종결된 생성물을 생성하였다는 것을 검증하였다 (도 7I 및 16A, B). 활성화는 폴리-U로 5' 보호 및 내부 폴리-U 트랙을 포함하는 다른 활성화 디자인이 표적 RNA의 존재 하에서만 Csm6의 활성화에 덜 효과적이었으므로, 폴리U로 3' 보호된 디자인의 경우에 가장 효과적이었다 (도 17A, B). 동일 반응에서 Csm6 및 Cas13 둘 모두에 대한 리포터를 조합함으로써, 출원인은 2종 효소의 조합된 절단 활성을 어세이할 수 있었다. 출원인은 활성제 농도가 Cas13에 의해 활성화된 Csm6의 상승적 이득을 증가시켰고 (도 7J), Csm6-특이적 폴리A 리포터의 증가 역시 Csm6 신호를 증가시켜서, 활성제 첨가 시 더 큰 증가를 야기시킨다는 것을 확인하였다 (도 18A, B). Csm6-증강된 LwaCas13a는 합성 아세틸트랜스퍼라제 유전자를 비롯하여 대두 게놈 DNA 유래의 제초제 내성의 전반적인 신호 및 동역학을 증가시켰다 (도 7K, L 및 19A, B). Csm6은 또한 U-절단성 CcaCas13b 효소로부터의 신호를 증강시킬 수 있었다 (도 20A-D).
Csm6-증강과 RPA 사전-증폭의 조합이 신호를 증가시키므로, 출원인은 RPA와 조합에 필요한 시험관내 전사 성분의 존재 하에서 활성에 대해 Csm6을 시험하였다. 출원인은 마그네슘 및 유리 rNTP가 사이클릭 포스페이트 활성제의 존재 하에서 Csm6의 뉴클레아제 활성을 감소시켰다는 것을 확인하였다 (도 21A). 용액 중 rNTP의 양 감소는 전사되는 RNA의 양을 감소시켰고, 그러므로 증가된 리포터 또는 활성제의 존재 하에서 조차도, Cas13으로부터 Csm6 활성에 대해 음성적인 효과를 가졌다 (도 21B-E). 이들 2가지 경쟁 인자에 해당하는, 사이클릭 포스페이트 활성제 조건, 감소된 rNTP는 Csm6-특이적 신호를 복원시켰다 (도 21F). 시험된 모든 rNTP 종은 Csm6 억제를 야기시켜서, Csm6 및 rNTP 용액이 상이한 반응으로 수행될 필요가 있다는 것을 의미한다 (도 22). 그러므로 출원인은 전사 단계를 개별 반응으로 분리하였고,Csm6 반응에서 최종 rNTP를 희석하는 한편 충분한 증폭을 허용하여서, 이러한 개별 반응은 제초제 내성 유전자를 강건하게 검출할 수 있었다 (도 23).
출원인은 측류 상에서 Csm6과 Cas13 검출의 조합은, 리포터의 조합을 적용하여, 단일 리포터 서열의 절단과 거짓 양성 판독을 방지함으로써, 가시적 판독의 배경치를 감소시킬 수 있다고 가정하였다. 출원인은 Csm6 및 활성제의 존재 하에서 다양한 서열 및 길이의 측류 리포터를 시험하였고, 장형 A/C 리포터가 LwaCas13으로부터의 직교성 (orthogonality)은 유지하지만 신호를 가질 수 있다는 것을 확인하였다 (도 24A, B). 출원인은 이 리포터를 RNaseAlert 리포터와 조합하여 사용하여서 RPA 증폭 부재 하, 및 오직 Csm6의 존재 하에서 뎅기 샘플을 검출하였다 (도 7M). 출원인은 이후에 RPA, Csm6, 및 측류를 조합하여 아실트랜스퍼라제 표적을 검출하였고, Csm6은 혼합 프로브를 사용하였을 때 검출에 필요하고, 배경치가 감소되었다는 것을 확인하였다 (도 7N). 전반적으로, 기술의 조합은 빠르고 강력한 시각적 검출에 이르게 한다.
실시예 4 - 합성 아실트랜스퍼라제 유전자 검출 신호를 증가시키기 위한 Csm6-증강된 LwaCas13a
검출 신호를 증폭시키기 위해서, 출원인은 CRISPR III-형 이펙터 뉴클레아제 Csm6을 보강시켰고, 이것은 사이클릭 아데닐레이트 분자 또는 2',3'-사이클릭 포스페이트로 종결된 선형 아데닌 동종중합체에 의해 활성화된다. LwaCas13a PsmCas13b 부차적 활성은 5' 말단 및 2',3'-사이클릭 포스페이트를 갖는 절단 생성물을 생성시켜서 (도 28), Cas13 부차적 활성이 Csm6 활성종을 생성시킬 수 있고, SHERLOCK 어세이에서 증폭된 신호 검출을 허용하게 된다는 것을 시사한다. 상이한 길이 및 3' 말단 변형의 RNA 아데닐레이트 분자를 시험하여서 (도 29 및 도 30A; 도 38), 출원인은 엔테로코커스 이탈리커스 유래 Csm6 (EiCsm6) 및 락토바실러스 살리바리우스 유래 Csm6 (LsCsm6)이 2',3'-사이클릭 포스페이트를 함유하는 헥사아데닐레이트에 의해 효율적으로 활성화된다는 것을 확인하였다 (도 30B-C). 게다가, EiCsm6, LsCsm6, 및 써머스 써모필러스 (Thermus thermophilus) 유래 Csm6 (TtCsm6)이 센서 스크리닝을 기반으로 A-풍부 및 C-풍부 센서에 대한 강력한 절단 선호도를 입증하여, 개별 채널에서 LwaCas13a 및 Csm6 절단 활성의 독립적인 측정을 가능하게 한다 (도 25D 및 도 30B-D, 도 3, 도 32A-E).
Cas13의 활성과 Csm6 활성화를 커플링시키기 위해서, 출원인은 LwaCas13a가 UU 및 AU 2-염기 모티프에 대해 강건한 활성을 가지므로 모든 우리딘을 동종중합체 A 스트레치로 분해시킬 수 있다는 이론적 근거에서, 우라실 선호 Cas13 효소에 의해 절단될 수 있는 보호성 폴리-U 스트레치가 후속되는, 폴리-A 스트레치를 함유하는 보호성 RNA 활성제를 디자인하였다 (도 27). 출원인은 A6 활성제가 Csm6 활성화에 최적이라는 발견과 일관되게, 표적 및 LwaCas13a-crRNA 복합체의 첨가시에, EiCsm6 및 LsCsm6이 (A)6-(U)5 활성제에 의해 활성화되었다는 것을 확인하였고 질량 분광법으로 확증하였다 (도 25E 및 도 32F, 도 33 및 도 34). 출원인은 동일한 형광 채널 내에 동일 반응에서 Csm6 및 Cas13 둘 모두에 대한 리포터를 조합하였고, 활성제 농도의 증가가 DENV ssRNA 검출에 대해 Cas13에 의한 Csm6의 상승적 활성화를 증가시켰고 (도 25F), Csm6-특이적 폴리A 리포터의 증가도 역시 Csm6 신호를 증가시켜서, 활성제 첨가시 신호의 더 큰 증가를 야기시켰다는 것을 확인하였다 (도 35A-B). 최적화 이후 (도 36), 출원인은 Csm6-증강된 LwaCas13a가 SHERLOCK에 의한 합성 아실트랜스퍼라제 유전자 검출의 전반적인 신호 및 동역학을 증가시켰다는 것을 확인하였다 (도 25G).
검출의 강건성을 개선시키고 거짓 양성 판독 가능성을 감소시키기 위해서, 출원인은 측류 상에서 Cas13 검출과 Csm6을 조합하였다 (도 26K). 출원인은 Csm6 및 활성제 존재 하에서 다양한 서열 및 길이의 측류 리포터를 시험하였고, 장형 A-C 리포터가 강력한 절단 신호를 입증하였음을 확인하였다 (도 37A-B). 출원인은 증폭을 위해서 오로지 Csm6에 의존하는 (즉, RPA 부재 하에서) DENV ssRNA의 신속한 검출을 위해 Cas13 측류 리포터와 조합하여 이 리포터를 사용하였다 (도 26L). 출원인은 이후에 RPA, Cas13/Csm6, 및 측류 판독을 조합하여 아실트랜스퍼라제 표적을 검출하였고, Csm6에 의해 부여된 신호의 증가가 배경치를 감소시키면서 측류에 의한 보다 신속한 검출을 가능하게 하였다는 것을 확인하였다 (도 37C-D).
재료 및 방법
Cas13 및 Csm6 오솔로그의 단백질 발현 및 정제
LwaCas13a 발현 및 정제는 약간 변형하여 이전에 기술된 대로 수행하였고 하기에 상술한다. LbuCas13a, LbaCas13a, Cas13b 및 Csm6 오솔로그는 변형 프로토콜에 따라 발현시켰고 정제하였다. 간략하게, 박테리아 발현 벡터로 RosettaTM 2(DE3)pLysS Singles 컴피턴트 세포 (Millipore)을 형질전환시켰다. 12.5 mL의 출발 배양물은 Terrific Broth 4 성장 배지 (Sigma) (TB)에서 밤새 성장시켰고, 이것을 사용하여 0.5의 OD600까지 37℃ 및 300 RPM에서 성장을 위해 4 L의 TB에 접종하였다. 이 시점에, 단백질 발현은 500 μM의 최종 농도로 IPTG (Sigma)를 보충하여 유도시켰고, 세포를 단백질 발현을 위해서 16시간 동안 18℃로 냉각시켰다. 그 다음으로 세포를 5000 g로 15분 동안 4℃에서 원심분리시켰다. 세포 펠렛을 회수하였고 후속 정제를 위해 -80℃에 저장하였다.
단백질 정제의 모든 후속 단계는 4℃에서 수행하였다. 세포 펠렛을 분쇄하였고 프로테아제 억제제 (Complete Ultra EDTA-free tablets), 리소자임 (500 ㎍/1 mL), 및 벤조나제가 보충된 용해 완충액 (20 mM Tris-HCl, 500 mM NaCl, 1 mM DTT, pH 8.0)에 재현탁시킨 후에 LM20 미세유동화기 시스템을 사용하여 27,000 PSI에서 고압 세포 파괴를 후속하였다. 용해물은 1시간 동안 4℃에서 10,000 g로 원심분리하여 맑게 만들었다. 상청액을 5 mL의 StrepTactin 세파로스 (GE)에 도포하였고 1시간 동안 회전하면서 인큐베이션시킨 후에 용해 완충액으로 3회 단백질-결합된 StrepTactin 수지를 세척하였다. 수지는 250 유닛의 SUMO 프로테아제 (250 mg/mL)와 함께 SUMO 분해 완충액 (30 mM Tris- HCl, 500 mM NaCl 1 mM DTT, 0.15% Igepal (NP-40), pH 8.0)에 재현탁시켰고 밤새 4℃에서 회전시키면서 인큐베이션하였다. 현탁액을 용리 용 컬럼에 도포하였고 중력류를 통해 수지로부터 분리하였다. 단백질 용리를 최대화시키기 위해서 1 컬럼 부피의 용리 용액으로 2회 수지를 세척하였다. 용리액은 양이온 교환 완충액 (20 mM HEPES, 1 mM DTT, 5% 글리세롤, pH 7.0; LbuCas13a, LbaCas13a, EiCsm6, LsCsm6, TtCsm6의 경우 pH 7.5)으로 희석하여 250 mM 까지 양이온 교환 크로마토그래피 용 조제물 중 염 농도를 낮춰주었다.
양이온 교환 및 겔 여과 정제를 위해서, 단백질은 5 mL의 HiTrap SP HP 양이온 교환 컬럼 (GE Healthcare Life Sciences) 상에 FPLC (AKTA PURE, GE Healthcare Life Sciences)를 통해서 로딩하였고 250 mM 내지 2M NaCl의 염 농도구배로 용리 완충액 (20 mM HEPES, 1 mM DTT, 5% 글리세롤, pH 7.0; LbuCas13a, LbaCas13a의 경우 pH 7.5)으로 용리하였다. 최종 분획은 SDS-PAGE를 통해서 재조합 단백질의 존재에 대해 시험되었고, 단백질을 함유하는 분획을 풀링하여 원심분리용 필터 유닛 (Millipore 50MWCO)을 통해 1 mL 까지 S200 완충액 (10 mM HEPES, 1 M NaCl, 5 mM MgCl2, 2 mM DTT, pH 7.0) 중에서 농축시켰다. 농축된 단백질은 겔 여과 컬럼 (Superdex® 200 Increase 10/300 GL, GE Healthcare Life Sciences) 상에 FPLC를 통해 로딩하였다. 겔 여과로부터의 최종 분획을 SDS-PAGE를 통해 분석하였고 단백질을 함유하는 분획을 풀링하고 저장 완충액 (600 mM NaCl, 50 mM Tris-HCl pH 7.5, 5% 글리세롤, 2 mM DTT)으로 완충액 교환시켜서 저장을 위해 -80℃에 냉동시켰다.
이 연구에서 정제된 모든 단백질에 대한 수탁 번호 및 플라스미드 맵은 도 39에서 입수가능하다.
핵산 표적 및 crRNA 제조
Cas12a 및 게놈 DNA 검출에 대한 핵산 표적은 NEBNext PCR 마스터 믹스를 사용해 PCR 증폭시켰고, 겔 추출하였으며, MinElute 겔 추출 키트 (Qiagen)로 정제하였다. RNA 기반 검출의 경우, 정제된 dsDNA는 T7 중합효소와 밤새 30℃에서 HiScribe T7 Quick High Yield RNA 합성 키트 (New England Biolabs)를 사용해 인큐베이션시켰고 RNA는 MEGAclear 전사 클린-업 키트 (Thermo Fisher)를 사용해 정제하였다.
crRNA 제조는 약간 변형하여 이전에 기술된 대로 수행하였고 하기에 상술된다. crRNA의 제조를 위해서, 구성체는 T7 프로모터 서열이 부가된 울트라머 DNA (Integrated DNA Technologies)로서 주문하였다. crRNA DNA는 짧은 T7 프라이머 (최종 농도 10 μM)와 어닐링시켰고 T7 중합효소와 밤새 37℃에서 HiScribe T7 Quick High Yield RNA 합성 키트 (New England Biolabs)를 사용하여 인큐베이션시켰다. crRNA는 추가로 이소프로판올 (Sigma)을 1.8x 보충하고, 2x 비율의 비드 대 반응 부피로 RNAXP 클린 비드 (Beckman Coulter)를 사용하여 정제하였다.
이 연구에서 사용된 모든 crRNA 서열은 도 40에서 입수가능하다. 이 연구에서 사용된 모든 DNA 및 RNA 표적 서열은 도 41에서 입수가능하다.
RPA 용 프라이머는 앰플리콘 크기 (100 내지 140 nt), 프라이머 용융 온도 (54℃ 내지 67℃), 및 프라이머 크기 (30 내지 35 nt)를 제외하고, 디폴트 매개변수를 사용하여 NCBI 프라이머-BLAST를 사용해 디자인하였다. 그 다음으로 프라이머는 DNA (Integrated DNA Technologies)로 주문하였다.
RPA 및 RT-RPA 반응 수행은 280 mM MgAc를 주형 투입 이전에 첨가한 것을 제외하고, 각각 TwistAmp® Basic 또는 TwistAmp® Basic RT (TwistDx)에서 지시한 바와 같이 하였다. 반응은 달리 설명하지 않으면, 1 ㎕의 투입량으로 1시간 동안 37℃에서 수행하였다.
핵산의 SHERLOCK 정량을 위해, RPA 프라이머 농도는 표준 농도 (480 nM 최종) 및 더 낮은 농도 (240 nM, 120 nM, 60 nM, 24 nM)에서 시험하여 최적 농도를 찾아내었다. RPA 반응은 20분 동안 더 수행하였다.
다수 표적을 RPA로 증폭시키는 경우에, 프라이머 농도는 480 nM의 최종 농도로 맞추었다. 즉, 2개 프라이머 쌍의 경우 120 nM의 각 프라이머가 듀플렉스 검출에 첨가되었다.
이 연구에서 사용된 모든 RPA는 도 42에서 입수가능하다.
형광 절단 어세이
검출 어세이는 약간 변형하여 이전에 기술된 대로 수행하였고 그 절차를 하기에 상술한다. 검출 어세이는 45 nM의 정제된 Cas13, 22.5 nM crRNA, 소광된 형광성 RNA 리포터 (125nM RNAse Alert v2, Thermo Scientific, 동종중합체 및 2-뉴클레오티드 리포터 (IDT); 250 nM의 폴리A Trilink 리포터), 0.5 ㎕ 쥐과 RNase 억제제 (New England Biolabs), 25 ng의 배경 전체 인간 RNA (HEK293FT 배양에서 정제됨), 및 다양한 양의 투입 핵산 표적을 사용하여, 달리 표시하지 않으면, 뉴클레아제 어세이 완충액 (20 mM HEPES, 60 mM NaCl, 6 mM MgCl2, pH 6.8)에서 수행하였다. Csm6 형광성 절단 반응의 경우, 단백질은 10 nM의 최종 농도로, 뉴클레아제 어세이 완충액 (20 mM HEPES, 60 mM NaCl, 6 mM MgCl2, pH 6.8) 중 500 nM의 2', 3' 사이클릭 포스페이트 올리고아데닐레이트, 250 nM의 형광성 리포터 및 0.5 ㎕ 쥐과 RNase 억제제와 함께 사용하였다. 반응은 형광 동역학을 5분마다 측정하면서 형광 플레이트 판독기 (BioTek) 상에서 1-3시간 동안 (달리 표시하지 않으면) 37℃에서 진행되도록 하였다. AsCas12a를 포함하는 반응에서, 45 nM AsCas12a가 IDT로부터의 재조합 단백질을 사용하여 포함되었다. 다중복합 반응의 경우에, 45 nM의 각 단백질 및 22.5 nM의 각 crRNA가 반응에 사용되었다.
이 연구에서 사용된 모든 절단 리포터는 도 43에서 이용가능하다.
SHERLOCK 핵산 검출
검출 어세이는 뉴클레아제 어세이 완충액 (20 mM HEPES, 60 mM NaCl, 6 mM MgCl2, pH 6.8) 중 45 nM의 정제된 Cas13, 22.5 nM의 crRNA, 소광된 형광성 RNA 리포터 (125 nM RNAse Alert v2, Thermo Scientific, 동종중합체 및 2-뉴클레오티드 리포터 (IDT), 250 nM의 폴리A Trilink 리포터), 0.5 ㎕ 쥐과 RNase 억제제 (New England Biolabs), 25 ng의 배경 전체 인간 RNA (HEK293FT 배양에서 정제), 및 1 ㎕의 RPA 반응물, rNTP 믹스 (1 mM 최종, NEB), 0.6 ㎕ T7 중합효소 (Lucigen) 및 3 mM MgCl2를 사용해 수행하였다. 반응은 형광 동역학을 5분마다 측정하면서 형광 프레이트 판독기 (BioTek) 상에서 1-3시간 동안 (달리 표시하지 않으면) 37℃에서 진행되도록 하였다.
원-포트 핵산 검출의 경우, 검출 어세이는 약간 변형하여 이전에 기술된 대로 수행하였다. 단일 100 ㎕ 조합 반응 어세이는 0.48 μM 전방향 프라이머, 0.48 μM 역방향 프라이머, 1x RPA 재수화 완충액, 다양한 양의 DNA 투입물, 45 nM LwCas13a 재조합 단백질, 22.5 nM crRNA, 125 ng 배경 인간 인간 RNA, 125 nM 기질 리포터 (RNase alert v2), 2.5 ㎕ 쥐과 RNase 억제제 (New England Biolabs), 2 mM ATP, 2 mM GTP, 2 mM UTP, 2 mM CTP, 1 ㎕ T7 중합효소 믹스 (Lucigen), 5 mM MgCl2, 및 14 mM MgAc로 이루어졌다. 반응은 형광 동역학을 5분마다 측정하면서 형광 프레이트 판독기 (BioTek) 상에서 1-3시간 동안 (달리 표시하지 않으면) 37℃에서 진행되도록 하였다. 측류 판독의 경우, 20 ㎕의 조합 반응물을 100 ㎕의 HybriDetect 1 어세이 완충액 (Milenia)에 첨가하였고 HybriDetect 1 측류 스트립 (Milenia) 상에서 수행하였다.
절단 단편 분석을 위한 핵산 표지화
표적 RNA는 상기 기술된 바와 같이 dsDNA 주형으로부터 시험관내 전사시키고 정제하였다. 시험관내 절단 반응은 다음의 변형과 함께 형광 절단 반응에 대해 상기 기술된 대로 수행하였다. 형광성 리포터는 1 ㎍ RNA 표적으로 대체하였고 배경 RNA는 사용하지 않았다. 절단 반응은 5분 (LwaCas13a) 또는 1시간 (PsmCas13b) 동안 37℃에서 수행하였다. 절단 반응은 RNA clean & concentrator-5 키트 (Zymo Research)를 사용하여 정제하였고 10 ㎕의 초순수 (Gibco)에 용리하였다. 절단 반응은 5'EndTag 표지화 반응 (Vector Laboratories) 키트 프로토콜에 따라서 10 ㎍의 말레이미드 IRDye 800CW (Licor)를 사용해 더욱 표지화하였다. Cas13 절단에 의해 생성된 5' 말단을 결정하기 위해서, 프로토콜은 변형하여 알칼리 포스파타제 (AP) 처리를 수행하거나 또는 오직 5'-OH 함유 RNA 종만을 표지화하기 위해 초순수로 대체한 한편, 미분해된 트리포스포릴화 (PPP) RNA 종은 AP 처리가 수행된 경우에만 표지된다.
고해상도 절단 단편 분석을 위한 질량 분광법
질량 분광법을 통해서 Cas13 부차적 RNase 활성으로 생성된 절단 말단을 결정하기 위해서, 다음의 변형과 함께 상기 기술된 바와 같이 시험관내 절단 반응을 수행하였다. Cas13 RNA 표적은 1 nM 최종 농도로, Csm6 활성제는 3μM 최종 농도로 사용하였고 배경 RNA는 사용하지 않았다. 대조군 반응의 경우에, Cas13 표적은 초순수로 대체하거나, 또는 표준 시험관내 절단 반응은 Cas13 표적, Cas13 단백질 및 Cas13 crRNA의 부재 하에서 2',3' 사이클릭 포스페이트 활성제를 함유하는 헥사아데닐레이트와 인큐베이션시켰다. 절단 반응은 1시간 동안 37℃에서 수행하였고 New England Biolabs siRNA 정제 프로토콜을 사용하여 정제하였다. 간략하게, 1/10 부피의 3 M NaOAc, 2 ㎕의 RNase-free Glycoblue (Thermofisher) 및 3x 부피의 냉 95% 에탄올을 첨가하였고, -20℃에서 2시간 동안 정치시키고, 15분 동안 14,000g로 원심분리하였다. 상청액을 제거하였고, 2x 부피의 80% EtOH을 첨가하고 10분 동안 실온에서 인큐베이션하였다. 상청액을 옮기고 샘플을 5분 동안 14,000g에서 원심분리하였다. 펠렛을 자연 건조시킨 후에, 50 ㎕의 UltraGrade 물을 첨가하고 질량 분광 분석을 위해 드라이 아이스 상에서 운반하였다.
질량 분광 분석을 위해서, 샘플을 1:1로 UltraGrade 물로 희석하였고 Agilent 1290 HPLC와 커플링된 음이온 방식의 Bruker Impact II q-TOF 질량 분광계에서 분석하였다. 이동상 A로서 수 중 0.1% 암모늄 히드록시드 v/v 및 이동상 B로 아세토니트릴을 사용하여 PLRP-S 컬럼 (50 mm, 5 ㎛ 입자 크기, 1000 옴스트롬 포어 크기 PLRP-S 컬럼, 2.1 mm ID)에 10 ㎕를 주입하였다. 유속은 내내 0.3 mL/분으로 일정하게 유지하였다. 이동상 조성물은 0% B에서 출발하였고 처음 2분 동안 유지하였다. 이 시점 이후에, 조성물은 다음 8분 동안 100% B로 교체하였고 1분 동안 유지하였다. 그 다음으로 조성물은 0.1분 동안 0% B로 되돌렸고 이어서 4.9분 동안 유지시켜서 컬럼이 출발 조건으로 재평형화될 수 있게 하였다. 질량 분광계는 대형 MW 이온에 대해 조율되었고, 데이타는 m/z 400-5000 사이에서 획득되었다. 질량 분광계로부터의 전체 데이타세트는 소듐 포르메이트의 주입을 사용하여 m/z에 의해 보정되었다. 음으로 하전된 이온 데이타로부터 계산된 중성 질량 스펙트럼을 생성시키기 위해서 MaxEnt 디컨볼루션 알고리즘에 대해 허가된 Bruker Compass Data Analysis 4.3을 사용해 데이타를 분석하였다.
간 타액으로부터 게놈 DNA 추출
타액 DNA 추출은 약간 변형하여 이전에 기술된 대로 수행하였고 하기에 상술된다. 채취 전에 30분에 음식 또는 음료 섭취를 제한한 지원자로부터 2 mL의 타액을 채취하였다. 그 다음으로 샘플은 키트 프로토콜에 따라 추천한 대로 QIAamp® DNA 혈액 미니 키트 (Qiagen)를 사용해 처리하였다. 끓인 타액 샘플의 경우, 400 ㎕의 포스페이트 완충 염수 (Sigma)를 100 ㎕의 지원자 타액에 첨가하였고 5분 동안 1800 g로 원심분리하였다. 상청액을 옮기고 펠렛은 95℃에서 5분 동안 인큐베이션하기 전에 0.2% Triton X-100 (Sigma)이 존재하는 포스페이트 완충 염수에 재현탁하였다. 1 ㎕의 샘플을 RPA 반응의 직접 투입물로서 사용하였다.
디지털 액적 PCR 정량
ddPCR 정량은 약간 변형하여 이전에 기술된 대로 수행하였고 하기에 상술한다. 표적 희석물의 농도를 확인하기 위해서, 우리는 디지털-액적 PCR (ddPCR)을 수행하였다. DNA 정량의 경우, 액적은 표적 서열에 대해 디자인된 PrimeTime qPCR 프로브/프라이머 어세이 (IDT)와 프로브 용 ddPCR Supermix (dUTP 없음) (BioRad)를 사용해 만들었다. RNA 정량의 경우, 액적은 표적 서열에 대해 디자인된 PrimeTime qPCR 프로브/프라이머 어세이와 프로브 용 원-스텝 RT-ddPCR 키트를 사용해 만들었다. 액적은 양쪽 경우에 QX200 액적 생성기 (BioRad)를 사용해 생성시켜서 PCR 플레이트로 옮겼다. 액적-기반 증폭은 키트 프로토콜에 기술된 대로 열순환기에서 수행하였고 핵산 농도는 이후에 QX200 액적 판독기 상에서 측정을 통해 결정하였다.
Cas13-Csm6 형광 절단 어세이
Cas13-Csm6 조합된 형광 절단 어세이는 하기와 같이 변형하여 표준 Cas13 형광 절단 반응에 대해 기술된 대로 수행하였다. 달리 표시하지 않으면 Csm6 단백질은 400 nM의 Csm6 형광 리포터 및 500 nM의 Csm6 활성제에 10 nM이 최종 농도로 첨가되었다. Cas13을 Csm6 부차적 RNase 활성과 구별하기 위해서, 2종의 상이한 형광단이 형광 검출에 사용되었다 (FAM 및 HEX). Csm6 활성에 의한 rRNA의 간섭때문에, IVT는 RPA 사전-증폭 단계에서 수행되었고 그 다음으로 이 반응물의 1 ㎕를 투입물로서 Cas13-Csm6 절단 어세이에 첨가하였다.
우리가 3-단계 Cas13-Csm6 절단 어세이를 시험한 경우에, RPA는 다양한 시간 동안 상기에 논의된 바와 같이 정상적으로 수행되었고 그 다음으로 다양한 시간 동안 정상적인 IVT 반응에 투입물로서 사용되었다. 이어서, 1 ㎕의 IVT가 이전 단락에 기술된 Cas13-Csm6 반응에 투입물로서 사용되었다. 이 연구에서 사용된 모든 Csm6 활성제는 도 38에서 입수가능하다.
라이브러리를 사용한 모티프 발굴 스크린
Cas13 절단 선호도를 스크리닝하기 위해서, 시험관내 RNA 절단 반응은 하기와 같이 변형하여 상기 기술된 대로 설정되었다. Cas13 표적은 20 nM로 사용되었고, 형광 리포터는 NGS 라이브러리 준비를 위한 DNA 핸들이 측접된 무작위 리보뉴클레오티드의 6-량체 스트레치를 함유하는 1 μM의 DNA-RNA 올리고뉴클레오티드 (IDT)로 대체되었다. 반응은 (달리 표시하지 않으면) 60분 동안 37℃에서 수행되었다. 반응물은 Zymo oligo-clean & concentrator-5 키트 (Zymo research)를 사용하여 정제하였고 15 ㎕의 초순수가 용리에 사용되었다. 10 ㎕의 정제된 반응물이 DNA 핸들에 결합되는 유전자-특이적 프라이머를 사용한 역전사에 사용되었다.
역전사 (RT)는 45분 동안 42℃에서 qScript Flex cDNA-키트 (quantabio) 프로토콜에 따라서 수행되었다. 절단 효율 및 생성물 순도를 평가하기 위해서, RT-반응물을 물에 1:10으로 희석하였고 Small RNA 키트에 로딩하여 Bioanalyzer 2100 (Agilent) 상에서 작업하였다. 4 마이크로리터의 RT-반응물을 제1 라운드의 NGS 라이브러리 제조에 사용하였다. NEBNext (NEB)를 사용하여, 최종 625 nM의 전방향 프라이머 및 625 nM의 역방향 프라이머를 사용하고 98℃에서 3분 초기 변성, 98℃에서 10s 사이클 변성, 63℃에서 10s 어닐링, 72℃에서 20s 연장 및 72℃ 2분 최종 연장의 15사이클 동안 제1 가닥 cDNA를 증폭시켰다.
2 마이크로리터의 제1 라운드 PCR 반응물을 제2 라운드 PCR 증폭에 사용하여 NGS 시퀀싱을 위한 Illumina-상용성 인덱스 (NEB)에 부착시켰다. 동일한 NEBNext PCR 프로토콜을 증폭에 사용하였다. PCR 생성물은 아가로스 겔-전기영동 (2% Sybr Gold E-Gel Invitrogen System)으로 분석하였고 5 ㎕의 각 반응물을 풀링하였다. 풀링된 샘플을 겔 추출하고, Qubit DNA 2.0 DNA 고감도 키트로 정량하였으며, 4 nM 최종 농도로 정규화하였다. 최종 라이브러리는 2 pM로 희석하였고 75-사이클 키트를 사용해 NextSeq 500 Illumina 시스템으로 시퀀싱하였다.
모티프 스크린 분석
무작위 모티프 라이브러리 스크린으로부터 바람직한 모티프의 감손을 분석하기 위해서, 6-량체 영역을 서열 데이타로부터 추출하였고 각 샘플에 대한 전체 판독 계측치에 대해 정규화시켰다. 그 다음으로, 실험 조건 및 대응 대조군 간에, 위계측치를 조정하여, log 비율을 생성시켰다. Cas13 실험의 경우, 대응 대조군은 표적 RNA를 첨가하지 았았고, Csm6 및 RNase A 실험의 경우에, 대응 대조군은 효소를 갖지 않았다. Log 비율 분포 모양을 사용하여 농축된 모티프에 대한 컷오프를 결정하였다. 그 다음으로 농축된 모니프를 사용하여 1-, 2-, 또는 3- 뉴클레오티드 조합의 존재를 결정하였다. 모티프 logo는 Weblogo3을 사용하여 생성시켰다.
Cas13 단백질 및 crRNA 직접 반복부의 계통수 분석
오솔로그 클러스터링을 조사하기 위해서, Cas13a 및 Cas13b 단백질 서열을 사용하여 Geneious의 MUSCLE에서 다중 서열 정렬을 생성시킨 후에 heatmap.2 함수로 유클리드 거리를 사용해 클러스터링하였다. 직접 반복부 클러스터링을 조사하기 위해서, Cas13a 및 Cas13b 직접 반복부 서열을 사용해 Geneious 알고리즘을 사용하는 Geneious에서 다중 서열 정렬을 생성시켰고 그 이후에 heatmap.2 함수로 유클리드 거리 R를 사용해 클러스터링하였다. 디-뉴클레오티드 모티프 선호도를 기반으로 오솔로그의 클러스터링을 조사하기 위해서, heatmap.2 함수로 유클리드 거리 R을 사용해 절단 활성 매트릭스를 클러스터링하였다.
금 나노입자 비색
RNA 올리고는 5' 및 3' 말단에 티올을 갖는 IDT로부터 합성하였다 (도 43의 서열). 티올 기를 탈보호시키기 위해서, 20 mM 최종 농도의 올리고는 100 mM DTT를 함유하는 150 mM 소듐 포스페이트 중에서 2시간 동안 실온에서 환원시켰다. 그 다음으로 올리고는 세파덱스 NAP-5 컬럼 (GE Healthcare)을 사용하여 700 ㎕ 물의 최종 부피로 정제하였다. 앞서 기술된 바와 같이, 10 μM의 환원된 올리고는 280 ㎕의 부피로 600 ㎕ 부피의 2.32 nM 15 nm-금 나노입자 (Ted Pella)에 첨가하였고, 올리고 대 나노입자의 비율은 2000:1이다. 후속하여, pH 8.3인 10 ㎕의 1 M Tris-HCl 및 90 ㎕의 1 M NaCl을 올리고-나노입자 혼합물에 첨가하였고 18시간 동안 실온에서 회전하면서 인큐베이션시켰다. 18시간 후에, 추가 1 M Tris-HCl (5 ㎕, pH 8.3)을 5 M NaCl (50 ㎕)과 첨가하였고 이것을 추가 15시간 동안 실온에서 회전하면서 인큐베이션시켰다. 인큐베이션 이후에, 최종 용액을 25분 동안 22,000g로 원심분리하였다. 상청액을 버리고 접합된 나노입자를 50 ㎕의 200 mM NaCl에 재현탁시켰다.
나노입자는 RNase 감도에 대해서 RNase A 어세이를 사용해 시험하였다. 다양한 양의 RNase A (Thermo Fischer)를 20 ㎕의 총 반응 부피로 1x RNase A 완충액 및 6 ㎕의 접합된 나노입자에 첨가하였다. 520 nm에서의 흡광도를 플레이트 분광광도계를 사용하여 3시간 동안 5분 마다 모니터링하였다.
FAM-바이오틴 리포터를 사용한 Cas13 활성의 측류 판독
FAM-RNA-바이오틴 리포터의 절단을 기반으로 하는 측류의 경우에, 비-RPA LwaCas13a 반응 또는 SHERLOCK-LwaCas13a 반응은 1시간 동안, 달리 표시하지 않으면, 1 μM 최종 농도의 FAM-RNA-바이오틴 리포터를 사용해 수행하였다. 인큐베이션 이후에, 20 ㎕ LwaCas13a 반응 상층액을 100 ㎕의 HybriDetect 1 어세이 완충액 (Milenia)에 첨가하였고 HybriDetect 1 측류 스트립 (Milenia) 상에 흘려주었다.
REPAIR 구성체의 클로닝, 포유동물 세포 형질감염, RNA 단리 및 REPAIR 용 NGS 라이브러리 제조
APC 돌연변이의 복귀 자극용 구성체 및 REPAIR 용 가이드 구성체는 이전에 기술된 대로 클로닝하였다. 간략하게, APC:c.1262G>A 돌연변이를 중심으로 96 nt 서열을 디자인하였고 발현 벡터 하에 골든 게이트 클로닝하였으며, 해당 가이드 서열은 PspCas13b 가이드 용 U6 발현 벡터에 골든 게이트 클로닝하였다. 환자 샘플을 모의하기 위해서, Lipofectamine 2000 (Invitrogen)을 사용해 300 ng의 돌연변이체 또는 야생형 APC 발현 벡터로 HEK293FT 세포를 형질감염시켰고, DNA 형질감염 후 2일에 제조사의 설명서에 따라서 Qiamp DNA Blood Midi 키트 (Qiagen)를 사용해 회수하였다. 20 ng의 DNA를 SHERLOCK-LwaCas13a 반응의 투입물로서 사용하였다.
REPAIR 시스템을 사용한 RNA 교정은 이전에 기술된 대로 수행하였다: 150 ng의 dPspCas13b-ADAR(DD)E488Q, 200 ng의 가이드 벡터, 및 30 ng의 APC 발현 벡터를 동시-형질감염시켰고, RNA 형질감염 후 2일에 제조사의 설명서에 따라서 RNeasy Plus Mini 키트 (Qiagen)를 사용해 회수하였다. 30 ng의 RNA를 SHERLOCK-LwaCas13a 반응의 투입물로서 사용하였다.
RNA 편집 분획은 이전에 기술된 대로 NGS를 통해 독립적으로 결정하였다. RNA는 서열 특이적 프라이머를 사용하여 qScript Flex 키트 (Quanta Biosciences)로 역전사시켰다. 제1 가닥 cDNA는 NEBNext High Fidelity 2X PCR 마스터믹스 (New England Biosciences)와 최종 625 nM의 전방향 프라이머 및 625 nM의 역방향 프라이머의 믹스를 사용하여 98℃에서 3분 초기 변성, 98℃에서 10초 사이클 변성, 65℃에서 30초 어닐링, 72℃에서 30초 연장 및 72℃에서 2분 최종 연장의 15 사이클 동안 증폭시켰다. 2 마이크로리터의 제1 라운드 PCR 반응믈을 제2 라운드 PCR 증폭에 사용하여, 18사이클로 동일 프로토콜을 사용해, NEBNext에 의해서, NGS 시퀀싱 용 Illumina-상용성 인덱스를 부착시켰다. PCR 생성물은 아가로스 겔 전기영동 (2% Sybr Gold E-Gel Invitrogen)으로 분석하였고 5 ㎕의 각 반응물을 풀링하였다. 풀링된 샘플을 겔 추출하였고, Qubit DNA 2.0 DNA 고감도 키트로 정량하였으며, 4 nM 최종 농도로 정규화하였고, 300 사이클 v2 MiSeq 키트 (Illumina)를 사용해 판독하였다.
SHERLOCK 형광도 데이타의 분석
SHERLOCK 형광 분석은 약간 변형하여 전에 기술된 대로 수행하였고 하기에 상술한다. 배경치 차감 형광도 데이타를 계산하기 위해서, 샘플의 초기 형광도를 차감하여 상이한 조건 간 비교를 가능하게 하였다. 배경 조건 (투입물 또는 crRNA가 부재하는 조건)에 대한 형광도를 샘플에서 차감하여 배경치 차감 형광도를 생성시켰다.
SNP 구별을 위한 crRNA 비율은 다음과 같이 샘플 대 샘플 전체 변동성을 조정하기 위해 계산되었다:
식에서 Ai 및 Bi 는 소정 개체에서, 각각 대립유전자 A 또는 대립유전자 B를 감지하는 crRNA의 기술적 복제 i에 대한 SHERLOCK 강도 값을 의미한다. 전형적으로 우리는 crRNA 당 4개의 기술적 복제를 가지므로, m 및 n은 4와 동등하고 분모는 소정 SNP 유전자좌 및 개체에 대한 모든 8개의 crRNA SHERLOCK 강도 값의 총합과 동등하다. 2개의 crRNA가 존재하기 때문에, 개체에 대한 각각의 crRNA 전반에서 crRNA 비율 평균은 항상 총합이 2일 것이다. 그러므로, 이상적인 동형접합 경우에, 양성 대립유전자 crRNA에 대한 평균 crRNA 비율은 2일 것이고 음성 대립유전자 crRNA에 대한 평균 crRNA 비율은 0일 것이다. 이상적인 이형접합 경우에, 각각의 2개 crRNA에 대한 평균 crRNA 비율은 1일 것이다. SHERLOCKv2에서, 우리는 상이한 색상 채널에서 Ai 및 Bi 를 측정하여 유전자형분석을 수행하기 때문에 480-색상 채널의 강도 값과 일치되도록 530-색상 채널을 6까지 조정하였다.
표적 부재 하에서 Cas13 오솔로그의 무차별적 절단
Cas13 패밀리의 일부 구성원, 예컨대 PinCas13b 및 LbuCas13a는 표적 존재 또는 부재 하에서 무차별적 절단이 입증되고, 이러한 배경치 활성은 디-뉴클레오티드 리포터 의존적이다. 이러한 배경치 활성은 또한 LbuCas13a의 경우에 스페이서 의존적이었다. 일부 리포터에서, U 및 A 염기 선호도는 단백질 또는 DR 유사성 내에 클러스터링되었다. 흥미롭게도, 여기서 확인된 디-뉴클레오티드 선호도는 직접 반복부 유사성 또는 단백질 유사성으로부터 클러스터링된 Cas13 패밀리와 상응하지 않았다.
PsmCas13b 및 CcaCas13b를 위한 crRNA 디자인의 특징규명
PsmCas13b 및 CcaCas13b에 의한 검출에 최적인 crRNA를 확인하기 위해서, 우리는 34-12 nt의 crRNA 스페이서 길이를 시험하였고 PsmCas13b는 30의 스페이서 길이에서 피크 감도를 가진데 반해서, CcaCas13b는 28 nt의 스페이서 길이 이상에서 동등한 감도를 가져서, Cas13 활성 평가를 위해 30 nt 스페이서의 사용을 정당화하였다. LwaCas13a와 비교하여 CcaCas13b 및 PsmCas13b의 표적화의 강건성을 더욱 조사하기 위해서, 우리는 ssRNA 1에 걸쳐 고르게 간격을 둔 11종의 상이한 crRNA를 디자인하였고 LwaCas13a 부차적 활성은 crRNA 디자인에 대해 강건하였고, 그에 반해 CcaCas13b 및 PsmCas13b 둘 모두는 상이한 crRNA에 걸쳐 활성에서 더 많은 가변성을 보였다는 것을 확인하였다.
추가의 직교성 모티프에 대한 무작위 라이브러리 모티프 스크리닝. Cas13a 및 Cas13b 오솔로그의 절단 선호도의 다양성을 더욱 조사하기 위해서, 우리는 부차적 엔도뉴클레아제 활성에 바람직한 모티프를 특징규명하기 위해 라이브러리-기반 접근법을 개발하였다. 우리는 일정한 DNA 핸들이 측접된 축퇴성 6-량체 RNA 리포터를 사용하여서, 미절단된 서열의 증폭 및 판독을 가능하게 하였다. 이 라이브러리와 Cas13 효소의 인큐베이션 결과 표적 RNA의 첨가에 의존적인 검출가능한 절단 패턴이 야기되었고, 이들 반응으로부터 감소된 모티프의 시퀀싱은 절단에 바람직한 모티프의 개체군을 의미하는 분해 시간 동안 라이브러리의 비대칭의 증가를 밝혀주었다. 고도로 감소된 모티프로부터의 서열 logo 및 쌍별 염기 선호도는 LwaCas13a 및 CcaCas13b에 대해 관찰된 U-선호도 및 PsmCas13b의 A-선호도를 재현하였다. 우리는 연구 결과들을 검증하기 위해 스크린으로부터 결정된 상위 모티프로부터 리포터를 합성하였고, LwaCas13a, CcaCas13a, 및 PsmCas13b가 모도 그들의 가장 고도로 바람직한 모티프를 절단하였다는 것을 확인하였다. 우리는 또한 다른 것이 아닌, 오직 하나의 오솔로그에 대해 절단일 보인 다수 서열을 확인하였고, 이것은 디-뉴클레오티드 모티프로부터 대안적인 직교적 판독을 가능하게 할 수 있었다. 상이한 표적과 인큐베이션된 LwaCas13a는 유사한 절단 모티프 선호도를 생성시켜서, 부차적 활성의 염기 선호도가 표적 서열과 무관하게 일관적이라는 것을 의미하였다.
LwaCas13a 절단 시 활성제 생성물의 검증
질량 분광법을 사용하여, 우리는 LwaCas13a 분해가 Csm6 활성화에 대해 예상되는 사이클릭-포스페이트 종결된 생성물을 생성시켰다는 것을 검증하였다. 활성화는 폴리-U에 의한 5' 보호 및 내부 폴리-U 트랙을 포함하는 다른 활성화 디자인이 표적 RNA의 존재 하에서 독점적으로 Csm6을 활성화시키는데 덜 효과적이었으므로 (아마도 LwaCas13a가 UA 모티프에 대해 적은 활성을 가지고 5' 보호가 Csm6의 활성화를 방지하는데 비효과적이기 때문에), 폴리U에 의한 3' 보호된 디자인의 경우에 가장 효과적이었다.
RPA 및 Csm6 반응의 조합을 위한 최적화
Csm6-증강과 RPA 사전-증폭의 조합이 신호 및 감도를 증가시키게 되므로, 우리는 RPA와의 조합에 필요한 시험관내 전사 성분의 존재 하에서 활성에 대해 Csm6을 시험하였다. 우리는 마그네슘 및 유리 rNTP 둘 모두가 사이클릭 포스페이트 활성제의 존재 하에서 Csm6의 뉴클레아제 활성을 감소시켰다는 것을 확인하였다. 용액 중 rNTP의 양 감소는 전사되는 RNA의 양을 감소시켰고, 그러므로 증가된 리포터 또는 활성제 농도가 존재하더라도, Cas13a에 의한 Csm6 활성화에 음성적 효과를 가졌다.
본 발명은 하기 번호매겨진 단락을 통해서 더욱 설명된다:
1. 하나 이상의 검출 CRISPR 이펙터 단백질 및 하나 이상의 신호 증폭 CRISPR 이펙터 단백질을 포함하는 조성물.
2. 단락 1에 있어서, 하나 이상의 검출 CRISPR 이펙터 단백질은 VI형 CRISPR 이펙터 단백질인 조성물.
3. 단락 2에 있어서, VI형 CRISPR 이펙터 단백질은 Cas13a, Cas13b, 또는 둘 모두인 조성물.
4. 단락 1 내지 단락 3 중 어느 하나에 있어서, 하나 이상의 신호 증폭 CRISPR 이펙터 단백질은 IIIa형 CRISPR 단백질인 조성물.
5. 단락 4에 있어서, III형 CRISPR 단백질은 Csm6 단백질인 조성물.
6. 단락 1 내지 단락 5 중 어느 하나에 있어서, 해당 표적 분자에 결합하도록 디자인된 하나 이상의 가이드 서열을 더 포함하는 것인 조성물.
7. 단락 7에 있어서, 활성화 서열의 절단 시 하나 이상의 신호 증폭 CRISPR 이펙터 단백질을 활성화시키도록 디자인된 하나 이상의 활성화 서열을 더 포함하는 것인 조성물.
8. 단락 1 내지 단락 7 중 어느 하나에 있어서, 리포터 구성체를 더 포함하는 것인 조성물.
9. 단락 1 내지 단락 8 중 어느 하나에 있어서, 보호된 제2 가이드 서열 및 제2 표적 서열을 더 포함하고, 여기서 제2 가이드 서열은 보호된 제2 가이드 서열 상에서 보호 엘리먼트의 제거 시 제2 표적 서열에 결합하도록 디자인된 것인 조성물.
10. 단락 1 내지 단락 9 중 어느 하나에 있어서, 보호된 제2 표적 서열 및 제2 가이드 서열을 더 포함하고, 여기서 제2 가이드 서열은 보호된 제2 표적 서열 상에서 보호 엘리먼트의 제거 시 제2 표적 서열에 결합하도록 디자인된 것인 조성물.
11. 단락 1 내지 단락 10 중 어느 하나에 있어서, 보호되거나 또는 원형화된 프라이머 및 가이드 서열 및/또는 표적 서열을 코딩하는 주형을 더 포함하고, 여기서 보호되거나 또는 원형화된 프라이머는 보호 엘리먼트의 제거 또는 원형화된 프라이머의 절단 시에 주형의 증폭 반응을 프라이밍하도록 디자인된 것인 조성물.
12. 단락 1 내지 단락 11 중 어느 하나에 있어서, 증폭 시약을 더 포함하는 것인 조성물.
13. 단락 1 내지 단락 12 중 어느 하나의 조성물을 포함하는 진단 장치.
14. 샘플에서 표적 분자를 검출하기 위한 방법으로서,
샘플 또는 샘플의 세트를 하나 이상의 개별 이산 부피에 분배시키는 단계로서, 개별 이산 부피는 단락 8 내지 12 중 어느 하나의 조성물을 포함하는 것인 단계;
하나 이상의 가이드 서열과 하나 이상의 표적 분자의 결합을 허용하기 위해 충분한 조건 하에서 샘플 또는 샘플의 세트를 인큐베이션시키는 단계;
하나 이상의 가이드 서열과 하나 이상의 표적 분자의 결합을 통해서 검출 CRISPR 이펙터 단백질을 활성화시키는 단계로서, 검출 CRISPR 이펙터 단백질의 활성화는 그 결과로 활성화 서열의 절단을 야기하여서 신호 증폭 CRISPR 이펙터 단백질이 활성화되고, 활성화된 검출 CRISPR 이펙터 단백질 및 활성화된 신호 증폭 CRISPR 이펙터 단백질 둘 모두는 리포터 구성체를 변형시켜서 검출가능한 양성 신호가 발생되는 것인 단계; 및
검출가능한 양성 신호를 검출하는 단계로서, 검출가능한 양성 신호의 검출은 샘플 중 하나 이상의 표적 분자의 존재를 의미하는 것인 단계
를 포함한다.
***
본 발명의 기술된 방법, 약학 조성물 및 키트의 다양한 변형 및 이형은 본 발명의 범주 및 사조를 벗어나지 않고 당업자에게 분명해질 것이다. 본 발명이 특별한 실시형태와 함께 기술되어 있지만, 더욱 변형될 수 있고 청구되는 본 발명이 이러한 특별한 실시형태에 과도하게 제한되어서는 안된다는 것을 이해하게 될 것이다. 실제로, 당업자에게 자명한 본 발명을 수행하기 위해 기술된 방식의 다양한 변형은 본 발명의 범주 내에 포함하고자 한다. 본 출원은 일반적으로 본 발명의 원리에 따른 본 발명의 임의의 이형, 용도, 또는 개조를 포괄하고자 하고 본 개시내용으로부터의 이러한 이탈의 포함은 본 발명이 속하는 분야 내에서 공지의 통상적인 관례 내이고 이전에 기재된 본 명세서의 본질적인 특성에 적용될 수 있다.