KR20200057071A - 스플라이싱 조절제의 스크리닝 및 확인을 위한 방법 및 조성물 - Google Patents

스플라이싱 조절제의 스크리닝 및 확인을 위한 방법 및 조성물 Download PDF

Info

Publication number
KR20200057071A
KR20200057071A KR1020207011984A KR20207011984A KR20200057071A KR 20200057071 A KR20200057071 A KR 20200057071A KR 1020207011984 A KR1020207011984 A KR 1020207011984A KR 20207011984 A KR20207011984 A KR 20207011984A KR 20200057071 A KR20200057071 A KR 20200057071A
Authority
KR
South Korea
Prior art keywords
snrnp
polynucleotide
hnrnp
target polynucleotide
cag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
KR1020207011984A
Other languages
English (en)
Inventor
캐슬린 맥카시
마이클 루지오
Original Assignee
스카이호크 테라퓨틱스, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 스카이호크 테라퓨틱스, 인코포레이티드 filed Critical 스카이호크 테라퓨틱스, 인코포레이티드
Publication of KR20200057071A publication Critical patent/KR20200057071A/ko
Ceased legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D401/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom
    • C07D401/02Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing two hetero rings
    • C07D401/10Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing two hetero rings linked by a carbon chain containing aromatic rings
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D231/00Heterocyclic compounds containing 1,2-diazole or hydrogenated 1,2-diazole rings
    • C07D231/02Heterocyclic compounds containing 1,2-diazole or hydrogenated 1,2-diazole rings not condensed with other rings
    • C07D231/10Heterocyclic compounds containing 1,2-diazole or hydrogenated 1,2-diazole rings not condensed with other rings having two or three double bonds between ring members or between ring members and non-ring members
    • C07D231/14Heterocyclic compounds containing 1,2-diazole or hydrogenated 1,2-diazole rings not condensed with other rings having two or three double bonds between ring members or between ring members and non-ring members with hetero atoms or with carbon atoms having three bonds to hetero atoms with at the most one bond to halogen, e.g. ester or nitrile radicals, directly attached to ring carbon atoms
    • C07D231/38Nitrogen atoms
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D401/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom
    • C07D401/02Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing two hetero rings
    • C07D401/08Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing two hetero rings linked by a carbon chain containing alicyclic rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D401/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom
    • C07D401/02Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing two hetero rings
    • C07D401/12Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing two hetero rings linked by a chain containing hetero atoms as chain links
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D401/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom
    • C07D401/14Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing three or more hetero rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D403/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, not provided for by group C07D401/00
    • C07D403/02Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, not provided for by group C07D401/00 containing two hetero rings
    • C07D403/12Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, not provided for by group C07D401/00 containing two hetero rings linked by a chain containing hetero atoms as chain links
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D413/00Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and oxygen atoms as the only ring hetero atoms
    • C07D413/02Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and oxygen atoms as the only ring hetero atoms containing two hetero rings
    • C07D413/06Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and oxygen atoms as the only ring hetero atoms containing two hetero rings linked by a carbon chain containing only aliphatic carbon atoms
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D413/00Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and oxygen atoms as the only ring hetero atoms
    • C07D413/02Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and oxygen atoms as the only ring hetero atoms containing two hetero rings
    • C07D413/12Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and oxygen atoms as the only ring hetero atoms containing two hetero rings linked by a chain containing hetero atoms as chain links
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D471/00Heterocyclic compounds containing nitrogen atoms as the only ring hetero atoms in the condensed system, at least one ring being a six-membered ring with one nitrogen atom, not provided for by groups C07D451/00 - C07D463/00
    • C07D471/02Heterocyclic compounds containing nitrogen atoms as the only ring hetero atoms in the condensed system, at least one ring being a six-membered ring with one nitrogen atom, not provided for by groups C07D451/00 - C07D463/00 in which the condensed system contains two hetero rings
    • C07D471/04Ortho-condensed systems
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D471/00Heterocyclic compounds containing nitrogen atoms as the only ring hetero atoms in the condensed system, at least one ring being a six-membered ring with one nitrogen atom, not provided for by groups C07D451/00 - C07D463/00
    • C07D471/02Heterocyclic compounds containing nitrogen atoms as the only ring hetero atoms in the condensed system, at least one ring being a six-membered ring with one nitrogen atom, not provided for by groups C07D451/00 - C07D463/00 in which the condensed system contains two hetero rings
    • C07D471/08Bridged systems
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D487/00Heterocyclic compounds containing nitrogen atoms as the only ring hetero atoms in the condensed system, not provided for by groups C07D451/00 - C07D477/00
    • C07D487/02Heterocyclic compounds containing nitrogen atoms as the only ring hetero atoms in the condensed system, not provided for by groups C07D451/00 - C07D477/00 in which the condensed system contains two hetero rings
    • C07D487/04Ortho-condensed systems
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D491/00Heterocyclic compounds containing in the condensed ring system both one or more rings having oxygen atoms as the only ring hetero atoms and one or more rings having nitrogen atoms as the only ring hetero atoms, not provided for by groups C07D451/00 - C07D459/00, C07D463/00, C07D477/00 or C07D489/00
    • C07D491/02Heterocyclic compounds containing in the condensed ring system both one or more rings having oxygen atoms as the only ring hetero atoms and one or more rings having nitrogen atoms as the only ring hetero atoms, not provided for by groups C07D451/00 - C07D459/00, C07D463/00, C07D477/00 or C07D489/00 in which the condensed system contains two hetero rings
    • C07D491/04Ortho-condensed systems
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D498/00Heterocyclic compounds containing in the condensed system at least one hetero ring having nitrogen and oxygen atoms as the only ring hetero atoms
    • C07D498/02Heterocyclic compounds containing in the condensed system at least one hetero ring having nitrogen and oxygen atoms as the only ring hetero atoms in which the condensed system contains two hetero rings
    • C07D498/04Ortho-condensed systems
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D513/00Heterocyclic compounds containing in the condensed system at least one hetero ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for in groups C07D463/00, C07D477/00 or C07D499/00 - C07D507/00
    • C07D513/02Heterocyclic compounds containing in the condensed system at least one hetero ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for in groups C07D463/00, C07D477/00 or C07D499/00 - C07D507/00 in which the condensed system contains two hetero rings
    • C07D513/04Ortho-condensed systems
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N24/00Investigating or analyzing materials by the use of nuclear magnetic resonance, electron paramagnetic resonance or other spin effects
    • G01N24/08Investigating or analyzing materials by the use of nuclear magnetic resonance, electron paramagnetic resonance or other spin effects by using nuclear magnetic resonance
    • G01N24/088Assessment or manipulation of a chemical or biochemical reaction, e.g. verification whether a chemical reaction occurred or whether a ligand binds to a receptor in drug screening or assessing reaction kinetics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/5308Immunoassay; Biospecific binding assay; Materials therefor for analytes not provided for elsewhere, e.g. nucleic acids, uric acid, worms, mites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2522/00Reaction characterised by the use of non-enzymatic proteins
    • C12Q2522/10Nucleic acid binding proteins
    • C12Q2522/101Single or double stranded nucleic acid binding proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/60Detection means characterised by use of a special device
    • C12Q2565/633NMR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • High Energy & Nuclear Physics (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

폴리뉴클레오타이드 및/또는 폴리뉴클레오타이드 및 단백질에 의해 형성된 복합체에 결합할 수 있는 소분자를 확인하기 위한 구조 기반 스크리닝 플랫폼 및 방법이 본원에 제공된다. 소분자와 폴리뉴클레오타이드와의 상호작용 및/또는 폴리뉴클레오타이드 및 단백질에 의해 형성된 복합체와의 상호작용을 특성화하는 구조 기반 스크리닝 플랫폼 및 방법이 또한 본원에 제공된다. RNA 스플라이싱에 관여하는 폴리뉴클레오타이드 및/또는 폴리뉴클레오타이드-단백질 복합체에 결합할 수 있는 소분자를 확인하기 위한 방법 및 조성물이 또한 본원에 제공된다.

Description

스플라이싱 조절제의 스크리닝 및 확인을 위한 방법 및 조성물
교차 참조
본 출원은 2017년 9월 25일에 출원된 미국 가출원 제62/562,941호의 우선권을 주장하며, 이는 그 전체가 참조로 본원에 포함되어 있다.
단백질-핵산 상호작용은 전사, RNA 스플라이싱, mRNA 붕괴, 및 mRNA 번역을 포함하는 많은 세포 기능에 관여한다. 단일 또는 이중 가닥 핵산의 특정 서열 및 구조적 구성요소에 높은 친화성으로 결합할 수 있는 쉽게 접근가능한 합성 분자는 이러한 상호작용을 제어가능한 방식으로 방해할 잠재력이 있어 분자 생물학 및 의약에 매력적인 도구이다.
인간 전사체는 스플라이싱에 의해 추가적으로 다양화되는 방대한 RNA 집단으로 구성된다. 게놈 전체 연구는 90%의 유전자가 인간에서 선택적으로 스플라이싱되어 단백질 다양성의 주요 동인(driver)을 스플라이싱하고, 결과적으로 세포 기능을 결정한다는 것을 강조한다. 당연히, 그 정도에 비춰볼 때, 수많은 스플라이스 이소형(isoform)이 암을 포함하는 몇 가지 질환과 관련이 있는 것으로 설명되어 왔다. 흥미롭게도, 암에 관여하는 많은 이들 스플라이스 이소형은 동일한 유전자로부터 유래되고, 혈관신생촉진(pro-angiogenic) 및 항혈관신생(anti-angiogenic), 또는 아폽토시스촉진(pro-apoptotic) 및 항아폽토시스(이들의 번역된 단백질 형태에서)와 같은 길항 기능을 갖는다. 따라서, 스플라이싱은 세포를 특히 비암성에서 암성으로 전환시키는데 있어 핵심 조절 과정을 주도할 수 있다.
또한, mRNA 발현에 영향을 미치는 돌연변이는 모든 질환을 유발하는 유전자 변경의 최대 절반을 유발하는 것으로 나타났다. 이것은 잠재적으로 유전 질환의 가장 빈번한 원인에 해당한다. 이들 돌연변이 중에서, 가장 흔한 결과는 엑손 스키핑(exon skipping)이다. 이러한 큰 서열 풀(pool)에서 특정 스플라이스 부위를 검출하는 것은 수백 개의 추가 스플라이싱 인자와 협력하는 주요 및 부(minor) 스플라이소좀의 책임이다. 코어 스플라이스 부위 모티프 외에, 스플라이싱에 필요한 정보의 대부분은 인접한 스플라이스 부위의 사용을 활성화시키거나 억제하는 서열 특이적 RNA-결합 단백질 인자를 모집함으로써 기능하는 엑손 및 인트론 시스-조절 요소에 포함되어 있는 것으로 생각된다. 이러한 복잡성은 스플라이싱을 서열 다형성 및 유해한 돌연변이에 취약하게 만든다. 이 외에도, 스플라이싱의 복잡하고 역동적인 과정은 스플라이싱 과정 동안 특정 동역학적 시점에서 발생하는 몇 가지 핵심적인 상호작용을 필요로 할 수 있다. 실제로, RNA 스플라이싱 오류(mis-splicing)는 상당한 사회적 결과를 갖는 점점 더 많은 인간 질환의 기초가 된다.
그러나, RNA 스플라이싱을 표적화하는 것, 보다 구체적으로 RNA 표적을 표적화하는 것은 RNA의 2차원, 및 3차원 구조, RNA 결합 친화성 또는 선택성을 유발하는 화학형(chemotype), 특정 mRNA 스플라이싱 핫 스팟(hot spot)에서 RNA 결합 친화성 및 선택성을 유발하는 화학형, 및 소분자 결합 포켓을 형성하는 RNA 구조적 요소의 확인과 같은 제한된 이용가능한 데이터로 인해 다루기 어렵다. RNA 표적에 결합하는 소분자 라이브러리의 스크리닝은 RNA 결합을 유발하는 화학형에 대한 데이터를 생성할 수 있다. 그러나, RNA 결합제가 풍부한 소분자-스크리닝 수집물은 많지 않으며; 실제로, 대부분의 라이브러리는 단백질에 결합하는 화합물에 편향되어 있다. 또한, 몇 가지 이용가능한 RNA 결합제 라이브러리는 비특이적이거나 특정 RNA에 대해 선택적이다. 이러한 요구 등을 해결하기 위해, 본 개시내용은 다양한 구현예에서 RNA 및/또는 RNA 단백질 복합체에 결합하는 소분자를 확인하고, 특정 RNA 결합 포켓에 들어갈 수 있는 신규한 분자를 설계하고, 질환과 관련된 전구-mRNA 스플라이싱 결함에 대한 소분자의 특이성 및 선택성을 개선하는데 사용될 수 있는 구조 기반의 스크리닝 플랫폼을 제공한다.
참조에 의한 포함
본 명세서에 언급된 모든 간행물, 특허, 및 특허 출원은 각각의 간행물, 특허, 또는 특허 출원이 구체적으로 그리고 개별적으로 참조로 포함된 것으로 표시되는 것과 동일한 정도로 본원에 참조로 포함된다.
일부 양태에서, 본 개시내용은 표적 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드 샘플을 제공하는 단계; 표적 폴리뉴클레오타이드에 제1 결합제, 제2 결합제, 또는 둘 모두를 접촉시키는 단계로서; 표적 폴리뉴클레오타이드 및 제1 결합제는 제1 복합체를 형성하고, 제2 결합제 및 제1 복합체는 제2 복합체를 형성하는 것인 단계; 및 NMR 장치를 사용하여 제1 복합체, 제2 복합체, 또는 둘 모두의 핵자기 공명(NMR) 스펙트럼을 수득하는 단계를 포함하는 방법을 제공한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 표적 리보핵산(RNA)이다. 일부 구현예에서, 표적 RNA는 전구체 메신저 RNA(전구-mRNA) 또는 이의 일부이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 스플라이스 부위 또는 이의 일부를 함유한다. 일부 구현예에서, 스플라이스 부위는 5' 스플라이스 부위, 잠재(cryptic) 5' 스플라이스 부위, 3' 스플라이스 부위, 또는 잠재 3' 스플라이스 부위, 또는 이의 임의의 조합이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 분기점(branch point, BP), 엑손 스플라이싱 인핸서(exonic splicing enhancer, ESE), 엑손 스플라이싱 사일런서(exonic splicing silencer, ESS), 인트론 스플라이싱 인핸서(intronic splicing enhancer, ISE), 인트론 스플라이싱 사일런서(intronic splicing silencer, ISS), 또는 폴리피리미딘 트랙트(tract), 또는 이의 임의의 조합을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 인트론 또는 이의 단편을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손 또는 이의 단편을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손-인트론 경계를 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 8개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 25개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 최대 1000개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 100 내지 200개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 2H, 13C, 15N, 19F 및 31P를 포함하는 하나 이상의 원자 표지로 동위원소적으로 표지된 뉴클레오타이드를 포함하지 않거나 적어도 하나 포함한다. 일부 구현예에서, 제1 결합제는 제1 폴리뉴클레오타이드, 제1 폴리펩타이드, 또는 이의 조합을 포함한다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 제1 RNA이다. 일부 구현예에서, 제1 RNA는 작은 핵 RNA(snRNA) 또는 이의 일부이다. 일부 구현예에서, snRNA는 U1 snRNA, U2 snRNA, U4 snRNA, U5 snRNA, U6 snRNA, U11 snRNA, U12 snRNA, U4atac snRNA, U5 snRNA, U6atac snRNA; 또는 이의 일부이다. 일부 구현예에서, 제1 폴리펩타이드는 리보핵산단백질의 단백질 구성요소 또는 이의 일부이다. 일부 구현예에서, 리보핵산단백질은 작은 핵 리보핵산단백질(snRNP) 또는 이의 일부이다. 일부 구현예에서, snRNP는 U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP, U11 snRNP, U12 snRNP, U4atac snRNP, U5 snRNP, U6atac snRNP; 또는 이의 일부이다. 일부 구현예에서, 제1 폴리펩타이드는 9G8, A1 hnRNP, A2 hnRNP, ASD-1, ASD-2b, ASF, B1 hnRNP, C1 hnRNP, C2 hnRNAP, CBP20, CBP80, CELF, F hnRNP, FBP11, Fox-1, Fox-2, G hnRNP, H hnRNP, hnRNP 1, hnRNP 3, hnRNP C, hnRNP G, hnRNP K, hnRNP M, hnRNP U, Hu, HUR, I hnRNP, K hnRNP, KH-유형 스플라이싱 조절 단백질(KSRP), L hnRNP, M hnRNP, mBBP, 머슬-블라인드 유사(muscle-blind like, MBNL), NF45, NFAR, Nova-1, Nova-2, nPTB, P54/SFRS11, 폴리피리미딘 트랙트 결합 단백질(PTB), PRP19 복합체 단백질, R hnRNP, RNPC1, SAM68, SC35, SF, SF1/BBP, SF2, SF3A, SF3B, SFRS10, Sm 단백질, SR 단백질, SRm300, SRp20, SRp30c, SRP35C, SRP36, SRP38, SRp40, SRp55, SRp75, SRSF, STAR, GSG, SUP-12, TASR-1, TASR-2, TIA, TIAR, TRA2, TRA2a/b, U hnRNP, U1 snRNP, U11 snRNP, U12 snRNP, U1-C, U2 snRNP, U2AF1-RS2, U2AF35, U2AF65, U4 snRNP, U5 snRNP, U6 snRNP, Urp, YB1, 또는 이의 임의의 조합을 포함하는 군으로부터 선택된 단백질 또는 이의 일부이다. 일부 구현예에서, 제2 결합제는 소분자이다. 일부 구현예에서, 제1 결합제는 소분자를 포함한다. 일부 구현예에서, 제2 결합제는 제2 폴리뉴클레오타이드, 제2 폴리펩타이드, 또는 이의 조합을 포함한다. 일부 구현예에서, 제2 폴리뉴클레오타이드는 제2 RNA이다. 일부 구현예에서, 제2 RNA는 작은 핵 RNA(snRNA) 또는 이의 일부이다. 일부 구현예에서, snRNA는 U1 snRNA, U2 snRNA, U4 snRNA, U5 snRNA, U6 snRNA, U11 snRNA, U12 snRNA, U4atac snRNA, U5 snRNA, U6atac snRNA; 또는 이의 일부이다. 일부 구현예에서, 제2 폴리펩타이드는 리보핵산단백질의 단백질 구성요소 또는 이의 일부이다. 일부 구현예에서, 리보핵산단백질은 작은 핵 리보핵산단백질(snRNP) 또는 이의 일부이다. 일부 구현예에서, snRNP는 U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP, U11 snRNP, U12 snRNP, U4atac snRNP, U5 snRNP, U6atac snRNP 또는 이의 일부이다. 일부 구현예에서, 제2 폴리펩타이드는 9G8, A1 hnRNP, A2 hnRNP, ASD-1, ASD-2b, ASF, B1 hnRNP, C1 hnRNP, C2 hnRNAP, CBP20, CBP80, CELF, F hnRNP, FBP11, Fox-1, Fox-2, G hnRNP, H hnRNP, hnRNP 1, hnRNP 3, hnRNP C, hnRNP G, hnRNP K, hnRNP M, hnRNP U, Hu, HUR, I hnRNP, K hnRNP, KH-유형 스플라이싱 조절 단백질(KSRP), L hnRNP, M hnRNP, mBBP, 머슬-블라인드 유사(MBNL), NF45, NFAR, Nova-1, Nova-2, nPTB, P54/SFRS11, 폴리피리미딘 트랙트 결합 단백질(PTB), PRP19 복합체 단백질, R hnRNP, RNPC1, SAM68, SC35, SF, SF1/BBP, SF2, SF3A, SF3B, SFRS10, Sm 단백질, SR 단백질, SRm300, SRp20, SRp30c, SRP35C, SRP36, SRP38, SRp40, SRp55, SRp75, SRSF, STAR, GSG, SUP-12, TASR-1, TASR-2, TIA, TIAR, TRA2, TRA2a/b, U hnRNP, U1 snRNP, U11 snRNP, U12 snRNP, U1-C, U2 snRNP, U2AF1-RS2, U2AF35, U2AF65, U4 snRNP, U5 snRNP, U6 snRNP, Urp, YB1, 또는 이의 임의의 조합을 포함하는 군으로부터 선택된 단백질 또는 이의 일부이다. 일부 구현예에서, 제1 복합체는 결합 포켓을 포함한다. 일부 구현예에서, 결합 포켓은 돌출부(bulge), 또는 돌연변이, 또는 스템-루프, 또는 이의 임의의 조합을 포함한다. 일부 구현예에서, 결합 포켓은 돌출부, 돌연변이, 또는 스템-루프를 포함하지 않는다. 일부 구현예에서, 돌출부 또는 돌연변이는 제1 폴리뉴클레오타이드에서 3차원적 구조 변화를 유발한다. 일부 구현예에서, 제2 결합제는 결합 포켓에 결합한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 ABCA4, ABCB4, ABCD1, ACADSB, ADA, ADAMTS13, AGL, ALB, ALDH3A2, ALG6, APC, APOB, AR, ATM, ATP7A, ATR, B2M, BMP2K, BRCA1, BRCA2, BTK, C3, CAT, CD46, CDH1, CDH23, CFTR, CHM, COL11A1, COL11A2, COL1A1, COL1A2, COL2A1, COL3A1, COL4A5, COL6A1, COL6A3, COL7A1, COL9A2, COLQ, CUL4B, CYBB, CYP17, CYP19, CYP27, CYP27A1, DES, DMD, DYSF, EGFR, EMD, ETV4, F13A1, F5, F7, F8, FAH, FANCA, FANCC, FANCG, FBN1, FECH, FGA, FGFR2, FGG, FIX, FLNA, FOXM1, FRAS1, GALC, GH1, GHV, HADHA, HBA2, HBB, HEXA, HEXB, HLCS, HMBS, HMGCL, HNF1A, HPRT1, HPRT2, HSF4, HSPG2, HTT, IDS, IKBKAP, INSR, ITGB2, ITGB3, JAG1, KRAS, KRT5, L1CAM, LAMA3, LDLR, LMNA, LPL, MADD, MAPT, MLH1, MSH2, MST1R, MTHFR, MUT, MVK, NF1, NF2, OAT, OPA1, OTC, PAH, PBGD, PCCA, PDH1, PGK1, PHEX, PKD2, PKLR, PLEKHM1, PLKR, POMT2, PRDM1, PRKAR1A, PROC, PSEN1, PTCH1, PTEN, PYGM, RP6KA3, RPGR, RSK2, SBCAD, SCN5A, SERPINA1, SLC12A3, SLC6A8, SMN2, SPINK5, SPTA1, TP53, TRAPPC2, TSC1, TSC2, TSHB, UGT1A1, 및 USH2A로 이루어진 군으로부터 선택된 유전자 또는 이의 유전자 변이체에 의해 코딩되는 서열을 포함한다.
일부 구현예에서, 제1 NMR 스펙트럼은 제1 복합체에 대해 수득되고, 제2 NMR 스펙트럼은 제2 복합체에 대해 수득된다. 일부 구현예에서, 방법은 제1 및 제2 NMR 스펙트럼을 비교하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제1 및 제2 NMR 스펙트럼의 비교에 기초하여 제2 결합제를 선택하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제1 및 제2 NMR 스펙트럼의 화학적 이동(chemical shift)을 결정하는 단계를 추가로 포함한다.
일부 양태에서, 본 개시내용은 표적 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드 샘플을 제공하는 단계로서, 표적 폴리뉴클레오타이드는 스플라이스 부위, 분기점(BP), 엑손 스플라이싱 인핸서(ESE), 엑손 스플라이싱 사일런서(ESS), 인트론 스플라이싱 인핸서(ISE), 인트론 스플라이싱 사일런서(ISS), 또는 폴리피리미딘 트랙트, 또는 이의 임의의 조합을 포함하는 것인 단계; 제1 결합제를 표적 폴리뉴클레오타이드와 접촉시키는 단계; 및 NMR 장치를 사용하여 폴리뉴클레오타이드 샘플의 제1 NMR 스펙트럼을 수득하는 단계를 포함하는 방법을 제공한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 표적 RNA이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 전구-mRNA 또는 이의 일부이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손 또는 이의 단편을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 인트론 또는 이의 단편을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 엑손-인트론 경계를 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 스플라이스 부위를 함유한다. 일부 구현예에서, 스플라이스 부위는 5' 스플라이스 부위, 잠재 5' 스플라이스 부위, 3' 스플라이스 부위, 또는 잠재 3' 스플라이스 부위, 또는 이의 일부이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 8개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 25개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 최대 1000개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 2H, 13C, 15N, 19F 및 31P를 포함하는 하나 이상의 원자 표지로 동위원소적으로 표지된 뉴클레오타이드를 포함하지 않거나 적어도 하나 포함한다. 일부 구현예에서, 제1 결합제는 제1 폴리뉴클레오타이드, 제1 폴리펩타이드, 또는 이의 조합을 포함한다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 제1 RNA이다. 일부 구현예에서, 제1 RNA는 작은 핵 RNA(snRNA) 또는 이의 일부이다. 일부 구현예에서, snRNA는 U1 snRNA, U2 snRNA, U4 snRNA, U5 snRNA, U6 snRNA, U11 snRNA, U12 snRNA, U4atac snRNA, U5 snRNA, U6atac snRNA; 또는 이의 일부이다. 일부 구현예에서, 제1 폴리펩타이드는 리보핵산단백질의 단백질 구성요소 또는 이의 일부이다. 일부 구현예에서, 리보핵산단백질은 작은 핵 리보핵산단백질(snRNP) 또는 이의 일부이다. 일부 구현예에서, snRNP는 U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP, U11 snRNP, U12 snRNP, U4atac snRNP, U5 snRNP, U6atac snRNP 또는 이의 일부이다. 일부 구현예에서, 제1 폴리펩타이드는 9G8, A1 hnRNP, A2 hnRNP, ASD-1, ASD-2b, ASF, B1 hnRNP, C1 hnRNP, C2 hnRNAP, CBP20, CBP80, CELF, F hnRNP, FBP11, Fox-1, Fox-2, G hnRNP, H hnRNP, hnRNP 1, hnRNP 3, hnRNP C, hnRNP G, hnRNP K, hnRNP M, hnRNP U, Hu, HUR, I hnRNP, K hnRNP, KH-유형 스플라이싱 조절 단백질(KSRP), L hnRNP, M hnRNP, mBBP, 머슬-블라인드 유사(MBNL), NF45, NFAR, Nova-1, Nova-2, nPTB, P54/SFRS11, 폴리피리미딘 트랙트 결합 단백질(PTB), PRP19 복합체 단백질, R hnRNP, RNPC1, SAM68, SC35, SF, SF1/BBP, SF2, SF3A, SF3B, SFRS10, Sm 단백질, SR 단백질, SRm300, SRp20, SRp30c, SRP35C, SRP36, SRP38, SRp40, SRp55, SRp75, SRSF, STAR, GSG, SUP-12, TASR-1, TASR-2, TIA, TIAR, TRA2, TRA2a/b, U hnRNP, U1 snRNP, U11 snRNP, U12 snRNP, U1-C, U2 snRNP, U2AF1-RS2, U2AF35, U2AF65, U4 snRNP, U5 snRNP, U6 snRNP, Urp, YB1, 또는 이의 임의의 조합을 포함하는 군으로부터 선택된 단백질 또는 이의 일부이다. 일부 구현예에서, 표적 폴리뉴클레오타이드 및 제1 결합제는 제1 복합체를 형성한다. 일부 구현예에서, 제1 복합체는 결합 포켓을 포함한다. 일부 구현예에서, 결합 포켓은 돌출부, 또는 돌연변이, 또는 스템-루프, 또는 이의 임의의 조합을 포함한다. 일부 구현예에서, 결합 포켓은 돌출부, 돌연변이, 또는 스템-루프를 포함하지 않는다. 일부 구현예에서, 돌출부 또는 돌연변이는 제1 폴리뉴클레오타이드에서 3차원적 구조 변화를 유발한다. 일부 구현예에서, 방법은 제2 결합제를 제1 복합체와 접촉시키는 단계를 추가로 포함한다. 일부 구현예에서, 제2 결합제는 폴리뉴클레오타이드, 폴리펩타이드, 단백질, 소분자, 이온, 염, 및 원자를 포함하는 군으로부터 선택된 하나 이상의 분자를 포함한다. 일부 구현예에서, 제2 결합제는 소분자이다. 일부 구현예에서, 소분자는 소분자의 라이브러리이다. 일부 구현예에서, 방법은 제2 결합제를 제1 복합체와 접촉시킨 후 제2 NMR 스펙트럼을 수득하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제1 및 제2 NMR 스펙트럼을 비교하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제1 및 제2 NMR 스펙트럼으로부터 하나 이상의 원자의 화학적 이동을 결정하는 단계를 추가로 포함한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 ABCA4, ABCB4, ABCD1, ACADSB, ADA, ADAMTS13, AGL, ALB, ALDH3A2, ALG6, APC, APOB, AR, ATM, ATP7A, ATR, B2M, BMP2K, BRCA1, BRCA2, BTK, C3, CAT, CD46, CDH1, CDH23, CFTR, CHM, COL11A1, COL11A2, COL1A1, COL1A2, COL2A1, COL3A1, COL4A5, COL6A1, COL6A3, COL7A1, COL9A2, COLQ, CUL4B, CYBB, CYP17, CYP19, CYP27, CYP27A1, DES, DMD, DYSF, EGFR, EMD, ETV4, F13A1, F5, F7, F8, FAH, FANCA, FANCC, FANCG, FBN1, FECH, FGA, FGFR2, FGG, FIX, FLNA, FOXM1, FRAS1, GALC, GH1, GHV, HADHA, HBA2, HBB, HEXA, HEXB, HLCS, HMBS, HMGCL, HNF1A, HPRT1, HPRT2, HSF4, HSPG2, HTT, IDS, IKBKAP, INSR, ITGB2, ITGB3, JAG1, KRAS, KRT5, L1CAM, LAMA3, LDLR, LMNA, LPL, MADD, MAPT, MLH1, MSH2, MST1R, MTHFR, MUT, MVK, NF1, NF2, OAT, OPA1, OTC, PAH, PBGD, PCCA, PDH1, PGK1, PHEX, PKD2, PKLR, PLEKHM1, PLKR, POMT2, PRDM1, PRKAR1A, PROC, PSEN1, PTCH1, PTEN, PYGM, RP6KA3, RPGR, RSK2, SBCAD, SCN5A, SERPINA1, SLC12A3, SLC6A8, SMN2, SPINK5, SPTA1, TP53, TRAPPC2, TSC1, TSC2, TSHB, UGT1A1, 및 USH2A로 이루어진 군으로부터 선택된 유전자 또는 이의 유전자 변이체에 의해 코딩되는 서열을 포함한다.
일부 양태에서, 본 개시내용은 (a) 표적 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드 샘플을 제공하는 단계; (b) NMR 장치를 사용하여 폴리뉴클레오타이드 샘플의 제1 NMR 스펙트럼을 수득하는 단계; (c) 결합제를 폴리뉴클레오타이드 샘플과 접촉시키는 단계; (d) 결합제와 접촉시킨 후 폴리뉴클레오타이드 샘플의 제2 NMR 스펙트럼을 수득하는 단계; 및 (e) 제1 및 제2 NMR 스펙트럼을 비교하는 단계; 및 (f) 비교에 기초하여 결합제를 선택하는 단계를 포함하는, 폴리뉴클레오타이드에 대한 결합제를 선택하는 방법을 제공한다. 일부 구현예에서, 결합제는 소분자, 폴리뉴클레오타이드, 또는 폴리펩타이드, 또는 이의 임의의 조합을 포함한다. 일부 구현예에서, 결합제는 소분자의 라이브러리를 포함한다. 일부 구현예에서, 폴리뉴클레오타이드 샘플은 제1 폴리뉴클레오타이드를 추가로 포함한다. 일부 구현예에서, 표적 폴리뉴클레오타이드 및 제1 폴리뉴클레오타이드는 거의 등몰량으로 첨가된다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 제1 RNA이다. 일부 구현예에서, 제1 RNA는 작은 핵 RNA(snRNA) 또는 이의 일부이다. 일부 구현예에서, snRNA는 U1, U2, U4, U5, U6, U11, U12, U4atac, U5, 또는 U6atac snRNA; 또는 이의 일부이다. 일부 구현예에서, 표적 및 제1 폴리뉴클레오타이드는 이합체(duplex)를 형성한다. 일부 구현예에서, 이합체는 결합 포켓을 함유한다. 일부 구현예에서, 결합 포켓은 돌출부, 또는 돌연변이, 또는 스템-루프, 또는 이의 임의의 조합을 포함한다. 일부 구현예에서, 결합 포켓은 돌출부, 돌연변이, 또는 스템-루프를 포함하지 않는다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 스플라이스 부위, 분기점(BP), 엑손 스플라이싱 인핸서(ESE), 엑손 스플라이싱 사일런서(ESS), 인트론 스플라이싱 인핸서(ISE), 인트론 스플라이싱 사일런서(ISS), 또는 폴리피리미딘 트랙트, 또는 이의 일부를 포함한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손 또는 이의 단편을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 인트론 또는 이의 단편을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손-인트론 경계를 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 8개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 25개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 최대 1000개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 100 내지 200개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 2H, 13C, 15N, 19F 및 31P를 포함하는 하나 이상의 원자 표지로 동위원소적으로 표지된 뉴클레오타이드를 포함하지 않거나 적어도 하나 포함한다. 일부 구현예에서, 방법은 제1 또는 제2 NMR 스펙트럼의 화학적 이동을 결정하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 폴리뉴클레오타이드 및 결합된 소분자의 3차원 원자 해상도 구조를 결정하는 단계를 추가로 포함한다. 일부 구현예에서, 3차원 원자 해상도 구조는 구조 예측 소프트웨어에 의해 결정된다. 일부 구현예에서, 구조 예측 소프트웨어는 Atnos/Candid-프로그램 묶음이다. 일부 구현예에서, 구조 예측 소프트웨어는 MC-fold | MC-Sym 파이프라인이다. 일부 구현예에서, 3차원 원자 해상도 구조를 결정하는 것은 뉴클레오타이드 서열 및 하나 이상의 2차원 구조 예측 알고리즘을 사용하여 복수의 이론적인 구조적 폴리뉴클레오타이드 2차원 모델을 생성하는 단계를 포함한다. 일부 구현예에서, 방법은 복수의 이론적인 구조적 폴리뉴클레오타이드 2차원 모델 및 선택적으로 하나 이상의 공지되고/거나 추정된 폴리뉴클레오타이드 2차원 모델을 사용하는 3차원 구조 예측 알고리즘을 사용하여 복수의 이론적인 구조적 폴리뉴클레오타이드 3차원 모델을 생성하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 복수의 이론적인 구조적 폴리뉴클레오타이드 3차원 모델 각각에 대해 예측된 화학적 이동 세트를 생성하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 예측된 화학적 이동 세트를 화학적 이동(들)과 비교하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 각각의 예측된 화학적 이동 세트 및 화학적 이동(들) 사이에 일치하는 하나 이상의 이론적인 구조적 폴리뉴클레오타이드 3차원 모델을 하나 이상의 3차원 원자 해상도 구조로서 선택하는 단계를 추가로 포함한다. 일부 구현예에서, 2차원 구조 예측 알고리즘은 최근접 이웃 알고리즘이다. 일부 구현예에서, 방법은 에너지 최소화 및/또는 분자 동역학 시뮬레이션을 포함하는 하나 이상의 기능을 수행하는 모델링 소프트웨어를 사용하여 선택된 하나 이상의 이론적인 구조적 폴리뉴클레오타이드 3차원 모델을 개선함으로써 하나 이상의 개선된 3차원 원자 해상도 구조를 생성하는 단계를 추가로 포함한다. 일부 구현예에서, 예측된 화학적 이동 세트는 각각의 이론적인 구조적 폴리뉴클레오타이드 3차원 모델을 NMR 데이터-구조 데이터베이스와 비교함으로써 생성된다. 일부 구현예에서, 예측된 화학적 이동 세트를 생성하는 것은 하나 이상의 실험적으로 결정된 폴리뉴클레오타이드 3차원 구조로부터 원자 좌표, 적층 결합, 자화율, 전자기장, 또는 이면각을 포함한 폴리뉴클레오타이드 구조적 지표(structural metric)를 계산하는 단계를 포함한다. 일부 구현예에서, 방법은 회귀 알고리즘을 사용하여 실험적 화학적 이동 및 실험적으로 결정된 3차원 폴리뉴클레오타이드 구조의 폴리뉴클레오타이드 구조적 지표 사이의 관계를 설명하는 수학적 함수 또는 객체의 세트를 생성하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 이론적인 구조적 폴리뉴클레오타이드 3차원 모델 각각에 대한 폴리뉴클레오타이드 구조적 지표를 계산하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 이론적인 구조적 폴리뉴클레오타이드 3차원 모델 각각에 대한 폴리뉴클레오타이드 구조적 지표를 수학적 함수 또는 객체의 세트에 입력하여 예측된 화학적 이동 세트를 생성하는 단계를 추가로 포함한다. 일부 구현예에서, 회귀 알고리즘은 랜덤 포레스트(Random Forest) 알고리즘을 포함하는 기계 학습 알고리즘이다. 일부 구현예에서, NMR 스펙트럼은 약 1 GHz MHz 내지 약 20 MHz 범위의 NMR 분광계 주파수로 수득된다. 일부 구현예에서, NMR 스펙트럼은 500 MHz 내지 900 MHz 범위의 NMR 분광계 주파수로 수득된다. 일부 구현예에서, NMR 장치는 AVANCE III이다. 일부 구현예에서, 방법은 단계 (f)로부터 선택된 결합제를 갖거나 갖지 않는 표적 폴리뉴클레오타이드에 결합하는 snRNA의 결합 동역학을 결정하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 단계 (f)로부터 선택된 결합제를 갖거나 갖지 않는 표적 폴리뉴클레오타이드에 결합하는 snRNP의 결합 동역학을 결정하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 단계 (f)로부터 선택된 결합제를 가지고 결정된 결합 동역학 및 결합제를 갖지 않고 결정된 결합 동역학을 비교하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제1 소분자 및 제2 소분자를 선택하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제1 소분자를 갖거나 갖지 않는 표적 폴리뉴클레오타이드에 결합하는 snRNA의 제1 결합 동역학, 및 제2 소분자를 갖거나 갖지 않는 표적 폴리뉴클레오타이드에 결합하는 snRNA의 제2 결합 동역학을 결정하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제1 결합 동역학 및 제2 결합 동역학을 비교하는 단계를 추가로 포함한다. 일부 구현예에서, 결합 동역학은 표면 플라즈몬 공명(SPR), 생물층 간섭계(BLI) 기술(Octet Systems), 등온 적정 열량 측정법(ITC), 또는 형광 이방성에 의해 결정된다. 일부 구현예에서, 방법은 제1 소분자 및 제2 소분자의 2차원 모델 또는 3차원 구조를 결정하는 단계를 포함한다. 일부 구현예에서, 방법은 제1 및 제2 소분자의 2차원 모델 또는 3차원 구조를 비교하는 단계를 포함한다.
일부 양태에서, 본 개시내용은 표적 폴리뉴클레오타이드 및 제1 폴리뉴클레오타이드에 의해 형성된 하나 이상의 결합 포켓을 확인하는 단계로서, 표적 폴리뉴클레오타이드는 스플라이스 부위, 분기점(BP), 엑손 스플라이싱 인핸서(ESE), 엑손 스플라이싱 사일런서(ESS), 인트론 스플라이싱 인핸서(ISE), 인트론 스플라이싱 사일런서(ISS), 또는 폴리피리미딘 트랙트, 또는 이의 임의의 조합의 서열을 함유하는 것인 단계; 및 하나 이상의 결합 포켓에 대해 하나 이상의 소분자 또는 이의 단편을 가상으로 스크리닝하는 단계로서, 가상 스크리닝 과정은 추정되는 소분자 또는 단편 히트(hit)를 확인하는 것인 단계를 포함하는 방법을 제공한다. 일부 구현예에서, 하나 이상의 결합 포켓을 확인하는 것은 표적 폴리뉴클레오타이드 및 제1 폴리뉴클레오타이드를 포함하는 3차원 원자 해상도 구조를 해석하는 단계를 포함한다. 일부 구현예에서, 3차원 원자 해상도 구조는 NMR 스펙트럼에 의해 결정된다. 일부 구현예에서, 방법은 실험 분석을 사용하여 가상 스크린으로부터 하나 이상의 소분자 또는 단편 히트를 시험하는 단계를 추가로 포함한다. 일부 구현예에서, 실험 분석은 표면 플라즈몬 공명(SPR), 생물층 간섭계(BLI) 기술(Octet Systems), 등온 적정 열량 측정법(ITC), 또는 형광 이방성이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 RNA이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 전구-mRNA이다. 일부 구현예에서, 스플라이스 부위는 5' 스플라이스 부위, 잠재 5' 스플라이스 부위, 3' 스플라이스 부위, 또는 잠재 3' 스플라이스 부위이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 인트론 또는 이의 단편을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손 또는 이의 단편을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손-인트론 경계를 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 8개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 25개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 최대 1000개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 100 내지 200개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 ABCA4, ABCB4, ABCD1, ACADSB, ADA, ADAMTS13, AGL, ALB, ALDH3A2, ALG6, APC, APOB, AR, ATM, ATP7A, ATR, B2M, BMP2K, BRCA1, BRCA2, BTK, C3, CAT, CD46, CDH1, CDH23, CFTR, CHM, COL11A1, COL11A2, COL1A1, COL1A2, COL2A1, COL3A1, COL4A5, COL6A1, COL6A3, COL7A1, COL9A2, COLQ, CUL4B, CYBB, CYP17, CYP19, CYP27, CYP27A1, DES, DMD, DYSF, EGFR, EMD, ETV4, F13A1, F5, F7, F8, FAH, FANCA, FANCC, FANCG, FBN1, FECH, FGA, FGFR2, FGG, FIX, FLNA, FOXM1, FRAS1, GALC, GH1, GHV, HADHA, HBA2, HBB, HEXA, HEXB, HLCS, HMBS, HMGCL, HNF1A, HPRT1, HPRT2, HSF4, HSPG2, HTT, IDS, IKBKAP, INSR, ITGB2, ITGB3, JAG1, KRAS, KRT5, L1CAM, LAMA3, LDLR, LMNA, LPL, MADD, MAPT, MLH1, MSH2, MST1R, MTHFR, MUT, MVK, NF1, NF2, OAT, OPA1, OTC, PAH, PBGD, PCCA, PDH1, PGK1, PHEX, PKD2, PKLR, PLEKHM1, PLKR, POMT2, PRDM1, PRKAR1A, PROC, PSEN1, PTCH1, PTEN, PYGM, RP6KA3, RPGR, RSK2, SBCAD, SCN5A, SERPINA1, SLC12A3, SLC6A8, SMN2, SPINK5, SPTA1, TP53, TRAPPC2, TSC1, TSC2, TSHB, UGT1A1, 및 USH2A로 이루어진 군으로부터 선택된 유전자 또는 이의 유전자 변이체에 의해 코딩되는 서열을 포함한다. 일부 구현예에서, 방법은 제1 추정되는 소분자 또는 및 제2 추정되는 소분자를 확인하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 표적 폴리뉴클레오타이드에 결합하는 제1 추정되는 소분자 또는 단편 히트의 제1 결합 동역학, 및 표적 폴리뉴클레오타이드에 결합하는 제2 추정되는 소분자 또는 단편 히트의 제2 결합 동역학을 결정하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제1 결합 동역학 및 제2 결합 동역학을 비교하여, 더 강한 소분자 또는 단편 히트를 선택하는 단계를 추가로 포함한다. 일부 구현예에서, 결합 동역학은 표면 플라즈몬 공명(SPR), 생물층 간섭계(BLI) 기술(Octet Systems), 등온 적정 열량 측정법(ITC), 또는 형광 이방성을 사용하여 결정된다.
일부 양태에서, 본 개시내용은 표적 폴리뉴클레오타이드를 함유하는 샘플에 결합제를 접촉시키는 단계로서, 표적 폴리뉴클레오타이드는 스플라이스 부위, 분기점(BP), 엑손 스플라이싱 인핸서(ESE), 엑손 스플라이싱 사일런서(ESS), 인트론 스플라이싱 인핸서(ISE), 인트론 스플라이싱 사일런서(ISS), 또는 폴리피리미딘 트랙트, 또는 이의 임의의 조합을 함유하는 것인 단계, 제1 분석에서 결합제 및 표적 폴리뉴클레오타이드의 구조를 수득하는 단계; 제2 분석에서 결합제의 결합 동역학을 수득하는 단계; 및 구조 및 결합 동역학에 기초하여 결합제를 선택하는 단계를 포함하는, 표적 폴리뉴클레오타이드에 대한 결합제를 선택하는 방법을 제공한다. 일부 구현예에서, 제1 분석 및 제2 분석은 동일하다. 일부 구현예에서, 제1 분석 및 제2 분석은 NMR이다. 일부 구현예에서, 제1 분석은 NMR이고, 제2 분석은 표면 플라즈몬 공명(SPR), 생물층 간섭계(BLI) 기술(Octet Systems), 등온 적정 열량 측정법(ITC), 또는 형광 이방성이다. 일부 구현예에서, 결합제는 소분자이다. 일부 구현예에서, 샘플은 제1 폴리뉴클레오타이드를 추가로 포함한다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 RNA이다.
일부 구현예에서, RNA는 작은 핵 RNA(snRNA) 또는 이의 일부이다. 일부 구현예에서, snRNA는 U1, U2, U4, U5, U6, U11, U12, U4atac, U5, 또는 U6atac snRNA; 또는 이의 일부이다. 일부 구현예에서, 표적 및 제1 폴리뉴클레오타이드는 이합체를 형성한다. 일부 구현예에서, 이합체는 결합 포켓을 함유한다. 일부 구현예에서, 결합 포켓은 돌출부, 또는 돌연변이, 또는 스템-루프, 또는 이의 임의의 조합을 포함한다. 일부 구현예에서, 결합 포켓은 돌출부, 돌연변이, 또는 스템-루프를 포함하지 않는다. 일부 구현예에서, 샘플은 단백질 또는 이의 일부를 추가로 포함한다. 일부 구현예에서, 단백질은 리보핵산단백질이다. 일부 구현예에서, 리보핵산단백질은 작은 핵 리보핵산단백질(snRNP) 또는 이의 일부이다. 일부 구현예에서, snRNP는 U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP, U11 snRNP, U12 snRNP, U4atac snRNP, U5 snRNP, U6atac snRNP 또는 이의 일부이다. 일부 구현예에서, 단백질은 9G8, A1 hnRNP, A2 hnRNP, ASD-1, ASD-2b, ASF, B1 hnRNP, C1 hnRNP, C2 hnRNAP, CBP20, CBP80, CELF, F hnRNP, FBP11, Fox-1, Fox-2, G hnRNP, H hnRNP, hnRNP 1, hnRNP 3, hnRNP C, hnRNP G, hnRNP K, hnRNP M, hnRNP U, Hu, HUR, I hnRNP, K hnRNP, KH-유형 스플라이싱 조절 단백질(KSRP), L hnRNP, M hnRNP, mBBP, 머슬-블라인드 유사(MBNL), NF45, NFAR, Nova-1, Nova-2, nPTB, P54/SFRS11, 폴리피리미딘 트랙트 결합 단백질(PTB), PRP19 복합체 단백질, R hnRNP, RNPC1, SAM68, SC35, SF, SF1/BBP, SF2, SF3A, SF3B, SFRS10, Sm 단백질, SR 단백질, SRm300, SRp20, SRp30c, SRP35C, SRP36, SRP38, SRp40, SRp55, SRp75, SRSF, STAR, GSG, SUP-12, TASR-1, TASR-2, TIA, TIAR, TRA2, TRA2a/b, U hnRNP, U1 snRNP, U11 snRNP, U12 snRNP, U1-C, U2 snRNP, U2AF1-RS2, U2AF35, U2AF65, U4 snRNP, U5 snRNP, U6 snRNP, Urp, YB1, 또는 이의 임의의 조합을 포함하는 군으로부터 선택된다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 GGA/gtgagu, AGA/gugagu, AGA/gugagu, AGA/gugagu, AGA/gugagu, AGA/gugagu, AGA/gugagc, AGA/gugagu, AGA/gugagu, GGA/gugagu, CGA/guccgu, GGAguaagu, GGA/guaagu, AGA/guaagu, AGA/guaagu, AGA/guaagu, AGA/guaagu, AGA/guaagu, AGA/guaagu, AGA/guaaga, AGA/guaagu, AGA/guaagu, AGA/guaagu, GGA/guaagu, AGA/guaagg, AGA/guaagu, AGA/guaagu, AGA/guaagu, GGA/guaagu, AGA/guaaga, AGA/guaagu, AGA/guaagu, AGA/guaagu, GGA/guaagg, AGA/guaagu, AGA/guaagu, GGA/guaagu, AGA/guaagu, AGA/guaaga, AGA/guaagu, AGA/guagau, UGA/gugaau, GGA/guuagu, AGA/guaggu, AGA/guaggu, GGA/guaggu, 또는 AGA/gugcgu를 포함한다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 ACA/gugagg, AAA/auaagu, GAA/ggaagu, GAA/guaaau, GCA/guagga, CAA/gugagu, GUA/gugagu, GAA/guggg, CCA/guaaac, UUA/guaaau, CAA/guaaac, ACA/guaaau, GAA/guaaac, UCA/guaaac, UCA/guaaau, GCA/guaaau, ACA/guaaau, CAA/gcaag, CAA/guaagg, UCA/guaagu, AUA/gugaau, CAA/gugaaa, CCA/gugaga, UCA/gugauu, GAA/gugugu, GAA/uaaguu, CAA/guaugu, AAA/guaugu, CAA/guauuu, ACA/guuagu, GCA/guuagu, 또는 ACA/guuuga를 포함한다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 CAA/guaacu, AUA/gucagu, GAA/gucugg, 또는 AAA/guacau를 포함한다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 NNBgunnnn, NNBhunnnn, 또는 NNBgvnnnn을 포함하며, 여기서 N/n은 A, U, G 또는 C이고; B는 C, G, 또는 U이며; h는 a, c, 또는 u이고; v는 a, c 또는 g이다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 NNBgurrrn, NNBguwwdn, NNBguvmvn, NNBguvbbn, NNBgukddn, NNBgubnbd, NNBhunngn, NNBhurmhd, 또는 NNBgvdnvn을 포함하며, 여기서 N/n은 A, U, G 또는 C이고; B는 C, G, 또는 U이며; h는 a, c, 또는 u이고; v는 a, c 또는 g이며; r은 a 또는 g이고; m은 a 또는 c이며; d는 a, g 또는 u이고; k는 g 또는 u이며; w는 a 또는 u이다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 CAC/gugagc, UCC/gugagc, AGC/gugagu, AGC/gugagu, AGG/gugagg, GUG/gugagc, GAG/gugagg, CCG/gugagg, UUG/gugagc, GUG/gugagu, UUU/gugagc, UUU/gugagc, GAU/gugagg, AGU/gugagu, AGU/gugagu, AGU/gugagu, AGU/gugagu, AGC/guaagu, GGC/guaagu, AAC/guaagu, GGC/guaagu, AGC/guaagg, GGC/guaagu, AGC/guaagu, GGC/guaagu, GGC/guaagu, AGC/guaagu, GAG/guaaga, CAG/guaagu, AGU/guaagc, AAU/guaagc, AAU/guaagg, CCU/guaagc, AGU/guaagu, GGU/guaagu, AGU/guaagu, AGU/guaagu, AGU/guaagu, GAU/guaagu, UCC/gugaau, CCG/gugaau, ACG/gugaac, CUG/gugaau, AGG/gugaau, UUG/gugaau, CCG/gugaau, GAG/gugaag, CCU/gugaau, CGU/gugaau, CCU/gugaau, GAG/guagga, CAU/guaggg, UGG/guggau, CAG/guggau, UGG/guggau, CGG/gugggu, GCG/guggga, UGG/guggggg, UGG/gugggug, CGU/gugggu, AUC/gguaaaa, GGG/guaaau, GCG/guaaaa, CAG/guaaag, UGG/guaaag, AAG/guaaag, AAG/guaaau, CAG/guaaag, UAG/guaaag, UUG/guaaag, GAG/guaaag, CAG/guaaag, AUG/guaaaa, AAG/guaaag, CAG/guaaag, CAG/guaaaa, GAG/guaaag, AAG/guaaag, UGU/guaaau, GUU/guaaau, GUU/guaaau, UCU/guaaau, GCU/guaaau, GAU/guaaau, GCU/guaaau, UCU/guaaau, ACU/guaaau, CCU/guaaau, CCU/guaaau, ACU/guaaau, AAU/guaaau, AGG/guagac, UUG/guagau, CAG/guagag, AAG/guagag, AAU/gugagu, CAG/gugagc, AAG/gugggu, AAG/guaggg, CAG/guaggc, 또는 AGC/guaggu를 포함한다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 CAG/guaau, CAG/guaaugu, CAG/guaaugu, CAG/guaaugu, CAG/guaaugu, GAG/guaauac, GAG/guaauau, GAG/guaaugu, AAG/guaauaa, AAG/guaaugu, AAG/guaaugu, AAG/guaaugua, AAG/guaaugu, AAG/guaaugu, GCU/guaauu, CCU/guaauu, GAU/guaauu, CAU/guaauu, AAU/guaauu, AGG/guauau, CAG/guauau, UAG/guauau, CAG/guauau, CGG/guauau, GAG/guauau, CGG/guauau, CAG/guauag, AAG/guauau, CAG/guauag, AAG/guauac, UAG/guauau, CAG/guauag, CAG/guauau, AAG/guuaag, AUC/guuaga, GCG/guuagu, AAG/guuagc, UGG/guuagu, GCG/guuagu, CUG/guuugu, CUG/guauga, CAG/guauga, UAG/guauga, AAG/guaugg, AAG/guauga, GAG/guaugg, CAG/guauga, CAG/guaugg, AAG/guaugg, UGG/guaugc, CAG/guaugu, AUG/guaugu, AAG/guaugu, AAG/guaugg, CAG/guaugg, GAG/guauga, CGG/guaugg, AAU/guaugu, AAG/guauuu, AUG/guauuu, UAG/guauug, AAG/guauuu, CAG/guauug, CAG/guauug, CAU/guauuu, ACU/guauu, AAG/guuuau, AAG/guuuaa, CAG/guuugg, CAG/guuugg, CAG/guuugc, AAG/guuugg, AAG/guuugg, 또는 UGG/guaugc를 포함한다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 CCG/guaacu, UUG/guaaca, AUG/guaacc, GGG/guaacu, AAG/guaaca, AAG/guaacu, UUG/guaaca, GCU/guaacu, ACU/guaacu, GCU/guaacu, UAG/guaccc, AAG/guaccu, CAG/guaccg, UGG/guacca, CAG/gucaau, AAG/gucaau, AAG/gucaag, AUG/guacau, GGG/guacau, UUG/guacau, CAG/guacag, CAG/guacag, CAG/guacag, CAG/guacag, AAG/guacag, CAG/guacag, GAG/guacaa, AAG/guacag, CAG/guacaa, UGU/guacau, CAG/gugcac, GGG/gugcau, CUG/gugcau, UAG/gugcau, CAG/gugcag, CAG/gugcag, AGG/gugcaa, AAC/gugacu, UCC/gugacu, CCG/gugacu, GCG/gugacu, GGG/gugacg, GGG/gugacg, GCG/gugacu, AUG/gugacc, GAU/gugacu, GGC/gucagu, 또는 UAG/gucaga를 포함한다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 AAG/guacgg, AAG/guacgg, AAG/guacug, AAG/guagcg, AAG/guagua, AAG/guagua, AAG/guagua, AAG/guagug, AAG/guauca, AAG/guaucg, AAG/guaucu, AAG/gucucu, AAG/gugccu, AAG/guggua, AAG/guguua, ACG/guagcu, AGC/guacgu, CAG/guacug, CAG/guagua, CAG/guagug, CAG/guagug, CAG/guaucc, CAG/gugcgc, 또는 GAG/gugccu를 포함한다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 CGG/guguau, AAG/guguau, GAG/guguac, CAG/guguau, UAG/guguau, CAG/guguag, GAG/guguau, AAG/gugugc, CAG/guguga, AAG/gugugu, CAG/guguga, CAG/gugugu, UGG/gugugg, CUG/guguga, CGG/gugugu, GAG/gugugc, CAG/guguga, AAU/gugugu, CAG/gugugu, CAG/gugugu, GAG/gugugu, CAG/guuguu, CAG/guuguc, GUG/guugua, CAG/guuguu, AAC/gugauu, CAG/gugaua, AGG/gugauc, GUG/gugauc, CCU/gugauu, GAU/gugauu, CAC/guuggu, CAG/guuggc, AAG/guuagc, 또는 CAG/guugau를 포함한다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 AUG/gucauu, CGG/gucauaauc, AAG/gucugu, AAG/gucuggg, CAG/gucugga, CAG/gucuggu, CAG/gucuga, GAG/gucuggu, AAG/gugucu, AAG/gugucu, AGG/gugucu, CUG/gugcuu, CAG/gucuuu, CAG/guugcu, GAG/gugcug, 또는 CAG/gugcug를 포함한다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 CGC/auaagu, UUC/auaagu, UGG/auaagg, ACG/auaagg, GUU/auaagu, CCU/auaagu, UUU/auaagc, GAG/aucugg, AAC/augagga, GAC/augagg, ACC/augagu, GGG/augagu, AAG/augagc, CAG/augagg, GAG/augagg, GCG/augagu, AAG/gaugag, CCU/augagu, GAU/augagu, GAU/augagu, UAG/augcgu, CAG/auuggu, AAG/auuugu, ACG/cuaagc, CAG/cugugu, CUG/uuaag, GAG/uuaagu, AAG/uuaagg, AUU/uuaagc, CUG/uugaga, CAG/uuuggu, 또는 GGG/auaagu를 포함한다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 CAG/auaacu, GAG/cugcag, 또는 AAG/uuaaua를 포함한다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 GCG/gagagu, AAG/ggaaaa, AUC/gguaaaa, AAG/gcaaaa, UGU/gcaagu, GAG/gcaggu, GAG/gcgugg, GAG/gcuccc, CAG/gcuggu, 또는 AAG/gaugag를 포함한다.
본 발명의 신규한 특징은 특히 첨부된 청구범위에 제시되어 있다. 본 발명의 특징 및 이점은 본 발명의 원리가 이용되는 예시적인 구현예를 제시하는 하기의 상세한 설명, 및 첨부 도면을 참조하여 더 잘 이해될 것이다:
도 1은 BLI에 의한 예시적인 결합 동역학 분석을 도시한다.
도 2는 본 개시내용의 다양한 구현예에서 사용될 수 있는 예시적인 표적 RNA-RNA 이합체를 도시한다.
도 3은 본 개시내용에 기재된 선택된 소분자 결합제의 효과를 시험하는 세포 기반 분석의 예시적인 결과를 도시한다.
도 4A-F NMR 또는 동역학 연구를 위한 하나 이상의 결합제에 결합하는 표적 폴리뉴클레오타이드 결합의 예시적인 결합 사건을 도시한다. 제1 결합제 및 제2 결합제 모두는 하나 이상의 분자를 포함할 수 있다. 둘 이상의 분자가 결합제에 포함되는 경우, 이들 분자는 동시에 또는 순차적으로 첨가될 수 있다.
도 5A는 SMN2 RNA 이합체의 개략도를 도시한다. 상부 가닥은 U1 snRNA 5'-말단에 해당한다. 하부 가닥은 SMN2 엑손7의 5'-스플라이스 부위에 해당한다.
도 5B는 실시예 화합물(화합물-A)의 구조를 도시한다.
도 5C 화합물 A 농도의 함수로서 RNA 이합체(이미노 영역)의 1D 1H 스펙트럼의 오버레이(좌측) 및 화합물 A 농도의 함수로서 RNA(피리미딘 영역)의 2D 1H-1H TOCSY 스펙트럼의 오버레이(우측)를 나타내는 실험적 NMR 데이터를 도시한다. 비율 RNA 이합체:화합물 A가 나타나 있다.
도 6A는 관찰된 화학적 이동과 함께 양성자(또는 유사원자(pseudoatom))의 이름이 예시된 화합물 A의 평면 구조를 도시한다.
도 6B는 확인된 분자간 핵 오버하우저 효과(nuclear Overhauser effect, NOE)가 예시된 화합물 A의 평면 구조를 도시한다.
도 6C 분자간 NOE에 주석이 달린 2D 1H-1H NOESY의 부분을 나타내는 실험적 NMR 데이터를 도시한다.
본원에 사용된 용어는 단지 특정 예시적인 구현예를 설명하기 위한 것이며 제한하고자 하는 것이 아니다. 본원에 사용된 바와 같이, 단수형 "a", "an" 및 "the"는 문맥이 달리 명확하게 나타내지 않는 한 복수형을 포함하는 것으로 의도될 수 있다. 따라서, 예를 들어, "결합제"에 대한 언급은 결합제의 혼합물을 포함하고; "NMR 공명"에 대한 언급은 둘 이상의 공명 등을 포함한다. 용어 "포함하다(comprises)," "포함하는(comprising)," "포함하는(including)," 및 "갖는(having)"은 포괄적이며, 따라서 언급된 특징, 물품, 단계, 동작, 요소, 및/또는 구성요소의 존재를 명시하지만, 하나 이상의 다른 특징, 물품, 단계, 동작, 요소, 구성요소, 및/또는 이의 그룹의 존재 또는 추가를 배제하지는 않는다. 본원에 기재된 방법 단계, 과정, 및 동작은, 수행 순서로 명시적으로 식별되지 않는 한, 논의되거나 예시된 특정 순서로 이들을 수행하는 것을 반드시 요구하는 것으로 해석되지 않아야 한다. 또한 추가적인 또는 대안적인 단계가 이용될 수 있음이 이해되어야 한다.
일 양태에서, 표적 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드 샘플을 제공하는 단계; 표적 폴리뉴클레오타이드에 제1 결합제, 제2 결합제, 또는 둘 모두를 접촉시키는 단계로서; 표적 폴리뉴클레오타이드 및 제1 결합제는 제1 복합체를 형성하고, 제2 결합제 및 제1 복합체는 제2 복합체를 형성하는 것인 단계; 및 NMR 장치를 사용하여 제1 복합체, 제2 복합체, 또는 둘 모두의 핵자기 공명(NMR) 스펙트럼을 수득하는 단계를 포함하는 방법이 본원에 제공된다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 표적 리보핵산(RNA)이다. 일부 구현예에서, 표적 RNA는 전구체 메신저 RNA(전구-mRNA) 또는 이의 일부이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 스플라이스 부위 또는 이의 일부를 함유한다. 일부 구현예에서, 스플라이스 부위는 5' 스플라이스 부위, 잠재 5' 스플라이스 부위, 3' 스플라이스 부위, 또는 잠재 3' 스플라이스 부위, 또는 이의 일부이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 분기점(BP), 엑손 스플라이싱 인핸서(ESE), 엑손 스플라이싱 사일런서(ESS), 인트론 스플라이싱 인핸서(ISE), 인트론 스플라이싱 사일런서(ISS), 또는 폴리피리미딘 트랙트, 또는 이의 임의의 조합을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 인트론 또는 이의 단편을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손 또는 이의 단편을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손-인트론 경계를 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 8개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 25개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 최대 1000개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 100 내지 200개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 2H, 13C, 15N, 19F 및 31P를 포함하는 하나 이상의 원자 표지로 동위원소적으로 표지된 뉴클레오타이드를 포함하지 않거나 적어도 하나 포함한다. 일부 구현예에서, 제1 결합제는 제1 폴리뉴클레오타이드, 제1 폴리펩타이드, 또는 이의 조합을 포함한다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 제1 RNA이다. 일부 구현예에서, 제1 RNA는 작은 핵 RNA(snRNA) 또는 이의 일부이다. 일부 구현예에서, 제1 폴리펩타이드는 단백질-RNA 복합체의 단백질 또는 단백질 구성요소이다. 일부 구현예에서, 폴리펩타이드는 트랜스-작용 인자의 단백질 또는 단백질 구성요소이다. 일부 구현예에서, 폴리펩타이드는 RNA 스플라이싱과 관련된 단백질의 일부, 예컨대 도메인 또는 서브도메인이다. 일부 구현예에서, 폴리펩타이드는 SR, TRA2, SF, SRSF, U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP, U11 snRNP, U12 snRNP, U1-C, Sm 단백질, FBP11, SF3A, SF3B, U2AF65, U2AF35, PRP19 복합체 단백질, hnRNP 1, hnRNP 3, hnRNP C, hnRNP G, hnRNP K, hnRNP M, hnRNP U, ASF, SF2, 9G8, SRP20, TRA2a/b, SRP36, SRP35C, SRP30C, SRP38, SRP40, SRP55, SRP75, HUR, NFAR, NF45, YB1, 및 접합 복합체 단백질(junction complex protein)을 포함하는 군으로부터 선택된 하나의 단백질의 단백질 구성요소 또는 이의 일부이다. RNA 스플라이싱과 관련된 다른 예시적인 단백질은 mBBP, 폴리피리미딘 트랙트 결합 단백질(PTB), nPTB, KH-유형 스플라이싱 조절 단백질(KSRP), SAM68, STAR/GSG, ASD-2b, ASD-1, SUP-12, RNPC1, ASF, snRNP 보조 인자-35(U2AF35), ASF/SF2, Nova-1/2, Fox-1/2, 머슬-블라인드 유사(MBNL), CELF, Hu, TIA, TIAR, 및 이들의 별칭을 포함한다. 일부 구현예에서, 제1 폴리펩타이드는 리보핵산단백질의 단백질 구성요소 또는 이의 일부이다. 일부 구현예에서, 리보핵산단백질은 작은 핵 리보핵산단백질(snRNP) 또는 이의 일부이다. 일부 구현예에서, snRNP는 U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP, U11 snRNP, U12 snRNP, U4atac snRNP, U5 snRNP, U6atac snRNP 또는 이의 일부이다. 일부 구현예에서, 제2 결합제는 소분자이다. 일부 구현예에서, 제1 결합제는 소분자를 포함한다. 일부 구현예에서, 제2 결합제는 제2 폴리뉴클레오타이드, 제2 폴리펩타이드, 또는 이의 조합을 포함한다. 일부 구현예에서, 제2 폴리뉴클레오타이드는 제2 RNA이다. 일부 구현예에서, 제2 RNA는 작은 핵 RNA(snRNA) 또는 이의 일부이다. 일부 구현예에서, 제2 폴리펩타이드는 리보핵산단백질의 단백질 구성요소 또는 이의 일부이다. 일부 구현예에서, 리보핵산단백질은 작은 핵 리보핵산단백질(snRNP) 또는 이의 일부이다. 일부 구현예에서, snRNP는 U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP, U11 snRNP, U12 snRNP, U4atac snRNP, U5 snRNP, U6atac snRNP 또는 이의 일부이다. 일부 구현예에서, 제1 복합체는 결합 포켓을 포함한다. 일부 구현예에서, 결합 포켓은 돌출부, 또는 돌연변이, 또는 스템-루프, 또는 이의 임의의 조합을 포함한다. 일부 구현예에서, 결합 포켓은 스템-루프 구조에 인접한 영역 또는 서열을 포함한다. 일부 구현예에서, 결합 포켓은 돌출부, 돌연변이, 또는 스템-루프를 포함하지 않는다. 일부 구현예에서, 돌출부 또는 돌연변이는 제1 폴리뉴클레오타이드에서 3차원적 구조 변화를 유발한다. 일부 구현예에서, 결합 포켓을 표적화하는 결합제는 결합 포켓에 결합시에 3차원적 구조 변화를 유도할 수 있다. 일부 구현예에서, 제2 결합제는 결합 포켓에 결합한다. 일부 구현예에서, 전구-mRNA는 ABCA4, ABCB4, ABCD1, ACADSB, ADA, ADAMTS13, AGL, ALB, ALDH3A2, ALG6, APC, APOB, AR, ATM, ATP7A, ATR, B2M, BMP2K, BRCA1, BRCA2, BTK, C3, CAT, CDH1, CDH23, CFTR, CHM, COL11A1, COL11A2, COL1A1, COL1A2, COL2A1, COL3A1, COL4A5, COL6A1, COL6A3, COL7A1, COL9A2, COLQ, CUL4B, CYBB, CYP17, CYP19, CYP27, CYP27A1, DES, DMD, DYSF, EGFR, EMD, ETV4, F13A1, F5, F7, F8, FAH, FANCA, FANCC, FANCG, FBN1, FECH, FGA, FGFR2, FGG, FIX, FLNA, FOXM1, FRAS1, GALC, GH1, GHV, HADHA, HBA2, HBB, HEXA, HEXB, HLCS, HMBS, HMGCL, HNF1A, HPRT1, HPRT2, HSF4, HSPG2, HTT, IDS, IKBKAP, INSR, ITGB2, ITGB3, JAG1, KRAS, KRT5, L1CAM, LAMA3, LDLR, LMNA, LPL, MADD, MAPT, MLH1, MSH2, MST1R, MTHFR, MUT, MVK, NF1, NF2, OAT, OPA1, OTC, PAH, PBGD, PCCA, PDH1, PGK1, PHEX, PKD2, PKLR, PLEKHM1, PLKR, POMT2, PRDM1, PRKAR1A, PROC, PSEN1, PTCH1, PTEN, PYGM, RP6KA3, RPGR, RSK2, SBCAD, SCN5A, SERPINA1, SLC12A3, SLC6A8, SMN2, SPINK5, SPTA1, TP53, TRAPPC2, TSC1, TSC2, TSHB, UGT1A1, CD46, 및 USH2A로 이루어진 군으로부터 선택된 유전자 또는 이의 유전자 변이체에 의해 코딩되는 서열을 포함한다. 일부 구현예에서, 제1 NMR 스펙트럼은 제1 복합체에 대해 수득되고, 제2 NMR 스펙트럼은 제2 복합체에 대해 수득된다. 일부 구현예에서, 방법은 제1 및 제2 NMR 스펙트럼을 비교하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제1 및 제2 NMR 스펙트럼의 비교에 기초하여 제2 결합제를 선택하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제1 및 제2 NMR 스펙트럼의 화학적 이동을 결정하는 단계를 추가로 포함한다.
일 양태에서, 표적 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드 샘플을 제공하는 단계로서, 표적 폴리뉴클레오타이드는 스플라이스 부위, 분기점(BP), 엑손 스플라이싱 인핸서(ESE), 엑손 스플라이싱 사일런서(ESS), 인트론 스플라이싱 인핸서(ISE), 인트론 스플라이싱 사일런서(ISS), 또는 폴리피리미딘 트랙트, 또는 이의 임의의 조합을 포함하는 것인 단계; 제1 결합제를 표적 폴리뉴클레오타이드와 접촉시키는 단계; 및 NMR 장치를 사용하여 폴리뉴클레오타이드 샘플의 제1 NMR 스펙트럼을 수득하는 단계를 포함하는 방법이 본원에 제공된다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 표적 RNA이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 전구-mRNA 또는 이의 일부이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손 또는 이의 단편을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 인트론 또는 이의 단편을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 엑손-인트론 경계를 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 스플라이스 부위 또는 이의 일부를 함유한다. 일부 구현예에서, 스플라이스 부위는 5' 스플라이스 부위, 잠재 5' 스플라이스 부위, 3' 스플라이스 부위, 또는 잠재 3' 스플라이스 부위, 또는 이의 임의의 조합이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 8개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 25개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 최대 1000개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 2H, 13C, 15N, 19F 및 31P를 포함하는 하나 이상의 원자 표지로 동위원소적으로 표지된 뉴클레오타이드를 포함하지 않거나 적어도 하나 포함한다. 일부 구현예에서, 제1 결합제는 제1 폴리뉴클레오타이드, 제1 폴리펩타이드, 또는 이의 조합을 포함한다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 제1 RNA이다. 일부 구현예에서, 제1 RNA는 작은 핵 RNA(snRNA) 또는 이의 일부이다. 일부 구현예에서, 제1 폴리펩타이드는 리보핵산단백질의 단백질 구성요소 또는 이의 일부이다. 일부 구현예에서, 리보핵산단백질은 작은 핵 리보핵산단백질(snRNP) 또는 이의 일부이다. 일부 구현예에서, snRNP는 U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP, U11 snRNP, U12 snRNP, U4atac snRNP, U5 snRNP, U6atac snRNP 또는 이의 일부이다. 일부 구현예에서, 폴리펩타이드는 트랜스-작용 인자의 단백질 또는 단백질 구성요소이다. 일부 구현예에서, 폴리펩타이드는 RNA 스플라이싱과 관련된 단백질의 일부, 예컨대 도메인 또는 서브도메인이다. 일부 구현예에서, 폴리펩타이드는 SR, TRA2, SF, SRSF, U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP, U11 snRNP, U12 snRNP, U1-C, Sm 단백질, FBP11, SF3A, SF3B, U2AF65, U2AF35, PRP19 복합체 단백질, hnRNP 1, hnRNP 3, hnRNP C, hnRNP G, hnRNP K, hnRNP M, hnRNP U, ASF, SF2, 9G8, SRP20, TRA2a/b, SRP36, SRP35C, SRP30C, SRP38, SRP40, SRP55, SRP75, HUR, NFAR, NF45, YB1, 및 접합 복합체 단백질을 포함하는 군으로부터 선택된 하나의 단백질의 단백질 구성요소 또는 이의 일부이다. RNA 스플라이싱과 관련된 다른 예시적인 단백질은 mBBP, 폴리피리미딘 트랙트 결합 단백질(PTB), nPTB, KH-유형 스플라이싱 조절 단백질(KSRP), SAM68, STAR/GSG, ASD-2b, ASD-1, SUP-12, RNPC1, ASF, snRNP 보조 인자-35(U2AF35), ASF/SF2, Nova-1/2, Fox-1/2, 머슬-블라인드 유사(MBNL), CELF, Hu, TIA, TIAR, 및 이들의 별칭을 포함한다. 일부 구현예에서, 표적 폴리뉴클레오타이드 및 제1 결합제는 제1 복합체를 형성한다. 일부 구현예에서, 제1 복합체는 결합 포켓을 포함한다. 일부 구현예에서, 결합 포켓은 돌출부, 돌연변이, 또는 스템-루프, 또는 이의 임의의 조합을 포함한다. 일부 구현예에서, 돌출부 또는 돌연변이는 제1 폴리뉴클레오타이드에서 3차원적 구조 변화를 유발한다. 일부 구현예에서, 방법은 제2 결합제를 제1 복합체와 접촉시키는 단계를 추가로 포함한다. 일부 구현예에서, 제2 결합제는 폴리뉴클레오타이드, 폴리펩타이드, 단백질, 소분자, 이온, 염, 및 원자를 포함하는 군으로부터 선택된 하나 이상의 분자를 포함한다. 일부 구현예에서, 제2 결합제는 소분자이다. 일부 구현예에서, 소분자는 소분자의 라이브러리이다. 일부 구현예에서, 제2 결합제는 제1 복합체에서 검출가능한 구조적 변화를 추가로 유발한다. 일부 구현예에서, 방법은 제2 결합제를 제1 복합체와 접촉시킨 후 제2 NMR 스펙트럼을 수득하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제1 및 제2 NMR 스펙트럼을 비교하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제1 및 제2 NMR 스펙트럼으로부터 하나 이상의 원자의 화학적 이동을 결정하는 단계를 추가로 포함한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 ABCA4, ABCB4, ABCD1, ACADSB, ADA, ADAMTS13, AGL, ALB, ALDH3A2, ALG6, APC, APOB, AR, ATM, ATP7A, ATR, B2M, BMP2K, BRCA1, BRCA2, BTK, C3, CAT, CDH1, CDH23, CFTR, CHM, COL11A1, COL11A2, COL1A1, COL1A2, COL2A1, COL3A1, COL4A5, COL6A1, COL6A3, COL7A1, COL9A2, COLQ, CUL4B, CYBB, CYP17, CYP19, CYP27, CYP27A1, DES, DMD, DYSF, EGFR, EMD, ETV4, F13A1, F5, F7, F8, FAH, FANCA, FANCC, FANCG, FBN1, FECH, FGA, FGFR2, FGG, FIX, FLNA, FOXM1, FRAS1, GALC, GH1, GHV, HADHA, HBA2, HBB, HEXA, HEXB, HLCS, HMBS, HMGCL, HNF1A, HPRT1, HPRT2, HSF4, HSPG2, HTT, IDS, IKBKAP, INSR, ITGB2, ITGB3, JAG1, KRAS, KRT5, L1CAM, LAMA3, LDLR, LMNA, LPL, MADD, MAPT, MLH1, MSH2, MST1R, MTHFR, MUT, MVK, NF1, NF2, OAT, OPA1, OTC, PAH, PBGD, PCCA, PDH1, PGK1, PHEX, PKD2, PKLR, PLEKHM1, PLKR, POMT2, PRDM1, PRKAR1A, PROC, PSEN1, PTCH1, PTEN, PYGM, RP6KA3, RPGR, RSK2, SBCAD, SCN5A, SERPINA1, SLC12A3, SLC6A8, SMN2, SPINK5, SPTA1, TP53, TRAPPC2, TSC1, TSC2, TSHB, UGT1A1, CD46, 및 USH2A로 이루어진 군으로부터 선택된 유전자 또는 이의 유전자 변이체에 의해 코딩되는 서열을 포함한다.
일 양태에서, 표적 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드 샘플을 제공하는 단계; NMR 장치를 사용하여 폴리뉴클레오타이드 샘플의 제1 NMR 스펙트럼을 수득하는 단계; 결합제를 폴리뉴클레오타이드 샘플과 접촉시키는 단계; 결합제와 접촉시킨 후 폴리뉴클레오타이드 샘플의 제2 NMR 스펙트럼을 수득하는 단계; 제1 및 제2 NMR 스펙트럼을 비교하는 단계; 및 비교에 기초하여 결합제를 선택하는 단계를 포함하는, 폴리뉴클레오타이드에 대한 결합제를 선택하는 방법이 본원에 제공된다. 일부 구현예에서, 결합제는 소분자, 폴리뉴클레오타이드, 또는 단백질, 또는 이의 임의의 조합을 포함한다. 일부 구현예에서, 폴리뉴클레오타이드 샘플은 제1 폴리뉴클레오타이드를 추가로 포함한다. 일부 구현예에서, 표적 폴리뉴클레오타이드 및 제1 폴리뉴클레오타이드는 거의 등몰량으로 첨가된다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 제1 RNA이다. 일부 구현예에서, 제1 RNA는 작은 핵 RNA(snRNA) 또는 이의 일부이다. 일부 구현예에서, snRNA는 U1-U12 snRNA 또는 이의 일부이다. 일부 구현예에서, 표적 및 제1 폴리뉴클레오타이드는 이합체를 형성한다. 일부 구현예에서, 이합체는 결합 포켓을 함유한다. 일부 구현예에서, 결합 포켓은 돌출부, 또는 돌연변이, 또는 스템-루프, 또는 이의 임의의 조합을 포함한다. 일부 구현예에서, 결합 포켓은 돌연변이, 돌출부, 또는 스템-루프를 포함하지 않는다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 스플라이스 부위, 분기점(BP), 엑손 스플라이싱 인핸서(ESE), 엑손 스플라이싱 사일런서(ESS), 인트론 스플라이싱 인핸서(ISE), 인트론 스플라이싱 사일런서(ISS), 또는 폴리피리미딘 트랙트, 또는 이의 임의의 조합을 포함한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손 또는 이의 단편을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 인트론 또는 이의 단편을 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손-인트론 경계를 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 8개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 25개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 최대 1000개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 100 내지 200개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 2H, 13C, 15N, 19F 및 31P를 포함하는 하나 이상의 원자 표지로 동위원소적으로 표지된 뉴클레오타이드를 포함하지 않거나 적어도 하나 포함한다. 일부 구현예에서, 방법은 제1 또는 제2 NMR 스펙트럼의 화학적 이동을 결정하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 폴리뉴클레오타이드 및 결합되거나 분자적으로 상호작용하는 소분자의 3차원 원자 해상도 구조를 결정하는 단계를 추가로 포함한다. 일부 구현예에서, 3차원 원자 해상도 구조는 구조 예측 소프트웨어에 의해 결정된다. 일부 구현예에서, 구조 예측 소프트웨어는 Atnos/Candid-프로그램 묶음이다. 일부 구현예에서, 구조 예측 소프트웨어는 MC-fold | MC-Sym 파이프라인이다. 일부 구현예에서, 3차원 원자 해상도 구조를 결정하는 것은 뉴클레오타이드 서열 및 하나 이상의 2차원 구조 예측 알고리즘을 사용하여 복수의 이론적인 구조적 폴리뉴클레오타이드 2차원 모델을 생성하는 단계를 포함한다. 일부 구현예에서, 방법은 복수의 이론적인 구조적 폴리뉴클레오타이드 2차원 모델 및 선택적으로 하나 이상의 공지되고/거나 추정된 폴리뉴클레오타이드 2차원 모델을 사용하는 3차원 구조 예측 알고리즘을 사용하여 복수의 이론적인 구조적 폴리뉴클레오타이드 3차원 모델을 생성하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 복수의 이론적인 구조적 폴리뉴클레오타이드 3차원 모델 각각에 대해 예측된 화학적 이동 세트를 생성하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 예측된 화학적 이동 세트를 하나 이상의 원자의 화학적 이동(들)과 비교하는 단계를 추가로 포함한다. 일부 구현예에서, NMR 장치는 공명 할당을 수행하고 NOE 유래 거리를 확인하여 구조 계산을 구동하는데 사용된다. 일부 구현예에서, 방법은 각각의 예측된 화학적 이동 세트 및 하나 이상의 원자의 화학적 이동(들) 사이에서 일치하는 하나 이상의 이론적인 구조적 폴리뉴클레오타이드 3차원 모델을 하나 이상의 3차원 원자 해상도 구조로서 선택하는 단계를 추가로 포함한다. 일부 구현예에서, 2차원 구조 예측 알고리즘은 최근접 이웃 알고리즘이다. 일부 구현예에서, 방법은 에너지 최소화 및/또는 분자 동역학 시뮬레이션을 포함하는 하나 이상의 기능을 수행하는 모델링 소프트웨어를 사용하여 선택된 하나 이상의 이론적인 구조적 폴리뉴클레오타이드 3차원 모델을 개선함으로써 하나 이상의 개선된 3차원 원자 해상도 구조를 생성하는 단계를 추가로 포함한다. 일부 구현예에서, 예측된 화학적 이동 세트는 각각의 이론적인 구조적 폴리뉴클레오타이드 3차원 모델을 NMR 데이터-구조 데이터베이스와 비교함으로써 생성된다. 일부 구현예에서, 예측된 화학적 이동 세트를 생성하는 것은 하나 이상의 실험적으로 결정된 폴리뉴클레오타이드 3차원 구조로부터 원자 좌표, 적층 결합, 자화율, 전자기장, 또는 이면각을 포함한 폴리뉴클레오타이드 구조적 지표를 계산하는 단계를 포함한다. 일부 구현예에서, 방법은 회귀 알고리즘을 사용하여 실험적 화학적 이동 및 실험적으로 결정된 3차원 폴리뉴클레오타이드 구조의 폴리뉴클레오타이드 구조적 지표 사이의 관계를 설명하는 수학적 함수 또는 객체의 세트를 생성하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 이론적인 구조적 폴리뉴클레오타이드 3차원 모델 각각에 대한 폴리뉴클레오타이드 구조적 지표를 계산하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 이론적인 구조적 폴리뉴클레오타이드 3차원 모델 각각에 대한 폴리뉴클레오타이드 구조적 지표를 수학적 함수 또는 객체의 세트에 입력하여 예측된 화학적 이동 세트를 생성하는 단계를 추가로 포함한다. 일부 구현예에서, 회귀 알고리즘은 랜덤 포레스트 알고리즘을 포함하는 기계 학습 알고리즘이다. 일부 구현예에서, NMR 스펙트럼은 약 1 GHz MHz 내지 약 20 MHz 범위의 NMR 분광계 주파수로 수득된다. 일부 구현예에서, NMR 스펙트럼은 500 MHz 내지 900 MHz 범위의 NMR 분광계 주파수로 수득된다. 일부 구현예에서, NMR 장치는 AVANCE III이다. 일부 구현예에서, 방법은 이합체에 대한 결합제의 결합 동역학을 결정하는 단계를 추가로 포함한다. 일부 구현예에서, 결합 동역학은 표면 플라즈몬 공명(SPR), 생물층 간섭계(BLI) 기술(Octet Systems), 등온 적정 열량 측정법(ITC), 또는 형광 이방성에 의해 결정된다.
일 양태에서, 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드에 의해 형성된 하나 이상의 결합 포켓을 확인하는 단계로서, 제1 폴리뉴클레오타이드는 스플라이스 부위, 분기점(BP), 엑손 스플라이싱 인핸서(ESE), 엑손 스플라이싱 사일런서(ESS), 인트론 스플라이싱 인핸서(ISE), 인트론 스플라이싱 사일런서(ISS), 또는 폴리피리미딘 트랙트, 또는 이의 임의의 조합을 함유하는 것인 단계; 및 하나 이상의 결합 포켓에 대해 하나 이상의 소분자를 가상으로 스크리닝하는 단계로서, 가상 스크리닝 과정은 추정되는 소분자 히트를 확인하는 것인 단계를 포함하는 방법이 본원에 제공된다. 일부 구현예에서, 하나 이상의 결합 포켓을 확인하는 것은 제1 폴리뉴클레오타이드 및 제2 폴리뉴클레오타이드를 포함하는 3차원 원자 해상도 구조를 해석하는 단계를 포함한다. 일부 구현예에서, 3차원 원자 해상도 구조는 NMR 스펙트럼에 의해 결정된다. 일부 구현예에서, 방법은 실험 분석을 사용하여 가상 스크린으로부터 하나 이상의 소분자 히트를 시험하는 단계를 추가로 포함한다. 일부 구현예에서, 실험 분석은 표면 플라즈몬 공명(SPR), 생물층 간섭계(BLI) 기술(Octet Systems), 등온 적정 열량 측정법(ITC), 또는 형광 이방성이다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 RNA이다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 전구-mRNA이다. 일부 구현예에서, 스플라이스 부위는 5' 스플라이스 부위, 잠재 5' 스플라이스 부위, 3' 스플라이스 부위, 또는 잠재 3' 스플라이스 부위이다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 적어도 하나의 인트론 또는 이의 단편을 함유한다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 적어도 하나의 엑손 또는 이의 단편을 함유한다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 적어도 하나의 엑손-인트론 경계를 함유한다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 적어도 8개의 뉴클레오타이드 길이이다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 적어도 25개의 뉴클레오타이드 길이이다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 최대 1000개의 뉴클레오타이드 길이이다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 100 내지 200개의 뉴클레오타이드 길이이다. 일부 구현예에서, 제1 폴리뉴클레오타이드는 ABCA4, ABCB4, ABCD1, ACADSB, ADA, ADAMTS13, AGL, ALB, ALDH3A2, ALG6, APC, APOB, AR, ATM, ATP7A, ATR, B2M, BMP2K, BRCA1, BRCA2, BTK, C3, CAT, CDH1, CDH23, CFTR, CHM, COL11A1, COL11A2, COL1A1, COL1A2, COL2A1, COL3A1, COL4A5, COL6A1, COL6A3, COL7A1, COL9A2, COLQ, CUL4B, CYBB, CYP17, CYP19, CYP27, CYP27A1, DES, DMD, DYSF, EGFR, EMD, ETV4, F13A1, F5, F7, F8, FAH, FANCA, FANCC, FANCG, FBN1, FECH, FGA, FGFR2, FGG, FIX, FLNA, FOXM1, FRAS1, GALC, GH1, GHV, HADHA, HBA2, HBB, HEXA, HEXB, HLCS, HMBS, HMGCL, HNF1A, HPRT1, HPRT2, HSF4, HSPG2, HTT, IDS, IKBKAP, INSR, ITGB2, ITGB3, JAG1, KRAS, KRT5, L1CAM, LAMA3, LDLR, LMNA, LPL, MADD, MAPT, MLH1, MSH2, MST1R, MTHFR, MUT, MVK, NF1, NF2, OAT, OPA1, OTC, PAH, PBGD, PCCA, PDH1, PGK1, PHEX, PKD2, PKLR, PLEKHM1, PLKR, POMT2, PRDM1, PRKAR1A, PROC, PSEN1, PTCH1, PTEN, PYGM, RP6KA3, RPGR, RSK2, SBCAD, SCN5A, SERPINA1, SLC12A3, SLC6A8, SMN2, SPINK5, SPTA1, TP53, TRAPPC2, TSC1, TSC2, TSHB, UGT1A1, CD46, 및 USH2A로 이루어진 군으로부터 선택된 유전자 또는 이의 유전자 변이체에 의해 코딩되는 서열을 포함한다.
정의
본원에 사용된 바와 같이 용어 "폴리뉴클레오타이드"는 일반적으로 하나 이상의 핵산 서브유닛, 또는 뉴클레오타이드를 포함하는 분자를 지칭하며, "핵산" 또는 "올리고뉴클레오타이드"와 상호교환적으로 사용될 수 있다. 폴리뉴클레오타이드는 아데노신(A), 시토신(C), 구아닌(G), 티민(T) 및 우라실(U), 또는 이의 변이체로부터 선택되는 하나 이상의 뉴클레오타이드를 포함할 수 있다. 뉴클레오타이드는 일반적으로 뉴클레오사이드 및 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 포스페이트(PO3)기를 포함한다. 뉴클레오타이드는 핵염기, 오탄당(리보스 또는 데옥시리보스), 및 하나 이상의 포스페이트기를 포함할 수 있다. 리보뉴클레오타이드는 당이 리보스인 뉴클레오타이드이다. 데옥시리보뉴클레오타이드는 당이 데옥시리보스인 뉴클레오타이드이다. 뉴클레오타이드는 뉴클레오사이드 모노포스페이트 또는 뉴클레오사이드 폴리포스페이트일 수 있다. 뉴클레오타이드는 발광 태그 또는 마커(예컨대, 형광단)와 같은 검출가능한 태그를 포함하는, 데옥시리보뉴클레오사이드 폴리포스페이트, 예컨대, 데옥시아데노신 트리포스페이트(dATP), 데옥시시티딘 트리포스페이트(dCTP), 데옥시구아노신 트리포스페이트(dGTP), 우리딘 트리포스페이트(dUTP) 및 데옥시티미딘 트리포스페이트(dTTP) dNTP로부터 선택될 수 있는 데옥시리보뉴클레오사이드 트리포스페이트(dNTP)일 수 있다. 뉴클레오타이드는, 예를 들어, 2H, 13C, 15N, 19F, 및 31P로 동위원소적으로 표지될 수 있다. 뉴클레오타이드는 성장하는 핵산 가닥 내로 혼입될 수 있는 임의의 서브유닛을 포함할 수 있다. 이러한 서브유닛은 A, C, G, T, 또는 U, 또는 하나 이상의 상보적인 A, C, G, T 또는 U에 특이적이거나, 퓨린(즉, A 또는 G, 또는 이의 변이체) 또는 피리미딘(즉, C, T 또는 U, 또는 이의 변이체)에 상보적인 임의의 다른 서브유닛일 수 있다. 일부 실시예에서, 폴리뉴클레오타이드는 데옥시리보핵산(DNA), 리보핵산(RNA), 또는 이의 유도체 또는 변이체이다. 일부 구현예에서, 폴리뉴클레오타이드는 몇 가지 예를 들어 짧은 간섭 RNA(siRNA), microRNA(miRNA), 플라스미드 DNA(pDNA), 짧은 헤어핀 RNA(shRNA), 작은 핵 RNA(snRNA), 메신저 RNA(mRNA), 전구체 mRNA(전구-mRNA), 안티센스 RNA(asRNA)이며, 뉴클레오타이드 서열 및 이의 임의의 구조적 구현예, 예컨대 단일-가닥, 이중-가닥, 삼중-가닥, 나선, 헤어핀 등 모두를 포함한다. 일부 경우에, 폴리뉴클레오타이드 분자는 원형이다. 폴리뉴클레오타이드는 다양한 길이를 가질 수 있다. 핵산 분자는 적어도 약 10 염기, 20 염기, 30 염기, 40 염기, 50 염기, 100 염기, 200 염기, 300 염기, 400 염기, 500 염기, 1 킬로염기(kb), 2 kb, 3, kb, 4 kb, 5 kb, 10 kb, 50 kb 이상의 길이를 가질 수 있다. 폴리뉴클레오타이드는 세포 또는 조직으로부터 단리될 수 있다. 본원에 구현된 바와 같이, 폴리뉴클레오타이드 서열은 단리된 및 정제된 DNA/RNA 분자, 합성 DNA/RNA 분자, 합성 DNA/RNA 유사체를 포함할 수 있다.
폴리뉴클레오타이드는 비표준 뉴클레오타이드(들), 비자연 뉴클레오타이드(들), 뉴클레오타이드 유사체(들) 및/또는 변형된 뉴클레오타이드를 포함하는 하나 이상의 뉴클레오타이드 변이체를 포함할 수 있다. 변형된 뉴클레오타이드의 예는, 비제한적으로 디아미노퓨린, 5-플루오로우라실, 5-브로모우라실, 5-클로로우라실, 5-아이오도우라실, 하이포잔틴, 잔틴, 4-아세틸시토신, 5-(카르복시하이드록실메틸)우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실, 디하이드로우라실, 베타-D-갈락토실큐오신, 이노신, N6-이소펜테닐아데닌, 1-메틸구아닌, 1-메틸이노신, 2,2-디메틸구아닌, 2-메틸아데닌, 2-메틸구아닌, 3-메틸시토신, 5-메틸시토신, N6-아데닌, 7-메틸구아닌, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 베타-D-만노실큐오신, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 2-메틸티오-D46-이소펜테닐아데닌, 우라실-5-옥시아세트산(v), 와이부톡소신, 슈도우라실, 큐오신, 2-티오시토신, 5-메틸-2-티오우라실, 2-티오우라실, 4-티오우라실, 5-메틸우라실, 우라실-5-옥시아세트산 메틸에스테르, 우라실-5-옥시아세트산(v), 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필) 우라실, (acp3)w, 2,6-디아미노퓨린 등을 포함한다. 일부 경우에, 뉴클레오타이드는 트리포스페이트 모이어티에 대한 변형을 포함하는 이들의 포스페이트 모이어티의 변형을 포함할 수 있다. 이러한 변형의 비제한적인 예는 더 큰 길이의 포스페이트 사슬(예컨대, 4, 5, 6, 7, 8, 9, 10개 이상의 포스페이트 모이어티를 갖는 포스페이트 사슬) 및 티올 모이어티(예컨대, 알파-티오트리포스페이트 및 베타-티오트리포스페이트)를 갖는 변형을 포함한다. 핵산 분자는 또한 염기 모이어티(예컨대, 전형적으로 상보적인 뉴클레오타이드와 수소 결합을 형성하는데 이용가능한 하나 이상의 원자에서 및/또는 전형적으로 상보적인 뉴클레오타이드와 수소 결합을 형성할 수 없는 하나 이상의 원자에서), 당 모이어티 또는 포스페이트 백본에서 변형될 수 있다. 핵산 분자는 또한 N-하이드록시석신이미드 에스테르(NHS)와 같은 아민 반응성 모이어티의 공유 부착을 허용하기 위해 아미노 알릴-dUTP(aa-dUTP) 및 아미노헥스힐아크릴아미드(aha-dCTP)와 같은 아민 변형된 기를 함유할 수 있다. 본 개시내용의 올리고뉴클레오타이드에서 표준 DNA 염기쌍 또는 RNA 염기쌍에 대한 대안은 세제곱 mm당 비트의 더 높은 밀도, 더 높은 안전성(천연 독소의 우발적 또는 의도적 합성에 대한 내성), 광 프로그래밍된 중합효소에서 더 쉬운 구별, 또는 더 낮은 2차 구조를 제공할 수 있다. 드 노보(de novo) 및/또는 증폭 합성을 위해 천연 및 돌연변이성 중합효소와 호환되는 이러한 대안적인 염기쌍은 문헌[Betz K, Malyshev DA, Lavergne T, Welte W, Diederichs K, Dwyer TJ, Ordoukhanian P, Romesberg FE, Marx A. Nat. Chem. Biol. 2012 Jul;8(7):612-4]에 기재되어 있으며, 이는 모든 목적을 위해 본원에 참조로 포함되어 있다.
용어 "폴리뉴클레오타이드 샘플"은, 선택적으로 용매에 용해된, 폴리뉴클레오타이드 또는 특정 양(예컨대, 폴리뉴클레오타이드의 몰 수 또는 농도)의 폴리뉴클레오타이드를 포함하며, 폴리뉴클레오타이드 샘플 내의 폴리뉴클레오타이드는 하나의 단일 뉴클레오타이드 서열을 갖는다. 일부 예에서, 폴리뉴클레오타이드 샘플 내의 폴리뉴클레오타이드는 동일한 뉴클레오타이드만을 가질 수 있거나, 폴리뉴클레오타이드 샘플은 상이한 뉴클레오타이드로 합성된 폴리뉴클레오타이드를 함유할 수 있다. 일부 예에서, 폴리뉴클레오타이드는 임의의 표지가 없다. 일부 다른 예에서, 폴리뉴클레오타이드는 하나 이상의 원자 표지로 표지된다.
본원에 사용된 바와 같이, 용어 "단백질"은 펩타이드 결합을 통해 연결된 아미노산 잔기의 긴 중합체를 지칭하며, 이는 하나 이상의 폴리펩타이드 사슬로 구성될 수 있다. 보다 구체적으로, 용어 "단백질"은 특정 순서, 단백질을 코딩하는 유전자에서의 뉴클레오타이드의 염기 서열에 의해 결정되는 바와 같은 순서의 아미노산의 하나 이상의 사슬로 구성되는 분자를 지칭한다. 단백질은 몸의 세포, 조직, 및 장기의 구조, 기능, 및 조절에 필수적이며, 각각의 단백질은 독특한 기능을 갖는다. 예는 호르몬, 효소, 항체, 및 이의 임의의 단편이다. 일부 경우에, 단백질은 단백질의 부분, 예를 들어, 단백질의 도메인, 서브도메인, 또는 모티프일 수 있다. 일부 경우에, 단백질은 단백질의 변이체(또는 돌연변이)일 수 있고, 하나 이상의 아미노산 잔기는 단백질의 자연 발생(또는 적어도 공지된) 아미노산 서열 내로 삽입, 결실, 및/또는 치환된다. 단백질 또는 이의 변이체는 자연 발생 또는 재조합일 수 있다.
본원에 사용된 바와 같이, 용어 "펩타이드"는 단량체가 아미노산이고 아미드 결합을 통해 함께 연결된 중합체이며, 대안적으로 폴리펩타이드로 지칭된다. 본 명세서의 문맥에서, 아미노산은 L-광학 이성질체 또는 D-광학 이성질체일 수 있는 것으로 이해되어야 한다. 펩타이드는 2개 이상의 아미노산 단량체 길이이고, 종종 20개 초과의 아미노산 단량체 길이일 수 있다.
결합 포켓은, 그 위치 상에서 결합제의 특이적 상호작용을 가능하게 하여 RNA의 확인 및 구조에 영향을 미치고 이로써 필수적으로 스플라이싱 과정을 억제하거나 활성화시키는 충분한 구조적 복잡성(예컨대, 2차 또는 3차 구조)을 갖는 폴리뉴클레오타이드(예컨대, RNA) 상의 임의의 위치를 지칭할 수 있다. 결합 포켓은 돌출부, 비돌연변이 단일 및 이합체 RNA, 스템-루프, 또는 스템-루프, 돌연변이 함유 단일 및 이합체 RNA에 인접한 서열을 함유할 수 있다. 결합 포켓은 돌연변이를 포함하거나 포함하지 않을 수 있다. 일부 경우에, 결합 포켓은 결합 포켓의 업스트림/다운스트림에 돌연변이를 갖는 서열 부분을 포함하며, 이러한 돌연변이는 결합 포켓에서 RNA의 구조에 영향을 미친다.
본원에 사용된 바와 같이 "결합제"는 핵산 분자, 2개 이상의 핵산 분자에 의해 형성된 복합체, 또는 핵산 및 단백질에 의해 형성된 복합체에 특이적으로 결합할 수 있는 분자를 지칭한다. 결합제는 단백질, 펩타이드, 핵산, 탄수화물, 지질, 또는 소 분자량 화합물일 수 있다. 본원에 개시된 결합제는 RNA 스플라이싱 오류를 조절 또는 교정할 수 있다.
본원에 사용된 바와 같이, "소 분자량 화합물"은 "소분자" 또는 "소 유기 분자"와 상호교환적으로 사용될 수 있다. 소분자는 펩타이드, 올리고뉴클레오타이드, 또는 이의 유사체 이외의 화합물을 지칭하며; 전형적으로 약 2,000 달톤 미만의 분자량을 갖는다.
리보핵산단백질(RNP)은 RNA를 함유하는 핵산단백질을 지칭한다. 그것은 리보핵산과 RNA 결합 단백질을 조합하는 회합이다. 이러한 조합은 또한 단백질-RNA 복합체로 지칭될 수 있다. 이들 복합체는 DNA 복제, 유전자 발현 조절 및 RNA의 대사 조절을 포함하는 많은 생물학적 기능에서 기능할 수 있다. RNP의 몇 가지 예는 리보좀, 효소 텔로머라제, 볼트(vault) 리보핵산단백질, RNase P, 이종 핵 RNP(hnRNP) 및 작은 핵 RNP(snRNP)를 포함한다.
단백질 코딩 유전자로부터의 초기(nascent) RNA 전사체 및 mRNA 가공 중간체는 전구-mRNA로 총칭되며, 일반적으로 진핵 세포의 핵 내의 단백질에 의해 결합된다. 초기 전사체가 RNA 중합효소 II로부터 처음 출현할 때부터 성숙한 mRNA가 세포질로 운반될 때까지, RNA 분자는 풍부한 핵 단백질 세트와 결합되어 있다. 이들 단백질은 hnRNP의 주요 단백질 구성요소이며, 이는 전구-mRNA 및 다양한 크기의 다른 핵 RNA를 지칭하는 총칭인 이종 핵 RNA(hnRNA)를 함유한다.
스플라이싱 인자는 스플라이싱 또는 스플라이싱 조절에서 기능을 하는 단백질 또는 단백질 복합체이다. 스플라이싱 인자는 항시적(constitutive) 스플라이싱, 조절된 스플라이싱 및 특정 메시지 또는 메시지 그룹의 스플라이싱에 필요할 수 있는 인자를 포함한다. 관련된 단백질의 그룹인 SR 단백질은 항시적 전구-mRNA 스플라이싱에서 기능할 수 있고, 또한 농도 의존적 방식으로 선택적 스플라이스 부위 선택을 조절할 수 있다. SR 단백질은 1개 또는 2개의 RNA 인식 모티프(RRM) 및 아르기닌 및 세린 잔기가 풍부한 C-말단(RS 도메인)으로 구성되는 모듈 구조를 갖는다. 선택적 스플라이싱에서의 이들의 활성은 단백질의 hnRNP A/B 패밀리의 구성원에 의해 길항될 수 있다. 스플라이싱 인자는 또한 하나 이상의 snRNA와 관련된 단백질을 포함할 수 있다. 인간에서의 SR 단백질은 SC35, SRp55, SRp40, SRm300, SFRS10, TASR-1, TASR-2, SF2/ASF, 9G8, SRp75, SRp30c, SRp20 및 P54/SFRS11을 포함한다. 스플라이스 부위 선택에 관여할 수 있는 인간의 다른 스플라이싱 인자는, 비제한적으로, U2 snRNA 보조 인자(예컨대 U2AF65, U2AF35), Urp/U2AF1-RS2, SF1/BBP, CBP80, CBP 20, SF1 및 PTB/hnRNP1을 포함한다. 인간의 hnRNP 단백질은, 비제한적으로, A1, A2/B1, L, M, K, U, F, H, G, R, I 및 C1/C2를 포함한다. 스플라이싱 인자는 snRNP 또는 전사체와 안정적으로 또는 일시적으로 결합할 수 있다.
용어 "인트론"은 유전자 내의 DNA 서열 및 가공되지 않은 RNA 전사체에서의 상응하는 서열 모두를 지칭한다. RNA 가공 경로의 일부로서, 인트론은 전사 직후 또는 전사와 동시에 RNA 스플라이싱에 의해 제거된다. 인트론은 대부분의 유기체 및 많은 바이러스의 유전자에서 발견된다. 이들은 단백질, 리보솜 RNA(rRNA), 및 운반 RNA(tRNA)를 생성하는 유전자를 포함하여, 광범위한 유전자에 위치할 수 있다. "엑손"은 인트론이 RNA 스플라이싱에 의해 제거된 후 상기 유전자에 의해 생산된 최종 성숙한 RNA의 일부를 코딩하는 유전자의 임의의 부분일 수 있다. 용어 "엑손"은 유전자 내의 DNA 서열 및 RNA 전사체에서의 상응하는 서열 모두를 지칭한다. "스플라이소좀(spliceosome)"은 snRNA 및 단백질 복합체로부터 조립된다. 스플라이소좀은 전사된 전구-mRNA로부터 인트론을 제거한다.
본원에 사용된 바와 같이, 용어 "표적" 또는 "표적 분자"는 분자 상의 인식 부분에 결합한 결합제에 의해 조절되는 임의의 생물학적 분자로부터 선택될 수 있는 분자를 기술한다. 조절은 활성화, 억제, 또는 임의의 구조적 변화일 수 있다. 예를 들어, 본 개시내용의 일부 구현예에서, 결합제는 표적 분자(예컨대 mRNA)에 결합하고 RNA 스플라이싱을 조절하여 스플라이싱에서의 일부 결함을 교정할 수 있다. 본 발명의 기술에 의해 포함되는 표적 분자는 폴리뉴클레오타이드, 단백질, 폴리펩타이드, 올리고펩타이드, 리보핵산단백질, 및 RNA 및 DNA를 포함하는 핵산을 포함하는 다양한 화합물을 포함할 수 있다. 일부 경우에, 표적 분자는 표적 폴리뉴클레오타이드, 표적 RNA, 또는 표적 DNA일 수 있다. 분자 상의 인식 부분은 결합제와 상호작용하는 구조적 부분을 지칭한다. 인식 부분은 하나 이상의 분자(예컨대, RNA 및 RNA 이합체)에 의해 형성된 결합 포켓(예컨대, mRNA 상의 결합 포켓)일 수 있다. 본원에 제공된 다양한 구현예에서, 표적 폴리뉴클레오타이드에 의해 형성된 결합 포켓은 돌출부, 또는 돌연변이, 또는 스템-루프, 또는 이의 임의의 조합을 포함하고, 소분자와 같은 결합제를 수용할 수 있다. 일부 구현예에서, 결합 포켓은 돌출부, 돌연변이, 또는 스템-루프를 포함하지 않을 수 있다.
스플라이싱
스플라이싱 또는 RNA 스플라이싱은 전형적으로 초기 전구체 메신저 RNA(전구-mRNA) 전사체를 성숙한 메신저 RNA(mRNA)로 편집하는 것을 지칭한다. 스플라이싱은 인트론 제거 후 엑손 결찰(ligation)을 포함하는 생화학적 과정이다. 순차적 에스테르교환 반응은 다운스트림 인트론에서 분기 아데노신(분기점; BP)에 의한 5' 스플라이스 부위(5'ss)의 친핵성 공격에 의해 개시되어, 2', 5'-포스포디에스테르 연결을 갖는 인트론 올가미(lariat) 중간체를 생성한다. 이어서, 3' 스플라이스 부위(3'ss)에서 5'ss 매개 공격이 발생하여, 인트론 올가미를 제거하고 스플라이싱된 RNA 생성물을 형성한다.
스플라이싱은 다양한 시스-작용 요소 및 트랜스-작용 인자에 의해 조절될 수 있다. 시스-작용 요소는 mRNA의 서열이며, 코어 공통 서열 및 다른 조절 요소를 포함할 수 있다. 코어 공통 서열은 전형적으로 5'ss, 3'ss, 폴리피리미딘 트랙트 및 BP 영역을 포함하는 보존된 RNA 서열 모티프를 지칭할 수 있으며, 이는 스플라이소좀 모집을 위해 기능할 수 있다. 코어 공통 서열은 실험을 위해 시험관내에서 사용될 때 작제물 스캐폴드(construct scaffold)로 지칭될 수 있다. BP는 전구-mRNA의 부분적으로 보존된 서열, 일반적으로 3'ss의 업스트림에 있는 50개 미만의 뉴클레오타이드를 지칭한다. BP는 스플라이싱 반응의 첫 번째 단계 동안 5'ss와 반응한다. 다른 조절 시스-작용 요소는 엑손 스플라이싱 인핸서(ESE), 엑손 스플라이싱 사일런서(ESS), 인트론 스플라이싱 인핸서(ISE), 및 인트론 스플라이싱 사일런서(ISS)를 포함할 수 있다. 트랜스-작용 인자는 시스-작용 요소에 결합하는 단백질 또는 리보핵산단백질일 수 있다.
스플라이스 부위 확인 및 조절된 스플라이싱은 주로 2개의 동적 거대분자 기계인 주요(U2-의존적) 및 부(U12-의존적) 스플라이소좀에 의해 달성될 수 있다. 각각의 스플라이소좀은 5개의 snRNP를 함유한다: 주요 스플라이소좀(모든 인트론의 ~95.5%를 가공)의 경우 U1, U2, U4, U5 및 U6 snRNP; 및 부 스플라이소좀의 경우 U11, U12, U4atac, U5 및 U6atac snRNP. 특정한 구조적 RNA와 함께 공통 서열 요소의 스플라이소좀 인식이 특징을 이룬다. 일반적으로, U1 snRNP는 인트론의 5'ss에서 GU 서열에 결합한다. 또한, U2 작은 핵 RNA 보조 인자 1(U2AF35) 및 USAF2(U2AF65) 및 스플라이싱 인자 1(SF1, 분기점 결합 단백질로도 알려짐)을 포함하는 많은 단백질이 때때로 주요 스플라이소좀 어셈블리에 필요할 수 있다. U2AF1은 인트론의 3' ss에서 결합할 수 있고, U2AF2는 폴리피리미딘 트랙트에 결합할 수 있다. SF1은 인트론 BP 서열에 결합할 수 있다. U2 snRNP는 SF1을 대체하고 분기점 서열에 결합하며, ATP는 가수분해된다. U5/U4/U6 snRNP 삼량체가 결합하고, U5 snRNP가 5' 부위에서 엑손에 결합하며, U6이 U2에 결합한다. 이후, U1 snRNP가 방출되고, U5가 엑손으로부터 인트론으로 이동하며, U6이 5'ss에서 결합한다. 이후, U4가 방출되고, U6/U2가 에스테르교환 반응을 촉매하여, 인트론의 5'-말단을 인트론 상의 "A"에 결찰시키고 올가미를 형성한다. U5는 3'ss에서 엑손에 결합하고, 5'부위가 절단되어, 올가미를 형성한다. U2/U5/U6은 올가미에 결합된 상태를 유지하고, 3' 부위가 절단되고, 엑손이 ATP 가수분해를 사용하여 결찰된다. 스플라이싱된 RNA는 방출되고, 올가미가 방출 및 분해되며, snRNP는 재순환된다. 5'ss, 3'ss 및 BP 부위에서 공통 서열 요소의 스플라이소좀 인식은 스플라이싱 경로의 단계 중 하나이며, SR 단백질 및 hnRNP를 포함하는 보조 스플라이싱 인자에 의해 인식될 수 있는 ESE, ISE, ESS, 및 ISS에 의해 조절될 수 있다. 폴리피리미딘 트랙트-결합 단백질(PTBP, 또는 PTB 또는 hnRNP1로도 알려짐)은 인트론의 폴리피리미딘 트랙트에 결합할 수 있고, RNA 루핑(looping)을 촉진할 수 있다.
선택적 스플라이싱(alternative splicing)은 단일 유전자가 결국 몇 가지 상이한 단백질을 생성할 수 있는 기전이다. 선택적 스플라이싱은 "선택적 스플라이싱 조절 단백질"로 불리는 다양한 상이한 단백질의 공동 작용에 의해 달성될 수 있으며, 상기 단백질은 전구-mRNA와 결합하여, 구별되는 대안적인 엑손을 성숙한 mRNA에 포함시킨다. 이러한 대안적인 형태의 유전자 전사체는 특정 단백질의 구별되는 이소형을 생성할 수 있다. 선택적 스플라이싱 조절 단백질에 결합할 수 있는 전구-mRNA 분자에서의 서열은, 비제한적으로, ISS, ISE, ESS, ESE, 및 폴리피리미딘 트랙트를 포함하는, 인트론 또는 엑손에서 발견될 수 있다. 많은 돌연변이 또는 업스트림 신호전달 경로는 스플라이싱 패턴을 변경할 수 있다. 예를 들어, 돌연변이는 시스-작용 요소일 수 있고, 이는 코어 공통 서열(예컨대 5'ss, 3'ss 및 BP) 또는 ESE, ESS, ISE, 및 ISS를 포함하는 스플라이소좀 모집을 조절하는 조절 요소, 또는 스템 루프에서와 같이 RNA 구조를 조절하는 영역에 위치할 수 있다. 돌연변이는 또한 돌연변이의 결과로서 스플라이싱 기계에 의해 활성화되고 인식되는 대안적인 5'ss로서 간주되는 서열에 존재할 수 있거나, 5'ss 내의 돌연변이는 대안적인 5'ss의 사용을 야기할 수 있다. 예를 들어, 신호전달 오류는 전구-mRNA에 결합하고 특정 mRNA 이소형의 생산을 조절하는 트랜스-작용 스플라이싱 인자를 많거나 적게 유도할 수 있다.
잠재 스플라이스 부위, 예를 들어, 잠재 5'ss 및 잠재 3'ss는 스플라이소좀에 의해 정상적으로 인식되지 않아서 일반적으로 휴면 상태에 있는 스플라이스 부위를 지칭할 수 있다. 잠재 스플라이스 부위는 시스-작용 요소 또는 트랜스-작용 인자에서의 돌연변이에 의해 인식되거나 활성화될 수 있다.
스플라이싱 인자는 암에서 탈조절될 수 있으며, 일부 경우에, 그 자체가 종양유전자 또는 유사 종양유전자(pseudo-oncogene)이고 암 진행을 유발하는 양성 피드백 루프(positive feedback loop)에 기여할 수 있다. 예를 들어, 인간 및 마우스 상피에서의 CD44 스플라이스 이소형 전환(switching)은 상피-중간엽 전이 및 유방암 진행에 필수적이다. FOXM1은 2개의 조건적(facultative) 엑손의 차별적 스플라이싱을 통해 동일한 유전자로부터 발생하는 3개의 구별되는 스플라이스 변이체에서 발현된다. FoxM1B 및 FoxM1C는 모두 전사적으로 활성이며, 이들 전사체로부터의 단백질은 암 세포 주기 진행을 유도하는 반면; FoxM1A는 엑손의 첨가가 FOXM1의 임의의 전사 활성을 폐지하여, 발현될 때 우성 음성 형태로 작용하기 때문에 전사적으로 불활성이며; 암 세포 주기 진행을 정지시킬 수 있다. 또 다른 예는 암 세포 및 마우스에서 반대 효과를 갖는 2개의 스플라이스 이소형인 IG20/MADD이며, 이는 단일 엑손이 상이하다. IG20은 TRAIL 유도된 아폽토시스를 예방하는 항아폽토시스 형태인 반면, MADD는 TRAIL 유도된 아폽토시스를 유도하는 아폽토시스 촉진 형태이다. 실제로, RNA 스플라이싱 오류는 상당한 사회적 결과를 갖는 점점 더 많은 인간 질환의 기초가 된다.
그러나, RNA 스플라이싱을 표적화하는 것, 보다 구체적으로 RNA 표적을 표적화하는 것은 RNA의 2차원, 및 3차원 구조, RNA 결합 친화성 또는 선택성을 유발하는 화학형(chemotype), 특정 mRNA 스플라이싱 핫 스팟(hot spot)에서 RNA 결합 친화성 및 선택성을 유발하는 화학형, 및 소분자 결합 포켓을 형성하는 RNA 구조적 요소의 확인과 같은 제한된 이용가능한 데이터로 인해 다루기 어렵다. 또한, 전구-mRNA의 RNA 스플라이싱은 동역학 구성요소에 의해 크게 영향을 받아, 특정 시점에 RNA 및/또는 RNA-단백질 복합체에 의해 특정 3차원 구조가 형성된다. 따라서, RNA 스플라이싱을 교정하기 위해 특이적이고 선택적인 소분자 결합제를 스크리닝하는 것은, 때때로 RNA 상의 다수의 제제의 결합을 정확히 평가할 수 있고, 결합제의 결과로서 구조적 변화를 측정/확인할 수 있으며, 그 결과 이소형 RNA 발현을 구동하는 RNA의 핵심 영역을 포함/제외하기 위해 RNA 스플라이싱의 방향에 영향을 미치는 특정 핵심 결합 영역, 또는 mRMA 핫 스팟 상에서의 분자 결합 및 때때로 동역학 친화성(결합 상수)의 변화를 결정할 수 있는 도구의 사용을 필요로 할 수 있다. 따라서, 이들 3-D 결합 포켓과의 소분자 상호작용은 질환에서 RNA 발현 오류에 영향을 미치고 이를 교정할 수 있다. RNA 표적 결합에 대한 소분자 라이브러리의 스크리닝은 RNA 결합을 유발하는 화학형에 대한 데이터를 생성할 수 있다. 그러나, RNA 결합제가 풍부한 소분자-스크리닝 수집물은 많지 않으며; 실제로, 대부분의 라이브러리는 단백질에 결합하는 화합물에 편향되어 있다. 또한, 몇 가지 이용가능한 RNA 결합제 라이브러리는 비특이적이거나 특정 RNA에 대해 선택적이다. 이러한 요구 등을 해결하기 위해, 본 개시내용은 다양한 구현예에서 RNA 및/또는 RNA 단백질 복합체에 결합하는 소분자를 확인하고, 특정 RNA 결합 포켓에 들어갈 수 있는 신규한 분자를 설계하고, 질환과 관련된 전구-mRNA 스플라이싱 결함에 대한 소분자의 특이성 및 선택성을 개선하는데 사용될 수 있는 구조 기반의 스크리닝 플랫폼을 제공한다.
표적 폴리뉴클레오타이드
본 개시내용은 다양한 구현예에서 폴리뉴클레오타이드 및/또는 폴리뉴클레오타이드 및 단백질에 의해 형성된 복합체(즉, 폴리뉴클레오타이드-단백질 복합체)에 결합할 수 있고 RNA 입체형태에 영향을 미쳐 RNA 발현에 영향을 미칠 수 있는 소분자를 확인하기 위한 구조 기반 스크리닝 플랫폼 또는 방법을 제공한다. 본 개시내용은 또한 RNA 스플라이싱에 관여하는 폴리뉴클레오타이드 및/또는 폴리뉴클레오타이드-단백질 복합체에 결합할 수 있는 소분자를 확인하기 위한 방법을 제공한다. 본 개시내용은 또한 RNA의 구조 및 트랜스-작용 단백질의 결합 친화성에 영향을 미칠 수 있는 소분자를 확인하기 위한 방법을 제공한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 RNA이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 mRNA이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 전구-mRNA 또는 전구-mRNA의 일부이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 5'ss, 잠재 5'ss, 3'ss, 또는 잠재 3'ss를 포함하는 스플라이스 부위 또는 이의 일부를 함유한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 BP, ESE, ESS, ISE, ISS, 및 폴리피리미딘 트랙트를 포함하는, 하나 이상의 다른 시스-작용 요소 또는 이의 일부를 포함한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 인트론 또는 이의 단편을 포함한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 2, 3, 4, 5, 6개 이상의 인트론 또는 이의 단편을 포함한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손 또는 이의 단편을 포함한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 2, 3, 4, 5, 6개 이상의 엑손 또는 이의 단편을 포함한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손-인트론 경계를 포함한다. 본원에 사용된 바와 같이, 엑손-인트론 경계는 인트론 및 엑손 사이의 경계에 위치한 인트론 및 엑손 서열을 함유하는 임의의 폴리뉴클레오타이드를 지칭할 수 있다. 일부 구현예에서, 엑손-인트론 경계는 엑손의 완전한 서열 및 인트론의 단편 서열을 함유할 수 있다. 일부 다른 구현예에서, 엑손-인트론 경계는 인트론의 완전한 서열 및 엑손의 단편 서열을 함유할 수 있다. 일부 경우에, 표적 폴리뉴클레오타이드는 엑손 및 인트론 서열 모두를 함유하며, 엑손 및 인트론의 순서를 달라질 수 있는 것으로 이해되어야 한다. 예를 들어, 엑손은 인트론의 5' 말단 상에 있을 수 있거나, 또는 엑손은 인트론의 3' 말단 상에 있을 수 있다. 일부 구현예에서, 엑손-인트론 경계는 5' ss를 포함한다. 일부 구현예에서, 엑손-인트론 경계는 3'ss를 포함한다. 표적 폴리뉴클레오타이드는 다양한 길이일 수 있다. 예를 들어, 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 5개의 뉴클레오타이드, 적어도 8개의 뉴클레오타이드, 적어도 10개의 뉴클레오타이드, 적어도 15개의 뉴클레오타이드, 적어도 20개의 뉴클레오타이드, 적어도 25개의 뉴클레오타이드, 적어도 30개의 뉴클레오타이드, 적어도 35개의 뉴클레오타이드, 적어도 40개의 뉴클레오타이드, 적어도 45개의 뉴클레오타이드, 적어도 50개의 뉴클레오타이드, 적어도 55개의 뉴클레오타이드, 적어도 60개의 뉴클레오타이드, 적어도 70개의 뉴클레오타이드, 적어도 75개의 뉴클레오타이드, 적어도 80개의 뉴클레오타이드, 적어도 85개의 뉴클레오타이드, 적어도 90개의 뉴클레오타이드, 적어도 95개의 뉴클레오타이드, 적어도 100개의 뉴클레오타이드, 적어도 200개의 뉴클레오타이드, 적어도 300개의 뉴클레오타이드, 적어도 400개의 뉴클레오타이드, 또는 적어도 500개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 최대 20개의 뉴클레오타이드, 최대 50개의 뉴클레오타이드, 최대 100개의 뉴클레오타이드, 최대 150개의 뉴클레오타이드, 최대 200개의 뉴클레오타이드, 최대 300개의 뉴클레오타이드, 최대 400개의 뉴클레오타이드, 최대 500개의 뉴클레오타이드, 최대 600개의 뉴클레오타이드, 최대 700개의 뉴클레오타이드, 최대 800개의 뉴클레오타이드, 최대 900개의 뉴클레오타이드, 또는 최대 1000개의 뉴클레오타이드 길이이다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 3 내지 5개의 뉴클레오타이드, 5 내지 10개의 뉴클레오타이드, 10-20개의 뉴클레오타이드, 20 내지 40개의 뉴클레오타이드, 40 내지 50개의 뉴클레오타이드, 50 내지 100개의 뉴클레오타이드, 100 내지 150개의 뉴클레오타이드, 150 내지 200개의 뉴클레오타이드, 200 내지 250개의 뉴클레오타이드, 250 내지 300개의 뉴클레오타이드, 300 내지 350개의 뉴클레오타이드, 350 내지 400개의 뉴클레오타이드, 400 내지 450개의 뉴클레오타이드, 또는 450 내지 500개의 뉴클레오타이드 길이이다.
일부 구현예에서, 폴리뉴클레오타이드는 ABCA4, ABCB4, ABCD1, ACADSB, ADA, ADAMTS13, AGL, ALB, ALDH3A2, ALG6, APC, APOB, AR, ATM, ATP7A, ATR, B2M, BMP2K, BRCA1, BRCA2, BTK, C3, CAT, CDH1, CDH23, CFTR, CHM, COL11A1, COL11A2, COL1A1, COL1A2, COL2A1, COL3A1, COL4A5, COL6A1, COL6A3, COL7A1, COL9A2, COLQ, CUL4B, CYBB, CYP17, CYP19, CYP27, CYP27A1, DES, DMD, DYSF, EGFR, EMD, ETV4, F13A1, F5, F7, F8, FAH, FANCA, FANCC, FANCG, FBN1, FECH, FGA, FGFR2, FGG, FIX, FLNA, FOXM1, FRAS1, GALC, GH1, GHV, HADHA, HBA2, HBB, HEXA, HEXB, HLCS, HMBS, HMGCL, HNF1A, HPRT1, HPRT2, HSF4, HSPG2, HTT, IDS, IKBKAP, INSR, ITGB2, ITGB3, JAG1, KRAS, KRT5, L1CAM, LAMA3, LDLR, LMNA, LPL, MADD, MAPT, MLH1, MSH2, MST1R, MTHFR, MUT, MVK, NF1, NF2, OAT, OPA1, OTC, PAH, PBGD, PCCA, PDH1, PGK1, PHEX, PKD2, PKLR, PLEKHM1, PLKR, POMT2, PRDM1, PRKAR1A, PROC, PSEN1, PTCH1, PTEN, PYGM, RP6KA3, RPGR, RSK2, SBCAD, SCN5A, SERPINA1, SLC12A3, SLC6A8, SMN2, SPINK5, SPTA1, TP53, TRAPPC2, TSC1, TSC2, TSHB, UGT1A1, CD46, 및 USH2A로 이루어진 군으로부터 선택된 유전자에 의해 코딩되는 서열을 포함한다. 일부 구현예에서, 폴리뉴클레오타이드는 전술한 유전자와 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 유전적 서열에 의해 코딩된 전구-mRNA이다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 하나 이상의 뉴클레오타이드 상에서 표지되거나 변형될 수 있다.
본 개시내용은 핵자기 공명(NMR) 분광학에 의해 폴리뉴클레오타이드 및/또는 폴리뉴클레오타이드-단백질 복합체에 결합하는 소분자 결합제를 확인하는 플랫폼 스크리닝 방법을 제공한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 임의의 표지가 없다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 동위원소적으로 표지된 뉴클레오타이드를 포함하지 않는다. 일부 다른 구현예에서, 표적 폴리뉴클레오타이드는 하나 이상의 원자 표지로 동위원소적으로 표지된 적어도 하나의 뉴클레오타이드를 포함한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 동위원소적으로 표지된 2개 이상의 뉴클레오타이드를 포함한다. 전형적으로, NMR 분광학에서 사용되는 원자 표지는 2H, 13C, 15N, 19F, 및 31P를 포함할 수 있다.
결합제
본 개시내용의 다양한 구현예에서, 적어도 하나의 결합제는 표적 폴리뉴클레오타이드를 함유하는 샘플에 도입된다. 일부 구현예에서, 표적 폴리뉴클레오타이드 자체는 소분자와 같은 결합제를 수용하는 인식 부분 또는 결합 포켓을 형성할 수 있다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 적어도 하나의 결합제와 복합체를 형성하여 추가의 결합제(들)를 수용하는 인식 부분 또는 결합 포켓을 형성한다. 본원에 개시된 결합제는 폴리뉴클레오타이드, 폴리펩타이드, 리보핵산단백질, 소분자, 또는 이의 임의의 조합일 수 있다. 일부 구현예에서, 결합제는 결합제의 혼합물일 수 있다. 일부 구현예에서, 2개 이상의 결합제는 표적 폴리뉴클레오타이드에 도입된다. 일부 구현예에서, 2개 이상의 결합제는 표적 폴리뉴클레오타이드와 함께 도입된다. 일부 구현예에서, 2개 이상의 결합제는 순차적으로 표적 폴리뉴클레오타이드에 도입될 수 있다.
일부 구현예에서, 결합제는 폴리뉴클레오타이드이다. 바람직한 구현예에서, 결합제는 snRNA 또는 이의 일부이다. 일부 구현예에서, 결합제는 U1 snRNA 또는 이의 일부이다. 일부 구현예에서, 결합제는 U2 snRNA 또는 이의 일부이다. 일부 다른 구현예에서, 결합제는 U1 snRNA, U2 snRNA, U4 snRNA, U5 snRNA, U6 snRNA, U11 snRNA, U12 snRNA, U4atac snRNA, U5 snRNA, U6atac snRNA, 또는 이의 임의의 부분이다. 일부 구현예에서, 결합제는 폴리펩타이드이다. 일부 구현예에서, 결합제는 리보핵산단백질의 단백질 구성요소이다. 일부 구현예에서, 결합제는 단백질의 도메인, 모티프, 또는 임의의 부분이다. 일부 구현예에서, 결합제는 U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP, U11 snRNP, U12 snRNP, U4atac snRNP, U5 snRNP, U6atac snRNP, 또는 이의 임의의 조합을 포함하는 군으로부터 선택된 단백질 또는 이의 일부일 수 있다. 일부 구현예에서, 결합제는 보조 스플라이싱 인자 또는 이의 일부일 수 있다. 예시적인 보조 스플라이싱 인자는, 비제한적으로, SR 단백질 및 hnRNP를 포함한다. 일부 구현예에서, 결합제는 SC35, SRp55, SRp40, SRm300, SFRS10, TASR-1, TASR-2, SF2/ASF, 9G8, SRp75, SRp30c, SRp20, P54/SFRS11, U2AF65, U2AF35, Urp/U2AF1-RS2, SF1/BBP, CBP80, CBP 20, PTB/hnRNP I, A1 hnRNP, A2/B1 hnRNP, L hnRNP, M hnRNP, K hnRNP, U hnRNP, F hnRNP, H hnRNP, G hnRNP, R hnRNP, I hnRNP, C1/C2 hnRNP, 또는 이의 임의의 조합을 포함하는 군으로부터 선택된 단백질 또는 이의 일부일 수 있다. 일부 구현예에서, 폴리펩타이드는 트랜스-작용 인자의 단백질 또는 단백질 구성요소이다. 일부 구현예에서, 폴리펩타이드는 RNA 스플라이싱과 관련된 단백질의 일부, 예컨대 도메인 또는 서브도메인이다. 일부 구현예에서, 폴리펩타이드는 SR, TRA2, SF, SRSF, U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP, U11 snRNP, U12 snRNP, U1-C, Sm 단백질, FBP11, SF3A, SF3B, U2AF65, U2AF35, PRP19 복합체 단백질, hnRNP 1, hnRNP 3, hnRNP C, hnRNP G, hnRNP K, hnRNP M, hnRNP U, ASF, SF2, 9G8, SRP20, TRA2a/b, SRP36, SRP35C, SRP30C, SRP38, SRP40, SRP55, SRP75, HUR, NFAR, NF45, YB1, 및 접합 복합체 단백질을 포함하는 군으로부터 선택된 하나의 단백질의 단백질 구성요소 또는 이의 일부이다. RNA 스플라이싱과 관련된 다른 예시적인 단백질은 mBBP, 폴리피리미딘 트랙트 결합 단백질(PTB), nPTB, KH-유형 스플라이싱 조절 단백질(KSRP), SAM68, STAR/GSG, ASD-2b, ASD-1, SUP-12, RNPC1, ASF, snRNP 보조 인자-35(U2AF35), ASF/SF2, Nova-1/2, Fox-1/2, 머슬-블라인드 유사(MBNL), CELF, Hu, TIA, TIAR, 및 이들의 별칭을 포함한다. 일부 구현예에서, 단백질은 단백질 변이체, 돌연변이체, 또는 단백질의 일부이다. 일부 구현예에서, 결합제는 소분자이다. 일부 구현예에서, 결합제는 소분자의 라이브러리이다. 다양한 소분자 라이브러리는 본원에 개시된 방법과 함께 사용될 수 있다.
일부 구현예에서, 제1 결합제는 표적 폴리뉴클레오타이드에 도입되어, 제1 결합제 및 표적 폴리뉴클레오타이드가 제1 복합체를 형성하게 한다. 일부 구현예에서, 제2 결합제는 표적 폴리뉴클레오타이드에 도입되어, 제1 복합체와 접촉한다. 일부 구현예에서, 제2 결합제는 제1 복합체와 함께 제2 복합체를 형성한다. 복합체는 핵산 이합체, 또는 폴리뉴클레오타이드-단백질 복합체, 또는 폴리뉴클레오타이드-소분자 복합체일 수 있다. 예를 들어, 폴리뉴클레오타이드를 포함하는 제1 결합제가 표적 폴리뉴클레오타이드에 도입되어 이합체를 형성한 다음, 폴리펩타이드 및 소분자를 포함하는 제2 결합제가 도입될 수 있다. 다른 예를 들어, 폴리뉴클레오타이드를 포함하는 제1 결합제가 표적 폴리뉴클레오타이드에 도입되어 이합체를 형성한 다음, 소분자를 포함하는 제2 결합제가 도입될 수 있다. 다른 예를 들어, 폴리펩타이드를 포함하는 제1 결합제가 표적 폴리뉴클레오타이드에 도입된 다음, 소분자를 포함하는 제2 결합제가 도입될 수 있다. 결합제를 표적 폴리뉴클레오타이드에 도입하기 위한 요구된 순서가 없음을 이해해야 한다. 일부 구현예에서, 결합제는 둘 이상의 분자를 포함할 수 있고, 상기 분자는 동시에 또는 순차적으로 도입될 수 있다.
폴리뉴클레오타이드, 또는 폴리뉴클레오타이드-폴리뉴클레오타이드 복합체, 또는 폴리뉴클레오타이드-단백질 복합체에 의해 형성된 결합 포켓은 소분자와 같은 결합제를 수용하는데 사용될 수 있다. 다양한 구현예에서, 표적 폴리뉴클레오타이드는 결합 포켓을 형성한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 추가의 폴리뉴클레오타이드에 결합하여 결합 포켓을 포함하는 복합체를 형성한다. 일부 구현예에서, 표적 폴리뉴클레오타이드는 단백질-RNA 복합체에 결합하여 결합 포켓을 형성한다. 일부 구현예에서, 결합 포켓은 돌출부, 또는 돌연변이, 또는 스템-루프, 또는 이의 임의의 조합을 포함한다. 일부 구현예에서, 결합 포켓은 돌출부, 돌연변이, 또는 스템-루프를 포함하지 않을 수 있다.
전구- mRNA 돌연변이 및 스플라이싱 오류
스플라이싱의 시스-작용 요소에서의 돌연변이는 스플라이싱 패턴을 변경할 수 있다. 일반적인 돌연변이는 5'ss, 3'ss, 및 BP 영역을 포함하는 코어 공통 서열, 또는 ESE, ESS, ISE, 및 ISS를 포함하는 다른 조절 요소에서 발견될 수 있다. 이들 시스-작용 요소에서의 돌연변이는 다수의 질환을 초래할 수 있다. 예시적인 질환이 표 1-3에 포함되어 있다. 본 개시내용은 시스-작용 요소에 하나 이상의 돌연변이를 함유하는 전구-mRNA를 표적화할 수 있는 소분자 결합제를 스크리닝하는 방법을 제공한다. 일부 구현예에서, 본 개시내용은 스플라이스 부위 또는 BP 영역에 하나 이상의 돌연변이를 함유하는 전구-mRNA를 표적화할 수 있는 소분자 결합제를 스크리닝하는 방법을 제공한다. 일부 구현예에서, 본 개시내용은 다른 조절 요소, 예를 들어, ESE, ESS, ISE, 및 ISS에 하나 이상의 돌연변이를 함유하는 전구-mRNA를 표적화할 수 있는 소분자 결합제를 스크리닝하는 방법을 제공한다.
시스-작용 요소에서의 돌연변이, 및 업스트림 신호전달 오류(mis-signaling)는 전구-mRNA에서 3차원적 구조 변화를 유도할 수 있다. 시스-작용 요소에서의 돌연변이 및 업스트림 신호전달 오류는 전구-mRNA가 적어도 하나의 snRNA, 또는 적어도 하나의 snRNP, 또는 적어도 하나의 다른 보조 스플라이싱 인자에 결합될 때 3차원적 구조 변화를 유도할 수 있다. 일부 구현예에서, 결합 포켓은 5'ss가 U1 snRNA 또는 이의 일부에 결합될 때 형성될 수 있다. 결합 포켓은 돌출부, 비돌연변이 단일 가닥 또는 이합체 RNA, 스템-루프, 또는 스템-루프, 돌연변이-함유 단일 및 이합체 RNA에 인접한 서열을 함유할 수 있다. 결합 포켓은 돌연변이를 포함하거나 포함하지 않을 수 있다. 일부 경우에, 결합 포켓은 결합 포켓의 업스트림/다운스트림에 돌연변이를 갖는 서열 부분을 포함하며, 이러한 돌연변이는 결합 포켓에서 RNA의 구조에 영향을 미친다. 일부 구현예에서, 5'ss가 스플라이싱과 관련된 다른 단백질 결합 파트너를 갖거나 갖지 않고 U1 snRNA 또는 이의 일부에 결합될 때 돌출부가 형성될 수 있다. 일부 구현예에서, 적어도 하나의 돌연변이를 함유하는 5'ss가 U1 snRNA 또는 이의 일부에 결합될 때 돌출부가 형성되도록 유도될 수 있다. 일부 구현예에서, 돌연변이는 잠재 5'ss의 사용을 유도하고 그것이 U1 snRNA 또는 이의 일부에 결합될 때 돌출부를 생성할 수 있다. 일부 구현예에서, 결합 포켓은 3'ss가 U2AF 또는 이의 일부에 결합될 때 형성될 수 있다. 일부 구현예에서, 돌연변이는 잠재 3'ss의 사용을 유도하고 그것이 U2AF 또는 이의 일부에 결합될 때 결합 포켓을 생성할 수 있다. 일부 구현예에서, 결합 포켓은 BP 영역이 U2 snRNA에 결합될 때 형성될 수 있다. snRNP의 단백질 구성요소는 이러한 결합 포켓을 형성하기 위해 존재하거나 존재하지 않을 수 있다. 예시적인 5'ss 서열이 표 1에 요약되어 있다. 본원에 개시된 방법에서 폴리뉴클레오타이드는 표 1에 요약된 5'ss 서열 중 어느 하나를 함유할 수 있다. 일부 구현예에서, 소분자는 돌출부에 결합할 수 있다.
본 개시내용의 일 양태에서, 표적 폴리뉴클레오타이드 상에 형성된 결합 포켓은 돌출부를 포함한다. 일부 구현예에서, 돌출부는 자연 발생이다. 일부 구현예에서, 돌출부는 스플라이스 부위 및 작은 핵 RNA 사이의 비정규 염기쌍에 의해 형성된다. 예를 들어, 돌출부는 5'ss 및 U1-U12 snRNA 중 어느 하나 사이의 비정규 염기쌍에 의해 형성될 수 있다. 돌출부는 1개의 뉴클레오타이드, 2개의 뉴클레오타이드, 3개의 뉴클레오타이드, 4개의 뉴클레오타이드, 5개의 뉴클레오타이드, 6개의 뉴클레오타이드, 7개의 뉴클레오타이드, 8개의 뉴클레오타이드, 9개의 뉴클레오타이드, 10개의 뉴클레오타이드, 11개의 뉴클레오타이드, 12개의 뉴클레오타이드, 13개의 뉴클레오타이드, 14개의 뉴클레오타이드, 또는 15개의 뉴클레오타이드를 포함할 수 있다.
일부 구현예에서, 3차원적 구조 변화는 돌출부 형성 없이 업스트림에서 돌연변이 또는 신호전달 오류에 의해 유도될 수 있다. 일부 구현예에서, 돌출부는 스플라이스 부위에서 임의의 돌연변이 없이 형성될 수 있다. 돌출부 형성을 갖거나 갖지 않는 보다 예시적인 5'ss 돌연변이가 표 1에 요약되어 있다. 본원에 개시된 방법에서 폴리뉴클레오타이드는 표 1에 요약된 5'ss 서열 중 어느 하나를 함유할 수 있다. 일부 구현예에서, 인식 부분은 임의의 시스-작용 요소에서의 돌연변이에 의해 형성될 수 있다. 일부 구현예에서, 소분자는 돌연변이에 의해 유도된 결합 포켓에 결합할 수 있다.
일부 구현예에서, 진정한(authentic) 5'ss에서의 돌연변이는 스플라이싱 동안 잠재 5'ss의 사용을 활성화시킬 수 있다. 예시적인 돌연변이된 진정한 5'ss 표적 및 상응하는 활성화된 잠재 스플라이스 부위 표적이 표 2에 요약되어 있다.
일부 구현예에서, 돌연변이는 ESE, ESS, ISE, 및 ISS를 포함하는 조절 요소 중 하나에 있을 수 있다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 스플라이스 부위를 포함하고, 스플라이스 부위는 NGAgunvrn, NHAdddddn, NNBnnnnnn, 및 NHAddmhvk로 이루어진 군으로부터 선택된 서열을 포함하며; N(또는 n)은 A, U, G 또는 C이고; B는 C, G, 또는 U이며; H는 A, C, 또는 U이고; d는 a, g, 또는 u이며; m은 a 또는 c이고; r은 a 또는 g이며; v는 a, c 또는 g이고; k는 g 또는 t이다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 스플라이스 부위를 포함하고, 스플라이스 부위는 NNBgunnnn, NNBhunnnn, 또는 NNBgvnnnn으로 이루어진 군으로부터 선택된 서열을 포함하며, N/n은 A, U, G 또는 C이고; B는 C, G, 또는 U이며; h는 a, c, 또는 t이고; v는 a, c 또는 g이다.
일부 구현예에서, 표적 폴리뉴클레오타이드는 스플라이스 부위를 포함하고, 스플라이스 부위는 NNBgtrrrn, NNBgtwwdn, NNBgtvmvn, NNBgtvbbn, NNBgtkddn, NNBgtbnbd, NNBhtnngn, NNBhtrmhd, 또는 NNBgvdnvn으로 이루어진 군으로부터 선택된 서열을 포함하며, N/n은 A, U, G 또는 C이고; B는 C, G, 또는 U이며; h는 a, c, 또는 u이고; v는 a, c 또는 g이며; r은 a 또는 g이고; m은 a 또는 c이며; d는 a, g 또는 u이고; k는 g 또는 u이며; w는 a 또는 u이다.
표 1. 예시적인 5' ss 서열 및 돌연변이
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
표 2. 예시적인 돌연변이된 진정한 스플라이스 부위 표적 및 상응하는 활성화된 잠재 스플라이스 부위 표적
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
NMR
핵자기 공명(NMR) 분광학은 유기 분자에 관한 정성적 및 정량적 정보를 결정하는데 사용되는 강력한 분석 기술일 수 있다. NMR은 작은 유기 화합물부터 단백질 및 핵산과 같은 중합체에 이르는 다양한 화학적 및 생물학적 분자의 구조를 해석하고 이에 관한 귀중한 정보를 제공하는데 사용될 수 있다. NMR에서, 샘플은 자기장에 놓여지고, 라모어 주파수(f)로 불리는 특징적인 주파수에서 무선주파수(RF) 여기를 받는다:
Figure pct00020
상기 식에서, γ는 핵의 자기회전비(gyromagnetic ratio)이고, B0는 자기장 강도이다. 자기장에서 핵은 제공된 에너지를 흡수하여 활성화된다. 흡수에 필요한 방사선의 주파수는 여기될 핵의 유형(예컨대, 1H 또는 13C, 또는 15N)에 의존하고, 주파수는 전형적으로 또한 핵의 화학적 환경(예컨대, 다양한 화학적 전기음성 그룹의 존재, 염, 용액의 pH, 및 결합제의 존재)에 의존할 것이며, 마지막으로, 자기장이 균일하지 않은 경우, 즉 자기장이 균질하지 않은 경우, 주파수는 또한 자기장에서의 공간 위치에 의존할 수 있다.
다양한 구현예에서, 2-D 구조 및/또는 3-D 원자 구조를 결정하는 방법은 상업적으로 이용가능한 분광계 주파수를 갖는, 예를 들어 약 1 GHz 초과의 1H 라모어 주파수의 NMR 장치를 이용하며, 약 1 GHz, 약 1 GHz 내지 약 20 MHz, 또는 약 900 MHz, 약 800 MHz, 약 700 MHz, 약 600 MHz, 약 500 MHz, 약 400 MHz, 약 300 MHz, 약 200 MHz, 약 100 MHz, 약 75 MHz, 약 50 MHz, 또는 약 20 MHz가 생체분자, 예를 들어, 폴리뉴클레오타이드의 구조를 결정하는데 사용될 수 있다. 단지 편의상, 본 방법의 개시내용은 폴리뉴클레오타이드를 사용하여 예시될 것이지만, 본원에 기재된 방법은 관심있는 표적 또는 원하는 생체분자로서 단백질 또는 폴리펩타이드의 상호작용 또는 구조를 결정하는데 적용될 수 있다. 단백질 및 폴리펩타이드를 선택적으로 표지화하는 방법은 당업계에 공지되어 있다. 일부 구현예에서, 본 기술의 방법은 300 MHz 이하의 1H 라모어 주파수를 제공하도록 작동가능한 NMR 모듈을 사용하여 수행될 수 있다.
일부 구현예에서, 더 낮은 자기장(예를 들어, 300 MHz 이하)이 사용될 수 있으며, 이는 의하게 단축할 수 있고 총 실험 시간을 높은 자기장의 1/4-1/5로 감소시킬 수 있는데, 반복 지연이 낮은 자기장에서 유의하게 더 짧은 Ti 이완 시간에 좌우되기 때문이다(즉, 4-8 ns의 상관 시간의 분자(25-50개 염기의 올리고뉴클레오타이드)의 경우 100 MHz에서의 Ti 이완 시간은 600 MHz에서의 Ti 이완 시간보다 6배 넘게 더 짧음). 높은 자기장과 낮은 자기장 사이의 이러한 Ti 이완 시간 차이는 분자량 또는 분자 크기가 증가할수록 더 커진다. 주어진 시간 내에, 낮은 자기장에서 4-5배 더 많은 측정이 반복되고 추가되어 2배의 신호 대 노이즈 증가를 얻을 수 있다.
일부 구현예에서, 낮은 자기장 NMR 장치, 예를 들어, 300 MHz 이하의 분광계 주파수를 갖는 NMR 장치를 사용하는 예기치 않은 이점이 있다. 일부 구현예에서, 방법은 폴리뉴클레오타이드와 같은 복잡한 구조에 관한 구조적으로 상세한 정보를 얻기 위해 낮은 자기장 NMR이 이용될 수 있다는 놀라운 발견으로부터 비롯된다. 낮은 자기장 NMR(즉, 300 MHz 이하의 1H 라모어 주파수)의 사용을 샘플의 선택적인 표지화와 조합하는 것은 화학적 이동 정보를 사용하여 복잡한 3-D 구조의 NMR 연구를 가능하게 하는 충분한 해상도를 제공한다.
일부 구현예에서, 본 개시내용의 방법은 낮은 자기장 NMR을 이용한다. 이들 방법은 예시적으로 정자기장(static magnetic field) 및 300 MHz 이하, 또는 약 299 MHz 이하, 또는 약 250 MHz 이하, 또는 약 225 MHz 이하, 또는 약 200 MHz 이하, 약 175 MHz 미만, 약 150 MHz 미만, 또는 약 125 MHz 미만, 또는 약 100 MHz 미만, 바람직하게는, 약 20 MHz 내지 약 300 MHz, 또는 약 20 MHz 내지 약 299 MHz, 또는 약 50 MHz 내지 약 275 MHz, 또는 약 75 MHz 내지 약 250 MHz, 또는 약 75 MHz 내지 약 225 MHz, 또는 약 75 MHz 내지 약 200 MHz, 또는 약 75 MHz 내지 약 175 MHz, 또는 약 100 MHz 내지 약 300 MHz, 또는 약 125 MHz 내지 약 275 MHz, 또는 약 20 MHz 내지 약 250 MHz, 또는 약 20 MHz 내지 약 225 MHz, 또는 약 20 MHz 내지 약 200 MHz, 또는 약 20 MHz 내지 약 150 MHz, 또는 약 20 MHz 내지 약 100 MHz 범위의 참조 주파수를 사용하여 하나 이상의 뉴클레오타이드로 선택적으로 표지된 표적 또는 선택된 폴리뉴클레오타이드의 조사를 포함한다.
일부 구현예에서, 많은 소분자 결합된 이분자 구조는 일반적으로 소분자에 결합될 때 결정된 생체분자 구조에 의존하는 컴퓨터 보조 약물 발견 노력을 포함하는 용도를 위해 결정될 수 있다.
어떤 소분자가 생체분자와 상호작용하는지 확인하기 위해, 일부 구현예에서, 균일하게 동위원소적으로 표지된 생체분자 샘플을 합성하고, 비교적 단단히 결합하는 소분자에 대해 NMR 신호에서 변화를 보일 것으로 예측되는 비율로(낮은 μM K d의 경우, 2:1 또는 4:1의 비율이 사용될 수 있음) 각 소분자를 개별적으로 또는 조합 방식으로 혼합하고, 화학적 이동, 공명 강도, 및/또는 NOE와 같은 NMR 데이터를 수집하고, 소분자의 존재하에서의 생체분자의 NMR 데이터를 소분자의 부재하에서의 생체분자의 NMR 데이터와 비교하고, NMR 데이터에서 유의한 변화를 일으키는 소분자를 선택한다. 일부 구현예에서, NMR 데이터에서의 변화는 화학적 이동 선폭의 일부, 예를 들어 하나의 선폭을 포함한다. 일부 구현예에서, NMR 데이터에서의 변화는, 소분자의 존재 및 부재하에서의 생체분자 NMR 데이터 비교가 유의할 때, NOE 및/또는 공명 강도의 유의한 감소를 포함한다. 다양한 구현예에서, 소분자의 NMR 데이터는 모니터링될 수 있고, 유사한 섭동(perturbation)이 관심있는 생체분자의 첨가시에 관찰될 수 있고, 여기서, 일부 구현예에서, 생체분자는 비동위원소적으로 표지된다. 다양한 구현예에서, 용액 환경의 차이로 인한 불규칙한 노이즈를 최소화하기 위해 각각의 샘플에 대해 동일한 용액 조건(예컨대, 완충액 또는 가용화 용액)이 사용된다.
방법
일부 양태에서, 본원에 기재된 방법은 제약 및 생명공학 산업에서 사용되는 약물 발견 패러다임에 적합하다. 첫 번째 예에서, 본원에 기재된 주제는 핵산(예컨대, RNA) 가소성(plasticity)을 이용하여 원자-해상도 핵산(예컨대, RNA) 구조를 해석하고 핵심 소분자-핵산(예컨대, RNA) 상호작용을 확인하기 위해 최적화된 결합 포켓을 밝힌다. 다양한 구현예에서, 이들 결합 포켓은 표적 스크리닝 동안 원자 수준 지침으로 효율적인 히트 확인을 제공한다. 두 번째 예에서, 선도물질 도출(hit-to-lead) 연구 및 선도물질 최적화를 위해 소분자를 추구함에 있어서, 원자-수준 상호작용은 의약 화학자들이 새로운 화합물을 합리적으로 설계할 수 있게 한다. 일부 구현예에서, 이것은 정확하고 효율적인 표적 검증을 제공한다.
일부 양태에서, 본 개시내용은 폴리뉴클레오타이드의 2차원(2-D) 또는 3차원(3-D) 원자 해상도 구조를 결정하는 방법을 제공한다. 방법은 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드 샘플을 제공하는 단계를 포함하고, 폴리뉴클레오타이드는 2H, 13C, 15N, 19F 및 31P로 이루어진 군으로부터 선택된 하나 이상의 원자 표지로 동위원소적으로 표지된 뉴클레오타이드를 포함하지 않거나 적어도 하나 포함한다. 일부 구현예에서, 방법은 NMR 장치를 사용하여 폴리뉴클레오타이드 샘플의 NMR 스펙트럼을 수득하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 밀접한 분자 상호작용을 갖는 하나 이상의 원자 또는 원자의 서브세트의 화학적 이동을 결정하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 화학적 이동으로부터 폴리뉴클레오타이드의 2-D 또는 3-D 원자 해상도 구조를 결정하는 단계를 추가로 포함한다.
일부 구현예에서, 제1 NMR 스펙트럼은 샘플 내의 제1 복합체에 대해 수득될 수 있고, 제2 NMR 스펙트럼은 샘플 내의 제2 복합체에 대해 수득될 수 있다. 제2 복합체는 제1 복합체보다 더 많은 하나 이상의 분자(예컨대 폴리뉴클레오타이드, 폴리펩타이드, 또는 소분자)를 함유할 수 있다. 일부 구현예에서, 방법은 제1 및 제2 NMR 스펙트럼을 비교하는 단계를 추가로 포함한다. 일부 구현예에서, NMR 스펙트럼은 소분자가 없는 폴리뉴클레오타이드 샘플에 대해 수득된다. 일부 구현예에서, NMR 스펙트럼은 소분자를 함유하는 폴리뉴클레오타이드 샘플에 대해 수득된다. 일부 구현예에서, 방법은 상이한 NMR 스펙트럼의 비교에 기초하여 결합제를 선택하거나 확인하는 단계를 포함한다. 일부 구현예에서, 방법은 상이한 NMR 스펙트럼의 비교에 기초하여 소분자를 선택하거나 확인하는 단계를 포함한다.
일부 구현예에서, 폴리뉴클레오타이드의 2-D 또는 3-D 구조를 결정하는 방법은 동일한 뉴클레오타이드 서열을 갖지만, 각각의 폴리뉴클레오타이드가 상이한 뉴클레오타이드 상에서 동위원소적으로 표지된다는 점에서 서로 상이한 다수의 폴리뉴클레오타이드의 조사를 필요로 할 수 있다. 다시 말해서, 방법은 다수의 폴리뉴클레오타이드의 화학적 이동을 결정하고, 각각의 폴리뉴클레오타이드는 분석된 제1 폴리뉴클레오타이드와 동일한 뉴클레오타이드 서열을 갖고, 각각의 폴리뉴클레오타이드는 하나 이상의 원자 표지로 표지된 상이한 뉴클레오타이드를 이용하여 합성된다. 예를 들어, 폴리뉴클레오타이드가 5개의 뉴클레오타이드를 갖는 경우, 방법은 5개의 폴리뉴클레오타이드 샘플을 필요로 할 것이며, 각각의 폴리뉴클레오타이드는 상이한 뉴클레오타이드 상에 하나 이상의 원자 표지로 표지된다. 이러한 동일한 5-머 폴리뉴클레오타이드 예에서, 방법은 폴리뉴클레오타이드 내의 하나 이상의 뉴클레오타이드를 본원에 기재된 바와 같은 하나 이상의 원자 표지로 전략적으로 표지화함으로써 뉴클레오타이드 서열에 존재하는 뉴클레오타이드의 수보다 더 적은 수의 구별되는 뉴클레오타이드를 이용할 수 있다. 일부 구현예에서, 폴리뉴클레오타이드 샘플은 하나의 뉴클레오타이드 표지 패턴을 갖는 하나의 폴리뉴클레오타이드만을 갖는다. 다른 구현예에서, 폴리뉴클레오타이드 샘플은 2개 이상의 폴리뉴클레오타이드를 함유할 수 있고, 각각은 하나 이상의 원자 표지로 표지된 상이한 뉴클레오타이드를 갖는다.
일부 양태에서, 방법은 약 1 GHz 내지 약 20 MHz 범위의 NMR 분광계 주파수를 이용하여 폴리뉴클레오타이드 샘플을 검사함으로써 폴리뉴클레오타이드 샘플의 NMR 스펙트럼을 수득한다. 이들 양태 중 하나에서, NMR 분광계 주파수는 300 MHz 이하, 예를 들어, 약 20 MHz 내지 약 100 MHz이다.
일부 구현예에서, NMR 검사는 다음 6단계 중 하나 이상을 포함한다. 첫째, 일부 구현예에서, 온도 조절 단계를 포함한다. 이 양태에서, 적절한 화학적 환경 중에 관심있는 폴리뉴클레오타이드를 함유하는 액체 샘플을 샘플 도관으로 옮기고 분석 부피를 NMR 조사를 위한 샘플로 채운다. 둘째, 일부 구현예에서, 샘플 도관 내의 샘플을 0 내지 60℃ 범위의 선택된 온도에서 평형화시킨다. 셋째, 일부 구현예에서, 조정(tuning) 및 매칭 단계가 수행될 수 있다. 이러한 과정은 공진 회로 주파수 및 임피던스가 회로에 전송된 펄스의 주파수 및 전송 선로의 임피던스(전형적으로 50 ohm)와 일치할 때까지 공진 회로 주파수 및 임피던스를 조정한다. 최상의 신호 대 노이즈 및 최소 RF 코일 가열을 위해, 조정 및 매칭은 각 샘플에 대해 수행될 수 있다. 그러나, 제조 과정 동안 사전 조정을 이용하면, 낮은 자기장 자석(low field magnet)에 대해 경미한 조정이 필요하거나 조정이 필요하지 않다. 넷째, 일부 구현예에서, 잠금(locking) 단계가 수행된다. 이 과정에서, 2H 신호는 자기장 표류(drift)가 보상될 수 있는 내부 피드백 기전을 위해 중수소 용매로부터 발견된다. 1H 신호와 떨어져 있는 2H 신호(예를 들어, 200 MHz 분광계에서 30.7 MHz)는 독립적으로 획득 및 처리된다. 잠금 신호는 또한 화학적 이동 기준의 역할을 한다.
다섯째, 일부 구현예에서, 검사 중인 샘플에 대해 NMR 데이터를 수득하기 전에, 시밍(shimming) 단계가 수행된다. 일부 구현예에서, 검사 단계는 상이한 기하학 및 강도의 작은 정자기장을 생성하고 B0의 비균일성을 교정하는 코일 세트에서 전류를 제어함으로써 분석 부피에서 균일한 자기장을 생성하는 것을 요구할 수 있다. 본 개시내용의 생체분자의 NMR 검사를 위해, NMR을 사용하여 샘플을 분석할 때 적어도 50 ppb(10억분의 1)의 장 균일성을 갖는 것이 바람직하다.
여섯째, 일부 구현예에서, 샘플에서 핵의 스핀 양자 상태를 조절하기 위해 분석 부피 주위의 각각의 공진 회로에 연결된 1H 및 13C 전송 선로에 일련의 정밀한 펄스 및 지연이 적용된다. 그 결과, 다른 핵에 부착된 모든 다른 1H 핵 스핀을 제외한 13C에 부착된 1H 핵 스핀과 같은 원하는 신호만이 선택 및 측정되거나, 성형된 펄스(선택적 펄스)를 사용하여 특정 화학적 이동 범위를 갖는 핵이 검출된다. 1-D, 2-D, 및 3-D 실험 설정에서 생체분자의 구조적 결정을 위한 다양한 HSQC, HMQC, COSY, TOCSY, NOESY, ROESY를 포함하여 많은 상이한 유형의 펄스 시퀀스가 상이한 목적을 위해 적용될 수 있다. 일부 구현예에서, 펄스 시퀀스 후, 동일한 공진 회로(2개 이상의 RF 코일 포함)는 미리 결정된 지속시간 동안 디지털화되고 기록되는 전압으로서 분석 부피 주위의 자기장의 변동(FID; 자유 유도 감쇠로 불림)을 감지하고 있다. 신호 대 노이즈(S/N)를 개선하기 위해, 펄싱 및 기록 단계의 세트가 여러 번 반복되고 펄싱을 시작하기 전에 스핀 시스템을 초기 상태로 되돌리는 이완 지연으로 불리는 일부 지연이 그 사이에 추가된다.
일부 양태에서, 본 개시내용은 관심있는 생체분자와 상호작용할 수 있는 소분자, 생체분자, 리간드 또는 다른 화학 물질(집합적으로 결합제로 지칭됨)과 혼합될 때 표적 생체분자의 구조를 결정하는 방법을 제공한다. 결합제의 첨가시 화학적 이동 변화는 생체분자가 결합제와 상호작용하고 있을 수 있음을 나타낸다. 결합제의 존재하에서의 화학적 이동이 수집되고 생체분자 및 결합된 결합제의 생체분자 구조를 결정하는데 사용될 수 있다. 이 양태의 일부 구현예에서, 방법은 복수의 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드 샘플을 제공하는 단계로서, 복수의 폴리뉴클레오타이드는 동일한 뉴클레오타이드 서열을 가지며, 각각의 폴리뉴클레오타이드는 2H, 13C, 15N, 19F 및 31P로 이루어진 군으로부터 선택된 하나 이상의 원자 표지로 동위원소적으로 표지된 적어도 하나의 뉴클레오타이드를 포함하는 것인 단계; 폴리뉴클레오타이드 샘플을 결합제와 혼합하여 복수의 결합된 복합체를 형성하는 단계; NMR 장치를 사용하여 결합된 복합체의 NMR 스펙트럼을 수득하는 단계; 하나 이상의 원자 표지의 화학적 이동을 결정하는 단계; 및 화학적 이동으로부터 폴리뉴클레오타이드의 3-D 원자 해상도 구조를 결정하는 단계를 포함한다.
본 방법의 일부 구현예에서, 표적 폴리뉴클레오타이드는 모두 동일한 뉴클레오타이드 서열을 갖지만 동위원소적으로 표지된 뉴클레오타이드(들)의 위치(들)가 상이한 복수의 폴리뉴클레오타이드를 생성함으로써 분석된다. 일부 구현예에서, 폴리뉴클레오타이드의 2차 구조는 폴리뉴클레오타이드 샘플의 수를 감소시키기 위해 표지된 뉴클레오타이드 또는 뉴클레오타이드의 배치를 결정하는데 사용된다. 폴리뉴클레오타이드의 1차 서열을 취하여, 2차 구조가 예측된다. 이후, 복수의 2차 구조 예측이 2차 구조 예측 알고리즘(예컨대, 최근접 이웃 알고리즘) 또는 컴퓨터 프로그램을 사용하여 계산될 수 있다. 이후, 방법은 상위 10개 정도의 2차 구조 예측을 이용한 정렬 단계를 사용하며 2차 구조에서 가장 큰 변동을 나타내는 부위를 결정한다. 이후, 가장 큰 변동을 나타내는 폴리뉴클레오타이드 서열 내의 부위 또는 부위들은 NMR 검출 또는 파생물에 대해 동위원소적으로 표지되고, 폴리뉴클레오타이드당 하나 이상의 뉴클레오타이드가 표지된다. 표지화 방식은 화학적 이동 데이터베이스로부터 알 수 있으며, 이에 의해 화학적 이동 분산을 최대화하면서 다수의 동위원소 표지가 폴리뉴클레오타이드 내로 도입될 수 있다.
일부 구현예에서, 본 개시내용은 3-D 원자 해상도 구조의 결정 또는 폴리뉴클레오타이드의 다른 NMR 상호작용 데이터의 수집을 위해 폴리뉴클레오타이드 서열 내의 하나 이상의 뉴클레오타이드의 하나 이상의 특이적 동위원소 표지 위치를 결정하는 방법을 제공한다. 방법은 하나 이상의 폴리뉴클레오타이드를 제공하는 단계로서, 하나 이상의 폴리뉴클레오타이드 각각은 동일한 폴리뉴클레오타이드 서열을 갖고, 하나 이상의 폴리뉴클레오타이드 각각은 2H, 13C, 15N, 19F 또는 31P를 포함하는 동위원소 표지로 표지된 하나 이상의 뉴클레오타이드를 포함하는 것인 단계; 컴퓨터 알고리즘(예컨대, MC-Sym|MC-fold)을 사용하여 폴리뉴클레오타이드 서열의 복수의 구조를 예측하는 단계; S2<0.8 및/또는 RMSF>0.5Å를 포함하는 지표를 사용하여 큰 구조적 변이를 나타내는 복수의 폴리뉴클레오타이드 구조 각각에서의 하나 이상의 영역(들)을 확인하는 단계; 예측된 구조로부터 나이미룸(Nymirum)의 랜덤 포레스트™ 예측기(RAMSEY), SHIFTS, NUCHEMICS, 및 QM 방법과 같은 화학적 이동 예측기를 사용하여 큰 구조적 변이를 갖는 예측된 구조의 영역으로부터 복수의 화학적 이동을 계산하는 단계; 및 화학적 이동 분산(dispersion)이 최대화되고 샘플의 수가 최소화되도록 각각의 폴리뉴클레오타이드 샘플(들) 상의 하나 이상의 특이적 동위원소 표지 위치를 결정하는 단계를 포함한다. MC-Fold|MC-Sym 파이프라인은 RNA 2차 및 3차 구조 예측을 위한 웹 호스팅 서비스이다. 파이프라인은 MC-Fold에 대한 입력 서열이 2차 구조를 출력하고, 상기 2차 구조가 MC-sym에 직접 입력되고, 상기 MC-sym이 3차 구조를 출력하는 것을 의미한다.
일부 양태에서, 본 발명은 표준 실험실 벤치 위에 있을 정도로 작은 NMR 장치를 제공한다. 제2 양태의 일부 구현예에서, NMR 장치는 하우징; 폴리뉴클레오타이드를 포함하는 샘플을 수용하도록 작동가능한 샘플 취급 장치; 및 NMR 모듈을 포함한다. NMR 모듈은 샘플 취급 장치로부터 샘플의 적어도 일부를 수용하도록 작동가능한 분석 부피를 포함하는 샘플 도관; 분석 부피에 근접하게 배치된 복수의 무선주파수 코일로서, 각각의 코일은 분석 부피에서 폴리뉴클레오타이드의 핵의 핵자기 공명을 발생시키기 위해 분석 부피에 걸쳐 구별되는 여기 주파수 펄스를 생성하도록 작동가능한 것인 코일; 및 분석 부피 및 무선주파수 코일을 가로질러 정자기장을 제공하도록 작동가능한 적어도 하나의 자석을 포함할 수 있다. NMR 모듈은 1H 라모어 주파수 of 300 MHz 이하의 1H 라모어 주파수를 가질 수 있고, RF 코일은 여기 주파수 펄스를 분석 부피에 전송하고 분석 부피에 함유된 폴리뉴클레오타이드의 핵에 의해 생성된 NMR로부터 시그널을 검출하도록 작동가능하다. 선택적으로, 장치는 분석 부피와 열적 결합된 가열 및 냉각 장치를 추가로 포함한다. 이와 관련하여, NMR 장치는 생체분자, 예를 들어 단백질 또는 핵산, 예를 들어, RNA 폴리뉴클레오타이드를 함유하는 샘플을 가열하여 폴리뉴클레오타이드를 어닐링시키고 NMR 스펙트럼을 획득하기 전에 폴리뉴클레오타이드를 이완되거나 안정한 입체형태로 두기 위한 샘플 도관 또는 분석 부피 가열 및 냉각 장치의 사용을 이용할 수 있다.
특정 구현예에서, 폴리뉴클레오타이드 샘플을 제공하는 방법 단계는 각각 2-D 또는 3-D 구조 예측 알고리즘을 사용하여 폴리뉴클레오타이드 서열의 하나 이상의 2-D 또는 3-D 모델을 결정하는 단계; 폴리뉴클레오타이드 서열의 하나 이상의 2-D 또는 3-D 모델 각각에서 하나 이상의 구조적 분균일(heterogeneous) 영역을 확인하는 단계; 하나 이상의 구조적 불균일 영역으로부터 하나 이상의 화학적 이동을 계산하는 단계; 및 하나 이상의 핵에 위치한 하나 이상의 원자 표지를 갖는 하나 이상의 뉴클레오타이드를 포함하는 폴리뉴클레오타이드를 합성하여 최소화된 화학적 이동 중첩을 갖는 폴리뉴클레오타이드를 초래하는 단계를 포함한다.
일부 구현예에서, 3-D 원자 해상도 구조를 결정하는 것은 뉴클레오타이드 서열 및 하나 이상의 2-D 구조 예측 알고리즘을 사용하여 복수의 이론적인 구조적 폴리뉴클레오타이드 2-D 모델을 생성하는 단계; 복수의 이론적인 구조적 폴리뉴클레오타이드 2-D 모델 및 선택적으로 하나 이상의 공지되거나 추정된 폴리뉴클레오타이드 2-D 모델을 사용하는 3-D 구조 예측 알고리즘을 사용하여 복수의 이론적인 구조적 폴리뉴클레오타이드 3-D 모델을 생성하는 단계; 복수의 이론적인 구조적 폴리뉴클레오타이드 3-D 모델 각각에 대해 예측된 화학적 이동 세트를 생성하는 단계; 예측된 화학적 이동 세트를 하나 이상의 원자의 화학적 이동(들)과 비교하는 단계; 및 각각의 예측된 화학적 이동 세트 및 하나 이상의 원자 표지의 화학적 이동(들) 사이에 일치하는 하나 이상의 이론적인 구조적 폴리뉴클레오타이드 3-D 모델을 하나 이상의 3-D 원자 해상도 구조로서 선택하는 단계를 포함한다. 일부 구현예에서, 예측된 화학적 이동 세트는 각각의 이론적인 구조적 폴리뉴클레오타이드 3-D 모델을 NMR-데이터 폴리뉴클레오타이드 구조 데이터베이스와 비교함으로써 생성된다. 일부 구현예에서, 예측된 화학적 이동 세트를 생성하는 것은 하나 이상의 실험적으로 결정된 폴리뉴클레오타이드 3-D 구조로부터 원자 좌표, 적층 결합, 자화율, 전자기장, 또는 이면각을 포함한 폴리뉴클레오타이드 구조적 지표를 계산하는 단계; 회귀 알고리즘을 사용하여 실험적으로 결정된 3-D 폴리뉴클레오타이드 구조의 실험적 화학적 이동 및 폴리뉴클레오타이드 구조적 지표 사이의 관계를 설명하는 수학적 함수 또는 객체의 세트를 생성하는 단계; 이론적인 구조적 폴리뉴클레오타이드 3-D 모델 각각에 대해 폴리뉴클레오타이드 구조적 지표를 계산하는 단계; 및 이론적인 구조적 폴리뉴클레오타이드 3-D 모델 각각에 대한 폴리뉴클레오타이드 구조적 지표를 수학적 함수 또는 객체의 세트에 입력하여 예측된 화학적 이동 세트를 생성하는 단계를 포함한다.
일부 구현예에서, 회귀 알고리즘은 랜덤 포레스트(Random Forest) 알고리즘을 포함하는 기계 학습 알고리즘이다. 일부 구현예에서, 실험적 화학적 이동 세트를 결정하는 것은 약 1 GHz 내지 약 20 MHz의 NMR 분광계 주파수를 사용하여 화학적 이동 세트를 모델링하는 단계를 포함한다.
일부 구현예에서, 3-D 원자 해상도 구조를 결정하는 것은 뉴클레오타이드 서열 및 하나 이상의 2-D 구조 예측 알고리즘을 사용하여 복수의 이론적인 구조적 폴리뉴클레오타이드 2-D 모델을 생성하는 단계; 복수의 이론적인 구조적 폴리뉴클레오타이드 2-D 모델 및 선택적으로 하나 이상의 공지되거나 추정된 폴리뉴클레오타이드 2-D 모델을 사용하는 3-D 구조 예측 알고리즘을 사용하여 복수의 이론적인 구조적 폴리뉴클레오타이드 3-D 모델을 생성하는 단계; 복수의 이론적인 구조적 폴리뉴클레오타이드 3-D 모델 각각에 대해 예측된 화학적 이동 세트를 생성하는 단계; 예측된 화학적 이동 세트를 하나 이상의 원자의 화학적 이동(들)과 비교하는 단계; 및 각각의 예측된 화학적 이동 세트 및 하나 이상의 원자 표지의 화학적 이동(들) 사이에 일치(예컨대, 최상의 일치)하는 하나 이상의 이론적인 구조적 폴리뉴클레오타이드 3-D 모델을 하나 이상의 3-D 원자 해상도 구조로서 선택하는 단계를 포함한다.
일부 구현예에서, 방법은 또한 하나 이상의 3-D 원자 해상도 구조에서 결합 포켓을 확인하는 단계를 포함한다. 일부 구현예에서, 방법은 또한 또 다른 분자를 하나 이상의 3-D 원자 해상도 구조 각각의 확인된 결합 포켓과 결합시키는 단계를 포함한다. 일부 구현예에서, 방법은 또한 에너지 최소화 및/또는 분자 동역학 시뮬레이션을 포함하는 하나 이상의 기능을 수행하는 모델링 소프트웨어를 사용하여 결합된 또 다른 분자 및 하나 이상의 3-D 원자 해상도 구조 각각의 결합 포켓을 개선하는 단계를 포함한다. 일부 구현예에서, 방법은 또한 하나 이상의 개선된 3-D 원자 해상도 구조에서 결합 포켓을 확인하는 단계를 포함한다. 일부 구현예에서, 방법은 또한 개선된 3-D 구조에서 결합된 또 다른 분자의 하나 이상의 좌표 및 하나 이상의 3-D 원자 해상도 구조 각각의의 결합 포켓을 사용하는 단계를 포함한다. 일부 구현예에서, 예측된 화학적 이동 세트는 각각의 이론적인 구조적 폴리뉴클레오타이드 3-D 모델을 NMR-데이터 폴리뉴클레오타이드 구조 데이터베이스와 비교함으로써 생성된다.
일부 구현예에서, 예측된 화학적 이동 세트를 생성하는 단계는 하나 이상의 실험적으로 결정된 폴리뉴클레오타이드 3-D 구조로부터 원자 좌표, 적층 결합, 자화율, 전자기장, 또는 이면각을 포함한 폴리뉴클레오타이드 구조적 지표를 계산하는 단계; 회귀 알고리즘을 사용하여 실험적으로 결정된 3-D 폴리뉴클레오타이드 구조의 실험적 화학적 이동 및 폴리뉴클레오타이드 구조적 지표 사이의 관계를 설명하는 수학적 함수 또는 객체의 세트를 생성하는 단계; 이론적인 구조적 폴리뉴클레오타이드 3-D 모델 각각에 대해 폴리뉴클레오타이드 구조적 지표를 계산하는 단계; 및 이론적인 구조적 폴리뉴클레오타이드 3-D 모델 각각에 대한 폴리뉴클레오타이드 구조적 지표를 수학적 함수 또는 객체의 세트에 입력하여 예측된 화학적 이동 세트를 생성하는 단계를 포함한다.
일부 구현예에서, 구조적 역학은 시간적 방식으로 NMR에 의해 구조적 정보를 수득함으로써 결정될 수 있다. 예를 들어, 소분자를 표적 폴리뉴클레오타이드에 결합시킬 때, 표적 폴리뉴클레오타이드에 결합하는 소분자의 구조적 정보는 소분자를 표적 폴리뉴클레오타이드에 접촉시킨 후 NMR에 의해 상이한 시간에 결정될 수 있다. 구조적 정보는 상이한 시점에 NMR 스펙트럼을 취함으로써 수득될 수 있다. 상이한 시점에 취한 NMR 스펙트럼은 화학적 이동을 계산하는데 사용될 수 있고, 화학적 이동은 결합 동역학을 결정하기 위해 비교될 수 있다.
일부 구현예에서, 소분자 및 표적 폴리뉴클레오타이드 사이의 결합 동역학은 당업계의 다양한 방법에 의해 결정될 수 있다. 예를 들어, 결합 동역학을 측정하기 위한 동역학 분석은, 비제한적으로, 표면 플라즈몬 공명(SPR), 생물층 간섭계(BLI) 기술(Octet Systems), 등온 적정 열량 측정법(ITC), 또는 형광 이방성을 포함한다. 일부 구현예에서, 확인된 소분자 및 표적 폴리뉴클레오타이드를 확인하기 위해 하나 이상의 결합 동역학 분석이 사용된다.
RNA 스플라이싱의 결합 동역학은 광범위하게는 선택적 스플라이싱 기구가 구조적 RNA와 함께 기능하고 전구-mRNA 스플라이싱, 인트론의 절제 및 엑손의 융합의 기능을 수행하여 최종 성숙한 mRNA 이소형을 생산하는 기전을 포함할 수 있다. 스플라이싱의 동역학은 전체 순 효과가 엑손 포함 또는 엑손 포함일 수 있도록 엑손 포함의 양성 및 음성 조절제 모두와 관련된 매우 역동적인 과정일 수 있다. 소분자와 같은 결합제는 이러한 과정과 상호작용할 수 있고 스플라이소좀 복합체를 형성하는 특히 관련된 트랜스-작용 결합 인자의 친화성에 영향을 주어 한 방향으로 엑손 스플라이싱에 영향을 미칠 수 있다. 결합 동역학은 k on, k off, 및 K d를 포함하는 다양한 매개변수에 의해 반영될 수 있다. 더 낮은 K d는 일반적으로 더 강한 결합을 나타내며, 따라서 더 높은 결합 친화성을 나타낸다.
표적에 결합하는 소분자의 결합 동역학은 소분자가 강한 결합제인지 아닌지 결정하는데 사용될 수 있다. 소분자를 갖거나 갖지 않는 또 다른 폴리뉴클레오타이드(예컨대, 표적 폴리뉴클레오타이드)에 결합하는 폴리뉴클레오타이드의 결합 동역학은 2개의 폴리뉴클레오타이드가 소분자의 존재하에 더 강하게 또는 더 약하게 결합하는지 결정하는데 사용될 수 있다. 소분자를 갖거나 갖지 않는 표적 폴리뉴클레오타이드에 결합하는 단백질의 결합 동역학은 단백질이 소분자의 존재하에 더 강하게 또는 더 약하게 결합하는지 유추하는데 사용될 수 있다. K d는 일정한 농도의 표적의 존재하에 다양한 농도의 결합제에 의해 결정될 수 있다. 예를 들어, 표적 mRNA 또는 RNA-RNA 이합체에 결합하는 소분자의 K d를 결정하는데 있어서, 소분자의 농도는 변경될 수 있다. K d는 또한 결합 과정 동안 k onk off를 측정함으로써 결정될 수 있고, 이는 K d를 계산하는데 사용될 수 있다.
일부 구현예에서, 결합제 및 표적 폴리뉴클레오타이드 사이의 결합 동역학이 결정될 수 있다. 일부 구현예에서, 결합제 및 RNA-RNA 복합체 사이의 결합 동역학이 결정될 수 있다. 일부 구현예에서, 결합제 및 RNA-단백질 복합체 사이의 결합 동역학이 결정될 수 있다. 예를 들어, 소분자 및 표적 폴리뉴클레오타이드(예컨대 mRNA) 사이의 결합 동역학은 결합이 얼마나 강한지 추론하기 위해 결정될 수 있다.
일부 구현예에서, 소분자 결합제를 갖거나 갖지 않는 RNA-RNA 이합체를 형성하기 위해 표적 폴리뉴클레오타이드에 결합하는 폴리뉴클레오타이드의 결합 동역학이 결정될 수 있다. 일부 구현예에서, 소분자 결합제를 갖거나 갖지 않는 표적 폴리뉴클레오타이드에 결합하는 폴리뉴클레오타이드의 결합 동역학이 결정될 수 있고, 소분자를 갖거나 갖지 않는 결합 동역학을 비교하여 폴리뉴클레오타이드가 소분자를 갖는 표적 폴리펩타이드와 더 강하게 또는 더 약하게 결합하는지 추론할 수 있다.
일부 구현예에서, 소분자 결합제를 갖거나 갖지 않는 단백질-RNA 복합체를 형성하기 위해 표적 RNA에 결합하는 단백질 또는 단백질 구성요소/폴리펩타이드의 결합 동역학이 결정될 수 있다. 일부 구현예에서, 소분자 결합제를 갖거나 갖지 않는 표적 폴리뉴클레오타이드에 결합하는 단백질 또는 폴리펩타이드의 결합 동역학이 결정되고, 소분자를 갖거나 갖지 않는 결합 동역학을 비교하여 단백질이 소분자를 갖는 표적 폴리펩타이드와 더 강하게 또는 더 약하게 결합하는지 추론할 수 있다.
일부 구현예에서, 소분자 결합제를 갖거나 갖지 않는 복합체를 형성하기 위해 표적 RNA에 결합하는 단백질-RNA 복합체의 결합 동역학이 결정될 수 있다. 일부 구현예에서, 소분자 결합제를 갖거나 갖지 않는 표적 폴리뉴클레오타이드에 대한 단백질-RNA 복합체 결합의 결합 동역학이 결정되고, 소분자를 갖거나 갖지 않는 결합 동역학을 비교하여 단백질-RNA 복합체가 소분자를 갖는 표적 폴리펩타이드와 더 강하게 또는 더 약하게 결합하는지 추론할 수 있다.
일부 구현예에서, 소분자 결합제는 NMR 분석에 의해 선택된 다음, 동역학 분석에서 시험된다. 예를 들어, 동역학 분석은 동일한 표적(예컨대, RNA, RNA-RNA 복합체, 또는 RNA-단백질 복합체)에 대한 2개 이상의 상이한 분자의 결합 동역학을 측정하고 K d를 비교하여 어떤 소분자가 강한 결합제인지 추론하는데 사용될 수 있다. 동역학 분석은 NMR 초기 스크리닝 후 2차 스크리닝 분석으로서의 역할을 할 수 있다. 일부 구현예에서, 동역학 분석은 또한 초기 스크리닝 분석으로서의 역할을 할 수 있고, 이어서 구조적 결정을 위한 NMR이 뒤따를 수 있다.
일부 구현예에서, 결합 동역학은 SPR 및/또는 BLI에 의해 측정된다. 이러한 경우, 폴리뉴클레오타이드는 표면에 고정화된다. 일부 상황에서, 표적 폴리뉴클레오타이드(예컨대, 표적 mRNA)는 표면에 고정화된다. 일부 상황에서, snRNA와 같은 폴리뉴클레오타이드는 표면에 고정화된다. 폴리뉴클레오타이드를 표면에 고정화시키는 방법은 폴리뉴클레오타이드를 바이오틴으로 표지하고, 표면을 스트렙타비딘과 접합시켜, 폴리뉴클레오타이드를 바이오틴-스트렙타비딘 상호작용을 통해 고정화시키는 단계를 포함할 수 있다.
일부 구현예에서, 결합 동역학은 형광 이방성에 의해 측정되고, 폴리뉴클레오타이드는 형광단으로 표지될 수 있다. 일부 다른 구현예에서, 결합 동역학은 ITC에 의해 측정된다.
임의의 상기 언급된 구현예에서, 동역학 분석은 하나 이상의 폴리뉴클레오타이드 분자, 또는 하나 이상의 폴리펩타이드 또는 이의 일부의 존재하에 시험될 수 있다. 예를 들어, 5'ss를 함유하는 표적 mRNA에 결합하는 U1 snRNP는 스플라이싱에 관여하는 하나 이상의 보조 스플라이싱 인자 또는 단백질의 존재하에 시험될 수 있다. 본원에 사용된 단백질은 단백질의 일부, 예를 들어 도메인을 포함할 수 있다.
소분자의 특이성을 결정하는 방법이 또한 본원에 제공된다. 예를 들어, 초기 NMR 스크리닝에 의해 선택된 소분자는 상이한 표적에 대한 소분자의 결합 친화성을 결정하기 위해 임의의 상기 언급된 동역학 분석에서 시험될 수 있다. 표적은 단백질 또는 이의 일부의 존재 또는 부재하에 snRNA와 결합된 표적 mRNA일 수 있다. 일부 구현예에서, 소분자의 특이성은 표적 mRNA(예컨대, 5'ss) 및 snRNA(예컨대, U1 snRNA)를 포함하는 상이한 RNA-RNA 이합체에 대해 시험될 수 있다. 일부 구현예에서, 소분자의 특이성은 표적 mRNA(예컨대, 5'ss), snRNA(예컨대, U1 snRNA) 및 단백질 또는 단백질 도메인(예컨대, U1-C 아연 핑거 도메인)을 포함하는 상이한 단백질-RNA 복합체에 대해 시험된다.
가상 스크리닝 또는 구조 기반 약물 설계는 NMR 연구 후에 수행될 수 있다. 상기 언급된 NMR 연구에서, 3차원 구조적 모델이 임의의 결합 파트너(예컨대, 폴리뉴클레오타이드, 또는 폴리펩타이드)의 존재하에 각각의 표적 폴리뉴클레오타이드에 대해 생성될 수 있다. 예를 들어, 3차원 구조적 모델이 snRNA 또는 이의 일부와 결합된 표적 mRNA에 대해 생성될 수 있고 결합 포켓이 RNA-RNA 이합체에 대해 확인될 수 있다. 또 다른 예를 들어, 3차원 구조적 모델이 단백질 결합 파트너 또는 단백질의 도메인의 존재하에 snRNA과 결합된 표적 mRNA에 대해 생성될 수 있고, 결합 포켓이 RNA-단백질 복합체에 대해 확인될 수 있다. 확인된 결합 포켓은 구조 기반 약물 설계 또는 가상 스크리닝 과정에 추가로 사용될 수 있다. 구조 기반 약물 설계(또는 직접 약물 설계)는 x-선 결정학 또는 NMR 분광학과 같은 방법을 통해 수득된 생물학적 표적 분자(예컨대, mRNA)의 3차원 구조의 지식에 의존할 수 있다. 표적의 실험적 구조가 이용가능하지 않은 경우, 관련 분자의 실험적 구조에 기초하여 표적의 상동성 모델을 생성하는 것이 가능할 수 있다. 생물학적 표적의 구조를 사용하여, 표적에 대해 높은 친화성 및 선택성으로 결합할 것으로 예상되는 후보 약물이 대화형 그래픽 및 의약 화학자의 직관을 사용하여 설계될 수 있다. 대안적으로 다양한 자동 계산 절차가 새로운 약물 후보를 제안하는데 사용될 수 있다.
구조 기반의 약물 설계를 위한 현재의 방법은 대략 3개의 주요 카테고리로 나뉠 수 있다. 첫 번째 방법은 빠른 근사(approximate) 도킹 프로그램을 사용하여 표적의 결합 포켓에 맞는 것을 찾기 위해 소분자의 3D 구조의 큰 데이터베이스를 검색함으로써 주어진 수용체에 대한 새로운 리간드를 확인하는 것이다. 두 번째 카테고리는 새로운 리간드의 드 노보(de novo) 설계이다. 이 방법에서, 리간드 분자는 작은 조각을 단계적인 방식으로 조립함으로써 결합 포켓의 제약 내에서 구축된다. 이들 조각은 개별 원자 또는 분자 단편일 수 있다. 이러한 방법의 주요 장점은 임의의 데이터베이스에 포함되지 않은 새로운 구조가 제안될 수 있다는 것이다. 세 번째 방법은 결합 포켓 내의 제안된 유사체를 평가함으로써 공지된 리간드를 최적화하는 것이다. 구조 기반 약물은 컴퓨터 프로그램(예컨대, GOLD)에 의해 도움을 받을 수 있으므로, 그것은 가상 스크리닝 과정으로 지칭될 수 있다. 본원에 사용된 바와 같이, 가장 스크린 또는 스크리닝은 광범위하게는 상기 방법 구조 기반 약물 설계 카테고리 모두를 포함할 수 있다. 본 개시내용의 일 양태에서, 가상 스크리닝 과정은 드 노보 약물 설계 및/또는 선도물질 최적화(lead optimization)를 위한 소분자 또는 이의 단편을 선택하기 위해 제공된다. 일부 구현예에서, 본 개시내용은 표적 폴리뉴클레오타이드 및 제1 폴리뉴클레오타이드에 의해 형성된 하나 이상의 결합 포켓을 확인하는 단계로서, 표적 폴리뉴클레오타이드는 스플라이스 부위, 분기점(BP), 엑손 스플라이싱 인핸서(ESE), 엑손 스플라이싱 사일런서(ESS), 인트론 스플라이싱 인핸서(ISE), 인트론 스플라이싱 사일런서(ISS), 또는 폴리피리미딘 트랙트, 또는 이의 임의의 조합을 함유하는 것인 단계; 및 하나 이상의 결합 포켓에 대해 하나 이상의 소분자 또는 이의 단편을 가상으로 스크리닝하는 단계로서, 가상 스크리닝 과정은 추정되는 소분자 또는 단편 히트를 확인하는 것인 단계를 포함하는 방법을 제공한다. 일부 구현예에서, 제1 및 제2 소분자 히트를 가상 스크리닝 과정을 통해 확인할 수 있고, 제1 및 제2 소분자 히트의 결합 동역학을 결정할 수 있다. 일부 구현예에서, 제1 및 제2 소분자의 결합 동역학을 비교하여 소분자 히트의 결합 친화성을 추론하고 더 강한 소분자(즉, 더 높은 결합 친화성)을 선택할 수 있다. 결합 동역학은 표면 플라즈몬 공명(SPR), 생물층 간섭계(BLI) 기술(Octet Systems), 등온 적정 열량 측정법(ITC), 또는 형광 이방성을 포함하는 다양한 분석에 의해 결정될 수 있다.
소분자 스플라이싱
RNA 전사체 양의 변화와 관련된 질환은 종종 비정상적인 단백질 발현에 초점을 두어 치료된다. 그러나, 스플라이싱 과정의 구성요소 또는 관련된 전사 인자 또는 관련된 안정성 인자와 같은 RNA 수준의 비정상적인 변화를 담당하는 과정이 소분자를 이용한 치료에 의해 표적화될 수 있다면, RNA 전사체 또는 관련된 단백질의 비정상적인 수준의 발현의 원치 않는 효과와 같은 단백질 발현 수준을 회복시킬 수 있을 것이다. 본 개시내용은 RNA 전사체 또는 관련된 단백질의 비정상적인 발현과 관련된 질환을 예방 또는 치료하기 위한 방법으로서 특정 유전자에 의해 코딩된 RNA 전사체의 양을 조절하는 방법을 제공한다.
다양한 구현예에서, 본 개시내용은 표적 폴리뉴클레오타이드, 예를 들어, mRNA에 결합하는 소분자 결합제를 확인하는 방법을 제공한다. 일부 구현예에서, 본 개시내용은 폴리뉴클레오타이드-단백질 복합체, 예를 들어 전구-mRNA 및 스플라이싱에 관여하는 단백질에 의해 형성된 복합체에 결합하는 소분자 결합제를 확인하는 방법을 제공한다. 다양한 구현예에서, 본 개시내용은 폴리뉴클레오타이드-단백질 복합체에 결합할 수 있는 소분자 결합제를 선택하는 스크리닝 방법을 제공한다. 다양한 구현예에서, 본 개시내용은 비정상적인 RNA 스플라이싱을 교정할 수 있는 소분자 결합제를 선택하는 스크리닝 방법을 제공한다. 다양한 구현예에서, 본 개시내용은 NMR에 의해 소분자 결합제를 선택하는 방법을 제공한다.
비정상적인 스플라이싱은, 비제한적으로, ABCA4, ABCB4, ABCD1, ACADSB, ADA, ADAMTS13, AGL, ALB, ALDH3A2, ALG6, APC, APOB, AR, ATM, ATP7A, ATR, B2M, BMP2K, BRCA1, BRCA2, BTK, C3, CAT, CD46, CDH1, CDH23, CFTR, CHM, COL11A1, COL11A2, COL1A1, COL1A2, COL2A1, COL3A1, COL4A5, COL6A1, COL6A3, COL7A1, COL9A2, COLQ, CUL4B, CYBB, CYP17, CYP19, CYP27, CYP27A1, DES, DMD, DYSF, EGFR, EMD, ETV4, F13A1, F5, F7, F8, FAH, FANCA, FANCC, FANCG, FBN1, FECH, FGA, FGFR2, FGG, FIX, FLNA, FOXM1, FRAS1, GALC, GH1, GHV, HADHA, HBA2, HBB, HEXA, HEXB, HLCS, HMBS, HMGCL, HNF1A, HPRT1, HPRT2, HSF4, HSPG2, HTT, IDS, IKBKAP, INSR, ITGB2, ITGB3, JAG1, KRAS, KRT5, L1CAM, LAMA3, LDLR, LMNA, LPL, MADD, MAPT, MLH1, MSH2, MST1R, MTHFR, MUT, MVK, NF1, NF2, OAT, OPA1, OTC, PAH, PBGD, PCCA, PDH1, PGK1, PHEX, PKD2, PKLR, PLEKHM1, PLKR, POMT2, PRDM1, PRKAR1A, PROC, PSEN1, PTCH1, PTEN, PYGM, RP6KA3, RPGR, RSK2, SBCAD, SCN5A, SERPINA1, SLC12A3, SLC6A8, SMN2, SPINK5, SPTA1, TP53, TRAPPC2, TSC1, TSC2, TSHB, UGT1A1, 및 USH2A를 포함하는, 다양한 유전자로부터 전사된 전구-mRNA에서 발생할 수 있다.
상기 비정상적인 스플라이싱에 의해 유발되는 예시적인 질환은 낭포성 섬유증, 선천성 근긴장증, 프로토포르피린증(적혈구생성), 림프구증식 증후군(X 연관), 신경섬유종증, 색소성 망막염, 만기발현형 척추뼈끝 형성이상(spondyloepiphyseal dysplasia tarda), 간질(진행성 근간대성), 루빈스타인-테이비 증후군, 근 이영양증(메로신 결핍), 후두각 증후군(occipital horn syndrome), 중쇄 아실-CoA DH 결핍증, 결절성 경화증, 파킨슨증을 갖는 전두측두엽 치매, 골형성 부전증, 선천성 근긴장증, 후두각 증후군, 가족성 자율신경실조증, 척수 근위축증, 암, 하이포잔틴 포스포리보실트랜스퍼라제 결핍증, 엘러스-단로스 증후군, 판코니 빈혈, 마르판 증후군, 혈전성 혈소판감소성 자반증, 글리코겐 축적병 유형 III, 및 비정형 용혈성 요독증후군(aHUS)을 포함한다.
일부 구현예에서, 본 개시내용에 따라 예방/치료될 수 있는 비암 질환 및/또는 이와 관련된 상태는 허친슨-길포드 조로증 증후군(HGPS), 지대형 근 이영양증 유형 1B, 가족성 부분적 지방이영양증 유형 2, 파킨슨증 염색체 17을 갖는 전두측두엽 치매, 신생아 저산소증-허혈, 가족성 자율신경실조증, 하이포잔틴 포스포리보실트랜스퍼라제 결핍증, 엘러스-단로스 증후군, 후두각 증후군, 판코니 빈혈, 마르판 증후군, 혈전성 혈소판감소성 자반증, 글리코겐 축적병 유형 III, 티로신혈증(유형 I), 멘케스병, 무알부민혈증, 선천 아세틸콜린에스테라제 결핍증, 혈우병 B 결핍증(응고 인자 IX 결핍증), 열성 이영양성 표피 수포증, 우성 이영양성 표피 수포증, 신장 세뇨관 상피 세포의 체세포 돌연변이, X 연관 부신백질이영양증(X-ALD), FVII 결핍증, 동형접합성 저베타지질단백혈증, 모세혈관확장성 운동실조, 안드로겐 민감성, 일반적인 선천성 무섬유소혈증, 폐기종 위험, 점액다당류증 유형 II(헌터 증후군), 중증 유형 III 골형성 부전증, 엘러스-단로스 증후군 IV, 글란즈만 혈소판무력증, 경증 베들렘 근병증, 다울링-미에라 단순성 표피 수포증, MTHFR의 중증 결핍증, 급성 간헐 포르피린증, 테이-삭스 증후군, 근인산분해효소 결핍증(맥아들병), 만성 티로신혈증 유형 1, 태반에서의 돌연변이, 백혈구 부착 결핍증, 유전 C3 결핍증, 태반 아로마타제 결핍증, 뇌건성 황색종증, 뒤시엔느 및 베커 근이영양증, 중증 인자 V 결핍증, 알파-지중해빈혈, 베타-지중해빈혈, 유전 HL 결핍증, 레쉬-니한 증후군, 가족성 고콜레스테롤혈증, 포스포글리세레이트 키나제 결핍증, 코우덴 증후군, X 연관 색소성 망막염(RP3), 크리글러-나자르 증후군 유형 1, 만성 티로신혈증 유형 I, 샌드호프병, 젊은이의 성인형 당뇨병(MODY), 가족성 결절성 경화증, 다낭성 신장 질환 1, 일차 갑상선 기능 항진증, 낭포성 섬유증, 척수 근위축증, 신경섬유종증, 신경섬유종증 유형 I 및 신경섬유종증 유형 II로 이루어진 군으로부터 선택된 비암 상태 또는 질환을 포함한다.
특정 구현예에서, 본 개시내용의 화합물에 의해 치료되는 암은 백혈병, 급성 골수성 백혈병, 결장암, 위암, 황반 변성, 급성 단핵구 백혈병, 유방암, 간세포 암종, 추체-간체 이영양증, 폐포 연부 육종, 골수종, 피부 흑색종, 전립선염, 췌장염, 췌장암, 망막염, 선암종, 아데노이드염, 선양 낭성 암종, 백내장, 망막 변성, 위장관 간질 종양, 베게너 육아종증, 육종, 근병증, 전립선 선암종, 호지킨 림프종, 난소암, 비호지킨 림프종, 다발성 골수종, 만성 골수성 백혈병, 급성 림프모구 백혈병, 신장 세포 암종, 이행 세포 암종, 결장직장암, 만성 림프구성 백혈병, 역형성 대세포 림프종, 신장암, 유방암, 자궁경부암이다.
특정 구현예에서, 본 개시내용에 따라 예방 및/또는 치료되는 암은 기저 세포 암종, 배상 세포 이형성, 또는 악성 신경교종, 간암, 유방암, 폐암, 전립선암, 자궁경부암, 자궁암, 결장암, 췌장암, 신장암, 위암, 방광암, 난소암, 또는 뇌암이다.
특정 구현예에서, 본 개시내용에 따라 예방 및/또는 치료되는 암은, 비제한적으로, 머리, 목, 눈, 입, 목구멍, 식도, 식도, 가슴, 골, 폐, 신장, 결장, 직장 또는 다른 위장관 장기, 위, 비장, 골격근, 피하 조직, 전립선, 유방, 난소, 고환 또는 다른 생식기, 피부, 갑상선, 혈액, 림프절, 신장, 간, 췌장, 및 뇌 또는 중추 신경계의 암을 포함한다.
본 개시내용에 따라 예방 및/또는 치료될 수 있는 암의 특정 예는, 비제한적으로, 신장암(renal cancer, kidney cancer), 다형성 교아종, 전이성 유방암; 유방 암종; 유방 육종; 신경섬유종; 신경섬유종증; 소아 종양; 신경모세포종; 악성 흑색종; 표피의 암종; 백혈병, 예컨대, 비제한적으로, 급성 백혈병, 급성 림프구성 백혈병, 급성 골수성 백혈병, 예컨대, 골수아구성, 전골수성, 골수단핵구, 단핵구, 적백혈병 백혈병 및 골수이형성 증후군, 만성 백혈병, 예컨대 비제한적으로, 만성 골수성(과립구) 백혈병, 만성 림프구성 백혈병, 모양 세포 백혈병; 진성 다혈구증; 림프종, 예컨대, 비제한적으로 호지킨병, 비호지킨병; 다발성 골수종, 예컨대, 비제한적으로 무증상 다발성 골수종, 비분비성 골수종, 골경화성 골수종, 형질 세포 백혈병, 고립성 형질세포종 및 골수외 형질세포종; 반델스트롬 거대글로불린혈증; 의미불명의 단클론 감마병증; 양성 단클론 감마병증; 중쇄 질환; 골암 및 결합 조직 육종, 예컨대, 비제한적으로 골 육종, 골수종 골 질환, 다발성 골수종, 진주종 유도 골 골육종, 골의 파제트병, 골육종, 연골육종, 유잉 육종, 악성 거대 세포 종양, 골의 섬유육종, 척색종, 골막 육종, 연조직 육종, 혈관육종(hemangiosarcoma), 섬유육종, 카포시 육종, 평활근육종, 지방육종, 림프관 육종, 신경초종, 횡문근육종, 및 활액 육종; 뇌 종양, 예컨대, 비제한적으로, 신경교종, 성상세포종, 뇌간 신경교종, 뇌실막종, 희소돌기아교세포종, 비신경교종 종양, 청 신경초종, 머리인두종, 수모세포종, 수막종, 송과체종, 송과체모세포종, 및 일차 뇌 림프종; 유방암, 예컨대, 비제한적으로 선암종, 소엽(소세포) 암종, 관내암종, 수질성 유방암, 점액성 유방암, 관상형 유방암, 유두 유방암, 파제트병(청소년 파제트병 포함) 및 염증성 유방암; 부신암, 예컨대 비제한적으로 갈색세포종 및 부신피질 암종; 갑상선암, 예컨대, 비제한적으로 유두 또는 여포성 갑상선암, 수질성 갑상선암 및 역형성 갑상선암; 췌장암, 예컨대, 비제한적으로, 인슐린종, 가스트린종, 글루카곤종, 비포마, 소마토스타틴-분비 종양, 및 카르시노이드 또는 섬세포 종양; 뇌하수체암, 예컨대, 비제한적으로 쿠싱병, 프로락틴-분비 종양, 말단비대증, 및 요붕증; 눈암, 예컨대, 비제한적으로 안구 흑색종, 예컨대 홍채 흑색종, 맥락막 흑색종, 및 섬모체 흑색종, 및 망막모세포종; 질암, 예컨대 편평 세포 암종, 선암종, 및 흑색종; 외음부암, 예컨대 편평 세포 암종, 흑색종, 선암종, 기저 세포 암종, 육종, 및 파제트병; 자궁경부암, 예컨대, 비제한적으로, 편평 세포 암종, 및 선암종; 자궁암, 예컨대, 비제한적으로 자궁내막 암종 및 자궁육종; 난소암, 예컨대, 비제한적으로, 난소 상피 암종, 경계선 종양, 생식 세포 종양, 및 간질 종양; 자궁경부 암종; 식도암, 예컨대, 비제한적으로, 편평암, 선암종, 선양 낭성 암종, 점막표피모양 암종, 선편평 암종, 육종, 흑색종, 형질세포종, 사마귀 암종, 및 귀리 세포(소세포) 암종; 위암, 예컨대, 비제한적으로, 선암종, 돌출형(polypoid), 궤양성, 표재 확산성, 미만 확장성, 악성 림프종, 지방육종, 섬유육종, 및 암육종; 결장암; KRAS 돌연변이된 결장직장암; 결장 암종; 직장암; 간암, 예컨대, 비제한적으로 간세포 암종 및 간모세포종, 담낭암, 예컨대, 선암종; 담관암종, 예컨대, 비제한적으로 유두, 결절, 및 미만성; 폐암, 예컨대, KRAS 돌연변이된 비소 세포 폐암, 비소 세포 폐암, 편평 세포 암종(표피양 암종), 선암종, 대세포 암종 및 소세포 폐암; 폐 암종; 고환암, 예컨대, 비제한적으로 생식계 종양, 정상피종, 역형성, 고전적(전형적), 정모세포, 비정상피종, 배아 암종, 기형종 암종, 융모막암종(난황낭 종양), 전립선암, 예컨대, 비제한적으로, 안드로겐 비의존적 전립선암, 안드로겐 의존적 전립선암, 선암종, 평활근육종, 및 횡문근육종; 페날 암(penal cancer); 구강암, 예컨대, 비제한적으로 편평 세포 암종; 기저암; 타액선암, 예컨대, 비제한적으로 선암종, 점막표피모양 암종, 및 선양 낭성 암종; 인두암, 예컨대, 비제한적으로 편평 세포 암, 및 사마귀; 피부암, 예컨대, 비제한적으로, 기저 세포 암종, 편평 세포 암종 및 흑색종, 표재 확산 흑색종, 결절 흑색종, 렌티고 악성 흑색종, 선단흑자성 흑색종; 신장암, 예컨대, 비제한적으로 신장 세포 암, 선암종, 부신종, 섬유육종, 이행 세포 암(신장 골반 및/또는 수뇨관); 신장 암종; 윌름스 종양; 방광암, 예컨대, 비제한적으로 이행 세포 암종, 편평 세포 암, 선암종, 암육종을 포함한다. 또한, 암은 점액육종, 골 육종, 내피육종, 림프관내피육종, 중피종, 윤활막종, 혈관모세포종, 상피 암종, 낭선암종, 기관지원성 암종, 땀샘 암종, 피지샘 암종, 유두 암종 및 유두 선암종을 포함한다.
특정 구현예에서, 본 개시내용에 따라 예방 및/또는 치료될 수 있는 암은 소아 고형 종양, 유잉 육종, 윌름스 종양, 신경모세포종, 신경섬유종, 표피의 암종, 악성 흑색종, 자궁경부 암종, 결장 암종, 폐 암종, 신장 암종, 유방 암종, 유방 육종, 전이성 유방암, HIV 관련 카포시 육종, 전립선 암, 안드로겐 비의존적 전립선 암, 안드로겐 의존적 전립선암, 신경섬유종증, 폐암, 비소 세포 폐암, KRAS 돌연변이된 비소 세포 폐암, 악성 흑색종, 흑색종, 결장암, KRAS 돌연변이된 결장직장암, 다형성 교아종, 신장암, 방광암, 난소암, 간세포 암종, 갑상선 암종, 횡문근육종, 급성 골수성 백혈병, 및 다발성 골수종을 포함한다.
일부 구현예에서, 본 개시내용에 따라 예방 및/또는 치료되는 암 및 이와 관련된 상태는 삼중 음성 유방암, 전이성 결장직장 암, 자궁내막암, 전이성 흑색종, 유전 비용종증 결장직장암, 선암종, 육종, 흑색종, 간암, 간세포 암종, 간모세포종, 간 암종, 전립선 암, 전립선 선암종, 안드로겐 비의존적 전립선암, 안드로겐 의존적 전립선암, 평활근육종, 횡문근육종, 전립선 암종, 뇌암, 신경교종, 성상세포종, 뇌간 신경교종, 뇌실막종, 희소돌기아교세포종, 비신경교종 종양, 청 신경초종, 머리인두종, 수모세포종, 수막종, 송과체종, 송과체모세포종, 일차 뇌 림프종, 역형성 성상세포종, 청소년 털모양 성상세포종, 희소돌기아교세포종 및 성상세포종 요소의 혼합, 유방암, 전이성 유방암, 유방 암종, 유방 육종, 선암종, 소엽(소세포) 암종, 관내 암종, 수질성 유방암, 점액성 유방암, 관상형 유방암, 유두 유방암, 파제트병, 청소년 파제트병, 염증성 유방암, 폐암, KRAS 돌연변이된 비소 세포 폐암, 비소 세포 폐암, 편평 세포 암종(표피양 암종), 선암종, 대세포 암종, 소세포 폐암, 폐 암종, 결장암, KRAS 돌연변이된 결장직장암, 결장 암종, 췌장암, 인슐린종, 가스트린종, 글루카곤종, 비포마, 소마토스타틴-분비 종양, 카르시노이드 종양, 섬세포 종양, 췌장 암종, 피부암, 피부 흑색종, 기저 세포 암종, 편평 세포 암종, 흑색종, 표재 확산 흑색종, 결절 흑색종, 렌티고 악성 흑색종, 선단흑자성 흑색종, 피부 암종, 자궁경부암, 자궁경부암, 편평 세포 암종, 선암종, 자궁경부 암종, 난소암, 난소 상피 암종, 경계선 종양, 생식 세포 종양, 간질 종양, 난소 암종, 구강암, 혈액암, 백혈병, 급성 골수성 백혈병, 급성 단핵구 백혈병, 만성 골수성 백혈병, 급성 림프모구 백혈병, 만성 림프구성 백혈병, 급성 백혈병, 급성 림프구성 백혈병, 급성 골수성 백혈병, 골수아구성 백혈병, 전골수성 백혈병, 골수단핵구 백혈병, 단핵구 백혈병, 적백혈병, 골수이형성 증후군, 만성 백혈병, 만성 골수성(과립구) 백혈병, 만성 림프구성 백혈병, 모양 세포 백혈병, 형질 세포 백혈병, 신경계의 암, 중추 신경계의 암, 일차 중추 신경계(CNS) 림프종, CNS 생식 세포 종양, 배상 세포 이형성, 신장암, 신장 세포 암, 선암종, 부신종, 섬유육종, 이행 세포 암(신장 골반 및/또는 수뇨관), 방광암, 이행 세포 암종, 편평 세포 암, 선암종, 암육종, 위암, 위암, 선암종, 돌출형(polypoid), 궤양성, 표재 확산성, 미만 확산성, 악성 림프종, 지방육종, 섬유육종, 암육종, 자궁암, 자궁내막 암종, 자궁육종, 식도암, 편평암, 선암종, 선양 낭성 암종, 점막표피모양 암종, 선편평 암종, 육종, 흑색종, 형질세포종, 사마귀 암종, 및 귀리 세포(소세포) 암종, 식도 암종, 직장의 암, 결장직장 암, 직장암, 결장직장 암종, 담낭암, 선암종, 담관암종, 유두 담관암종, 결절 담관암종, 미만성 담관암종, 고환암, 생식계 종양, 정상피종, 역형성 고환암, 고전적(전형적) 고환암, 정모세포 고환암, 비정상피종 고환암, 배아 암종, 기형종 암종, 융모막암종(난황낭 종양), 위암, 위장관 간질 종양, 다른 위장관 장기의 암, 위 암종, 골암, 결합 조직 육종, 골 육종, 골수종 골 질환, 다발성 골수종, 진주종 유도 골 골육종, 골의 파제트병, 골육종, 연골육종, 유잉 육종, 악성 거대 세포 종양, 골의 섬유육종, 척색종, 골막 육종, 연조직 육종, 혈관육종(hemangiosarcoma), 섬유육종, 카포시 육종, 평활근육종, 지방육종, 림프관육종, 신경초종, 횡문근육종, 활액 육종, 호지킨 림프종, 비호지킨 림프종, 역형성 대세포 림프종, 림프절의 암, 림프관내피육종, 골수종, 다발성 골수종, 무증상 다발성 골수종, 비분비성 골수종, 골경화성 골수종, 고립성 형질세포종, 골수외 형질세포종, 폐포 연부 육종, 선양 낭성 암종, 신장 세포 암종, 이행 세포 암종, 생식 세포 암, 악성 신경교종, 신장 암종, 질암, 편평 세포 암종, 선암종, 흑색종, 외음부암, 편평 세포 암종, 흑색종, 선암종, 육종, 파제트병, 다른 생식기의 암, 갑상선암, 유두 갑상선암, 여포성 갑상선암, 수질성 갑상선암, 역형성 갑상선암, 갑상선 암종, 타액샘 암, 선암종, 점막표피모양 암종, 눈암, 안구 흑색종, 홍채 흑색종, 맥락막 흑색종, 섬모체 흑색종, 망막모세포종, 페날암, 구강암, 편평 세포 암종, 기저암, 인두암, 편평 세포 암, 사마귀 인두암, 윌름스 종양, 머리의 암, 목의 암, 눈의 암, 목구멍의 암, 가슴의 암, 비장의 암, 골격근의 암, 피하 조직의 암, 부신암, 갈색세포종, 부신피질 암종, 뇌하수체 암, 쿠싱병, 프로락틴-분비 종양, 말단비대증, 요붕증, 점액육종, 골원성 육종, 내피육종, 중피종, 윤활막종, 혈관모세포종, 상피 암종, 낭선암종, 기관지원성 암종, 땀샘 암종, 피지샘 암종, 유두 암종, 유두 선암종, 뇌실막종, 시신경 신경교종, 원시 신경외배엽 종양, 횡문근양 종양, 신장암, 다형성 교아종, 신경섬유종, 신경섬유종증, 소아 암, 신경모세포종, 악성 흑색종, 표피의 암종, 진성 다혈구증, 반델스트롬 거대글로불린혈증, 의미불명의 단클론 감마병증, 양성 단클론 감마병증, 중쇄 질환, 소아 고형 종양, 유잉 육종, 윌름스 종양, 표피의 암종, HIV 관련 카포시 육종, 횡문근육종, 포막종, 남성화세포종, 자궁내막 암종, 자궁내막 비대증, 자궁내막증, 섬유육종, 융모막암종, 비인두 암종, 후두 암종, 간모세포종, 카포시 육종, 혈관종, 해면상 혈관종, 혈관모세포종, 망막모세포종, 교아종, 슈반세포종, 신경모세포종, 횡문근육종, 골원성 육종, 평활근육종, 요로 암종, 모반증과 관련된 비정상적인 혈관 증식, 부종(예컨대, 뇌 종양과 관련된 것), 메이그 증후군, 뇌하수체 선종, 원시 신경외배엽 종양, 수모세포종, 및 청 신경종이다.
특정 구현예에서, 본 개시내용에 따라 예방 및/또는 치료되는 암 및 이와 관련된 상태는 유방 암종, 폐 암종, 위 암종, 식도 암종, 결장직장 암종, 간 암종, 난소 암종, 포막종, 남성화세포종, 자궁경부 암종, 자궁내막 암종, 자궁내막 비대증, 자궁내막증, 섬유육종, 융모막암종, 두경부암, 비인두 암종, 후두 암종, 간모세포종, 카포시 육종, 흑색종, 피부 암종, 혈관종, 해면상 혈관종, 혈관모세포종, 췌장 암종, 망막모세포종, 성상세포종, 교아종, 슈반세포종, 희소돌기아교세포종, 수모세포종, 신경모세포종, 횡문근육종, 골원성 육종, 평활근육종, 요로 암종, 갑상선 암종, 윌름스 종양, 신장 세포 암종, 전립선 암종, 모반증과 관련된 비정상적인 혈관 증식, 부종(예컨대, 뇌 종양과 관련된 것), 또는 메이그 증후군이다. 특정 구현예에서, 암은 성상세포종, 희소돌기아교세포종, 희소돌기아교세포종 및 성상세포종 요소의 혼합, 뇌실막종, 수막종, 뇌하수체 선종, 원시 신경외배엽 종양, 수모세포종, 일차 중추 신경계(CNS) 림프종, 또는 CNS 생식 세포 종양이다.
특정 구현예에서, 본 개시내용에 따라 치료되는 암은 청 신경종, 역형성 성상세포종, 다형성 교아종, 또는 수막종이다.
다른 특정 구현예에서, 본 개시내용에 따라 치료되는 암은 뇌간 신경교종, 머리인두종, 뇌실막종, 청소년 털모양 성상세포종, 수모세포종, 시신경 신경교종, 원시 신경외배엽 종양, 또는 횡문근양 종양이다.
본 개시내용의 일부 양태에서, 스크리닝 방법에 의해 확인된 소분자는 정맥내 투여, 피하 투여, 경구 투여, 흡입, 비강 투여, 피부 투여, 또는 안과 투여에 의해 포유동물에게 투여하기 위해 제제화될 수 있다. 일 양태에서, 스크리닝 방법에 의해 확인된 소분자는 질환 또는 상태와 관련된 단백질의 RNA 스플라이싱을 조절함으로써 치료될 수 있는 질환 또는 상태를 치료하는데 사용될 수 있다.
일부 구현예에서, 본 개시내용에 의해 확인된 소분자는 최대 약 2000 달톤, 1500 달톤, 1000 달톤 또는 900 달톤의 분자량을 갖는다. 일부 구현예에서, 본 개시내용에 의해 확인된 소분자는 적어도 100 달톤, 200 달톤, 300 달톤, 400 달톤 또는 500 달톤의 분자량을 갖는다. 일부 구현예에서, 본 개시내용에 의해 확인된 소분자는 포스포디에스테르 연결을 포함하지 않는다.
본 개시내용에서 확인된 소분자는 5'ss, 잠재 5'ss, 3'ss, 잠재 3'ss, ESE, ESS, ISE, 및/또는 ISS에서의 돌연변이에 의해 유발된 비정상적인 스플라이싱을 조절하는데 사용될 수 있다. 조절은 향상/활성화 및 예방/억제 모두를 포함할 수 있다. 일부 구현예에서, 조절은 향상/활성화일 수 있고, 소분자는 표적 폴리뉴클레오타이드에 결합하는 하나의 폴리뉴클레오타이드 또는 폴리펩타이드의 결합을 안정화시키거나 향상시킨다. 예를 들어, 소분자는 표적 mRNA에 결합하여 표적 폴리뉴클레오타이드에 결합하는 추가적인 폴리뉴클레오타이드 또는 폴리펩타이드의 결합을 촉진할 수 있다. 일부 경우에, 소분자는 표적 mRNA에 결합하는 RNA의 결합을 촉진할 수 있다. 일부 경우에, 소분자는 표적 mRNA에 결합하는 단백질 또는 이의 일부의 결합을 촉진할 수 있다. 일부 경우에, 소분자는 표적 RNA-RNA 이합체에 결합하는 단백질 또는 이의 일부의 결합을 촉진할 수 있다. 일부 경우에, 소분자는 표적 mRNA에 결합하는 단백질-RNA 복합체(예컨대, snRNP)의 결합을 촉진할 수 있다. 일부 경우에, 소분자는 표적 mRNA의 2차 또는 3차 구조 또는 분자 모이어티를 변화시킴으로써 표적 RNA-RNA 이합체에 결합하는 단백질 또는 이의 일부의 결합을 촉진할 수 있다. 예를 들어, 소분자는 5'ss 또는 3'ss 또는 이의 일부를 함유하는 표적 mRNA에 결합하는 폴리뉴클레오타이드 및/또는 폴리펩타이드 결합을 촉진하여; 인접한 엑손의 포함을 용이하게 할 수 있다.
일부 구현예에서, 조절은 예방/억제일 수 있으며, 소분자는 하나의 폴리뉴클레오타이드 또는 폴리펩타이드가 표적 폴리뉴클레오타이드에 결합하는 것을 불안정화하게 하거나 예방한다. 예를 들어, 소분자는 표적 mRNA에 결합하여 추가적인 폴리뉴클레오타이드 또는 폴리펩타이드가 표적 폴리뉴클레오타이드에 결합하는 것을 예방할 수 있다. 일부 경우에, 소분자는 RNA가 표적 mRNA에 결합하는 것을 예방할 수 있다. 일부 경우에, 소분자는 단백질 또는 이의 일부가 표적 mRNA에 결합하는 것을 예방할 수 있다. 일부 경우에, 소분자는 단백질 또는 이의 일부가 표적 RNA-RNA 이합체에 결합하는 것을 예방할 수 있다. 일부 경우에, 소분자는 단백질-RNA 복합체(예컨대, snRNP)가 표적 mRNA에 결합하는 것을 예방할 수 있다. 일부 경우에, 소분자는 표적 mRNA의 2차 또는 3차 구조 또는 분자 모이어티를 변화시킴으로써 표적 RNA-RNA 이합체에 결합하는 단백질 또는 이의 일부의 결합을 촉진할 수 있다. 예를 들어, 소분자는 잠재 5'ss 또는 잠재 3'ss 또는 이의 일부를 함유하는 표적 mRNA에 대한 폴리뉴클레오타이드 및/또는 폴리펩타이드 결합을 방지하여; 인접한 엑손의 포함을 용이하게 할 수 있다. 예를 들어, 소분자는 진정한 5'ss 또는 진정한 3'ss 또는 이의 일부를 함유하는 표적 mRNA에 대한 폴리뉴클레오타이드 및/또는 폴리펩타이드 결합을 방지하여; 엑손의 소실을 용이하게 할 수 있다.
본 개시내용에서 확인된 소분자는 하나 이상의 단백질에서의 비정상적인 스플라이싱과 관련된 질환 또는 상태를 치료하는데 사용될 수 있다. 본 개시내용에서 확인된 소분자는 스플라이싱을 조절하는데, 예를 들어 생성된 RNA 전사체의 양을 조절하는데 사용될 수 있다. 일부 구현예에서, 본 개시내용에서 확인된 소분자는 시스-작용 요소에서의 임의의 돌연변이와 관련되지 않은 스플라이싱을 조절하는데 사용될 수 있다.
일부 구현예에서, 본 개시내용에서 확인된 소분자는 서열 GGA/gugagu, AGA/gugagu, AGA/gugagu, AGA/gugagu, AGA/gugagu, AGA/gugagu, AGA/gugagc, AGA/gugagu, AGA/gugagu, GGA/gugagu, CGA/guccgu, GGAguaagu, GGA/guaagu, AGA/guaagu, AGA/guaagu, AGA/guaagu, AGA/guaagu, AGA/guaagu, AGA/guaagu, AGA/guaaga, AGA/guaagu, AGA/guaagu, AGA/guaagu, GGA/guaagu, AGA/guaagg, AGA/guaagu, AGA/guaagu, AGA/guaagu, GGA/guaagu, AGA/guaaga, AGA/guaagu, AGA/guaagu, AGA/guaagu, GGA/guaagg, AGA/guaagu, AGA/guaagu, GGA/guaagu, AGA/guaagu, AGA/guaaga, AGA/guaagu, AGA/guagau, UGA/gugaau, GGA/guuagu, AGA/guaggu, AGA/guaggu, GGA/guaggu, 또는 AGA/gugcgu를 포함하는 스플라이스 부위 서열의 스플라이싱을 조절한다. 일부 구현예에서, 본 개시내용에서 확인된 소분자는 서열 ACA/gugagg, AAA/auaagu, GAA/ggaagu, GAA/guaaau, GCA/guagga, CAA/gugagu, GUA/gugagu, GAA/guggg, CCA/guaaac, UUA/guaaau, CAA/guaaac, ACA/guaaau, GAA/guaaac, UCA/guaaac, UCA/guaaau, GCA/guaaau, ACA/guaaau, CAA/guaagc, CAA/guaagg, UCA/guaagu, AUA/gugaau, CAA/gugaaa, CCA/gugaga, UCA/gugauu, GAA/gugugu, GAA/uaaguu, CAA/guaugu, AAA/guaugu, CAA/guauuu, ACA/guuagu, GCA/guuagu, 또는 ACA/guuuga를 포함하는 스플라이스 부위 서열의 스플라이싱을 조절한다. 일부 구현예에서, 본 개시내용에서 확인된 소분자는 서열 CAA/guaacu, AUA/gucagu, GAA/gucugg, AAA/guacau를 포함하는 스플라이스 부위 서열의 스플라이싱을 조절한다. 일부 구현예에서, 본 개시내용에서 확인된 소분자는 서열 NNBgunnnn, NNBhunnnn, 또는 NNBgvnnnn을 포함하는 스플라이스 부위 서열의 스플라이싱을 조절한다. 일부 구현예에서, 본 개시내용에서 확인된 소분자는 서열 NNBgurrrn, NNBguwwdn, NNBguvmvn, NNBguvbbn, NNBgukddn, NNBgubnbd, NNBhunngn, NNBhurmhd, 또는 NNBgvdnvn을 포함하는 스플라이스 부위 서열의 스플라이싱을 조절한다. 이들 구현예에서, N(또는 n)은 A, U, G 또는 C이고; B(또는 b)는 C, G, 또는 U이며; H(또는 h)는 A, C, 또는 U이고; d는 a, g, 또는 u이며; m은 a 또는 c이고; r은 a 또는 g이며; v는 a, c 또는 g이고; k는 g 또는 u이며; w는 a 또는 u이다. 일부 구현예에서, 본 개시내용에서 확인된 소분자는 서열 CAC/gugagc, UCC/gugagc, AGC/gugagu, AGC/gugagu, AGG/gugagg, GUG/gugagc, GAG/gugagg, CCG/gugagg, UUG/gugagc, GUG/gugagu, UUU/gugagc, UUU/gugagc, GAU/gugagg, AGU/gugagu, AGU/gugagu, AGU/gugagu, AGU/gugagu, AGC/guaagu, GGC/guaagu, AAC/guaagu, GGC/guaagu, AGC/guaagg, GGC/guaagu, AGC/guaagu, GGC/guaagu, GGC/guaagu, AGC/guaagu, GAG/guaaga, CAG/guaagu, AGU/guaagc, AAU/guaagc, AAU/guaagg, CCU/guaagc, AGU/guaagu, GGU/guaagu, AGU/guaagu, AGU/guaagu, AGU/guaagu, GAU/guaagu, UCC/gugaau, CCG/gugaau, ACG/gugaac, CUG/gugaau, AGG/gugaau, UUG/gugaau, CCG/gugaau, GAG/gugaag, CCU/gugaau, CGU/gugaau, CCU/gugaau, GAG/guagga, CAU/guaggg, UGG/guggau, CAG/guggau, UGG/guggau, CGG/gugggu, GCG/guggga, UGG/guggggg, UGG/gugggug, CGU/gugggu, AUC/gguaaaa, GGG/guaaau, GCG/guaaaa, CAG/guaaag, UGG/guaaag, AAG/guaaag, AAG/guaaau, CAG/guaaag, UAG/guaaag, UUG/guaaag, GAG/guaaag, CAG/guaaag, AUG/guaaaa, AAG/guaaag, CAG/guaaag, CAG/guaaaa, GAG/guaaag, AAG/guaaag, UGU/guaaau, GUU/guaaau, GUU/guaaau, UCU/guaaau, GCU/guaaau, GAU/guaaau, GCU/guaaau, UCU/guaaau, ACU/guaaau, CCU/guaaau, CCU/guaaau, ACU/guaaau, AAU/guaaau, AGG/guagac, UUG/guagau, CAG/guagag, AAG/guagag, AAU/gugagu, CAG/gugagc, AAG/gugggu, AAG/guaggg, CAG/guaggc, 또는 AGC/guaggu를 포함하는 스플라이스 부위 서열의 스플라이싱을 조절한다. 일부 구현예에서, 본 개시내용에서 확인된 소분자는 서열 CAG/guaau, CAG/guaaugu, CAG/guaaugu, CAG/guaaugu, CAG/guaaugu, GAG/guaauac, GAG/guaauau, GAG/guaaugu, AAG/guaauaa, AAG/guaaugu, AAG/guaaugu, AAG/guaaugua, AAG/guaaugu, AAG/guaaugu, GCU/guaauu, CCU/guaauu, GAU/guaauu, CAU/guaauu, AAU/guaauu, AGG/guauau, CAG/guauau, UAG/guauau, CAG/guauau, CGG/guauau, GAG/guauau, CGG/guauau, CAG/guauag, AAG/guauau, CAG/guauag, AAG/guauac, UAG/guauau, CAG/guauag, CAG/guauau, AAG/guuaag, AUC/guuaga, GCG/guuagu, AAG/guuagc, UGG/guuagu, GCG/guuagu, CUG/guuugu, CUG/guauga, CAG/guauga, UAG/guauga, AAG/guaugg, AAG/guauga, GAG/guaugg, CAG/guauga, CAG/guaugg, AAG/guaugg, UGG/guaugc, CAG/guaugu, AUG/guaugu, AAG/guaugu, AAG/guaugg, CAG/guaugg, GAG/guauga, CGG/guaugg, AAU/guaugu, AAG/guauuu, AUG/guauuu, UAG/guauug, AAG/guauuu, CAG/guauug, CAG/guauug, CAU/guauuu, ACU/guauu, AAG/guuuau, AAG/guuuaa, CAG/guuugg, CAG/guuugg, CAG/guuugc, AAG/guuugg, AAG/guuugg, 또는 UGG/guaugc를 포함하는 스플라이스 부위 서열의 스플라이싱을 조절한다. 일부 구현예에서, 본 개시내용에서 확인된 소분자는 서열 CCG/guaacu, UUG/guaaca, AUG/guaacc, GGG/guaacu, AAG/guaaca, AAG/guaacu, UUG/guaaca, GCU/guaacu, ACU/guaacu, GCU/guaacu, UAG/guaccc, AAG/guaccu, CAG/guaccg, UGG/guacca, CAG/gucaau, AAG/gucaau, AAG/gucaag, AUG/guacau, GGG/guacau, UUG/guacau, CAG/guacag, CAG/guacag, CAG/guacag, CAG/guacag, AAG/guacag, CAG/guacag, GAG/guacaa, AAG/guacag, CAG/guacaa, UGU/guacau, CAG/gugcac, GGG/gugcau, CUG/gugcau, UAG/gugcau, CAG/gugcag, CAG/gugcag, AGG/gugcaa, AAC/gugacu, UCC/gugacu, CCG/gugacu, GCG/gugacu, GGG/gugacg, GGG/gugacg, GCG/gugacu, AUG/gugacc, GAU/gugacu, GGC/gucagu, 또는 UAG/gucaga를 포함하는 스플라이스 부위 서열의 스플라이싱을 조절한다. 일부 구현예에서, 본 개시내용에서 확인된 소분자는 서열 AAG/guacgg, AAG/guacgg, AAG/guacug, AAG/guagcg, AAG/guagua, AAG/guagua, AAG/guagua, AAG/guagug, AAG/guauca, AAG/guaucg, AAG/guaucu, AAG/gucucu, AAG/gugccu, AAG/guggua, AAG/guguua, ACG/guagcu, AGC/guacgu, CAG/guacug, CAG/guagua, CAG/guagug, CAG/guagug, CAG/guaucc, CAG/gugcgc, 또는 GAG/gugccu를 포함하는 스플라이스 부위 서열의 스플라이싱을 조절한다. 일부 구현예에서, 본 개시내용에서 확인된 소분자는 서열 CGG/guguau, AAG/guguau, GAG/guguac, CAG/guguau, UAG/guguau, CAG/guguag, GAG/guguau, AAG/gugugc, CAG/guguga, AAG/gugugu, CAG/guguga, CAG/gugugu, UGG/gugugg, CUG/guguga, CGG/gugugu, GAG/gugugc, CAG/guguga, AAU/gugugu, CAG/gugugu, CAG/gugugu, GAG/gugugu, CAG/guuguu, CAG/guuguc, GUG/guugua, CAG/guuguu, AAC/gugauu, CAG/gugaua, AGG/gugauc, GUG/gugauc, CCU/gugauu, GAU/gugauu, CAC/guuggu, CAG/guuggc, AAG/guuagc, 또는 CAG/guugau를 포함하는 스플라이스 부위 서열의 스플라이싱을 조절한다. 일부 구현예에서, 본 개시내용에서 확인된 소분자는 서열 AUG/gucauu, CGG/gucauaauc, AAG/gucugu, AAG/gucuggg, CAG/gucugga, CAG/gucuggu, CAG/gucuga, GAG/gucuggu, AAG/gugucu, AAG/gugucu, AGG/gugucu, CUG/gugcuu, CAG/gucuuu, CAG/guugcu, GAG/gugcug, 또는 CAG/gugcug를 포함하는 스플라이스 부위 서열의 스플라이싱을 조절한다. 일부 구현예에서, 본 개시내용에서 확인된 소분자는 서열 CGC/auaagu, UUC/auaagu, UGG/auaagg, ACG/auaagg, GUU/auaagu, CCU/auaagu, UUU/auaagc, GAG/aucugg, AAC/augagga, GAC/augagg, ACC/augagu, GGG/augagu, AAG/augagc, CAG/augagg, GAG/augagg, GCG/augagu, AAG/gaugag, CCU/augagu, GAU/augagu, GAU/augagu, UAG/augcgu, CAG/auuggu, AAG/auuugu, ACG/cuaagc, CAG/cugugu, CUG/uuaag, GAG/uuaagu, AAG/uuaagg, AUU/uuaagc, CUG/uugaga, CAG/uuuggu, 또는 GGG/auaagu를 포함하는 스플라이스 부위 서열의 스플라이싱을 조절한다. 일부 구현예에서, 본 개시내용에서 확인된 소분자는 서열 CAG/auaacu, GAG/cugcag, 또는 AAG/uuaaua를 포함하는 스플라이스 부위 서열의 스플라이싱을 조절한다. 일부 구현예에서, 본 개시내용에서 확인된 소분자는 서열 GCG/gagagu, AAG/ggaaaa, AUC/gguaaaa, AAG/gcaaaa, UGU/gcaagu, GAG/gcaggu, GAG/gcgugg, GAG/gcuccc, CAG/gcuggu, 또는 AAG/gaugag를 포함하는 스플라이스 부위 서열의 스플라이싱을 조절한다.
본 개시내용에 의해 확인될 수 있는 예시적인 소분자가 표 3에 요약되어 있다
표 3. 예시적인 소분자 구조
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
Figure pct00036
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040
Figure pct00041
Figure pct00042
실시예
실시예 1
본 실시예는 표적 RNA에 결합하는 결합제를 확인하기 위해 본원에 제공된 방법을 사용하는 예시적인 실험 계획을 제공한다. 실험은 다음 단계를 포함한다:
단계 1은 RNA 이합체 형성 및 NMR 스크리닝을 포함할 수 있다. 소분자를 갖는 NMR 스펙트럼 및 소분자를 갖지 않는 NMR 스펙트럼을 비교하여 소분자가 RNA 이합체에 결합하는지 여부를 결정할 수 있다. 본원에 기재된 표적 유전자의 스플라이싱 변형제를 확인하기 위해, 화합물의 라이브러리를 RNA 이합체에 결합하는 능력에 대해 시험할 수 있다. 이 경우, 자유 RNA 이합체의 2D 1H-1H TOCSY 지문(fingerprint)을 기록하고 후보 분자의 첨가 후의 동일한 지문과 비교할 것이다. 이들 2개의 지문 스펙트럼을 비교함으로써, 이들이 차이를 나타내는지 여부를 빠르게 알 수 있다. 후보 분자의 첨가가 RNA의 화학적 이동(chemical shift)의 변화를 유도한 경우, 이는 분자 및 RNA 이합체 사이의 직접적인 상호작용을 뒷받침할 것이다. 2개의 상이한 스펙트럼으로부터 화학적 이동 및 지문을 비교하는 것으로부터, RNA 이합체에 결합하거나 RNA 이합체에 결합하지 않는 소분자를 결정 및 확인할 수 있다.
단계 2는 U1-C 아연 핑거 도메인의 결합 특이성 및 효과를 포함할 수 있다. 스크리닝은 자유 RNA 및 소분자의 첨가 후 간의 비교에 기초할 것이다. 추가 조사를 위해 RNA 이합체 결합제를 선택할 것이다. 먼저, 상호작용의 강도를 결정할 수 있다. 관심있는 소분자에 의해 RNA의 적정을 수행함으로써, 상호작용의 강도를 결정할 수 있다. 둘째, 관심있는 소분자를 몇 가지 상이한 RNA 이합체에 대해 시험할 수 있기 때문에, 상호작용의 특이성이 결정될 수 있으며, 다른 RNA 이합체에서 히트 분자를 시험함으로써 확인된 상호작용의 특이성을 시험할 수 있다. 셋째, 다양한 RAN 결합제를 서로 비교함으로써 RNA 이합체에서 소분자 결합제의 특이성 및 고유한 결합 위치를 밝힐 수 있다. 마지막으로, U1-C의 아연 핑거를 분석에 첨가하고 그것이 RNA 이합체 - 소분자의 상호작용에 얼마나 영향을 미치거나 경쟁하는지 시험할 가능성을 제공할 수 있다.
단계 3은 RNA 이합체 - 소분자 복합체의 NMR 구조 결정을 포함할 수 있다. 용액 상태 NMR을 사용한 구조 결정을 위해 가장 유망한 소분자 - RNA 이합체를 선택할 것이다. 이러한 복합체의 구조를 해석하기 위해, 높은 자기장 NMR 분광계 접근이 공명 할당을 수행하는데 중요할 뿐만 아니라 구조 계산을 수행하기 위해 NOE 유래 거리를 확인하는데 중요하다. 이러한 복합체 구조를 분석하기 위해 NMR 900 MHz 분광계 이상이 데이터 수집에 사용될 필요가 있을 수 있다.
실시예 2
본 실시예는 최대 200개의 뉴클레오타이드 길이를 갖는 엑손-인트론 경계를 함유하는 mRNA 단편을 사용하는 방법을 제공한다. 일부 실험에서, mRNA는 표지되지 않을 것이다. 1H 스펙트럼은 표지되지 않은 표적에 대해 수득될 것이다. 일부 다른 경우에, 5'ss 서열의 8-12개의 뉴클레오타이드에 포함된 엑손/인트론 뉴클레오타이드는 NMR로 측정하기 위해 동위원소적으로 표지될 수 있다. 이것은 실험의 해상도 및 서열의 나머지와 결합하는 화합물을 결정하는 능력 중 어느 것도 상실하지 않으면서 mRNA의 2차 구조를 보존할 수 있게 할 수 있다. U1(5'-AUACΨΨACCUG-3')의 5'-말단 및 다양한 표적(표 1-2 참고)의 5'ss 사이의 이합체 RNA는 NMR 완충액에서 거의 등몰량의 U1 snRNA 및 5'ss를 첨가함으로써 형성될 수 있다. 실험은 1) 선택적으로, mRNA 서열의 더 큰 영역은 표지되지 않은 상태를 유지하면서(하지만 2-D/3-D 구조적 정교함을 제공함) mRNA 서열의 부분, 이 경우 5'ss를 방사성 표지하는 단계; 2) NMR 장치를 사용하여 폴리뉴클레오타이드 샘플, 예컨대 이합체 RNA의 NMR 스펙트럼을 수득하는 단계; 3) U1 단백질을 도입한 다음 관심있는 소분자를 도입하여 snRNA를 갖는 5'ss 이합체의 하나 이상의 원자의 화학적 이동을 결정하는 단계; 4) mRNA가 U1 단백질과 상호작용하거나 하지 않을 수 있음을 나타내는, U1 단백질의 첨가시의 화학적 이동 변화를 측정하는 단계; 5) mRNA가 U1 단백질 단독의 첨가시와 상이하게 소분자 및 단백질과 상호작용할 수 있음을 나타내는 소분자 및 U1 단백질의 첨가시의 화학적 이동 변화를 측정하는 단계; 및 6) U1 단백질 및/또는 소분자의 존재하에 화학적 이동을 수집하는 단계를 포함한다. 화학적 이동은 mRNA 및 결합된 소분자의 이분자 구조를 결정하는데 사용될 수 있다. NMR 스펙트럼으로부터, 5'ss 및 소분자의 구조의 2-D 또는 3-D 원자 해상도가 컴퓨터로 모델화될 수 있다. 복수의 2차 구조 예측은 2차 구조 예측 알고리즘(예컨대, 최근접 이웃 알고리즘) 또는 컴퓨터 프로그램을 사용하여 계산될 수 있다. MC-Fold|MC-Sym 파이프라인은 RNA 2차 및 3차 구조 예측을 위한 웹 호스팅 서비스이다. 파이프라인은 MF-Fold로의 입력 서열이 2차 구조를 출력하고, 상기 2차 구조는 직접 MC-Sym에 입력되고, 상기 MC-Sym은 3차 구조를 출력하는 것을 의미한다.
실시예 3
본 실시예는 RNA 및 RNA-화합물 복합체 샘플의 NMR 준비를 위한 예시적인 실험 절차를 제공한다. 운동 뉴런 생존(SMN) 단백질에 대한 RNA가 본원에서 예로서 사용된다. SMN 5'ss RNA(5'-GGAGUAAGUCU), U1 snRNA(5'-GAUACUUACCUG) 및 SMN ssRNA/U1 snRNP-연결된 RNA(5'-GGAGUAAGUCU-GAUACUUACCUG)는 트리링크 바이오테크놀리지스(TriLink BioTechnologies) 또는 인테그레이티드 DNA 테크놀로지스(Integrated DNA Technologies)에 의해 합성될 수 있다. dsRNA는 NMR 완충액(20 mM 인산칼륨, pH 6.2, 100 mM KCl 및 0.1 mM EDTA)에서 등몰 농도의 SMN ssRNA 및 U1 snRNA를 혼합함으로써 제조될 수 있다. 상이한 RNA-RNA 이합체가 이 실험에 사용될 수 있고, 도 2에 예가 있다. 혼합물은 5분 동안 60℃로 가열된 다음 실온으로 냉각될 수 있다. 1차원 NMR 결합 연구를 위한 샘플은 D2O 완충액에서 100 μM 화합물 및 5 μM dsRNA로 만들 수 있다. SMN ssRNA/U1 snRNP 연결된 RNA는 스템-루프 염기쌍 패턴이 TOCSY에 의해 SMN ssRNA/snRNP RNA dsRNA와 동일하다는 확인 후에 컴퓨터 모델링 구조 결정에 사용될 수 있다. D2O 또는 H2O 완충액 중의 SMN ssRNA 및 U1 snRNA를 갖는 TOCSY를 위한 샘플을 5분 동안 85℃로 가열한 다음 실온으로 냉각될 수 있다. SMN ssRNA-U1 snRNA-NVS-SM2 복합체는 화합물 농도가 포화에 도달할 때까지 NVS-SM2의 10 mM DMSO-d6 스톡 용액을 350-500 μM의 dsRNA에 첨가함으로써 제조될 수 있다.
실시예 4
NMR 실험은 AVANCE III 600 MHz 또는 800 MHz 분광계(Bruker)에서 수행할 수 있다. 샘플 온도는 dsRNA와의 결합 실험의 경우 20℃이고 1D 1H, 및 2-D COSY 및 RNA-11 및 RNA-12를 갖는 TOCSY를 포함하는 구조 결정 실험의 경우 5-37℃일 수 있다. 모델을 TOCSY 스펙트럼의 분석을 포함한 데이터 세트로부터 조립하였다.
NMR 스펙트럼은 냉동탐침이 장착된 Bruker Avance III 500, 600, 700 또는 900 MHz 분광계 및 실온 탐침을 갖는 Bruker Avance III 750 MHz 분광계에서 RNA-단백질 복합체에 대해 303 K 및 313 K에서 또는 모든 단백질 복합체에 대해 313 K에서 획득할 수 있다. 스펙트럼은 Topspin 2.1 또는 Topspin 3.0으로 처리하고 Sparky 3.0에서 분석할 수 있다. RNA 및 단백질의 1H, 13C 및 15N 할당은 당업계의 표준 방법에 의해 달성될 수 있다. RNA-단백질 복합체의 모델링을 위해, HHC- 및 HHN-3D-NOESY 실험으로부터 유래된 분자간 거리 제한뿐만 아니라 백본 아미드 및 RNA-C1'-H1', C5-H5, C6-H6, C8-H8 및 C2-H2 결합에 대해 측정된 잔류 쌍극 커플링이 사용될 수 있다. 분자간 거리 제한은 13C15N-표지된 단백질 및 표지되지 않은 RNA로부터 또는 15N-표지된 단백질 및 13C15N-표지된 RNA로부터 재구성된 복합체에 기록된 3-D 13C-F1-편집된, F3-필터링된-NOESY-HSQCs 및 2-D 1H-1H F1-13C-필터링된, F2-13C-편집된 NOESY 스펙트럼으로부터 추출될 수 있다.
실시예 5
본 실시예는 예시적인 모델링 전략을 제공한다. RNA-단백질 복합체의 모델링은 단백질-RNA 복합체의 구조 예측 및 결정에 고전적으로 필요한 상이한 소프트웨어의 조합으로 구현될 수 있다. Atnos/Candid-프로그램 묶음 및 인공 RRM NOESY 매트릭스를 사용하여 RRM 폴드에 전형적인 분자내 NOESY 패턴에 해당하는 피크 목록을 생성할 수 있다. CYANA 3.0 및 보다 특히 CYANA noeassign 명령을 사용하여 거리 및 각도 제한을 통합하고 모델을 계산할 수 있다. 가교 부위가 각각 핵산의 염기 고리와 아미노산의 측쇄 사이의 다양한 거리를 정의하기 때문에, 모델링을 위해, CLIR-MS/MS-데이터를 모호한 거리 제한으로서 삽입할 수 있다. 분자내 제한은 RCSB 단백질 데이터 은행(PDB)에서의 공개된 단백질 구조 및 MC-FOLD 및 MC-SYM에 의해 예측된 RNA 구조로부터 유래될 수 있다. 이용가능한 복합체 구조로부터 추출된 추가적인 특정 단백질-RNA 접촉은 분명한 거리 제한으로서 통합될 수 있다. 모든 모델에 대해, 사이클당 약 200개의 구조가 계산될 수 있고, 가장 낮은 에너지의 약 20개를 다음 사이클을 위한 시작 앙상블로서 선택할 수 있다. RNA-단백질 복합체를 모델링하기 위해, RNA 모이어티를 제외한 사이클 1에서의 PDB로부터의 평균 단백질-RNA 복합체 구조를 이용하여 CYANA noeassign 계산을 개시할 수 있다. 입체적 충돌(steric clash)을 피하고 정전기적 및 소수성 단백질-RNA 접촉을 개선하기 위해 CYANA noeassign으로 수득된 최종 20개의 가장 낮은 에너지 모델을 앰버 12 포스 필드(amber 12 force field)로 개선할 수 있다.
실시예 6
본 실시예는 RNA에 결합하는 U1 snRNP의 SPR 분석에 의한 결합 동역학을 보여준다. 바이오티닐화된 RNA(5'-바이오틴TEG/UCUAAGGCGUAAGUCUGCCAG-3', 및 5'-바이오틴TEG/UCUAAGCAGUAAGUCUGCCAG-3')는 인테그레이티드 DNA 테크놀로지스(Integrated DNA Technologies)사에 의해 합성할 수 있다. 결합 단계에 있는 화합물만을 이용한 초기 SPR 연구는 25℃에서 Biacore T100에서 수행할 수 있다. RNA를 SPR 완충액(38 mM HEPES, pH 7.6, 60 mM KCl, 0.12 mM EDTA, 3.2 MgCl2, 0.05% P20)으로 희석하고, 90℃로 가열하고, 실온으로 서서히 냉각하고, 14,000g에서 10분 동안 원심분리하고, 110 상대적 유닛(RU)의 표적 수준을 스트렙타비딘 코팅된 SA 칩(GE Healthcare) 상에서 포획할 것이다. U1 snRNP는 DMSO 또는 화합물을 함유하는 SPR 완충액으로 1:50으로 희석될 것이다. 최종 DMSO 농도는 0.5%일 것이고, 러닝 완충액은 동일한 백분율로 조정될 것이다. 표면은 1 M NaCl, 10 mM NaOH로 재생될 것이다. 공동 주입 실험을 표면에 로딩된 최소 25 RU의 표적 RNA를 갖는 NLC 칩(Bio-Rad)을 사용하여 25℃에서 ProteOn XPR36에서 동일한 완충액 조건하에 수행할 것이다. ProteOn의 공동 주입 기능은 결합 및 해리 단계 모두에서 NVS-SM2 또는 DMSO의 시험을 가능하게 하였다. 해리 속도 상수는 분석물 농도와 무관하며, 2개의 중복 주입으로부터 ProteOn 소프트웨어를 사용하여 측정될 수 있다. 모든 데이터를 단백질 단독 표면뿐만 아니라 완충액 주사에 대해 이중 참조할 것이며, 제외된 부피에 대한 DMSO 보정을 수행할 것이다.
실시예 7
실시예는 RNA에 결합하는 U1 snRNA의 SPR 분석에 의한 결합 동역학을 나타낸다. SPR 연구는 표면에 로딩된 최소 300 RU의 표적 RNA를 갖는 NLC 칩(BioRad)을 사용하여 20℃에서 ProteOn XPR36에서 수행할 것이다. U1 snRNA(5'-AUACUUACCUG-3')를 DMSO 또는 화합물을 함유하는 SPR 완충액으로 1 μM로 희석할 것이다. 공동 주입 특징은 결합 및 해리 단계가 DMSO 또는 화합물을 함유하도록 사용될 것이다. 표면 재생 및 참조는 상기 실시예 5와 같이 수행될 것이다.
실시예 8
도 1은 생물층 간섭계(BLI)에 의한 결합 동역학 분석의 개략도를 나타낸다. 이러한 예시적인 실험 설계에서, snRNA는, 예를 들어, 바이오틴-스트렙타비딘 상호작용을 통해 표면에 고정화된다. 용액에서, 표적 mRNA 및 U1-C 아연 핑거 도메인이 첨가되고, 이들은 고정화된 snRNA에 결합하여 복합체를 형성한다. 소분자 결합제의 존재하에, 이는 RNA-RNA 이합체에 결합하고 단백질이 RNA-RNA 이합체에 결합하는 것을 방지함으로써 단백질-RNA 복합체를 불안정화시킬 수 있다. 결합 동역학을 결정하기 위해 다양한 농도의 소분자가 동일한 표적 복합체(예컨대, mRNA-snRNA-U1-C) 내로 적정될 수 있다. K d는 소분자 적정으로 결정될 수 있다.
실시예 9
본원에 개시된 관심있는 소분자는 효율 측정, 예를 들어, IC50을 위해 세포 기반 분석에서 시험될 수 있다. 세포 생존율을 측정하기 위해, 세포를 5xl03 세포/웰의 밀도로 96-웰 플라스틱 조직 배양 플레이트에 플레이팅하였다. 플레이팅 24시간 후, 세포를 RG-11-1 화합물로 처리하였다. 72시간 후, 세포 배양 배지를 제거하고, 플레이트를 0.5% 크리스탈 바이올렛 및 25% 메탄올을 함유하는 100 mL/웰의 용액으로 염색하고, 탈이온수로 세정하고, 밤새 건조하고, 100 ml 시트레이트 완충액(50% 에탄올 중의 0.1 M 구연산 나트륨)에 재현탁시켜 플레이팅 효율을 평가하였다. 570 nm에서 평가되고 Vmax 동역학 마이크로플레이트 리더 및 Softmax 소프트웨어(Molecular Devices Corp., Menlo Park, CA)를 사용하여 정량화된, 크리스탈 바이올렛 염색의 강도는 세포 수와 정비례하였다. 데이터를 비히클 처리된 세포에 대해 정규화하였고, 이는 대표적인 실험으로부터의 평균 ± SE로서 도 3A-F에 제시되어 있다.
실시예 10
예를 들어, 개시된 방법은 FOXM1 유전자로부터 발현된 mRNA의 스플라이싱을 조절하기 위한 소분자 결합제를 선택하는데 사용될 수 있다. 예시적인 소분자는 FOXM1 mRNA의 5'ss(엑손 9의 5'ss)를 표적화할 수 있다. 이들은 또한 mRNA의 일부 다른 요소를 표적화할 수 있거나 다른 유전자의 경우 다른 mRNA를 표적화할 수 있다. 예시적인 구조가 본원에 요약되어 있다:
일 양태에서, 본 개시된 방법에 의해 확인될 수 있는 화합물은 식 (I)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00043
상기 식에서,
고리 A는 아릴 또는 헤테로아릴이고;
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C2-C6알케닐, 치환되거나 비치환된 C2-C6알키닐, 치환되거나 비치환된 C1-C6플루오로알킬, 및 치환되거나 비치환된 C1-C6헤테로알킬로부터 선택되며;
L1은 -X1-L3- 또는 -L3-X1-이고;
X1은 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, 또는 -NR1-이며;
L3은 부재하거나 또는 치환되거나 비치환된 C1-C4알킬렌이고;
고리 B는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이며;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, NR10C(=N-CN)N(R1)2, -NR1C(=O)R1, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되고;
각각의 R1은 독립적으로 H, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 페닐, 또는 치환되거나 비치환된 헤테로아릴이며;
L2는 -X2-L4-, 또는 -L4-X2-이고;
X2는 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, -S(=O)2NR1-, 또는 -NR1-이며;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C3알킬렌이고;
고리 C는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이며;
각각의 RC는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -CH2-N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R11, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 및 치환되거나 비치환된 C2-C8헤테로사이클로알킬로부터 선택되고;
n은 0, 1, 또는 2이며;
m은 0, 1, 또는 2이고;
q는 0, 1, 2, 3, 4, 5, 또는 6이다.
또 다른 양태에서, 본 개시된 방법에 의해 확인될 수 있는 화합물은 식 (II)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00044
상기 식에서,
고리 A는 아릴 또는 헤테로아릴이고;
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C2-C6알케닐, 치환되거나 비치환된 C2-C6알키닐, 치환되거나 비치환된 C1-C6플루오로알킬, 및 치환되거나 비치환된 C1-C6헤테로알킬로부터 선택되며;
L1은 -X1-L3-, 또는 -L3-X1-이고;
X1은 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, 또는 -NR1-이며;
L3은 부재하거나 또는 치환되거나 비치환된 C1-C4알킬렌이고;
고리 B는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이며;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -N(R1)2, -S(=O)2R1, -NR1S(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, NR10C(=N-CN)N(R1)2, -NR1C(=O)R1, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되고;
각각의 R1은 독립적으로 H, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 페닐, 또는 치환되거나 비치환된 헤테로아릴이며;
L2는 -X2-L4-, 또는 -L4-X2-이고;
X2은 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, 또는 -NR1-이며;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C3알킬렌이고;
R2는 독립적으로 H, D, -F, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R11, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C6알키닐, 및 치환되거나 비치환된 C1-C6플루오로알킬로부터 선택되며;
n은 0, 1, 또는 2이고;
m은 0, 1, 또는 2이다.
일부 구현예에서, 본원에서 확인될 수 있는 화합물은 식 (III)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00045
상기 식에서,
고리 A는 아릴 또는 헤테로아릴이고;
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C2-C6알케닐, 치환되거나 비치환된 C2-C6알키닐, 치환되거나 비치환된 C1-C6플루오로알킬, 및 치환되거나 비치환된 C1-C6헤테로알킬로부터 선택되며;
L1은 -X1-L3-, 또는 -L3-X1-이고;
X1은 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, 또는 -NR1-이며;
L3은 부재하거나 또는 치환되거나 비치환된 C1-C4알킬렌이고;
고리 B는 아릴 또는 헤테로아릴이며;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -N(R1)2, -S(=O)2R1, -NR1S(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, NR10C(=N-CN)N(R1)2, -NR1C(=O)R1, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되고;
각각의 R1은 독립적으로 H, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 페닐, 또는 치환되거나 비치환된 헤테로아릴이며;
L2는 -X2-L4-, 또는 -L4-X2-이고;
X2은 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, 또는 -NR1-이며;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C3알킬렌이고;
고리 C는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이며;
각각의 RC는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -CH2-N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R11, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C6알키닐, 및 치환되거나 비치환된 C1-C6플루오로알킬로부터 선택되고;
고리 D는 모노사이클릭 카르보사이클 또는 모노사이클릭 헤테로사이클이며;
각각의 RD는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C2-C6알케닐, 치환되거나 비치환된 C2-C6알키닐, 치환되거나 비치환된 C1-C6플루오로알킬, 및 치환되거나 비치환된 C1-C6헤테로알킬로부터 선택되고;
L5는 -X3-L6-, 또는 -L6-X3-이며;
X3은 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, 또는 -NR1-이고;
L6은 부재하거나 또는 치환되거나 비치환된 C1-C4알킬렌이며;
n은 0, 1, 또는 2이고;
m은 0, 1, 또는 2이며;
q는 0, 1, 2, 3, 4, 5, 또는 6이고;
p는 0, 1, 2, 3, 또는 4이다.
또 다른 양태에서, 본원에서 확인될 수 있는 화합물은 식 (IV)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00046
상기 식에서,
고리 A는 아릴 또는 헤테로아릴이고;
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C2-C6알케닐, 치환되거나 비치환된 C2-C6알키닐, 치환되거나 비치환된 C1-C6플루오로알킬, 및 치환되거나 비치환된 C1-C6헤테로알킬로부터 선택되며;
L1은 -X1-L3-, 또는 -L3-X1-이고;
X1은 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, 또는 -NR1-이며;
L3은 부재하거나 또는 치환되거나 비치환된 C1-C4알킬렌이고;
고리 B는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이며;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -N(R1)2, -S(=O)2R1, -NR1S(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, NR10C(=N-CN)N(R1)2, -NR1C(=O)R1, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되고;
각각의 R1은 독립적으로 H, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 페닐, 또는 치환되거나 비치환된 헤테로아릴이며;
L2는 -X2-L4-, 또는 -L4-X2-이고;
X2는 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, 또는 -NR1-이며;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C3알킬렌이고;
R2는 독립적으로 H, D, -F, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R11, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C6알키닐, 및 치환되거나 비치환된 C1-C6플루오로알킬로부터 선택되며;
고리 D는 모노사이클릭 카르보사이클 또는 모노사이클릭 헤테로사이클이고;
각각의 RD는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C2-C6알케닐, 치환되거나 비치환된 C2-C6알키닐, 치환되거나 비치환된 C1-C6플루오로알킬, 및 치환되거나 비치환된 C1-C6헤테로알킬로부터 선택되며;
L5는 -X3-L6-, 또는 -L6-X3-이고;
X3은 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, 또는 -NR1-이며;
L6은 부재하거나 또는 치환되거나 비치환된 C1-C4알킬렌이고;
n은 0, 1, 또는 2이며;
m은 0, 1, 또는 2이고;
p는 0, 1, 2, 3, 또는 4이다.
일 양태에서, 본원에서 확인될 수 있는 화합물은 식 (V)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00047
상기 식에서,
고리 A는 아릴 또는 헤테로아릴이고;
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C2-C6알케닐, 치환되거나 비치환된 C2-C6알키닐, 치환되거나 비치환된 C1-C6플루오로알킬, 및 치환되거나 비치환된 C1-C6헤테로알킬로부터 선택되며;
L1은 -X1-L3- 또는 -L3-X1-이고;
X1은 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -NR1S(=O)2-, 또는 -NR1-이며;
L3은 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이고;
Y1은 -W1-Y2- 또는 -Y2-W1-이며;
W1은 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -NR1S(=O)2-, 또는 -NR1-이고;
Y2은 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이며;
고리 B는 아릴 또는 헤테로아릴이고;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, NR10C(=N-CN)N(R1)2, -NR1C(=O)R1, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
각각의 R1은 독립적으로 H, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 페닐, 또는 치환되거나 비치환된 헤테로아릴이고;
L2는 -X2-L4-, 또는 -L4-X2-이며;
X2는 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, , -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, -S(=O)2NR1-, 또는 -NR1-이고;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C3알킬렌이며;
고리 C는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이고;
각각의 RC는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -CH2-N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R11, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 및 치환되거나 비치환된 C2-C8헤테로사이클로알킬로부터 선택되며;
n은 0, 1, 또는 2이고;
m은 0, 1, 또는 2이며;
q는 0, 1, 2, 3, 4, 5, 또는 6이다.
또 다른 양태에서, 본원에서 확인될 수 있는 화합물은 식 (VI)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00048
상기 식에서,
고리 A는 아릴 또는 헤테로아릴이고;
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C2-C6알케닐, 치환되거나 비치환된 C2-C6알키닐, 치환되거나 비치환된 C1-C6플루오로알킬, 및 치환되거나 비치환된 C1-C6헤테로알킬로부터 선택되며;
L1은 -X1-L3- 또는 -L3-X1-이고;
X1은 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -NR1S(=O)2-, 또는 -NR1-이며;
L3은 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이고;
Y1은 -W1-Y2- 또는 -Y2-W1-이며;
W1은 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -NR1S(=O)2-, 또는 -NR1-이고;
Y2는 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이며;
고리 B는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이고;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -N(R1)2, -S(=O)2R1, -NR1S(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, NR10C(=N-CN)N(R1)2, -NR1C(=O)R1, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
각각의 R1은 독립적으로 H, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 페닐, 또는 치환되거나 비치환된 헤테로아릴이고;
L2는 -X2-L4-, 또는 -L4-X2-이며;
X2는 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, 또는 -NR1-이고;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C3알킬렌이며;
R2는 독립적으로 H, D, -F, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R11, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C6알키닐, 및 치환되거나 비치환된 C1-C6플루오로알킬로부터 선택되고;
n은 0, 1, 또는 2이며;
m은 0, 1, 또는 2이다.
또 다른 양태에서, 본원에서 확인될 수 있는 화합물은 식 (VII)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00049
상기 식에서,
고리 A는 아릴 또는 헤테로아릴이고;
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C2-C6알케닐, 치환되거나 비치환된 C2-C6알키닐, 치환되거나 비치환된 C1-C6플루오로알킬, 및 치환되거나 비치환된 C1-C6헤테로알킬로부터 선택되며;
L1은 -X1-L3- 또는 -L3-X1-이고;
X1은 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -NR1S(=O)2-, 또는 -NR1-이며;
L3은 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이고;
Y1은 -W1-Y2- 또는 -Y2-W1-이며;
W1은 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -1C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -NR1S(=O)2-, 또는 -NR1-이고;
Y2는 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이며;
고리 B는 아릴 또는 헤테로아릴이고;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -N(R1)2, -S(=O)2R1, -NR1S(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, NR10C(=N-CN)N(R1)2, -NR1C(=O)R1, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 아릴 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
각각의 R1은 독립적으로 H, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 페닐, 또는 치환되거나 비치환된 헤테로아릴이고;
L2는 -X2-L4-, 또는 -L4-X2-이며;
X2는 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, 또는 -NR1-이고;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C3알킬렌이며;
고리 C는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이고;
각각의 RC는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -CH2-N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R11, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C6알키닐, 및 치환되거나 비치환된 C1-C6플루오로알킬로부터 선택되며;
고리 D는 모노사이클릭 카르보사이클 또는 모노사이클릭 헤테로사이클이고;
각각의 RD는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C2-C6알케닐, 치환되거나 비치환된 C2-C6알키닐, 치환되거나 비치환된 C1-C6플루오로알킬, 및 치환되거나 비치환된 C1-C6헤테로알킬로부터 선택되며;
L5는 -X3-L6-, 또는 -L6-X3-이고;
X3은 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, 또는 -NR1-이며;
L6은 부재하거나 또는 치환되거나 비치환된 C1-C4알킬렌이고;
n은 0, 1, 또는 2이며;
m은 0, 1, 또는 2이고;
q는 0, 1, 2, 3, 4, 5, 또는 6이며;
p는 0, 1, 2, 3, 또는 4이다.
또 다른 양태에서, 본원에서 확인될 수 있는 화합물은 식 (VIII)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00050
상기 식에서,
고리 A는 아릴 또는 헤테로아릴이고;
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C2-C6알케닐, 치환되거나 비치환된 C2-C6알키닐, 치환되거나 비치환된 C1-C6플루오로알킬, 및 치환되거나 비치환된 C1-C6헤테로알킬로부터 선택되며;
L1은 -X1-L3- 또는 -L3-X1-이고;
X1은 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -NR1S(=O)2-, 또는 -NR1-이며;
L3은 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이고;
Y1은 -W1-Y2- 또는 -Y2-W1-이며;
W1은 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -NR1S(=O)2-, 또는 -NR1-이고;
Y2는 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이며;
고리 B는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이고;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -N(R1)2, -S(=O)2R1, -NR1S(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, NR10C(=N-CN)N(R1)2, -NR1C(=O)R1, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
각각의 R1은 독립적으로 H, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 페닐, 또는 치환되거나 비치환된 헤테로아릴이고;
L2는 -X2-L4-, 또는 -L4-X2-이며;
X2는 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, 또는 -NR1-이고;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C3알킬렌이며;
R2는 독립적으로 H, D, -F, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R11, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C6알키닐, 및 치환되거나 비치환된 C1-C6플루오로알킬로부터 선택되고;
고리 D는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이며;
각각의 RD는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C2-C6알케닐, 치환되거나 비치환된 C2-C6알키닐, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬로부터 선택되고;
L5는 -X3-L6-, 또는 -L6-X3-이며;
X3은 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)2NR1-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, 또는 -NR1-이고;
L6은 부재하거나 또는 치환되거나 비치환된 C1-C4알킬렌이며;
n은 0, 1, 또는 2이고;
m은 0, 1, 또는 2이며;
p는 0, 1, 2, 3, 또는 4이다.
일 양태에서, 본원에서 확인될 수 있는 화합물은 식 (IX)의 구조 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며;
Figure pct00051
상기 식에서,
고리 A는 아릴 또는 헤테로아릴이고;
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C2-C6알케닐, 치환되거나 비치환된 C2-C6알키닐, 치환되거나 비치환된 C1-C6플루오로알킬, 및 치환되거나 비치환된 C1-C6헤테로알킬로부터 선택되며;
L1은 -X1-L3- 또는 -L3-X1-이고;
X1은 -S(=O)2NR1-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, 또는 -NR1S(=O)2-이며;
L3은 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이고;
고리 B는 아릴 또는 헤테로아릴이며;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되고;
각각의 R1은 독립적으로 H, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 페닐, 또는 치환되거나 비치환된 헤테로아릴이며;
L2는 -X2-L4-, 또는 -L4-X2-이고;
X2는 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, -S(=O)2NR1-, 또는 -NR1-이며;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C3알킬렌이고;
고리 C는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이며;
각각의 RC는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -CH2-N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R11, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 및 치환되거나 비치환된 C2-C8헤테로사이클로알킬로부터 선택되고;
n은 0, 1, 또는 2이며;
m은 0, 1, 또는 2이고;
q는 0, 1, 2, 3, 4, 5, 또는 6이다.
일 양태에서, 식 (X)의 구조를 갖는 화합물 또는 이의 약제학적으로 허용가능한 염 또는 용매화물이 본원에 기재되며:
Figure pct00052
상기 식에서,
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C2-C6알케닐, 치환되거나 비치환된 C2-C6알키닐, 치환되거나 비치환된 C1-C6플루오로알킬, 및 치환되거나 비치환된 C1-C6헤테로알킬로부터 선택되고;
L1은 -X1-L3- 또는 -L3-X1-이며;
X1은 -S(=O)2NR1-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, 또는 -NR1S(=O)2-이고;
L3은 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이며;
고리 B는 아릴 또는 헤테로아릴이고;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
각각의 R1은 독립적으로 H, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 페닐, 또는 치환되거나 비치환된 헤테로아릴이고;
L2는 -X2-L4-, 또는 -L4-X2-이며;
X2는 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, -S(=O)2NR1-, 또는 -NR1-이고;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C3알킬렌이며;
고리 C는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이고;
각각의 RC는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -CH2-N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R11, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 및 치환되거나 비치환된 C2-C8헤테로사이클로알킬로부터 선택되며;
n은 0, 1, 또는 2이고;
m은 0, 1, 또는 2이며;
q는 0, 1, 2, 3, 4, 5, 또는 6이다.
일 양태에서, 본원에서 확인될 수 있는 화합물은 식 (XI)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00053
상기 식에서,
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C2-C6알케닐, 치환되거나 비치환된 C2-C6알키닐, 치환되거나 비치환된 C1-C6플루오로알킬, 및 치환되거나 비치환된 C1-C6헤테로알킬로부터 선택되고;
L1은 -X1-L3- 또는 -L3-X1-이며;
X1은 -S(=O)2NR1-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, 또는 -NR1S(=O)2-이고;
L3은 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이며;
고리 B는 모노사이클릭 헤테로사이클 또는 바이사이클릭 헤테로사이클이고;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 아릴 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
각각의 R1은 독립적으로 H, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 페닐, 또는 치환되거나 비치환된 헤테로아릴이고;
L2는 -X2-L4-, 또는 -L4-X2-이며;
X2는 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, -S(=O)2NR1-, 또는 -NR1-이고;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C3알킬렌이며;
고리 C는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이고;
각각의 RC는 독립적으로 H, D, F, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -CH2-N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R11, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 및 치환되거나 비치환된 C2-C8헤테로사이클로알킬로부터 선택되며;
n은 0, 1, 또는 2이고;
m은 0, 1, 또는 2이며;
q는 0, 1, 2, 3, 4, 5, 또는 6이다.
일 양태에서, 본원에서 확인될 수 있는 화합물은 식 (XII)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00054
상기 식에서,
각각의 A는 독립적으로 N 또는 CRA이고;
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, =O, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)(=NR1)R2, -NR1S(=O)2R2, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)R1, -P(=O)(R2)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C7헤테로사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
L1은 -X1-L3- 또는 -L3-X1-이고;
X1은 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)(=NR1)-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -S(=O)2NR1-, -NR1S(=O)2-, -NR1-, -P(=O)R2-, -P(=O)(N(R1)2)-, 또는 -P(=O)(CR1 3)-이며;
L3은 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이고;
고리 B는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이며;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, =O, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)(=NR1)R2, -NR1S(=O)2R2, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)R1, -P(=O)(R2)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C7헤테로사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되고;
각각의 R1은 독립적으로 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6할로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 아릴, 또는 치환되거나 비치환된 헤테로아릴이며;
각각의 R2는 독립적으로 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 아릴, 치환되거나 비치환된 모노사이클릭 헤테로아릴, -OH, -OR1, -N(R1)2, -CH2OR1, -C(=O)OR1, -OC(=O)R1, -C(=O)N(R1)2, 또는 -NR1C(=O)R1이고;
L2는 -X2-L4- 또는 -L4-X2-이며;
X2는 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)(=NR1)-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)C(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, -S(=O)2NR1-, -NR1-, -P(=O)R2-, -P(=O)(N(R1)2)-, 또는 -P(=O)(CR1 3)-이고;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이며;
고리 C는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이고;
각각의 RC는 독립적으로 H, D, F, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -CH2-N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R1, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 및 치환되거나 비치환된 C2-C8헤테로사이클로알킬로부터 선택되며;
n은 0, 1, 2, 또는 3이고;
m은 0, 1, 2, 또는 3이며;
q는 0, 1, 2, 3, 4, 5, 또는 6이다.
또 다른 양태에서, 본원에서 확인될 수 있는 화합물은 식 (XIII)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00055
상기 식에서,
각각의 A는 독립적으로 N 또는 CRA이고;
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, =O, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)(=NR1)R2, -NR1S(=O)2R2, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)R1, -P(=O)(R2)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C7헤테로사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
L1은 -X1-L3- 또는 -L3-X1-이고;
X1은 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)(=NR1)-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -S(=O)2NR1-, -NR1S(=O)2-, -NR1-, -P(=O)R2-, -P(=O)(N(R1)2)-, 또는 -P(=O)(CR1 3)-이며;
L3은 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이고;
고리 B는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이며;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, =O, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)(=NR1)R2, -NR1S(=O)2R2, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)R1, -P(=O)(R2)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C7헤테로사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되고;
각각의 R1은 독립적으로 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6할로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 아릴, 또는 치환되거나 비치환된 헤테로아릴이며;
각각의 R2는 독립적으로 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 아릴, 치환되거나 비치환된 모노사이클릭 헤테로아릴, -OH, -OR1, -N(R1)2, -CH2OR1, -C(=O)OR1, -OC(=O)R1, -C(=O)N(R1)2, 또는 -NR1C(=O)R1이고;
L2는 -X2-L4- 또는 -L4-X2-이며;
X2는 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)(=NR1)-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)C(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, -S(=O)2NR1-, -NR1-, -P(=O)R2-, -P(=O)(N(R1)2)-, 또는 -P(=O)(CR1 3)-이고;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이며;
RC는 -CN, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -CH2-N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R1, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 및 치환되거나 비치환된 C2-C8헤테로사이클로알킬이고;
n은 0, 1, 2, 또는 3이며;
m은 0, 1, 2, 또는 3이다.
일 양태에서, 본원에서 확인될 수 있는 화합물은 식 (XIV)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00056
상기 식에서,
각각의 A는 독립적으로 N 또는 CRA1이고;
각각의 RA1은 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, =O, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)(=NR1)R2, -NR1S(=O)2R2, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)R1, -P(=O)(R2)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C7헤테로사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
RA2는 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 또는 치환되거나 비치환된 C1-C6헤테로알킬이고;
L1은 -X1-L3- 또는 -L3-X1-이며;
X1은 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)(=NR1)-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -S(=O)2NR1-, -NR1S(=O)2-, -NR1-, -P(=O)R2-, -P(=O)(N(R1)2)-, 또는 -P(=O)(CR1 3)-이고;
L3은 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이며;
고리 B는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이고;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, =O, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)(=NR1)R2, -NR1S(=O)2R2, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)R1, -P(=O)(R2)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C7헤테로사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
각각의 R1은 독립적으로 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6할로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 아릴, 또는 치환되거나 비치환된 헤테로아릴이고;
각각의 R2는 독립적으로 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 아릴, 치환되거나 비치환된 모노사이클릭 헤테로아릴, -OH, -OR1, -N(R1)2, -CH2OR1, -C(=O)OR1, -OC(=O)R1, -C(=O)N(R1)2, 또는 -NR1C(=O)R1이며;
L2는 -X2-L4- 또는 -L4-X2-이고;
X2는 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)(=NR1)-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)C(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, -S(=O)2NR1-, -NR1-, -P(=O)R2-, -P(=O)(N(R1)2)-, 또는 -P(=O)(CR1 3)-이며;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이고;
고리 C는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이며;
각각의 RC는 독립적으로 H, D, F, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -CH2-N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R1, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 및 치환되거나 비치환된 C2-C8헤테로사이클로알킬로부터 선택되고;
n은 0, 1, 2, 또는 3이며;
m은 0, 1, 2, 또는 3이고;
q는 0, 1, 2, 3, 4, 5, 또는 6이다.
또 다른 양태에서, 본원에서 확인될 수 있는 화합물은 식 (XV)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00057
상기 식에서,
각각의 A는 독립적으로 N 또는 CRA1이고;
각각의 RA1은 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, =O, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)(=NR1)R2, -NR1S(=O)2R2, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)R1, -P(=O)(R2)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C7헤테로사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
RA2는 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C3-C6사이클로알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 또는 치환되거나 비치환된 C1-C6헤테로알킬이고;
L1은 -X1-L3- 또는 -L3-X1-이며;
X1은 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)(=NR1)-, -CH2-, -C(=O)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -S(=O)2NR1-, -NR1S(=O)2-, -NR1-, -P(=O)R2-, -P(=O)(N(R1)2)-, 또는 -P(=O)(CR1 3)-이고;
L3은 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이며;
고리 B는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이고;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, =O, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)(=NR1)R2, -NR1S(=O)2R2, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)R1, -P(=O)(R2)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C7헤테로사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
각각의 R1은 독립적으로 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6할로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 아릴, 또는 치환되거나 비치환된 헤테로아릴이고;
각각의 R2는 독립적으로 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 아릴, 치환되거나 비치환된 모노사이클릭 헤테로아릴, -OH, -OR1, -N(R1)2, -CH2OR1, -C(=O)OR1, -OC(=O)R1, -C(=O)N(R1)2, 또는 -NR1C(=O)R1이며;
L2는 -X2-L4- 또는 -L4-X2-이고;
X2는 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)(=NR1)-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)C(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, -S(=O)2NR1-, -NR1-, -P(=O)R2-, -P(=O)(N(R1)2)-, 또는 -P(=O)(CR1 3)-이며;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이고;
RC는 -CN, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -CH2-N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R1, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 또는 치환되거나 비치환된 C2-C8헤테로사이클로알킬이며;
n은 0, 1, 2, 또는 3이고;
m은 0, 1, 2, 또는 3이다.
일 양태에서, 본원에서 확인될 수 있는 화합물은 식 (XVI)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00058
상기 식에서,
고리 A는 6원 아릴 또는 6원 헤테로아릴이고;
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, =O, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)(=NR1)R2, -NR1S(=O)2R2, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)R1, -P(=O)(R2)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C7헤테로사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
L1은 -X1A-L3-X1B-, -L3-X1A-X1B-, 또는 -X1A-X1B-L3-이고;
X1A는 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)(=NR1)-, -CH2-, -C(=O)-, -C(=N-OR2)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -S(=O)2NR1-, -NR1S(=O)2-, -NR1-, -NOR1-, -P(=O)R2-, -P(=O)(N(R1)2)-, -P(=O)(CR1 3)-, -CR2=CR2-, -N=CR2-, -CR2=N-, 또는 -NR2-NR2-이며;
L3은 부재하거나, 치환되거나 비치환된 C1-C2알킬렌, 또는
Figure pct00059
이고;
X1B는 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)(=NR1)-, -CH2-, -C(=O)-, -C(=N-OR2)-, -C(=O)O-, -OC(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -S(=O)2NR1-, -NR1S(=O)2-, -NR1-, -NOR1-, -P(=O)R2-, -P(=O)(N(R1)2)-, -P(=O)(CR1 3)-, -CR2=CR2-, -N=CR2-, -CR2=N-, 또는 -NR2-NR2-이며;
고리 B는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이고;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, =O, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)(=NR1)R2, -NR1S(=O)2R2, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)R1, -P(=O)(R2)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C7헤테로사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
각각의 R1은 독립적으로 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 아릴, 또는 치환되거나 비치환된 헤테로아릴이고;
각각의 R2는 독립적으로 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 아릴, 치환되거나 비치환된 모노사이클릭 헤테로아릴, -OH, -OR1, -N(R1)2, -CH2OR1, -C(=O)OR1, -OC(=O)R1, -C(=O)N(R1)2, 또는 -NR1C(=O)R1이며;
L2는 -X2-L4- 또는 -L4-X2-이고;
X2는 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)(=NR1)-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)C(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, -S(=O)2NR1-, -NR1-, -P(=O)R2-, -P(=O)(N(R1)2)-, 또는 -P(=O)(CR1 3)-이며;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이고;
고리 C는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이며;
각각의 RC는 독립적으로 H, D, F, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -CH2-N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R1, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 및 치환되거나 비치환된 C2-C8헤테로사이클로알킬로부터 선택되고;
n은 0, 1, 2, 또는 3이며;
m은 0, 1, 2, 또는 3이고;
q는 0, 1, 2, 3, 4, 5, 또는 6이다.
일 양태에서, 본원에서 확인될 수 있는 화합물은 식 (XVII)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00060
상기 식에서,
고리 A는 바이사이클릭 카르보사이클 또는 바이사이클릭 헤테로사이클이고;
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, =O, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)(=NR1)R2, -NR1S(=O)2R2, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)R1, -P(=O)(R2)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C7헤테로사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
L1은 -X1-L3- 또는 -L3-X1-이고;
X1은 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)(=NR1)-, -CH2-, -C(=O)-, -C(=N-OR2)-, -C(=O)O-, -OC(=O)-, -C(=O)C(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -S(=O)2NR1-, -NR1S(=O)2-, -NR1-, -NOR1-, -P(=O)R2-, -P(=O)(N(R1)2)-, -P(=O)(CR1 3)-, -CR2=CR2-, -N=CR2-, -CR2=N-, -C≡C-, 또는 -NR2-NR2-이며;
L3은 부재하거나, 치환되거나 비치환된 C1-C2알킬렌, 또는
Figure pct00061
이고;
고리 B는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이며;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, =O, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)(=NR1)R2, -NR1S(=O)2R2, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)R1, -P(=O)(R2)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C7헤테로사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되고;
각각의 R1은 독립적으로 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 아릴, 또는 치환되거나 비치환된 헤테로아릴이며;
각각의 R2는 독립적으로 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 아릴, 치환되거나 비치환된 모노사이클릭 헤테로아릴, -OH, -OR1, -N(R1)2, -CH2OR1, -C(=O)OR1, -OC(=O)R1, -C(=O)N(R1)2, 또는 -NR1C(=O)R1이고;
L2는 -X2-L4- 또는 -L4-X2-이며;
X2는 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)(=NR1)-, -CH2-, -CH=CH-, -C≡C-, -C(=O)-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)C(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, -S(=O)2NR1-, -NR1-, -P(=O)OR1-, -P(=O)(N(R1)2)-, 또는 -P(=O)(CR1 3)-이고;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이며;
고리 C는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이고;
각각의 RC는 독립적으로 H, D, F, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -CH2-N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R1, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 및 치환되거나 비치환된 C2-C8헤테로사이클로알킬로부터 선택되며;
n은 0, 1, 2, 또는 3이고;
m은 0, 1, 2, 또는 3이며;
q는 0, 1, 2, 3, 4, 5, 또는 6이다.
또 다른 양태에서, 본원에서 확인될 수 있는 화합물은 식 (XVIII)의 구조, 또는 이의 약제학적으로 허용가능한 염 또는 용매화물을 가지며:
Figure pct00062
상기 식에서,
고리 A는 바이사이클릭 카르보사이클 또는 바이사이클릭 헤테로사이클이고;
각각의 RA는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, =O, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)(=NR1)R2, -NR1S(=O)2R2, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)R1, -P(=O)(R2)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C7헤테로사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
L1은 -X1-L3- 또는 -L3-X1-이고;
X1은 부재하거나, -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)(=NR1)-, -CH2-, -C(=O)-, -C(=N-OR2)-, -C(=O)O-, -OC(=O)-, -C(=O)C(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -S(=O)2NR1-, -NR1S(=O)2-, -NR1-, -NOR1-, -P(=O)R2-, -P(=O)(N(R1)2)-, -P(=O)(CR1 3)-, -CR2=CR2-, -N=CR2-, -CR2=N-, -C≡C-, 또는 -NR2-NR2-이며;
L3은 부재하거나, 치환되거나 비치환된 C1-C2알킬렌, 또는
Figure pct00063
이고;
각각의 RB는 독립적으로 H, D, 할로겐, -CN, -OH, -OR1, =O, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -NR1S(=O)(=NR1)R2, -NR1S(=O)2R2, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)R1, -P(=O)(R2)2, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 치환되거나 비치환된 C2-C7헤테로사이클로알킬, 치환되거나 비치환된 아릴, 및 치환되거나 비치환된 모노사이클릭 헤테로아릴로부터 선택되며;
각각의 R1은 독립적으로 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 아릴, 또는 치환되거나 비치환된 헤테로아릴이고;
각각의 R2는 독립적으로 H, D, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 아릴, 치환되거나 비치환된 모노사이클릭 헤테로아릴, -OH, -OR1, -N(R1)2, -CH2OR1, -C(=O)OR1, -OC(=O)R1, -C(=O)N(R1)2, 또는 -NR1C(=O)R1이며;
L2는 -X2-L4- 또는 -L4-X2-이고;
X2는 -O-, -S-, -S(=O)-, -S(=O)2-, -S(=O)(=NR1)-, -CH2-, -CH=CH-, -C≡C-, -C(=O)O-, -OC(=O)-, -OC(=O)O-, -C(=O)C(=O)-, -C(=O)NR1-, -NR1C(=O)-, -OC(=O)NR1-, -NR1C(=O)O-, -NR1C(=O)NR1-, -NR1S(=O)2-, -S(=O)2NR1-, -NR1-, -P(=O)OR1-, -P(=O)(N(R1)2)-, 또는 -P(=O)(CR1 3)-이며;
L4는 부재하거나 또는 치환되거나 비치환된 C1-C2알킬렌이고;
고리 C는 모노사이클릭 카르보사이클, 바이사이클릭 카르보사이클, 모노사이클릭 헤테로사이클, 또는 바이사이클릭 헤테로사이클이며;
각각의 RC는 독립적으로 H, D, F, -CN, -OH, -OR1, -SR1, -S(=O)R1, -S(=O)2R1, -N(R1)2, -CH2-N(R1)2, -NHS(=O)2R1, -S(=O)2N(R1)2, -C(=O)R1, -OC(=O)R1, -CO2R1, -OCO2R1, -C(=O)N(R1)2, -OC(=O)N(R1)2, -NR1C(=O)N(R1)2, -NR1C(=O)R1, -NR1C(=O)OR1, 치환되거나 비치환된 C1-C6알킬, 치환되거나 비치환된 C1-C6플루오로알킬, 치환되거나 비치환된 C1-C6헤테로알킬, 치환되거나 비치환된 C3-C8사이클로알킬, 및 치환되거나 비치환된 C2-C8헤테로사이클로알킬로부터 선택되고;
n은 0, 1, 2, 또는 3이며;
q는 0, 1, 2, 3, 4, 5, 또는 6이다.
실시예 11
새로운 SMN2 스플라이싱 변형제를 개발 또는 스크리닝하기 위해, 화합물 A에 의해 매개되는 SMN2 특이적 스플라이싱 교정에 대한 분자적 기초를 조사하였다. U1 snRNA의 5'-말단 및 SMN2 엑손 7의 5'-스플라이스 부위에 의해 형성된 RNA 이합체에 결합하는 스플라이싱 변형제 화합물 A의 능력을 먼저 확인하였다. 이후, 복합체 화합물 A-RNA 이합체의 용액 구조를 용액 상태 NMR 분광학에 의해 해석하였다. 자유 RNA 이합체 및 스플라이싱 변형제와 복합된 RNA 이합체의 용액 구조에 비교함으로써, 화합물 A의 작용 기전을 결정하였다. 화합물 A는 넓은 홈(major groove)에서 엑손-인트론의 수준에서 RNA 이합체와 상호작용하며, 쌍을 형성하지 않은 아데닌을 RNA 나선 염기 스택(base stack) 내로 끌어당긴다. 스플라이싱 변형제는 SMN2 엑손 7의 약한 5'-스플라이스 부위를 강한 부위로 변형시킨다. 복합체의 구조는 화합물 A가 SMN2 엑손 7의 스플라이싱을 교정하기 위해 위치 -1에서 돌출부를 수리한다는 것을 밝혀내었다.
척수 근위축증(SMA)은 영아 사망률의 주된 유전적 원인에 해당하는 상염색체 열성 신경근 질환이다. 상기 장애는 근육 약화 및 위축을 초래하는 척수 및 뇌간으로부터 운동 뉴런의 점진적인 퇴화를 특징으로 할 수 있다. SMA는 도처에 존재하며 다수의 세포 과정에 관여하는 SMN 단백질의 주요 공급원인 운동 뉴런-1 생존 유전자(SMN1)의 유전적 동형접합 불활성화에 의해 유발된다. 파라로그(paralog) 유전자 SMN2가 인간 게놈에서 발견되긴 하지만, 이것은 엑손 7이 결여되고 불안정한 단백질을 코딩하는 상이한 mRNA 이소형의 생산을 주로 유발하는 몇 가지 침묵 돌연변이(엑손 7에서의 C6T 돌연변이 포함)가 상이하다. 기능성 SMN 단백질의 양의 감소가 운동 뉴런 기능을 손상시킬 수 있지만, 정확한 기전은 여전히 불명확하다. SMN2는 여전히 소량의 기능성 SMN 단백질(~ 20%)을 생산하지만 SMN1의 소실을 보상하기에 충분하지 않기 때문에, 모든 SMA 환자는 SMN2 유전자의 적어도 하나의 카피를 가지며 질환의 중증도는 SMN2 유전자 카피 수와 반비례한다. 최근에, SMN2 E7 포함을 촉진하는 스플라이싱 변형제가 개발되었다. 이들은 기능성 SMN 단백질의 생산 및 SMA-모델 마우스의 생존을 증가시킬 수 있다. 스플라이싱 변형제는 전구-mRNA 스플라이싱 수준에서 SMN2 E7에 대해 높은 특이성으로 작용할 수 있고 5'-SS E7에서 특정 인핸서 복합체를 안정화시켜 스플라이소좀 어셈블리의 초기 단계를 도울 수 있다. 스플라이싱 교정이 원자 수준에서 어떻게 구동되는지 깊이 이해하고 새로운 치료 분자를 개발하기 위해, 화합물 A에 의해 매개되는 SMN2 스플라이싱 교정의 분자 기전을 조사하였다.
화합물 A는 U1 snRNA 5'-말단 및 SMN2 엑손 7의 5'- 스플라이스 부위에 의해 형성된 RNA 이합체에 결합한다.
화합물 A는 전구-mRNA 수준에서 작용하며, SMN2 엑손 7의 5'-스플라이스 부위에서 스플라이싱 인핸서 복합체를 선호해야 한다. 스플라이소좀 어셈블리시 RNA 이합체에서의 화합물 A의 결합을 평가하기 위해, 용액 상태 NMR에 의해 시험관내 결합 분석을 수행하였다. RNA 이합체를 MES d-8 5 mM pH 5.5, NaCl 50 mM에서 250 μM로 제조하고, 동결 탐침이 장착된 600 MHz AVIII HD 분광계에서 참조 스펙트럼(1D 1H 및 2D 1H-1H TOCSY)을 기록하였다. 이후, 화합물 A를 동일한 완충액에 용해시키고, RNA 샘플에 첨가하였다. 스플라이싱 변형제의 첨가시, RNA의 공명은 두 파트너 간의 직접적인 상호작용에 따라, 화학적 이동 변화를 겪었다(도 5C). 특히, U+2 및 C8의 방향족 양성자 H5-H6에 대해 그리고 G-2의 이미노 양성자에 대해 화학적 이동 변화가 관찰되었다. 전체적으로, 이들 양성자는 엑손-인트론 접합의 넓은 홈 상에 위치한 RNA 상의 분자 결합 포켓을 정의한다.
화합물 A 및 RNA 이합체 사이의 분자간 NOE 유래 거리의 확인
화합물 A에 의해 유도된 특정 스플라이싱 교정에 대한 구조적 통찰력을 얻기 위해, 화합물 A에 결합된 RNA 이합체의 용액 구조를 조사하였다. 첫 번째 단계로서, 화합물 A의 양성자 공명을 할당하였다(도 6A). 화학적 이동 예측 도구(nmrdb.com)를 사용하여, 복합체의 동핵 NMR 스펙트럼에서 화합물 A의 화학적 이동을 확인하였다. 화합물 A의 공명이 할당되면, 2D 1H-1H TOCSY 및 NOESY 스펙트럼을 분석하여 RNA 이합체 공명 및 스플라이싱 변형제의 하나의 양성자와 RNA 이합체의 하나의 양성자 사이의 상관관계에 상응하는 분자간 NOE를 확인하였다. 화합물 A는 4개의 메틸기를 함유하기 때문에, 다수의 분자간 접촉이 확인되었다(30 분자간 거리)(도 6B). 첫 번째 사이클은 분자간 NOE의 주요 공급자이며, 그것은 분자의 이 부분이 5'-스플라이스 부위의 영역 G-1-G+1과 상호작용한다는 것을 보여준다. 중심 방향족 사이클은 피페라진 모이어티가 U1 snRNA 5'-말단으로부터 C9에 근접한 동안 임의의 분자간 구속을 제공하지 않는다. NOESY 스펙트럼에서 분자간 NOE의 존재를 나타내는 실험 데이터가 도 6C에 예시되어 있다. 이후, 이들 분자간 NOE를 NOE ㅇ-유래 거리로 변환하고 복합체 화합물 A-RNA 이합체의 구조 계산을 구동하는데 사용하였다.
화합물 A-RNA 이합체 복합체의 용액 구조
화합물 A-RNA 이합체 복합체의 용액 구조를 RNA 이합체에 대한 316개의 분자내 거리, 염기쌍을 유지하는 18개의 제약(constraint), 리보스 퍼커(pucker)를 보장하는 146개의 각도 구속(angular restraint) 및 30개의 분자간 NOE를 사용하여 해석하였다. 제공된 화학적 이동에 기초하여 NMR 데이터를 분석하고 이 해석을 비틀림 각도 모사된 어닐링에 결합시킨 CYANA NOEASSIGN을 사용하는 RNA 부분에 대한 반자동 접근법을 사용하여 RNA의 구조를 계산하였다. 프로그램은 7 사이클의 NOE 할당, 보정, 구조 계산 및 구조 및 실험 데이터 간의 일치의 평가를 수행한다. 이후, 자동 구조 계산의 출력을 수동 통합된 분자간 NOE 유래 거리와 조합하여 여전히 비틀림-각도 공간에 있는 복합체의 구조를 계산하였다. 낮은 표적 기능이 달성되면, 구조를 AMBER12의 SANDER 모듈을 사용하여 카테시안 공간(Cartesian space)에서 모사된 어닐링에 의해 개선하였다. 이후, 이 구조를 사용하여 새로운 SMN2 스플라이싱 변형제를 개발 및 스크리닝하였다.
SMN2 엑손 7 및 U1 snRNP의 5'-스플라이스 부위의 인식시 형성된 RNA 이합체에 결합된 화합물 A 스플라이싱 변형제의 용액 구조를 해석함으로써, 화합물 A가 엑손-인트론 접합에서 쌍을 형성하지 않은 아데닌을 RNA 나선 염기 스택으로 안정화시킨다는 것이 밝혀졌다. 아데닌의 입체형태 전환은 강한 5'-스플라이스 부위를 모방하고 특정 스플라이싱 교정을 유도한다. 화합물 A 결합 포켓의 원자 세부사항은 SMN2 및 다른 표적에 대한 새로운 스플라이싱 변형제를 합리적으로 설계하는 능력을 예시한다.
본 발명의 바람직한 구현예가 본원에 도시되고 설명되었지만, 이러한 구현예는 단지 예로서 제공된다는 것이 당업자에게 자명할 것이다. 많은 변경, 변화, 및 치환이 본 발명을 벗어나지 않으면서 당업자에게 일어날 것이다. 본원에 기재된 본 발명의 구현예에 대한 다양한 대안이 본 발명을 실시하는데 사용될 수 있음이 이해되어야 한다. 하기 청구범위는 본 발명의 범위를 정의하고 이들 청구범위 내의 방법 및 구조 및 이들의 등가물이 이에 의해 포함되는 것으로 의도된다.
SEQUENCE LISTING <110> SKYHAWK THERAPEUTICS, INC. <120> METHODS AND COMPOSITIONS FOR SCREENING AND IDENTIFICATION OF SPLICING MODULATORS <130> 51503-703.601 <140> PCT/US2018/052743 <141> 2018-09-25 <150> 62/562,941 <151> 2017-09-25 <160> 28 <170> PatentIn version 3.5 <210> 1 <211> 10 <212> RNA <213> Homo sapiens <400> 1 uggguggggg 10 <210> 2 <211> 10 <212> RNA <213> Homo sapiens <400> 2 ugggugggug 10 <210> 3 <211> 10 <212> RNA <213> Homo sapiens <400> 3 aucgguaaaa 10 <210> 4 <211> 10 <212> RNA <213> Homo sapiens <400> 4 cagguaaugu 10 <210> 5 <211> 10 <212> RNA <213> Homo sapiens <400> 5 gagguaauac 10 <210> 6 <211> 10 <212> RNA <213> Homo sapiens <400> 6 gagguaauau 10 <210> 7 <211> 10 <212> RNA <213> Homo sapiens <400> 7 gagguaaugu 10 <210> 8 <211> 10 <212> RNA <213> Homo sapiens <400> 8 aagguaauaa 10 <210> 9 <211> 10 <212> RNA <213> Homo sapiens <400> 9 aagguaaugu 10 <210> 10 <211> 11 <212> RNA <213> Homo sapiens <400> 10 aagguaaugu a 11 <210> 11 <211> 12 <212> RNA <213> Homo sapiens <400> 11 cgggucauaa uc 12 <210> 12 <211> 10 <212> RNA <213> Homo sapiens <400> 12 aaggucuggg 10 <210> 13 <211> 10 <212> RNA <213> Homo sapiens <400> 13 caggucugga 10 <210> 14 <211> 10 <212> RNA <213> Homo sapiens <400> 14 caggucuggu 10 <210> 15 <211> 10 <212> RNA <213> Homo sapiens <400> 15 gaggucuggu 10 <210> 16 <211> 10 <212> RNA <213> Homo sapiens <400> 16 aacaugagga 10 <210> 17 <211> 10 <212> RNA <213> Homo sapiens <400> 17 caagguaccu 10 <210> 18 <211> 11 <212> RNA <213> Homo sapiens <220> <221> modified_base <222> (5)..(6) <223> Pseudouracil <400> 18 auacuuaccu g 11 <210> 19 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 19 ggaguaaguc u 11 <210> 20 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 20 gauacuuacc ug 12 <210> 21 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 21 ggaguaaguc ugauacuuac cug 23 <210> 22 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 22 ucuaaggcgu aagucugcca g 21 <210> 23 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 23 ucuaagcagu aagucugcca g 21 <210> 24 <211> 11 <212> RNA <213> Homo sapiens <400> 24 auacuuaccu g 11 <210> 25 <211> 10 <212> RNA <213> Homo sapiens <400> 25 caaguaagug 10 <210> 26 <211> 10 <212> RNA <213> Homo sapiens <400> 26 cagguaagua 10 <210> 27 <211> 10 <212> RNA <213> Homo sapiens <220> <221> modified_base <222> (5)..(6) <223> Pseudouracil <400> 27 auacuuacug 10 <210> 28 <211> 12 <212> RNA <213> Homo sapiens <220> <221> modified_base <222> (12)..(12) <223> a, c, u, g, unknown or other <400> 28 caguaagucu gn 12

Claims (178)

  1. (a) 표적 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드 샘플을 제공하는 단계;
    (b) 표적 폴리뉴클레오타이드에 제1 결합제, 제2 결합제, 또는 둘 모두를 접촉시키는 단계로서,
    표적 폴리뉴클레오타이드 및 제1 결합제는 제1 복합체를 형성하고,
    제2 결합제 및 제1 복합체는 제2 복합체를 형성하는 것인 단계; 및
    (c) 핵자기 공명(NMR) 장치를 사용하여 제1 복합체, 제2 복합체, 또는 둘 모두의 핵자기 공명(NMR) 스펙트럼을 수득하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서, 표적 폴리뉴클레오타이드는 표적 리보핵산(RNA)인 방법.
  3. 제2항에 있어서, 표적 RNA는 전구체 메신저 RNA(전구-mRNA) 또는 이의 일부인 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 스플라이스 부위 또는 이의 일부를 함유하는 것인 방법.
  5. 제4항에 있어서, 스플라이스 부위는 5' 스플라이스 부위, 잠재(cryptic) 5' 스플라이스 부위, 3' 스플라이스 부위, 또는 잠재 3' 스플라이스 부위, 또는 이의 임의의 조합인 방법.
  6. 제1항 내지 제3항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 분기점(BP), 엑손 스플라이싱 인핸서(ESE), 엑손 스플라이싱 사일런서(ESS), 인트론 스플라이싱 인핸서(ISE), 인트론 스플라이싱 사일런서(ISS), 또는 폴리피리미딘 트랙트(tract), 또는 이의 임의의 조합을 함유하는 것인 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 하나의 인트론 또는 이의 단편을 함유하는 것인 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손 또는 이의 단편을 함유하는 것인 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손-인트론 경계를 함유하는 것인 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 8개의 뉴클레오타이드 길이인 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 25개의 뉴클레오타이드 길이인 방법.
  12. 제1항 내지 제10항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 최대 1000개의 뉴클레오타이드 길이인 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 100 내지 200개의 뉴클레오타이드 길이인 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 2H, 13C, 15N, 19F 및 31P를 포함하는 하나 이상의 원자 표지로 동위원소적으로 표지된 뉴클레오타이드를 포함하지 않거나 적어도 하나 포함하는 것인 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 제1 결합제는 제1 폴리뉴클레오타이드, 제1 폴리펩타이드, 또는 이의 조합을 포함하는 것인 방법.
  16. 제15항에 있어서, 제1 폴리뉴클레오타이드는 제1 RNA인 방법.
  17. 제16항에 있어서, 제1 RNA는 작은 핵 RNA(snRNA) 또는 이의 일부인 방법.
  18. 제17항에 있어서, snRNA는 U1 snRNA, U2 snRNA, U4 snRNA, U5 snRNA, U6 snRNA, U11 snRNA, U12 snRNA, U4atac snRNA, U5 snRNA, U6atac snRNA; 또는 이의 일부인 방법.
  19. 제15항 내지 제18항 중 어느 한 항에 있어서, 제1 폴리펩타이드는 리보핵산단백질의 단백질 구성요소 또는 이의 일부인 방법.
  20. 제19항에 있어서, 리보핵산단백질은 작은 핵 리보핵산단백질(snRNP) 또는 이의 일부인 방법.
  21. 제20항에 있어서, snRNP는 U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP, U11 snRNP, U12 snRNP, U4atac snRNP, U5 snRNP, U6atac snRNP; 또는 이의 일부인 방법.
  22. 제15항 내지 제18항 중 어느 한 항에 있어서, 제1 폴리펩타이드는 9G8, A1 hnRNP, A2 hnRNP, ASD-1, ASD-2b, ASF, B1 hnRNP, C1 hnRNP, C2 hnRNAP, CBP20, CBP80, CELF, F hnRNP, FBP11, Fox-1, Fox-2, G hnRNP, H hnRNP, hnRNP 1, hnRNP 3, hnRNP C, hnRNP G, hnRNP K, hnRNP M, hnRNP U, Hu, HUR, I hnRNP, K hnRNP, KH-유형 스플라이싱 조절 단백질(KSRP), L hnRNP, M hnRNP, mBBP, 머슬-블라인드 유사(MBNL), NF45, NFAR, Nova-1, Nova-2, nPTB, P54/SFRS11, 폴리피리미딘 트랙트 결합 단백질(PTB), PRP19 복합체 단백질, R hnRNP, RNPC1, SAM68, SC35, SF, SF1/BBP, SF2, SF3A, SF3B, SFRS10, Sm 단백질, SR 단백질, SRm300, SRp20, SRp30c, SRP35C, SRP36, SRP38, SRp40, SRp55, SRp75, SRSF, STAR, GSG, SUP-12, TASR-1, TASR-2, TIA, TIAR, TRA2, TRA2a/b, U hnRNP, U1 snRNP, U11 snRNP, U12 snRNP, U1-C, U2 snRNP, U2AF1-RS2, U2AF35, U2AF65, U4 snRNP, U5 snRNP, U6 snRNP, Urp, YB1, 또는 이의 임의의 조합을 포함하는 군으로부터 선택된 단백질 또는 이의 일부인 방법.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 제2 결합제는 소분자인 방법.
  24. 제1항 내지 제14항 중 어느 한 항에 있어서, 제1 결합제는 소분자를 포함하는 것인 방법.
  25. 제1항 내지 제14항 및 제24항 중 어느 한 항에 있어서, 제2 결합제는 제2 폴리뉴클레오타이드, 제2 폴리펩타이드, 또는 이의 조합을 포함하는 것인 방법.
  26. 제25항에 있어서, 제2 폴리뉴클레오타이드는 제2 RNA인 방법.
  27. 제26항에 있어서, 제2 RNA는 작은 핵 RNA(snRNA) 또는 이의 일부인 방법.
  28. 제27항에 있어서, snRNA는 U1 snRNA, U2 snRNA, U4 snRNA, U5 snRNA, U6 snRNA, U11 snRNA, U12 snRNA, U4atac snRNA, U5 snRNA, U6atac snRNA; 또는 이의 일부인 방법.
  29. 제25항 내지 제28항 중 어느 한 항에 있어서, 제2 폴리펩타이드는 리보핵산단백질의 단백질 구성요소 또는 이의 일부인 방법.
  30. 제29항에 있어서, 리보핵산단백질은 작은 핵 리보핵산단백질(snRNP) 또는 이의 일부인 방법.
  31. 제30항에 있어서, snRNP는 U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP, U11 snRNP, U12 snRNP, U4atac snRNP, U5 snRNP, U6atac snRNP 또는 이의 일부인 방법.
  32. 제25항 내지 제28항 중 어느 한 항에 있어서, 제2 폴리펩타이드는 9G8, A1 hnRNP, A2 hnRNP, ASD-1, ASD-2b, ASF, B1 hnRNP, C1 hnRNP, C2 hnRNAP, CBP20, CBP80, CELF, F hnRNP, FBP11, Fox-1, Fox-2, G hnRNP, H hnRNP, hnRNP 1, hnRNP 3, hnRNP C, hnRNP G, hnRNP K, hnRNP M, hnRNP U, Hu, HUR, I hnRNP, K hnRNP, KH-유형 스플라이싱 조절 단백질(KSRP), L hnRNP, M hnRNP, mBBP, 머슬-블라인드 유사(MBNL), NF45, NFAR, Nova-1, Nova-2, nPTB, P54/SFRS11, 폴리피리미딘 트랙트 결합 단백질(PTB), PRP19 복합체 단백질, R hnRNP, RNPC1, SAM68, SC35, SF, SF1/BBP, SF2, SF3A, SF3B, SFRS10, Sm 단백질, SR 단백질, SRm300, SRp20, SRp30c, SRP35C, SRP36, SRP38, SRp40, SRp55, SRp75, SRSF, STAR, GSG, SUP-12, TASR-1, TASR-2, TIA, TIAR, TRA2, TRA2a/b, U hnRNP, U1 snRNP, U11 snRNP, U12 snRNP, U1-C, U2 snRNP, U2AF1-RS2, U2AF35, U2AF65, U4 snRNP, U5 snRNP, U6 snRNP, Urp, YB1, 또는 이의 임의의 조합을 포함하는 군으로부터 선택된 단백질 또는 이의 일부인 방법.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 제1 복합체는 결합 포켓을 포함하는 것인 방법.
  34. 제33항에 있어서, 결합 포켓은 돌출부(bulge), 또는 돌연변이, 또는 스템-루프, 또는 이의 임의의 조합을 포함하는 것인 방법.
  35. 제33항에 있어서, 결합 포켓은 돌출부, 돌연변이, 또는 스템-루프를 포함하지 않는 것인 방법.
  36. 제34항에 있어서, 돌출부 또는 돌연변이는 제1 폴리뉴클레오타이드에서 3차원적 구조 변화를 유발하는 것인 방법.
  37. 제33항 내지 제36항 중 어느 한 항에 있어서, 제2 결합제는 결합 포켓에 결합하는 것인 방법.
  38. 제1항 내지 제37항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 ABCA4, ABCB4, ABCD1, ACADSB, ADA, ADAMTS13, AGL, ALB, ALDH3A2, ALG6, APC, APOB, AR, ATM, ATP7A, ATR, B2M, BMP2K, BRCA1, BRCA2, BTK, C3, CAT, CD46, CDH1, CDH23, CFTR, CHM, COL11A1, COL11A2, COL1A1, COL1A2, COL2A1, COL3A1, COL4A5, COL6A1, COL6A3, COL7A1, COL9A2, COLQ, CUL4B, CYBB, CYP17, CYP19, CYP27, CYP27A1, DES, DMD, DYSF, EGFR, EMD, ETV4, F13A1, F5, F7, F8, FAH, FANCA, FANCC, FANCG, FBN1, FECH, FGA, FGFR2, FGG, FIX, FLNA, FOXM1, FRAS1, GALC, GH1, GHV, HADHA, HBA2, HBB, HEXA, HEXB, HLCS, HMBS, HMGCL, HNF1A, HPRT1, HPRT2, HSF4, HSPG2, HTT, IDS, IKBKAP, INSR, ITGB2, ITGB3, JAG1, KRAS, KRT5, L1CAM, LAMA3, LDLR, LMNA, LPL, MADD, MAPT, MLH1, MSH2, MST1R, MTHFR, MUT, MVK, NF1, NF2, OAT, OPA1, OTC, PAH, PBGD, PCCA, PDH1, PGK1, PHEX, PKD2, PKLR, PLEKHM1, PLKR, POMT2, PRDM1, PRKAR1A, PROC, PSEN1, PTCH1, PTEN, PYGM, RP6KA3, RPGR, RSK2, SBCAD, SCN5A, SERPINA1, SLC12A3, SLC6A8, SMN2, SPINK5, SPTA1, TP53, TRAPPC2, TSC1, TSC2, TSHB, UGT1A1, 및 USH2A로 이루어진 군으로부터 선택된 유전자 또는 이의 유전자 변이체에 의해 코딩되는 서열을 포함하는 것인 방법.
  39. 제1항 내지 제38항 중 어느 한 항에 있어서, 제1 NMR 스펙트럼은 제1 복합체에 대해 수득되고, 제2 NMR 스펙트럼은 제2 복합체에 대해 수득되는 것인 방법.
  40. 제39항에 있어서, 제1 및 제2 NMR 스펙트럼을 비교하는 단계를 추가로 포함하는 방법.
  41. 제40항에 있어서, 제1 및 제2 NMR 스펙트럼의 비교에 기초하여 제2 결합제를 선택하는 단계를 추가로 포함하는 방법.
  42. 제39항 내지 제41항 중 어느 한 항에 있어서, 제1 및 제2 NMR 스펙트럼의 화학적 이동을 결정하는 단계를 추가로 포함하는 방법.
  43. (a) 표적 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드 샘플을 제공하는 단계로서, 표적 폴리뉴클레오타이드는 스플라이스 부위, 분기점(BP), 엑손 스플라이싱 인핸서(ESE), 엑손 스플라이싱 사일런서(ESS), 인트론 스플라이싱 인핸서(ISE), 인트론 스플라이싱 사일런서(ISS), 또는 폴리피리미딘 트랙트, 또는 이의 임의의 조합을 포함하는 것인 단계;
    (b) 제1 결합제를 표적 폴리뉴클레오타이드와 접촉시키는 단계; 및
    (c) NMR 장치를 사용하여 폴리뉴클레오타이드 샘플의 제1 NMR 스펙트럼을 수득하는 단계
    를 포함하는 방법.
  44. 제43항에 있어서, 표적 폴리뉴클레오타이드는 표적 RNA인 방법.
  45. 제43항 또는 제44항에 있어서, 표적 폴리뉴클레오타이드는 전구-mRNA 또는 이의 일부인 방법.
  46. 제43항 내지 제45항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손 또는 이의 단편을 함유하는 것인 방법.
  47. 제43항 내지 제46항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 하나의 인트론 또는 이의 단편을 함유하는 것인 방법.
  48. 제43항 내지 제47항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 엑손-인트론 경계를 함유하는 것인 방법.
  49. 제43항 내지 제48항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 스플라이스 부위를 함유하는 것인 방법.
  50. 제43항 내지 제49항 중 어느 한 항에 있어서, 스플라이스 부위는 5' 스플라이스 부위, 잠재 5' 스플라이스 부위, 3' 스플라이스 부위, 또는 잠재 3' 스플라이스 부위, 또는 이의 일부인 방법.
  51. 제43항 내지 제50항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 8개의 뉴클레오타이드 길이인 방법.
  52. 제43항 내지 제51항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 25개의 뉴클레오타이드 길이인 방법.
  53. 제43항 내지 제52항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 최대 1000개의 뉴클레오타이드 길이인 방법.
  54. 제43항 내지 제53항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 2H, 13C, 15N, 19F 및 31P를 포함하는 하나 이상의 원자 표지로 동위원소적으로 표지된 뉴클레오타이드를 포함하지 않거나 적어도 하나 포함하는 것인 방법.
  55. 제43항 내지 제54항 중 어느 한 항에 있어서, 제1 결합제는 제1 폴리뉴클레오타이드, 제1 폴리펩타이드, 또는 이의 조합을 포함하는 것인 방법.
  56. 제55항에 있어서, 제1 폴리뉴클레오타이드는 제1 RNA인 방법.
  57. 제56항에 있어서, 제1 RNA는 작은 핵 RNA(snRNA) 또는 이의 일부인 방법.
  58. 제57항에 있어서, snRNA는 U1 snRNA, U2 snRNA, U4 snRNA, U5 snRNA, U6 snRNA, U11 snRNA, U12 snRNA, U4atac snRNA, U5 snRNA, U6atac snRNA; 또는 이의 일부인 방법.
  59. 제55항 내지 제58항 중 어느 한 항에 있어서, 제1 폴리펩타이드는 리보핵산단백질의 단백질 구성요소 또는 이의 일부인 방법.
  60. 제59항에 있어서, 리보핵산단백질은 작은 핵 리보핵산단백질(snRNP) 또는 이의 일부인 방법.
  61. 제60항에 있어서, snRNP는 U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP, U11 snRNP, U12 snRNP, U4atac snRNP, U5 snRNP, U6atac snRNP 또는 이의 일부인 방법.
  62. 제55항 내지 제58항 중 어느 한 항에 있어서, 제1 폴리펩타이드는 9G8, A1 hnRNP, A2 hnRNP, ASD-1, ASD-2b, ASF, B1 hnRNP, C1 hnRNP, C2 hnRNAP, CBP20, CBP80, CELF, F hnRNP, FBP11, Fox-1, Fox-2, G hnRNP, H hnRNP, hnRNP 1, hnRNP 3, hnRNP C, hnRNP G, hnRNP K, hnRNP M, hnRNP U, Hu, HUR, I hnRNP, K hnRNP, KH-유형 스플라이싱 조절 단백질(KSRP), L hnRNP, M hnRNP, mBBP, 머슬-블라인드 유사(MBNL), NF45, NFAR, Nova-1, Nova-2, nPTB, P54/SFRS11, 폴리피리미딘 트랙트 결합 단백질(PTB), PRP19 복합체 단백질, R hnRNP, RNPC1, SAM68, SC35, SF, SF1/BBP, SF2, SF3A, SF3B, SFRS10, Sm 단백질, SR 단백질, SRm300, SRp20, SRp30c, SRP35C, SRP36, SRP38, SRp40, SRp55, SRp75, SRSF, STAR, GSG, SUP-12, TASR-1, TASR-2, TIA, TIAR, TRA2, TRA2a/b, U hnRNP, U1 snRNP, U11 snRNP, U12 snRNP, U1-C, U2 snRNP, U2AF1-RS2, U2AF35, U2AF65, U4 snRNP, U5 snRNP, U6 snRNP, Urp, YB1, 또는 이의 임의의 조합을 포함하는 군으로부터 선택된 단백질 또는 이의 일부인 방법.
  63. 제43항 내지 제62항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드 및 제1 결합제는 제1 복합체를 형성하는 것인 방법.
  64. 제63항에 있어서, 제1 복합체는 결합 포켓을 포함하는 것인 방법.
  65. 제64항에 있어서, 결합 포켓은 돌출부, 또는 돌연변이, 또는 스템-루프, 또는 이의 임의의 조합을 포함하는 것인 방법.
  66. 제64항에 있어서, 결합 포켓은 돌출부, 돌연변이, 또는 스템-루프를 포함하지 않는 것인 방법.
  67. 제65항에 있어서, 돌출부 또는 돌연변이는 제1 폴리뉴클레오타이드에서 3차원적 구조 변화를 유발하는 것인 방법.
  68. 제63항 내지 제67항 중 어느 한 항에 있어서, 제2 결합제를 제1 복합체와 접촉시키는 단계를 추가로 포함하는 방법.
  69. 제68항에 있어서, 제2 결합제는 폴리뉴클레오타이드, 폴리펩타이드, 단백질, 소분자, 이온, 염, 및 원자를 포함하는 군으로부터 선택된 하나 이상의 분자를 포함하는 것인 방법.
  70. 제68항 또는 제69항에 있어서, 제2 결합제는 소분자인 방법.
  71. 제70항에 있어서, 소분자는 소분자의 라이브러리인 방법.
  72. 제68항 내지 제71항 중 어느 한 항에 있어서, 제2 결합제를 제1 복합체와 접촉시킨 후 제2 NMR 스펙트럼을 수득하는 단계를 추가로 포함하는 방법.
  73. 제72항에 있어서, 제1 및 제2 NMR 스펙트럼을 비교하는 단계를 추가로 포함하는 방법.
  74. 제43항 내지 제73항 중 어느 한 항에 있어서, 제1 및 제2 NMR 스펙트럼으로부터 하나 이상의 원자의 화학적 이동을 결정하는 단계를 추가로 포함하는 방법.
  75. 제43항 내지 제74항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 ABCA4, ABCB4, ABCD1, ACADSB, ADA, ADAMTS13, AGL, ALB, ALDH3A2, ALG6, APC, APOB, AR, ATM, ATP7A, ATR, B2M, BMP2K, BRCA1, BRCA2, BTK, C3, CAT, CD46, CDH1, CDH23, CFTR, CHM, COL11A1, COL11A2, COL1A1, COL1A2, COL2A1, COL3A1, COL4A5, COL6A1, COL6A3, COL7A1, COL9A2, COLQ, CUL4B, CYBB, CYP17, CYP19, CYP27, CYP27A1, DES, DMD, DYSF, EGFR, EMD, ETV4, F13A1, F5, F7, F8, FAH, FANCA, FANCC, FANCG, FBN1, FECH, FGA, FGFR2, FGG, FIX, FLNA, FOXM1, FRAS1, GALC, GH1, GHV, HADHA, HBA2, HBB, HEXA, HEXB, HLCS, HMBS, HMGCL, HNF1A, HPRT1, HPRT2, HSF4, HSPG2, HTT, IDS, IKBKAP, INSR, ITGB2, ITGB3, JAG1, KRAS, KRT5, L1CAM, LAMA3, LDLR, LMNA, LPL, MADD, MAPT, MLH1, MSH2, MST1R, MTHFR, MUT, MVK, NF1, NF2, OAT, OPA1, OTC, PAH, PBGD, PCCA, PDH1, PGK1, PHEX, PKD2, PKLR, PLEKHM1, PLKR, POMT2, PRDM1, PRKAR1A, PROC, PSEN1, PTCH1, PTEN, PYGM, RP6KA3, RPGR, RSK2, SBCAD, SCN5A, SERPINA1, SLC12A3, SLC6A8, SMN2, SPINK5, SPTA1, TP53, TRAPPC2, TSC1, TSC2, TSHB, UGT1A1, 및 USH2A로 이루어진 군으로부터 선택된 유전자 또는 이의 유전자 변이체에 의해 코딩되는 서열을 포함하는 것인 방법.
  76. (a) 표적 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드 샘플을 제공하는 단계;
    (b) NMR 장치를 사용하여 폴리뉴클레오타이드 샘플의 제1 NMR 스펙트럼을 수득하는 단계;
    (c) 결합제를 폴리뉴클레오타이드 샘플과 접촉시키는 단계;
    (d) 결합제와 접촉시킨 후 폴리뉴클레오타이드 샘플의 제2 NMR 스펙트럼을 수득하는 단계; 및
    (e) 제1 및 제2 NMR 스펙트럼을 비교하는 단계; 및
    (f) 비교에 기초하여 결합제를 선택하는 단계
    를 포함하는, 폴리뉴클레오타이드에 대한 결합제를 선택하는 방법.
  77. 제76항에 있어서, 결합제는 소분자, 폴리뉴클레오타이드, 또는 폴리펩타이드, 또는 이의 임의의 조합을 포함하는 것인 방법.
  78. 제77항에 있어서, 결합제는 소분자의 라이브러리를 포함하는 것인 방법.
  79. 제76항 내지 제78항 중 어느 한 항에 있어서, 폴리뉴클레오타이드 샘플은 제1 폴리뉴클레오타이드를 추가로 포함하는 것인 방법.
  80. 제79항에 있어서, 표적 폴리뉴클레오타이드 및 제1 폴리뉴클레오타이드는 거의 등몰량으로 첨가되는 것인 방법.
  81. 제79항 또는 제80항에 있어서, 제1 폴리뉴클레오타이드는 제1 RNA인 방법.
  82. 제81항에 있어서, 제1 RNA는 작은 핵 RNA(snRNA) 또는 이의 일부인 방법.
  83. 제82항에 있어서, snRNA는 U1, U2, U4, U5, U6, U11, U12, U4atac, U5, 또는 U6atac snRNA; 또는 이의 일부인 방법.
  84. 제79항 내지 제83항 중 어느 한 항에 있어서, 표적 및 제1 폴리뉴클레오타이드는 이합체(duplex)를 형성하는 것인 방법.
  85. 제84항에 있어서, 이합체는 결합 포켓을 함유하는 것인 방법.
  86. 제85항에 있어서, 결합 포켓은 돌출부, 또는 돌연변이, 또는 스템-루프, 또는 이의 임의의 조합을 포함하는 것인 방법.
  87. 제85항에 있어서, 결합 포켓은 돌출부, 돌연변이, 또는 스템-루프를 포함하지 않는 것인 방법.
  88. 제76항 내지 제87항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 스플라이스 부위, 분기점(BP), 엑손 스플라이싱 인핸서(ESE), 엑손 스플라이싱 사일런서(ESS), 인트론 스플라이싱 인핸서(ISE), 인트론 스플라이싱 사일런서(ISS), 또는 폴리피리미딘 트랙트, 또는 이의 일부를 포함하는 것인 방법.
  89. 제76항 내지 제88항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손 또는 이의 단편을 함유하는 것인 방법.
  90. 제76항 내지 제89항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 하나의 인트론 또는 이의 단편을 함유하는 것인 방법.
  91. 제76항 내지 제90항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손-인트론 경계를 함유하는 것인 방법.
  92. 제76항 내지 제91항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 8개의 뉴클레오타이드 길이인 방법.
  93. 제76항 내지 제92항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 25개의 뉴클레오타이드 길이인 방법.
  94. 제76항 내지 제93항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 최대 1000개의 뉴클레오타이드 길이인 방법.
  95. 제76항 내지 제94항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 100 내지 200개의 뉴클레오타이드 길이인 방법.
  96. 제76항 내지 제95항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 2H, 13C, 15N, 19F 및 31P를 포함하는 하나 이상의 원자 표지로 동위원소적으로 표지된 뉴클레오타이드를 포함하지 않거나 적어도 하나 포함하는 것인 방법.
  97. 제76항 내지 제96항 중 어느 한 항에 있어서, 제1 또는 제2 NMR 스펙트럼의 화학적 이동을 결정하는 단계를 추가로 포함하는 방법.
  98. 제1항 내지 제97항 중 어느 한 항에 있어서, 폴리뉴클레오타이드 및 결합된 소분자의 3차원 원자 해상도 구조를 결정하는 단계를 추가로 포함하는 방법.
  99. 제98항에 있어서, 3차원 원자 해상도 구조는 구조 예측 소프트웨어에 의해 결정되는 것인 방법.
  100. 제99항에 있어서, 구조 예측 소프트웨어는 Atnos/Candid-프로그램 묶음인 방법.
  101. 제99항에 있어서, 구조 예측 소프트웨어는 MC-fold | MC-Sym 파이프라인인 방법.
  102. 제98항 내지 제101항 중 어느 한 항에 있어서, 3차원 원자 해상도 구조를 결정하는 것은 뉴클레오타이드 서열 및 하나 이상의 2차원 구조 예측 알고리즘을 사용하여 복수의 이론적인 구조적 폴리뉴클레오타이드 2차원 모델을 생성하는 단계를 포함하는 것인 방법.
  103. 제102항에 있어서, 복수의 이론적인 구조적 폴리뉴클레오타이드 2차원 모델 및 선택적으로 하나 이상의 공지되고/거나 추정된 폴리뉴클레오타이드 2차원 모델을 사용하는 3차원 구조 예측 알고리즘을 사용하여 복수의 이론적인 구조적 폴리뉴클레오타이드 3차원 모델을 생성하는 단계를 추가로 포함하는 방법.
  104. 제103항에 있어서, 복수의 이론적인 구조적 폴리뉴클레오타이드 3차원 모델 각각에 대해 예측된 화학적 이동 세트를 생성하는 단계를 추가로 포함하는 방법.
  105. 제104항에 있어서, 예측된 화학적 이동 세트를 화학적 이동(들)과 비교하는 단계를 추가로 포함하는 방법.
  106. 제105항에 있어서, 각각의 예측된 화학적 이동 세트 및 화학적 이동(들) 사이에 일치하는 하나 이상의 이론적인 구조적 폴리뉴클레오타이드 3차원 모델을 하나 이상의 3차원 원자 해상도 구조로서 선택하는 단계를 추가로 포함하는 방법.
  107. 제102항 내지 제106항 중 어느 한 항에 있어서, 2차원 구조 예측 알고리즘은 최근접 이웃 알고리즘인 방법.
  108. 제102항 내지 제107항 중 어느 한 항에 있어서, 에너지 최소화 및/또는 분자 동역학 시뮬레이션을 포함하는 하나 이상의 기능을 수행하는 모델링 소프트웨어를 사용하여 선택된 하나 이상의 이론적인 구조적 폴리뉴클레오타이드 3차원 모델을 개선함으로써 하나 이상의 개선된 3차원 원자 해상도 구조를 생성하는 단계를 추가로 포함하는 방법.
  109. 제104항 내지 제108항 중 어느 한 항에 있어서, 예측된 화학적 이동 세트는 각각의 이론적인 구조적 폴리뉴클레오타이드 3차원 모델을 NMR 데이터-구조 데이터베이스와 비교함으로써 생성되는 것인 방법.
  110. 제109항에 있어서, 예측된 화학적 이동 세트를 생성하는 것은 하나 이상의 실험적으로 결정된 폴리뉴클레오타이드 3차원 구조로부터 원자 좌표, 적층 결합, 자화율, 전자기장, 또는 이면각을 포함한 폴리뉴클레오타이드 구조적 지표를 계산하는 단계를 포함하는 것인 방법.
  111. 제110항에 있어서, 회귀 알고리즘을 사용하여 실험적 화학적 이동 및 실험적으로 결정된 3차원 폴리뉴클레오타이드 구조의 폴리뉴클레오타이드 구조적 지표 사이의 관계를 설명하는 수학적 함수 또는 객체의 세트를 생성하는 단계를 추가로 포함하는 방법.
  112. 제111항에 있어서, 이론적인 구조적 폴리뉴클레오타이드 3차원 모델 각각에 대해 폴리뉴클레오타이드 구조적 지표를 계산하는 단계를 추가로 포함하는 방법.
  113. 제112항에 있어서, 이론적인 구조적 폴리뉴클레오타이드 3차원 모델 각각에 대한 폴리뉴클레오타이드 구조적 지표를 수학적 함수 또는 객체의 세트에 입력하여 예측된 화학적 이동 세트를 생성하는 단계를 추가로 포함하는 방법.
  114. 제111항 내지 제113항 중 어느 한 항에 있어서, 회귀 알고리즘은 랜덤 포레스트(Random Forest) 알고리즘을 포함하는 기계 학습 알고리즘인 방법.
  115. 제1항 내지 제96항 중 어느 한 항에 있어서, NMR 스펙트럼은 약 1 GHz MHz 내지 약 20 MHz 범위의 NMR 분광계 주파수로 수득되는 것인 방법.
  116. 제1항 내지 제115항 중 어느 한 항에 있어서, NMR 스펙트럼은 500 MHz 내지 900 MHz 범위의 NMR 분광계 주파수로 수득되는 것인 방법.
  117. 제1항 내지 제116항 중 어느 한 항에 있어서, NMR 장치는 AVANCE III인 방법.
  118. 제76항 내지 제117항 중 어느 한 항에 있어서, 단계 (f)로부터 선택된 결합제를 갖거나 갖지 않는 표적 폴리뉴클레오타이드에 결합하는 snRNA의 결합 동역학을 결정하는 단계를 추가로 포함하는 방법.
  119. 제76항 내지 제117항 중 어느 한 항에 있어서, 단계 (f)로부터 선택된 결합제를 갖거나 갖지 않는 표적 폴리뉴클레오타이드에 결합하는 snRNA의 결합 동역학을 결정하는 단계를 추가로 포함하는 방법.
  120. 제118항 또는 제119항에 있어서, 단계 (f)로부터 선택된 결합제를 갖고 결정된 결합 동역학 및 이를 갖지 않고 결정된 결합 동역학을 비교하는 단계를 추가로 포함하는 방법.
  121. 제78항 내지 제117항 중 어느 한 항에 있어서, 제1 소분자 및 제2 소분자를 선택하는 단계를 추가로 포함하는 방법.
  122. 제121항에 있어서, 제1 소분자를 갖거나 갖지 않는 표적 폴리뉴클레오타이드에 결합하는 snRNA의 제1 결합 동역학, 및 제2 소분자를 갖거나 갖지 않는 표적 폴리뉴클레오타이드에 결합하는 snRNA의 제2 결합 동역학을 결정하는 단계를 추가로 포함하는 방법.
  123. 제122항에 있어서, 제1 결합 동역학 및 제2 결합 동역학을 비교하는 단계를 추가로 포함하는 방법.
  124. 제118항 내지 제123항 중 어느 한 항에 있어서, 결합 동역학은 표면 플라즈몬 공명(SPR), 생물층 간섭계(BLI) 기술(Octet Systems), 등온 적정 열량 측정법(ITC), 또는 형광 이방성에 의해 결정되는 것인 방법.
  125. 제121항 내지 제124항 중 어느 한 항에 있어서, 제1 소분자 및 제2 소분자의 2차원 모델 또는 3차원 구조를 결정하는 단계를 포함하는 방법.
  126. 제125항에 있어서, 제1 및 제2 소분자의 2차원 모델 또는 3차원 구조를 비교하는 단계를 포함하는 방법.
  127. (a) 표적 폴리뉴클레오타이드 및 제1 폴리뉴클레오타이드에 의해 형성된 하나 이상의 결합 포켓을 확인하는 단계로서, 표적 폴리뉴클레오타이드는 스플라이스 부위, 분기점(BP), 엑손 스플라이싱 인핸서(ESE), 엑손 스플라이싱 사일런서(ESS), 인트론 스플라이싱 인핸서(ISE), 인트론 스플라이싱 사일런서(ISS), 또는 폴리피리미딘 트랙트, 또는 이의 임의의 조합의 서열을 함유하는 것인 단계; 및
    (b) 하나 이상의 결합 포켓에 대해 하나 이상의 소분자 또는 이의 단편을 가상으로 스크리닝하는 단계로서, 가상 스크리닝 과정은 추정되는 소분자 또는 단편 히트(hit)를 확인하는 것인 단계
    를 포함하는 방법.
  128. 제127항에 있어서, 하나 이상의 결합 포켓을 확인하는 것은 표적 폴리뉴클레오타이드 및 제1 폴리뉴클레오타이드를 포함하는 3차원 원자 해상도 구조를 해석하는 단계를 포함하는 것인 방법.
  129. 제128항에 있어서, 3차원 원자 해상도 구조는 NMR 스펙트럼에 의해 결정되는 것인 방법.
  130. 제127항 내지 제129항 중 어느 한 항에 있어서, 실험 분석을 사용하여 가상 스크린으로부터 하나 이상의 소분자 또는 단편 히트를 시험하는 단계를 추가로 포함하는 방법.
  131. 제130항에 있어서, 실험 분석은 표면 플라즈몬 공명(SPR), 생물층 간섭계(BLI) 기술(Octet Systems), 등온 적정 열량 측정법(ITC), 또는 형광 이방성인 방법.
  132. 제127항 내지 제131항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 RNA인 방법.
  133. 제127항 내지 제132항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 전구-mRNA인 방법.
  134. 제127항 내지 제133항 중 어느 한 항에 있어서, 스플라이스 부위는 5' 스플라이스 부위, 잠재 5' 스플라이스 부위, 3' 스플라이스 부위, 또는 잠재 3' 스플라이스 부위인 방법.
  135. 제127항 내지 제134항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 하나의 인트론 또는 이의 단편을 함유하는 것인 방법.
  136. 제127항 내지 제135항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손 또는 이의 단편을 함유하는 것인 방법.
  137. 제127항 내지 제136항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 하나의 엑손-인트론 경계를 함유하는 것인 방법.
  138. 제127항 내지 제137항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 8개의 뉴클레오타이드 길이인 방법.
  139. 제127항 내지 제138항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 적어도 25개의 뉴클레오타이드 길이인 방법.
  140. 제127항 내지 제139항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 최대 1000개의 뉴클레오타이드 길이인 방법.
  141. 제127항 내지 제140항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 100 내지 200개의 뉴클레오타이드 길이인 방법.
  142. 제127항 내지 제141항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 ABCA4, ABCB4, ABCD1, ACADSB, ADA, ADAMTS13, AGL, ALB, ALDH3A2, ALG6, APC, APOB, AR, ATM, ATP7A, ATR, B2M, BMP2K, BRCA1, BRCA2, BTK, C3, CAT, CD46, CDH1, CDH23, CFTR, CHM, COL11A1, COL11A2, COL1A1, COL1A2, COL2A1, COL3A1, COL4A5, COL6A1, COL6A3, COL7A1, COL9A2, COLQ, CUL4B, CYBB, CYP17, CYP19, CYP27, CYP27A1, DES, DMD, DYSF, EGFR, EMD, ETV4, F13A1, F5, F7, F8, FAH, FANCA, FANCC, FANCG, FBN1, FECH, FGA, FGFR2, FGG, FIX, FLNA, FOXM1, FRAS1, GALC, GH1, GHV, HADHA, HBA2, HBB, HEXA, HEXB, HLCS, HMBS, HMGCL, HNF1A, HPRT1, HPRT2, HSF4, HSPG2, HTT, IDS, IKBKAP, INSR, ITGB2, ITGB3, JAG1, KRAS, KRT5, L1CAM, LAMA3, LDLR, LMNA, LPL, MADD, MAPT, MLH1, MSH2, MST1R, MTHFR, MUT, MVK, NF1, NF2, OAT, OPA1, OTC, PAH, PBGD, PCCA, PDH1, PGK1, PHEX, PKD2, PKLR, PLEKHM1, PLKR, POMT2, PRDM1, PRKAR1A, PROC, PSEN1, PTCH1, PTEN, PYGM, RP6KA3, RPGR, RSK2, SBCAD, SCN5A, SERPINA1, SLC12A3, SLC6A8, SMN2, SPINK5, SPTA1, TP53, TRAPPC2, TSC1, TSC2, TSHB, UGT1A1, 및 USH2A로 이루어진 군으로부터 선택된 유전자 또는 이의 유전자 변이체에 의해 코딩되는 서열을 포함하는 것인 방법.
  143. 제127항 내지 제142항 중 어느 한 항에 있어서, 제1 추정되는 소분자 또는 및 제2 추정되는 소분자를 확인하는 단계를 추가로 포함하는 방법.
  144. 제143항에 있어서, 표적 폴리뉴클레오타이드에 결합하는 제1 추정되는 소분자 또는 단편 히트의 제1 결합 동역학, 및 표적 폴리뉴클레오타이드에 결합하는 제2 추정되는 소분자 또는 단편 히트의 제2 결합 동역학을 결정하는 단계를 추가로 포함하는 방법.
  145. 제144항에 있어서, 제1 결합 동역학 및 제2 결합 동역학을 비교하여, 더 강한 소분자 또는 단편 히트를 선택하는 단계를 추가로 포함하는 방법.
  146. 제145항에 있어서, 결합 동역학은 표면 플라즈몬 공명(SPR), 생물층 간섭계(BLI) 기술(Octet Systems), 등온 적정 열량 측정법(ITC), 또는 형광 이방성을 사용하여 결정되는 것인 방법.
  147. (a) 표적 폴리뉴클레오타이드를 함유하는 샘플에 결합제를 접촉시키는 단계로서, 표적 폴리뉴클레오타이드는 스플라이스 부위, 분기점(BP), 엑손 스플라이싱 인핸서(ESE), 엑손 스플라이싱 사일런서(ESS), 인트론 스플라이싱 인핸서(ISE), 인트론 스플라이싱 사일런서(ISS), 또는 폴리피리미딘 트랙트, 또는 이의 임의의 조합을 함유하는 것인 단계,
    (b) 제1 분석에서 결합제 및 표적 폴리뉴클레오타이드의 구조를 수득하는 단계;
    (c) 제2 분석에서 결합제의 결합 동역학을 수득하는 단계; 및
    (d) 구조 및 결합 동역학에 기초하여 결합제를 선택하는 단계
    를 포함하는, 표적 폴리뉴클레오타이드에 대한 결합제를 선택하는 방법.
  148. 제147항에 있어서, 제1 분석 및 제2 분석은 동일한 것인 방법.
  149. 제148항에 있어서, 제1 분석 및 제2 분석은 NMR인 방법.
  150. 제147항에 있어서, 제1 분석은 NMR이고, 제2 분석은 표면 플라즈몬 공명(SPR), 생물층 간섭계(BLI) 기술(Octet Systems), 등온 적정 열량 측정법(ITC), 또는 형광 이방성인 방법.
  151. 제147항 내지 제150항 중 어느 한 항에 있어서, 결합제는 소분자인 방법.
  152. 제147항 내지 제151항 중 어느 한 항에 있어서, 샘플은 제1 폴리뉴클레오타이드를 추가로 포함하는 것인 방법.
  153. 제152항에 있어서, 제1 폴리뉴클레오타이드는 RNA인 방법.
  154. 제153항에 있어서, RNA는 작은 핵 RNA(snRNA) 또는 이의 일부인 방법.
  155. 제154항에 있어서, snRNA는 U1, U2, U4, U5, U6, U11, U12, U4atac, U5, 또는 U6atac snRNA; 또는 이의 일부인 방법.
  156. 제147항 내지 제155항 중 어느 한 항에 있어서, 표적 및 제1 폴리뉴클레오타이드는 이합체를 형성하는 것인 방법.
  157. 제156항에 있어서, 이합체는 결합 포켓을 함유하는 것인 방법.
  158. 제157항에 있어서, 결합 포켓은 돌출부, 또는 돌연변이, 또는 스템-루프, 또는 이의 임의의 조합을 포함하는 것인 방법.
  159. 제157항에 있어서, 결합 포켓은 돌출부, 돌연변이, 또는 스템-루프를 포함하지 않는 것인 방법.
  160. 제147항 내지 제159항 중 어느 한 항에 있어서, 샘플은 단백질 또는 이의 일부를 추가로 포함하는 것인 방법.
  161. 제160항에 있어서, 단백질은 리보핵산단백질인 방법.
  162. 제161항에 있어서, 리보핵산단백질은 작은 핵 리보핵산단백질(snRNP) 또는 이의 일부인 방법.
  163. 제162항에 있어서, snRNP는 U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP, U11 snRNP, U12 snRNP, U4atac snRNP, U5 snRNP, U6atac snRNP 또는 이의 일부인 방법.
  164. 제160항에 있어서, 단백질은 9G8, A1 hnRNP, A2 hnRNP, ASD-1, ASD-2b, ASF, B1 hnRNP, C1 hnRNP, C2 hnRNAP, CBP20, CBP80, CELF, F hnRNP, FBP11, Fox-1, Fox-2, G hnRNP, H hnRNP, hnRNP 1, hnRNP 3, hnRNP C, hnRNP G, hnRNP K, hnRNP M, hnRNP U, Hu, HUR, I hnRNP, K hnRNP, KH-유형 스플라이싱 조절 단백질(KSRP), L hnRNP, M hnRNP, mBBP, 머슬-블라인드 유사(MBNL), NF45, NFAR, Nova-1, Nova-2, nPTB, P54/SFRS11, 폴리피리미딘 트랙트 결합 단백질(PTB), PRP19 복합체 단백질, R hnRNP, RNPC1, SAM68, SC35, SF, SF1/BBP, SF2, SF3A, SF3B, SFRS10, Sm 단백질, SR 단백질, SRm300, SRp20, SRp30c, SRP35C, SRP36, SRP38, SRp40, SRp55, SRp75, SRSF, STAR, GSG, SUP-12, TASR-1, TASR-2, TIA, TIAR, TRA2, TRA2a/b, U hnRNP, U1 snRNP, U11 snRNP, U12 snRNP, U1-C, U2 snRNP, U2AF1-RS2, U2AF35, U2AF65, U4 snRNP, U5 snRNP, U6 snRNP, Urp, YB1, 또는 이의 임의의 조합을 포함하는 군으로부터 선택되는 것인 방법.
  165. 제1항 내지 제164항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 GGA/gtgagu, AGA/gugagu, AGA/gugagu, AGA/gugagu, AGA/gugagu, AGA/gugagu, AGA/gugagc, AGA/gugagu, AGA/gugagu, GGA/gugagu, CGA/guccgu, GGAguaagu, GGA/guaagu, AGA/guaagu, AGA/guaagu, AGA/guaagu, AGA/guaagu, AGA/guaagu, AGA/guaagu, AGA/guaaga, AGA/guaagu, AGA/guaagu, AGA/guaagu, GGA/guaagu, AGA/guaagg, AGA/guaagu, AGA/guaagu, AGA/guaagu, GGA/guaagu, AGA/guaaga, AGA/guaagu, AGA/guaagu, AGA/guaagu, GGA/guaagg, AGA/guaagu, AGA/guaagu, GGA/guaagu, AGA/guaagu, AGA/guaaga, AGA/guaagu, AGA/guagau, UGA/gugaau, GGA/guuagu, AGA/guaggu, AGA/guaggu, GGA/guaggu, 또는 AGA/gugcgu를 포함하는 것인 방법.
  166. 제1항 내지 제164항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 ACA/gugagg, AAA/auaagu, GAA/ggaagu, GAA/guaaau, GCA/guagga, CAA/gugagu, GUA/gugagu, GAA/guggg, CCA/guaaac, UUA/guaaau, CAA/guaaac, ACA/guaaau, GAA/guaaac, UCA/guaaac, UCA/guaaau, GCA/guaaau, ACA/guaaau, CAA/gcaag, CAA/guaagg, UCA/guaagu, AUA/gugaau, CAA/gugaaa, CCA/gugaga, UCA/gugauu, GAA/gugugu, GAA/uaaguu, CAA/guaugu, AAA/guaugu, CAA/guauuu, ACA/guuagu, GCA/guuagu, 또는 ACA/guuuga를 포함하는 것인 방법.
  167. 제1항 내지 제164항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 CAA/guaacu, AUA/gucagu, GAA/gucugg, 또는 AAA/guacau를 포함하는 것인 방법.
  168. 제1항 내지 제164항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 NNBgunnnn, NNBhunnnn, 또는 NNBgvnnnn을 포함하고, 여기서 N/n은 A, U, G 또는 C이며; B는 C, G, 또는 U이고; h는 a, c, 또는 u이며; v는 a, c 또는 g인 방법.
  169. 제168항에 있어서, 표적 폴리뉴클레오타이드는 NNBgurrrn, NNBguwwdn, NNBguvmvn, NNBguvbbn, NNBgukddn, NNBgubnbd, NNBhunngn, NNBhurmhd, 또는 NNBgvdnvn을 포함하고, 여기서 N/n은 A, U, G 또는 C이며; B는 C, G, 또는 U이고; h는 a, c, 또는 u이며; v는 a, c 또는 g이고; r은 a 또는 g이며; m은 a 또는 c이고; d는 a, g 또는 u이며; k는 g 또는 u이고; w는 a 또는 u인 방법.
  170. 제169항에 있어서, 표적 폴리뉴클레오타이드는 CAC/gugagc, UCC/gugagc, AGC/gugagu, AGC/gugagu, AGG/gugagg, GUG/gugagc, GAG/gugagg, CCG/gugagg, UUG/gugagc, GUG/gugagu, UUU/gugagc, UUU/gugagc, GAU/gugagg, AGU/gugagu, AGU/gugagu, AGU/gugagu, AGU/gugagu, AGC/guaagu, GGC/guaagu, AAC/guaagu, GGC/guaagu, AGC/guaagg, GGC/guaagu, AGC/guaagu, GGC/guaagu, GGC/guaagu, AGC/guaagu, GAG/guaaga, CAG/guaagu, AGU/guaagc, AAU/guaagc, AAU/guaagg, CCU/guaagc, AGU/guaagu, GGU/guaagu, AGU/guaagu, AGU/guaagu, AGU/guaagu, GAU/guaagu, UCC/gugaau, CCG/gugaau, ACG/gugaac, CUG/gugaau, AGG/gugaau, UUG/gugaau, CCG/gugaau, GAG/gugaag, CCU/gugaau, CGU/gugaau, CCU/gugaau, GAG/guagga, CAU/guaggg, UGG/guggau, CAG/guggau, UGG/guggau, CGG/gugggu, GCG/guggga, UGG/guggggg, UGG/gugggug, CGU/gugggu, AUC/gguaaaa, GGG/guaaau, GCG/guaaaa, CAG/guaaag, UGG/guaaag, AAG/guaaag, AAG/guaaau, CAG/guaaag, UAG/guaaag, UUG/guaaag, GAG/guaaag, CAG/guaaag, AUG/guaaaa, AAG/guaaag, CAG/guaaag, CAG/guaaaa, GAG/guaaag, AAG/guaaag, UGU/guaaau, GUU/guaaau, GUU/guaaau, UCU/guaaau, GCU/guaaau, GAU/guaaau, GCU/guaaau, UCU/guaaau, ACU/guaaau, CCU/guaaau, CCU/guaaau, ACU/guaaau, AAU/guaaau, AGG/guagac, UUG/guagau, CAG/guagag, AAG/guagag, AAU/gugagu, CAG/gugagc, AAG/gugggu, AAG/guaggg, CAG/guaggc, 또는 AGC/guaggu를 포함하는 것인 방법.
  171. 제169항에 있어서, 표적 폴리뉴클레오타이드는 CAG/guaau, CAG/guaaugu, CAG/guaaugu, CAG/guaaugu, CAG/guaaugu, GAG/guaauac, GAG/guaauau, GAG/guaaugu, AAG/guaauaa, AAG/guaaugu, AAG/guaaugu, AAG/guaaugua, AAG/guaaugu, AAG/guaaugu, GCU/guaauu, CCU/guaauu, GAU/guaauu, CAU/guaauu, AAU/guaauu, AGG/guauau, CAG/guauau, UAG/guauau, CAG/guauau, CGG/guauau, GAG/guauau, CGG/guauau, CAG/guauag, AAG/guauau, CAG/guauag, AAG/guauac, UAG/guauau, CAG/guauag, CAG/guauau, AAG/guuaag, AUC/guuaga, GCG/guuagu, AAG/guuagc, UGG/guuagu, GCG/guuagu, CUG/guuugu, CUG/guauga, CAG/guauga, UAG/guauga, AAG/guaugg, AAG/guauga, GAG/guaugg, CAG/guauga, CAG/guaugg, AAG/guaugg, UGG/guaugc, CAG/guaugu, AUG/guaugu, AAG/guaugu, AAG/guaugg, CAG/guaugg, GAG/guauga, CGG/guaugg, AAU/guaugu, AAG/guauuu, AUG/guauuu, UAG/guauug, AAG/guauuu, CAG/guauug, CAG/guauug, CAU/guauuu, ACU/guauu, AAG/guuuau, AAG/guuuaa, CAG/guuugg, CAG/guuugg, CAG/guuugc, AAG/guuugg, AAG/guuugg, 또는 UGG/guaugc를 포함하는 것인 방법.
  172. 제169항에 있어서, 표적 폴리뉴클레오타이드는 CCG/guaacu, UUG/guaaca, AUG/guaacc, GGG/guaacu, AAG/guaaca, AAG/guaacu, UUG/guaaca, GCU/guaacu, ACU/guaacu, GCU/guaacu, UAG/guaccc, AAG/guaccu, CAG/guaccg, UGG/guacca, CAG/gucaau, AAG/gucaau, AAG/gucaag, AUG/guacau, GGG/guacau, UUG/guacau, CAG/guacag, CAG/guacag, CAG/guacag, CAG/guacag, AAG/guacag, CAG/guacag, GAG/guacaa, AAG/guacag, CAG/guacaa, UGU/guacau, CAG/gugcac, GGG/gugcau, CUG/gugcau, UAG/gugcau, CAG/gugcag, CAG/gugcag, AGG/gugcaa, AAC/gugacu, UCC/gugacu, CCG/gugacu, GCG/gugacu, GGG/gugacg, GGG/gugacg, GCG/gugacu, AUG/gugacc, GAU/gugacu, GGC/gucagu, 또는 UAG/gucaga를 포함하는 것인 방법.
  173. 제169항에 있어서, 표적 폴리뉴클레오타이드는 AAG/guacgg, AAG/guacgg, AAG/guacug, AAG/guagcg, AAG/guagua, AAG/guagua, AAG/guagua, AAG/guagug, AAG/guauca, AAG/guaucg, AAG/guaucu, AAG/gucucu, AAG/gugccu, AAG/guggua, AAG/guguua, ACG/guagcu, AGC/guacgu, CAG/guacug, CAG/guagua, CAG/guagug, CAG/guagug, CAG/guaucc, CAG/gugcgc, 또는 GAG/gugccu를 포함하는 것인 방법.
  174. 제169항에 있어서, 표적 폴리뉴클레오타이드는 CGG/guguau, AAG/guguau, GAG/guguac, CAG/guguau, UAG/guguau, CAG/guguag, GAG/guguau, AAG/gugugc, CAG/guguga, AAG/gugugu, CAG/guguga, CAG/gugugu, UGG/gugugg, CUG/guguga, CGG/gugugu, GAG/gugugc, CAG/guguga, AAU/gugugu, CAG/gugugu, CAG/gugugu, GAG/gugugu, CAG/guuguu, CAG/guuguc, GUG/guugua, CAG/guuguu, AAC/gugauu, CAG/gugaua, AGG/gugauc, GUG/gugauc, CCU/gugauu, GAU/gugauu, CAC/guuggu, CAG/guuggc, AAG/guuagc, 또는 CAG/guugau를 포함하는 것인 방법.
  175. 제169항에 있어서, 표적 폴리뉴클레오타이드는 AUG/gucauu, CGG/gucauaauc, AAG/gucugu, AAG/gucuggg, CAG/gucugga, CAG/gucuggu, CAG/gucuga, GAG/gucuggu, AAG/gugucu, AAG/gugucu, AGG/gugucu, CUG/gugcuu, CAG/gucuuu, CAG/guugcu, GAG/gugcug, 또는 CAG/gugcug를 포함하는 것인 방법.
  176. 제169항에 있어서, 표적 폴리뉴클레오타이드는 CGC/auaagu, UUC/auaagu, UGG/auaagg, ACG/auaagg, GUU/auaagu, CCU/auaagu, UUU/auaagc, GAG/aucugg, AAC/augagga, GAC/augagg, ACC/augagu, GGG/augagu, AAG/augagc, CAG/augagg, GAG/augagg, GCG/augagu, AAG/gaugag, CCU/augagu, GAU/augagu, GAU/augagu, UAG/augcgu, CAG/auuggu, AAG/auuugu, ACG/cuaagc, CAG/cugugu, CUG/uuaag, GAG/uuaagu, AAG/uuaagg, AUU/uuaagc, CUG/uugaga, CAG/uuuggu, 또는 GGG/auaagu를 포함하는 것인 방법.
  177. 제169항에 있어서, 표적 폴리뉴클레오타이드는 CAG/auaacu, GAG/cugcag, 또는 AAG/uuaaua를 포함하는 것인 방법.
  178. 제169항에 있어서, 표적 폴리뉴클레오타이드는 GCG/gagagu, AAG/ggaaaa, AUC/gguaaaa, AAG/gcaaaa, UGU/gcaagu, GAG/gcaggu, GAG/gcgugg, GAG/gcuccc, CAG/gcuggu, 또는 AAG/gaugag를 포함하는 것인 방법.
KR1020207011984A 2017-09-25 2018-09-25 스플라이싱 조절제의 스크리닝 및 확인을 위한 방법 및 조성물 Ceased KR20200057071A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762562941P 2017-09-25 2017-09-25
US62/562,941 2017-09-25
PCT/US2018/052743 WO2019060917A2 (en) 2017-09-25 2018-09-25 METHODS AND COMPOSITIONS FOR SCREENING AND IDENTIFYING SPREADING MODULATORS

Publications (1)

Publication Number Publication Date
KR20200057071A true KR20200057071A (ko) 2020-05-25

Family

ID=65810963

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207011984A Ceased KR20200057071A (ko) 2017-09-25 2018-09-25 스플라이싱 조절제의 스크리닝 및 확인을 위한 방법 및 조성물

Country Status (6)

Country Link
US (3) US20230152257A1 (ko)
EP (1) EP3688187A4 (ko)
JP (1) JP7195328B2 (ko)
KR (1) KR20200057071A (ko)
CN (1) CN111373057A (ko)
WO (1) WO2019060917A2 (ko)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EA201991309A1 (ru) 2016-11-28 2019-11-29 Способы модуляции сплайсинга рнк
KR20200017476A (ko) 2017-06-14 2020-02-18 피티씨 테라퓨틱스, 인크. Rna 스플라이싱의 변경 방법
CN112272666A (zh) 2018-04-10 2021-01-26 斯基霍克疗法公司 用于治疗癌症的化合物
AR119731A1 (es) 2019-05-17 2022-01-05 Novartis Ag Inhibidores del inflamasoma nlrp3
CA3148611A1 (en) 2019-08-12 2021-02-18 Regeneron Pharmaceuticals, Inc. Macrophage stimulating 1 receptor (mst1r) variants and uses thereof
JP7736700B2 (ja) 2020-02-28 2025-09-09 リミックス セラピューティクス インコーポレイテッド 複素環アミド及びスプライシングを調節するためのその使用
WO2021174167A1 (en) 2020-02-28 2021-09-02 Remix Therapeutics Inc. Compounds and methods for modulating splicing
MX2022010634A (es) 2020-02-28 2023-01-19 Remix Therapeutics Inc Derivados de piridazina para modular el empalme de acidos nucleicos.
CA3169697A1 (en) 2020-02-28 2021-09-02 Dominic Reynolds Thiophenyl derivatives useful for modulating nucleic acid splicing
JP2023520916A (ja) 2020-04-08 2023-05-22 リミックス セラピューティクス インコーポレイテッド スプライシングを調整するための化合物及び方法
KR20230005210A (ko) 2020-04-08 2023-01-09 레믹스 테라퓨틱스 인크. 스플라이싱을 조절하기 위한 화합물 및 방법
EP4178963A1 (en) 2020-07-02 2023-05-17 Remix Therapeutics Inc. 5-[5-(piperidin-4-yl)thieno[3,2-c]pyrazol-2-yl]indazole derivatives and related compounds as modulators for splicing nucleic acids and for the treatment of proliferative diseases
EP4175956A1 (en) 2020-07-02 2023-05-10 Remix Therapeutics Inc. 2-(indazol-5-yl)-6-(piperidin-4-yl)-1,7-naphthyridine derivatives and related compounds as modulators for splicing nucleic acids and for the treatment of proliferative diseases
WO2023034812A1 (en) 2021-08-30 2023-03-09 Remix Therapeutics Inc. Compounds and methods for modulating splicing
WO2023034836A1 (en) 2021-08-30 2023-03-09 Remix Therapeutics Inc. Compounds and methods for modulating splicing
US20240400584A1 (en) 2021-08-30 2024-12-05 Remix Therapeutics Inc. Compounds and methods for modulating splicing
US20240368163A1 (en) 2021-08-30 2024-11-07 Remix Therapeutics Inc. Compounds and methods for modulating splicing
IL311132A (en) 2021-08-30 2024-04-01 Remix Therapeutics Inc Splicing Modulation Compounds and Methods
CA3233973A1 (en) 2021-10-13 2023-04-20 Dominic Reynolds Compounds and methods for modulating nucleic acid splicing
WO2023064879A1 (en) 2021-10-13 2023-04-20 Remix Therapeutics Inc. Compounds and methods for modulating nucleic acid splicing
US20250326748A1 (en) 2022-01-05 2025-10-23 Remix Therapeutics Inc. Compounds and methods for modulating splicing
US20250109140A1 (en) 2022-01-05 2025-04-03 Remix Theraputics Inc. 5-[5-(piperidin-4-yl)thieno[3,2-c]pyrazol-2-yl]indazole derivatives and related compounds as modulators for splicing nucleic acids and for the treatment of proliferative diseases
WO2023133217A1 (en) 2022-01-05 2023-07-13 Remix Therapeutics Inc. 2-(indazol-5-yl)-6-(piperidin-4-yl)-1,7-naphthyridine derivatives and related compounds as modulators for splicing nucleic acids and for the treatment of proliferative diseases
UY40374A (es) 2022-08-03 2024-02-15 Novartis Ag Inhibidores de inflamasoma nlrp3
CN121090843B (zh) * 2025-09-15 2026-03-03 中国科学院生物物理研究所 用于β-地中海贫血筛查和诊断的新型生物标志物及其应用

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU711092B2 (en) * 1995-11-14 1999-10-07 Abbvie Inc. Use of nuclear magnetic resonance to design ligands to target biomolecules
DE60042338D1 (de) * 1999-10-04 2009-07-16 Univ New Jersey Med TAR RNA bindende Peptide
WO2002083837A1 (en) * 2001-04-11 2002-10-24 Ptc Therapeutics, Inc. Methods for identifying small molecules that bind specific rna structural motifs
AU2003252136A1 (en) * 2002-07-24 2004-02-09 Ptc Therapeutics, Inc. METHODS FOR IDENTIFYING SMALL MOLEDULES THAT MODULATE PREMATURE TRANSLATION TERMINATION AND NONSENSE MEDIATED mRNA DECAY
US8460864B2 (en) * 2003-01-21 2013-06-11 Ptc Therapeutics, Inc. Methods for identifying compounds that modulate untranslated region-dependent gene expression and methods of using same
US9068234B2 (en) * 2003-01-21 2015-06-30 Ptc Therapeutics, Inc. Methods and agents for screening for compounds capable of modulating gene expression
US7563601B1 (en) * 2005-06-01 2009-07-21 City Of Hope Artificial riboswitch for controlling pre-mRNA splicing
US10522239B2 (en) * 2012-12-05 2019-12-31 Nymirum, Inc. Small molecule binding pockets in nucleic acids
EP2929335B1 (en) * 2012-12-05 2021-03-24 Nymirum, Inc. Nmr methods for analysis of biomolecule structure

Also Published As

Publication number Publication date
WO2019060917A2 (en) 2019-03-28
US20220024895A1 (en) 2022-01-27
US20220098168A1 (en) 2022-03-31
US20230152257A1 (en) 2023-05-18
CN111373057A (zh) 2020-07-03
WO2019060917A3 (en) 2019-04-25
EP3688187A2 (en) 2020-08-05
EP3688187A4 (en) 2021-09-29
JP7195328B2 (ja) 2022-12-23
JP2020537158A (ja) 2020-12-17

Similar Documents

Publication Publication Date Title
KR20200057071A (ko) 스플라이싱 조절제의 스크리닝 및 확인을 위한 방법 및 조성물
Shi et al. NMR chemical exchange measurements reveal that N 6-methyladenosine slows RNA annealing
Campbell et al. Locked vs. unlocked nucleic acids (LNA vs. UNA): contrasting structures work towards common therapeutic goals
Abulwerdi et al. Selective small-molecule targeting of a triple helix encoded by the long noncoding RNA, MALAT1
US10522239B2 (en) Small molecule binding pockets in nucleic acids
Kamola et al. In silico and in vitro evaluation of exonic and intronic off-target effects form a critical element of therapeutic ASO gapmer optimization
Marušič et al. NMR of RNA-Structure and interactions
Berner et al. G4-ligand-conjugated oligonucleotides mediate selective binding and stabilization of individual G4 DNA structures
US8710199B2 (en) Signal activated molecular delivery
Ding et al. Cross-binding of four adenosine/ATP aptamers to caffeine, theophylline, and other methylxanthines
Velema et al. Chemical RNA cross-linking: mechanisms, computational analysis, and biological applications
JP2012504962A (ja) テロメラーゼ阻害剤およびその使用方法
Kwiatkowska et al. siRNAs modified with boron cluster and their physicochemical and biological characterization
Duss et al. Cut and paste RNA for nuclear magnetic resonance, paramagnetic resonance enhancement, and electron paramagnetic resonance structural studies
Piacenti et al. A combined experimental and computational study on peptide nucleic acid (PNA) analogues of tumor suppressive miRNA-34a
Vongsutilers et al. Epigenetic TET-catalyzed oxidative products of 5-methylcytosine impede Z-DNA formation of CG decamers
Ma et al. High-sensitivity enzyme-free fluorescence probe based on CRISPR/Cas13 and the isothermal amplification strategy for Axl sensing
Bruylants et al. Comparison of the thermodynamics and base-pair dynamics of a full LNA: DNA duplex and of the isosequential DNA: DNA duplex
Ferreira et al. Complete mesoscopic parameterization of single LNA modifications in DNA applied to oncogene probe design
Kozuch et al. Enhanced cancer theranostics with self-assembled, multilabeled siRNAs
Tam et al. Versatility of threose nucleic acids: synthesis, properties, and applications in chemical biology and biomedical advancements
Ma et al. Isonucleotide incorporation into middle and terminal siRNA duplexes exhibits high gene silencing efficacy and nuclease resistance
Hartono et al. Modeling p K shift in DNA triplexes containing locked nucleic acids
Fedorova Pulsed electron double resonance in structural studies of spin-labeled nucleic acids
Song et al. DNA Aptamers with Chemically Locked Ends for Virus Infection Inhibition

Legal Events

Date Code Title Description
PA0105 International application

St.27 status event code: A-0-1-A10-A15-nap-PA0105

E13-X000 Pre-grant limitation requested

St.27 status event code: A-2-3-E10-E13-lim-X000

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

A201 Request for examination
PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

D13-X000 Search requested

St.27 status event code: A-1-2-D10-D13-srh-X000

P22-X000 Classification modified

St.27 status event code: A-2-2-P10-P22-nap-X000

D14-X000 Search report completed

St.27 status event code: A-1-2-D10-D14-srh-X000

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

E601 Decision to refuse application
PE0601 Decision on rejection of patent

St.27 status event code: N-2-6-B10-B15-exm-PE0601

R18 Changes to party contact information recorded

Free format text: ST27 STATUS EVENT CODE: A-3-3-R10-R18-OTH-X000 (AS PROVIDED BY THE NATIONAL OFFICE)

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000

R18 Changes to party contact information recorded

Free format text: ST27 STATUS EVENT CODE: A-3-3-R10-R18-OTH-X000 (AS PROVIDED BY THE NATIONAL OFFICE)

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000