BRPI0613566B1 - Métodospara sintetizar uma molécula que compreende umaporção funcional, para sintetizar uma biblioteca decompostos, e para identificar um ou mais compostosque se ligam a um alvo biológico - Google Patents

Métodospara sintetizar uma molécula que compreende umaporção funcional, para sintetizar uma biblioteca decompostos, e para identificar um ou mais compostosque se ligam a um alvo biológico Download PDF

Info

Publication number
BRPI0613566B1
BRPI0613566B1 BRPI0613566-8A BRPI0613566A BRPI0613566B1 BR PI0613566 B1 BRPI0613566 B1 BR PI0613566B1 BR PI0613566 A BRPI0613566 A BR PI0613566A BR PI0613566 B1 BRPI0613566 B1 BR PI0613566B1
Authority
BR
Brazil
Prior art keywords
seq
group
oligonucleotide
functional
building blocks
Prior art date
Application number
BRPI0613566-8A
Other languages
English (en)
Inventor
George J. Franklin
Paolo A. Centrella
David I. Israel
Malcolm L. Gefter
Dennis Benjamin
Nils Jacob Vest Hansen
Stephen Hale
Christopher C. Arico-Muendel
Mathew Clark
Richard Wagner
Malcom J. Kavarana
Steffan Phillip Creaser
Barry Morgan
Raksha A. Acharya
Original Assignee
Praecis Pharmaceuticals Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36930432&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BRPI0613566(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Praecis Pharmaceuticals Inc. filed Critical Praecis Pharmaceuticals Inc.
Publication of BRPI0613566A2 publication Critical patent/BRPI0613566A2/pt
Publication of BRPI0613566B1 publication Critical patent/BRPI0613566B1/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07BGENERAL METHODS OF ORGANIC CHEMISTRY; APPARATUS THEREFOR
    • C07B61/00Other general methods
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Steroid Compounds (AREA)
  • Nitrogen Condensed Heterocyclic Rings (AREA)
  • Polyurethanes Or Polyureas (AREA)
  • Addition Polymer Or Copolymer, Post-Treatments, Or Chemical Modifications (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Compounds Of Unknown Constitution (AREA)
  • Low-Molecular Organic Synthesis Reactions Using Catalysts (AREA)
  • Saccharide Compounds (AREA)

Abstract

composto, método para sintetizar uma molécula, biblioteca de composto, método para sintetizar a mesma e método para identificar um ou mais compostos que se ligam a um alvo biológico. trata-se de um método para sintetizar bibliotecas de moléculas que incluem um marcador de oligonucleotídeo de codificação.

Description

Relatório Descritivo da Patente de Invenção para MÉTODOS PARA SINTETIZAR UMA MOLÉCULA QUE COMPREENDE UMA PORÇÃO FUNCIONAL, PARA SINTETIZAR UMA BIBLIOTECA DE COMPOSTOS, E PARA IDENTIFICAR UM OU MAIS COMPOSTOS QUE SE LIGAM A UM ALVO BIOLÓGICO.
PEDIDOS DE PATENTE RELACIONADOS [001] Este pedido de patente é uma continuação em parte do
Pedido de Patente n° de série U.S. 11/015458 depositado em 17 de dezembro de 2004, pendente, que está relacionado com o Pedido de Patente Provisório n° de série U.S. 60/530854, depositado em 17 de dezembro de 2003; Pedido de Patente Provisório n° de série 60/540681, depositado em 30 de janeiro de 2004; Pedido de Patente Provisório n° de série U.S. 60/553.715 depositado em 15 de março de 2004; e Pedido de Patente Provisório n° de série U.S. 60/588.672 depositado em 16 de julho de 2004. Este pedido de patente também reivindica a prioridade ao Pedido de Patente Provisório n° de série U.S. 60/689.466, depositado em 9 de junho de 2005 e Pedido de Patente Provisório n° de série U.S. 60/731.041 depositado em 28 de outubro de 2005. Os conteúdos totais de cada pedido de patente precedente estão incorporados aqui à guisa de referência.
ANTECEDENTES DA INVENÇÃO [002] A procura por métodos mais eficientes para identificar compostos que possuem atividades biológicas úteis resultou no desenvolvimento de métodos para triagem de um grande número de compostos distintos, presentes em coleções referidas como bibliotecas combinatórias. Tais bibliotecas podem incluir 105 ou mais compostos distintos. Há uma variedade de métodos para produzir bibliotecas combinatórias, e síntese combinatória de peptídeos, peptidomiméticos e pequenas moléculas orgânicas foram relatadas.
[003] Os dois maiores desafios no uso de abordagens
Petição 870190086182, de 02/09/2019, pág. 19/160
2/141 combinatórias na descoberta do fármaco são a síntese de bibliotecas de complexidade suficiente e a identificação de moléculas que são ativas nos exames usados. É geralmente conhecido que quanto maior for o grau de complexidade de uma biblioteca, ou seja, o número de estruturas distintas presente na biblioteca, maior será a probabilidade de a biblioteca conter moléculas com a atividade de interesse. Portanto, a química empregada na síntese de biblioteca deve ser capaz de produzir um grande número de compostos dentro de uma estrutura de tempo razoável. Entretanto, para uma dada concentração formal ou total, aumentar o número de elementos distintos dentro da biblioteca reduz a concentração de qualquer elemento de biblioteca particular. Isto complica a identificação de moléculas ativas de bibliotecas de alta complexidade.
[004] Uma abordagem para superar estes obstáculos foi o desenvolvimento de bibliotecas codificadas, e particularmente bibliotecas onde cada composto inclui um marcador amplificável. Tais bibliotecas incluem bibliotecas codificadas de DNA, onde um marcador de DNA que identifica um elemento de biblioteca pode ser amplificado utilizando técnicas de biologia molecular, tal como a reação em cadeia da polimerase. Entretanto, o uso de tais métodos para produzir ainda será mostrado, e é visível que métodos aperfeiçoados para produzir tais bibliotecas são requeridos para a compreensão do potencial desta abordagem à descoberta de fármaco.
SUMÁRIO DA INVENÇÃO [005] A presente invenção refere-se a um método para sintetizar bibliotecas de moléculas que incluem um marcador de oligonucleotídeo de codificação. O método utiliza uma estratégia de divisão e agrupamento onde uma solução que compreende um iniciador, que compreende um primeiro bloco de construção ligado a um oligonucleotídeo de codificação, é dividida em múltiplas frações. Em
Petição 870190086182, de 02/09/2019, pág. 20/160
3/141 cada fração, o iniciador é reagido com um segundo, exclusivo, bloco de construção e um segundo, exclusivo oligonucleotídeo que identifica o segundo bloco de construção. Estas reações podem ser simultâneas ou sequenciais e, se for sequencial, cada reação pode preceder a outra. As moléculas diméricas produzidas em cada fração são combinadas (agrupadas) e então divididas novamente em múltiplas frações. Cada fração é então reagida com um terceiro bloco de construção exclusivo (fração específica) e um terceiro oligonucleotídeo exclusivo codifica o bloco de construção. O número de moléculas exclusivas presente na biblioteca de produto é uma função do (1) número de blocos de construção diferentes usado em cada etapa da síntese, e (2) do número de vezes que o processo de agrupamento e divisão é repetido.
[006] Em uma modalidade, a invenção proporciona um método para sintetizar uma molécula que compreende ou consiste em uma porção funcional que é ligada de forma operativa a um oligonucleotídeo de codificação. O método inclui as etapas de: (1) proporcionar um composto iniciador que consiste em uma porção funcional que compreende n blocos de construção, onde n é um número inteiro de 1 ou mais, onde a porção funcional compreende pelo menos um grupo reativo e onde a porção funcional é ligada de forma operativa a um oligonucleotídeo inicial; (2) reagir o composto iniciador com um bloco de construção que compreende pelo menos um grupo reativo complementar, onde pelo menos um grupo reativo complementar é complementar ao grupo reativo da etapa (1), sob condições adequadas para reação do grupo reativo e o grupo reativo complementar para formar uma ligação covalente; (3) reagir o oligonucleotídeo inicial com um oligonucleotídeo de entrada que identifica o bloco de construção da etapa (b) na presença de uma enzima que catalisa a ligação do oligonucleotídeo inicial e o oligonucleotídeo de entrada, sob condições adequadas para ligação do oligonucleotídeo de entrada e o
Petição 870190086182, de 02/09/2019, pág. 21/160
4/141 oligonucleotídeo inicial, dessa forma produzindo uma molécula que compreende ou consiste em uma porção funcional que compreende n+1 blocos de construção que é ligada de forma operativa a um oligonucleotídeo de codificação. Se a porção funcional da etapa (3) compreender um grupo reativo, as etapas 1 a 3 podem se repetir uma ou mais vezes, dessa maneira formando ciclos 1 a i, onde i é um número inteiro de 2 ou mais, com o produto da etapa (3) de um ciclo s, onde s é um número inteiro de i a 1 ou menos, se tornando o composto iniciador de ciclo s + 1.
[007] Em uma modalidade, a invenção proporciona um método para sintetizar uma biblioteca de compostos, onde os compostos compreendem uma porção funcional que compreende dois ou mais blocos de construção que é ligada de forma operativa a um oligonucleotídeo que identifica a estrutura da porção funcional. O método compreende as etapas de (1) proporcionar uma solução que compreende m compostos iniciadores, onde m é um número inteiro de 1 ou mais, onde os compostos iniciadores consistem em uma porção funcional que compreende n blocos de construção, onde n é um número inteiro de 1 ou mais, que é ligado de forma operativa a um oligonucleotídeo inicial que identifica os n blocos de construção; (2) dividir a solução da etapa (1) em r frações, onde r é um número inteiro de 2 ou mais; (3) reagir os compostos iniciadores em cada fração com um dos r blocos de construção, desse modo produzindo r frações que compreendem compostos que consistem em uma porção funcional que compreende n+1 blocos de construção ligados de forma operativa ao oligonucleotídeo inicial; (4) reagir o oligonucleotídeo inicial em cada fração com um entre um conjunto de r oligonucleotídeos de entrada distintos na presença de uma enzima que catalisa a ligação do oligonucleotídeo de entrada e o oligonucleotídeo inicial, sob condições adequadas para ligação enzimática do oligonucleotídeo de entrada e o
Petição 870190086182, de 02/09/2019, pág. 22/160
5/141 oligonucleotídeo inicial, dessa forma produzindo r alíquotas que compreendem moléculas que consistem em uma porção funcional que compreende n+1 blocos de construção ligados de forma operativa a um oligonucleotídeo alongado que codifica os n+1 blocos de construção. Opcionalmente, o método pode incluir adicionalmente a etapa de (5) recombinar as r frações produzidas na etapa (4), dessa forma produzindo uma solução que compreende compostos que consistem em uma porção funcional que compreende n + 1 blocos de construção, que é ligada de forma operativa a um oligonucleotídeo alongado. As etapas (1) a (5) podem ser conduzidas uma ou mais vezes para produzir os ciclos 1 a i, onde i é um número inteiro de 2 ou mais. No ciclo s+1, onde s é um número inteiro de i a 1 ou menor, a solução que compreende m compostos iniciadores da etapa (1) é a solução da etapa (5) de ciclo s. Também, os compostos iniciadores da etapa (1) de ciclo s+1 são os compostos da etapa (5) de ciclo s.
[008] Em uma modalidade preferida, os blocos de construção são acoplados em cada etapa utilizando reações químicas convencionais. Os blocos de construção podem ser acoplados para produzir polímeros ou oligômeros lineares ou ramificados, tais como peptídeos, peptidomiméticos, e peptóides, ou moléculas não-oligoméricas, tais como moléculas que compreendem uma estrutura de suporte provisório à qual está ligada uma ou mais porções químicas adicionais. Por exemplo, se os blocos de construção forem resíduos de aminoácido, os blocos de construção podem ser acoplados utilizando estratégias de síntese peptídica padrão, tal como, síntese em fase de solução ou fase sólida que utiliza estratégias de proteção/desproteção adequadas como conhecidas no campo. De preferência, os blocos de construção são acoplados utilizando química em fase de solução. Os oligonucleotídeos de codificação são oligonucleotídeos de fita simples ou de fita dupla, de preferência, oligonucleotídeos de fita dupla. Os oligonucleotídeos de
Petição 870190086182, de 02/09/2019, pág. 23/160
6/141 codificação são, de preferência, oligonucleotídeos de 4 a 12 bases ou pares de bases por bloco de construção; os oligonucleotídeos de codificação podem ser acoplados utilizando a metodologia sintética de oligonucleotídeo em fase de solução ou fase sólida, porém são, de preferência, acoplados utilizando um processo enzimático em fase de solução. Por exemplo, os oligonucleotídeos podem ser acoplados utilizando uma topoisomerase, uma ligase, ou uma DNA polimerase, se a sequência dos oligonucleotídeos de codificação incluir uma sequência de iniciação para ligação através de uma destas enzimas. O acoplamento enzimático dos oligonucleotídeos de codificação oferece as vantagens de (1) maior precisão de adição comparada com acoplamento sintético (não-enzimático) padrão; e (2) o uso de uma estratégia de proteção/desproteção mais simples.
[009] Em outro aspecto, a invenção proporciona compostos da
Fórmula I:
(I) onde X é uma porção funcional que compreende um ou mais blocos de construção; Z é um oligonucleotídeo ligado em sua terminação 3' a B; Y é um oligonucleotídeo que é ligado em sua terminação 5' a C; A é um grupo funcional que forma uma ligação covalente com X; B é um grupo funcional que forma uma ligação com a extremidade 3' de Z; C é um grupo funcional que forma uma ligação com a extremidade 5' de Y; cada D, F e E é, independentemente, um grupo de ligação bifuncional; e S um átomo ou uma estrutura molecular provisório. Tais compostos incluem aqueles que são sintetizados
Petição 870190086182, de 02/09/2019, pág. 24/160
7/141 utilizando os métodos da invenção.
[0010] A invenção se refere adicionalmente a uma biblioteca de composto que compreende compostos que compreendem uma porção funcional que compreende dois ou mais blocos de construção que é ligada de forma operativa a um oligonucleotídeo que codifica a estrutura da porção funcional. Tais bibliotecas podem compreender de cerca de 102 a cerca de 1012 ou mais elementos distintos, por exemplo, 102, 103, 104, 105, 106, 107, 108, 109, 1010, 1011, 1012 ou mais elementos distintos, ou seja, estruturas moleculares distintas.
[0011] Em uma modalidade, a biblioteca de composto compreende compostos que são independentemente da Fórmula I:
(I) onde X é uma porção funcional que compreende um ou mais blocos de construção; Z é um oligonucleotídeo ligado em sua terminação 3' a B; Y é um oligonucleotídeo que é ligado em sua terminação 5' a C; A é um grupo funcional que forma uma ligação covalente com X; B é um grupo funcional que forma uma ligação com a extremidade 3' de Z; C é um grupo funcional que forma uma ligação com a extremidade 5' de Y; cada D, F e E é, independentemente, um grupo de ligação bifuncional; e S um átomo ou um suporte molecular provisório. Tais bibliotecas incluem aquelas que são sintetizadas utilizando os métodos da invenção.
[0012] Em outro aspecto, a invenção proporciona um método para identificar um composto que se liga a um alvo biológico, sendo que o dito método compreende as etapas de: (a) colocar o alvo biológico em
Petição 870190086182, de 02/09/2019, pág. 25/160
8/141 contato com uma biblioteca de composto da invenção, onde a biblioteca de composto inclui compostos que compreendem uma porção funcional que compreende dois ou mais blocos de construção que é ligada de forma operativa a um oligonucleotídeo que codifica a estrutura da porção funcional. Esta etapa é realizada sob condições adequadas para pelo menos um elemento da biblioteca de composto se ligar ao alvo; (2) remover os elementos de biblioteca que não se ligam ao alvo; (3) amplificar os oligonucleotídeos de codificação de pelo menos um elemento da biblioteca de composto que se liga ao alvo; (4) sequenciar os oligonucleotídeos de codificação da etapa (3); e utilizar as sequências determinadas na etapa (5) para determinar a estrutura das porções funcionais dos elementos da biblioteca de composto que se liga ao alvo biológico.
[0013] A presente invenção proporciona diversas vantagens na identificação de moléculas que possuem uma propriedade desejada. Por exemplo, os métodos da invenção permitem o uso de uma faixa de reações químicas para construir as moléculas na presença do marcador de oligonucleotídeo. Os métodos da invenção também proporcionam um meio de alta fidelidade para incorporar marcadores de oligonucleotídeo nas estruturas químicas então produzidas. Ademais, estes permitem a síntese de bibliotecas que possuem um grande número de cópias de cada elemento, dessa forma permitindo múltiplas rodadas de seleção contra um alvo biológico enquanto deixam um número suficiente de moléculas após a rodada final de amplificação e sequência dos marcadores de oligonucleotídeo.
BREVE DESCRIÇÃO DOS DESENHOS [0014] A Figura 1 é uma representação esquemática de ligação de oligonucleotídeos de fita dupla, onde o oligonucleotídeo inicial possui um ressalto que é complementar ao ressalto do oligonucleotídeo de entrada. A fita inicial é representada tanto como livre, conjugada a um
Petição 870190086182, de 02/09/2019, pág. 26/160
9/141 ligante de aminoexila ou conjugada a um resíduo de fenilalanina através de um ligante de aminoexila.
[0015] A Figura 2 é uma representação esquemática de ligação de oligonucleotídeo que utiliza uma fita imobilizadora. Nesta modalidade, o imobilizador é um oligonucleotídeo 12-mer com sequências complementares ao oligonucleotídeo inicial de fita simples e oligonucleotídeo de entrada de fita simples.
[0016] A Figura 3 é uma representação esquemática de ligação de um oligonucleotídeo inicial e um oligonucleotídeo de entrada, quando o oligonucleotídeo inicial for de fita dupla com fitas covalentemente ligadas, e o oligonucleotídeo de entrada é de fita dupla.
[0017] A Figura 4 é uma representação esquemática de alongamento de oligonucleotídeo que utiliza uma polimerase. A fita inicial é representado tanto como livre, conjugada a um ligante de aminoexila como conjugada a um resíduo de fenilalanina através de um ligante de aminoexila.
[0018] A Figura 5 é uma representação esquemática do ciclo de síntese de uma modalidade da invenção.
[0019] A Figura 6 é uma representação esquemática de um processo de seleção de múltiplas rodadas que utiliza as bibliotecas da invenção.
[0020] A Figura 7 é um gel resultante de eletroforese dos produtos de cada ciclo 1 a 5 descrito no Exemplo 1 e segue a ligação do iniciador de fechamento. Os padrões de peso molecular são mostrados na via de acesso 1, e as quantidades indicadas de uma hiper-escala, para quantificação de DNA, são mostrados nas vias de acesso 9 a 12.
[0021] A Figura 8 é uma representação esquemática do acoplamento de blocos de construção que utiliza cicloadição de azidoalcino.
[0022] As Figuras 9 e 10 ilustram o acoplamento de blocos de
Petição 870190086182, de 02/09/2019, pág. 27/160
10/141 construção através de substituição aromática nucleofílica sobre uma triazina clorada.
[0023] A Figura 11 mostra estruturas heteroaromáticas cloradas representativas adequadas para uso na síntese de porções funcionais. [0024] A Figura 12 ilustra a ciclização de um peptídeo linear que utiliza a reação de cicloadição de azido/alcino.
[0025] A Figura 13a é um cromatograma da biblioteca produzida como descrito no Exemplo 2 após o Ciclo 4.
[0026] A Figura 13b é um espectro de massa da biblioteca produzida como descrito no Exemplo 2 após o Ciclo 4.
DESCRIÇÃO DETALHADA DA INVENÇÃO [0027] A presente invenção se refere a métodos para produzir compostos e bibliotecas de composto combinatórias, os compostos e bibliotecas produzidos através dos métodos da invenção, e métodos para utilizar as bibliotecas para identificar compostos que possuem uma propriedade desejada, tal como uma atividade biológica desejada. A invenção se refere adicionalmente aos compostos identificados que utilizam estes métodos.
[0028] Uma variedade de abordagens foi empregada para produzir e examinar bibliotecas químicas combinatórias. Os exemplos incluem métodos onde os elementos individuais da biblioteca são fisicamente separados um do outro, tal como quando um único composto for sintetizado em cada um entre os vários recipientes de reação. Entretanto, estas bibliotecas tipicamente examinam um composto de cada vez, ou no máximo, diversos compostos de cada vez e não, portanto, resultam em processos de triagem mais eficientes. Em outros métodos, os compostos são sintetizados sobre suportes sólidos. Tais suportes provisórios sólidos incluem chips onde os compostos específicos ocupam regiões específicas do chip ou membrana (posição endereçável). Em outros métodos, os compostos são sintetizados em
Petição 870190086182, de 02/09/2019, pág. 28/160
11/141 contas, com cada conta contendo uma estrutura química diferente. [0029] Duas dificuldades que surgem no rastreamento de bibliotecas extensas são (1) o número de compostos distintos que pode ser examinado; e (2) a identificação de compostos que são ativos na rede. Em um método, os compostos que são ativos na tela são identificados ao reduzir a biblioteca original em frações e subtrações ainda menores, em cada caso seleciona-se a fração ou subtração que contém compostos ativo e adicionalmente subdivide-se até atingir uma subtração ativa que contém um conjunto de compostos que é suficientemente pequeno para que todos os elementos do subconjunto possam ser individualmente sintetizados e avaliados para a atividade desejada. Esta é uma atividade enfadonha e demorada.
[0030] Outro método para deconvoluir os resultados de um triagem de biblioteca combinatória é utilizar bibliotecas onde os elementos da biblioteca são marcados com uma etiqueta de identificação, ou seja, cada etiqueta presente na biblioteca está associada com uma estrutura de composto discreta presente na biblioteca, de modo que identificação da etiqueta ordene a estrutura da molécula marcada. Uma abordagem às bibliotecas marcadas utiliza marcadores de oligonucleotídeo, como descrito, por exemplo, na Patente Nos. U.S. 5.573.905; 5.708.153; 5.723.598, 6.060.596 pedidos PCT publicados WO 93/06121; WO
93/20242; WO 94/13623; WO 00/23458; WO 02/074929 e WO 02/103008, e por Brenner and Lerner (Proc. Natl. Acad. ScL USA 89, 5381-5383 (1992); Nielsen and Janda {Methods: A Companion to Methods in Enzymology 6, 361-371 (1994); and Nielsen, Brenner and Janda (J. Am. Chem. Soc. 115, 9812-9813 (1993)), sendo que cada um está incorporado aqui à guisa de referência em sua totalidade. Tais marcadores podem ser amplificados, utilizando por exemplo, reação em cadeia da polimerase, para produzir diversas cópias do marcador e identificar o marcador por sequenciamento. A sequência do marcador
Petição 870190086182, de 02/09/2019, pág. 29/160
12/141 identifica então a estrutura da molécula de ligação, que pode ser sintetizada em forma pura e testada. A presente invenção proporciona um aperfeiçoamento nos métodos para produzir bibliotecas codificadas de DNA, bem como os primeiros exemplos de bibliotecas extensas (105 elementos ou mais) de moléculas codificadas de DNA onde a porção funcional é sintetizada utilizando métodos sintéticos em fase de solução. [0031] A presente invenção proporciona métodos que permitem a síntese fácil de bibliotecas combinatórias codificadas por oligonucleotídeo, e permitem um meio eficiente, de alta fidelidade para adicionar tal marcador de oligonucleotídeo a cada elemento de uma vasta coleção de moléculas.
[0032] Os métodos da invenção incluem métodos para sintetizar moléculas bifuncionais que compreendem uma primeira porção (porção funcional) que é constituída de blocos de construção, e uma segunda porção ligada de forma operativa à primeira porção, que compreende um marcador de oligonucleotídeo que identifica a estrutura da primeira porção, ou seja, o marcador de oligonucleotídeo indica que blocos de construção foram usados na construção da primeira porção, bem como a ordem na qual os blocos de construção foram ligados. Geralmente, as informações proporcionadas pelo marcador de oligonucleotídeo são suficientes para determinar os blocos de construção usados para construir a porção ativa. Em certas modalidades, a sequência do marcador de oligonucleotídeo é suficiente para determinar a disposição dos blocos de construção na porção funcional, por exemplo, para porções peptídicas, a sequência de aminoácido.
[0033] O termo porção funcional como usado aqui, se refere a uma porção química que compreende um ou mais blocos de construção. De preferência, os blocos de construção na porção funcional não são ácidos nucléicos. A porção funcional pode ser um polímero ou oligômero
Petição 870190086182, de 02/09/2019, pág. 30/160
13/141 cíclico linear ou ramificado ou uma pequena molécula orgânica.
[0034] O termo bloco de construção, como usado aqui, é uma unidade estrutural química que é ligada a outras unidades estruturais químicas ou pode ser ligada a outras unidades estruturais químicas ou pode ser ligada a outras tais unidades. Quando a porção funcional for polimérica ou oligomérica, os blocos de construção são as unidades monoméricas do polímero ou oligômero. Os blocos de construção também podem incluir uma estrutura de suporte provisório (bloco de construção de suporte provisório) à qual está, ou pode ser, ligada uma ou mais estruturas adicionais (blocos de construção periféricos).
[0035] Deve ser entendido que o termo bloco de construção é usado aqui para se referir a uma unidade estrutural química visto que esta ocorre em uma porção funcional e também na forma reativa usada para a síntese da porção funcional. Dentro da porção funcional, um bloco de construção irá ocorrer sem qualquer parte do bloco de construção que é perdida como uma consequência da incorporação do bloco de construção na porção funcional. Por exemplo, em casos onde a reação formadora de ligação libera uma molécula pequena (veja abaixo), o bloco de construção visto que ocorre na porção funcional é um resíduo de bloco de construção, ou seja, o restante do bloco de construção usado na síntese após a perda dos átomos contribui para a molécula liberada.
[0036] Os blocos de construção podem ser quaisquer compostos químicos que sejam complementares, ou seja, os blocos de construção devem ser capazes de reagir um com o outro para formar uma estrutura que compreende dois ou mais blocos de construção. Tipicamente, todos os blocos de construção usados irão possuir pelo menos dois grupos reativos, embora seja possível que alguns dos blocos de construção (por exemplo, o ultimo bloco de construção em uma porção funcional oligomérica) usados possuam apenas um único grupo reativo cada. Os
Petição 870190086182, de 02/09/2019, pág. 31/160
14/141 grupos reativos em dois blocos de construção diferentes deveriam ser complementares, ou seja, capazes de reagir um com o outro para formar uma ligação covalente, opcionalmente com a perda concomitante de uma molécula pequena, tal como água, HCl, HF, e assim por diante. [0037] Para os propósitos atuais, dois grupos reativos são complementares se estes forem capazes de reagir um com o outro para formar uma ligação covalente. Em uma modalidade preferida, as reações formadoras de ligação ocorrem rapidamente sob condições ambientes sem formação substancial de produtos secundários. De preferência, um dado grupo reativo irá reagir com um dado grupo reativo complementar exatamente uma vez. Em uma modalidade, os grupos reativos complementares de dois blocos de construção reagem, por exemplo, através de substituição nucleofílica, para formar uma ligação covalente. Em uma modalidade, um elemento de um par de grupos reativos complementares é um grupo eletrofílico e o outro elemento do par é um grupo nucleofílico.
[0038] Os grupos eletrofílicos e nucleofílicos complementares incluem qualquer dois grupos que reagem através de substituição nucleofílica sob condições adequadas para formar uma ligação covalente. Uma variedade de reações formadoras de ligação adequadas é conhecida na técnica. Veja, por exemplo, March, Advanced Organic Chemistry, quarta edição, New York: John Wiley and Sons (1992), Capítulos 10 a 16; Carey and Sundberg, Advanced Organic Chemistry, Part B, Plenum (1990), Capítulos 1 a 11; e Collman et al., Principles and Applications of Organotransition Metal Chemistry, University Science Books, Mill Valley, Calif. (1987), Capítulos 13 a 20; sendo que cada um está incorporado aqui à guisa de referência em sua totalidade. Exemplos de grupos eletrofílicos adequados incluem grupos carbonila reativos, tais como grupos cloreto de acila, grupos éster, inclusive ésteres de pentafluorofenil carbonila e ésteres succinimida,
Petição 870190086182, de 02/09/2019, pág. 32/160
15/141 grupos cetona e grupos aldeído; grupos sulfonila reativos, tais como grupos cloreto de sulfonila, e grupos fosfonil reativos. Outros grupos eletrofílicos incluem grupos epóxido terminal, grupos isocianato e grupos haleto alquila. Os grupos nucleofílicos adequados incluem grupos amino primários e secundários e grupos hidroxila e grupos carboxila.
[0039] Os grupos reativos complementares estão apresentados abaixo. Um versado na técnica pode determinar facilmente outros pares de grupos reativos que podem ser usados no presente método, e os exemplos proporcionados aqui não são considerados de caráter limitativo.
[0040] Em uma primeira modalidade, os grupos reativos complementares incluem grupos carboxila ativados, grupos sulfonila reativos ou grupos fosfonila reativos, ou uma combinação destes, e grupos amino primários e secundários. Nesta modalidade, os grupos reativos complementares reagem sob condições adequadas para formar uma ligação de amida, sulfonamida ou fosfonamidato.
[0041] Ema segunda modalidade, os grupos reativos complementares incluem grupos epóxido e grupos amino primários ou secundários. Um bloco de construção dotado de epóxido reage com um bloco de construção dotado de amina sob condições adequadas para formar uma ligação de carbono-nitrogênio, resultando em um β-amino álcool.
[0042] Em outra modalidade, os grupos reativos complementares incluem grupos aziridina e grupos amino primários ou secundários. Sob condições adequadas, um bloco de construção dotado de aziridina reage com um bloco de construção dotado de amina para formar uma ligação de carbono-nitrogênio, resultando em 1,2-diamina. Em uma terceira modalidade, os grupos reativos complementares incluem grupos isocianato e grupos amino primários e secundários. Um bloco de
Petição 870190086182, de 02/09/2019, pág. 33/160
16/141 construção dotado de isocianato irá reagir com um bloco de construção dotado de amino sob condições adequadas para formar uma ligação de carbono-nitrogênio, resultando em um grupo uréia.
[0043] Em uma quarta modalidade, os grupos reativos complementares incluem grupos isocianato e grupos hidroxila. Um bloco de construção dotado de isocianato para reagir com um bloco de construção dotado de hidroxila sob condições adequadas para formar uma ligação de carbono-oxigênio, resultando em um grupo carbamato. [0044] Em uma quinta modalidade, os grupos reativos complementares incluem grupos amino e grupos dotados de carbonila, tais como grupos aldeído ou cetona. As aminas reagem com tais grupos através de aminação redutiva para formar uma nova ligação de carbononitrogênio.
[0045] Em uma sexta modalidade, os grupos reativos complementares incluem grupos ilídeo fosforoso e grupos aldeído ou cetona. Um bloco de construção dotado de ilídeo fosforoso irá reagir com um bloco de construção dotado de aldeído ou cetona sob condições adequadas para formar uma ligação dupla carbono-carbono, resultando em um alceno.
[0046] Em uma sétima modalidade, os grupos reativos complementares reagem através de cicloadição para formar uma estrutura cíclica. Ume exemplo de tais grupos reativos complementares são alcinos e azidos orgânicos, que reagem sob condições adequadas para formar uma estrutura de anel triazol. Um exemplo do uso desta reação para ligar dois blocos de construção está ilustrado na Figura 8. As condições adequadas para tais reações são conhecidas na técnica e incluem aquelas descritas em WO 03/101972, cujos conteúdos estão incorporados à guisa de referência no presente documento. Em uma oitava modalidade, os grupos reativos complementares são um haleto de alquila e um nucleófilo, tal como um grupo amino, um grupo hidroxila
Petição 870190086182, de 02/09/2019, pág. 34/160
17/141 ou um grupo carboxila. Tais grupos reagem sob condições adequadas para formar uma carbono-nitrogênio (haleto de alquila mais amina) ou carbono-oxigênio (haleto de alquila mais hidroxila ou grupo carboxila). [0047] Em uma nona modalidade, os grupos funcionais complementares são um grupo heteroaromático halogenado e um nucleófilo, e os blocos de construção são ligados sob condições adequadas através de substituição nucleofílica aromática. Os grupos heteroaromáticos adequados incluem pirimidinas, triazinas e purinas cloradas, que reagem com nucleófilos, tais como aminas, sob condições suaves em solução aquosa. Exemplos representativos da reação de uma triclorotriazina marcada por oligonucleotídeo com aminas são mostrados nas Figuras 9 e 10. Exemplos de grupos heteroaromáticos clorados adequados são mostrados na Figura 11.
[0048] As reações formadoras de ligação adicionais que podem ser usadas para unir os blocos de construção na síntese das moléculas e bibliotecas da invenção incluem aquelas mostradas abaixo. As reações mostradas abaixo destacam os grupos funcionais reativos. Diversos substituintes podem estar presentes nos reagentes, inclusive aqueles marcados com R1, R2, R3 e R4. As possíveis posições que podem ser substituídas incluem, porém sem caráter limitativo, aquelas indicadas por R1, R2, R3 e R4. Estes substituintes podem incluir qualquer porção química adequada, porém são, de preferência, limitados àqueles que não interferem ou significativamente inibem a reação indicada, e, salvo especificação em contrário, podem incluir hidrogênio, alquila, alquila substituída, arila, arila substituída, heteroarila, heteroarila substituída, alcóxi, arilóxi, arilalquila, arilalquila substituída, amino, amino substituído e outros conforme conhecidos na técnica. Os substituintes adequados sobre estes grupos incluem alquila, arila, heteroarila, ciano, halogênio, hidroxila, nitro, amino, mercapto, carboxila, e carboxamida. Quando especificado, os grupos de doação de elétrons adequados incluem nitro,
Petição 870190086182, de 02/09/2019, pág. 35/160
18/141 carboxila, haloalquila, tais como trifluorometila e outros conforme conhecidos na técnica. Exemplos de grupos doadores de elétrons incluem alquila, alcóxi, hidroxila, amino, halogênio, acetamido e outros conforme conhecidos na técnica. Adição de uma amina primária a um alceno:
[0049] Substituição nucleofílica:
[0050]
Alquilação redutiva de uma amina:
Ri +
NaBH(OAc)^
Ri
NH2
O
NaBH3CN
H N
[0051] Reações formadoras de ligação carbono-carbono catalisadas por paládio
+
OH
B
OH
Petição 870190086182, de 02/09/2019, pág. 36/160
19/141
N
O
H
OH
O [0052] Reações de condensação Ugi:
NC
[0053] Reações de substituição aromática eletrofílica:
YH
Ri
Y
R2
R2
Ri [0054] X é um grupo doador de elétrons [0055] Reações formadoras de imina/imínio/enamina
Petição 870190086182, de 02/09/2019, pág. 37/160
20/141
[0056] Reações de cicloadição:
[0057]
Cicloadição Diels-Alder
[0058]
Cicloadição 1,3-dipolar,
XYZ
[0059] Reações de substituição aromática nucleofílica
1’
R2 N
O [0060] W é um grupo de remoção de elétrons
+
Ri
Y [0061] Exemplos de substituintes adequados X e Y incluem amino substituído ou não-substituído, alcóxi substituído ou não-substituído, tioalcóxi substituído ou não-substituído, arilóxi substituído ou não-substituído e tioarilóxi substituído ou não-substituído.
Petição 870190086182, de 02/09/2019, pág. 38/160
21/141
nh2
MeO
[0062]
Reação de Heck
O
[0063]
Formação de acetal
X
Z
[0064] Exemplos de substituintes adequados X e Y incluem amino substituído ou não-substituído, hidroxila e sulfidril; Y é um ligante que conecta X e Y e é adequado para formar a estrutura de anel encontrada no produto da reação.
[0065] Reações de aldol:
X
[0066] Exemplos de substituintes adequados X incluem O, S e NR3.
Petição 870190086182, de 02/09/2019, pág. 39/160
22/141 [0067] Os blocos de construção de suporte provisório que podem ser usados para formar as moléculas e bibliotecas da invenção incluem aqueles que possuem dois ou mais grupos funcionais que podem participar nas reações formadoras de ligação com precursores de bloco de construção periféricos, por exemplo, que utilizam uma ou mais reações formadoras de ligação discutidas acima. As porções de suporte provisório também podem ser sintetizadas durante a construção das bibliotecas e moléculas da invenção, por exemplo, utilizando precursores de bloco de construção que podem reagir de maneiras específicas para formar moléculas que compreendem uma porção molecular central onde estão anexados os grupos funcionais periféricos. Em uma modalidade, uma biblioteca da invenção compreende moléculas que compreende uma porção de suporte provisório constante, porém porções periféricas diferentes ou disposições diferentes de porções periféricas. Em certas bibliotecas, todos os elementos de biblioteca compreendem uma porção de suporte provisório constante; outras bibliotecas podem compreender moléculas que possuem duas ou mais porções de suporte provisório diferentes. Exemplos de reações formadoras de porção de suporte provisório que podem ser usados na construção das moléculas e bibliotecas da invenção estão apresentados na Tabela 8. As referências citadas na tabela estão incorporadas aqui à guisa de referência em sua totalidade. Os grupos Ri, R2, R3 e R4 estão limitados apenas devido ao fato de estes não interferirem, ou significativamente inibirem, a reação indicada, e podem incluir hidrogênio, alquila, alquila substituída, heteroalquila, heteroalquila substituída, cicloalquila, heterocicloalquila, cicloalquila substituída, heterocicloalquila substituída, arila, arila substituída, arilalquila, heteroarilalquila, arilalquila substituída, arilalquila heteroarilalquila substituída, heteroarila, heteroarila substituída, halogênio, alcóxi, arilóxi, amino, amino substituído e outros conforme
Petição 870190086182, de 02/09/2019, pág. 40/160
23/141 conhecidos na técnica. Os substituintes adequados incluem, porém sem caráter limitativo, alquila, alcóxi, tioalcóxi, nitro, hidroxila, sulfidrila, arilóxi, aril-S-, halogênio, carbóxi, amino, alquilamino, dialquilamino, arilamino, ciano, cianato, nitrila, isocianato, tiocianato, carbamila, e carbamila substituída.
[0068] Deve ser entendido que a síntese de uma porção funcional pode proceder através de um tipo particular de reação de acoplamento, tal como, porém sem caráter limitativo, uma das reações discutidas acima, ou através de uma combinação de duas ou mais reações de acoplamento, tais como duas ou mais reações de acoplamento discutidas acima. Por exemplo, em uma modalidade, os blocos de construção são unidos através de uma combinação de formação de ligação de amida (amino e grupos complementares de ácido carboxílico) e aminação redutiva (amino e grupos complementares de aldeído ou cetona). Qualquer substância química de acoplamento pode ser usada, desde que esta seja compatível com a presença de um oligonucleotídeo. Marcadores de oligonucleotídeo de fita dupla (dúplex), como usado em certas modalidades da presente invenção, são quimicamente mais poderosos do que marcadores de fita simples, e, portanto, toleram uma faixa mais ampla de condições de reação e permitem o uso de reações formadoras de ligação que poderia não ser possível com marcadores de fita simples.
[0069] Um bloco de construção pode incluir um ou mais grupos funcionais além do grupo ou grupos reativos empregados para formar a porção funcional. Um ou mais destes grupos funcionais podem ser protegidos para evitar reações indesejadas destes grupos funcionais. Os grupos de proteção adequados são conhecidos na técnica por uma variedade de grupos funcionais (Greene and Wuts, Protective Groups in Organic Synthesis, second edition, New York: John Wiley and Sons (1991), incorporados aqui à guisa de referência). Os grupos de proteção
Petição 870190086182, de 02/09/2019, pág. 41/160
24/141 particularmente úteis incluem t-butil ésteres e éteres, acetais, tritil éteres e aminas, acetil ésteres, trimetilsilil éteres, tricloroetil éteres e ésteres de carbamatos.
[0070] Em uma modalidade, cada bloco de construção compreende dois grupos reativos, que podem ser iguais ou diferentes. Por exemplo, cada bloco de construção adicionado em ciclo s pode compreender dois grupos reativos que são iguais, porém que são complementares aos grupos reativos dos blocos de construção adicionados em etapas s-1 e s + 1. Em outra modalidade, cada bloco de construção compreende dois grupos reativos que são complementares aos mesmos. Por exemplo, uma biblioteca que compreende moléculas de poliamida pode ser produzida através de reações entre blocos de construção que compreendem dois grupos amino primários e os blocos de construção que compreendem dois grupos carboxila ativados. Nos compostos resultantes não há terminação N ou C, visto que grupos amida alternados possuem direcionalidade oposta. Alternativamente, uma biblioteca de poliamida pode ser produzida utilizando blocos de construção que compreendem um grupo amino e um grupo carboxila ativado. Nesta modalidade, os blocos de construção adicionados na etapa n do ciclo irão possuir um grupo reativo livre que é complementar ao grupo reativo disponível sobre o bloco de construção n-1, enquanto, de preferência, o outro grupo reativo sobre o bloco de construção nth é protegido. Por exemplo, se os elementos da biblioteca forem sintetizados a partir da direção C para N, os blocos de construção adicionados irão compreender um grupo carboxila ativado e um grupo amino protegido.
[0071] As porções funcionais podem ser porções poliméricas ou oligoméricas, tais como peptídeos, peptidomiméticos, ácidos nucléico de peptídeo ou peptóides, ou estas podem ser pequenas moléculas não-poliméricas, por exemplo, moléculas que possuem uma estrutura
Petição 870190086182, de 02/09/2019, pág. 42/160
25/141 que compreende um suporte central provisório e estruturas dispostas em torno da periferia do suporte provisório. As bibliotecas poliméricas ou oligoméricas lineares irão resultar do uso de blocos de construção que possuem dois grupos reativos, enquanto bibliotecas poliméricas ou oligoméricas ramificadas irão resultar do uso de blocos de construção que possuem três ou mais grupos reativos, opcionalmente em combinação com blocos de construção que possuem apenas dois grupos reativos. Tais moléculas podem ser representadas pela fórmula geral X1X2...Xn, onde cada X é uma unidade monomélica de um polímero que compreende n unidades monomélicas, onde n é um número inteiro maior que 1. No caso de compostos oligoméricos ou poliméricos, os blocos de construção terminais não precisam compreender dois grupos funcionais. Por exemplo, no caso de uma biblioteca de poliamida, o bloco de construção C-terminal pode compreender um grupo amino, porém a presença de um grupo carboxila é opcional. Similarmente, o bloco de construção na terminação N pode compreender um grupo carboxila, porém não precisa conter um grupo amino.
[0072] Os compostos oligoméricos ou poliméricos ramificados também podem ser sintetizados desde que pelo menos um bloco de construção compreenda três grupos funcionais que são reativos com outros blocos de construção. Uma biblioteca da invenção pode compreender moléculas lineares, moléculas ramificadas ou uma combinação destas.
[0073] As bibliotecas também podem ser construídas utilizando, por exemplo, um bloco de construção de suporte provisório que possui dois ou mais grupos reativos, em combinação com outros blocos de construção que possuem apenas um grupo reativo disponível, por exemplo, onde qualquer grupo reativo adicional tanto é protegido como não-reativos com outros grupos reativos presentes no bloco de
Petição 870190086182, de 02/09/2019, pág. 43/160
26/141 construção de suporte provisório. Em uma modalidade, por exemplo, as moléculas sintetizadas podem ser representadas pela fórmula geral X(Y)n, onde X é um bloco de construção de suporte provisório; cada Y é um bloco de construção ligado a X e n é um número inteiro de pelo menos dois, e de preferência, um número inteiro de 2 a cerca de 6. Em uma modalidade preferida, o bloco de construção inicial de ciclo 1 é um bloco de construção de suporte provisório. Em moléculas da fórmula X(Y)n, cada Y pode ser igual ou diferente, porém na maioria dos elementos de uma biblioteca típica, cada Y será diferente.
[0074] Em uma modalidade, as bibliotecas da invenção compreendem compostos de poliamida. Os compostos de poliamida podem ser compostos de blocos de construção derivados de qualquer aminoácido, inclusive os vinte α-aminoácidos naturalmente ocorrentes, tais como alanina (Ala; A), glicina (Gly; G), asparagina (Asn; N), ácido aspártico (Asp; D), ácido glutâmico (Glu; E), histidina (His; H), leucina (Leu; L), lisina (Lys; K), fenilalanina (Phe; F), tirosina (Tyr; Y), treonina (Thr; T), serina (Ser; S), arginina (Arg; R), valina (Val; V), glutamina (Gln; Q), isoleucina (He; I), cisteína (Cys; C), metionina (Met; M), prolina (Pro; P) e triptofano (Trp; W), onde são dados códigos de três letras e uma letra para cada aminoácido. Em sua forma naturalmente ocorrente, cada aminoácido anterior se apresenta na configuração L, que deve ser assumida aqui, salvo observação em contrário. No presente método, entretanto, as formas de configuração D destes aminoácidos também podem ser usadas. Estes D-aminoácidos estão indicados aqui por códigos de três letras ou uma letra em caixa baixa, ou seja, ala (a), gly (g), leu (1), gin (q), thr (t), ser (s), e assim por diante. Os blocos de construção também podem ser derivados de outros a-aminoácidos, inclusive, porém sem caráter limitativo, 3-arilalaninas, tais como, naftilalanina, fenilalaninas substituídas por fenila, inclusive 4-flúor-, 4cloro, 4-bromo e 4-metilfenilalanina; 3-heteroarilalaninas, tais como, 3
Petição 870190086182, de 02/09/2019, pág. 44/160
27/141 piridilalanina, 3-tienilalanina, 3-quinolilalanina, e 3-imidazolilalanina; ornitina; citrulina; homocitrulina; sarcosina; homoprolina; homocisteína; prolina substituída, tal como hidroxiprolina e fluoroprolina; desidroprolina; norleucina; O-metiltirosina; O-metilserina; Ometiltreonina e 3-cicloexilalanina. Cada aminoácido anterior pode ser utilizado tanto na configuração D como L.
[0075] Os blocos de construção também podem ser aminoácidos que não são α-aminoácidos, tais como α-azaaminoácidos; β, γ, δ, ε,aminoácidos, e aminoácidos N-substituídos, tal como glicina Nsubstituída, onde o N-substituinte pode ser, por exemplo, um grupo alquila, arila, heteroarila, arilalquila ou heteroarilalquila substituída ou não-substituída. Em uma modalidade, o N-substituinte é um filamento lateral de um α-aminoácido naturalmente ocorrente ou nãonaturalmente ocorrente.
[0076] O bloco de construção também pode ser uma estrutura peptidomimética, tal como um dipeptídeo, tripeptídeo, tetrapeptídeo ou pentapeptídeo mimético. Tais blocos de construção peptidomiméticos são, de preferência, derivados de compostos amino acila, de modo que a substância química de adição destes blocos de construção ao grupo poli(aminoacila) de crescimento é igual, ou similar, à substância química usada nos outros blocos de construção. Os blocos de construção também podem ser moléculas que são capazes de formar ligações que são isoestéricas com uma ligação de peptídeo, para formar porções funcionais peptidomiméticas que compreendem uma modificação de filamento principal de peptídeo, tal como v[CH2S], ψ [CH2NH], v[CSNH2], v[NHCO], ψ[^^2], e ψ[^) ou (Z) CH=CH]. Na nomenclatura usada acima, ψ indica a ausência de uma ligação de amida. A estrutura que susbtitui o grupo amida está especificada entre colchetes.
[0077] Em uma modalidade, a invenção proporciona um método para sintetizar um composto que compreende ou consiste em uma
Petição 870190086182, de 02/09/2019, pág. 45/160
28/141 porção funcional que é ligada de forma operativa a um oligonucleotídeo de codificação. O método inclui as etapas de: (1) proporcionar um composto iniciador que consiste em uma porção funcional inicial que compreende n blocos de construção, onde n é um número inteiro de 1 ou mais, onde a porção funcional inicial compreende pelo menos um grupo reativo, e onde a porção funcional inicial é ligada de forma operative a um oligonucleotídeo inicial que codifica os n blocos de construção; (2) reagir o composto iniciador com um bloco de construção que compreende pelo menos um grupo reativo complementar, onde pelo menos um grupo reativo complementar é complementar ao grupo reativo da etapa (1), sob condições adequadas para reação do grupo reativo e do grupo reativo complementar para formar uma ligação covalente; (3) reagir o oligonucleotídeo inicial com um oligonucleotídeo de entrada na presença de uma enzima que catalisa a ligação do oligonucleotídeo inicial e o oligonucleotídeo de entrada, sob condições adequadas para ligação do oligonucleotídeo de entrada e do oligonucleotídeo inicial, produzindo desta forma uma molécula que compreende ou consiste em uma porção funcional que compreende n+1 blocos de construção que é ligada de forma operativa a um oligonucleotídeo de codificação. Se a porção funcional da etapa (3) compreender um grupo reativo, as etapas 1 a 3 podem ser repetidas uma ou mais vezes, formando desta forma ciclos 1 a i, onde i é um número inteiro de 2 ou mais, com o produto da etapa (3) de um ciclo s1, onde s é um número inteiro de i ou menos, tornando-se o composto iniciador da etapa (1) de ciclo s. Em cada ciclo, um bloco de construção é adicionado à porção funcional em crescimento e uma sequência de oligonucleotídeo, que codifica o novo bloco de construção, é adicionada ao oligonucleotídeo em codificação de crescimento.
[0078] Em uma modalidade, o(s) composto(s) iniciador(es) inicial(is) é/são gerados ao reagir um primeiro bloco de construção com um
Petição 870190086182, de 02/09/2019, pág. 46/160
29/141 oligonucleotídeo (por exemplo, um oligonucleotídeo que inclui sequências iniciador de PCR ou um oligonucleotídeo inicial) ou com um ligante ao qual tal oligonucleotídeo está anexado. Na modalidade estabelecida na Figura 5, o ligante compreende um grupo reativo para fixação de um primeiro bloco de construção e fica fixado a um oligonucleotídeo inicial. Nesta modalidade, a reação de um bloco de construção, ou em cada uma das diversas alíquotas, um entre uma coleção de blocos de construção, com o grupo reativo do ligante e adição de um oligonucleotídeo que codifica o bloco de construção no oligonucleotídeo inicial produz um ou mais compostos iniciadores iniciais do processo estabelecido acima.
[0079] Em uma modalidade preferida, cada bloco de construção individual está associado com um oligonucleotídeo distinto, de modo que a sequência de nucleotídeos no oligonucleotídeo adicionado em um dado ciclo identifique o bloco de construção adicionado no mesmo ciclo. [0080] O acoplamento de blocos de construção e ligação de oligonucleotídeos irá ocorrer geralmente em concentrações similares de materiais de partida e reagentes. Por exemplo, as concentrações de reagentes na ordem de micromolar para milimolar, por exemplo, de cerca de 10 μM a cerca de 10 mM, são preferidas para possuir acoplamento eficiente de blocos de construção.
[0081] Em certas modalidades, o método compreende adicionalmente, após a etapa (2), a etapa de remover qualquer porção funcional inicial não-reagida. A remoção de qualquer porção funcional inicial não-reagida em um ciclo particular impede que a porção funcional inicial do ciclo reaja com um bloco de construção adicionado em um ciclo posterior. Tais reações poderiam resultar na geração de porções funcionais que não possuem um ou mais blocos de construção, resultando potencialmente em uma faixa de estruturas de porção funcional qie corresponde a uma sequência de oligonucleotídeo
Petição 870190086182, de 02/09/2019, pág. 47/160
30/141 particular. Tal remoção pode ser realizada ao reagir qualquer porção funcional inicial restante com um composto que reagem com o grupo reativo da etapa (2). De preferência, o composto removedor reage rapidamente com o grupo reativo da etapa (2) e não inclui grupos reativos adicionais que podem reagir com blocos de construção adicionados em ciclos posteriores. Por exemplo, na síntese de um composto onde o grupo reativo da etapa (2) é um grupo amino, um composto removedor adequado é um N-hidroxissuccinimida éster, tal como ácido acético N-hidroxissuccinimida.
[0082] Em outra modalidade, a invenção proporciona um método para produzir uma biblioteca de compostos, onde cada composto compreende uma porção funcional que compreende dois ou mais resíduos de bloco de construção que é ligada de forma operativa a um oligonucleotídeo. Em uma modalidade preferida, o oligonucleotídeo presente em cada molécula proporciona informações suficientes para identificar os blocos de construção dentro da molécula e, opcionalmente, a ordem de adição dos blocos de construção. Nesta modalidade, o método da invenção compreende um método para sintetizar uma biblioteca de compostos, onde os compostos compreendem uma porção funcional de dois ou mais blocos de construção que é ligada de forma operativa a um oligonucleotídeo que identifica a estrutura da porção funcional. O método compreende as etapas de (1) proporcionar uma solução que compreende m compostos iniciadores, onde m é um número inteiro de 1 ou mais, onde os compostos iniciadorse consistem em uma porção funcional que compreende n blocos de construção, onde n é um número inteiro de 1 ou mais, que é ligada de forma operativa a um oligonucleotídeo inicial que identifica os n blocos de construção; (2) dividir a solução da etapa (1) em pelo menos r frações, onde r é um número inteiro de 2 ou mais; (3) reagir cada fração com um dos r blocos de construção, produzindo
Petição 870190086182, de 02/09/2019, pág. 48/160
31/141 desta forma r frações que compreendem compostos que consistem em uma porção funcional que compreende n+1 blocos de construção ligada de forma operativa ao oligonucleotídeo inicial; (4) reagir cada uma das r frações da etapa (3) com um entre um conjunto de r oligonucleotídeos de entrada distintos sob condições adequadas para ligação enzimática do oligonucleotídeo de entrada ao oligonucleotídeo inicial, produzindo desta forma r frações que compreendem moléculas que consistem em uma porção funcional que compreende n+1 blocos de construção ligada de forma operativa a um oligonucleotídeo alongado que condifica os n+1 blocos de construção. Opcionalmente, o método pode incluir adicionalmente a etapa de (5) recombinar as r frações, produzidas na etapa (4), produzindo desta forma uma solução que compreende moléculas que consistem em uma porção funcional que compreende n + 1 blocos de construção, que é ligada de forma operativa a um oligonucleotídeo alongado que codifica os n + 1 blocos de construção. As etapas (1) a (5) podem ser conduzidas uma ou mais vezes para produzir ciclos 1 a i, onde i é um número inteiro de 2 ou mais. No ciclo s+1, onde s é um número inteiro de i-1 ou menos, sendo que a solução compreende m compostos iniciadores da etapa (1) é a solução da etapa (5) de ciclo s. Também, os compostos iniciadores da etapa (1) de ciclo s+1 são os produtos da etapa (4) no ciclo s.
[0083] De preferência, a solução da etapa (2) é dividida em r frações em cada ciclo da síntese de biblioteca. Nesta modalidade, cada fração é reagida com um único bloco de construção.
[0084] Nos métodos da invenção, a ordem de adição do bloco de construção e o oligonucleotídeo de entrada não é importante, e as etapas (2) e (3) da síntese de uma molécula, e etapas (3) e (4) na sínteee de biblioteca podem ser invertidas, ou seja, o oligonucleotídeo de entrada pode ser ligado ao oligonucleotídeo inicial antes de o novo bloco de construção ser adicionado. Em certas modalidades, pode ser
Petição 870190086182, de 02/09/2019, pág. 49/160
32/141 possível conduzir estas duas etapas simultaneamente.
[0085] Em certas modalidades, o método compreende adicionalmente, após a etapa (2), a etapa de remover qualquer porção funcional inicial não-reagida. A remoção de qualquer porção funcional inicial não-reagida em um ciclo particular impede que a porção funcional inicial de um ciclo reaja com um bloco de construção adicionado em um ciclo posterior. Tais reações poderiam resultar na geração de porções funcionais que não possuem um ou mais blocos de construção, resultando potencialmente em uma faixa de estruturas de porção funcional que corresponde a uma sequência de oligonucleotídeo particular. Tal remoção pode ser realizada ao reagir qualquer porção funcional restante com um composto que reage com o grupo reativo da etapa (2). De preferência, o composto de sequestro reage rapidamente com o grupo reativo da etapa (2) e não inclui grupos reativos adicionais que podem reagir com blocos de construção adicionados em ciclos posteriores. Por exemplo, na síntese de um composto onde o grupo reativo da etapa (2) é um grupo amino, um composto removedor adequado é um N-hidroxissuccinimida éster, tal como ácido acético Nhidroxissuccinimida éster.
[0086] Em uma modalidade, os blocos de construção usados na síntese de biblioteca são selecionados a partir de um conjunto de blocos de construção candidatos ao avaliar a capacidade de os blocos de construção candidatos reagirem com grupos funcionais complementares apropriados sob as condições usadas para síntese da biblioteca. Os blocos de construção que são mostradas como adequadamente reativos sob tais condições podem ser então selecionados para incorporação na biblioteca. Os produtos de um dado ciclo podem ser, opcionalmente, purificados. Quando o ciclo for um ciclo intermediário, ou seja, qualquer ciclo antes do ciclo final, estes productos são intermediários e podem ser purificados antes do próximo
Petição 870190086182, de 02/09/2019, pág. 50/160
33/141 ciclo. Se o ciclo for o ciclo final, os produtos do ciclo são os produtos finais, e podem ser purificados antes de qualquer uso dos compostos. Esta etapa de purificação pode, por exemplo, remover reagentes nãoreagidos ou em excesso e a enzima empregada para ligação de oligonucleotídeo. Qualquer método que é adequado para separar os produtos de outras espécies presentes na solução pode ser usado, inclusive cromatografia líquida, tal como cromatografia líquida de alta eficiência (HPLC) e precipitação com um co-solvente adequado, tal como etanol. Os métodos adequados para purificação irão depender da natureza dos produtos e do sistema de solvente usado para a síntese.
[0087] As reações são, de preferência, conduzidas em solução aquosa, tal como uma solução aquosa, porém também podem ser conduzidas em meio aquoso/orgânico misturado compatível com as propriedades de solubilidade dos blocos de construção, dos oligonucleotídeos, dos intermediários e dos produtos finais e da enzima usada para catalisar a ligação de oligonucleotídeo.
[0088] Deve ser entendido que o número teórico de compostos produzidos por um dado ciclo no método descrito acima é o produto do número de compostos iniciadores diferentes, m, usado no ciclo e o número de blocos de construção distintos adicionados no ciclo, r. O número real de compostos distintos produzidos no ciclo pode ser tão alto quanto o produto de r e m (r x m), porém poderia ser inferior, dadas as diferenças na reatividade de certos blocos de construção com certos outros blocos de construção. Por exemplo, a cinética de adição de um bloco de construção particular a um composto iniciador particular pode ser tal que na escala de tempo do ciclo sintético, pouco ou nenhum produto daquela reação pode ser produzido.
[0089] Em certas modalidades, um bloco de construção comum é adicionado antes do ciclo 1, após o último ciclo ou entre qualquer dos dois ciclos. Por exemplo, quando a porção funcional for uma poliamida,
Petição 870190086182, de 02/09/2019, pág. 51/160
34/141 um bloco de construção de terminação comum N-terminal pode ser adicionado após o ciclo final. Um bloco de construção comum também pode ser introduzido entre qualquer dos dois ciclos, por exemplo, para adicionar um grupo funcional, tal como um grupo alcino ou azido, que pode ser utilizado para modificar as porções funcionais, por exemplo por ciclização, após a síntese de biblioteca.
[0090] O termo ligado de forma operativa, como usado aqui, significa que duas estruturas químicas são ligadas juntamente de tal maneira para permanecerem ligadas através das diversas manipulações que se espera sofrer. Tipicamente, a porção funcional e o oligonucleotídeo de codificação são ligados de forma covalente através de um grupo de ligação apropriado. O grupo de ligação é uma porção bivalente com um sítio de ligação para o oligonucleotídeo e um sítio de ligação para a porção funcional. Por exemplo, quando a porção funcional for um composto de poliamida, o composto de poliamida pode ser ligado ao grupo de ligação em sua terminação N, sua terminação C ou através de um grupo funcional sobre um dos filamentos laterais. O grupo de ligação é suficiente para separar o composto de poliamida e o oligonucleotídeo por pelo menos um átomo, e de preferência, por mais de um átomo, tal como pelo menos dois, pelo menos três, pelo menos quatro, pelo menos cinco ou pelo menos seis átomos. De preferência, o grupo de ligação é suficientemente flexível para permitir que o composto de poliamida ligue as moléculas alvo de maneira que seja independente do oligonucleotídeo. Em uma modalidade, o grupo de ligação é ligado à terminação N do composto de poliamida e o grupo 5'-fosfato do oligonucleotídeo. Por exemplo, o grupo de ligação pode ser derivado de um precursor de grupo de ligação que compreende um grupo carboxila ativado sobre uma extremidade e um éster ativado sobre a outra extremidade. A reação do precursor de grupo de ligação com o átomo de nitrogênio N-terminal irá formar uma ligação de amida que conecta o
Petição 870190086182, de 02/09/2019, pág. 52/160
35/141 grupo de ligação ao composto de poliamida ou bloco de construção Nterminal, enquanto a reação do precursor de grupo de ligação com o grupo 5'-hidróxi irá resultar na ligação do oligonucleotídeo ao grupo de ligação através de uma ligação de éster. O grupo de ligação pode compreender, por exemplo, umo filamento de polimetileno, tal como umo filamento -(CH2)n- ou umo filamento de poli(etileno glicol), tal como umo filamento -(CH2CH2O)n, onde em cada caso n é um número inteiro de 1 a cerca de 20. De preferência, n é 2 a cerca de 12, mais preferivelmente de cerca de 4 a cerca de 10. Em uma modalidade, o grupo de ligação compreende um grupo hexametileno (-(CH2)6-).
[0091] Quando os blocos de construção forem resíduos de aminoácido, a porção funcional resultante é uma poliamida. Os aminoácidos podem ser acoplados utilizando qualquer química adequada para a formação de ligações de amida. De preferência, o acoplamento dos blocos de construção de aminoácido é conduzido sob condições que são compatíveis com a ligação enzimática de oligonucleotídeos, por exemplo, em pH neutro ou quase neutro em solução aquosa. Em uma modalidade, o composto de poliamida é sintetizado a partir da direção de C-terminal para N-terminal. Nesta modalidade, o primeiro, ou C-terminal, bloco de construção é acoplado em seu grupo carboxila a um oligonucleotídeo através de um grupo de ligação adequado. O primeiro bloco de construção é reagido com o segundo bloco de construção, que possui de preferência, um grupo carboxila ativado e um grupo amino protegido. Qualquer estratégia de grupo de ativação/proteção que é adequada para formação de ligação de amida em fase de solução pode ser usada. Por exemplo, as espécies de carboxila ativadas incluem fluoretos de acila (Patente U.S. 5.360.928, incorporada aqui à guisa de referência em sua totalidade), anidridos simétricos e N-hidroxissuccinimida ésteres. Os grupos acila também podem ser ativados in situ, como conhecido na técnica, através
Petição 870190086182, de 02/09/2019, pág. 53/160
36/141 de reação com um composto de ativação adequado. Os compostos de ativação adequados incluem dicicloexilcarbodiimida (DCC), diisopropilcarbodiimida (DIC), 1 -etoxicarbonil-2-etóxi-1,2-diidroquinolina (EEDQ), cloridrato de 1-etil-3-(3-dimetilaminopropil)carbodiimida (EDC), anidrido n-propano-fosfônico (PPA), cloreto de N,N-bis (2-oxo-3oxazolidinil)imido-fosforil (BOP-Cl), hexafluorofosfato bromo-trispirrolidinofosfônio (PyBrop), difenilfosforil azido (DPPA), reagente de Castro (BOP, PyBop), O-benzotriazolil-N,N,N', sais de N'tetrametilurônio (HBTU), cianeto de dietilfosforil (DEPCN), dióxido de
2.5- difenil-2,3-diidro-3-oxo-4-hidróxi-tiofeno (reagente de Steglich; HOTDO), 1,1'-carbonil-diimidazol (CDI), e cloreto de 4-(4,6-dimetóxi-
1.3.5- triazin-2-il)-4-metilmorpriolínio (DMT-MM). Os reagentes de acoplamento podem ser empregados separados ou em combinação com aditivos tais como N. N-dimetil-4-aminopiridina (DMAP), N-hidróxibenzotriazol (HOBt), N-hidroxibenzotriazina (HOOBt), Nhidroxissuccinimida (HOSu) N-hidroxiazabenzotriazol (HOAt), sais de azabenzotriazolil-tetrametilurônio (HATU, HAPyU) ou 2-hidroxipiridina. Em certas modalidades, a síntese de uma biblioteca requer o uso de duas ou mais estratégias de ativação, para permitir o uso de um conjunto estruturalmente diferente de blocos de construção. Para cada bloco de construção, um versado na técnica pode determinar a estratégia de ativação apropriada.
[0092] O grupo de proteção N-terminal pode ser qualquer grupo de proteção que seja compatível com as condições do processo, por exemplo, os grupos de proteção que são adequados para condições de síntese em fase de solução. Um grupo de proteção preferido é o grupo fluorenilmetoxicarbonil (Fmoc). Qualquer grupo funcional potencialmente reativo sobre o filamento lateral do bloco de construção de aminoacila também pode precisar ser adequadamente protegido. De preferência, o grupo de proteção de filamento lateral é ortogonal ao
Petição 870190086182, de 02/09/2019, pág. 54/160
37/141 grupo de proteção N-terminal, ou seja, o grupo de proteção de filamento lateral é removido sob condições que são diferentes daquelas requeridas para remoção do grupo de proteção N-terminal. Os grupos de proteção de filamento lateral adequados incluem o grupo nitroveratril, que pode ser adequado para proteger tanto os grupos carboxila de filamento lateral como os grupos amino de filamento lateral. Outro grupo de proteção amina de filamento lateral adequado é o grupo N-pent-4enoíla.
[0093] Os blocos de construção podem ser modificados após a incorporação na porção funcional, por exemplo, através de uma reação adequada que envolve um grupo funcional sobre um ou mais blocos de construção. A modificação do bloco de construção pode ocorrer após a adição do bloco de construção final ou em qualquer ponto intermediário na síntese da porção funcional, por exemplo, após qualquer ciclo do processo sintético. Quando uma biblioteca de moléculas bifuncionais da invenção for sintetizada, a modificação do bloco de construção pode ser realizada sobre toda a biblioteca ou sobre uma parte da biblioteca, aumentando desta forma o grau de complexidade da biblioteca. As reações modificadoras de bloco de construção adequadas incluem aquelas reações que podem ser realizadas sob condições compatíveis com a porção funcional e o oligonucleotídeo de codificação. Exemplos de tais reações incluem acilação e sulfonação de grupos amino ou grupos hidroxila, alquilação de grupos amino, esterificação ou tioesterificação de grupos carboxila, amidação de grupos carboxila, epoxidação de alcenos, e outras reações como conhecido na técnica. Quando a porção funcional incluir um bloco de construção que possui um grupo funcional alcino ou azido, a reação de cicloadição de azido/alcino pode ser usada para derivatizar o bloco de construção. Por exemplo, um bloco de construção que inclui um alcino pode ser reagido com um azido orgânico, ou um bloco de construção que inclui um azido
Petição 870190086182, de 02/09/2019, pág. 55/160
38/141 pode ser reagido com um alcino, em cada caso formando um triazol. As reações de modificação de bloco de construção podem ocorrer após a adição do bloco de construção final ou em um ponto intermediário no processo sintético, e podem ser usadas para acrescentar uma variedade de estruturas químicas à porção funcional, inclusive carboidratos, porções de ligação de metal e estruturas para marcar certos tipos de biomoléculas ou de tecido.
[0094] Em outra modalidade, a porção funcional compreende uma série linear de blocos de construção e esta série linear é ciclizada utilizando uma reação adequada. Por exemplo, se pelo menos dois blocos de construção no arranjo linear incluírem grupos sulfidrila, os grupos sulfidrila podem ser oxidados para formar uma ligação de bissulfeto, desta forma ciclizando o arranjo linear. Por exemplo, as porções funcionais podem ser oligopeptídeos que incluem duas ou mais porções de L ou D-cisteína e/ou L ou D-homocisteína. Os blocos de construção também podem incluir outros grupos funcionais capazes de reagir um com o outro para ciclizar o arranjo linear, tais como grupos carboxila e grupos amino ou hidroxila.
[0095] Em uma modalidade preferida, um dos blocos de construção no arranjo linear compreende um grupo alcino e outro bloco de construção no arranjo linear compreende um grupo azido. Os grupos azido e alcino podem ser induzidos para reagir através de cicloadição, resultando na formação de uma estrutura macrocíclica. No exemplo ilustrado na Figura 9, a porção funcional é um polipeptídeo que compreende um bloco de construção de propargilglicina em sua terminação C e um grupo azidoacetila em sua terminação N. A reação do grupo alcino e azido sob condições adequadas resulta na formação de um composto cíclico, que inclui uma estrutura triazol dentro do macrociclo. No caso de uma biblioteca, em uma modalidade, cada elemento da biblioteca compreende blocos de construção dotados de
Petição 870190086182, de 02/09/2019, pág. 56/160
39/141 alcino e azido e podem ser ciclizados desta maneira. Em uma segunda modalidade, todos os elementos da biblioteca compreendem blocos de construção dotados de alcino e azido, porém apenas uma parte da biblioteca é ciclizada. Em uma terceira modalidade, apenas certas porções funcionais incluem blocos de construção dotados de alcino e azido, e apenas estas moléculas são ciclizadas. Nas segunda e terceira modalidades anteriores, a biblioteca, após a reação de cicloadição, irá incluir tanto porções funcionais cíclicas como lineares.
[0096] Em algumas modalidades da invenção onde a mesma porção funcional, por exemplo, triazina, é adicionada a cada e todas as frações da biblioteca durante uma etapa de síntese particular, pode não ser necessário adicionar um marcador de oligonucleotídeo que codifica aquela porção funcional.
[0097] Os oligonucleotídeos podem ser ligados por métodos químicos ou enzimáticos. Em uma modalidade, os oligonucleotídeos são ligados por meio químico. A ligação química de DNA e RNA pode ser realizada utilizando reagentes tais como carbodiimida solúvel em água e brometo de cianogênio como ensinado, por exemplo, por Shabarova, et al. (1991) Nucleic Acids Research, 19, 4247-4251), Federova, et al. (1996) Nucleosides and Nucleotides, 15, 1137-1147, and Carriero and Damlia (2003) Journal of Organic Chemistry, 68, 83288338. Em uma modalidade, a ligação química é realizada utilizando brometo de cianogênio, 5 M em acetonitrila, em uma proporção 1:10 v/v com 5' oligonucleotídeo fosforilado em um pH 7,6 tampão (1 M MES + 20 mM de MgCl2) a 0 graus durante 1 a 5 minutos. Em outra modalidade, os oligonucleotídeos são ligados utilizando métodos enzimáticos. Em cada modalidade, os oligonucleotídeos podem ser de fita dupla, de preferência, com um ressalto de cerca de 5 a cerca de 14 bases. O oligonucleotídeo também pode ser de fita simples, em tal caso um imobilizador com uma sobreposição de cerca de 6 bases com cada
Petição 870190086182, de 02/09/2019, pág. 57/160
40/141 oligonucleotídeos ligado é empregado para posicionar as porções reativas 5' e 3' em proximidade uma com a outra.
[0098] Em uma modalidade, o bloco de construção inicial é ligado de forma operativa a um oligonucleotídeo inicial. Antes ou após o acoplamento de um segundo bloco de construção ao bloco de construção inicial, uma segunda sequência de oligonucleotídeo que identifica o segundo bloco de construção é ligada ao oligonucleotídeo inicial. Os métodos para ligar a sequência de oligonucleotídeo inicial e a sequência de oligonucleotídeo de entrada estão estabelecidos nas Figuras 1 e 2. Na Figura 1, o oligonucleotídeo inicial é de fita dupla, e a fita inclui uma sequência de ressalto que é complementar a uma extremidade do segundo oligonucleotídeo e coloca o segundo oligonucleotídeo em contato com os oligonucleotídeo iniciais. De preferência, a sequência ressaltante do oligonucleotídeo inicial e a sequência complementar do segundo oligonucleotídeo possuem pelo menos cerca de 4 bases; mais preferivelmente ambas as sequências possuem o mesmo comprimento. O oligonucleotídeo inicial e o segundo oligonucleotídeo podem ser ligados utilizando uma enzima adequada. Se o oligonucleotídeo inicial for ligado ao primeiro bloco de construção na extremidade 5' de uma das fitas (a fita superior), então a fita que é complementar à fita superior (a fita inferior) irá incluir a sequência de ressalto em sua extremidade 5', e o segundo oligonucleotídeo irá incluir uma sequência complementar em sua extremidade 5'. Após a ligação do segundo oligonucleotídeo, a fita pode ser adicionada que é complementar à sequência do segundo oligonucleotídeo que é 3' à sequência complementar de ressalto, e que inclui sequência de ressalto adicional.
[0099] Em uma modalidade, o oligonucleotídeo é alongado como estabelecido na Figura 2. O oligonucleotídeo ligado à porção funcional em crescimento e o oligonucleotídeo de entrada são posicionados para
Petição 870190086182, de 02/09/2019, pág. 58/160
41/141 ligação através do uso de uma sequência de imobilizador, que inclui uma região que é complementar à extremidade 3' do oligonucleotídeo inicial e uma região que é complementar à extremidade 5' do oligonucleotídeo de entrada. O imobilizador coloca a extremidade 5' do oligonucleotídeo em proximidade com a extremidade 3' do oligo de entrada e a ligação é realizada utilizando ligação enzimática. No exemplo ilustrado na Figura 2, o oligonucleotídeo inicial consiste em 16 nucleobases e o imobilizador é complementar às 6 bases na extremidade 3'. O oligonucleotídeo de entrada consiste em 12 nucleobases, e o imobilizador é complementar às 6 bases na terminação 5'. O comprimento do imobilizador e os comprimentos das regiões complementares não são importantes. Entretanto, as regiões complementares devem ser suficientemente extensas para permitir a formação de dímero estável sob as condições da ligação, porém não tão extensas para produzir um nucleotídeo de codificação excessivamente extenso nas moléculas finais. Prefere-se que as regiões complementares possuam de cerca de 4 bases a cerca de 12 bases, mais preferivelmente, de cerca de 5 bases a cerca de 10 bases, e mais preferivelmente, de cerca de 5 bases a cerca de 8 bases de comprimento.
[00100] Os métodos de divisão e agrupamento usados para os métodos para síntese de biblioteca estão estabelecidos aqui asseguram que cada porção funcional única seja ligada de forma operativa a pelo menos uma sequência de oligonucleotídeo única que identifica a porção funcional. Se 2 ou mais marcadores de oligonucleotídeo diferentes forem usados por pelo menos um bloco de construção em pelo menos um dos ciclos sintéticos, cada porção funcional distinta que compreende aquele bloco de construção será codificada por múltiplos oligonucleotídeos. Por exemplo, se 2 marcadores de oligonucleotídeo forem usados por cada bloco de construção durante a síntese de uma
Petição 870190086182, de 02/09/2019, pág. 59/160
42/141 biblioteca de 4 ciclos, haverá 16 sequências de DNA (24) que codificam cada porção funcional única. Há diversas vantagens potenciais para codificar cada porção funcional única com múltiplas sequências. Primeiro, a seleção de uma combinação diferente de sequências de marcador que codificam a mesma porção funcional assegura que aquelas moléculas foram independentemente selecionadas. Segundo, a seleção de uma combinação diferente de sequências de marcador que codificam a mesma porção funcional elimina a possibilidade que a seleção se baseou na sequência do oligonucleotídeo. Terceiro, o artefato técnico pode ser reconhecido se a análise de sequência sugerir que uma porção funcional particular for altamente enriquecida, porém surge apenas uma combinação de sequência dentre diversas possibilidades. Múltiplas marcações podem ser realizadas com reações de divisão independentes com o mesmo bloco de construção, porém um marcador de oligonucleotídeo diferente. Alternativamente, múltiplas marcações podem ser realizadas ao misturar uma proporção apropriada de cada marcador em uma única reação de marcação com um bloco de construção individual.
[00101] Em uma modalidade, o oligonucleotídeo inicial possui fita dupla e as duas fitas são covalentemente unidas. Um meio para unir covalentemente as duas fitas é mostrado na Figura 3, onde uma porção de ligação, por exemplo, um ligante, é usada para ligar as duas fitas e a porção funcional. A porção de ligação pode ser qualquer estrutura química que compreende um primeiro grupo funcional que é adaptado para reagir com um bloco de construção, um segundo grupo funcional que é adaptado para reagir com a extremidade 3' de um oligonucleotídeo, e um terceiro grupo funcional que é adaptado para reagir com a extremidade 5' de um oligonucleotídeo. De preferência, os segundo e terceiro grupos funcionais são orientados para posicionar as duas fitas de oligonucleotídeo em uma orientação relativa que permite
Petição 870190086182, de 02/09/2019, pág. 60/160
43/141 a hibridização das duas fitas. Por exemplo, a porção de ligação, por exemplo, o ligante, pode possuir a estrutura geral (I):
B (i) onde A, é um grupo funcional que pode formar uma ligação covalente com um bloco de construção, B é um grupo funcional que pode formar uma ligação com a extremidade 5' de um oligonucleotídeo, e C é um grupo funcional que pode formar uma ligação com a extremidade 3' de um oligonucleotídeo. D5 F e E são grupo químicos que ligam grupos funcionais A, C e B a S, que é um átomo de núcleo ou suporte provisório. De preferência, cada D, E e F é independentemente um filamento de átomos, tal como um filamento de alquileno ou um filamento oligo(etileno glicol), e D, E e F podem ser iguais ou diferentes, e são de preferência, eficazes para permitir a hibridização dos dois oligonucleotídeos e a síntese da porção funcional. Em uma modalidade, a porção de ligação trivalente é um ligante que possui a estrutura —HN
O
O
O=P-O i
O[00102] Nesta modalidade, o grupo NH está disponível para ligação a um bloco de construção, enquanto os grupos fosfato terminal estão disponíveis para ligação a um oligonucleotídeo.
[00103] Em modalidades onde o oligonucleotídeo inicial possui fita
Petição 870190086182, de 02/09/2019, pág. 61/160
44/141 dupla, os oligonucleotídeos de entrada também possuem fita dupla. Como mostrado na Figura 3, o oligonucleotídeo inicial pode possui uma fita que é mais longa do que a outra, proporcionando uma sequência de ressalto. Nesta modalidade, o oligonucleotídeo de entrada inclui, uma sequência de ressalto que é complementar à sequência de ressalto do oligonucleotídeo inicial. A hibridização das duas sequências complementares coloca o oligonucleotídeo de entrada na posição para ligação ao oligonucleotídeo inicial. Esta ligação pode ser realizada de forma enzimática utilizando uma DNA ou RNA ligase. As sequências de ressalto do oligonucleotídeo de entrada e do oligonucleotídeo inicial possuem, de preferência, o mesmo comprimento e consistem em dois ou mais nucleotídeos, de preferência, de 2 a cerca de 10 nucleotídeos, mais preferivelmente de 2 a cerca de 6 nucleotídeos. Em uma modalidade preferida, o oligonucleotídeo de entrada é um oligonucleotídeo de fita dupla que possui uma sequência de ressalto em cada extremidade. A sequência de ressalto em uma extremidade é complementar à sequência de ressalto do oligonucleotídeo inicial, enquanto, após a ligação do oligonucleotídeo de entrada e do oligonucleotídeo inicial, a sequência de ressalto na outra extremidade se torna a sequência de ressalto de oligonucleotídeo inicial do próximo ciclo. Em uma modalidade, todas as três sequências de ressalto possuem 2 a 6 nucleotídeos de comprimento, e a sequência de codificação do oligonucleotídeo de entrada possui de 3 a 10 nucleotídeos de comprimento, de preferência, 3 a 6 nucleotídeos de comprimento. Em uma modalidade particular, todas as sequências de ressalto possuem 2 nucleotídeos de comprimento e a sequência de codificação possui 5 nucleotídeos de comprimento.
[00104] Na modalidade ilustrada na Figura 4, a fita de entrada possui uma região em sua extremidade 3' que é complementar à extremidade 3' do oligonucleotídeo inicial, deixando os ressaltos nas extremidades 5'
Petição 870190086182, de 02/09/2019, pág. 62/160
45/141 de ambas as fitas. As extremidades 5' podem ser preenchidas utilizando, por exemplo, uma DNA polimerase, tal como polimerase de saída, resultando em um oligonucleotídeo alongado de fita dupla. A fita inferior deste oligonucleotídeo pode ser removida, e a sequência adicional adicionada à extremidade 3' da fita superior utilizando o mesmo método.
[00105] O marcador de oligonucleotídeo de codificação é formado como o resultado da adição sucessiva de oligonucleotídeos que identifica cada bloco de construção sucessivo. Em uma modalidade dos métodos da invenção, os marcadores de oligonucleotídeo sucessivos podem ser acoplados por ligação enzimática para produzir um oligonucleotídeo de codificação.
[00106] A ligação catalisada por enzima de oligonucleotídeos pode ser realizada utilizando qualquer enzima que possui a capacidade de ligar fragmentos de ácido nucléico. As enzimas exemplificativas incluem ligases, polimerases, e topoisomerases. Em modalidades específicas da invenção, a DNA ligase (EC 6.5.1.1), DNA polimerase (EC 2.7.7.7), RNA polimerase (EC 2.7.7.6) ou topoisomerase (EC 5.99.1.2) são usadas para ligar os oligonucleotídeos. As enzimas contidas em cada classe EC podem ser encontradas, por exemplo, como descrito em Bairoch (2000) Nucleic Acids Research 28:304-5.
[00107] Em uma modalidade preferida, os oligonucleotídeos usados nos métodos da invenção são oligodesoxinucleotídeos e a enzima usada para catalisar a ligação de oligonucleotídeo é DNA ligase. Para a ligação ocorrer na presença da ligase, ou seja, para que uma ligação de fosfodiéster seja formada entre dois oligonucleotídeos, um oligonucleotídeo deve possuir um grupo fosfato 5' livre e o outro oligonucleotídeo deve possuir um grupo hidroxila 3' livre. As DNA ligases exemplificativas que podem ser usadas nos métodos da invenção incluem T4 DNA ligase, Taq DNA ligase, T4 RNA ligase, DNA
Petição 870190086182, de 02/09/2019, pág. 63/160
46/141 ligase (E. coli) (todas disponíveis, por exemplo, junto a New England Biolabs, MA).
[00108] Um versado na técnica irá entender que cada enzima usada para ligação possui atividade ótima sob condições específicas, por exemplo, temperatura, concentração de tampão, pH e tempo. Cada uma destas condições pode ser ajustada, por exemplo, de acordo com as instruções do fabricante, para obter ligação ótima dos marcadores de oligonucleotídeo.
[00109] O oligonucleotídeo de entrada pode possui qualquer comprimento desejado, porém possui, de preferência, pelo menos três nucleobases de comprimento. Mais preferivelmente, o oligonucleotídeo de entrada possui 4 ou mais nucleobases de comprimento. Em uma modalidade, o oligonucleotídeo de entrada possui cerca de 3 a cerca de 12 nucleobases de comprimento. Prefere-se que os oligonucleotídeos das moléculas nas bibliotecas da invenção possuam uma sequência terminal comum que pode servir como um iniciador para PCR, como conhecido na técnica. Tal sequência terminal comum pode ser incorporada como a extremidade terminal do oligonucleotídeo de entrada adicionado no ciclo final da síntese de biblioteca, por exemplo, utilizando os métodos de ligação enzimática descritos aqui.
[00110] Uma modalidade preferida do método da invenção está estabelecida na Figura 5. O processo começa com uma sequência de DNA sintetizada que é ligada em sua extremidade 5' a um ligante que termina em um grupo amino. Na etapa 1, esta sequência de DNA de partida está ligada a uma sequência de DNA de entrada na presença de uma fita imobilizadora de DNA, DNA ligase e ditiotreitol em tampão Tris. Isto produz uma sequência de DNA marcada que pode ser então diretamente usada na próxima etapa ou purificada, por exemplo, utilizando HPLC ou precipitação com etanol, antes de proceder para a próxima etapa. Na etapa 2 o DNA marcado é reagido com um
Petição 870190086182, de 02/09/2019, pág. 64/160
47/141 aminoácido ativado protegido, neste exemplo, um fluoreto de aminoácido protegido por Fmoc, produzindo um conjugado de aminoácido-DNA protegido. Na etapa 3, o conjugado de aminoácidoDNA protegido está desprotegido, por exemplo, na presença de piperidina, e o conjugado desprotegido resultante é, opcionalmente, purificado, por exemplo, por HPLC ou precipitação com etanol. O conjugado desprotegido é o produto do primeiro ciclo de síntese, e se torna o material de partida do segundo ciclo, que adiciona um segundo resíduo de aminoácido ao grupo amino livre do conjugado desprotegido. [00111] Em modalidades onde PCR deve ser usada para amplificar e/ou sequenciar os oligonucleotídeos de codificação de moléculas selecionadas, os oligonucleotídeos de codificação podem incluir, por exemplo, sequências de iniciador de PCR e/ou iniciadores de sequenciamento (por exemplo, iniciadores tais como, por exemplo, 3'GACTACCGCGCTCCCTCCG-3' e 3'-GACTCGCCCGACCGTTCCG5'). Uma sequência de iniciador de PCR pode ser incluída, por exemplo, no oligonucleotídeo inicial antes do primeiro ciclo de síntese, e/ou esta pode ser incluída com o primeiro oligonucleotídeo de entrada, e/ou pode ser ligada ao oligonucleotídeo de codificação após o ciclo final de síntese de biblioteca, e/ou pode ser incluída no oligonucleotídeo de entrada do ciclo final. As sequências de iniciador de PCR adicionadas após o ciclo final de síntese de biblioteca e/ou no oligonucleotídeo de entrada do ciclo final são referidas aqui como sequências de terminação.
[00112] Em uma modalidade, a sequência de iniciador de PCR é designada no marcador de oligonucleotídeo de codificação. Por exemplo, uma sequência de iniciador de PCR pode ser incorporada no marcador de oligonucleotídeo inicial e/ou pode ser incorporada no marcador de oligonucleotídeo final. Em uma modalidade a mesma sequência de iniciador de PCR é incorporada no marcador de
Petição 870190086182, de 02/09/2019, pág. 65/160
48/141 oligonucleotídeo inicial e final. Em outra modalidade, uma primeira sequência de iniciador de PCR é incorporada no marcador de oligonucleotídeo inicial e uma segunda sequência de iniciador de PCR é incorporada no marcador de oligonucleotídeo final. Alternativamente, a segunda sequência de iniciador de PCR pode ser incorporada na sequência de terminação como descrito aqui. Em modalidades preferidas, a sequência de iniciador de PCR possui pelo menos cerca de 5, 7, 10, 13, 15, 17, 20, 22, ou 25 nucleotídeos de comprimento. [00113] As sequências de iniciador de PCR adequadas para uso nas bibliotecas da invenção são conhecidas na técnica; os iniciadores e métodos adequados estão estabelecidos, por exemplo, em Innis, et ah, eds., PCR Protocols: A Guide to Methods and Applications, San Diego: Academic Press (1990), cujos conteúdos estão incorporados aqui à guisa de referência em sua totalidade. Outros iniciadores adequados para uso na construção das bibliotecas descritas aqui são aqueles iniciadores descritos em Publicações PCT Publications WO 2004/069849 e WO 2005/003375, cujos conteúdos estão expressamente incorporados aqui à guisa de referência.
[00114] O termo polinucleotídeo como usado aqui em referência a iniciadores, sondas e fragmentos ou segmentos de ácido nucléico que serão sintetizados por extensão de iniciador é definido como uma molécula compreendida de dois ou mais desoxirribonucleotídeos, de preferência, mais de três.
[00115] O termo iniciador como usado aqui se refere a um polinucleotídeo se purificado a partir de uma digestão por enzima de restrição de ácido nucléico ou produzido de forma sintética, que é capaz de atuar como um ponto de iniciação de síntese de ácido nucléico quando colocado sob condições onde a síntese de um produto de extensão de iniciador que é complementar a um fita de ácido nucléico é induzida, ou seja, na presença de nucleotídeos e um agente para
Petição 870190086182, de 02/09/2019, pág. 66/160
49/141 polimerização tal como DNA polimerase, transcriptase reversa e similares, e em uma temperatura e pH adequados. O iniciador possui, de preferência, fita simples para eficiência máxima, porém pode estar, alternativamente, em forma de fita dupla. Se possuir fita dupla, o iniciador primeiro é tratado para separar este de sua fita complementar antes de ser usado para preparar produtos de extensão. De preferência, o iniciador é um polidesoxirribonucleotídeo. O iniciador deve ser suficientemente comprido para iniciar a síntese de produtos de extensão na presença dos agentes para polimerização. Os comprimentos exatos dos iniciadores irão depender de muitos fatores, inclusive temperatura e a fonte de iniciador.
[00116] Os iniciadores usados aqui são selecionados para serem substancialmente complementares às fitas diferentes de cada sequência específica que será amplificada. Isto significa que o iniciador deve ser suficientemente complementar para se hibridizar de forma nãoaleatória com sua respectiva fita modelo. Portanto, a sequência de iniciador pode ou não refletir a sequência exata do modelo.
[00117] Os iniciadores de polinucleotídeo podem ser preparados utilizando qualquer método adequado, tal como, por exemplo, os métodos de fosfotriéster ou fosfodiéster descritos em Narang et al, (1979) Meth. Enzymol, 68:90; Patente n° U.S. 4.356.270, Patente n° U.S. 4.458.066, Patente n° U.S. 4.416.988, Patente n° U.S. 4.293.652; e Brown et al., (1979) Meth. Enzymol, 68:109. Os conteúdos de todos os documentos anteriores estão incorporados aqui à guisa de referência.
[00118] Em casos onde as sequências de iniciador de PCR estão incluídas em um oligonucleotídeo de entrada, estes oligonucleotídeos de entrada serão, de preferência, mais longos do que os oligonucleotídeos de entrada adicionados nos outros ciclos, pois estes irão incluir tanto uma sequência de codificação como uma sequência de
Petição 870190086182, de 02/09/2019, pág. 67/160
50/141 iniciador de PCR. Em uma modalidade, a sequência de terminação é adicionada após a adição do bloco de construção final e do oligonucleotídeo de entrada final, e a síntese de uma biblioteca como estabelecido aqui inclui a etapa de ligar a sequência de terminação ao oligonucleotídeo de codificação, de modo que a parte de oligonucleotídeo substancialmente de todos os elementos de biblioteca termine em uma sequência que inclui uma sequência de iniciador de PCR. De preferência, a sequência de terminação é adicionada por ligação às frações agrupadas que são produtos do ciclo sintético final. A sequência de terminação pode ser adicionada utilizando o processo enzimático usado na construção da biblioteca.
[00119] Em uma modalidade, a mesma sequência de terminação é ligada a cada elemento da biblioteca. Em outra modalidade, uma pluralidade de sequências de terminação é usada. Nesta modalidade, as sequências terminação de oligonucleotídeo que contêm bases variáveis estão, por exemplo, ligadas sobre elementos de biblioteca após o ciclo sintético final. Em uma modalidade, após o ciclo sintético final, as frações são agrupadas e então divididas e então divididas em frações novamente, com cada fração dotada de uma sequência de terminação diferente adicionada. Alternativamente, múltiplas sequências de terminação podem ser adicionadas à biblioteca agrupada após o ciclo de síntese final. Em ambas as modalidades, os elementos de biblioteca finais irão incluir moléculas que compreendem porções funcionais ligadas para identificar oligonucleotídeos que incluem duas ou mais sequências de terminação diferentes.
[00120] Em uma modalidade, o iniciador de terminação compreende uma sequência de oligonucleotídeo que contém nucleotídeos variáveis, ou seja, degenerados. Tais bases degeneradas dentro dos iniciadores de terminação permitem a identificação de moléculas de biblioteca de interesse ao determinar se uma combinação de blocos de construção é
Petição 870190086182, de 02/09/2019, pág. 68/160
51/141 a consequência de duplicação de PCR (sequência idêntica) ou ocorrências independentes da molécula (sequência diferente). Por exemplo, tais bases degeneradas reduzem o número potencial de falsos positivos identificados durante a triagem biológica da biblioteca codificada.
[00121] Em uma modalidade, um iniciador de terminação degenerado compreende ou possui a seguinte sequência:
5'-CAGCGTTCGA-3'
3'-AA GTCGCAAGCT NNNNN GTCTGTTCGAAGTGGACG5'
Sobreposiçã o para ligação sobre biblioteca
Região constante para extensão de iniciador
Seqüência degenerada
Região constante para amplificação onde N pode ser qualquer uma das 4 bases, permitindo 1024 sequências diferentes (45). O iniciador possui a seguinte sequência após sua ligação sobre a biblioteca e extensão de iniciador:
5'-CAGCGTTCGA N'N'N'N'N'CAGACAAGCTTCACCTGC-3'
3'-AA GTCGCAAGCT NN N NN
GTCTGTTCGAAGTGGACG-5' [00122] Em outra modalidade, o iniciador de terminação compreende ou possui a seguinte sequência:
3'-AA GTCGCAAGCTACGABBBABBBABBBA
GACTACCGCGCTCCCTCCG
Sobreposiçã o para ligação sobre biblioteca
Região constante para extensão de iniciador
Seqüência degenerada
Região constante para amplificação
Petição 870190086182, de 02/09/2019, pág. 69/160
52/141 onde B pode ser qualquer um entre C, G ou T, que permite 19.683 sequências diferentes (39). O desenho da região degenerada neste iniciador aperfeiçoa a análise de sequência de DNA, à medida que as bases A que flanqueiam e pontuam as bases B degeneradas impedem estiramentos homopoliméricos de mais de 3 bases, e facilitam o alinhamento de sequência.
[00123] Em uma modalidade, o oligonucleotídeo de terminação degenerado é ligado aos elementos da biblioteca utilizando uma enzima adequada e a fita superior do oligonucleotídeo de terminação degenerado é subsequentemente polimerizado utilizando uma enzima adequada, tal como uma DNA polimerase.
[00124] Em outra modalidade, a sequência de iniciação de PCR é um adaptador universal ou um iniciador universal. Como usado aqui, um adaptador universal ou iniciador universal é um oligonucleotídeo que contém uma única região de iniciação de PCR, ou seja, por exemplo, cerca de 5, 7, 10, 13, 15, 17, 20, 22, ou 25 nucleotídeos de comprimento, e fica localizado adjacente a uma única região de iniciação de sequenciamento, ou seja, por exemplo, cerca de 5, 7, 10, 13, 15, 17, 20, 22, ou 25 nucleotídeos de comprimento, e é opcionalmente seguido por uma única sequência-chave discriminante (ou sequência identificadora de amostra) que consiste em pelo menos um de cada um dos quatro desoxirribonucleotídeos {ou seja, A, C, G, T).
[00125] Como usado aqui, o termo sequência-chave discriminante ou sequência identificadora de amostra se refere a uma sequência que pode ser usada para marcar exclusivamente uma população de moléculas de uma amostra. Múltiplas amostras, sendo que cada uma contém uma única sequência identificadora de amostra, podem ser misturadas, sequenciadas e re-armazenadas após o sequenciamento de DNA para análise de amostras individuais. A mesma sequência discriminante pode ser usada por uma biblioteca inteira ou,
Petição 870190086182, de 02/09/2019, pág. 70/160
53/141 alternativamente, sequências chave discriminantes diferentes podem ser usadas para rastrear bibliotecas diferentes. Em uma modalidade, a sequência-chave discriminante está tanto no iniciador 5' de PCR, iniciador 3' de PCR, como em ambos os iniciadores. Se ambos os iniciadores de PCR contiverem uma sequência identificadora de amostra, o número de amostras diferentes que podem ser agrupadas com sequências identificadoras de amostra exclusivas é o produto do número de sequências identificadoras de amostra sobre cada iniciador. Desta maneira, 10 5' iniciadores de sequência identificadora de amostra diferentes podem ser combinados com 10 3' iniciadores de sequência identificadora de amostra diferentes para produzir 100 combinações de sequência identificadora de amostra diferentes.
[00126] Exemplos sem caráter limitativo de 5' e 3' iniciadores de PCR exclusivos que contêm sequências chave discriminantes incluem os seguintes:
[00127] 5' iniciadores (posições variáveis em negrito e em itálico):
5' A GCCTTGCCAGCCCGCTCAGATGACTCCCAAATCGATGTG;
5' C GCCTTGCCAGCCCGCTCAGCTGACTCCCAAATCGATGTG;
5' G GCCTTGCCAGCCCGCTCAGGTGACTCCCAAATCGATGTG;
5' T GCCTTGCCAGCCCGCTCAGTTGACTCCCAAATCGATGTG;
5' AA GCCTTGCCAGCCCGCTCAGAATGACTCCCAAATCGATGTG;
5' AC GCCTTGCCAGCCCGCTCAGACTGACTCCCAAATCGATGTG;
5' AG GCCTTGCCAGCCCGCTCAGAGTGACTCCCAAATCGATGTG;
Petição 870190086182, de 02/09/2019, pág. 71/160
54/141
5' AT GCCTTGCCAGCCCGCTCAGATTGACTCCCAAATCGATGTG; and
5' CA GCCTTGCCAGCCCGCTCAGCATGACTCCCAAATCGATGTG. [00128] 3' SID iniciadores (posições variáveis em negrito e em itálico):
3' A GCCTCCCTCGCGCCATCAGAGCAGGTGAAGCTTGTCTG;
3' C GCCTCCCTCGCGCCATCAGCGCAGGTGAAGCTTGTCTG;
3' G GCCTCCCTCGCGCCATCAGGGCAGGTGAAGCTTGTCTG;
3' T GCCTCCCTCGCGCCATCAGTGCAGGTGAAGCTTGTCTG;
3' AA GCCTCCCTCGCGCCATCAGAAGCAGGTGAAGCTTGTCTG;
3' AC GCCTCCCTCGCGCCATCAGACGCAGGTGAAGCTTGTCTG;
3' AG GCCTCCCTCGCGCCATCAGAGGCAGGTGAAGCTTGTCTG;
3' AT GCCTCCCTCGCGCCATCAGATGCAGGTGAAGCTTGTCTG; e
3' CA GCCTCCCTCGCGCCATCAGCAGCAGGTGAAGCTTGTCTG [00129] Em uma modalidade, a sequência-chave discriminante possui cerca de 4, 5, 6, 7, 8, 9, ou 10 nucleotídeos de comprimento. Em outra modalidade, a sequência-chave discriminante é uma combinação de cerca de 1 a 4 nucleotídeos. Ainda em outra modalidade, cada adaptador universal possui cerca de quarenta e quatro nucleotídeos de comprimento. Em uma modalidade, os adaptadores universais são
Petição 870190086182, de 02/09/2019, pág. 72/160
55/141 ligados, utilizando T4 DNA ligase, sobre a extremidade dos oligonucleotídeo de codificação. Os adaptadores universais diferentes podem ser especificamente designados para cada preparação de biblioteca e irão, portanto, proporcionar um único identificador para cada biblioteca. O tamanho e sequência dos adaptadores universais podem ser modificados conforme considerado necessário por um versado na técnica.
[00130] Conforme indicado acima, a sequência de nucleotídeo do marcador de oligonucleotídeo como parte dos métodos desta invenção pode ser determinada através do uso da reação em cadeia da polimerase (PCR).
[00131] O marcador de oligonucleotídeo é compreendido de polinucleotídeos que identificam os blocos de construção que constituem a porção funcional como descrito aqui. A sequência de ácido nucléico do marcador de oligonucleotídeo é determinada ao submeter o marcador de oligonucleotídeo a uma reação de PCR como se segue. A amostra apropriada está conectada com um par de iniciadores de PCR, sendo que cada elemento do par possui uma sequência de nucleotídeo pré-selecionada. O par de iniciadores de PCR é capaz de iniciar reações de extensão de iniciador ao se hibridizar em um sítio de ligação de iniciador de PCR sobre o marcador de oligonucleotídeo de codificação. O sítio de ligação de iniciador de PCR é, de preferência, definido no marcador de oligonucleotídeo de codificação. Por exemplo, um sítio de ligação de iniciador de PCR pode ser incorporado no marcador de oligonucleotídeo inicial e o segundo sítio de ligação de iniciador de PCR pode estar no marcador de oligonucleotídeo final. Alternativamente, o segundo sítio de ligação de iniciador de PCR pode ser incorporado na sequência de terminação como descrito aqui. Em modalidades preferidas, o sítio de ligação de iniciador de PCR possui pelo menos cerca de 5, 7, 10, 13, 15, 17, 20, 22, ou 25 nucleotídeos de comprimento.
Petição 870190086182, de 02/09/2019, pág. 73/160
56/141 [00132] A reação de PCR é realizada ao misturar o par de iniciadores de PCR, de preferência, uma quantidade predeterminada deste, com os ácidos nucléicos do marcador de oligonucleotídeo codificação, de preferência, uma quantidade predeterminada deste, em um tampão PCR para formar uma mistura de reação de PCR. A mistura é termociclada durante inúmeros ciclos, estes são tipicamente predeterminados, suficientes para a formação de um produto de reação de PCR. Uma quantidade suficiente de produto é uma que pode ser isolada em uma quantidade suficiente para permitir a determinação de sequência de DNA.
[00133] A PCR é tipicamente realizada por termociclagem, ou seja, aumentando e diminuindo repetidamente a temperatura de uma mistura de PCR dentro de uma faixa de temperatura cujo limite inferior é cerca de 30oC a cerca de 55oC e cujo limite superior é cerca de 90oC a cerca de 100oC. O aumento e redução pode ser contínuo, porém de preferência fásico com períodos de tempo de estabilidade de temperatura relativa em cada temperatura que favorece a síntese, desnaturação e hibridização de polinucleotídeo.
[00134] A reação de PCR é realizada utilizando qualquer método adequado. Geralmente esta ocorre em uma solução aquosa tamponada, ou seja, um tampão PCR, de preferência, em um pH de 7 a
9. De preferência, um excesso molar do iniciador está presente. Um grande excesso molar é preferido para aperfeiçoar a eficiência do processo.
[00135] O tampão PCR também contém os trifosfatos de desoxirribonucleotídeo (substratos de síntese de polinucleotídeo) dATP, dCTP, dGTP, e dTTP e uma polimerase, tipicamente termoestável, todos em quantidades adequadas para reação de extensão de iniciador (síntese de polinucleotídeo). A solução resultante (mistura de PCR) é aquecida a cerca de 90oC a 100oC durante cerca de 1 a 10 minutos, de
Petição 870190086182, de 02/09/2019, pág. 74/160
57/141 preferÊncia, de 1 a 4 minutos. Após este período de aquecimento a solução é permitida para se resfriar até 54oC, que é preferível para hibridização de iniciador. A reação de sínteses pode ocorrer em uma temperatura que varia de temperatura ambiente até uma temperatura acima da qual a polimerase (agente de indução) não funciona mais de forma eficiente. Desta maneira, por exemplo, se a DNA polimerase for usada, a temperatura é geralmente menor que cerca de 40oC. A termociclagem é repetida até a quantidade desejada de produto de PCR ser produzida. Um tampão PCR exemplificativo compreende os seguintes reagentes: 50 mM de KCl; 10 mM de Tris-HCl em pH 8,3; 1,5 mM de MgCl.sub.2 ; 0,001% (peso/vol) de gelatina, 200 μM de dATP; 200 μM de dTTP; 200 μM de dCTP; 200 μM de dGTP; e 2,5 unidades de (Taq) DNA polimerase I Thermus aquaticus por 100 microlitros de tampão.
[00136] As enzimas adequadas para alongar as sequências de iniciador incluem, por exemplo, DNA polimerase I de E. coli, Taq DNA polimerase, fragmento Klenow de DNA polimerase I de E. coli, T4 DNA polimerase, outras DNA polimerases disponíveis, transcriptase reversa, e outras enzimas, inclusive enzimas estáveis ao calor, que irão facilitar a combinação dos nucleotídeos de maneira apropriada para formar os produtos de extensão de iniciador que são complementares a cada fita de ácido nucléico. Geralmente, a síntese será iniciada na extremidade 3' de cada iniciador e procede na direção 5' ao longo da fita modelo, até a síntese terminar, produzindo moléculas de comprimentos diferentes. [00137] A fita de DNA recentemente sintetizada e sua fita complementar formam uma molécula de fita dupla que pode ser usado nas etapas seguintes do processo de análise.
[00138] Os métodos de amplificação por PCR estão descritos em detalhe na Patente Nos U.S. 4.683.192, 4.683.202, 4.800.159, e
4.965.188, e pelo menos em PCR Technology: Principles and
Petição 870190086182, de 02/09/2019, pág. 75/160
58/141
Applications for DNA Amplification, H. Erlich, ed., Stockton Press, New York (1989); e PCR Protocols: A Guide to Methods and Applications, Innis et al, eds., Academic Press, San Diego, Calif. (1990). Os conteúdos de todos os documentos anteriores estão incorporados aqui à guisa de referência.
[00139] Uma vez que o marcador de oligonucleotídeo de codificação foi amplificado, a sequência do marcador, e essencialmente a composição da molécula selecionada, podem ser determinadas utilizando análise de sequência de ácido nucléico, um procedimento bem-conhecido para determinar a sequência de sequências de nucleotídeo. A análise de sequência de ácido nucléico é abordada por uma combinação de (a) técnicas fisioquímicas, baseada na hibridização ou desnaturação de uma fita de sonda mais seu alvo complementar, e (b) reações enzimáticas com polimerases.
[00140] A invenção se refere adicionalmente aos compostos que podem ser produzidos utilizando os métodos da invenção e coleções de tais compostos, tanto como espécies isoladas como agrupadas para formar uma biblioteca de estruturas químicas. Os compostos da invenção incluem compostos da formula
onde X é uma porção funcional que compreende um ou mais blocos de construção, Z é um oligonucleotídeo ligado em sua terminação 3' a B e Y é um oligonucleotídeo que é ligado a C em sua terminação 5'. A é um grupo funcional que forma uma ligação covalente com X, B é um grupo funcional que forma uma ligação com a extremidade 3' de Z e C é um grupo funcional que forma uma ligação
Petição 870190086182, de 02/09/2019, pág. 76/160
59/141 com a extremidade 5' de Y. D, F e E são grupos químicos que ligam grupos funcionais A, C e B a S, que é um átomo de núcleo ou suporte provisório. De preferência, cada D, E e F é independentemente uma fita de átomos, tal como uma fita de alquileno ou um filamento de oligo(etileno glicol), e D, E e F podem ser iguais ou diferentes, e são, de preferência, eficazes para permitir a hibridização dos dois oligonucleotídeos e a síntese da porção funcional.
[00141] De preferência, Y e Z são substancialmente complementares e são orientados no composto para permitir o pareamento de base de Watson-Crick e formação de dúplex sob condições adequadas. Y e Z possuem o mesmo comprimento ou comprimentos diferentes. De preferência, Y e Z possuem o mesmo comprimento, ou um entre Y e Z possui de 1 a 10 bases a mais do que o outro. Em uma modalidade preferida, cada Y e Z possui 10 ou mais bases de comprimento e possuem regiões complementares ou mais pares de base. Mais preferivelmente, Y e Z são substancialmente complementares por todo seu comprimento, ou seja, estes não possuem mais de uma incompatibilidade por cada dez pares de base. Mais preferivelmente, Y e Z são complementares por todo seu comprimento, ou seja, exceto para qualquer região de ressalto sobre Y ou Z, as fitas se hibridizam através de pareamento de base de Watson-Crick sem incompatibilidades por todo seu comprimento.
[00142] S pode ser um único átomo ou um suporte molecular provisório. Por exemplo, S pode ser um átomo de carbono, um átomo de boro, um átomo de nitrogênio ou um átomo de fósforo, ou um suporte poliatômico provisório, tal como um grupo fosfato ou um grupo cíclico, tal como um grupo cicloalquila, cicloalquenila, heterocicloalquila, heterocicloalquenila, arila ou heteroarila. Em uma modalidade, o ligante é um grupo da estrutura
Petição 870190086182, de 02/09/2019, pág. 77/160
60/141
OP(O) 2O----(CH2CH2O)m---OPO 3---N-----(CH2)n
OP(O) 2O----(CH2CH2O)p---OPO3---onde cada n, m e p é, independentemente, um número inteiro de 1 a cerca de 20, de preferência de 2 a oito, e mais preferivelmente de 3 a
6. Em uma modalidade particular, o ligante possui a estrutura mostrada abaixo.
—HN
O
O=P-O
O
O[00143] Em uma modalidade, as bibliotecas da invenção incluem moléculas que consistem em uma porção funcional composta de blocos de construção, onde cada porção funcional é ligada de forma operativa a um oligonucleotídeo de codificação. A sequência de nucleotídeo do oligonucleotídeo de codificação é indicativa dos blocos de construção presentes na porção funcional, e em algumas modalidades, da conectividade ou disposição dos blocos de construção. A invenção proporciona a vantagem que a metodologia usada para construir a porção funcional e aquela usada para construir o marcador de oligonucleotídeo podem ser realizadas no mesmo meio de reação, de preferência, um meio aquoso, desta maneira simplificando o método de preparar a biblioteca comparado com métodos na técnica anterior. Em certas modalidades onde tanto as etapas de ligação de oligonucleotídeo como as etapas de adição de bloco de construção pode ser conduzida em meio aquoso, cada reação irá possuir um pH ótimo diferente. Nestas modalidades, a reação de adição de bloco de construção pode ser conduzida em um pH e temperatura adequados em um tampão aquoso adequado. O tampão pode ser então trocado por um tampão aquoso que proporciona um pH adequado para ligação de oligonucleotídeo. Em outra modalidade, a invenção proporciona compostos, e bibliotecas que
Petição 870190086182, de 02/09/2019, pág. 78/160
61/141 compreendem tais compostos, da Fórmula II
Z--L--A—X(Y)n onde X é um suporte molecular provisório, cada Y é independentemente, uma porção periférica, e n é um número inteiro de 1 a 6. Cada A é independentemente, um bloco de construção e n é um número inteiro de 0 a cerca de 5. L é uma porção de ligação e Z é um oligonucleotídeo de fita simples ou fita dupla que identifica a estrutura - At-X(Y)n. A estrutura X(Y)n pode ser, por exemplo, uma das estruturas de suporte provisório estabelecidas na Tabela 8 (veja abaixo). Em uma modalidade, a invenção proporciona compostos, e bibliotecas que compreendem tais compostos, da Fórmula III:
onde t é um número inteiro de 0 a cerca de 5, de preferência de 0 a 3, e cada A é, independentemente, um bloco de construção. L é uma porção de ligação e Z é um oligonucleotídeo de fita simples ou de fita dupla que identifica cada A e R1, R2, R3 e R4. Cada R1, R2, R3 e R4 é independentemente um substituinte selecionado entre hidrogênio, alquila, alquila substituída, heteroalquila, heteroalquila substituída, cicloalquila, heterocicloalquila, cicloalquila substituída, heterocicloalquila substituída, arila, arila substituída, arilalquila, heteroarilalquila, arilalquila substituída, heteroarilalquila substituída, heteroarila, heteroarila substituída, alcóxi, arilóxi, amino, e amino substituído. Em uma modalidade, cada A é um resíduo de aminoácido. [00144] As bibliotecas que incluem compostos da Fórmula II ou Fórmula III podem compreender pelo menos cerca de 100; 1000;
10.000; 100.000; 1.000.000 ou 10.000.000 de compostos da Fórmula II ou Fórmula III. Em uma modalidade, a biblioteca é preparada através
Petição 870190086182, de 02/09/2019, pág. 79/160
62/141 de um método definido para produzir uma biblioteca que compreende pelo menos cerca de 100; 1000; 10.000; 100.000; 1.000.000 ou
10.000.000 de compostos da Fórmula II ou Fórmula III.
Petição 870190086182, de 02/09/2019, pág. 80/160
Tabela 8
Suportes provisórios aldeído/cetona
Outros Referência amina ácido carboxílico
Carranco, I., et al. (2005) J.
Comb. Chem.
7:33-41
Benzaldeído e furfural
aminos
Rosamilia, A.E., et al. (2005) Organic Letters 7:15251528
63/141
R3
Syeda Huma, H.Z., et al.
(2002) Tet Lett
43:6485-6488
Petição 870190086182, de 02/09/2019, pág. 81/160
R2 CHO
RAC
R2
R1— CHO
R2—NH2
YAyCooh Tempest, P., et
R-ry | N R3 al. (2001) Tet Lett 42:49594962 III
-x. EWG cooY x-' N Paulvannan, K. (1999) Tet Lett XY 40:1851-1854
NO^^^.-COOH Ύ T Tempest, P., et =^R4 al. (2001) Tet
xYxF Lett 42:4963- 4968
NO2^/;x,/COOH Ύ T Tempest, P., et N R3 al. (2003) Tet
xYx-f Lett 44:1947- 1950
64/141
Petição 870190086182, de 02/09/2019, pág. 82/160
R1— CHO
R^- COOH
O
Nefzi, A., et al.
(1999) Tet Lett
40:4939-4942
Bose, A.K., et al. (2005) Tet Lett 46:19011903
Stadler, A. and
Kappe, C.O. (2001) J.
Comb. Chem. 3:624-630;
Lengar, A. and Kappe, C.O.
(2004) Organic
Letters 6:771774
65/141
Petição 870190086182, de 02/09/2019, pág. 83/160
Grande faixa de aminas alifática primárias
CO2Me
NCS
Ivachtchenko,
A.V., et al. (2003) J. Comb.
Chem. 5:775788
R1-HS ri—nh2
Micheli, F., et al. (2001) J. Comb.
Chem.3:224228
66/141
Petição 870190086182, de 02/09/2019, pág. 84/160
Sternson, S.M., et al. (2001) Org. Lett. 3:4239-4242
DIA
R1
CH
RAC
CH
Cheng, W.-C., et al. (2002) J.
Crg.Chem. 67:5673-5677; Park, K.-H., et al. (2001) J
Comb Chem
3:171-176
Brown, B.J., et al. (2000)
Synlett 1:131133
67/141
R1—NH2
Kilburn, J.P., et al. (2001) Tet Lett 42:25832586
Petição 870190086182, de 02/09/2019, pág. 85/160
O.
•R1 r:
I
R3 aminoácido éster aminoácido del Fresno, M., et al. (1998) Tet Lett 39:2639-2642
68/141
Petição 870190086182, de 02/09/2019, pág. 86/160
aminoácido
AlvarezGutierrez, J.M., ácidos carboxílico et al. (2000)
Tet Lett 41:609-612
R^- CHO
R1—NH2
O II H /N HC FMOC RAC Rinnová, M., et j;.'- R3 N0 al. (2002) J. N Comb.Chem
R1 4:209-213
O R^^OH Makara, G.M., r^h^nh et al. (2002)
Organic Lett
4:1751-1754
69/141
Petição 870190086182, de 02/09/2019, pág. 87/160
O
R2 R4
Schell, P., et al. (2005) J.
Comb. Chem
7:96-98
aminoácidos
Feliu, L., et al. (2003) J.
Comb. Chem.
5:356-361
70/141
Aminos
Aldeídos
Petição 870190086182, de 02/09/2019, pág. 88/160
RAC
H2
O
O aminoácidos
aminoácidos
Hiroshige, M., et al. (1995) J. Am. Chem.
Soc. 117:1159011591
Bose, A.K., et al. (2005) Tet Lett 46:19011903
71/141
Petição 870190086182, de 02/09/2019, pág. 89/160
72/141 [00145] Uma vantagem dos métodos da invenção é que estes podem ser usados para preparar bibliotecas que compreendem grandes números de compostos. A capacidade de amplificar sequências de oligonucleotídeo de codificação utilizando métodos conhecidos, tal como, reação em cadeia da polimerase (PCR) significa que as moléculas selecionadas podem ser identificadas mesmo que relativamente poucas cópias sejam recuperadas. Isto permite o uso prático de bibliotecas muito extensas, que, como uma consequência de seu alto grau de complexidade, tanto compreendem relativamente poucas cópias de qualquer dado elemento de biblioteca, como requerem o uso de volumes muito grandes. Por exemplo, uma biblioteca que consiste em 10 estruturas exclusivas onde cada estrutura possui 1 x 1012 cópias (cerca de 1 picomol), requer cerca de 100 L de solução em 1 μM de concentração eficaz. Para a mesma biblioteca, se cada elemento for representado por 1.000.000 de cópias, o volume requerido é 100 μL em 1 μM de concentração eficaz.
[00146] Em uma modalidade preferida, a biblioteca compreende de cerca de 103 a cerca de 1015 cópias de cada elemento de biblioteca. Dadas as diferenças em eficiência de síntese entre os elementos de biblioteca, é possível que os elementos de biblioteca diferentes irão possuir números diferentes de cópias em qualquer dada biblioteca. Portanto, embora o número de cópias de cada elemento teoricamente presente na biblioteca pode ser o mesmo, o número real de cópias de qualquer dado elemento de biblioteca é independente do número de cópias de qualquer outro elemento. Mais preferivelmente, as bibliotecas de composto da invenção incluem pelo menos cerca de 105, 106 ou 107 cópias de cada elemento de biblioteca, ou de substancialmente todos os elementos de biblioteca. Por substancialmente todos os elementos de biblioteca entende-se que pelo menos cerca de 85% dos elementos da biblioteca, de preferência, pelo menos cerca de 90%, e mais
Petição 870190086182, de 02/09/2019, pág. 90/160
73/141 preferivelmente, pelo menos cerca de 95% dos elementos da biblioteca. [00147] De preferência, a biblioteca inclui um número suficiente de cópias de cada elemento que múltiplas séries (ou seja, duas ou mais) de seleção contra um alvo biológico podem ser realizadas, com quantidades suficientes de moléculas de ligação que permanecem após a série final de seleção para permitir a amplificação dos marcadores de oligonucleotídeo das moléculas restantes e, portanto, a identificação das porções funcionais das moléculas de ligação. Uma representação esquemática de tal processo de seleção é ilustrada na Figura 6, onde 1 e 2 representam elementos de biblioteca, B é uma molécula-alvo e X é uma porção ligada de forma operativa a B que permite a remoção de B do meio de seleção. Neste exemplo, o composto 1 se liga a B, enquanto o composto 2 não se liga a B. O processo de seleção, como mostrado na Série 1, compreende (I) contactar uma biblioteca que compreende compostos 1 e 2 com B-X sob condições adequadas para ligação de composto 1 a B; (II) remover o composto não-ligado 2, (III) dissociar o composto 1 de B e remover BX do meio de reação. O resultado de Série 1 é uma coleção de moléculas que é enriquecida no composto 1 com relação ao composto 2. As séries subsequentes que empregam as etapas I a III resultam em enriquecimento adicional de composto 1 com relação ao composto 2. Embora três series de seleção sejam mostradas na Figura 6, na prática qualquer número de séries pode ser empregado, por exemplo, de uma série a dez séries, para obter o enriquecimento desejado de moléculas de ligação com relação a moléculas de nãoligação.
[00148] Na modalidade mostrada na Figura 6, não há amplificação (síntese de mais cópias) dos compostos restantes após qualquer uma das séries de seleção. Tal amplificação pode resultar em uma mistura de compostos que não é compatível com as quantidades relativas dos compostos restantes após a seleção. Esta inconsistência se deve ao
Petição 870190086182, de 02/09/2019, pág. 91/160
74/141 fato de que certos compostos podem ser mais facilmente sintetizados do que outros compostos, e desta maneira podem ser amplificados de uma maneira que não é proporcional à sua presença após a seleção. Por exemplo, se o composto 2 for mais facilmente sintetizado do que o composto 1, a amplificação das moléculas restantes após a Rodada 2 poderia resultar em uma amplificação desproporcional do composto 2 com relação ao composto 1, e uma mistura resultante de compostos com um enriquecimento muito inferior (se houver algum) do composto 1 com relação ao composto 2.
[00149] Em uma modalidade, o alvo é imobilizado sobre um suporte provisório através de qualquer técnica de imobilização conhecida. O suporte provisório sólido pode ser, por exemplo, uma matriz insolúvel em água contida dentro de uma coluna de cromatografia ou uma membrana. A biblioteca codificada pode ser aplicada a uma matriz insolúvel em água contida dentro de uma coluna de cromatografia. A coluna é então lavada para remover aglutinantes não-específicos. Os compostos ligados por alvo podem ser então dissociados ao alterar o pH, concentração salina, concentração de solvente orgânico, ou outros métodos, tal como competição com um ligante conhecido com o alvo.
[00150] Em outra modalidade, o alvo é livre em solução e é incubado com a biblioteca codificada. Os compostos que se ligam ao alvo (também referidos aqui como ligantes) são seletivamente isolados por uma etapa de separação por tamanho tal como filtração ou ultrafiltração em gel. Em uma modalidade, a mistura de compostos codificados e a biomolécula-alvo é passada através de uma coluna de cromatografia de exclusão por tamanho (filtração em gel), que separa qualquer complexo ligante-alvo dos compostos não-ligados. Os complexos de ligante-alvo são transferidos para uma coluna de cromatografia em fase reversa, que dissocia os ligantes do alvo. Os ligantes dissociados são então analisados por amplificação por PCR e análise de sequência dos
Petição 870190086182, de 02/09/2019, pág. 92/160
75/141 oligonucleotídeos de codificação. Esta abordagem é particularmente vantajosa em situações onde a imobilização do alvo pode resultar em uma perda de atividade.
[00151] Em algumas modalidades da invenção, o método de seleção pode compreender amplificar o oligonucleotídeo de codificação de pelo menos um elemento da biblioteca de compostos que se liga a um alvo antes do sequenciamento.
[00152] Em uma modalidade, a biblioteca de compostos que compreende oligonucleotídeos de codificação é amplificada antes da análise de sequência para minimizar qualquer inclinação potencial na distribuição de população de moléculas de DNA presentes na mistura de biblioteca selecionada. Por exemplo, apenas uma pequena quantidade de biblioteca é recuperada após uma etapa de seleção e é tipicamente amplificada utilizando PCR antes da análise de seleção. PCR possui o potencial para produzir uma inclinação na distribuição de população de moléculas de DNA presentes na mistura de biblioteca selecionada. Isto é especialmente problemático quando o número de moléculas de entrada é pequeno e as moléculas de entrada são modelos de PCR ineficientes. Os produtos de PCR produzidos em ciclos precoces são modelos mais eficientes do que a biblioteca dúplex covalente, e, portanto, a frequência destas moléculas na população amplificada final pode ser muito maior do que em modelos de entrada originais.
[00153] Consequentemente, para minimizar esta inclinação de PCR potencial, em uma modalidade da invenção, uma população de oligonucleotídeos de fita simples correspondente aos elementos de biblioteca individuais é produzida, por exemplo, ao utilizar um iniciador em uma reação, seguida por amplificação por PCR que utiliza dois iniciadores. Ao fazer isto, ocorre um acúmulo linear de produto de extensão de iniciador de fita simples antes da amplificação exponencial
Petição 870190086182, de 02/09/2019, pág. 93/160
76/141 que utilize PCR, e a diversidade e distribuição de moléculas no produto de extensão de iniciador acumulado refletem mais precisamente a diversidade e distribuição de moléculas presentes no modelo de entrada original, uma vez que a fase exponencial de amplificação ocorre somente após uma grande quantidade da diversidade molecular original presente ser representada na população de moléculas produzida durante a reação de extensão de iniciador.
[00154] Uma vez que ligantes simples são identificados através do processo descrito acima, diversos níveis de análise podem ser aplicados para produzir informações de relação estrutura-atividade e para guiar a otimização adicional da afinidade, especificidade e bioatividade do ligante. Para ligantes derivados do mesmo suporte provisório, uma modelagem molecular tridimensional pode ser empregada para identificar características estruturais significativas comuns aos ligantes, gerando assim famílias de ligantes de pequenas moléculas que se ligam aparentemente em um sítio comum sobre a biomolécula-alvo.
[00155] Uma variedade de abordagens de triagem pode ser usada para obter ligantes que possuem alta afinidade com um alvo, porém afinidade significativamente mais fraca com outro alvo estreitamente relacionado. Uma estratégia de triagem é identificar ligantes de ambas as biomoléculas em experimentos paralelos e eliminam subsequentemente ligantes comuns através de uma comparação de cruzamento de dados. Neste método, os ligantes de cada biomolécula podem ser separadamente identificados como descrito acima. Este método é compatível tanto com as biomoléculas alvo imobilizadas como biomoléculas alvo livres em solução.
[00156] Para biomoléculas alvo imobilizadas, outra estratégia é adicionar uma etapa de pré-seleção que elimina todos os ligantes que se ligam à biomolécula não-alvo da biblioteca. Por exemplo, uma
Petição 870190086182, de 02/09/2019, pág. 94/160
77/141 primeira biomolécula pode ser colocada em contato com uma biblioteca codificada como descrito acima. Os compostos que não se ligam à primeira biomolécula são então separados de qualquer primeiro complexo biomolécula-ligante que se forma. A segunda biomolécula é então colocada em contato com os compostos que não se ligam à primeira biomolécula. Os compostos que se ligam à segunda biomolécula podem ser identificados como descrito acima e possuem afinidade significativamente maior com a segunda biomolécula do que com a primeira biomolécula.
[00157] Um ligante de uma biomolécula de função desconhecida que é identificado pelo método descrito acima também pode ser usado para determinar a função biológica da biomolécula. Isto é vantajoso pois, embora as novas sequências de gene continuem a ser identificadas, as funções das proteínas codificadas por estas sequências e a validade destas proteínas como alvos de nova descoberta e desenvolvimento de fármaco, são difíceis de determinar e representar talvez o obstáculo mais significativo para aplicar informações genômicas no tratamento de doença. Os ligantes específicos alvo obtidos através do processo descrito nesta invenção podem ser empregados de forma eficaz na em todas os ensaios biológicos de célula ou em modelos de animal apropriados para entender tanto a função da proteína-alvo como a validade da proteína-alvo para intervenção terapêutica. Esta abordagem também pode confirmar que o alvo é especificamente receptivo à descoberta de fármaco com molécula pequena.
[00158] Em uma modalidade, um ou mais compostos dentro de uma biblioteca da invenção são identificados como ligantes de uma biomolécula particular. Estes compostos podem ser então avaliados em um ensaio in vitro pela capacidade de se ligar à biomolécula. De preferência, as porções funcionais dos compostos de ligação são sintetizados dentro do marcador de oligonucleotídeo ou porção ligante,
Petição 870190086182, de 02/09/2019, pág. 95/160
78/141 e estas porções funcionais são avaliadas pela capacidade de se ligar à biomolécula.
[00159] O efeito da ligação das porções funcionais à biomolécula sobre a função da biomolécula também pode ser avaliado utilizando ensaios in vitro baseados em célula ou isentos de célula. Para uma biomolécula que possui uma função conhecida, o ensaio pode incluir uma comparação da atividade da biomolécula na presença e ausência do ligante, por exemplo, através de medida direta da atividade, tal como atividade enzimática ou através de uma medida indireta, tal como uma função celular que é influenciada pela biomolécula. Se a biomolécula for de função desconhecida, uma célula que expressa a biomolécula pode ser colocada em contato com o ligante e o efeito do ligante sobre a viabilidade, função, fenótipo, e/ou expressão de gene da célula é avaliado. O ensaio in vitro pode ser, por exemplo, um ensaio de morte celular, um ensaio de proliferação celular ou um ensaio de replicação viral. Por exemplo, se a biomolécula for uma proteína expressa por um vírus, uma célula infectada com o vírus pode ser colocada em contato com um ligante pela proteína. O efeito da ligação do ligante à proteína sobre a viabilidade viral pode ser então avaliado.
[00160] Um ligante identificado pelo método da invenção também pode ser avaliado em um modelo in vivo ou em um ser humano. Por exemplo, o ligante pode ser avaliado em um animal ou organismo que produz a biomolécula. Qualquer alteração resultante na condição saudável (por exemplo, progresso da doença) do animal ou organismo pode ser determinada.
[00161] Para uma biomolécula, tal como uma proteína ou uma molécula de ácido nucléico, de função desconhecida, o efeito de um ligante que se liga à biomolécula sobre uma célula ou organismo que produz a biomolécula pode proporcionar informações sobre a função biológica da biomolécula. Por exemplo, a observação que um processo
Petição 870190086182, de 02/09/2019, pág. 96/160
79/141 celular particular é inibido na presença do ligante indica que o processo depende, pelo menos em parte, da função da biomolécula.
[00162] Os ligantes identificados utilizando os métodos da invenção também podem ser usados como reagentes de afinidade pela biomolécula à qual estes se ligam. Em uma modalidade, tais ligantes são usados para realizar a purificação de afinidade da biomolécula, por exemplo, através de cromatografia de uma solução que compreende a biomolécula que utiliza uma fase sólida à qual um ou mais tais ligantes estão ligados.
[00163] Esta invenção é adicionalmente ilustrada pelos seguintes exemplos que não devem ser interpretados como limitativos. Os conteúdos destas referências, patentes e pedidos de patente publicados citados durante este pedido, bem como as Figuras e a Lista de Sequência, estão incorporados por meio deste à guisa de referência. EXEMPLOS
Exemplo 1: Síntese e Caracterização de uma biblioteca na ordem de 105 elementos [00164] A síntese de uma biblioteca que compreende a ordem de 105 elementos distintos foi realizada utilizando os seguintes reagentes: Composto 1:
O η n O
O / O-TGACTCCCAAATCAATGTG- 3'
O _ _ O
O J O-ACTGAGGGTTTAGTTAC-PO4-5’ [00165] Códigos de uma letra para desoxirribonucleotídeos:
A = adenosina
C = cistidina
G = guanosina
T = timidina
Petição 870190086182, de 02/09/2019, pág. 97/160
80/141
Precursores de bloco de construção:
Fmoc..
N
H
OH
O
BB1
Fmoc
Fmoc
BB4
Fmoc
BB5
BB3
Fmoc
Fmoc.
N
H
OH
O
BB7
Fmoc
OH
O
BB6
Fmoc
BB9
BB8
Fmoc.
N
H
OH
O
Fmoc
O
N
OH
Fmoc.
N
H
OH
O
BB10 BB11 BB12
Marcadores de oligonucleotídeo:
Sequência Número de marcador
5'-PO4-GCAACGAAG (SEQ ID NO:1) 1.1
ACCGTTGCT-PO3-5'(SEQ ID NO:2)
Petição 870190086182, de 02/09/2019, pág. 98/160
81/141
5'-PO3-GCGTACAAG (SEQ ID NO:3)1.2
ACCGCATGT-PO3-5' (SEQ ID NO:4)
5'-PO3-GCTCTGTAG (SEQ ID NO:5)1.3
ACCGAGACA-PO3-5' (SEQ ID NO:6)
5'-PO3-GTGCCATAG (SEQ ID NO:7)1.4
ACCACGGTA-PO3-5' (SEQ ID NO:8)
5'-PO3-GTTGACCAG (SEQ ID NO:9)1.5
ACCAACTGG-PO3-5' (SEQ ID NO:10)
5'-PO3-CGACTTGAC (SEQ ID NO:11)1.6
CAAGTCGCA-PO3-5' (SEQ ID NO:12)
5'-PO3-CGTAGTCAG (SEQ ID NO:13)1.7
ACGCATCAG-PO3-5' (SEQ ID NO:14)
5'-PO3-CCAGCATAG (SEQ ID NO:15)1.8
ACGGTCGTA-PO3-5' (SEQ ID NO:16)
5'-PO3-CCTACAGAG (SEQ ID NO:17)1.9
ACGGATGTC-PO3-5' (SEQ ID NO:18)
5'-PO3-CTGAACGAG (SEQ ID NO:19)1.10
CGTTCAGCA-PO3-5' (SEQ ID NO:20)
5'-PO3-CTCCAGTAG (SEQ ID NO:21)1.11
ACGAGGTCA-PO3-5' (SEQ ID NO:22)
Petição 870190086182, de 02/09/2019, pág. 99/160
82/141
5'-PO3-TAGGTCCAG (SEQ ID NO:23)
ACATCCAGG-PO3-5' (SEQ ID NO:24)
5'-PO3-GCGTGTTGT (SEQ ID NO:25)
TCCGCACAA-PO3-5' (SEQ ID NO:26)
5'-PO3-GCTTGGAGT (SEQ ID NO:27)
TCCGAACCT-PO3-5' (SEQ ID NO:28) 5'-PO3-GTCAAGCGT (SEQ ID NO:29)
TCCAGTTCG-PO3-5' (SEQ ID NO:30) 5'-PO3-CAAGAGCGT (SEQ ID NO:31)
TCGTTCTCG-PO3-5' (SEQ ID NO:32) 5'-PO3-CAGTTCGGT (SEQ ID NO:33)
TCGTCAAGC-PO3-5' (SEQ ID NO:34) 5'-PO3-CGAAGGAGT (SEQ ID NO:35)
TCGCTTCCT-PO3-5' (SEQ ID NO:36)
5'-PO3-CGGTGTTGT (SEQ ID NO:37)
TCGCCACAA-PO3-5' (SEQ ID NO:38)
5'-PO3-CGTTGCTGT (SEQ ID NO:39)
TCGCAACGA-PO3-5' (SEQ ID NO:40) 5'-PO3-CCGATCTGT (SEQ ID NO:41)
TCGGCTAGA-PO3-5' (SEQ ID NO:42)
1.12
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
Petição 870190086182, de 02/09/2019, pág. 100/160
83/141
5'-PO3-CCTTCTCGT (SEQ ID NO:43) TCGGAAGAG-PO3-5' (SEQ ID NO:44)
5'-PO3-TGAGTCCGT (SEQ ID NO:45)
TCACTCAGG-PO3-5' (SEQ ID NO:46)
5'-PO3-TGCTACGGT (SEQ ID NO:47) TCAGATTGC-PO3-5' (SEQ ID NO:48)
5'-PO3-GTGCGTTGA (SEQ ID NO:49)
CACACGCAA-PO3-5' (SEQ ID NO:50)
5'-PO3-GTTGGCAGA (SEQ ID NO:51)
CACAACCGT-PO3-5' (SEQ ID NO:52)
5'-PO3-CCTGTAGGA (SEQ ID NO:53)
CAGGACATC-PO3-5' (SEQ ID NO:54)
5'-PO3-CTGCGTAGA (SEQ ID NO:55)
CAGACGCAT-PO3-5' (SEQ ID NO:56)
5'-PO3-CTTACGCGA (SEQ ID NO:57)
CAGAATGCG-PO3-5' (SEQ ID NO:58)
5'-PO3-TGGTCACGA (SEQ ID NO:59)
CAACCAGTG-PO3-5' (SEQ ID NO:60)
5'-PO3-TCAGAGCGA (SEQ ID NO:61)
CAAGTCTCG-PO3-5' (SEQ ID NO:62)
5'-PO3-TTGCTCGGA (SEQ ID NO:63)
2.10
2.11
2.12
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
Petição 870190086182, de 02/09/2019, pág. 101/160
84/141
3.9
CAAACGAGC-PO3-5' (SEQ ID NO:64)
5'-PO3-GCAGTTGGA (SEQ ID NO:65)
CACGTCAAC-PO3-5' (SEQ ID NO:66)
5'-PO3-GCCTGAAGA (SEQ ID NO:67)
CACGGACTT-PO3-5' (SEQ ID NO:68) 5'-PO3-GTAGCCAGA (SEQ ID NO:69)
CACATCGGT-PO3-5' (SEQ ID NO:70) 5'-PO3-GTCGCTTGA (SEQ ID NO:71)
CACAGCGAA-PO3-5' (SEQ ID NO:72)
5'-PO3-GCCTAAGTT (SEQ ID NO:73)
CTCGGATTC-PO3-5' (SEQ ID NO:74)
5'-PO3-GTAGTGCTT (SEQ ID NO:75)
CTCATCACG-PO3-5' (SEQ ID NO:76)
5'-PO3-GTCGAAGTT (SEQ ID NO:77)
CTCAGCTTC-PO3-5' (SEQ ID NO:78)
5'-PO3-GTTTCGGTT (SEQ ID NO:79)
CTCAAAGCC-PO3-5' (SEQ ID NO:80)
5'-PO3-CAGCGTTTT (SEQ ID NO:81)
CTGTCGCAA-PO3-5' (SEQ ID NO:82)
5'-PO3-CATACGCTT (SEQ ID NO:83)
3.10
3.11
3.12
4.1
4.2
4.3
4.4
4.5
4.6
Petição 870190086182, de 02/09/2019, pág. 102/160
85/141
4.7
CTGTATGCG-PO3-5' (SEQ ID NO:84)
5'-PO3-CGATCTGTT (SEQ ID NO:85)
CTGCTAGAC-PO3-5' (SEQ ID NO:86)
5'-PO3-CGCTTTGTT (SEQ ID NO:87)
CTGCGAAAC-PO3-5' (SEQ ID NO:88)
5'-PO3-CCACAGTTT (SEQ ID NO:89)
CTGGTGTCA-PO3-5' (SEQ ID NO:90)
5'-PO3-CCTGAAGTT (SEQ ID NO:91)
CTGGACTTC-PO3-5' (SEQ ID NO:92)
5'-PO3-CTGACGATT (SEQ ID NO:93)
CTGACTGCT-PO3-5' (SEQ ID NO:94)
5'-PO3-CTCCACTTT (SEQ ID NO:95)
CTGAGGTGA-PO3-5' (SEQ ID NO:96)
5'-PO3-ACCAGAGCC (SEQ ID NO:97)
AATGGTCTC-PO3-5' (SEQ ID NO:98)
5'-PO3-ATCCGCACC (SEQ ID NO:99)
AATAGGCGT-PO3-5' (SEQ ID NO:100)
5'-PO3-GACGACACC (SEQ ID NO:101)
AACTGCTGT-PO3-5' (SEQ ID NO:102)
5'-PO3-GGATGGACC (SEQ ID NO:103)
4.8
4.9
4.10
4.11
4.12
5.1
5.2
5.3
5.4
Petição 870190086182, de 02/09/2019, pág. 103/160
86/141
AACCTACCT-PO3-5' (SEQ ID NO:104)
5'-PO3-GCAGAAGCC (SEQ ID NO:105)5.5
AACGTCTTC-PO3-5' (SEQ ID NO:106)
5'-PO3-GCCATGTCC (SEQ ID NO:107).6
AACGGTACA-PO3-5' (SEQ ID NO:108)
5'-PO3-GTCTGCTCC (SEQ ID NO:109).7
AACAGACGA-PO3-5' (SEQ ID NO:110)
5'-PO3-CGACAGACC (SEQ ID NO:111)5.8
AAGCTGTCT-PO3-5' (SEQ ID NO:112)
5'-PO3-CGCTACTCC (SEQ ID NO:113).9
AAGCGATGA-PO3-5' (SEQ ID NO:114)
5'-PO3-CCACAGACC (SEQ ID NO:115)5.10
AAGGTGTCT-PO3-5' (SEQ ID NO:116)
5'-PO3-CCTCTCTCC (SEQ ID NO:117).11
AAGGAGAGA-PO3-5' (SEQ ID NO:118)
5'-PO3-CTCGTAGCC (SEQ ID NO:119).12
AAGAGCATC-PO3-5' (SEQ ID NO:120)
1X tampão ligase: 50 mM de Tris, pH 7,5; 10 mM de ditiotreitol; 10 mM de MgCl2; 2,5 mM de ATP; 50 mM de NaCl.
10X tampão ligase: 500 mM de Tris, pH 7,5; 100 mM fr ditiotreitol; 100 mM de MgCl2; 25 mM de ATP; 500 mM de NaCl
Ciclo 1
Petição 870190086182, de 02/09/2019, pág. 104/160
87/141 [00166] A cada um dos doze tubos de PCR foram adicionados 50 μΐ de 1 mM de uma solução de Composto 1 em água; 75 μΐ de 0,80 mM de solução de um dos Marcadores 1,1-1,12; 15 μΐ de 10X tampão ligase e 10 μΐ de água deionizada. Os tubos foram aquecidos a 95oC durante 1 minuto e então resfriados a 16oC durante 10 minutos. A cada tubo foram adicionadas 5.000 unidades de T4 DNA ligase (2,5 μΐ de solução de 2.000.000 unidade/ml (New England Biolabs, Cat. n° M0202)) em 50 gl de 1X tampão ligase e as soluções resultantes foram incubadas a 16oC durante 16 horas.
[00167] Após a ligação, as amostras foram transferidas para tubos Eppendorf de 1,5 ml e tratados com 20 μΐ de 5 M NaCl aquoso e 500 μΐ de etanol frio (-20oC), e mantidas a - 20oC durante 1 hora. Após a centrifugação, o sobrenadante foi removido e o pélete foi lavado com 70% de etanol aquoso a -20oC. Cada pélete foi dissolvido em 150 μΐ de 150 mM de tampão borato de sódio, pH 9,4.
[00168] As soluções estoque que compreendem cada precursor de bloco de construção BB1 a BB12, N,N-diisopropiletanolamina e hexafluorofosfato O-(7-azabenzotriazol-1-il)-1,1,3,3-tetrametilurônio, cada um em uma concentração de 0,25 M, foram preparadas em DMF e agitadas em temperatura ambiente durante 20 minutos. As soluções precursoras de bloco de construção foram adicionadas a cada solução de pélete descrita acima para proporcionar um excesso de 10 dobras de precursor de bloco de construção com relação ao ligante. As soluções resultantes foram agitadas. Um adicional de 10 equivalentes de precursor de bloco de construção foi adicionado à mistura de reação após 20 minutos, e outros 10 equivalentes após 40 minutos. A concentração final de DMF na mistura de reação era 22%. As soluções de reação foram então agitadas durante a noite até 4oC. O progresso da reação foi monitorado por RP-HPLC utilizando 50 mM de acetato de tetraetilamônio aquoso (pH=7,5) e acetonitrila, e um gradiente de 2 até
Petição 870190086182, de 02/09/2019, pág. 105/160
88/141
46% de acetonitrila durante 14 min. A reação foi interrompida quando ~95% de material de partida (ligante) for acilado. Após a acilação as misturas de reação foram agrupadas e lioflizadas até secar. O material liofilizado foi então purificado por HPLC, e as frações correspondentes à biblioteca (produto acilado) foram agrupadas e liofilizadas.
[00169] A biblioteca foi dissolvida em 2,5 ml de 0,01 M de tampão fosfato de sódio (pH = 8,2) e 0,1 ml de piperidina (4% v/v) foi adicionado a esta. A adição de piperidina resulta em turvação que não se dissolve mediante mistura. As misturas de reação foram agitadas em temperatura ambiente durante 50 minutos, e então a solução turva foi centrifugada (14.000 rpm), o sobrenadante foi removido utilizando uma pipeta de 200 pl, e o pélete foi ressuspenso em 0,1 ml de água. A lavagem aquosa foi combinada com o sobrenadante e o pélete foi descartado. A biblioteca desprotegida foi precipitada a partir da solução por adição de etanol gelado em excesso para induzir a concentração final de etanol na reação a 70% v/v. A centrifugação da mistura de etanol aquoso forneceu um pélete branco que compreende a biblioteca. O pélete foi lavado uma vez co 70% de etanol aquoso gelado. Após a remoção de solvente o pélete foi seco em ar (~5min.) para remover traços de etanol e então usado no ciclo 2. Os marcadores e precursores de bloco de construção correspondentes na Rodada 1 estão estabelecidos na Tabela 1, abaixo.
Marcador de construção
Bloco Marcador
Precursor
BB1 1,11
BB2 1,6
BB3 1,2
BB4 1,8
BB5 1,1
BB6 1,10
Petição 870190086182, de 02/09/2019, pág. 106/160
89/141
Marcador de construção Bloco Precursor
BB7
BB8
BB9
BB10
BB11
BB12
Marcador
1,12
1,5
1,4
1,3
1,7
1,9
Siclos 2-5 [00170] Para cada um destes ciclos, a solução combinada resultante do ciclo anterior foi dividida em 12 alíquotas iguais de 50 ul cada e colocada em tubos de PCR. A cada tubo foi adicionada uma solução que compreende um marcador diferente, e a ligação, purificação e acilação foram realizadas como descrito no Ciclo 1, exceto para os Ciclos 3-5, a etapa de purificação por HPLC descrita no Ciclo 1 foi omitida. A correspondência entre marcadores e precursores de bloco de construção nos Ciclos 2 a 5 está apresentada na Tabela 2.
[00171] Os produtos do Ciclo 5 foram ligados com o iniciador de fechamento mostrado abaixo, utilizando o método descrito acima para ligação de marcadores.
5'-PO3-GGCACATTGATTTGGGAGTCA
GTGTAACTAAACCCTCAGT-PO3-5'
Tabela 2
Precursor de bloco de construção Ciclo 2 Marcador Ciclo 3 Marcador Ciclo 4 Marcador Ciclo 5 Marcador
BB1 2,7 3,7 4,7 5,7
BB2 2,8 3,8 4,8 5,8
BB3 2,2 3,2 4,2 5,2
BB4 2,10 3,10 4,10 5,10
BB5 2,1 3,1 4,1 5,1
Petição 870190086182, de 02/09/2019, pág. 107/160
90/141
Precursor de bloco de construção Ciclo 2 Marcador Ciclo 3 Marcador Ciclo 4 Marcador Ciclo 5 Marcador
BB6 2,12 3,12 4,12 5,12
BB7 2,5 3,5 4,5 5,5
BB8 2,6 3,6 4,6 5,6
BB9 2,4 3,4 4,4 5,4
BB10 2,3 3,3 4,3 5,3
BB11 2,9 3,9 4,9 5,9
BB12 2,11 3,11 4,11 5,11
Resultados:
[00172] O procedimento sintético descrito acima possui a capacidade de produzir uma biblioteca que compreende 125 (cerca de 249.000) estruturas diferentes. A síntese da biblioteca foi monitorada através de eletroforese em gel do produto de cada ciclo. Os resultados de cada um dos cinco ciclos e a biblioteca final após a ligação do iniciador de fechamento estão ilustrados na Figura 7. O composto marcado head piece é o Composto 1. A figura mostra que cada ciclo resulta no aumento de peso molecular esperado e que os produtos de cada ciclo são substancialmente homogêneos com relação ao peso molecular.
Exemplo 2: Síntese e Caracterização de uma biblioteca na ordem de 108 elementos [00173] A síntese de uma biblioteca que compreende a ordem de 108 elementos distintos foi realizada utilizando os seguintes reagentes: Composto 2:
[00174] Códigos com uma única letra para desoxirribonucleotídeos: A = adenosina
Petição 870190086182, de 02/09/2019, pág. 108/160
91/141
C = citidina
G = guanosina
T = timidina
Precursores de Bloco de construção:
OH
Fmoc-NH O
O
OH
N
O Fmoc.N
H
O
OH
O
H
YxNH3
O
Fmoc
BB1
Fmoc
BB2
BB3
BB4
HO.
' OH
Fmoc
Fmoc „ N H
O
OH
Fmoc
COO H
BB5
BB6
BB7
HN Fmoc
O HC
OH
OH
Fmoc-NH
OH
C
O
BB8 BB9
BB10
Fmoc
Fmoc-NH O
Fmoc
BB11 BB12 BB13 BB14
Fmoc
Fmoc
O
OH
Fmoc
Fmoc
O
BB15 BB16 BB17 BB18
Fmoc - NH /L
OH
BB19
Petição 870190086182, de 02/09/2019, pág. 109/160
92/141
Cl
Fmoc
BB21
OH
HO
BB23
Cl
Fmoc N
OH
O
BB24
Fmoc n
H
OH
O
O NH2
NH
BB25
Fmoc
H
OH
O
BB29
X OH
Fmoc N J HO
BB32 nX·0 Fmoc Oh
Fmoc—N H
NH2
O
II COH
O
OH
N
BB26
BB27
O
H Fmoc N
NH
OH
O
OH O
OH
HN ._
Fmoc
BB33
BB30
Fmoc
O
BB35
Petição 870190086182, de 02/09/2019, pág. 110/160
93/141
Fmoc
O
O2N
Fmoc „
N
H
O
OH ^CO
I 11
Fmoc O Fmoc'N
H
O
BB36
BB37
BB38
BB39 Fmoc'NH
H
N
Fmoc
OH
O Fmoc'N
H
OH
O
Fmoc x
N H O
OH
BB40 BB41
BB42 BB43
HN C'
I I Fmoc OH
N H N~Fmoc
O
Zoh \ .Fmoc
V'N \ H ./'OH
Fmoc χ N H O
OH
BB44
BB45
BB46
BB47
HN
Fmoc
OH
O
BB48
<COH
I 11
Fmoc O
BB52
Fmoc
Zx .OH ’N Y H O .ΟΠ HN C 1 11 Fmoc O N Π H O
BB49 BB50 BB51
H O FmocN
OH
BB54
BB53
Fmoc
Fmoc
BB55
OH
Petição 870190086182, de 02/09/2019, pág. 111/160
94/141
Fmoc
OH
BB57
H2N
Fmoc— N I H ,CHO
BB58
Fmoc
N Ύ H O
OH
Fmoc hN
BB61
Fmoc
Fmoc — NH ’,C=O
Fmoc O
BB62 hn-Voh
OH
Fmoc
BB60
Fmoc
OH
YCOH Fmoc O
BB63 BB64
O
OH
BB65
BB66
BB68
Fmoc
OH
Fmoc
BB70
Fmoc „ w
H
OH
NH
BB71
BB69
Petição 870190086182, de 02/09/2019, pág. 112/160
95/141
Fmoc
O2N
I XN
Fmoc
Fmoc
C
II
O
OH
OH
BB71 BB72
BB73
BB74
Fmoc
O
N H
NO
Fmoc
N H
OH
BB75
BB76
BB77
Fmoc
OH
O
OH
Fmoc O
OH BB78 BB79 BB780 ^^OH
I 11
Fmoc O
BB81
Fmoc
BB84
BB85
Fmoc
N H O
H N
BB86
Petição 870190086182, de 02/09/2019, pág. 113/160
96/141
Fmoc
Fmoc x N H O
Fmoc
O
BB88
Cl
BB89 Fm°c'N H O
BB90
BB87
Fmoc -NH
Fmoc
BB91
Fmoc
BB92
O
OH
BB93
Fmoc
Fmoc X,
N
H
O
OH
BB94
BB95 BB96
Tabela 3:
Marcadores de oligonucleotídeo usados no ciclo 1:
CISDOVBH
Número de Sequência de fita superior Sequência de fita inferior
Marcador
5'-PO3- 5'-PO3-
1.1 AAATCGATGTGGTCACTCAG GAGTGACCACATCGATTTGG
(SEQ ID NO:121) (SEQ ID NO:122)
5'-PO3- 5'-PO3-
1.2 AAATCGATGTGGACTAGGAG CCTAGTCCACATCGATTTGG
(SEQ ID NO:123) (SEQ ID NO:124)
5'-PO3- 5'-PO3-
1.3 AAATCGATGTGCCGTATGAG CATACGGCACATCGATTTGG
(SEQ ID NO:125) (SEQ ID NO:126)
1.4 5'-PO3- 5'-PO3-
AAATCGATGTGCTGAAGGAG CCTTCAGCACATCGATTTGG
Petição 870190086182, de 02/09/2019, pág. 114/160
97/141
Número de Marcador
1.5
1.6
1.7
1.8
1.9
1.10
1.11
1.12
1.13
1.14
1.15
Sequência de fita superior (SEQ ID NO:127)
5'-PO3AAATCGATGTGGACTAGCAG (SEQ ID NO:129)
5'-PO3AAATCGATGTGCGCTAAGAG (SEQ ID NO:131)
5'-PO3AAATCGATGTGAGCCGAGAG (SEQ ID NO:133)
5'-PO3AAATCGATGTGCCGTATCAG (SEQ ID NO:135)
5'-PO3AAATCGATGTGCTGAAGCAG (SEQ ID NO:137)
5'-PO3AAATCGATGTGTGCGAGTAG (SEQ ID NO:139)
5'-PO3AAATCGATGTGTTTGGCGAG (SEQ ID NO:141)
5'-PO3AAATCGATGTGCGCTAACAG (SEQ ID NO:143)
5'-PO3AAATCGATGTGAGCCGACAG (SEQ ID NO:145)
5'-PO3AAATCGATGTGAGCCGAAAG (SEQ ID NO:147)
5'-PO3Sequência de fita inferior (SEQ ID NO:128)
5'-PO3GCTAGTCCACATCGATTTGG (SEQ ID NO:130)
5'-PO3CTTAGCGCACATCGATTTGG (SEQ ID NO:132)
5'-PO3CTCGGCTCACATCGATTTGG (SEQ ID NO:134)
5'-PO3GATACGGCACATCGATTTGG (SEQ ID NO:136)
5'-PO3GCTTCAGCACATCGATTTGG (SEQ ID NO:138)
5'-PO3ACTCGCACACATCGATTTGG (SEQ ID NO:140)
5'-PO3CGCCAAACACATCGATTTGG (SEQ ID NO:142)
5'-PO3GTTAGCGCACATCGATTTGG (SEQ ID NO:144)
5'-PO3GTCGGCTCACATCGATTTGG (SEQ ID NO:146)
5'-PO3TTCGGCTCACATCGATTTGG (SEQ ID NO:148)
5'-PO3Petição 870190086182, de 02/09/2019, pág. 115/160
98/141
Número de Sequência de fita superior
Marcador
AAATCGATGTGTCGGTAGAG (SEQ ID NO:149)
5'-PO3-
1.16 AAATCGATGTGGTTGCCGAG (SEQ ID NO:151)
5'-PO3-
1.17 AAATCGATGTGAGTGCGTAG (SEQ ID NO:153)
5'-PO3-
1.18 AAATCGATGTGGTTGCCAAG (SEQ ID NO:155)
5'-PO3-
1.19 AAATCGATGTGTGCGAGGAG (SEQ ID NO:157)
5'-PO3-
1.20 AAATCGATGTGGAACACGAG (SEQ ID NO:159)
5'-PO3-
1.21 AAATCGATGTGCTTGTCGAG (SEQ ID NO:161)
5'-PO3-
1.22 AAATCGATGTGTTCCGGTAG (SEQ ID NO:163)
5'-PO3-
1.23 AAATCGATGTGTGCGAGCAG (SEQ ID NO:165)
5'-PO3-
1.24 AAATCGATGTGGTCAGGTAG (SEQ ID NO:167)
Sequência de fita inferior
CTACCGACACATCGATTTGG (SEQ ID NO:150)
5'-PO3CGGCAACCACATCGATTTGG (SEQ ID NO:152)
5'-PO3ACGCACTCACATCGATTTGG (SEQ ID NO:154)
5'-PO3TGGCAACCACATCGATTTGG (SEQ ID NO:156)
5'-PO3CCTCGCACACATCGATTTGG (SEQ ID NO:158)
5'-PO3CGTGTTCCACATCGATTTGG (SEQ ID NO:160)
5'-PO3CGACAAGCACATCGATTTGG (SEQ ID NO:162)
5'-PO3A0CCGGAACACATCGATTTGG (SEQ ID NO:164)
5'-PO3GCTCGCACACATCGATTTGG (SEQ ID NO:166)
5'-PO3ACCTGACCACATCGATTTGG (SEQ ID NO:168)
5'-PO3- 5'-PO3-
1.25 AAATCGATGTGGCCTGTTAG AACAGGCCACATCGATTTGG (SEQ ID NO:169) (SEQ ID NO: 170)
Petição 870190086182, de 02/09/2019, pág. 116/160
99/141
Número de Marcador
1.26
1.27
1.28
1.29
1.30
1.31
1.32
1.33
1.34
1.35
1.36
Sequência de fita superior
5'-PO3AAATCGATGTGGAACACCAG (SEQ ID NO:171)
5'-PO3AAATCGATGTGCTTGTCCAG (SEQ ID NO:173)
5'-PO3AAATCGATGTGTGCGAGAAG (SEQ ID NO:175)
5'-PO3AAATCGATGTGAGTGCGGAG (SEQ ID NO:177)
5'-PO3AAATCGATGTGTTGTCCGAG (SEQ ID NO:179)
5'-PO3AAATCGATGTGTGGAACGAG (SEQ ID NO:181)
5'-PO3AAATCGATGTGAGTGCGAAG (SEQ ID NO:183)
5'-PO3AAATCGATGTGTGGAACCAG (SEQ ID NO:185)
5'-PO3AAATCGATGTGTTAGGCGAG (SEQ ID NO:187)
5'-PO3AAATCGATGTGGCCTGTGAG (SEQ ID NO:189)
5'-PO3AAATCGATGTGCTCCTGTAG (SEQ ID NO:191)
Sequência de fita inferior
5'-PO3GGTGTTCCACATCGATTTGG (SEQ ID NO:172)
5'-PO3GGACAAGCACATCGATTTGG (SEQ ID NO:174)
5'-PO3TCTCGCACACATCGATTTGG (SEQ ID NO:176)
5'-PO3CCGCACTCACATCGATTTGG (SEQ ID NO:178)
5'-PO3CGGACAACACATCGATTTGG (SEQ ID NO:180)
5'-PO3CGTTCCACACATCGATTTGG (SEQ ID NO:182)
5'-PO3TCGCACTCACATCGATTTGG (SEQ ID NO:184)
5'-PO3GGTTCCACACATCGATTTGG (SEQ ID NO:186)
5'-PO3CGCCTAACACATCGATTTGG (SEQ ID NO:188)
5'-PO3CACAGGCCACATCGATTTGG (SEQ ID NO:190)
5'-PO3ACAGGAGCACATCGATTTGG (SEQ ID NO:192)
Petição 870190086182, de 02/09/2019, pág. 117/160
100/141
Número de Marcador
1.37
1.38
1.39
1.40
1.41
1.42
1.43
1.44
1.45
1.46
1.47
Sequência de fita superior
5'-PO3AAATCGATGTGGTCAGGCAG (SEQ ID NO:193)
5'-PO3AAATCGATGTGGTCAGGAAG (SEQ ID NO:195)
5'-PO3AAATCGATGTGGTAGCCGAG (SEQ ID NO:197)
5'-PO3AAATCGATGTGGCCTGTAAG (SEQ ID NO:199)
5'-PO3AAATCGATGTGCTTTCGGAG (SEQ ID NO:201)
5'-PO3AAATCGATGTGCGTAAGGAG (SEQ ID NO:203)
5'-PO3AAATCGATGTGAGAGCGTAG (SEQ ID NO:205)
5'-PO3AAATCGATGTGGACGGCAAG (SEQ ID NO:207)
5'-PO3AAATCGATGTGCTTTCGCAG (SEQ ID NO:209)
5'-PO3AAATCGATGTGCGTAAGCAG (SEQ ID NO:211)
5'-PO3AAATCGATGTGGCTATGGAG (SEQ ID NO:213)
Sequência de fita inferior
5'-PO3GCCTGACCACATCGATTTGG (SEQ ID NO:194)
5'-PO3TCCTGACCACATCGATTTGG (SEQ ID NO:196)
5'-PO3CGGCTACCACATCGATTTGG (SEQ ID NO:198)
5'-PO3TACAGGCCACATCGATTTGG (SEQ ID NO:200)
5'-PO3CCGAAAGCACATCGATTTGG (SEQ ID NO:202)
5'-PO3CCTTACGCACATCGATTTGG (SEQ ID NO:204)
5'-PO3ACGCTCTCACATCGATTTGG (SEQ ID NO:206)
5'-PO3TGCCGTCCACATCGATTTGG (SEQ ID NO:208)
5'-PO3GCGAAAGCACATCGATTTGG (SEQ ID NO:210)
5'-PO3GCTTACGCACATCGATTTGG (SEQ ID NO:212)
5'-PO3CCATAGCCACATCGATTTGG (SEQ ID NO:214)
Petição 870190086182, de 02/09/2019, pág. 118/160
101/141
Número de Sequência de fita superior Sequência de fita inferior
Marcador
5'-PO3- 5'-PO3-
1.48 AAATCGATGTGACTCTGGAG CCAGAGTCACATCGATTTGG
(SEQ ID NO:215) (SEQ ID NO:216)
5'-PO3- 5'-PO3-
1.49 AAATCGATGTGCTGGAAAG TTCCAGCACATCGATTTGG
(SEQ ID NO:217) (SEQ ID NO:218)
5'-PO3- 5'-PO3-
1.50 AAATCGATGTGCCGAAGTAG ACTTCGGCACATCGATTTGG
(SEQ ID NO:219) (SEQ ID NO:220)
5'-PO3- 5'-PO3-
1.51 AAATCGATGTGCTCCTGAAG TCAGGAGCACATCGATTTGG
(SEQ ID NO:221) (SEQ ID NO:222)
5'-PO3- 5'-PO3-
1.52 AAATCGATGTGTCCAGTCAG GACTGGACACATCGATTTGG
(SEQ ID NO:223) (SEQ ID NO:224)
5'-PO3- 5'-PO3-
1.53 AAATCGATGTGAGAGCGGAG CCGCTCTCACATCGATTTGG
(SEQ ID NO:225) (SEQ ID NO:226)
5'-PO3- 5'-PO3-
1.54 AAATCGATGTGAGAGCGAAG TCGCTCTCACATCGATTTGG
(SEQ ID NO:227) (SEQ ID NO:228)
5'-PO3- 5'-PO3-
1.55 AAATCGATGTGCCGAAGGAG CCTTCGGCACATCGATTTGG
(SEQ ID NO:229) (SEQ ID NO:230)
5'-PO3- 5'-PO3-
1.56 AAATCGATGTGCCGAAGCAG GCTTCGGCACATCGATTTGG
(SEQ ID NO:231) (SEQ ID NO:232)
5'-PO3- 5'-PO3-
1.57 AAATCGATGTGTGTTCCGAG CGGAACACACATCGATTTGG
(SEQ ID NO:233) (SEQ ID NO:234)
5'-PO3- 5'-PO3-
1.58 AAATCGATGTGTCTGGCGAG CGCCAGACACATCGATTTGG
(SEQ ID NO:235) (SEQ ID NO:236)
Petição 870190086182, de 02/09/2019, pág. 119/160
102/141
Número de Marcador
1.59
1.60
1.61
1.62
1.63
1.64
1.65
1.66
1.67
1.68
1.69
Sequência de fita superior
5'-PO3AAATCGATGTGCTATCGGAG (SEQ ID NO:237)
5'-PO3AAATCGATGTGCGAAAGGAG (SEQ ID NO:239)
5'-PO3AAATCGATGTGCCGAAGAAG (SEQ ID NO:241)
5'-PO3AAATCGATGTGGTTGCAGAG (SEQ ID NO:243)
5'-PO3AAATCGATGTGGATGGTGAG (SEQ ID NO:245)
5'-PO3AAATCGATGTGCTATCGCAG (SEQ ID NO:247)
5'-PO3AAATCGATGTGCGAAAGCAG (SEQ ID NO:249)
5'-PO3AAATCGATGTGACACTGGAG (SEQ ID NO:251)
5'-PO3AAATCGATGTGTCTGGCAAG (SEQ ID NO:253)
5'-PO3AAATCGATGTGGATGGTCAG (SEQ ID NO:255)
5'-PO3AAATCGATGTGGTTGCACAG (SEQ ID NO:257)
Sequência de fita inferior
5'-PO3CCGATAGCACATCGATTTGG (SEQ ID NO:238)
5'-PO3CCTTTCGCACATCGATTTGG (SEQ ID NO:240)
5'-PO3TCTTCGGCACATCGATTTGG (SEQ ID NO:242)
5'-PO3CTGCAACCACATCGATTTGG (SEQ ID NO:244)
5'-PO3CACCATCCACATCGATTTGG (SEQ ID NO:246)
5'-PO3GCGATAGCACATCGATTTGG (SEQ ID NO:248)
5'-PO3GCTTTCGCACATCGATTTGG (SEQ ID NO:250)
5'-PO3CCAGTGTCACATCGATTTGG (SEQ ID NO:252)
5'-PO3TGCCAGACACATCGATTTGG (SEQ ID NO:254)
5'-PO3GACCATCCACATCGATTTGG (SEQ ID NO:256)
5'-PO3GTGCAACCACATCGATTTGG (SEQ ID NO:258)
Petição 870190086182, de 02/09/2019, pág. 120/160
103/141
Número de Sequência de fita superior
Marcador
5'-PO3-
1.70 AAATCGATGTGGGCATCGAG (SEQ ID NO:259)
5'-PO3-
1.71 AAATCGATGTGTGCCTCCAG (SEQ ID NO:261)
5'-PO3-
1.72 AAATCGATGTGTGCCTCAAG (SEQ ID NO:263)
5'-PO3-
1.73 AAATCGATGTGGGCATCCAG (SEQ ID NO:265)
5'-PO3-
1.74 AAATCGATGTGGGCATCAAG (SEQ ID NO:267)
5'-PO3-
1.75 AAATCGATGTGCCTGTCGAG (SEQ ID NO:269)
5'-PO3-
1.76 AAATCGATGTGGACGGATAG (SEQ ID NO:271)
5'-PO3-
1.77 AAATCGATGTGCCTGTCCAG (SEQ ID NO:273)
5'-PO3-
1.78 AAATCGATGTGAAGCACGAG (SEQ ID NO:275)
5'-PO3-
1.79 AAATCGATGTGCCTGTCAAG (SEQ ID NO:277)
5'-PO3-
1.80 AAATCGATGTGAAGCACCAG (SEQ ID NO:279)
Sequência de fita inferior
5'-PO3-CGATGCCCCATCCGA
TTT GG (SEQ ID NO:260)
5'-PO3GGAGGCACACATCGATTTGG (SEQ ID NO:262)
5'-PO3TGAGGCACACATCGATTTGG (SEQ ID NO:264) 5'-PO3GGATGCCCACATCGATTTGG (SEQ ID NO:266) 5'-PO3-TGATGCCCA CAT CGA TTT GG (SEQ ID NO:268)
5'-PO3-CGA CAG GCA CAT
CGA TTT GG (SEQ ID NO:270)
5'-PO3-ATC CGT CCA CAT CGA
TTT GG (SEQ ID NO:272)
5'-PO3-GGA CAG GCA CAT
CGA TTT GG (SEQ ID NO:274)
5'-PO3-CGT GCT TCA CAT CGA
TTT GG (SEQ ID NO:276)
5'-PO3-TGA CAG GCA CAT CGA
TTT GG (SEQ ID NO:278)
5'-PO3-GGT GCT TCA CAT CGA
TTT GG (SEQ ID NO:280)
Petição 870190086182, de 02/09/2019, pág. 121/160
104/141
Número de Sequência de fita superior
Marcador
5'-PO3-
1.81 AAATCGATGTGCCTTCGTAG (SEQ ID NO:281)
5'-PO3-
1.82 AAATCGATGTGTCGTCCGAG (SEQ ID NO:283)
5'-PO3-
1.83 AAATCGATGTGGAGTCTGAG (SEQ ID NO:285)
5'-PO3-
1.84 AAATCGATGTGTGATCCGAG (SEQ ID NO:287)
5'-PO3-
1.85 AAATCGATGTGTCAGGCGAG (SEQ ID NO:289)
5'-PO3-
1.86 AAATCGATGTGTCGTCCAAG (SEQ ID NO:291)
5'-PO3-
1.87 AAATCGATGTGGACGGAGAG (SEQ ID NO:293)
5'-PO3-
1.88 AAATCGATGTGGTAGCAGAG (SEQ ID NO:295)
5'-PO3-
1.89 AAATCGATGTGGCTGTGTAG (SEQ ID NO:297)
5'-PO3-
1.90 AAATCGATGTGGACGGACAG (SEQ ID NO:299)
5'-PO3-
1.91 AAATCGATGTGTCAGGCAAG (SEQ ID NO:301)
Sequência de fita inferior
5'-PO3-ACG AAG GCA CAT
CGA TTT GG (SEQ ID NO:282)
5'-PO3-CGG ACG ACA CAT
CGA TTT GG (SEQ ID NO:284)
5'-PO3-CAG ACT CCA CAT CGA
TTT GG (SEQ ID NO:286)
5'-PO3-CGG ATC ACA CAT CGA
TTT GG (SEQ ID NO:288)
5'-PO3-CGC CTG ACA CAT CGA
TTT GG (SEQ ID NO:290)
5'-PO3-TGG ACG ACA CAT CGA
TTT GG (SEQ ID NO:292)
5'-PO3-CTC CGT CCA CAT CGA
TTT GG (SEQ ID NO:294)
5'-PO3-CTG CTA CCA CAT CGA
TTT GG (SEQ ID NO:296)
5'-PO3ACACAGCCACATCGATTTGG (SEQ ID NO:298)
5'-PO3-GTC CGT CCA CAT CGA
TTT GG (SEQ ID NO:300)
5'-PO3-TGC CTG ACA CAT CGA
TTT GG (SEQ ID NO:302)
Petição 870190086182, de 02/09/2019, pág. 122/160
105/141
Número de Sequência de fita superior
Marcador
5'-PO3-
1.92 AAATCGATGTGGCTCGAAAG (SEQ ID NO:303)
5'-PO3-
1.93 AAATCGATGTGCCTTCGGAG (SEQ ID NO:305)
5'-PO3-
1.94 AAATCGATGTGGTAGCACAG (SEQ ID NO:307)
5'-PO3-
1.95 AAATCGATGTGGAAGGTCAG (SEQ ID NO:309)
5'-PO3-
1.96 AAATCGATGTGGTGCTGTAG (SEQ ID NO:311)
Sequência de fita inferior
5'-PO3TTCGAGCCACATCGATTTGG (SEQ ID NO:304)
5'-PO3-CCG AAG GCA CAT
CGA TTT GG (SEQ ID NO:306)
5'-PO3-GTG CTA CCA CAT CGA
TTT GG (SEQ ID NO:308)
5'-PO3-GAC CTT CCA CAT CGA
TTT GG (SEQ ID NO:310)
5'-PO3-ACA GCA CCA CAT CGA
TTT GG (SEQ ID NO:312)
Tabela 4: Marcadores de oligonucleotídeo usados no ciclo 2:
Número de Sequência de fita Sequência de fita inferior
Marcador superior
5'-PO3-GTT GCC TGT 5'-PO3-AGG CAA CCT
2.1 (SEQ ID NO:313) (SEQ ID NO:314)
5'-PO3-CAG GAC GGT 5'-PO3-CGT CCT GCT
2.2 (SEQ ID NO:315) (SEQ ID NO:316)
5'-PO3-AGA CGT GGT 5'-PO3-CAC GTC TCT
2.3 (SEQ ID NO:317) (SEQ ID NO:318)
5'-PO3-CAG GAC CGT 5'-PO3-GGT CCT GCT
2.4 (SEQ ID NO:319) (SEQ ID NO:320)
5'-PO3-CAG GAC AGT 5'-PO3-TGT CCT GCT
2.5 (SEQ ID NO:321) (SEQ ID NO:322)
5'-PO3-CAC TCT GGT 5'-PO3-CAG AGT GCT
2.6 (SEQ ID NO:323) (SEQ ID NO:324)
2.7 5'-PO3-GAC GGC TGT 5'-PO3-AGC CGT CCT
Petição 870190086182, de 02/09/2019, pág. 123/160
106/141
Número de Sequência de fita Sequência de fita inferior
Marcador superior
(SEQ ID NO:325) (SEQ ID NO:326)
5'-PO3-CAC TCT CGT 5'-PO3-GAG AGT GCT
2.8 (SEQ ID NO:327) (SEQ ID NO:328)
5'-PO3-GTA GCC TGT 5'-PO3-AGG CTA CCT
2.9 (SEQ ID NO:329) (SEQ ID NO:330)
5'-PO3-GCC ACT TGT 5'-PO3-AAG TGG CCT
2.10 (SEQ ID NO:331) (SEQ ID NO:332)
5'-PO3-CAT CGC TGT 5'-PO3-AGC GAT GCT
2.11 (SEQ ID NO:333) (SEQ ID NO:334)
5'-PO3-CAC TGG TGT 5'-PO3-ACC AGT GCT
2.12 (SEQ ID NO:335) (SEQ ID NO:336)
5'-PO3-GCC ACT GGT 5'-PO3-CAG TGG CCT
2.13 (SEQ ID NO:337) (SEQ ID NO:338)
5'-PO3-TCT GGC TGT 5'-PO3-AGC CAG ACT
2.14 (SEQ ID NO:339) (SEQ ID NO:340)
5'-PO3-GCC ACT CGT 5'-PO3-GAG TGG CCT
2.15 (SEQ ID NO:341) (SEQ ID NO:342)
5'-PO3-TGC CTC TGT 5'-PO3-AGA GGC ACT
2.16 (SEQ ID NO:343) (SEQ ID NO:344)
5'-PO3-CAT CGC AGT 5'-PO3-TGC GAT GCT
2.17 (SEQ ID NO:345) (SEQ ID NO:346)
5'-PO3-CAG GAA GGT 5'-PO3-CTT CCT GCT
2.18 (SEQ ID NO:347) (SEQ ID NO:348)
5'-PO3-GGC ATC TGT 5'-PO3-AGA TGC CCT
2.19 (SEQ ID NO:349) (SEQ ID NO:350)
5'-PO3-CGG TGC TGT 5'-PO3-AGC ACC GCT
2.20 (SEQ ID NO:351) (SEQ ID NO:352)
5'-PO3-CAC TGG CGT 5'-PO3-GCC AGT GCT
2.21 (SEQ ID NO:353) (SEQ ID NO:354)
5'-PO3-TCTCCTCGT 5'-PO3-GAGGAGACT
2.22 (SEQ ID NO:355) (SEQ ID NO:356)
2.23 5'-PO3-CCT GTC TGT 5'-PO3-AGA CAG GCT
Petição 870190086182, de 02/09/2019, pág. 124/160
107/141
Número de Sequência de fita
Sequência de fita inferior Marcador superior
2.24 (SEQ ID NO:357) 5'-PO3-CAA CGC TGT (SEQ ID NO:359) (SEQ ID NO:358) 5'-PO3-AGC GTT GCT (SEQ ID NO:360)
5'-PO3-TGC CTC GGT 5'-PO3-CGA GGC ACT
2.25 (SEQ ID NO:361) (SEQ ID NO:362)
5'-PO3-ACA CTG CGT 5'-PO3-GCA GTG TCT
2.26 (SEQ ID NO:363) (SEQ ID NO:364)
5'-PO3-TCG TCC TGT 5'-PO3-AGG ACG ACT
2.27 (SEQ ID NO:365) (SEQ ID NO:366)
5'-PO3-GCT GCC AGT 5'-PO3-TGG CAG CCT
2.28 (SEQ ID NO:367) (SEQ ID NO:368)
5'-PO3-TCA GGC TGT 5'-PO3-AGC CTG ACT
2.29 (SEQ ID NO:369) (SEQ ID NO:370)
5'-PO3-GCC AGG TGT 5'-PO3-ACC TGG CCT
2.30 (SEQ ID NO:371) (SEQ ID NO:372)
5'-PO3-CGG ACC TGT 5'-PO3-AGG TCC GCT
2.31 (SEQ ID NO:373) (SEQ ID NO:374)
5'-PO3-CAA CGC AGT 5'-PO3-TGC GTT GCT
2.32 (SEQ ID NO:375) (SEQ ID NO:376)
5'-PO3-CAC ACG AGT 5'-PO3-TCG TGT GCT
2.33 (SEQ ID NO:377) (SEQ ID NO:378)
5'-PO3-ATG GCC TGT 5'-PO3-AGG CCA TCT
2.34 (SEQ ID NO:379) (SEQ ID NO:380)
5'-PO3-CCA GTC TGT 5'-PO3-AGA CTG GCT
2.35 (SEQ ID NO:381) (SEQ ID NO:382)
5'-PO3-GCC AGG AGT 5'-PO3-TCC TGG CCT
2.36 (SEQ ID NO:383) (SEQ ID NO:384)
5'-PO3-CGG ACC AGT 5'-PO3-TGG TCC GCT
2.37 (SEQ ID NO:385) (SEQ ID NO:386)
5'-PO3-CCT TCG CGT 5'-PO3-GCG AAG GCT
2.38 (SEQ ID NO:387) (SEQ ID NO:388)
2.39 5'-PO3-GCA GCC AGT 5'-PO3-TGG CTG CCT
Petição 870190086182, de 02/09/2019, pág. 125/160
108/141
Número de Sequência de fita Sequência de fita inferior
Marcador superior
(SEQ ID NO:389) (SEQ ID NO:390)
5'-PO3-CCA GTC GGT 5'-PO3-CGA CTG GCT
2.40 (SEQ ID NO:391) (SEQ ID NO:392)
5'-PO3-ACT GAG CGT 5'-PO3-GCT CAG TCT
2.41 (SEQ ID NO:393) (SEQ ID NO:394)
5'-PO3-CCA GTC CGT 5'-PO3-GGA CTG GCT
2.42 (SEQ ID NO:395) (SEQ ID NO:396)
5'-PO3-CCA GTC AGT 5'-PO3-TGA CTG GCT
2.43 (SEQ ID NO:397) (SEQ ID NO:398)
5'-PO3-CAT CGA GGT 5'-PO3-CTC GAT GCT
2.44 (SEQ ID NO:399) (SEQ ID NO:400)
5'-PO3-CCA TCG TGT 5'-PO3-ACG ATG GCT
2.45 (SEQ ID NO:401) (SEQ ID NO:402)
5'-PO3-GTG CTG CGT 5'-PO3-GCA GCA CCT
2.46 (SEQ ID NO:403) (SEQ ID NO:404)
5'-PO3-GAC TAC GGT 5'-PO3-CGT AGT CCT
2.47 (SEQ ID NO:405) (SEQ ID NO:406)
5'-PO3-GTG CTG AGT 5'-PO3-TCA GCA CCT
2.48 (SEQ ID NO:407) (SEQ ID NO:408)
5'-PO3-GCTGCATGT 5'-PO3-ATGCAGCCT
2.49 (SEQ ID NO:409) (SEQ ID NO:410)
5'-PO3-GAGTGGTGT 5'-PO3-ACCACTCCT
2.50 (SEQ ID NO:411) (SEQ ID NO:412)
5'-PO3-GACTACCGT 5'-PO3-GGTAGTCCT
2.51 (SEQ ID NO:413) (SEQ ID NO:414)
5'-PO3-CGGTGATGT 5'-PO3-ATCACCGCT
2.52 (SEQ ID NO:415) (SEQ ID NO:416)
5'-PO3-TGCGACTGT 5'-PO3-AGTCGCACT
2.53 (SEQ ID NO:417) (SEQ ID NO:418)
5'-PO3-TCTGGAGGT 5'-PO3-CTCCAGACT
2.54 (SEQ ID NO:419) (SEQ ID NO:420)
2.55 5'-PO3-AGCACTGGT 5'-PO3-CAGTGCTCT
Petição 870190086182, de 02/09/2019, pág. 126/160
109/141
Número de Marcador Sequência de fita
superior (SEQ ID NO:421) Sequência de fita inferior (SEQ ID NO:422)
5'-PO3-TCGCTTGGT 5'-PO3-CAAGCGACT
2.56 (SEQ ID NO:423) (SEQ ID NO:424)
5'-PO3-AGCACTCGT 5'-PO3-GAGTGCTCT
2.57 (SEQ ID NO:425) (SEQ ID NO:426)
5'-PO3-GCGATTGGT 5'-PO3-CAATCGCCT
2.58 (SEQ ID NO:427) (SEQ ID NO:428)
5'-PO3-CCATCGCGT 5'-PO3-GCGATGGCT
2.59 (SEQ ID NO:429) (SEQ ID NO:430)
5'-PO3-TCGCTTCGT 5'-PO3-GAAGCGACT
2.60 (SEQ ID NO:431) (SEQ ID NO:432)
5'-PO3-AGTGCCTGT 5'-PO3-AGGCACTCT
2.61 (SEQ ID NO:433) (SEQ ID NO:434)
5'-PO3-GGCATAGGT 5'-PO3-CTATGCCCT
2.62 (SEQ ID NO:435) (SEQ ID NO:436)
5'-PO3-GCGATTCGT 5'-PO3-GAATCGCCT
2.63 (SEQ ID NO:437) (SEQ ID NO:438)
5'-PO3-TGCGACGGT 5'-PO3-CGTCGCACT
2.64 (SEQ ID NO:439) (SEQ ID NO:440)
5'-PO3-GAGTGGCGT 5'-PO3-GCCACTCCT
2.65 (SEQ ID NO:441) (SEQ ID NO:442)
5'-PO3-CGGTGAGGT 5'-PO3-CTCACCGCT
2.66 (SEQ ID NO:443) (SEQ ID NO:444)
5'-PO3-GCTGCAAGT 5'-PO3-TTGCAGCCT
2.67 (SEQ ID NO:445) (SEQ ID NO:446)
5'-PO3-TTCCGCTGT 5'-PO3-AGCGGAACT
2.68 (SEQ ID NO:447) (SEQ ID NO:448)
5'-PO3-GAGTGGAGT 5'-PO3-TCCACTCCT
2.69 (SEQ ID NO:449) (SEQ ID NO:450)
5'-PO3-ACAGAGCGT 5'-PO3-GCTCTGTCT
2.70 (SEQ ID NO:451) (SEQ ID NO:452)
2.71 5'-PO3-TGCGACCGT 5'-PO3-GGTCGCACT
Petição 870190086182, de 02/09/2019, pág. 127/160
110/141
Número de Sequência de fita
Sequência de fita inferior Marcador superior
2.72 (SEQ ID NO:453) 5'-PO3-CCTGTAGGT (SEQ ID NO:455) (SEQ ID NO:454) 5'-PO3-CTACAGGCT (SEQ ID NO:456)
5'-PO3-TAGCCGTGT 5'-PO3-ACGGCTACT
2.73 (SEQ ID NO:457) (SEQ ID NO:458)
5'-PO3-TGCGACAGT 5'-PO3-TGTCGCACT
2.74 (SEQ ID NO:459) (SEQ ID NO:460)
5'-PO3-GGTCTGTGT 5'-PO3-ACAGACCCT
2.75 (SEQ ID NO:461) (SEQ ID NO:462)
5'-PO3-CGGTGAAGT 5'-PO3-TTCACCGCT
2.76 (SEQ ID NO:463) (SEQ ID NO:464)
5'-PO3-CAACGAGGT 5'-PO3-CTCGTTGCT
2.77 (SEQ ID NO:465) (SEQ ID NO:466)
5'-PO3-GCAGCATGT 5'-PO3-ATGCTGCCT
2.78 (SEQ ID NO:467) (SEQ ID NO:468)
5'-PO3-TCGTCAGGT 5'-PO3-CTGACGACT
2.79 (SEQ ID NO:469) (SEQ ID NO:470)
5'-PO3-AGTGCCAGT 5'-PO3-TGGCACTCT
2.80 (SEQ ID NO:471) (SEQ ID NO:472)
5'-PO3-TAGAGGCGT 5'-PO3-GCCTCTACT
2.81 (SEQ ID NO:473) (SEQ ID NO:474)
5'-PO3-GTCAGCGGT 5'-PO3-CGCTGACCT
2.82 (SEQ ID NO:475) (SEQ ID NO:476)
5'-PO3-TCAGGAGGT 5'-PO3-CTCCTGACT
2.83 (SEQ ID NO:477) (SEQ ID NO:478)
5'-PO3-AGCAGGTGT 5'-PO3-ACCTGCTCT
2.84 (SEQ ID NO:479 (SEQ ID NO:480)
5'-PO3-TTCCGCAGT 5'-PO3-TGCGGAACT
2.85 (SEQ ID NO:481) (SEQ ID NO:482)
5'-PO3-GTCAGCCGT 5'-PO3-GGCTGACCT
2.86 (SEQ ID NO:483) (SEQ ID NO:484)
2.87 5'-PO3-GGTCTGCGT 5'-PO3-GCAGACCCT
Petição 870190086182, de 02/09/2019, pág. 128/160
111/141
Número de Sequência de fita Sequência de fita inferior
Marcador superior
(SEQ ID NO:485) (SEQ ID NO:486)
5'-PO3-TAGCCGAGT 5'-PO3-TCGGCTACT
2.88 (SEQ ID NO:487) (SEQ ID NO:488)
5'-PO3-GTCAGCAGT 5'-PO3-TGCTGACCT
2.89 (SEQ ID NO:489) (SEQ ID NO:490)
5'-PO3-GGTCTGAGT 5'-PO3-TCAGACCCT
2.90 (SEQ ID NO:491) (SEQ ID NO:492)
5'-PO3-CGGACAGGT 5'-PO3-CTGTCCGCT
2.91 (SEQ ID NO:493) (SEQ ID NO:494)
5'-PO3-TTAGCCGGT5'- 5'-PO3-CGGCTAACT5'-PO3-3'
2.92 PO3-3' (SEQ ID NO:495) (SEQ ID NO:496)
5'-PO3-GAGACGAGT 5'-PO3-TCGTCTCCT
2.93 (SEQ ID NO:497) (SEQ ID NO:498)
5'-PO3-CGTAACCGT 5'-PO3-GGTTACGCT
2.94 (SEQ ID NO:499) (SEQ ID NO:500)
5'-PO3-TTGGCGTGT5'- 5'-PO3-ACGCCAACT5'-PO3-3'
2.95 PO3-3' (SEQ ID NO:501) (SEQ ID NO:502)
5'-PO3-ATGGCAGGT 5'-PO3-CTGCCATCT
2.96 (SEQ ID NO:503) (SEQ ID NO:504)
Tabela 5. Marcadores de oligonucleotídeo usados no ciclo 3
Número de Sequência de fita Sequência de fita inferior
Marcador superior
5'-PO3-CAG CTA CGA 5'-PO3-GTA GCT GAC
3.1 (SEQ ID NO:505) (SEQ ID NO:506)
5'-PO3-CTC CTG CGA 5'-PO3-GCA GGA GAC
3.2 (SEQ ID NO:507) (SEQ ID NO:508)
5'-PO3-GCT GCC TGA 5'-PO3-AGG CAG CAC
3.3 (SEQ ID NO:509) (SEQ ID NO:510)
3.4 5'-PO3-CAG GAA CGA 5'-PO3-GTT CCT GAC
Petição 870190086182, de 02/09/2019, pág. 129/160
112/141
Número de
Marcador
3.5
3.6
3.7
3.8
3.9
3.10
3.11
3.12
3.13
3.14
3.15
3.16
3.17
3.18
3.19
Sequência de fita superior (SEQ ID NO:511) 5'-PO3-CAC ACG CGA (SEQ ID NO:513) 5'-PO3-GCA GCC TGA (SEQ ID NO:515) 5'-PO3-CTG AAC GGA (SEQ ID NO:517) 5'-PO3-CTG AAC CGA (SEQ ID NO:519) 5'-PO3-TCT GGA CGA (SEQ ID NO:521) 5'-PO3-TGC CTA CGA (SEQ ID NO:523) 5'-PO3-GGC ATA CGA (SEQ ID NO:525) 5'-PO3-CGG TGA CGA (SEQ ID NO:527) 5'-PO3-CAA CGA CGA (SEQ ID NO:529) 5'-PO3-CTC CTC TGA (SEQ ID NO:531) 5'-PO3-TCA GGA CGA (SEQ ID NO:533) 5'-PO3-AAA GGC GGA (SEQ ID NO:535) 5'-PO3-CTC CTC GGA (SEQ ID NO:537) 5'-PO3-CAG ATG CGA (SEQ ID NO:539) 5'-PO3-GCA GCA AGA (SEQ ID NO:541)
Sequência de fita inferior (SEQ ID NO:512) 5'-PO3-GCG TGT GAC (SEQ ID NO:514) 5'-PO3-AGG CTG CAC (SEQ ID NO:516) 5'-PO3-CGT TCA GAC (SEQ ID NO:518) 5'-PO3-GGT TCA GAC (SEQ ID NO:520) 5'-PO3-GTC CAG AAC (SEQ ID NO:522) 5'-PO3-GTA GGC AAC (SEQ ID NO:524) 5'-PO3-GTA TGC CAC (SEQ ID NO:526) 5'-PO3-GTC ACC GAC (SEQ ID NO:528) 5'-PO3-GTC GTT GAC (SEQ ID NO:530) 5'-PO3-AGA GGA GAC (SEQ ID NO:532) 5'-PO3-GTC CTG AAC (SEQ ID NO:534) 5'-PO3-CGC CTT TAC (SEQ ID NO:536) 5'-PO3-CGA GGA GAC (SEQ ID NO:538) 5'-PO3-GCA TCT GAC (SEQ ID NO:540) 5'-PO3-TTG CTG CAC (SEQ ID NO:542)
Petição 870190086182, de 02/09/2019, pág. 130/160
113/141
Número de Sequência de fita Sequência de fita inferior
Marcador superior
5'-PO3-GTG GAG TGA 5'-PO3-ACT CCA CAC
3.20 (SEQ ID NO:543) (SEQ ID NO:544)
5'-PO3-CCA GTA GGA 5'-PO3-CTA CTG GAC
3.21 (SEQ ID NO:545) (SEQ ID NO:546)
5'-PO3-ATG GCA CGA 5'-PO3-GTG CCA TAC
3.22 (SEQ ID NO:547) (SEQ ID NO:548)
5'-PO3-GGA CTG TGA 5'-PO3-ACA GTC CAC
3.23 (SEQ ID NO:549) (SEQ ID NO:550)
5'-PO3-CCG AAC TGA 5'-PO3-AGT TCG GAC
3.24 (SEQ ID NO:551) (SEQ ID NO:552)
5'-PO3-CTC CTC AGA 5'-PO3-TGA GGA GAC
3.25 (SEQ ID NO:553) (SEQ ID NO:554)
5'-PO3-CAC TGC TGA 5'-PO3-AGC AGT GAC
3.26 (SEQ ID NO:555) (SEQ ID NO:556)
5'-PO3-AGC AGG CGA 5'-PO3-GCC TGC TAC
3.27 (SEQ ID NO:557) (SEQ ID NO:558)
5'-PO3-AGC AGG AGA 5'-PO3-TCC TGC TAC
3.28 (SEQ ID NO:559) (SEQ ID NO:560)
5'-PO3-AGA GCC AGA 5'-PO3-TGG CTC TAC
3.29 (SEQ ID NO:561) (SEQ ID NO:562)
5'-PO3-GTC GTT GGA 5'-PO3-CAA CGA CAC
3.30 (SEQ ID NO:563) (SEQ ID NO:564)
5'-PO3-CCG AAC GGA 5'-PO3-CGT TCG GAC
3.31 (SEQ ID NO:565) (SEQ ID NO:566)
5'-PO3-CAC TGC GGA 5'-PO3-CGC AGT GAC
3.32 (SEQ ID NO:567) (SEQ ID NO:568)
5'-PO3-GTG GAG CGA 5'-PO3-GCT CCA CAC
3.33 (SEQ ID NO:569) (SEQ ID NO:570)
5'-PO3-GTG GAG AGA 5'-PO3-TCT CCA CAC
3.34 (SEQ ID NO:571) (SEQ ID NO:572)
3.35 5'-PO3-GGA CTG CGA 5'-PO3-GCA GTC CAC
Petição 870190086182, de 02/09/2019, pág. 131/160
114/141
Número de Marcador 3.36 Sequência de fita superior (SEQ ID NO:573) 5'-PO3-CCG AAC CGA (SEQ ID NO:575) Sequência de fita inferior (SEQ ID NO:574) 5'-PO3-GGT TCG GAC (SEQ ID NO:576)
5'-PO3-CAC TGC CGA 5'-PO3-GGC AGT GAC
3.37 (SEQ ID NO:577) (SEQ ID NO:578)
5'-PO3-CGA AAC GGA 5'-PO3-CGT TTC GAC
3.38 (SEQ ID NO:579) (SEQ ID NO:580)
5'-PO3-GGA CTG AGA 5'-PO3-TCA GTC CAC
3.39 (SEQ ID NO:581) (SEQ ID NO:582)
5'-PO3-CCG AAC AGA 5'-PO3-TGT TCG GAC
3.40 (SEQ ID NO:583) (SEQ ID NO:584)
5'-PO3-CGA AAC CGA 5'-PO3-GGT TTC GAC
3.41 (SEQ ID NO:585) (SEQ ID NO:586)
5'-PO3-CTG GCT TGA 5'-PO3-AAG CCA GAC
3.42 (SEQ ID NO:587) (SEQ ID NO:588)
5'-PO3-CAC ACC TGA 5'-PO3-AGG TGT GAC
3.43 (SEQ ID NO:589) (SEQ ID NO:590)
5'-PO3-AAC GAC CGA 5'-PO3-GGT CGT TAC
3.44 (SEQ ID NO:591) (SEQ ID NO:592)
5'-PO3-ATC CAG CGA 5'-PO3-GCT GGA TAC
3.45 (SEQ ID NO:593) (SEQ ID NO:594)
5'-PO3-TGC GAA GGA 5'-PO3-CTT CGC AAC
3.46 (SEQ ID NO:595) (SEQ ID NO:596)
5'-PO3-TGC GAA CGA 5'-PO3-GTT CGC AAC
3.47 (SEQ ID NO:597) (SEQ ID NO:598)
5'-PO3-CTG GCT GGA 5'-PO3-CAG CCA GAC
3.48 (SEQ ID NO:599) (SEQ ID NO:600)
5'-PO3-CAC ACC GGA 5'-PO3-CGG TGT GAC
3.49 (SEQ ID NO:601) (SEQ ID NO:602)
3.50 5'-PO3-AGT GCA GGA 5'-PO3-CTG CAC TAC
Petição 870190086182, de 02/09/2019, pág. 132/160
115/141
Número de Sequência de fita Sequência de fita inferior
Marcador superior
(SEQ ID NO:603) (SEQ ID NO:604)
5'-PO3-GAC CGT TGA 5'-PO3-AAC GGT CAC
3.51 (SEQ ID NO:605) (SEQ ID NO:606)
5'-PO3-GGT GAG TGA 5'-PO3-ACT CAC CAC
3.52 (SEQ ID NO:607) (SEQ ID NO:608)
5'-PO3-CCT TCC TGA 5'-PO3-AGG AAG GAC
3.53 (SEQ ID NO:609) (SEQ ID NO:610)
5'-PO3-CTG GCT AGA 5'-PO3-TAG CCA GAC
3.54 (SEQ ID NO:611) (SEQ ID NO:612)
5'-PO3-CAC ACC AGA 5'-PO3-TGG TGT GAC
3.55 (SEQ ID NO:613) (SEQ ID NO:614)
5'-PO3-AGC GGT AGA 5'-PO3-TAC CGC TAC
3.56 (SEQ ID NO:615) (SEQ ID NO:616)
5'-PO3-GTC AGA GGA 5'-PO3-CTC TGA CAC
3.57 (SEQ ID NO:617) (SEQ ID NO:618)
5'-PO3-TTC CGA CGA 5'-PO3-GTC GGA AAC
3.58 (SEQ ID NO:619) (SEQ ID NO:620)
5'-PO3-AGG CGT AGA 5'-PO3-TAC GCC TAC
3.59 (SEQ ID NO:621) (SEQ ID NO:622)
5'-PO3-CTC GAC TGA 5'-PO3-AGT CGA GAC
3.60 (SEQ ID NO:623) (SEQ ID NO:624)
5'-PO3-TAC GCT GGA 5'-PO3-CAG CGT AAC
3.61 (SEQ ID NO:625) (SEQ ID NO:626)
5'-PO3-GTT CGG TGA 5'-PO3-ACC GAA CAC
3.62 (SEQ ID NO:627) (SEQ ID NO:628)
5'-PO3-GCC AGC AGA 5'-PO3-TGC TGG CAC
3.63 (SEQ ID NO:629) (SEQ ID NO:630)
5'-PO3-GAC CGT AGA 5'-PO3-TAC GGT CAC
3.64 (SEQ ID NO:631) (SEQ ID NO:632)
5'-PO3-GTG CTC TGA 5'-PO3-AGA GCA CAC
3.65 (SEQ ID NO:633) (SEQ ID NO:634)
Petição 870190086182, de 02/09/2019, pág. 133/160
116/141
Número de Sequência de fita Sequência de fita inferior
Marcador superior
5'-PO3-GGT GAG CGA 5'-PO3-GCT CAC CAC
3.66 (SEQ ID NO:635) (SEQ ID NO:636)
5'-PO3-GGT GAG AGA 5'-PO3-TCT CAC CAC
3.67 (SEQ ID NO:637) (SEQ ID NO:638)
5'-PO3-CCT TCC AGA 5'-PO3-TGG AAG GAC
3.68 (SEQ ID NO:639) (SEQ ID NO:640)
5'-PO3-CTC CTA CGA 5'-PO3-GTA GGA GAC
3.69 (SEQ ID NO:641) (SEQ ID NO:642)
5'-PO3-CTC GAC GGA 5'-PO3-CGT CGA GAC
3.70 (SEQ ID NO:643) (SEQ ID NO:644)
5'-PO3-GCC GTT TGA 5'-PO3-AAA CGG CAC
3.71 (SEQ ID NO:645) (SEQ ID NO:646)
5'-PO3-GCG GAG TGA 5'-PO3-ACT CCG CAC
3.72 (SEQ ID NO:647) (SEQ ID NO:648)
5'-PO3-CGT GCT TGA 5'-PO3-AAG CAC GAC
3.73 (SEQ ID NO:649) (SEQ ID NO:650)
5'-PO3-CTC GAC CGA 5'-PO3-GGT CGA GAC
3.74 (SEQ ID NO:651) (SEQ ID NO:652)
5'-PO3-AGA GCA GGA 5'-PO3-CTG CTC TAC
3.75 (SEQ ID NO:653) (SEQ ID NO:654)
5'-PO3-GTG CTC GGA 5'-PO3-CGA GCA CAC
3.76 (SEQ ID NO:655) (SEQ ID NO:656)
5'-PO3-CTC GAC AGA 5'-PO3-TGT CGA GAC
3.77 (SEQ ID NO:657) (SEQ ID NO:658)
5'-PO3-GGA GAG TGA 5'-PO3-ACT CTC CAC
3.78 (SEQ ID NO:659) (SEQ ID NO:660)
5'-PO3-AGG CTG TGA 5'-PO3-ACA GCC TAC
3.79 (SEQ ID NO:661) (SEQ ID NO:662)
5'-PO3-AGA GCA CGA 5'-PO3-GTG CTC TAC
3.80 (SEQ ID NO:663) (SEQ ID NO:664)
3.81 5'-PO3-CCA TCC TGA 5'-PO3-AGG ATG GAC
Petição 870190086182, de 02/09/2019, pág. 134/160
117/141
Número de Sequência de fita Sequência de fita inferior
Marcador superior
(SEQ ID NO:665) (SEQ ID NO:666)
5'-PO3-GTT CGG AGA 5'-PO3-TCC GAA CAC
3.82 (SEQ ID NO:667) (SEQ ID NO:668)
5'-PO3-TGG TAG CGA 5'-PO3-GCT ACC AAC
3.83 (SEQ ID NO:669) (SEQ ID NO:670)
5'-PO3-GTG CTC CGA 5'-PO3-GGA GCA CAC
3.84 (SEQ ID NO:671) (SEQ ID NO:672)
5'-PO3-GTG CTC AGA 5'-PO3-TGA GCA CAC
3.85 (SEQ ID NO:673) (SEQ ID NO:674)
5'-PO3-GCC GTT GGA 5'-PO3-CAA CGG CAC
3.86 (SEQ ID NO:675) (SEQ ID NO:676)
5'-PO3-GAG TGC TGA 5'-PO3-AGC ACT CAC
3.87 (SEQ ID NO:677) (SEQ ID NO:678)
5'-PO3-GCT CCT TGA 5'-PO3-AAG GAG CAC
3.88 (SEQ ID NO:679) (SEQ ID NO:680)
5'-PO3-CCG AAA GGA 5'-PO3-CTT TCG GAC
3.89 (SEQ ID NO:681) (SEQ ID NO:682)
5'-PO3-CAC TGA GGA 5'-PO3-CTC AGT GAC
3.90 (SEQ ID NO:683) (SEQ ID NO:684)
5'-PO3-CGT GCT GGA 5'-PO3-CAG CAC GAC
3.91 (SEQ ID NO:685) (SEQ ID NO:686)
5'-PO3-CCG AAA CGA 5'-PO3-GTT TCG GAC
3.92 (SEQ ID NO:687) (SEQ ID NO:688)
5'-PO3-GCG GAG AGA 5'-PO3-TCT CCG CAC
3.93 (SEQ ID NO:689) (SEQ ID NO:690)
5'-PO3-GCC GTT AGA 5'-PO3-TAA CGG CAC
3.94 (SEQ ID NO:691) (SEQ ID NO:692)
5'-PO3-TCT CGT GGA 5'-PO3-CAC GAG AAC
3.95 (SEQ ID NO:693) (SEQ ID NO:694)
3.96 5'-PO3-CGT GCT AGA 5'-PO3-TAG CAC GAC
Petição 870190086182, de 02/09/2019, pág. 135/160
118/141
Número de Marcador i Sequência de fita
superior (SEQ ID NO:695) Sequência de fita inferior (SEQ ID NO:696)
Tabela 6. Marcadores de oligonucleotídeo usados no ciclo 4
Número
de Sequência de fita superior Sequência de fita inferior
Marcador
5'-PO3-GCCTGTCTT 5'-PO3-GAC AGG CTC
4.1 (SEQ ID NO:697) (SEQ ID NO:698)
5'-PO3-CTCCTGGTT 5'-PO3-CCA GGA GTC
4.2 (SEQ ID NO:699) (SEQ ID NO:700)
5'-PO3-ACTCTGCTT 5'-PO3-GCA GAG TTC
4.3 (SEQ ID NO:701) (SEQ ID NO:702)
5'-PO3-CATCGCCTT 5'-PO3-GGC GAT GTC
4.4 (SEQ ID NO:703) (SEQ ID NO:704)
5'-PO3-GCCACTATT 5'-PO3-TAG TGG CTC
4.5 (SEQ ID NO:705) (SEQ ID NO:706)
5'-PO3-CACACGGTT 5'-PO3-CCG TGT GTC
4.6 (SEQ ID NO:707) (SEQ ID NO:708)
5'-PO3-CAACGCCTT 5'-PO3-GGC GTT GTC
4.7 (SEQ ID NO:709) (SEQ ID NO:710)
5'-PO3-ACTGAGGTT 5'-PO3-CCT CAG TTC
4.8 (SEQ ID NO:711) (SEQ ID NO:712)
5'-PO3-GTGCTGGTT 5'-PO3-CCA GCA CTC
4.9 (SEQ ID NO:713) (SEQ ID NO:714)
5'-PO3-CATCGACTT 5'-PO3-GTC GAT GTC
4.10 (SEQ ID NO:715) (SEQ ID NO:716)
5'-PO3-CCATCGGTT 5'-PO3-CCG ATG GTC
4.11 (SEQ ID NO:717) (SEQ ID NO:718)
5'-PO3-GCTGCACTT 5'-PO3-GTG CAG CTC
4.12 (SEQ ID NO:719) (SEQ ID NO:720)
5'-PO3-ACAGAGGTT 5'-PO3-CCT CTG TTC
4.13 (SEQ ID NO:721) (SEQ ID NO:722)
Petição 870190086182, de 02/09/2019, pág. 136/160
119/141
Número de Sequência de fita superior Sequência de fita inferior
Marcador 5'-PO3-AGTGCCGTT 5'-PO3-CGG CAC TTC
4.14 (SEQ ID NO:723) (SEQ ID NO:724)
5'-PO3-CGGACATTT 5'-PO3-ATG TCC GTC
4.15 (SEQ ID NO:725) (SEQ ID NO:726)
5'-PO3-GGTCTGGTT 5'-PO3-CCA GAC CTC
4.16 (SEQ ID NO:727) (SEQ ID NO:728)
5'-PO3-GAGACGGTT 5'-PO3-CCG TCT CTC
4.17 (SEQ ID NO:729) (SEQ ID NO:730)
5'-PO3-CTTTCCGTT 5'-PO3-CGG AAA GTC
4.18 (SEQ ID NO:731) (SEQ ID NO:732)
5'-PO3-CAGATGGTT 5'-PO3-CCA TCT GTC
4.19 (SEQ ID NO:733) (SEQ ID NO:734)
5'-PO3-CGGACACTT 5'-PO3-GTG TCC GTC
4.20 (SEQ ID NO:735) (SEQ ID NO:736)
5'-PO3-ACTCTCGTT 5'-PO3-CGA GAG TTC
4.21 (SEQ ID NO:737) (SEQ ID NO:738)
5'-PO3-GCAGCACTT 5'-PO3-GTG CTG CTC
4.22 (SEQ ID NO:739) (SEQ ID NO:740)
5'-PO3-ACTCTCCTT 5'-PO3-GGA GAG TTC
4.23 (SEQ ID NO:741) (SEQ ID NO:742)
5'-PO3-ACCTTGGTT 5'-PO3-CCA AGG TTC
4.24 (SEQ ID NO:743) (SEQ ID NO:744)
5'-PO3-AGAGCCGTT 5'-PO3-CGG CTC TTC
4.25 (SEQ ID NO:745) (SEQ ID NO:746)
5'-PO3-ACCTTGCTT 5'-PO3-GCA AGG TTC
4.26 (SEQ ID NO:747) (SEQ ID NO:748)
5'-PO3-AAGTCCGTT 5'-PO3-CGG ACT TTC
4.27 (SEQ ID NO:749) (SEQ ID NO:750)
5'-PO3-GGA CTG GTT 5'-PO3-CCA GTC CTC
4.28 (SEQ ID NO:751) (SEQ ID NO:752)
4.29 5'-PO3-GTCGTTCTT 5'-PO3-GAA CGA CTC
Petição 870190086182, de 02/09/2019, pág. 137/160
120/141
Número de Sequência de fita superior Sequência de fita inferior
Marcador
(SEQ ID NO:753) (SEQ ID NO:754)
4.30 5'-PO3-CAGCATCTT 5'-PO3-GAT GCT GTC
(SEQ ID NO:755) (SEQ ID NO:756)
4.31 5'-PO3-CTATCCGTT 5'-PO3-CGG ATA GTC
(SEQ ID NO:757) (SEQ ID NO:758)
4.32 5'-PO3-ACACTCGTT 5'-PO3-CGA GTG TTC
(SEQ ID NO:759) (SEQ ID NO:760)
4.33 5'-PO3-ATCCAGGTT 5'-PO3-CCT GGA TTC
(SEQ ID NO:761) (SEQ ID NO:762)
4.34 5'-PO3-GTTCCTGTT 5'-PO3-CAG GAA CTC
(SEQ ID NO:763) (SEQ ID NO:764)
4.35 5'-PO3-ACACTCCTT 5'-PO3-GGA GTG TTC
(SEQ ID NO:765) (SEQ ID NO:766)
4.36 5'-PO3-GTTCCTCTT 5'-PO3-GAG GAA CTC
(SEQ ID NO:767) (SEQ ID NO:768)
4.37 5'-PO3-CTGGCTCTT 5'-PO3-GAG CCA GTC
(SEQ ID NO:769) (SEQ ID NO:770)
4.38 5'-PO3-ACGGCATTT 5'-PO3-ATG CCG TTC
(SEQ ID NO:771) (SEQ ID NO:772)
4.39 5'-PO3-GGTGAGGTT 5'-PO3-CCT CAC CTC
(SEQ ID NO:773) (SEQ ID NO:774)
4.40 5'-PO3-CCTTCCGTT 5'-PO3-CGG AAG GTC
(SEQ ID NO:775) (SEQ ID NO:776)
4.41 5'-PO3-TACGCTCTT 5'-PO3-GAG CGT ATC
(SEQ ID NO:777) (SEQ ID NO:778)
4.42 5'-PO3-ACGGCAGTT 5'-PO3-CTG CCG TTC
(SEQ ID NO:779) (SEQ ID NO:780
4.43 5'-PO3-ACTGACGTT 5'-PO3-CGT CAG TTC
(SEQ ID NO:781) (SEQ ID NO:782)
4.44 5'-PO3-ACGGCACTT 5'-PO3-GTG CCG TTC
(SEQ ID NO:783) (SEQ ID NO:784)
Petição 870190086182, de 02/09/2019, pág. 138/160
121/141
Número de Sequência de fita superior Sequência de fita inferior
Marcador 5'-PO3-ACTGACCTT 5'-PO3-GGT CAG TTC
4.45 (SEQ ID NO:785) (SEQ ID NO:786)
5'-PO3-TTTGCGGTT 5'-PO3-CCG CAA ATC
4.46 (SEQ ID NO:787) (SEQ ID NO:788)
5'-PO3-TGGTAGGTT 5'-PO3-CCT ACC ATC
4.47 (SEQ ID NO:789) (SEQ ID NO:790)
5'-PO3-GTTCGGCTT 5'-PO3-GCC GAA CTC
4.48 (SEQ ID NO:791) (SEQ ID NO:792)
5'-PO3-GCC GTT CTT 5'-PO3-GAA CGG CTC
4.49 (SEQ ID NO:793) (SEQ ID NO:794)
5'-PO3-GGAGAGGTT 5'-PO3-CCT CTC CTC
4.50 (SEQ ID NO:795) (SEQ ID NO:796)
5'-PO3-CACTGACTT 5'-PO3-GTC AGT GTC
4.51 (SEQ ID NO:797) (SEQ ID NO:798)
5'-PO3-CGTGCTCTT 5'-PO3-GAG CAC GTC
4.52 (SEQ ID NO:799) (SEQ ID NO:800)
5'-PO3-AATCCGCTT 5'-PO3-GCGGATTTC
4.53 (SEQ ID NO:801) (SEQ ID NO:802)
5'-PO3-AGGCTGGTT 5'-PO3-CCA GCC TTC
4.54 (SEQ ID NO:803) (SEQ ID NO:804)
5'-PO3-GCTAGTGTT 5'-PO3-CAC TAG CTC
4.55 (SEQ ID NO:805) (SEQ ID NO:806)
5'-PO3-GGAGAGCTT 5'-PO3-GCT CTC CTC
4.56 (SEQ ID NO:807) (SEQ ID NO:808)
5'-PO3-GGAGAGATT 5'-PO3-TCT CTC CTC
4.57 (SEQ ID NO:809) (SEQ ID NO:810)
5'-PO3-AGGCTGCTT 5'-PO3-GCA GCC TTC
4.58 (SEQ ID NO:811) (SEQ ID NO:812)
5'-PO3-GAGTGCGTT 5'-PO3-CGC ACT CTC
4.59 (SEQ ID NO:813) (SEQ ID NO:814)
4.60 5'-PO3-CCATCCATT 5'-PO3-TGG ATG GTC
Petição 870190086182, de 02/09/2019, pág. 139/160
122/141
Número
de Sequência de fita superior Sequência de fita inferior
Marcador (SEQ ID NO:815) (SEQ ID NO:816)
5’-PO3-GCIAGICII 5’-PO3-GAC IAG CIC
4.61 (SEQ ID NO:817) (SEQ ID NO:818)
5’-PO3-AGGCIGAII 5’-PO3-ICA GCC IIC
4.62 (SEQ ID NO:819) (SEQ ID NO:820)
5’-PO3-ACAGACGII 5’-PO3-CGI CIG IIC
4.63 (SEQ ID NO:821) (SEQ ID NO:822)
5’-PO3-GAGIGCCII 5’-PO3-GGC ACI CIC
4.64 (SEQ ID NO:823) (SEQ ID NO:824)
5’-PO3-ACAGACCII 5’-PO3-GGI CIG IIC
4.65 (SEQ ID NO:825) (SEQ ID NO:826)
5’-PO3-CGAGC 1 III 5’-PO3-AAG CIC GIC
4.66 (SEQ ID NO:827) (SEQ ID NO:828)
5’-PO3-IIAGCGGII 5’-PO3-CCG CIA AIC
4.67 (SEQ ID NO:829) (SEQ ID NO:830)
5’-PO3-CCICIIGII 5’-PO3-CAA GAG GIC
4.68 (SEQ ID NO:831) (SEQ ID NO:832)
5’-PO3-GGICICIII 5’-PO3-AGA GAC CIC
4.69 (SEQ ID NO:833) (SEQ ID NO:834)
5’-PO3-GCCAGAIII 5’-PO3-AIC IGG CIC
4.70 (SEQ ID NO:835) (SEQ ID NO:836)
5’-PO3-GAGACCIII 5’-PO3-AGG ICI CIC
4.71 (SEQ ID NO:837) (SEQ ID NO:838)
5’-PO3-CACACAGII 5’-PO3-CIG IGI GIC
4.72 (SEQ ID NO:839) (SEQ ID NO:840)
5’-PO3-CCICIICII 5’-PO3-GAA GAG GIC
4.73 (SEQ ID NO:841) (SEQ ID NO:842)
5’-PO3-IAGAGCGII 5’-PO3-CGC ICI AIC
4.74 (SEQ ID NO:843) (SEQ ID NO:844)
5’-PO3-GCACC I III 5’-PO3-AAG GIG CIC
4.75 (SEQ ID NO:845) (SEQ ID NO:846)
Petição 870190086182, de 02/09/2019, pág. 140/160
123/141
Número de Sequência de fita superior Sequência de fita inferior
Marcador 5'-PO3-GGCTTGTTT 5'-PO3-ACA AGC CTC
4.76 (SEQ ID NO:847) (SEQ ID NO:848)
5'-PO3-GACGCGATT 5'-PO3-TCG CGT CTC
4.77 (SEQ ID NO:849) (SEQ ID NO:850)
5'-PO3-CGAGCTGTT 5'-PO3-CAG CTC GTC
4.78 (SEQ ID NO:851) (SEQ ID NO:852)
5'-PO3-TAGAGCCTT 5'-PO3-GGC TCT ATC
4.79 (SEQ ID NO:853) (SEQ ID NO:854)
5'-PO3-CATCCGTTT 5'-PO3-ACG GAT GTC
4.80 (SEQ ID NO:855) (SEQ ID NO:856)
5'-PO3-GGTCTCGTT 5'-PO3-CGA GAC CTC
4.81 (SEQ ID NO:857) (SEQ ID NO:858)
5'-PO3-GCCAGAGTT 5'-PO3-CTC TGG CTC
4.82 (SEQ ID NO:859) (SEQ ID NO:860)
5'-PO3-GAGACCGTT 5'-PO3-CGG TCT CTC
4.83 (SEQ ID NO:861) (SEQ ID NO:862)
5'-PO3-CGAGCTATT 5'-PO3-TAG CTC GTC
4.84 (SEQ ID NO:863) (SEQ ID NO:864)
5'-PO3-GCAAGTGTT 5'-PO3-CAC TTG CTC
4.85 (SEQ ID NO:865) (SEQ ID NO:866)
5'-PO3-GGTCTCCTT 5'-PO3-GGA GAC CTC
4.86 (SEQ ID NO:867) (SEQ ID NO:868)
5'-PO3-GCCAGACTT 5'-PO3-GTC TGG CTC
4.87 (SEQ ID NO:869) (SEQ ID NO:870)
5'-PO3-GGTCTCATT 5'-PO3-TGA GAC CTC
4.88 (SEQ ID NO:871) (SEQ ID NO:872)
5'-PO3-GAGACCATT 5'-PO3-TGG TCT CTC
4.89 (SEQ ID NO:873) (SEQ ID NO:874)
5'-PO3-CCTTCAGTT 5'-PO3-CTG AAG GTC
4.90 (SEQ ID NO:875) (SEQ ID NO:876)
4.91 5'-PO3-GCACCTGTT 5'-PO3-CAG GTG CTC
Petição 870190086182, de 02/09/2019, pág. 141/160
124/141
Número de Sequência de fita superior Sequência de fita inferior
Marcador
(SEQ ID NO:877) (SEQ ID NO:878)
4.92 5'-PO3-AAAGGCGTT 5'-PO3-CGC CTT TTC
(SEQ ID NO:879) (SEQ ID NO:880)
4.93 5'-PO3-CAGATCGTT 5'-PO3-CGA TCT GTC
(SEQ ID NO:881) (SEQ ID NO:882)
4.94 5'-PO3-CATAGGCTT 5'-PO3-GCC TAT GTC
(SEQ ID NO:883) (SEQ ID NO:884)
4.95 5'-PO3-CCTTCACTT 5'-PO3-GTG AAG GTC
(SEQ ID NO:885) (SEQ ID NO:886)
4.96 5'-PO3-GCACCTCTT 5'-PO3-GAG GTG CTC
(SEQ ID NO:887) (SEQ ID NO:888)
Tabela 7: Correspondência entre os blocos de construção e marcadores de oligonucleotídeo de Ciclos 1-4.
Bloco de Construção Ciclo 1 Ciclo 2 Ciclo 3 Ciclo 4
BB1 1,1 2,1 3,1 4,1
BB2 1,2 2,2 3,2 4,2
BB3 1,3 2,3 3,3 4,3
BB4 1,4 2,4 3,4 4,4
BB5 1,5 2,5 3,5 4,5
BB6 1,6 2,6 3,6 4,6
BB7 1,7 2,7 3,7 4,7
BB8 1,8 2,8 3,8 4,8
BB9 1,9 2,9 3,9 4,9
BB10 1,10 2,10 3,10 4,10
BB11 1,11 2,11 3,11 4,11
BB12 1,12 2,12 3,12 4,12
BB13 1,13 2,13 3,13 4,13
BB14 1,14 2,14 3,14 4,14
BB15 1,15 2,15 3,15 4,15
Petição 870190086182, de 02/09/2019, pág. 142/160
125/141
Bloco de Construção Ciclo 1 Ciclo 2 Ciclo 3 Ciclo 4
BB16 1,16 2,16 3,16 4,16
BB17 1,17 2,17 3,17 4,17
BB18 1,18 2,18 3,18 4,18
BB19 1,19 2,19 3,19 4,19
BB20 1,20 2,20 3,20 4,20
BB21 1,21 2,21 3,21 4,21
BB22 1,22 2,22 3,22 4,22
BB23 1,23 2,23 3,23 4,23
BB24 1,24 2,24 3,24 4,24
BB25 1,25 2,25 3,25 4,25
BB26 1,26 2,26 3,26 4,26
BB27 1,27 2,27 3,27 4,27
BB28 1,28 2,28 3,28 4,28
BB29 1,29 2,29 3,29 4,29
BB30 1,30 2,30 3,30 4,30
BB31 1,31 2,31 3,31 4,31
BB32 1,32 2,32 3,32 4,32
BB33 1,33 2,33 3,33 4,33
BB34 1,34 2,34 3,34 4,34
BB35 1,35 2,35 3,35 4,35
BB36 1,36 2,36 3,36 4,36
BB37 1,37 2,37 3,37 4,37
BB38 1,38 2,38 3,38 4,38
BB39 1,39 2,39 3,39 4,39
BB40 1,44 2,44 3,44 4,44
BB41 1,41 2,41 3,41 4,41
BB42 1,42 2,42 3,42 4,42
BB43 1,43 2,43 3,43 4,43
BB44 1,40 2,40 3,40 4,40
BB45 1,45 2,45 3,45 4,45
Petição 870190086182, de 02/09/2019, pág. 143/160
126/141
Bloco de Construção Ciclo 1 Ciclo 2 Ciclo 3 Ciclo 4
BB46 1,46 2,46 3,46 4,46
BB47 1,47 2,47 3,47 4,47
BB48 1,48 2,48 3,48 4,48
BB49 1,49 2,49 3,49 4,49
BB50 1,50 2,50 3,50 4,50
BB51 1,51 2,51 3,51 4,51
BB52 1,52 2,52 3,52 4,52
BB53 1,53 2,53 3,53 4,53
BB54 1,54 2,54 3,54 4,54
BB55 1,55 2,55 3,55 4,55
BB56 1,56 2,56 3,56 4,56
BB57 1,57 2,57 3,57 4,57
BB58 1,58 2,58 3,58 4,58
BB59 1,59 2,59 3,59 4,59
BB60 1,60 2,60 3,60 4,60
BB61 1,61 2,61 3,61 4,61
BB62 1,62 2,62 3,62 4,62
BB63 1,63 2,63 3,63 4,63
BB64 1,64 2,64 3,64 4,64
BB65 1,65 2,65 3,65 4,65
BB66 1,66 2,66 3,66 4,66
BB67 1,67 2,67 3,67 4,67
BB68 1,68 2,68 3,68 4,68
BB69 1,69 2,69 3,69 4,69
BB70 1,70 2,70 3,70 4,70
BB71 1,71 2,71 3,71 4,71
BB72 1,72 2,72 3,72 4,72
BB73 1,73 2,73 3,73 4,73
BB74 1,74 2,74 3,74 4,74
BB75 1,75 2,75 3,75 4,75
Petição 870190086182, de 02/09/2019, pág. 144/160
127/141
Bloco de Construção Ciclo 1 Ciclo 2 Ciclo 3 Ciclo 4
BB76 1,76 2,76 3,76 4,76
BB77 1,77 2,77 3,77 4,77
BB78 1,78 2,78 3,78 4,78
BB79 1,79 2,79 3,79 4,79
BB80 1,80 2,80 3,80 4,80
BB81 1,81 2,81 3,81 4,81
BB82 1,82 2,82 3,82 4,82
BB83 1,96 2,96 3,96 4,96
BB84 1,83 2,83 3,83 4,83
BB85 1,84 2,84 3,84 4,84
BB86 1,85 2,85 3,85 4,85
BB87 1,86 2,86 3,86 4,86
BB88 1,87 2,87 3,87 4,87
BB89 1,88 2,88 3,88 4,88
BB90 1,89 2,89 3,89 4,89
BB91 1,90 2,90 3,90 4,90
BB92 1,91 2,91 3,91 4,91
BB93 1,92 2,92 3,92 4,92
BB94 1,93 2,93 3,93 4,93
BB95 1,94 2,94 3,94 4,94
BB96 1,95 2,95 3,95 4,95
1X tampão ligase: 50 mM de Tris, pH 7,5; 10 mM de
ditiotreitol; 10 mM de MgCb; 2mM de ATP; 50 mM de NaCl.
10X tampão ligase: 500 mM de Tris, pH 7,5; 100 mM de ditiotreitol; 100 mM de MgCl2; 20 mM de ATP; 500 mM de NaCl
Fixação de Espaçador Solúvel em Água ao Composto 2 [00175] A uma solução de Composto 2 (60 mL, 1 mM) em tampão borato de sódio (150 mM, pH 9,4) que foi resfriado até 4°C foram adicionados 40 equivalentes de N-Fmoc-15-amino 4,7,10,13-ácido tetraoxaoctadecanóico (S-Ado) em N,N-dimetilformamida (DMF) (16
Petição 870190086182, de 02/09/2019, pág. 145/160
128/141 mL, 0,15 M) seguido por 40 equivalentes de hidrato de cloreto de 4-(4,6dimetóxi [1.3.5]triazin-2-il)-4-metilmorfolínio (DMTMM) em água (9,6 mL, 0,25 M). A mistura foi suavemente agitada durante 2 horas até 4°C antes um adicional de 40 equivalentes de S-Ado e DMTMM foi adicionado e agitado durante um adicional de 16 horas até 4°C.
[00176] Após acilação, um volume de 0,1X de 5 M de NaCl aquoso e um volume de 2,5X de etanol frio (-20oC) foi adicionado e a mistura foi permitida para permanecer a -20oC durante pelo menos uma hora. A mistura foi então centrifugada durante 15 minutos a 14.000 rpm em uma centrífuga até 4°C para fornecer um pélete branco que foi lavado com EtOH frio e então seco em um liofilizador em temperatura ambiente durante 30 minutos. O sólido foi dissolvido em 40 mL de água e purificado por HPLC em Fase Reversa com uma coluna Waters Xterra RPi8. Um perfil de gradiente em fase móvel binário foi usado para eluir o produto utilizando 50 mM de um tampão acetato de trietilamônio aquoso em pH 7,5 e 99% de acetontrila/1% de solução aquosa. O material purificado foi concentrado por liofilização e o resíduo resultante foi dissolvido em 5 mL de água. Um volume de 0,1X de piperidina foi adicionado à solução e a mistura foi suavemente agitada durante 45 minutos em temperatura ambiente. O produto foi então purificado por precipitação de etanol como descrito acima e isolado por centrifugação. O pélete resultante foi lavado duas vezes com EtOH frio e seco por liofilização para fornecer o Composto 3 purificado.
Ciclo 1 [00177] A cada cavidade em uma placa de 96 cavidades foram adicionados 12,5 pL de 4 mM de uma solução do Composto 3 em água; 100 pL de 1 mM de uma solução de um dos marcadores de oligonucleotídeo 1,1 a 1,96, como mostrado na Tabela 3 (a razão molar de Composto 3 para marcadores era 1:2). As placas foram aquecidas a 95oC durante 1 minuto e então resfriadas a 16oC durante 10 minutos. A
Petição 870190086182, de 02/09/2019, pág. 146/160
129/141 cada cavidade foram adicionados 10 pL de 10X tampão ligase, 30 unidades de T4 DNA ligase (1 pL de uma solução de 30 unidades/pL (FermentasLife Science, Cat. n° EL0013)), 76,5 μΙ de água e as soluções resultantes foram incubadas a 16oC durante 16 horas.
[00178] Após a reação de ligação, 20 μL de 5 M de NaCl aquoso foram diretamente adicionados a cada cavidade, seguido por 500 μL de etanol frio (-20oC), e mantidos a -20oC durante 1 hora. As placas foram centrifugadas durante 1 hora em 3200 g em uma centrífuga Beckman Coulter Allegra 6R utilizando Beckman Microplus Carriers. O sobrenadante foi cuidadosamente removido ao inverter a placa e o pélete foi lavado com 70% de etanol frio aquoso a -20oC. Cada pélete foi então dissolvido em tampão borato de sódio (50 μL, 150 mM, pH 9,4) a uma concentração de 1 mM e resfriado até 4oC.
[00179] A cada solução foram adicionados 40 equivalentes de um dos 96 precursores de bloco de construção em DMF (13 μL, 0,15 M) seguido por 40 equivalentes de DMT-MM em água (8 μL, 0,25M), e as soluções foram suavemente agitadas até 4°C. Após 2 horas, um adicional de 40 equivalentes de cada precursor de bloco de construção e DMTMM foram adicionados e as soluções foram suavemente agitadas durante 16 horas até 4°C. Após a acilação, 10 equivalentes de ácido acético-N-hidróxi-succinimida em DMF (2 μL, 0,25M) foram adicionados a cada solução e suavemente agitados durante 10 minutos.
[00180] Após a acilação, as 96 misturas de reação foram agrupadas e 0,1 volume de 5M de NaCl aquoso e 2,5 volumes de etanol frio absoluto foram adicionados e a solução foi permitida para permanecer a -20oC durante pelo menos uma hora. A mistura foi então centrifugada. Após a centrifugação, o máximo de sobrenadante possível foi removido com uma micropipeta, o pélete foi lavado com etanol frio e centrifugado novamente. O sobrenadante foi removido com uma pipeta de 200 μL. 70% de etanol frio foi adicionado ao tubo, e a mistura resultante foi
Petição 870190086182, de 02/09/2019, pág. 147/160
130/141 centrifugada durante 5 min até 4°C.
[00181] O sobrenadante foi removido e o etanol restante foi removido por liofilização em temperatura ambiente durante 10 minutos. O pélete foi então dissolvido em 2 mL de água e purificado por HPLC em Fase Reversa com uma coluna Waters Xterra RP18. Um perfil de gradiente em fase móvel binário foi usado para eluir a biblioteca utilizando 50 mM de tampão acetato de trietilamônio aquoso em pH 7,5 e 99% de acetontrila/1% de solução aquosa. As frações que contêm a biblioteca foram coletadas, agrupadas e liofilizadas. O resíduo resultante foi dissolvido em 2,5 mL de água e 250 pL de piperidina foram adicionados. A solução foi suavemente agitada durante 45 minutos e então precipitada com etanol como anteriormente descrito. O pélete resultante foi seco por liofilização e então dissolvido em tampão borato de sódio (4,8 mL, 150 mM, pH 9,4) a uma concentração de 1 mM.
[00182] A solução foi resfriada até 4°C e 40 equivalentes de N-Fmocpropargilglicina em DMF (1,2 mL, 0,15 M) e DMT-MM em água (7,7 mL, 0,25 M) foram adicionados. A mistura foi suavemente agitada durante 2 horas até 4°C antes um adicional de 40 equivalentes de N-Fmocpropargilglocina e DMT-MM foram adicionados e a solução foi agitada durante um adicional de 16 horas. A mistura foi posteriormente purificada por precipitação de EtOH e HPLC em Fase Reversa como descrito acima e o grupo N-Fmoc foi removido por tratamento com piperidina como anteriormente descrito. Mediante purificação final por precipitação de EtOH, o pélete resultante foi seco por liofilização e conduzido para o próximo ciclo de síntese
Ciclos 2-4 [00183] Para cada um destes ciclos, o pélete seco do ciclo anterior foi dissolvido em água e a concentração de biblioteca foi determinada por espectrofotometria baseada no coeficiente de extinção do componente de DNA da biblioteca, onde o coeficiente de extinção inicial
Petição 870190086182, de 02/09/2019, pág. 148/160
131/141 do Composto 2 é 131.500 L/(mol.cm). A concentração da biblioteca foi ajustada com água de modo que a concentração final nas reações de ligação subsequentes seja 0,25 mM. A biblioteca foi então dividida em 96 alíquotas iguais em uma placa de 96 cavidades. A cada cavidade adicionou-se uma solução que compreende um marcador diferente (razão molar da biblioteca para marcador era 1:2), e as ligações foram realizadas como descrito no Ciclo 1. Os marcadores de oligonucleotídeo usados nos Ciclos 2, 3 e 4 estão estabelecidos nas Tabelas 4, 5 e 6, respectivamente. A correspondência entre os marcadores e os precursores de bloco de construção de cada um dos Ciclos 1 a 4 é proporcionada na Tabela 7. A biblioteca foi precipitada através da adição de etanol como descrito acima no Ciclo 1, e dissolvida em tampão borato de sódio (150 mM, pH 9,4) a uma concentração de 1 mM. As acilações e purificações subsequentes foram realizadas como descrito no Ciclo 1, exceto a purificação por HPLC que foi omitida durante o Ciclo 3.
[00184] Os produtos do Ciclo 4 foram ligados com o iniciador de fechamento mostrado abaixo, utilizando o método descrito acima para ligação de marcadores.
5-PO3-CAG AAG ACA GAC AAG CTT CAC CTG C ( SEQ ID NO: 889) 5'-PO3-GCA GGT GAA GCT TGT CTG TCT TCT GAA (SEQ ID NO : 890) RESULTADOS:
[00185] O procedimento sintético descrito acima possui a capacidade de produzir uma biblioteca que compreende 964 (cerca de 108) estruturas diferentes. A síntese da biblioteca foi monitorada através de eletroforese em gel e LC/MS do produto de cada ciclo. Mediante finalização, a biblioteca foi analisada utilizando diversas técnicas. A Figura 13a é um cromatograma da biblioteca após o Ciclo 4, porém antes da ligação do iniciador de fechamento; a Figura 13b é um espectro
Petição 870190086182, de 02/09/2019, pág. 149/160
132/141 de massa da biblioteca na mesma etapa sintética. O peso molecular médio foi determinado por análise LC/MS de íon negativo. O sinal iônico foi deconvoluto utilizando software ProMass. Este resultado é compatível com a massa média prevista da biblioteca.
[00186] O componente de DNA da biblioteca foi analisado por eletroforese em gel agarose, que mostrou que a maior parte do material de biblioteca corresponde ao produto ligado do tamanho correto. A análise de sequência de DNA de clones moleculares de produto de PCR derivada de uma amostragem da biblioteca mostra a ligação de DNA ocorrida com alta fidelidade e próxima ao término.
CICLIZAÇÃO DE BIBLIOTECA [00187] No término do Ciclo 4, uma parte da biblioteca foi terminada na terminação-N utilizando ácido azidoacético sob as condições normais de acilação. O produto, após a purificação por precipitação de EtOH, foi dissolvido em tampão fosfato de sódio (150 mM, pH 8) a uma concentração de 1 mM e 4 equivalentes de CuSO4 em água (200 mM), ácido ascórbico em água (200 mM), e uma quantidade catalítica do composto mostrado abaixo como uma solução em DMF (200 mM) foram adicionados. A mistura de reação foi então suavemente agitada durante horas em temperatura ambiente.
[00188] Para avaliar o nível de ciclização, alíquotas de 5 pL da reação de ciclização de biblioteca foram removidas e tratadas com um azido marcado de forma fluorescente ou alcino (1 pL de 100 mM de estoques DMF) preparado como descrito no Exemplo 4. Após 16 horas, nem os marcadores de alcino nem azido foram incorporados na biblioteca por análise HPLC em 500 nm. Este resultado indicou que a
Petição 870190086182, de 02/09/2019, pág. 150/160
133/141 biblioteca não continha mais grupos azido ou alcino capazes de cicloadição e que a biblioteca deve, portanto, reagir com ela mesma, tanto através de ciclização como reações intermoleculares. A biblioteca ciclizada foi purificada por HPLC em Fase Reversa como anteriormente descrito. Os experimentos de controle que utilizam a biblioteca nãociclizada mostraram a incorporação completa dos marcadores fluorescentes mencionados acima.
Exemplo 4: Preparação de Marcadores Fluorescentes para Análise de Ciclização:
[00189] Em tubos separados, propargil glicina ou 2-amino-3fenilpropilazido (8 pmol cada) foi combinada com FAM-OSu (Molecular Probes Inc.) (1,2 equiv.) em pH 9,4 tampão borato (250 pL). As reações foram permitidas para proceder durante 3 h em temperatura ambiente, e foram então liofilizadas durante a noite. A purificação por HPLC forneceu o alcino e azido fluorescentes em rendimento quantitativo.
Agente de nareação de
Agente de nareação de alcino fluorescente azido fluorescente
Exemplo 5: Ciclização de compostos individuais utilizando a reação de cicloadição de azido/alcino [00190] Preparação de Azidoacetil-Gly-Pro-Phe-Pra-NH2:
[00191] Utilizando-se 0,3 mmol de resina Rink-amida, a sequência indicada foi sintetizada utilizando técnicas de síntese em fase sólida
Petição 870190086182, de 02/09/2019, pág. 151/160
134/141 padrão com aminoácidos protegidos por Fmoc e HATU como agente de ativação (Pra = C-propargilglicina). Ácido azidoacético foi usado para cobrir o tetrapeptídeo. O peptídeo foi clivado a partir da resina com 20% de TFA/DCM durante 4 h. A purificação por RP HPLC forneceu o produto como um sólido branco (75 mg, 51%). 1H RMN (DMSO-d6, 400 MHz): 8,4 - 7,8 (m, 3H), 7,4 - 7,1 (m, 7 H), 4,6 - 4,4 (m, 1H), 4,4 - 4,2 (m, 2H), 4,0 - 3,9 (m, 2H), 3,74 (dd, 1H, J = 6 Hz, 17 Hz), 3,5 - 3,3 (m, 2H), 3,07 (dt, 1H, J = 5 Hz, 14 Hz), 2,92 (dd, 1H, J = 5 Hz, 16 Hz), 2,86 (t, 1H, J = 2 Hz), 2,85 - 2,75 (m, 1H), 2,6 - 2,4 (m, 2H), 2,2 - 1,6 (m, 4H). 1R (mull) 2900, 2100, 1450, 1300 cm-1. ESMS 497,4 ([M+H],
100%), 993,4 ([2M+H], 50%). ESIMS com fragmentação de fonte iônica: 519,3 ([M+Na], 100%), 491,3 (100%), 480,1 ([M-NH2], 90%), 452,2 ([MNH2-CO], 20%), 424,2 (20%), 385,1 ([M-Pra], 50%), 357,1 ([M- Pra-CO], 40%), 238,0 ([M-Pra-Phe], 100%).
[00192] Ciclização de Azidoacetil-Gly-Pro-Phe-Pra-NH2.
Cu(MeCN) 4PF6
DIEA, MeCN
Ph c(O)NH2 [00193] O peptídeo de azidoacetil (31 mg, 0,62 mmol) foi dissolvido em MeCN (30 mL). Diisopropiletilamina (DIEA, 1 mL) e Cu(MeCN)4PF6 (1 mg) foram adicionados. Após agitação durante 1,5 h, a solução foi evaporada e o resíduo resultante foi absorvido em 20% de MeCN/H20. Após centrifugação para remover sais insolúveis, a solução foi submetida a HPLC em fase reversa preparativo. O peptídeo cíclico desejado foi isolado como um sólido branco (10 mg, 32%). 1H RMN (DMSO-d6, 400 MHz): 8,28 (t, 1H, J = 5 Hz), 7,77 (s, 1H), 7,2 - 6,9 (m, 9H), 4,98 (m, 2H), 4,48 (m, 1H), 4,28 (m, 1H), 4,1 - 3,9 (m, 2H), 3,63
Petição 870190086182, de 02/09/2019, pág. 152/160
135/141 (dd, 1H, J = 5 Hz, 16 Hz), 3,33 (m, 2H), 3,0 (m, 3H), 2,48 (dd, 1H, J = 11 Hz, 14 Hz), 1,75 (m, 1H0, 1,55 (m, 1H), 1,32 (m, 1H), 1,05 (m, 1H). IR (mull) 2900, 1475, 1400 cm-1. ESIMS 497,2 ([M+H], 100%), 993,2 ([2M+H], 30%), 1015,2 ([2M+Na], 15%). ESMS com fragmentação de fonte iônica: 535,2 (70%), 519,3 ([M+Na], 100%), 497,2 ([M+H], 80%),
480.1 ([M-NH2], 30%), 452,2 ([M-NH2-CO], 40%), 208,1 (60%). [00194] Preparação de Azidoacetil-Gly-Pro-Phe-Pra-Gly-OH: [00195] Utilizando-se 0,3 mmol de Glicina-resina Wang, a sequência indicada foi sintetizada utilizando aminoácidos protegidos por Fmoc e HATU como o agente de ativação. Ácido azidoacético foi usado na última etapa de acoplamento para cobrir o pentapeptídeo. A clivagem do peptídeo foi realizada utilizando 50% de TFA/DCM durante 2 h. A purificação por RP HPLC forneceu o peptídeo como um sólido branco (83 mg; 50%). 1H RMN (DMSOd6, 400 MHz): 8,4 - 7,9 (m, 4H), 7,2 (m, 5H), 4,7 - 4,2 (m, 3H), 4,0 - 3,7 (m, 4H), 3,5 - 3,3 (m, 2H), 3,1 (m, 1H), 2,91 (dd, 1H, J = 4 Hz, 16 Hz), 2,84 (t, 1H, J = 2,5 Hz), 2,78 (m, 1H), 2,6 - 2,4 (m, 2H), 2,2 - 1,6 (m, 4H). IR (mull) 2900, 2100, 1450, 1350 cm-1. ESIMS 555,3 ([M+H], 100%). ESIMS com fragmentação de fonte iônica:
577.1 ([M+Na], 90%), 555,3 ([M+H], 80%), 480,1 ([M-GIy], 100%), 385,1 ([M-Gly-Pra], 70%), 357,1 ([M- Gly-Pra-CO], 40%), 238,0 ([M-Gly-PraPhe], 80%).
[00196] Ciclização de Azidoacetil-Gly-Pro-Phe-Pra-Gly-OH:
[00197] O peptídeo (32 mg, 0,058 mmol) foi dissolvido em MeCN (60 mL). Diisopropiletilamina (1 mL) e Cu(MeCN)4PF6 (1 mg) foram adicionados e a solução foi agitada durante 2 h. O solvente foi evaporado e o produto bruto foi submetido a RP HPLC para remover dímeros e trímeros. O monômero cíclico foi isolado como um vidro incolor (6 mg, 20%). ESIMS 555.6 ([M+H], 100%), 1109,3 ([2M+H], 20%), 1131,2 ([2M+Na], 15%).
[00198] ESIMS com fragmentação de fonte iônica: 555,3 ([M+H],
Petição 870190086182, de 02/09/2019, pág. 153/160
136/141
100%), 480,4 ([M-GIy], 30%), 452,2 ([M-GIy-CO], 25%), 424,5 ([M-Gly2CO], 10%, possível apenas e uma estrutura cíclica).
[00199] Conjugação de Peptídeo Linear a DNA:
[00200] O composto 2 (45 nmol) foi dissolvido em 45 pL de tampão borato de sódio (pH 9,4; 150 mM). Até 4oC, o peptídeo linear (18 pL de 100 mM de estoque em DMF; 180 nmols; 40 equiv.) foi adicionado, seguido por DMT-MM (3,6 pL de 500 mM de estoque em água; 180 nmols; 40 equiv.). Após agitação durante 2 h, LCMS mostrou a reação completa, e o produto foi isolado por precipitação de etanol. ESIMS 1823,0 ([M-3H]/3, 20%), 1367,2 ([M-4H]/4, 20%), 1093,7 ([M-5H]/5,
40%), 911,4 ([M-6H]/6, 100%).
[00201] Conjugação de Peptídeo Cíclico a DNA:
[00202] O composto 2 (20 nmols) foi dissolvido em 20 pL de tampão borato de sódio (pH 9,4, 150 mM). Até 4oC, o peptídeo linear (8 pL de 100 mM de estoque em DMF; 80 nmols; 40 equiv.) foi adicionado, seguido por DMT-MM (1,6 pL de 500 mM de estoque em água; 80 nmols; 40 equiv.). Após agitação durante 2 h, LCMS mostrou reação completa, e o produto foi isolado por precipitação de etanol. ESIMS 1823,0 ([M-3H]/3, 20%), 1367,2 ([M-4HJ/4, 20%), 1093,7 ([M-5H]/5,
40%), 911,4 ([M-6H]/6, 100%).
[00203] Ciclização de Peptídeo Ligado por DNA:
[00204] O conjugado de peptídeo linear-DNA (10 nmols) foi dissolvido em pH 8 tampão fosfato de sódio (10 pL, 150mm). Em temperatura ambiente, 4 equivalentes de CuSO4, ácido ascórbico, e o ligante Sharpless foram adicionados (0,2 pL de 200 mM de estoques). A reação foi permitida para proceder durante a noite. RP HPLC mostrou que nenhum peptídeo linear-DNA estava presente, e que o produto foi co-eluído com peptídeo cíclico autêntico-DNA. Nenhum traço de dímeros ou outros oligômeros foram observados.
Petição 870190086182, de 02/09/2019, pág. 154/160
137/141
I D N A -u iNão-ligado
D Μ T - Μ M , p H i.o . Μ 0 n À-lNão-ligado
D Μ T - Μ M . p H 1 .5
Fosfato pH 8
Ligante =
equilalente, cada
CuSO4, ligante ácido ascórbico
Eluição @ 4.48 min.
Eluição @ 4.27 min.
Condições de LC: Targa C18, 2.1 x40 mm, 10-40% MeCN em 40mM aq. TEAA terminando em 8 min.
Exemplo 6: Aplicação de Reações de Substituição Nucleofílica Aromática para Síntese de Porção Funcional [00205] Procedimento Geral para Arilação de Composto 3 com Cloreto Cianúrico:
[00206] O Composto 2 é dissolvido em pH 9,4 tampão borato de sódio em uma concentração de 1 mM. A solução é resfriada até 4°C e 20 equivalentes de cloreto cianúrico são então adicionados como 500 mM de uma solução em MeCN. Após 2h, a reação completa é confirmada por LCMS e o conjugado de diclorotriazina-DNA resultante é isolado por precipitação de etanol.
[00207] Procedimento para Substituição de Amina de DiclorotriazinaDNA:
[00208] O conjugado diclorotriazina-DNA é dissolvido em pH 9,5 tampão borato em uma concentração de 1 mM. Em temperatura ambiente, 40 equivalentes de uma amina alifática são adicionadas como uma solução DMF. A reação é seguida por LCMS e é geralmente
Petição 870190086182, de 02/09/2019, pág. 155/160
138/141 completa após 2 h. O conjugado de alquilamino-monoclorotriazina-DNA resultante é isolado por precipitação de etanol.
[00209] Procedimento para Substituição de Amina de Monoclorotriazina-DNA:
[00210] O conjugado de alquilamino-monoclorotriazina-DNA é dissolvido em pH 9,5 tampão borato em uma concentração de 1 mM. A 42oC, 40 equivalentes de uma segunda amina alifática são adicionados como uma solução DMF. A reação é seguida por LCMS e é geralmente completa após 2 h. O conjugado de diaminotriazina-DNA resultante é isolado por precipitação de etanol.
Exemplo 7: Aplicação de Reações de Aminação Reduzidas para Síntese de Porção Funcional [00211] Procedimento Geral para Aminação Reduzida de Ligante de DNA que Contém uma Amina Secundária com um Bloco de construção de Aldeído:
[00212] O Composto 2 foi acoplado a um resíduo de prolina Nterminal. O composto resultante foi dissolvido em tampão fosfato de sódio (50 pL, 150 mM, pH 5,5) em uma concentração de 1 mM. A esta solução foram adicionados 40 equivalentes de um bloco de construção de aldeído em DMF (8 pL, 0,25M) e cianoboroidreto de sódio em DMF (8 pL, 0,25M) e a solução foi aquecida a 80oC durante 2 horas. Após a alquilação, a solução foi purificada por precipitação de etanol.
[00213] Procedimento Geral para Aminações Reduzidas de Ligante de DNA que Contém um Aldeído com Blocos de construção de Amina: [00214] O Composto 2 acoplado a um bloco de construção que compreende um grupo aldeído foi dissolvido em tampão fosfato de sódio (50 pL, 250 mM, pH 5,5) em uma concentração de 1 mM. A esta solução foram adicionados 40 equivalentes de um bloco de construção de amina em DMF (8 pL, 0,25M) e cianoboroidreto de sódio em DMF (8 pL, 0,25M) e a solução foi aquecida a 80oC durante 2 horas. Após a alquilação, a
Petição 870190086182, de 02/09/2019, pág. 156/160
139/141 solução foi purificada por precipitação de etanol.
Exemplo 8: Aplicação de Reações de Construção de Peptóide para
Síntese de Porção Funcional [00215] Procedimento Geral para Síntese de Peptóide sobre Ligante de DNA:
H2N DNA-ligante
equivalentes
H2N
DNA-ligante
HN
DNA ligante equivalentes [00216] O Composto 2 foi dissolvido em tampão borato de sódio (50 pl_, 150 mM, pH 9,4) em uma concentração de 1 mM e resfriado até 4°C. A esta solução foram adicionados 40 equivalentes de bromoacetato Nhidroxissuccinimidila em DMF (13 pl_, 0,15 M) e a solução foi suavemente agitada até 4°C durante 2 horas. Após a acilação, o ligante de DNA foi purificado por precipitação de etanol e redissolvido em tampão borato de sódio (50 μΙ_, 150 mM, pH 9,4) em uma concentração de 1 mM e resfriado até 4°C. A esta solução foram adicionados 40 equivalentes de um bloco de construção de amina em DMF (13 μΙ_, 0,15 M) e a solução foi suavemente agitada até 4°C durante 16 horas. Após a alquilação, o ligante de DNA foi purificado por precipitação de etanol e re-dissolvido em tampão borato de sódio (50 μΙ_, , 150 mM, pH 9,4) em uma concentração de 1 mM e resfriado até 4°C. A síntese de peptóide continua através da adição gradativa de bromoacetato de Nhidroxissuccinimidil seguida pela adição de um bloco de construção de amina.
Exemplo 9: Aplicação da Reação de Cicloadição de Azido-Alcino para
Síntese de Porção Funcional
Procedimento Geral [00217] Um conjugado de DNA que contém alcino é dissolvido em pH 8,0 tampão fosfato em uma concentração de ca. 1mM. A esta mistura são adicionados 10 equivalentes de um azido orgânico e 5
Petição 870190086182, de 02/09/2019, pág. 157/160
140/141 equivalentes de sulfato de cobre (II), ácido ascórbico, e o ligante (tris((1-benziltriazol-4-il)metil)amina todos em temperatura ambiente. A reação é seguida por LCMS, e é geralmente completa após 1 - 2 h. O conjugado de triazol-DNA resultante pode ser isolado por precipitação de etanol.
Exemplo 10 Identificação de um ligante a Ab1 quinase de dentro de uma biblioteca codificada [00218] A capacidade de enriquecer moléculas de interesse em uma biblioteca codificada por DNA acima de elementos de biblioteca indesejados é preeminente para identificar compostos simples com propriedades definidas contra alvos terapêuticos de interesse. Para demonstrar esta capacidade de enriquecimento uma molécula de ligação conhecida (descrita por Shah et ah, Science 305, 399-401 (2004), incorporado aqui à guisa de referência) a rhAb1 quinase (GenBank U07563) foi sintetizada. Este composto foi ligado a um oligonucleotídeo de DNA de fita dupla através do ligante descrito nos exemplos anteriores utilizando métodos de química padrão para produzir uma molécula similar (porção funcional ligada a um oligonucleotídeo) àquelas produzidas através dos métodos descritos nos Exemplos 1 e 2. Uma biblioteca geralmente produzida como descrito no Exemplo 2 e o aglutinante Ab1 quinase ligado por DNA foram desenhados com sequências de DNA exclusiva das que permitem a análise qPCR de ambas espécies. O aglutinante Ab1 quinase ligado por DNA foi misturado com a biblioteca em uma razão de 1:1000. Esta mistura foi equilibrada com rhAble quinase, e a enzima foi capturada em uma fase sólida, lavada para remover elementos de biblioteca de nãoligação e as moléculas de ligação foram eluídas. A razão de moléculas de biblioteca para o inibidor de Ab1 quinase ligado por DNA no eluato era 1:1, indicando um enriquecimento maior que 500 dobras do aglutinante Ab1 quinase ligado por DNA em um excesso de 1000 dobras
Petição 870190086182, de 02/09/2019, pág. 158/160
141/141 de moléculas de biblioteca.
EQUIVALENTES [00219] Os versados na técnica irão reconhecer, ou serão capazes de determinar utilizando não mais que experimentação de rotina, muitos equivalentes às modalidades específicas da invenção descritos aqui. Tais equivalentes pretendem ser abrangidos pelas seguintes reivindicações.

Claims (23)

  1. REIVINDICAÇÕES
    1. Método para sintetizar uma molécula que compreende uma porção funcional que é ligada de forma operativa a um oligonucleotídeo de codificação que identifica a estrutura da porção funcional, caracterizado pelo fato de que compreende as etapas de:
    (a) proporcionar um composto iniciador que consiste em uma porção funcional inicial que compreende n blocos de construção, em que n é um número inteiro de 1 ou maior, em que a porção funcional inicial compreende pelo menos um grupo reativo, e fica ligado de forma operativa a um oligonucleotídeo inicial;
    sendo que a porção funcional inicial compreende pelo menos um grupo reativo, e é ligado de forma operativa a um oligonucleotídeo inicial;
    sendo que a porção funcional inicial e o oligonucleotídeo inicial são ligados por uma porção de ligação, em que o oligonucleotídeo inicial possui fita dupla e a porção de ligação é covalentemente acoplada à porção funcional inicial e a ambas as fitas do oligonucleotídeo inicial;
    (b) reagir o composto iniciador com um bloco de construção desejado que compreende pelo menos um grupo reativo complementar, em que pelo menos um grupo reativo complementar é complementar ao grupo reativo da etapa (a), sob condições adequadas para a reação do grupo reativo complementar para formar uma ligação covalente;
    (c) reagir o oligonucleotídeo inicial com um oligonucleotídeo de entrada que identifica o bloco de construção da etapa (b) na presença de uma enzima que catalisa a ligação do oligonucleotídeo inicial e o oligonucleotídeo de entrada, sob condições adequadas para a ligação do oligonucleotídeo de entrada para formar um oligonucleotídeo de codificação;
    desse modo produzindo uma molécula que compreende uma porção funcional que compreende n+1 blocos de construção que ficam
    Petição 870190086182, de 02/09/2019, pág. 6/160
  2. 2/8 ligados de forma operativa a um oligonucleotídeo de codificação que identifica a estrutura da porção funcional, em que o último dos oligonucleotídeos de entrada compreende uma sequência cap, a dita sequência cap compreendendo uma sequência de nucleotídeos que contém nucleotídeos degenerados.
    2. Método para sintetizar uma biblioteca de compostos, em que os compostos compreendem uma porção funcional que compreende dois ou mais blocos de construção que são ligados de forma operativa a um oligonucleotídeo de codificação que identifica a estrutura da porção funcional, caracterizado pelo fato de que compreende as etapas de:
    (a) proporcionar uma solução que compreende m compostos iniciadores, como definidos na reivindicação 1, em que m é um número inteiro de 1 ou mais (b) dividir a solução da etapa (a) em r frascos de reação, em que r é um número inteiro de 2 ou mais, que produz desta forma r alíquotas da solução;
    (c) reagir os compostos iniciadores em cada frasco de reação com um dos r blocos de construção, os ditos blocos de construção que compreendem pelo menos um grupo reativo complementar, em que o pelo menos um grupo reativo complementar é complementar ao grupo reativo da etapa (a), sob condições adequadas para reação do dito grupo reativo complementar para formar uma ligação covalente;
    produzindo desta forma r alíquotas que compreendem compostos que consistem em uma porção funcional que compreende n+1 blocos de construção ligados de forma operativa ao oligonucleotídeo inicial; e (d) reagir o oligonucleotídeo inicial em cada alíquota com um de um conjunto de r oligonucleotídeos de entrada distintos,
    Petição 870190086182, de 02/09/2019, pág. 7/160
  3. 3/8 correspondentes aos blocos de contrução da etapa (c), na presença de uma enzima que catalisa a ligação do oligonucleotídeo de entrada e o oligonucleotídeo inicial, sob condições adequadas para ligação enzimática do oligonucleotídeo de entrada e do oligonucleotídeo inicial para formar o oligonucleotídeo de codificação sendo que o último dos ditos oligonucleotídeos de entrada distintos r compreende uma sequência cap, a dita sequência cap compreendendo uma sequência de nucleotídeos que contêm nucleotídeos degenerados;
    produzindo, desta forma, r alíquotas que compreendem moléculas que consistem em uma porção funcional que compreende n+1 blocos de construção ligados de forma operativa a um oligonucleotídeo de codificação que identifica a estrutura da porção funcional os n+1 blocos de construção.
    3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a porção funcional da etapa (c) compreende um grupo reativo, e as etapas (a) a (c) são repetidas uma ou mais vezes, formando assim ciclos 1 a i, em que i é um número inteiro de 2 ou maior, em que o produto da etapa (c) de um ciclo s, em que s é um número inteiro de i-1 ou menor, é o composto iniciador de ciclo s + 1.
  4. 4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa (c) precede a etapa (b) ou etapa (b) precede a etapa (c).
  5. 5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que pelo menos um dos blocos de construção é um aminoácido ou um aminoácido ativado.
  6. 6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a enzima é selecionada do grupo que consiste em uma DNA ligase, uma RNA ligase, uma DNA polimerase, uma RNA polimerase e uma topoisomerase.
    Petição 870190086182, de 02/09/2019, pág. 8/160
    4/8
  7. 7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o oligonucleotídeo inicial compreende uma sequência iniciadora de PCR.
  8. 8. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o oligonucleotídeo de entrada possui de 3 a 10 nucleotídeos de comprimento.
  9. 9. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que compreende adicionalmente após o ciclo i, a etapa de:
    (e) ciclizar a porção funcional; opcionalmente, em que a porção funcional compreende um grupo alquinila e um grupo azido, e o composto é submetido a condições adequadas para cicloadição do grupo alquinila e do grupo azida para formar um grupo triazol, dessa forma ciclizando a porção funcional.
  10. 10. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que compreende adicionalmente as etapas de (e) combinar duas ou mais das r alíquotas, produzindo, desta forma, uma solução que compreende moléculas que consistem em uma porção funcional que compreende n + 1 blocos de construção, que são ligados de forma operativa a um oligonucleotídeo de codificação que identifica a estrutura da porção funcional os n +1 blocos de construção.
  11. 11. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que alíquotas r são combinadas.
  12. 12. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que as etapas (a) a (e) são conduzidas uma ou mais vezes para produzir ciclos 1 a i, em que i é um número inteiro de 2 ou mais, em que no ciclo s+1, em que s é um número inteiro de i-1 ou menos, a solução que compreende m compostos iniciadores da etapa (a) é a solução da etapa (e) de ciclo s, opcionalmente, em que pelo menos em um dos ciclos 1 a i a etapa (d) precede a etapa (c).
  13. 13. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a porção ligante que compreende um primeiro grupo
    Petição 870190086182, de 02/09/2019, pág. 9/160
    5/8 funcional adaptado para ligação com um bloco de construção, um segundo grupo funcional adaptado para ligação à extremidade 5' de um oligonucleotídeo, e um terceiro grupo funcional adaptado para ligação à extremidade 3' de um oligonucleotídeo.
  14. 14. Método, de acordo com a reivindicação 13, caracterizado pelo fato de que a porção ligante pertence à estrutura:
    c .A ^D ^S^
    E
    B em que
    A é um grupo funcional adaptado para ligação a um bloco de construção;
    B é um grupo funcional adaptado para ligação à extremidade 5' de um oligonucleotídeo;
    C é um grupo funcional adaptado para ligação à extremidade
    3' de um oligonucleotídeo;
    S é um átomo ou um suporte provisório;
    D é uma estrutura química que conecta A a S;
    E é uma estrutura química que conecta B a S; e
    F é uma estrutura química que conecta C a S, opcionalmente em que , (i) A é um grupo amino;
    B é um grupo fosfato; e
    C é um grupo fosfato; ou (ii) , em que cada D, E e F é, independentemente, um grupo alquileno ou um grupo oligo(etileno glicol); ou (iii) , em que S é um átomo de carbono, um átomo de
    Petição 870190086182, de 02/09/2019, pág. 10/160
    6/8 nitrogênio, um átomo de fósforo, um átomo de boro, um grupo fosfato, um grupo cíclico ou um grupo policíclico, opcionalmente, em que a porção ligante pertence à estrutura:
    y-----OP(O) 2O----(CH2CH2O)m---OPO 3-------N---(CH2)n^Z
    -----OP(O) 2O----(CH2CH2O)p---OPO 3---em que cada n, m e p é, independentemente, um número inteiro de 1 a cerca de 20; opcionalmente (A), em que cada n, m e p é independentemente um número inteiro de 2 a oito, opcionalmente, em que cada n, m e p é independentemente um número inteiro de 3 a 6; ou (B), em que a porção ligante possui a estrutura:
    O-
  15. 15. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que compreende adicionalmente após o ciclo i, a etapa de:
    (f) ciclizar uma ou mais porções funcionais; opcionalmente em que em que a porção funcional da etapa (f) compreende um grupo azida e um grupo alquinila; opcionalmente, em que a porção funcional é mantida sob condições adequadas para cicloadição do grupo azida e do grupo alquinila para formar um grupo triazol, formando, assim, uma porção funcional cíclica; opcionalmente, em que a reação de cicloadição é conduzida na presença de um catalisador de cobre; opcionalmente em que pelo menos uma ou mais porções funcionais da etapa (f) compreende pelo menos dois grupos sulfidrila, e a dita porção funcional é mantida sob condições adequadas para reação dos dois grupos
    Petição 870190086182, de 02/09/2019, pág. 11/160
    7/8 sulfidrila para formar um grupo bissulfeto, desta forma, ciclicizando a porção funcional.
  16. 16. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o grupo reativo e o grupo reativo complementar são selecionados do grupo que consiste em:
    (i) um grupo amino; um grupo carboxila; um grupo sulfonila; um grupo fosfonila; um grupo epóxido; um grupo aziridina; e um grupo isocianato; ou (ii) um grupo hidroxila; um grupo carboxila; um grupo sulfonila; um grupo fosfonila; um grupo epóxido; um grupo aziridina; e um grupo isocianato; ou (iii) um grupo amino e um grupo aldeído ou cetona, opcionalmente em que a reação entre o grupo reativo e o grupo reativo complementar é conduzida sob condições de redução; ou (iv) um grupo ilídeo fosforoso e um grupo aldeído ou cetona.
  17. 17. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o grupo reativo e o grupo reativo complementar reagem através de cicloadição para formar uma estrutura cíclica, opcionalmente em que o grupo reativo e o grupo reativo complementar são selecionados do grupo que consiste em:
    (i) um alcino e uma azida, ou (ii) um grupo heteroaromático halogenado e um nucleófilo, opcionalmente em que o grupo heteroaromático halogenado é selecionado do grupo que consiste em pirimidinas cloradas, triazinas cloradas e purinas cloradas; ou em que o nucleófilo é um grupo amino.
  18. 18. Método para identificar um ou mais compostos que se ligam a um alvo biológico, caracterizado pelo fato de que compreende as etapas de:
    (a) colocar o alvo biológico em contato com uma biblioteca de composto preparada pelo método, como definido na reivindicação 2,
    Petição 870190086182, de 02/09/2019, pág. 12/160
    8/8 sob condições adequadas para pelo menos um elemento da biblioteca de composto se ligar ao alvo;
    (b) remover os elementos de biblioteca que não se ligam ao alvo;
    (c) amplificar os oligonucleotídeos de codificação de pelo menos um elemento da biblioteca de composto que se liga ao alvo;
    (d) sequenciar os oligonucleotídeos de codificação da etapa (c); e (e) utilizar as sequências determinadas na etapa (d) para determinar a estrutura das porções funcionais dos elementos da biblioteca de composto que se ligam ao alvo biológico;
    desta forma identifica-se um ou mais compostos que se ligam ao alvo biológico.
  19. 19. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a sequência de cap compreende a sequência SEQ ID NO: 930.
  20. 20. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a sequência de cap compreende a sequência SEQ ID NO: 931.
  21. 21. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que as reações são conduzidas em solução.
  22. 22. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a molécula sintetizada é um composto polimérico.
  23. 23. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a molécula sintetizada é um composto não-polimérico.
BRPI0613566-8A 2005-06-09 2006-06-09 Métodospara sintetizar uma molécula que compreende umaporção funcional, para sintetizar uma biblioteca decompostos, e para identificar um ou mais compostosque se ligam a um alvo biológico BRPI0613566B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US68946605P 2005-06-09 2005-06-09
US60/689,466 2005-06-09
US73104105P 2005-10-28 2005-10-28
US60/731,041 2005-10-28
PCT/US2006/022555 WO2006135786A2 (en) 2005-06-09 2006-06-09 Methods for synthesis of encoded libraries

Publications (2)

Publication Number Publication Date
BRPI0613566A2 BRPI0613566A2 (pt) 2011-01-18
BRPI0613566B1 true BRPI0613566B1 (pt) 2020-01-07

Family

ID=36930432

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0613566-8A BRPI0613566B1 (pt) 2005-06-09 2006-06-09 Métodospara sintetizar uma molécula que compreende umaporção funcional, para sintetizar uma biblioteca decompostos, e para identificar um ou mais compostosque se ligam a um alvo biológico

Country Status (23)

Country Link
EP (4) EP2338990A3 (pt)
JP (2) JP5508711B2 (pt)
KR (1) KR101346432B1 (pt)
CN (2) CN102392014A (pt)
AT (1) ATE507292T1 (pt)
AU (1) AU2006257915B2 (pt)
BR (1) BRPI0613566B1 (pt)
CA (1) CA2611512C (pt)
CY (1) CY1112036T1 (pt)
DE (1) DE602006021580D1 (pt)
DK (4) DK1910538T3 (pt)
ES (2) ES2401485T3 (pt)
HR (1) HRP20110528T1 (pt)
IL (1) IL187977A (pt)
NO (1) NO343698B1 (pt)
NZ (1) NZ564545A (pt)
PL (2) PL2258870T3 (pt)
PT (2) PT1910538E (pt)
RS (1) RS51868B (pt)
RU (2) RU2459869C2 (pt)
SI (1) SI1910538T1 (pt)
WO (1) WO2006135786A2 (pt)
ZA (2) ZA200800190B (pt)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1401850A1 (en) 2001-06-20 2004-03-31 Nuevolution A/S Nucleoside derivatives for library preparation
EP1487978B1 (en) 2002-03-15 2008-11-19 Nuevolution A/S An improved method for synthesising templated molecules
WO2004013070A2 (en) 2002-08-01 2004-02-12 Nuevolution A/S Multi-step synthesis of templated molecules
PT2348125T (pt) 2002-10-30 2017-08-29 Nuevolution As Método para a síntese de um complexo bifuncional
AU2003291964A1 (en) 2002-12-19 2004-07-14 Nuevolution A/S Quasirandom structure and function guided synthesis methods
US20070026397A1 (en) 2003-02-21 2007-02-01 Nuevolution A/S Method for producing second-generation library
EP1670939B1 (en) 2003-09-18 2009-11-04 Nuevolution A/S A method for obtaining structural information concerning an encoded molecule and method for selecting compounds
CA2611512C (en) 2005-06-09 2018-05-22 Praecis Pharmaceuticals, Inc. Methods for synthesis of encoded libraries
HUE056836T2 (hu) * 2005-12-01 2022-03-28 Nuevolution As Enzimatikus kódolási eljárások nagy könyvtárak hatékony szintéziséhez
DK2396459T3 (en) 2009-02-13 2017-08-28 X-Chem Inc Method for preparing and screening DNA-encoded libraries
WO2011127933A1 (en) 2010-04-16 2011-10-20 Nuevolution A/S Bi-functional complexes and methods for making and using such complexes
DK2748357T3 (en) * 2011-09-07 2018-07-16 X Chem Inc Methods for labeling DNA-encoded libraries
EA201992285A1 (ru) 2012-07-13 2020-05-31 Икс-Чем, Инк. Днк-кодированные библиотеки, содержащие связи кодирующих олигонуклеотидов, не доступные для считывания полимеразами
JP6911248B2 (ja) 2017-03-17 2021-07-28 成都先導薬物開発股▲フン▼有限公司Hitgen Inc. エンコードライブラリの合成方法及び組成物
WO2019149198A1 (zh) * 2018-01-31 2019-08-08 成都先导药物开发股份有限公司 一种dna编码化合物库及化合物筛选方法
GB201821109D0 (en) * 2018-12-21 2019-02-06 Philochem Ag Nucleic acid encoded chemical libraries
CN110041390B (zh) * 2019-04-26 2022-05-27 上海药明康德新药开发有限公司 DNA编码化合物库中On-DNA的1,2,3-三氮唑化合物的合成方法
CN112779606A (zh) * 2019-11-06 2021-05-11 成都先导药物开发股份有限公司 一种On-DNA曼尼希反应的方法
CN113089104B (zh) * 2019-12-23 2023-03-28 成都先导药物开发股份有限公司 一种On-DNA二胺化合物关环反应的合成方法
CN115506036B (zh) * 2021-06-22 2024-07-02 中国科学院上海药物研究所 Dna编码化合物文库起始片段及其制备和应用
DK4201951T3 (da) * 2021-12-21 2024-01-15 Bachem Holding Ag Fremgangsmåde til syntese af et peptid
CN114920791B (zh) * 2022-04-28 2024-06-18 康龙化成(宁波)科技发展有限公司 一种寡聚核酸-琥珀酰亚胺化合物的合成方法

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1545804A (en) 1924-12-26 1925-07-14 Warmerdam Nicholas Sash fastener
US4356270A (en) 1977-11-08 1982-10-26 Genentech, Inc. Recombinant DNA cloning vehicle
US4293652A (en) 1979-05-25 1981-10-06 Cetus Corporation Method for synthesizing DNA sequentially
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
US4416988A (en) 1980-12-23 1983-11-22 Harvey Rubin Detection and isolation of enkephalin mRNA using a synthetic oligodeoxynucleotide
JPS60222842A (ja) 1984-04-19 1985-11-07 Fuji Photo Film Co Ltd ハロゲン化銀写真乳剤およびその製造方法
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US5360928A (en) 1989-10-23 1994-11-01 Research Corporation Technologies, Inc. Synthesis and use of amino acid fluorides as peptide coupling reagents
JP2001524926A (ja) * 1991-09-18 2001-12-04 アフィマックス テクノロジーズ ナームロゼ フェンノートシャップ オリゴマーの雑多ライブラリーの集合体を合成する方法
US5573905A (en) 1992-03-30 1996-11-12 The Scripps Research Institute Encoded combinatorial chemical libraries
US5565324A (en) * 1992-10-01 1996-10-15 The Trustees Of Columbia University In The City Of New York Complex combinatorial chemical libraries encoded with tags
CA2151473A1 (en) 1992-12-11 1994-06-23 Ronald N . Zuckermann Synthesis of encoded polymers
US6537776B1 (en) * 1999-06-14 2003-03-25 Diversa Corporation Synthetic ligation reassembly in directed evolution
EP1123305A1 (en) 1998-10-19 2001-08-16 The Board Of Trustees Of The Leland Stanford Junior University Dna-templated combinatorial library chemistry
EP1423400B2 (en) 2001-03-19 2013-05-22 President and Fellows of Harvard College Evolving new molecular function
ATE371026T1 (de) 2001-06-20 2007-09-15 Nuevolution As Eine methode zur synthese von matrizenabhängigen molekülen
AU2003240482B2 (en) 2002-05-30 2009-03-12 The Scripps Research Institute Copper-catalysed ligation of azides and acetylenes
AU2003263937B2 (en) * 2002-08-19 2010-04-01 The President And Fellows Of Harvard College Evolving new molecular function
PT2348125T (pt) * 2002-10-30 2017-08-29 Nuevolution As Método para a síntese de um complexo bifuncional
WO2005003375A2 (en) 2003-01-29 2005-01-13 454 Corporation Methods of amplifying and sequencing nucleic acids
GB0304433D0 (en) * 2003-02-27 2003-04-02 Xceleron Ltd Improvements relating to chemical libraries
DE602004019764D1 (de) * 2003-03-20 2009-04-16 Nuevolution As Ligationsvermittelnde codierung von kleinen molekülen
EP1670939B1 (en) * 2003-09-18 2009-11-04 Nuevolution A/S A method for obtaining structural information concerning an encoded molecule and method for selecting compounds
CN1898257B (zh) * 2003-12-17 2010-06-23 普雷西斯药品公司 合成编码文库的方法
US7116036B2 (en) 2004-08-02 2006-10-03 General Electric Company Energy harvesting system, apparatus and method
EP1828381B1 (en) * 2004-11-22 2009-01-07 Peter Birk Rasmussen Template directed split and mix systhesis of small molecule libraries
CA2611512C (en) 2005-06-09 2018-05-22 Praecis Pharmaceuticals, Inc. Methods for synthesis of encoded libraries

Also Published As

Publication number Publication date
ES2365534T3 (es) 2011-10-06
EP2338990A3 (en) 2011-10-19
IL187977A0 (en) 2008-03-20
AU2006257915A1 (en) 2006-12-21
PL2258870T3 (pl) 2013-05-31
ZA200800190B (en) 2010-11-24
CN102392014A (zh) 2012-03-28
HRP20110528T1 (hr) 2011-09-30
EP2258870A3 (en) 2011-11-30
NO20076362L (no) 2008-03-07
EP2258870A2 (en) 2010-12-08
EP1910538A2 (en) 2008-04-16
JP5508711B2 (ja) 2014-06-04
HK1150454A1 (en) 2011-12-30
EP2258870B1 (en) 2013-01-02
PT2258870E (pt) 2013-04-01
JP2008543289A (ja) 2008-12-04
EP1910538B1 (en) 2011-04-27
DK200800005A (da) 2008-03-04
KR20080036577A (ko) 2008-04-28
WO2006135786A3 (en) 2007-06-21
RU2459869C2 (ru) 2012-08-27
CA2611512C (en) 2018-05-22
RU2008100035A (ru) 2009-07-20
KR101346432B1 (ko) 2014-02-14
RS51868B (sr) 2012-02-29
CN101233235B (zh) 2012-10-03
BRPI0613566A2 (pt) 2011-01-18
AU2006257915B2 (en) 2011-09-08
ATE507292T1 (de) 2011-05-15
PL1910538T3 (pl) 2011-12-30
DK177345B1 (da) 2013-01-28
RU2011101778A (ru) 2012-07-27
CY1112036T1 (el) 2015-11-04
EP2311786A3 (en) 2014-04-02
EP2311786A2 (en) 2011-04-20
DK1910538T3 (da) 2011-08-08
NZ564545A (en) 2011-03-31
ES2401485T3 (es) 2013-04-22
ZA201004791B (en) 2012-06-27
DE602006021580D1 (de) 2011-06-09
DK201170734A (en) 2011-12-20
CN101233235A (zh) 2008-07-30
DK2258870T3 (da) 2013-03-18
SI1910538T1 (sl) 2011-09-30
PT1910538E (pt) 2011-07-28
CA2611512A1 (en) 2006-12-21
WO2006135786A2 (en) 2006-12-21
HK1120546A1 (en) 2009-04-03
NO343698B1 (no) 2019-05-13
DK179064B1 (da) 2017-10-02
IL187977A (en) 2013-02-28
JP2014039550A (ja) 2014-03-06
EP2338990A2 (en) 2011-06-29

Similar Documents

Publication Publication Date Title
AU2004299145B2 (en) Methods for synthesis of encoded libraries
DK179064B1 (da) Fremgangsmåder til syntese af kodede biblioteker
CA2626325A1 (en) Methods for identifying compounds of interest using encoded libraries
AU2011205057B2 (en) Methods for synthesis of encoded libraries
HK1150454B (en) Method for identifying compounds which bind to biological target molecule
HK1158695A (en) Methods for synthesis of encoded libraries
AU2011205058A1 (en) Methods for synthesis of encoded libraries
MX2007015543A (en) Methods for synthesis of encoded libraries
HK1155432A (en) Methods for synthesis of encoded libraries
HK1120546B (en) Methods for synthesis of encoded libraries

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06T Formal requirements before examination [chapter 6.20 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 07/01/2020, OBSERVADAS AS CONDICOES LEGAIS.

B21F Lapse acc. art. 78, item iv - on non-payment of the annual fees in time

Free format text: REFERENTE A 20A ANUIDADE.