ES2324513T3 - Procedimientos de clonacion y produccion de cadenas de fragmentos con contenido de informacion legible. - Google Patents
Procedimientos de clonacion y produccion de cadenas de fragmentos con contenido de informacion legible. Download PDFInfo
- Publication number
- ES2324513T3 ES2324513T3 ES00940666T ES00940666T ES2324513T3 ES 2324513 T3 ES2324513 T3 ES 2324513T3 ES 00940666 T ES00940666 T ES 00940666T ES 00940666 T ES00940666 T ES 00940666T ES 2324513 T3 ES2324513 T3 ES 2324513T3
- Authority
- ES
- Spain
- Prior art keywords
- fragments
- chain
- nucleic acid
- code
- chains
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 239000012634 fragment Substances 0.000 title claims abstract description 177
- 238000000034 method Methods 0.000 title claims abstract description 93
- 238000010367 cloning Methods 0.000 title abstract description 6
- 238000004519 manufacturing process Methods 0.000 title description 14
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 40
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 35
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 35
- 230000000295 complement effect Effects 0.000 claims description 52
- 239000002253 acid Substances 0.000 claims description 10
- 230000011664 signaling Effects 0.000 claims description 8
- 239000000523 sample Substances 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 238000003786 synthesis reaction Methods 0.000 claims description 5
- 230000027455 binding Effects 0.000 abstract description 11
- 108091034117 Oligonucleotide Proteins 0.000 description 42
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 26
- 108020004414 DNA Proteins 0.000 description 19
- 239000007787 solid Substances 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000010168 coupling process Methods 0.000 description 9
- 102000003960 Ligases Human genes 0.000 description 8
- 108090000364 Ligases Proteins 0.000 description 8
- 230000008878 coupling Effects 0.000 description 8
- 238000005859 coupling reaction Methods 0.000 description 8
- 238000009396 hybridization Methods 0.000 description 8
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- -1 sheets Substances 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000011049 pearl Substances 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 101100135641 Caenorhabditis elegans par-3 gene Proteins 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 241001123946 Gaga Species 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 229920001410 Microfiber Polymers 0.000 description 1
- 108091081548 Palindromic sequence Proteins 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 108010034634 Repressor Proteins Proteins 0.000 description 1
- 102000009661 Repressor Proteins Human genes 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 239000004809 Teflon Substances 0.000 description 1
- 229920006362 Teflon® Polymers 0.000 description 1
- 101000803959 Thermus thermophilus (strain ATCC 27634 / DSM 579 / HB8) DNA ligase Proteins 0.000 description 1
- 108010001244 Tli polymerase Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 229910002056 binary alloy Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 150000001875 compounds Chemical group 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 125000002485 formyl group Chemical class [H]C(*)=O 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 230000005389 magnetism Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 239000003658 microfiber Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229940127073 nucleoside analogue Drugs 0.000 description 1
- 230000005408 paramagnetism Effects 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/66—General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10T—TECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
- Y10T436/00—Chemistry: analytical and immunological testing
- Y10T436/14—Heterocyclic carbon compound [i.e., O, S, N, Se, Te, as only ring hetero atom]
- Y10T436/142222—Hetero-O [e.g., ascorbic acid, etc.]
- Y10T436/143333—Saccharide [e.g., DNA, etc.]
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
Procedimiento para la síntesis de una molécula de ácido nucleico bicatenario que contiene información en forma de código alfanumérico para almacenar información en forma de un código alfanumérico que comprende por lo menos las etapas siguientes: i) generar n fragmentos de ácido nucleico bicatenario, en el que por lo menos n-2 fragmentos presentan zonas monocatenarias en ambos terminales y 2 fragmentos presentan zonas monocatenarias en por lo menos un terminal, en el que (n-1) zonas monocatenarias son complementarias con otras (n-1) zonas monocatenarias, produciendo de este modo (n-1) pares complementarios; ii) poner en contacto dichos n fragmentos de ácido nucleico bicatenario, simultánea o consecutivamente, para efectuar la unión de dichos pares complementarios de las zonas monocatenarias; y iii) ligar opcionalmente dichos pares complementarios simultánea o consecutivamente para producir una molécula de ácido nucleico constituida por n fragmentos; en el que dichos fragmentos comprenden zonas que representan una unidad de información correspondiente a uno o más elementos del código.
Description
Procedimientos de clonación y producción de
cadenas de fragmentos con contenido de información legible.
La presente invención se refiere a nuevos
procedimientos de generación de ADN con un contenido de información
fácilmente legible.
Actualmente los procedimientos de clonación
conocidos implican generalmente la utilización de enzimas de
restricción que se utilizan para generar fragmentos para la
inserción y vectores de escisión para las secuencias
correspondientes producidas y por consiguiente terminales
complementarias. Generalmente, las enzimas que se utilizan cortan
secuencias palindrómicas y de este modo producen prolongaciones
idénticas. Diferentes secuencias que son cortadas con las mismas
endonucleasas de restricción pueden ligarse a continuación
conjuntamente para formar nuevos ácidos nucleicos
recombinantes.
Mandecki y Bolling; Gene. 15 de agosto de
1988; 63(1):101-7 describe un procedimiento
para la síntesis de un gen u otro fragmento de ADN con una secuencia
definida.
Se ha descubierto actualmente de manera
sorprendente que al generar fragmentos que comprenden zonas que
representan una unidad de información que corresponden a uno o más
elementos del código, puede sintetizarse una molécula de ácido
nucleico bicatenaria que puede almacenar código alfanumérico. Según
un primer aspecto de la invención, un procedimiento para sintetizar
una molécula de ácido nucleico bicatenario que contiene información
en forma de código alfanumérico para almacenar la información en
forma de código alfanumérico comprende:
- i)
- generar n fragmentos de ácido nucleico bicatenario, en los que por lo menos n-2 fragmentos presentan zonas monocatenarias en ambos terminales y 2 fragmentos presentan zonas monocatenarias en por lo menos un terminal, en los que (n-1) zonas monocatenarias son complementarias con (n-1) otras zonas monocatenarias, produciendo de este modo (n-1) pares complementarios;
- ii)
- poner en contacto dichos n fragmentos de ácido nucleico bicatenarios simultánea o consecutivamente, para efectuar la unión de dichos pares complementarios de zonas monocatenarias; y
- iii)
- ligar opcionalmente dichos pares complementarios simultanea o consecutivamente para producir una molécula de ácido nucleico constituida por n fragmentos;
en la que dichos fragmentos comprenden zonas que
representan una unidad de información correspondiente a uno o más
elementos del código.
\vskip1.000000\baselineskip
Según un segundo aspecto de la invención, un
procedimiento identifica los elementos del código contenidos en una
molécula de ácido nucleico preparada según el primer aspecto, en el
que una sonda portadora de unos medios de señalización específica
para uno o más elementos del código, está unida a la molécula de
ácido nucleico y se detecta una señal generada por los medios de
señalización, por lo que pueden identificarse uno o más elementos
del código.
"Zonas monocatenarias" como se hace
referencia en la presente memoria son las zonas que sobresalen en el
extremo, es decir en el terminal de las moléculas de ácido nucleico.
Estas zonas son suficientes para permitir la unión específica de
moléculas con zonas monocatenarias complementarias y la ligadura
ulterior entre estas moléculas. De este modo, las zonas
monocatenarias son por lo menos de 1 base de longitud,
preferentemente de 3 bases de longitud, pero preferentemente de por
lo menos 4 bases, por ejemplo de 4 a 10 bases, por ejemplo de 4, 5 ó
6 bases de longitud. Se contemplan zonas monocatenarias de hasta 20
bases de longitud que permitirán la utilización de fragmentos en el
procedimiento de la invención que son de hasta Mb de longitud.
"Unión" tal como se utiliza en la presente
memoria se refiere a la etapa de asociación de zonas monocatenarias
complementarias (es decir, unión no covalente). La "ligadura"
ulterior de las secuencias consigue la unión covalente.
"Complementario" tal como se utiliza en la
presente memoria se refiere al reconocimiento de bases específicas
mediante por ejemplo la complementariedad base-base.
Sin embargo, la complementariedad tal como se hace referencia en la
presente memoria incluye el emparejamiento de nucleótidos en el
emparejamiento de bases Watson-Crick además del
emparejamiento de análogos de nucleósido, por ejemplo desoxinosina
que son susceptibles de hibridación específica a la base en las
moléculas de ácido nucleico y otros análogos que dan como resultado
dicha hibridación específica, por ejemplo, APN, ADN y sus análogos.
La complementariedad de una zona monocatenaria con otras se
considera que es suficiente, cuando, en las condiciones utilizadas,
se consigue la fijación específica. De este modo en el caso de
zonas monocatenarias largas puede tolerarse alguna falta de
especificidad base-base, por ejemplo, mal
emparejadas, por ejemplo si una base en un serie de 10 bases no es
complementaria. Dichos desemparejamientos ligeros que no afectan a
la última fijación ni a la ligadura de las zonas monocatenarias se
consideran que son complementarios para los fines de la presente
invención. Las zonas monocatenarias pueden conservar partes, en la
unión, que continúan siendo monocatenarias, por ejemplo cuando se
emplean prolongaciones de diferentes tamaños o las porciones
complementarias no comprenden todas las zonas monocatenarias. En
dichos casos, tal como se mencionó anteriormente, puede conseguirse
proporcionar el enlace de zonas monocatenarias que se considera que
son complementarias. En estos casos, antes de la ligadura, las bases
desaparecidas pueden rellenarse en por ejemplo utilizando el
fragmento de Klenow, u otras técnicas apropiadas cuando sea
necesario.
La ligadura entre las moléculas de ácido
nucleico se consigue por cualquier técnica apropiada conocida en la
materia (véase por ejemplo, Sambrook et al., en
"Molecular Cloning: A Laboratory Manual", 2ª ed., Editor
Chris Nolan, Cold Spring Harbor Laboratory Press, 1989). Por
ejemplo, la ligadura puede conseguirse químicamente o mediante la
utilización de ligasas naturales apropiadas o variantes de las
mismas. Las ligasas apropiadas que pueden utilizarse incluyen la T4
ADN ligasa, y ligasas termoestables, tales como Pfu, Taq y TTH ADN
ligasa. La ligadura puede evitarse o permitirse controlando el
estado de fosforilación de las bases terminales por ejemplo mediante
la utilización apropiada de cinasas o fosfatasas. Pueden utilizarse
también de manera apropiada grandes volúmenes para permitir
ligaduras intermoleculares. De este modo, puede utilizarse adaptador
elevado para las relaciones vector/inserción para evitar que el
vector o la inserción se vuelvan a ligar en su material
original.
En el procedimiento de la invención, se combinan
múltiples fragmentos mediante la selección apropiada de las zonas
monocatenarias que aparecen en sus extremos. Esto tiene aplicación
en la producción de secuencias específicas con fines biológicos,
pero presenta utilidad específica en la producción de cadenas de
moléculas de ácido nucleico en las que las unidades que preparan las
cadenas cada una significa una unidad de información, es decir, las
cadenas pueden utilizarse para almacenar información, tal como se
describirá con más detalle a continuación. Tal como se utiliza en la
presente memoria "cadenas" se refiere a una disposición en
serie de los fragmentos tal como se describe en la presente memoria.
Dichas cadenas son preferentemente lineales e incluyen secuencias de
fragmentos ramificadas y no ramificadas. De este modo, por ejemplo,
pueden utilizarse fragmentos de ADN ramificados para proporcionar
cadenas con una disposición ramificada de los fragmentos.
Para producir cadenas de moléculas de ácido
nucleico con diferentes fragmentos unitarios, es decir cadenas de
fragmentos puede utilizarse el procedimiento siguiente. En primer
lugar es necesario generar fragmentos que tengan prolongaciones en
su extremo, para permitirles que se unan uno con otro. (Los
fragmentos 3' y 5' últimos pueden sin embargo tener una prolongación
solamente en el extremo que estará acoplado a los fragmentos
internos). Tal como se describirá con mayor detalle a continuación,
para determinadas aplicaciones, oligonucleótidos apropiados pueden
proceder de bancos en los que los miembros presentan variabilidad en
por lo menos alguna de sus bases. Si deben producirse bancos en los
que los miembros son bicatenarios, se valorará que el número de
miembros en dicho banco pueda ser más bien elevado. Esto puede sin
embargo reducirse eficazmente utilizando un número más pequeño de
bloques de construcción más pequeño.
Una estrategia consiste en construir dos
oligonucleótidos monocatenarios utilizando técnicas convencionales.
Pueden utilizarse oligonucleótidos que tienen una zona de 6 bases
que se complementan entre sí y de este modo permiten la hibridación.
Como no todas las moléculas están implicadas en la hibridación, las
zonas monocatenarias se extienden más allá de la zona de hibridación
creando de este modo zonas monocatenarias. Por conveniencia el
número de miembros del banco requeridos puede reducirse aún más si
aparecen secuencias repetidas con frecuencia en la cadena del
fragmento. Esto se describirá con mayor detalle a continuación.
Una vez se han creado las unidades (es decir,
los fragmentos) de la cadena bicatenaria apropiadas pueden ligarse
en la misma solución, proporcionando que las diferentes
prolongaciones presentes en las secuencias sean únicas.
Por lo tanto, en un primer aspecto, la presente
invención proporciona un procedimiento de síntesis de una molécula
de ácido nucleico bicatenaria que contiene información en forma de
código alfanumérico para almacenar información que comprende por lo
menos las etapas siguientes:
- 1)
- generar n fragmentos de ácido nucleico bicatenarios, en el que por lo menos n-2 fragmentos tienen zonas monocatenarias en ambos terminales y 2 fragmentos tienen zonas monocatenarias en por lo menos un terminal, en el que (n-1) zonas monocatenarias son complementarias con otras (n-1) zonas monocatenarias, produciendo de este modo (n-1) pares complementarios,
- 2)
- poner en contacto dichos n fragmentos de ácido nucleico bicatenario, simultánea o consecutivamente, para efectuar la unión de dichos pares complementarios de zonas monocatenarias,
- 3)
- ligar opcionalmente dichos pares complementarios simultánea o consecutivamente para producir una molécula de ácido nucleico constituida por n fragmentos, en los que dichos fragmentos comprenden zonas que representan una unidad de información correspondiente a uno o más elementos del código.
\vskip1.000000\baselineskip
Las expresiones "molécula de ácido
nucleico", "zonas monocatenarias", "complementario",
"enlace" y "ligadura" se describieron anteriormente en la
presente memoria.
En la etapa 1) se hace referencia a
(n-1) zonas monocatenarias complementarias a
"otras" (n-1) zonas monocatenarias. Ésta
describe dos familias de zonas monocatenarias, que comprenden
conjuntamente 2(n-1) miembros, que forman
n-1 pares. Por lo tanto "otras" se refiere a
las zonas monocatenarias en la segunda familia que no están
presentes en la primera familia.
"Poner en contacto" tal como se utiliza en
la presente memoria se refiere a poner juntos los fragmentos
bicatenarios en condiciones que sean conductores para la asociación
de las zonas monocatenarias complementarias. Dependiendo del
procedimiento utilizado, esto puede permitir por último la ligadura
de los fragmentos que llevan estas zonas. Sin embargo debe indicarse
que los fragmentos pueden estar unidos por otros procedimientos
aparte de la ligadura. Por ejemplo puede utilizarse la PCR con
cebadores apropiados, por ejemplo pares de cebadores.
La puesta en contacto y/o ligadura simultánea o
consecutiva se refiere a la posibilidad de añadir los fragmentos
individualmente o en grupos a una cadena en crecimiento o añadir
simultáneamente los n fragmentos juntos, en los que la ligadura
puede realizarse después de cada adición o una vez se han combinado
los n fragmentos. Preferentemente la ligadura se efectúa una vez se
han combinado todos los fragmentos.
"Fragmentos" tal como se utiliza en la
presente memoria son preferentemente mayores de 6 bases de longitud
(en los que dicha longitud se refiere a la longitud de cada
oligonucleótido monocatenario que construye el fragmento que puede
diferenciarse ligeramente en la longitud de uno a otro), por ejemplo
entre 6 y 50 bases, por ejemplo de 8 a 25 bases.
Tal como se hace referencia en la presente
memoria, "n" es un número entero de por lo menos 4, por
ejemplo, por lo menos 10 ó 100, por ejemplo entre 25 y 200.
Preferentemente, tal como se mencionó
anteriormente, los fragmentos se generan mediante la utilización de
oligonucleótido monocatenarios para generar moléculas bicatenarias
apropiadas.
De particular interés en dichos procedimientos
es la producción de cadenas de fragmentos que pueden utilizarse para
almacenar información en forma de código a la que puede accederse
fácilmente.
Existe actualmente una gran necesidad de
almacenar información con diferentes propósitos (por ejemplo
programas informáticos, música, películas, bases de datos, etc.). Es
por consiguiente imperativo encontrar unos medios de almacenamiento
eficaces, que den como resultado el desarrollo de tecnología de CD
ROM, DVD, etc. las moléculas de ácido nucleico ofrecen
procedimientos muchos más eficaces para almacenar información y
presentan varias ventajas sobre procedimientos de almacenamiento
actualmente en utilización. Por ejemplo, la capacidad de
almacenamiento de las moléculas de ácido nucleico es extensa. En
principio, uno tubo de ensayo que contiene moléculas de ADN puede
contener tanta información como varios millones de CD ROM o más. El
ácido nucleico puede copiarse rápida y eficazmente utilizando
sistema naturales que son mejorados en gran medida por técnicas que
han sido desarrolladas tales como PCR, LCR, etc. Cuando se
almacenan apropiadamente, las moléculas de ácido nucleico pueden
conservarse durante periodos sumamente largos. Las herramientas
naturales para la manipulación de moléculas nucleicas están ya
disponibles para el tratamiento de las moléculas, por ejemplo
polimerasas, enzimas de restricción, factores de transcripción,
ribosomas, etc. Las moléculas de ácido nucleico pueden también tener
propiedades
catalíticas.
catalíticas.
Además, pueden utilizarse moléculas de ácido
nucleico como sistemas seguros ya que pueden construirse de tal
manera que no sean copiadas fácilmente, a diferencia de la copia de
los sistemas de almacenamiento actuales, por ejemplo los CD, etc.,
que está aumentando constantemente.
Anteriormente, sin embargo, no fue posible
aprovecharse del enorme potencial ofrecido por las moléculas de
ácido nucleico debido a la ausencia de algunos procedimientos
eficaces para escribir mensajes de ADN o leer mensajes de ADN. El
procedimiento descrito anteriormente proporciona procedimientos que
superan este problema permitiendo la síntesis rápida de grandes
moléculas de ADN y procedimientos para escanear rápida y eficazmente
aquellas moléculas para recuperar la información.
La clave para la recuperación eficaz de la
información codificada por las moléculas de ácido nucleico
producidas según el procedimiento descrito en la presente memoria,
es la expansión de la unidad que proporciona información en la
molécula. En la naturaleza y en los procedimientos utilizados
anteriormente, cada base en la secuencia presenta un contenido de
información individual. De hecho se han descrito procedimientos en
los que una sola base puede significar más de una sola unidad de
información, por ejemplo en código binario, las bases A="00",
C="01", G="10" y T="11". Aunque esto presenta
ventajas siempre que cantidades significativas de información puedan
estar contenidas en una sola molécula, el sistema adolece de graves
inconvenientes ya que requiere procedimientos de escritura y lectura
en los que las bases individuales puedan acoplarse y
discriminarse.
En un procedimiento preferido de la invención
por consiguiente, se proporcionan unidades de información que no son
bases individuales, sino que en su lugar son secuencias cortas. Las
técnicas descritas anteriormente permiten la producción rápida de
dichas cadenas y que pueda accederse fácilmente a la
información.
Por lo tanto las unidades que representan
información codificada pueden generarse y leerse. Cada unidad de
información por consiguiente puede representar un elemento del
código, en el que el código puede por ejemplo ser código
alfanumérico o una representación más simple tal como un código
binario. En cada caso los elementos individuales del código, por
ejemplo "a", "b", "c", "1", "0", etc. es
necesario estén representados por una secuencia individualizada y
específica.
Tal como se utiliza en la presente memoria
"unidades de información" se refiere a secuencias cortas
discretas que representan una sola pieza de información, por ejemplo
uno o más elementos (es decir, combinaciones de los mismos) de un
código.
"Elementos" del código, tal como se
mencionó anteriormente se refieren a diferentes miembros que
construyen un código tal como un código binario o alfanumérico.
Por lo tanto, según el procedimiento de la
invención, los fragmentos que están unidos comprenden zonas que
representan una unidad de información correspondiente a uno o más
elementos del código. El código es alfanumérico. Especialmente con
preferencia el código es binario. De este modo, por ejemplo,
considerando un sistema binario de captura de información, si se
desea producir cadenas constituidas por "0", "1"
fragmentos, las combinaciones de secuencias apropiadas pueden
atribuirse a "0" ó "1".
Por conveniencia cada uno o más de dichos
elementos del código (juntos) presenta la fórmula:
(X)_{a},
en la
que
X es un nucleótido A, T, G, C o un derivado del
mismo que permite la unión complementaria y puede ser igual o
diferente en cada posición, y
a es un número entero mayor de 2, por ejemplo
mayor de 4, por ejemplo de 2 a 20, preferentemente de 4 a 10, por
ejemplo de 6 a 8,
en el que (X)_{a} es diferente de cada
uno o más elementos del código.
Especialmente preferentemente, en el caso del
código binario, los elementos del código "1" y "0" puede
presentar las fórmulas:
"0"=(X)_{a}
\hskip0.5cmy
\hskip0.5cm"1"=(Y)_{b},
en la
que
(X)_{a} e (Y)_{b} no son
idénticos,
X e Y son cada uno un nucleótido A, T, G, C o un
derivado de los mismos que permite la unión complementaria y pueden
ser iguales o diferentes en cada posición, y
a y b son números enteros mayores de 2, por
ejemplo mayores de 4, por ejemplo de 2 a 20, preferentemente de 4 a
10, por ejemplo de 6 a 8.
Tal como se hace referencia en la presente
memoria un "derivado" que es susceptible de unión
complementaria se refiere a un análogo o variante de nucleótido que
es susceptible de unirse a un nucleótido presente en una cadena
complementaria, e incluye variantes de nucleótidos naturales o
sintéticas específicas, por ejemplo uracilo o nucleótidos metilados
o amidados, etc.
En la forma más sencilla y preferida, X e Y son
los mismos en cada posición, por ejemplo "0" = GGGGGGGG y
"1" = AAAAAAAA. Sin embargo, pueden utilizarse secuencias
repetidas tales como [AC]_{6}A o [GT]_{6}A. La
secuencia del código puede presentar también una propiedad
funcional, por ejemplo, puede ser un elemento de integración tal
como AttP1 o AttP2.
Se valorará sin embargo que las secuencias
descritas anteriormente puedan también indicar más de un solo
elemento del código. De este modo por ejemplo la unidad de
información puede indicar 2 o más elementos del código, por ejemplo
de 2 a 32 elementos, preferentemente de 2 a 4 elementos del código.
Si, por ejemplo, se considera el código binario, cada unidad de
información puede referirse a "01" ó "00" u "11" ó
"10".
En el procedimiento descrito en la presente
memoria, las cadenas que comprenden dichas propiedades pueden
prepararse de la manera siguiente. Para producir una cadena con, por
ejemplo, 8 0/1 fragmentos, ocho fragmentos que empiezan por "0"
con diferentes prolongaciones y 8 fragmentos que comienzan por
"1" con diferentes prolongaciones se generan como se ilustra en
la Figura 1. En este caso los fragmentos "0" estaban
constituidos por la secuencia GGGGGGGG, aunque esta podría
sustituirse por otras secuencias. Además los fragmentos son
sintetizados de modo que tengan prolongaciones únicas de modo que
puedan ligarse solamente en una posición. Por lo tanto, los
fragmentos para la posición 1 en la cadena se producen de modo que
tengan una prolongación que esté complementada por una de las
prolongaciones en los fragmentos para la posición 2. De este modo,
los fragmentos de la posición 2 se sintetizan de modo que puedan
unirse a los fragmentos de la posición 1. Asimismo los fragmentos de
la posición 3 pueden unirse solamente a los fragmentos de la
posición 2 en uno de sus terminales y los fragmentos de la posición
4 al otro terminal y así sucesivamente. Estos fragmentos se
almacenan por separado. Con el fin de construir una cadena, se hace
la selección de una de las dos alternativas para cada posición de
modo que se produzca una cadena binaria apropiada.
Por lo tanto, en el esquema esbozado
anteriormente, para producir un fragmento de cadena que representa
una cadena 01001011, los fragmentos "0" de las posiciones 1, 3,
4 y 6 se mezclan con los fragmentos "1" de las posiciones 2, 5,
7 y 8. Si los fragmentos se ligan a continuación añadiendo ligasa o
utilizando otros procedimientos de ligadura mencionados
anteriormente, se producirá la cadena descrita anteriormente. Como
se apreciará, ésta cadena podría también conseguirse utilizando por
ejemplo solamente 4 fragmentos si la unidad de información
transportase cada fragmento de los elementos del código 2
indicados.
Además es posible combinar fragmentos
intermedios de las cadenas, (por ejemplo que contienen por lo menos
4 fragmentos) con otros fragmentos de las cadenas, que proporcionan
prolongaciones apropiadas existentes en sus terminales puedan
ligarse para formar fragmentos de cadenas compuestos. Por lo tanto,
pueden realizarse en paralelo varios ciclos y combinarse los
productos. En el procedimiento representado en la Figura 1 los
fragmentos del extremo presentan extremos truncados, pero
evidentemente, pueden utilizarse fragmentos apropiados que tengan
prolongaciones asimismo en los terminales.
Una técnica apropiada para producir 8 cadenas de
fragmentos, que contiene cada una 8 fragmentos que pueden ser
ligados entonces se ilustra en la Figura 2. Para el fragmento de la
cadena 1, se utilizan fragmentos terminales de modo que es posible
para la cadena de fragmento completa ligarse al fragmento de la
cadena 2 y así sucesivamente. Éstos pueden combinarse a continuación
para producir una cadena de 64 fragmentos. Asimismo, dichas cadenas
de 8 fragmentos pueden combinarse para producir cadenas de
fragmentos que comprenden 512 fragmentos.
Como se apreciará, tal como en la producción de
cadenas más cortas, la etapa de ligadura, cuando se lleva a cabo, se
efectúa convenientemente una vez que se han combinado todas las
cadenas del fragmento. Sin embargo, si se desea la etapa de ligadura
puede realizarse sucesivamente además de cada cadena de fragmentos
posterior.
Para combinar 8 fragmentos binarios por ciclo,
se requieren 16 fragmentos de partida diferentes, que representan
las diferentes alternativas "0", "1" en cada posición.
Para construir una cadena de 64 fragmentos utilizando dos ciclos, es
decir para producir 8 cadenas con 8 fragmentos que se ligan a
continuación, solamente se requieren 16 + (4x7) = 44 fragmentos de
partida. Por lo tanto, el número de diferentes fragmentos de partida
requeridos refleja un aumento casi lineal en contraste con las
combinaciones de las cadenas de fragmentos que pueden producirse que
aumenta exponencialmente con el número de ciclos. Como consecuencia,
pueden producirse fragmentos de cadena muy largos con un número
relativamente de fragmentos de partida.
Desde luego, como se mencionó anteriormente,
pueden producirse cadenas intermedias más largas o más cortas que 8.
Ya que existe un gran número de permutaciones en la zona que
sobresale, pueden utilizarse más fragmentos de partida permitiendo
de este modo que se construyan fragmentos mayores en un solo ciclo.
Por lo tanto, puede reducirse el número de ciclos necesarios para
producir cadenas largas.
Las cadenas de fragmentos pequeños producidas
según los procedimientos descritos en la presente memoria pueden
acoplarse conjuntamente también utilizando variaciones de las
técnicas descritas en la presente memoria. Por ejemplo, pueden
utilizarse pares de cebadores complementarios para unir varias
cadenas tal como se describe en el ejemplo 5. En esta técnica, la
ampliación de las cadenas de fragmentos se consigue utilizando
diferentes pares de cebadores. El segundo cebador en el par cebador
1 es complementario con el primer cebador en el par cebador 2 y el
segundo cebador en el que el par es complementario con el primer
cebador en el par cebador 3 y así sucesivamente. Se realizan a
continuación reacciones de PCR que producen productos que en forma
monocatenaria son capaces de unirse entre si mediante sus extremos
complementarios introducidos por los pares de cebador. Éstos pueden
ligarse a continuación.
Alternativamente, las cadenas de fragmentos
preparadas por los procedimientos descritos en la presente memoria
pueden ampliarse con un cebador que contiene una secuencia de
restricción con una nucleasa que escinde fuera su secuencia de
reconocimiento. Estos productos de ampliación se digieren a
continuación con esta nucleasa para producir prolongaciones no
palindrómicas en el extremo de cada cadena de fragmento. Mediante la
selección de la secuencia apropiada (por ejemplo en el cebador o los
fragmentos que se utilizan) las prolongaciones que se generan
permiten a las diferentes cadenas de fragmentos combinarse en
orden.
Por lo tanto en un aspecto preferido, la
invención proporciona un procedimiento de síntesis de una molécula
de ácido nucleico bicatenaria que comprende por lo menos las etapas
siguientes:
- 1)
- generar cadenas de fragmentos según el procedimiento descrito anteriormente en la presente memoria;
- 2)
- generar opcionalmente zonas monocatenarias en el extremo de dichas cadenas de fragmentos en las que dichas zonas monocatenarias son complementarias con otras zonas monocatenarias en dichas cadenas de fragmentos formando de este modo pares complementarios de zonas monocatenarias,
- 3)
- poner en contacto dichas cadenas de fragmentos entre sí, simultánea o consecutivamente, para efectuar la unión de dichos pares complementarios de cadenas monocatenarias.
Opcionalmente dichas cadenas se ligan, sin
embargo, pueden utilizarse técnicas alternativas para formar la
cadena última, por ejemplo puede utilizarse la PCR tal como se
describe en la presente memoria.
Preferentemente las cadenas de fragmentos
intermedios son entre 4 y 20 fragmentos de longitud, por ejemplo de
5 a 10, y entre 5 y 50 dichas cadenas de fragmentos se combinan por
ejemplo entre 10 y 20.
Por conveniencia los fragmentos que deben
utilizarse en el procedimiento de la invención están contenidos en
bancos. Los procedimientos de producción de los fragmentos que
construyen la librería son bien conocidos en la técnica. Por
ejemplo, pueden producirse una serie de oligonucleótidos que
contienen dos porciones. Una primera porción que formará una
prolongación en un extremo y una segunda porción que efectuará la
unión a un oligonucleótido complementario y que contienen en esta
porción la unidad de información. Al producir las porciones de
hibridación comunes y las prolongaciones de las variantes, se crea
una serie de oligonucleótidos bicatenarios para uno o más elementos
del código (indicados por lo menos por una parte de la porción de
hibridación). Esto proporciona un banco para uno (o una combinación
de) elementos del código. Pueden crearse bancos diferentes para
diferentes elementos del código (o combinaciones de los mismos),
mediante alteración apropiada de la unidad de información, es decir,
la secuencia en la porción de hibridación.
Por conveniencia para su utilización en la
invención, estos diferentes oligonucleótidos bicatenarios están
dispuestos en dos redes bidimensionales de modo que en una dimensión
las posiciones consecutivas dentro del último fragmento están
indicadas y en la segunda dimensión el posible elemento del código
(o combinaciones de los mismos) se proporcionan. En el caso más
sencillo, en el código binario, en el que "0" y "1" están
representados por diferentes secuencias, la primera dimensión
comprendería fragmentos para cada posición del fragmento propuesto y
la segunda dimensión tendría solamente 2 variantes ("0" y
"1"). Esto puede simplemente verse como un solo banco o dos
bancos, es decir los bancos "0" ó "1". Una vez producidos
estos bancos, las cadenas de fragmentos en cualquier orden deseado
de fragmentos pueden producirse fácilmente.
Con el fin de que los miembros del banco se
dirijan de manera apropiada a su zona o pocillo correcta (es decir
el banco puede estar compuesto por soportes sólidos separados, o un
soporte solidó con diferentes direcciones, por ejemplo pocillos o
diferentes pocillos que contienen diferentes soluciones), cualquier
técnica de clasificación apropiada puede utilizarse. Esta
clasificación puede conseguirse en virtud del procedimiento
utilizado para la producción de los miembros del banco, o puede
conseguirse la clasificaron mediante una técnica apropiada, por
ejemplo por unión a oligonucleótidos complementarios en la zona del
banco oportuna.
Los soportes sólidos apropiados adecuados para
acoplar miembros del banco son bien conocidos en la técnica y se
describen extensamente en la bibliografía y generalmente hablando,
el soporte sólido puede ser cualquiera de los soportes o matrices
bien conocidos que se utilizan extensamente en la actualidad o se
proponen para la inmovilización, separación, etc. en los
procedimientos químicos o bioquímicos. De este modo, por ejemplo,
los restos de inmovilización pueden tomar la forma de perlas,
partículas, hojas, geles, filtros, membranas, tiras de microfibra,
tubos o placas, fibras o capilares, hechos por ejemplo de material
polimérico, por ejemplo agarosa, celulosa, aginato, teflón, látex o
poliestireno. Resultan generalmente preferidos los materiales en
partículas, por ejemplo perlas. Por conveniencia, el resto de
inmovilización puede comprender partículas magnéticas, tales como
partículas superparamagnéticas.
En una forma de realización preferida, se
utilizan placas o láminas para permitir la fijación de las moléculas
en disposición lineal. Las placas pueden comprender también pocillos
perpendiculares a la placa en los que pueden acoplarse moléculas. El
acoplamiento al soporte sólido puede realizarse directa o
indirectamente y la técnica que se utiliza dependerá de si la
molécula que debe acoplarse es un oligonucleótido para la fijación
del miembro del banco o el propio miembro del banco. Para acoplar
los miembros del banco directamente, es decir, no mediante la unión
a un oligonucleótido, el acoplamiento puede realizarse por
conveniencia indirectamente mediante la utilización de un resto de
acoplamiento transportado en las moléculas de ácido nucleico y/o el
soporte sólido. Por lo tanto, por ejemplo, puede utilizarse un par
de acompañantes para la unión por afinidad, tal como avidina,
estreptavidina o biotina, ADN o proteína de unión a ADN (por ejemplo
la proteína represora lac I o la secuencia del operador lac a la
que se une), anticuerpos (que pueden ser mono- o policlonales)
fragmentos de anticuerpo o los epítopos o haptenos de anticuerpos.
En estos casos, un acompañante del par de unión se acopla al soporte
sólido (o es parte inherente del mismo) y el otro acompañante se
acopla a (o es parte inherente de) las moléculas de ácido nucleico.
Alternativamente, pueden utilizarse técnicas de acoplamiento directo
tales como por ejemplo si se utiliza un filtro, el acoplamiento
puede realizarse por reticulación producida por UV. Cuando se
acoplan fragmentos de ADN, puede utilizarse también la tendencia
natural del ADN a adherirse al vidrio.
Los oligonucleótidos que deben utilizarse para
captura de los miembros del banco pueden acoplarse al soporte sólido
mediante la utilización de grupos funcionales apropiados en el
soporte sólido.
El acoplamiento de grupos funcionales apropiados
al soporte sólido puede realizarse por procedimientos bien conocidos
en la técnica, que incluyen por ejemplo, el acoplamiento por grupos
hidroxilo, carboxilo, aldehído o amino que pueden proporcionarse
mediante el tratamiento del soporte sólido para proporcionar
recubrimientos de la superficie adecuados. El acoplamiento de grupos
funcionales apropiados a las moléculas de ácido nucleico de la
invención puede realizarse por ligadura o introducirse durante la
síntesis o ampliación, utilizando por ejemplo cebadores que llevan
un resto apropiado, tal como biotina o una secuencia específica para
captura.
El mezclado apropiado puede conseguirse por
automatización. Por ejemplo, en el caso de los fragmentos "0" y
"1", la combinación correcta de estos elementos es la etapa
crítica desde el punto de vista del consumo de recursos y de tiempo.
Este procedimiento esta descrito con mayor detalle en el Ejemplo 2.
En particular, el procedimiento puede minimizarse proporcionando
procedimientos de ampliación adecuados (tales como la clonación y/o
PCR) se emplean en la ultima etapa. Por lo tanto, pueden utilizarse
técnicas que utilizan tecnología tal como la clasificación
utilizando citómetros de flujo tal como se describe en la Figura 3C.
Dichos procedimientos de clasificación están muy probados y son
capaces de clasificar aproximadamente 5 a 30.000 gotitas por segundo
para un equipo convencional, pero hasta 300.000 gotitas por segundo
para los citómetros más avanzados.
Como se mencionó anteriormente, es posible que
cada fragmento pueda indicar más de un solo elemento del código. Si
por ejemplo cada fragmento indica 5 elementos del código, utilizando
la tecnología existente y un banco de 32x100 componentes del banco,
si se conectan 3.200 recipientes al dispositivo de clasificación
ilustrado en la Figura 3C debería ser posible escribir varios miles
de cadenas con 500 elementos del código por segundo. Evidentemente,
un procedimiento que puede generar secuencias de ácido nucleico con
tal rapidez ofrece ventajas significativas en los procedimientos
conocidos en la técnica.
La molécula de ácido nucleico (es decir, la
cadena de fragmentos) producida según el procedimiento descrito
anteriormente y las moléculas monocatenarias de la misma comprenden
más propiedades de la invención. Estas moléculas pueden, cuando
proceda, ser incluidas en un vector.
Una vez producidas, las cadenas de fragmentos,
en forma bicatenaria o monocatenaria, pueden utilizarse para
almacenar información. En dichos casos se requiere unos medios
apropiados de lectura de la información almacenada en estas cadenas.
En algunas aplicaciones, las cadenas de fragmentos pueden dirigirse
de manera apropiada a zonas específicas, por ejemplo mediante la
unión a oligonucleótidos transportados sobre soportes sólidos que
son complementarios a las prolongaciones en un terminal de las
cadenas de fragmentos. Alternativamente pueden utilizarse el
anticuerpo/antígeno apropiado, o los sistemas de reconocimiento de
ADN:proteína. Por lo tanto, a continuación puede accederse a la
información almacenada en las moléculas dirigidas de esta manera, o
en la solución.
El documento WO 00/39333 describe técnicas
apropiadas para dirigir y leer la información contenida en moléculas
de ácido nucleico. De particular interés a este respecto son las
técnicas en las que se detecta la fluorescencia de las sondas que
llevan marcadores fluorescentes dirigidos a secuencias específicas.
En dichas técnicas, las sondas que llevan marcadores como los
descritos anteriormente en la presente memoria, pueden dirigirse a
zonas de fragmentos específicas, particularmente a zonas que indican
elementos del código. Las señales generadas (directa o
indirectamente) por los marcadores pueden detectarse a continuación
e identificarse de este modo el elemento del código. Si se utiliza
un solo sistema binario solamente se requieren 2 marcadores
discretos y puede determinarse su modelo de unión. Alternativamente,
si un código más complejo se refleja en las cadenas de fragmentos,
igualmente se requieren marcadores más discretos para la detección
poco ambiciosa.
Por lo tanto en otro aspecto, la presente
invención proporciona un procedimiento de identificación de los
elementos del código contenidos en una molécula de ácido nucleico
preparada tal como se describió anteriormente en la presente memoria
(es decir cadena de fragmentos) en la que una sonda, portadora de
unos medios de señalización (por ejemplo un marcador), específica
para uno o más elementos del código, está unida a dicha molécula de
ácido nucleico y se detecta una señal generada por dichos medios de
señalización, por lo que puede identificarse dicho elemento o más
elementos del código.
Preferentemente dichos medios de señalización
son un marcador tal como se describió anteriormente en la presente
memoria.
Una "sonda" tal como se hace referencia en
la presente memoria se refiere a una molécula de ácido nucleico
apropiada, por ejemplo de secuencias de ADN, ARN o APN, o híbridos
de la misma, que puede unirse a una molécula diana de ácido nucleico
(que puede ser monocatenaria o bicatenaria) por interacciones
específicas, es decir, es específica para elementos del código
específicos, por ejemplo mediante unión complementaria a una
secuencia específica. Las sondas pueden ser de cualquier longitud
conveniente, que permita la unión específica, por ejemplo del orden
de 5 a 50 bases, preferentemente de 8 a 20 bases de longitud.
Unos "medios de señalización" tales como se
utiliza en la presente memoria se refieren a unos medios para
generar una señal directa o indirectamente. Una señal puede ser
cualquier propiedad física o química que pueda detectarse, por
ejemplo presencia de un producto específico, color, fluorescencia,
radiación, magnetismo, paramagnetismo, carga eléctrica, tamaño o
volumen. Preferentemente el marcador es un fluoróforo cuya
fluorescencia se detecta. En dichos casos para la detección del
marcador pueden utilizarse escáneres de fluorescencia y de este modo
la identificación de los elementos del código.
Un elemento del código específico o una
combinación de elementos puede identificarse mediante la aparición
de una señal específica. Evidentemente la posición de cada señal es
crucial para determinar la secuencia de los elementos del código.
Como consecuencia se utilizarían los procedimientos en los que puede
obtenerse la información de la posición (absoluta o relativa). En el
documento WO 00/39333 se describen técnicas apropiadas, por ejemplo
utilizando moléculas diana que se han acoplado a un soporte sólido
en un extremo.
Existen numerosas aplicaciones para las cadenas
de fragmentos una vez producidas en nano y
pico-tecnología, entre otras por ejemplo por
alargamiento de las cadenas de fragmentos mediante una corriente de
liquido, electricidad u otra tecnología y utilizándolas como
plantillas para nano y pico-estructuras. Pueden
utilizarse también productos para marcar productos que pueden
identificarse a continuación para crear su identidad.
Alternativamente, pueden utilizarse moléculas para almacenar la
información, por ejemplo fotografías, texto, música o como
almacenamiento de datos en ordenadores de ADN. La producción rápida
y las técnicas de lectura hacen posibles dichas aplicaciones por
primera vez.
\vskip1.000000\baselineskip
Los ejemplos siguientes solamente en los que las
Figuras referidas son las siguientes se dan a titulo de
ilustración:
La Figura 1 presenta la producción de una cadena
de fragmentos que utiliza 8 fragmentos de partida "0" y
"1" con diferentes prolongaciones;
la Figura 2 presenta la producción de una cadena
de 64 fragmentos en la que se producen 8 cadenas que comprenden 8
fragmentos cada una en la que los terminales de las cadenas 1 y 2, y
2 y 3, etc. son complementarias de modo que pueden ligarse;
la Figura 3 presenta 3 técnicas para mezclar los
fragmentos "0" y "1" de un banco de fragmentos ordenados
para cada posición, en las que A) se seleccionan fragmentos
apropiados por aspiración de los pocillos apropiados, B) se liberan
los fragmentos apropiados en los pocillos del banco y C) se utiliza
un citómetro de flujo para dirigir gotitas apropiadas a la cámara de
mezclado;
la Figura 4 presenta la ampliación por PCR de la
cadena señal
1-0-1-0-0
utilizando los cebadores SP6 y T7. Banda 1: 1 \mug de un escalón
de ADN de 1 kb (Gibco BRL), Banda 2: 10 \mul de ADN de la cadena
de fragmentos ampliada por PCR utilizando los cebadores SP6 y T7.
Banda 3: igual que la banda 2 excepto para la utilización de los
cebadores SP6 y T7-Cy5; y
la Figura 5 presenta la utilización de pares de
cebadores durante el procedimiento de ampliación para unir cadenas
de fragmentos.
\vskip1.000000\baselineskip
Este procedimiento describe un proceso rápido
para mezclar fragmentos "0" y "1" apropiados con las
prolongaciones correctas para producir una cadena específica
constituida por los "0" y "1".
Se producen dos bancos, uno con fragmentos
"0" y otro con fragmentos "1". Como se menciona en la
descripción, se generan con prolongaciones que pueden estar ligadas
a prolongaciones correspondientes para los fragmentos en posiciones
adyacentes. Estos elementos separados se presentan en pocillos
separados para formar el banco, de modo que los fragmentos en la
posición 1 están presentes en el pocillo 1, los fragmentos en la
posición 2 están presentes en el pocillo 2 y así sucesivamente. Los
dos bancos proporcionan de este modo alternativas para cada
posición. Con el fin de generar la cadena es necesario por
consiguiente seleccionar solamente el fragmento correcto "0" o
"1" para la posición 1, y a continuación la posición 2, etc. Ya
que estos fragmentos, como consecuencia de sus únicas prolongaciones
pueden hibridarse solamente con fragmentos para las posiciones
adyacentes, es necesario seleccionar solamente los fragmentos
correctos, a continuación mezclar y ligar estos fragmentos
simultáneamente. En la Figura 3 se presentan diferentes modos de
conseguir este efecto que permiten tres alternativas diferentes
de
mezclado.
mezclado.
En la Figura 3A, por ejemplo para producir la
cadena
0-1-0-0-1,
se utiliza el aparato para aspirar del banco "0" en las
posiciones 1, 3 y 4 y aspirar del banco "1" en las posiciones 2
y 5. Los líquidos que se han aspirado pueden mezclarse a
continuación junto con la ligasa y un tampón apropiado. En la
alternativa B, cada pocillo en el banco está conectado a un
tubo/boquilla que puede cerrarse/abrirse electrónicamente. El
líquido de las boquillas se dirige a la cámara de ligadura junto con
ligasa y un tampón apropiado. Pueden diferentes cadenas construirse
cambiando de manera apropiada el modelo de boquillas que se
abren/cierran.
El procedimiento pueden miniaturizarse también,
por ejemplo utilizando la tecnología de citómetro de flujo tal como
se ilustra en la Figura 3C. En este procedimiento, los componentes
del banco se almacenan en recipientes en la parte superior de la
"maquina de escritura". Gotitas de cada recipiente se guían a
continuación al pocillo de residuos o de producción dependiendo de
la naturaleza de la cadena que debe construirse. El mecanismo de
guía es tal como se utiliza en los citómetros de flujo ordinarios,
es decir, se cargan las gotitas cuando dejan el recipiente y pueden
guiarse electrónicamente en diferentes direcciones.
Por conveniencia, el procedimiento de clonación
puede realizarse utilizando bancos que contienen oligonucleótidos.
Por ejemplo un banco puede contener:
- 1.
- Oligonucleótidos con una parte común y 5 bases en el extremo 5' que varían para proporcionar todas las permutaciones posibles, es decir 1.024 variantes.
- 2.
- Oligonucleótidos con una parte común y 4 bases en el extremo 5' que varían para proporcionar todas las permutaciones posibles, es decir 256 variantes.
- 3.
- Oligonucleótidos con una parte común y 5 bases en el extremo 3' que varían para proporcionar todas las permutaciones posibles, es decir 1024 variantes.
- 4.
- Oligonucleótidos con una parte común y 6 bases en el extremo 3' que varían para proporcionar todas las permutaciones posibles, es decir 4.096 variantes.
En lo expuesto anteriormente, los
oligonucleótidos se producen de tal modo que todos los
oligonucleótidos "1" son complementarios a los oligonucleótidos
"2" en virtud de las bases invariantes, es decir para generar
una molécula bicatenaria con prolongaciones de 4/5 bases variantes.
Asimismo son complementarios los oligonucleótidos "3" y
"4".
Los oligonucleótidos combinados de este modo (es
decir, con prolongaciones en su extremo de 4 a 6 bases pueden
también combinarse con oligonucleótidos bicatenarios complementarios
generados también combinando determinados miembros del banco. De
esta manera las prolongaciones variables de diferentes longitudes
pueden crearse en la molécula resultante, por ejemplo una molécula
con una prolongación de 4 bases en ambos extremos 3' y 5'.
Puede también proporcionarse oligonucleótidos en
el banco que permiten que se unan adaptadores 5' y 3'. De este modo,
por ejemplo, pueden proporcionarse oligonucleótidos que presentan la
siguiente forma:
- 5.
- 5'-AAAA-[comp1]-FFFFF-3'
- 6.
- 5'-DDDDD-[comp1]-FFFFF-3'
- 7.
- 5'-AAAA-[comp1]-HHHHHH-3'
- 8.
- 5'-DDDDD-[comp1]-HHHHHH-3'
- 9.
- 3'-[comp1*]-5'
- 10.
- 5'-BBBB-[comp2]-3'
- 11.
- 5'-EEEEE-[comp2*]-3'
- 12.
- 5'-[comp3]-GGGGG-3'
- 13.
- 5'-[comp3*]-IIIIII-3'
en los que "compx" se refiere a una zona
que es complementaria de la zona "compx*", es decir, "5",
"6", "7" u "8" pueden unirse a "9". Además,
"comp2" puede unirse al oligonucleótido 1 anterior,
"comp2a" puede unirse al oligonucleótido 2, "comp3" puede
unirse al oligonucleótido 4 y "comp3*" puede unirse al
oligonucleótido "3". Las bases indican que "A" se une a
"B", es decir "7" y "10" pueden unirse a sus
extremos. Asimismo "D" se une a "E", "F" se une a
"G" y "H" se une a "I". (Estas bases cuando están
juntas pueden tener un contenido variable, por ejemplo AAAA = GAGA y
entonces BBBB = TCTC).
Mediante la utilización apropiada de los
enlazadores descritos anteriormente pueden combinarse los
adaptadores 5' y 3'. Por ejemplo, el oligonucleótido "2" con la
prolongación 5' de la base 4 específica puede unirse mediante su
zona complementaria a un enlazador "11" oligonucleotídico que a
continuación dejará un solapamiento "EEEEE". Éste puede estar
unido al oligonucleótido "8" por el solapamiento que puede por
sí mismo unirse al oligonucleótido "9" mediante su zona
complementaria. El solapamiento "HHHHHH" puede unirse al
oligonucleótido "13" que puede acoplar un oligonucleótido
"4" por la unión a la zona complementaria. Estas diversas
permutaciones pueden realizarse que dan como resultado varias
longitudes de solapamiento, por ejemplo cualquier combinación de 4,
5 ó 6 solapamientos de bases que pueden estar en la misma o
diferentes cadenas.
Con el fin de identificar conjuntos de
oligonucleótidos con prolongaciones de 6 pares de bases que es
improbable que formen ligaduras de desemparejamiento entre sí pueden
realizarse las etapas siguientes.
- 1.
- Crear los 2.048 pares de prolongaciones de 6 bases.
- 2.
- Eliminar los 32 pares palindrómicos.
Esto produce un conjunto final de 2.016 pares
que sobresalen.
\vskip1.000000\baselineskip
Parte
1
Tomar un par como par nº 1 y seleccionar el par
siguiente ejecutando el apartado 1.
Apartado
1
Calcular las (2016-n) tablas de
puntuaciones desemparejadas no ponderadas entre los n par(es)
ya seleccionados y los (2016-n) pares restantes y
hallar entre los últimos par(es) los que la puntuación menor
en la tabla es la mayor (véase a continuación para detalles acerca
del cálculo de la puntuación). Si existe solamente dicho par,
entonces seleccionarlo. Si existen varios pares, a continuación
calcular las puntuaciones mal emparejadas ponderadas de las
comparaciones de la prolongación que dan la menor puntuación no
ponderada y hallar el/los par(es) para los que la menor
puntuación ponderada es la mayor. Si existe solamente uno de dichos
pares, entonces seleccionarlo. Si existen varios pares, entonces
rehacer el procedimiento completo utilizando la segunda puntuación
menor no ponderada en la tabla de desemparejamientos, a continuación
la tercera menor y así sucesivamente. Si varios pares permanecen
unidos después de todas las puntuaciones equivocadas que se han
considerado, mantenerlos todos.
Repetir el algoritmo 1 para cada par
seleccionado e iterarlo en el número deseado de posiciones para
obtener la(s)
cadena(s) de pares que sobresalen. Este procedimiento genera un árbol con un par que sobresale en cada rama. Se calculan las puntuaciones más bajas no ponderadas y mal emparejadas ponderadas de la combinación específica de pares de cada punto. Se interrumpe una serie de reacciones específica (1) cuando se alcanza el número deseado de posiciones, o (2) cuando la combinación de pares es la que ya se ha encontrado al principio, o (3) cuando las puntuaciones mal emparejadas más bajas de esta combinación son menores que las puntuaciones más bajas de la(s) cadena(s) completa(s) ya construidas. El punto (3) asegura que cada nueva cadena completa siempre tiene puntuaciones mal emparejadas más pequeñas que son mayores o por lo menos iguales a las de la(s) cadena(s) construida(s) anteriormente. Obsérvese también que, como resultado de este proceso, todos los pares en una cadena dada son exclusivos y todas las cadenas completas en el árbol son únicas. El proceso total termina cuando se interrumpe la última serie de reacciones que ha de explorarse. Mantener la(s) cadena(s) completa(s) cuyas puntuaciones mal emparejadas más bajas son las
mayores.
cadena(s) de pares que sobresalen. Este procedimiento genera un árbol con un par que sobresale en cada rama. Se calculan las puntuaciones más bajas no ponderadas y mal emparejadas ponderadas de la combinación específica de pares de cada punto. Se interrumpe una serie de reacciones específica (1) cuando se alcanza el número deseado de posiciones, o (2) cuando la combinación de pares es la que ya se ha encontrado al principio, o (3) cuando las puntuaciones mal emparejadas más bajas de esta combinación son menores que las puntuaciones más bajas de la(s) cadena(s) completa(s) ya construidas. El punto (3) asegura que cada nueva cadena completa siempre tiene puntuaciones mal emparejadas más pequeñas que son mayores o por lo menos iguales a las de la(s) cadena(s) construida(s) anteriormente. Obsérvese también que, como resultado de este proceso, todos los pares en una cadena dada son exclusivos y todas las cadenas completas en el árbol son únicas. El proceso total termina cuando se interrumpe la última serie de reacciones que ha de explorarse. Mantener la(s) cadena(s) completa(s) cuyas puntuaciones mal emparejadas más bajas son las
mayores.
Repetir el apartado 1 empezando en cada uno de
los 2016 pares como par nº 1 para producir una serie de 2016 cadenas
que sobresalen. Encontrar la(s) mejor(es)
cadena(s) aplicando el algoritmo 2.
Para todas las cadenas, calcular las tablas de
puntuaciones mal emparejadas no ponderadas entre todos los pares que
están presentes en la cadena, y encontrar la(s)
cadena(s) para la(s) que la puntuación más baja en la
tabla es la mayor (véase a continuación para detalles). Si existe
solamente una cadena tal, entonces seleccionarla. Si existen varias
cadenas, entonces calcular las puntuaciones mal emparejadas
ponderadas de las comparaciones que sobresalen que dan la puntuación
más baja no ponderada y encontrar la(s) cadena(s) para
la que la puntuación ponderada menor es la mayor. Si existe
solamente una de dichas cadenas, entonces seleccionarla. Si existen
varias cadenas, entonces rehacer el procedimiento completo
utilizando la segunda puntuación más baja no ponderada en la tabla
de que sobresalen, a continuación la tercera más baja, y así
sucesivamente. Si varias cadenas permanecen enlazadas después de que
se han considerado todas las puntuaciones mal emparejadas, entonces
conservarlas todas.
Esto permite la producción de un conjunto de una
o más cadenas que sobresalen.
\newpage
Parte
2
Tomar una cadena y ejecutar el apartado 2.
Apartado
2
Para esta cadena, hallar el/los par(es)
que sobresale(s) que es(son) responsable(s) de
las puntuaciones no ponderadas y ponderadas menores en la tabla de
puntuaciones desemparejadas entre todos los pares en la cadena. A
continuación, crear nuevas cadenas sustituyendo este par con todos
los pares que sobresalen restantes que no están presentes en la
cadena original (si existen varios pares que han de sustituirse,
sustituir un par una vez). A partir del conjunto completo de cadenas
recién generadas y de la cadena original, seleccionar una o más
cadenas siguiendo el algoritmo 2. Entonces, incluyendo la cadena
original en al algoritmo 2 se asegura que las cadenas seleccionadas
siempre tienen una puntuación mal emparejada que es mayor o por lo
menos igual a la puntuación de la cadena original. La mejora (si
existe) puede implicar la puntuación menor o de orden n menor no
ponderada, o la puntuación ponderada correspondiente.
Repetir el algoritmo 3 para cada cadena
seleccionada. Este procedimiento genera un árbol con una cadena en
cada rama. Cada nueva cadena que se añade al árbol tiene una
puntuación mal emparejada mayor o igual a la puntuación de la cadena
hallada en la etapa previa. Se interrumpe una serie de reacciones
específicas cuando la cadena seleccionada es la que se ha encontrado
ya al principio. Esto asegura que todas las cadenas en el árbol son
únicas. El procedimiento completo termina cuando se interrumpe la
última serie de reacciones que debe explorarse. Mantener todas las
cadenas que están presentes en el árbol.
Repetir el apartado 2 (es decir, construir un
árbol) partiendo de cada una de las cadenas seleccionadas al final
de la parte 1.
A partir de la serie completa de cadenas
presentes en todos los árboles, seleccionar una o más cadenas
siguiendo el algoritmo 2.
Esto produce una serie final de una o más
cadenas que sobresalen.
La puntuación no ponderada para una ligadura
entre dos prolongaciones de 6 bases es el número de
incompatibilidades observadas, considerando los tripletes de las
primeras 3 bases y las últimas 3 bases por separado. Por ejemplo, la
puntuación para la ligadura AAAAAC/TTTGCA es de 0 a 3 y la
puntuación para AAAAC/TCAGGG es 2-2. Todas las
puntuaciones posibles se ordenan desde la mayor a la menor según el
orden siguiente:
- mayor:
- 3-3
- \quad
- 3-2/2-3
- \quad
- 2-2
- \quad
- 3-1/1-3
- \quad
- 2-1/1-2
- \quad
- 1-1
- \quad
- 3-0/0-3
- \quad
- 2-0/0-2
- menor:
- 1-0/0-1
La puntuación ponderada (WS) para una ligadura
se calcula de la manera siguiente:
en la que PBS_{i} es la
puntuación para el par de bases concreto en el punto i y se da en la
tabla
siguiente:
para el perfecto emparejamiento
entre una prolongación y su complemento, WS =
6.
Para seleccionar el siguiente par que sobresale,
se calculan las tablas de puntuaciones con compatibilidad entre los
pares seleccionados en las posiciones anteriores y se calculan todos
los pares restantes. Para construir dicha tabla, se comparan todos
los pares anteriormente seleccionados con un nuevo par y también
cada prolongación se compara con ella misma. De este modo, si se han
seleccionado ya n pares, el numero de ligaduras consideradas para
cada tabla es 4n + 2(n+1) = 6n+2. Cuando se comparan dos
prolongaciones que están en la misma cadena de ADN, una de ellas
está invertida.
Se considera el ejemplo siguiente en el que los
pares AAAAAC/TTTTTG (1A/1B) y AAACGT/TTTGCA (2A/2B) se han
seleccionado previamente y el nuevo par AGTCCC/TCAGGG (3A/3B) se
selecciona en la posición siguiente:
La tabla correspondiente es:
En la presente memoria, la puntuación más baja
es 2-2; 2,4 dada por la ligadura entre las
prolongaciones 1A y 3B.
Para calcular la tabla de las puntuaciones mal
emparejadas para una cadena, todos los pares que sobresalen
contenidos en la cadena se comparan entre sí y también cada
prolongación se compara con ella misma. De este modo, para una
cadena de p pares que sobresalen, el numero de ligaduras
consideradas es 4p(p-1) / 2 + 2p =
2(p2). Como anteriormente, una de las dos prolongaciones se
invierte en la comparación cuando ambas son de la misma cadena de
ADN.
Por ejemplo, se considera la siguiente cadena de
3 pares (es decir, la posición 4): AAAAAC/TTTTTG (1A/1B),
AAACGT/TTTGCA (2A/2B), AGTCCC/TCAGGG (3A/3B) en la que 1A está en un
fragmento, 1B y 2A están en un segundo fragmento, 2B y 3A están en
un tercer fragmento y 3B está en un cuarto fragmento.
La tabla correspondiente es:
En la presente memoria, la puntuación más baja
es 0-3; 3,8 proporcionada por la ligadura entre las
prolongaciones 1A y 2B.
Parte 1
Parte 2
Debe apreciarse que la puntuación mal emparejada
no ponderada (en la que 9 = 3-3, 8 =
3-2, 7 = 2-2, 6 =
3-1, 5 = 2-1, 4 =
1-1, 3 = 3-0, 2 =
2-0, 1 = 1-0) reduce a medida que
aumenta el número de posiciones.
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
Este experimento demuestra la construcción de
una cadena específica de 5 fragmentos utilizando un conjunto de
cuatro pares que sobresalen de 6 bases 5' no palindrómicas. El
conjunto de cuatro únicos pares que sobresalen se halló utilizando
un programa informático tal como se describe en el Ejemplo 5.
\newpage
Basándose en los pares que sobresalen, se
construyó una serie de cinco componentes del banco hibridando
oligonucleótidos complementarios en tubos separados:
\vskip1.000000\baselineskip
Los componentes del banco (de 4 pmoles cada uno)
se mezclaron a continuación y se ligaron utilizando 100 U de T4 ADN
ligasa (NEB) en 1x tampón de ligasa a 25ºC durante 15 minutos. La
ligasa se inactivó a continuación a 65ºC durante 20 min.
Se utilizaron 5 \mul de la reacción de
ligadura (50 \mul) como plantilla en una reacción de PCR (50
\mul) que contenía 1x tampón Thermopol (NEB), dNTP 0,05 mM,
cebador T7 0,4 \muM, cebador SP6 0,4 \muM y 0,04 U/\mul de
Vent polimerasa (NEB). La PCR se inició en caliente (95ºC durante 3
minutos antes de la adición de polimerasa) y se cicló 30 veces; 95ºC
30 s; 55ºC 30 s; 76ºC, 30 s, utilizando un termociclador
PTC-200 (MJ Research). Se analizaron 10 \mul de la
PCR en un gel de agarosa al 1,5% como se representa en la Figura 4.
La fotografía del gel mostraba solamente una banda intensa
correspondiente a aproximadamente 240 bp como cabía esperar (243
bp). El producto de PCR restante se extrajo dos veces con cloroformo
y se precipitó utilizando etanol al 71% y NaAc 0,1 M. Se disolvió el
ADN en agua y se secuenció. La secuencia confirmó que se generaba la
cadena señal esperada
(1-0-1-0-0).
\vskip1.000000\baselineskip
Este experimento demuestra la utilización de
pares de cebadores complementarios para unirse a cadenas de
fragmentos como alternativa a la estrategia de ligadura demostrada
en el ejemplo anterior.
En este experimento 5 fragmentos de cadenas con
5 posiciones (fragmentos o bits) se ligan cada una por separado en
el ciclo de ligadura 1 como se demostró al principio (Ejemplo 6).
Estas cadenas de 5 fragmentos se amplían a continuación con 5 pares
de cebador diferentes (se utiliza el par 1 para ampliar la cadena 1,
el par 2 se utiliza para ampliar la cadena 2, etc.). El segundo
cebador en el par cebador 1 es complementario con el primer cebador
en el par 2 cebador, el segundo cebador en el par 2 cebador es
complementario con el primer cebador en el par 3 cebador, y así
sucesivamente.
Se extrae a continuación una pequeña alícuota de
cada una de las 5 reacciones de PCR y se lleva a cabo nuevas
reacciones de PCR con los cebadores que son específicos al final de
la cadena 1 y 5 señal. El procedimiento se ilustra en la Figura
5.
Se seleccionan oligonucleótidos que se unen a la
cadena del fragmento y actúan también como cebadores. Por lo tanto,
por ejemplo, para las cadenas adyacentes puede estar unido
utilizando por ejemplo los pares de cebador siguientes:
Las zonas del cebador ampliado anteriores son
complementarias y pueden unirse de este modo.
Como alternativa a este procedimiento, pueden
utilizarse dos ciclos de ligadura en los que las cadenas de 5
fragmentos (generadas por ligadura) se ligan. Por lo tanto, varios
ciclos de construcción para construir cadenas largas con señal.
Después de la ligadura inicial en el primer ciclo de ligadura las
cadenas de 5 fragmentos se amplían a continuación con cebadores que
contienen una secuencia FokI. Se seleccionan cebadores de
manera apropiada de modo que la digestión con FokI construya
entonces prolongaciones no palindrómicas al final de cada cadena de
fragmentos en la que la prolongación generada en la cadena de 1
fragmento puede ligarse con la primera prolongación generada en la
cadena de 2 fragmentos, el segundo saliente generado en la cadena de
2 fragmentos puede ligarse con el primer saliente generado en la
cadena de 3 fragmentos, y así sucesivamente. La cadena de 5
fragmentos puede por consiguiente ligarse de manera controlada para
generar una cadena final con 25 fragmentos (bits).
Si se quieren construir cadenas de fragmentos
con 100 ó 500 fragmentos se puede repetir este procedimiento 1 ó 2
veces más. La capacidad de polimerasa, sin embargo, será un factor
limitativo con respecto a cuántos ciclos de ligadura es posible
realizar. Resultarán por lo tanto necesario utilizar otras
estrategias para construir cadenas aun más largas.
Claims (7)
1. Procedimiento para la síntesis de una
molécula de ácido nucleico bicatenario que contiene información en
forma de código alfanumérico para almacenar información en forma de
un código alfanumérico que comprende por lo menos las etapas
siguientes:
- i)
- generar n fragmentos de ácido nucleico bicatenario, en el que por lo menos n-2 fragmentos presentan zonas monocatenarias en ambos terminales y 2 fragmentos presentan zonas monocatenarias en por lo menos un terminal, en el que (n-1) zonas monocatenarias son complementarias con otras (n-1) zonas monocatenarias, produciendo de este modo (n-1) pares complementarios;
- ii)
- poner en contacto dichos n fragmentos de ácido nucleico bicatenario, simultánea o consecutivamente, para efectuar la unión de dichos pares complementarios de las zonas monocatenarias; y
- iii)
- ligar opcionalmente dichos pares complementarios simultánea o consecutivamente para producir una molécula de ácido nucleico constituida por n fragmentos;
en el que dichos fragmentos comprenden zonas que
representan una unidad de información correspondiente a uno o más
elementos del código.
2. Procedimiento según la reivindicación 1, en
el que cada zona que representa una unidad del código alfanumérico
está constituida por entre 4 y 10 bases.
3. Procedimiento según la reivindicación 1 ó 2,
en el que cada fragmento está constituido por entre 8 y 25
bases.
4. Procedimiento según cualquiera de las
reivindicaciones anteriores, en el que el código alfanumérico es
binario.
5. Procedimiento según cualquiera de las
reivindicaciones anteriores, en el que por lo menos 10 fragmentos de
ácido nucleico bicatenario se hibridan conjuntamente en la etapa
(i), para producir una molécula de ácido nucleico bicatenario que
comprende por lo menos 10 fragmentos.
6. Procedimiento según cualquiera de las
reivindicaciones anteriores, en el que una pluralidad de moléculas
de moléculas de ácido nucleico bicatenario que comprenden una serie
de fragmentos de ácido nucleico bicatenario se sintetizan y se unen
de manera conjunta.
7. Procedimiento para identificar los elementos
de código contenidos en una molécula de ácido nucleico preparada
según un procedimiento según cualquiera de las reivindicaciones 1 a
6, en el que una sonda, portadora de unos medios de señalización,
específica para uno o más elementos de código, está unida a dicha
molécula de ácido nucleico y es detectada una señal generada por
dichos medios de señalización, pudiendo identificarse uno o más
elementos de código.
Applications Claiming Priority (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| NO991325A NO991325D0 (no) | 1999-03-18 | 1999-03-18 | FremgangsmÕter for DNA-syntese og avlesning |
| NO20003191A NO20003191D0 (no) | 1999-03-18 | 2000-06-20 | Metoder for Õ konstruere nukleinsyrer |
| NO20003190A NO20003190D0 (no) | 1999-03-18 | 2000-06-20 | Metode for rekombinering av nukleinsyrer |
| NO20003191 | 2000-06-20 | ||
| NO20003190 | 2000-06-20 | ||
| PCT/GB2000/002512 WO2001000816A1 (en) | 1999-03-18 | 2000-06-27 | Methods of cloning and producing fragment chains with readable information content |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2324513T3 true ES2324513T3 (es) | 2009-08-10 |
Family
ID=29273457
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES00940666T Expired - Lifetime ES2324513T3 (es) | 1999-03-18 | 2000-06-27 | Procedimientos de clonacion y produccion de cadenas de fragmentos con contenido de informacion legible. |
Country Status (9)
| Country | Link |
|---|---|
| US (2) | US7371851B1 (es) |
| EP (2) | EP1196554B1 (es) |
| JP (1) | JP2004512807A (es) |
| AT (1) | ATE423845T1 (es) |
| AU (1) | AU5557400A (es) |
| DE (1) | DE60041642D1 (es) |
| ES (1) | ES2324513T3 (es) |
| NO (1) | NO20016428D0 (es) |
| WO (1) | WO2001000816A1 (es) |
Families Citing this family (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6670127B2 (en) | 1997-09-16 | 2003-12-30 | Egea Biosciences, Inc. | Method for assembly of a polynucleotide encoding a target polypeptide |
| GB0103364D0 (en) * | 2001-02-10 | 2001-03-28 | Nat Inst Of Agricultural Botan | Storage of encoded information within biological macromolecules |
| DE10144132A1 (de) * | 2001-09-07 | 2003-03-27 | Axaron Bioscience Ag | Identifikation und Quantifizierung von Nukleinsäuren durch Erzeugen und Analyse von Sequenz-tags einheitlicher Länge |
| AU2003260790A1 (en) * | 2002-09-05 | 2004-03-29 | Plant Bioscience Limited | Genome partitioning |
| EP1398375A1 (en) * | 2002-09-13 | 2004-03-17 | Cosmix Molecular Biologicals GmbH | Recombination process for recombining fragments of variant polynucleotides |
| WO2005003375A2 (en) * | 2003-01-29 | 2005-01-13 | 454 Corporation | Methods of amplifying and sequencing nucleic acids |
| GB0308852D0 (en) * | 2003-04-16 | 2003-05-21 | Lingvitae As | Method |
| JP2007524410A (ja) * | 2004-01-23 | 2007-08-30 | リングヴィテ エーエス | ポリヌクレオチドライゲーション反応の改良 |
| JP5331476B2 (ja) | 2005-06-15 | 2013-10-30 | カリダ・ジェノミックス・インコーポレイテッド | 遺伝子解析および化学解析用の単分子アレイ |
| US20090075343A1 (en) * | 2006-11-09 | 2009-03-19 | Complete Genomics, Inc. | Selection of dna adaptor orientation by nicking |
| ES2959127T3 (es) | 2007-06-19 | 2024-02-20 | Hoffmann La Roche | Secuenciación de ácidos nucleicos de alto rendimiento por expansión |
| WO2009132028A1 (en) * | 2008-04-21 | 2009-10-29 | Complete Genomics, Inc. | Array structures for nucleic acid detection |
| WO2010059763A1 (en) * | 2008-11-19 | 2010-05-27 | Amyris Biotechnologies, Inc. | Compositions and methods for the assembly of polynucleotides |
| EP3346404B1 (en) * | 2012-06-01 | 2025-04-02 | European Molecular Biology Laboratory | High-capacity storage of digital information in dna |
| US9790546B2 (en) * | 2012-08-31 | 2017-10-17 | Roche Molecular Systems, Inc. | Microfluidic chip, device and system for the generation of aqueous droplets in emulsion oil for nucleic acid amplification |
| US9328382B2 (en) | 2013-03-15 | 2016-05-03 | Complete Genomics, Inc. | Multiple tagging of individual long DNA fragments |
| US9771575B2 (en) | 2015-06-19 | 2017-09-26 | Agilent Technologies, Inc. | Methods for on-array fragmentation and barcoding of DNA samples |
| CN109074424B (zh) * | 2016-05-04 | 2022-03-11 | 深圳华大生命科学研究院 | 利用dna存储文本信息的方法、其解码方法及应用 |
| CN120624607A (zh) | 2018-05-08 | 2025-09-12 | 深圳华大智造科技股份有限公司 | 用于准确且经济高效的测序、单体型分型和组装的基于单管珠粒的dna共条形码化 |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| IL82064A0 (en) * | 1986-04-04 | 1987-10-20 | Innogenetics Sa Nv | Vectors comprising appropriate means for an enzymatical synthesis of nucleotide sequences,particularly dna fragments |
| GB9214873D0 (en) | 1992-07-13 | 1992-08-26 | Medical Res Council | Process for categorising nucleotide sequence populations |
| US6335160B1 (en) * | 1995-02-17 | 2002-01-01 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
| US5856103A (en) * | 1994-10-07 | 1999-01-05 | Board Of Regents The University Of Texas | Method for selectively ranking sequences for antisense targeting |
| US6030657A (en) * | 1994-11-01 | 2000-02-29 | Dna Technologies, Inc. | Labeling technique for countering product diversion and product counterfeiting |
| US5976846A (en) * | 1996-01-13 | 1999-11-02 | Passmore; Steven E. | Method for multifragment in vivo cloning and mutation mapping |
| DE19633427C2 (de) * | 1996-08-20 | 2001-10-04 | Hubert S Bernauer | Verfahren zur Synthese von Nukleinsäuremolekülen mit zumindest teilweise vorbestimmter Nukleotidsequenz |
| GB9618544D0 (en) * | 1996-09-05 | 1996-10-16 | Brax Genomics Ltd | Characterising DNA |
| AU4753397A (en) * | 1996-10-03 | 1998-04-24 | Incyte Pharmaceuticals, Inc. | Methods for generating and analyzing transcript markers |
| WO1998038326A1 (en) * | 1997-02-28 | 1998-09-03 | Nature Technology Corporation | Self-assembling genes, vectors and uses thereof |
| WO2000039333A1 (en) * | 1998-12-23 | 2000-07-06 | Jones Elizabeth Louise | Sequencing method using magnifying tags |
| AU4703300A (en) * | 1999-05-06 | 2000-11-21 | Mount Sinai School Of Medicine Of The City University Of New York, The | Dna-based steganography |
-
2000
- 2000-06-27 AT AT00940666T patent/ATE423845T1/de not_active IP Right Cessation
- 2000-06-27 EP EP00940666A patent/EP1196554B1/en not_active Expired - Lifetime
- 2000-06-27 ES ES00940666T patent/ES2324513T3/es not_active Expired - Lifetime
- 2000-06-27 US US10/019,258 patent/US7371851B1/en not_active Expired - Fee Related
- 2000-06-27 JP JP2001506810A patent/JP2004512807A/ja active Pending
- 2000-06-27 DE DE60041642T patent/DE60041642D1/de not_active Expired - Fee Related
- 2000-06-27 EP EP08153722A patent/EP1983052A3/en not_active Withdrawn
- 2000-06-27 AU AU55574/00A patent/AU5557400A/en not_active Abandoned
- 2000-06-27 WO PCT/GB2000/002512 patent/WO2001000816A1/en not_active Ceased
-
2001
- 2001-12-28 NO NO20016428A patent/NO20016428D0/no unknown
-
2007
- 2007-08-09 US US11/836,515 patent/US20080057546A1/en not_active Abandoned
Also Published As
| Publication number | Publication date |
|---|---|
| EP1983052A3 (en) | 2009-01-07 |
| AU5557400A (en) | 2001-01-31 |
| ATE423845T1 (de) | 2009-03-15 |
| JP2004512807A (ja) | 2004-04-30 |
| US7371851B1 (en) | 2008-05-13 |
| DE60041642D1 (de) | 2009-04-09 |
| NO20016428D0 (no) | 2001-12-28 |
| US20080057546A1 (en) | 2008-03-06 |
| EP1196554B1 (en) | 2009-02-25 |
| EP1196554A1 (en) | 2002-04-17 |
| EP1983052A2 (en) | 2008-10-22 |
| WO2001000816A1 (en) | 2001-01-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2324513T3 (es) | Procedimientos de clonacion y produccion de cadenas de fragmentos con contenido de informacion legible. | |
| US11961008B2 (en) | Sequence-controlled polymer random access memory storage | |
| US11821034B2 (en) | Nucleic acid sample preparation methods | |
| ES2866896T3 (es) | Procedimiento para incrementar el rendimiento de secuenciación de molécula única concatenando fragmentos de ADN cortos | |
| CN108350499B (zh) | 可转化标记组合物、方法及结合其的过程 | |
| ES2724824T3 (es) | Métodos para la secuenciación de ácidos nucleicos | |
| ES2842527T3 (es) | Métodos para crear y analizar bibliotecas codificadas por ADN | |
| ES2450047T5 (es) | Método de preparación de bibliotecas de polinucleótidos molde | |
| AU2022202347A1 (en) | Libraries of Nucleic Acids and Methods for Making the Same | |
| ES2565809T3 (es) | Métodos mejorados de secuenciación de ácidos nucleicos | |
| US11725205B2 (en) | Methods and polynucleotides for amplifying a target polynucleotide | |
| CN107750361A (zh) | 关系dna操作 | |
| CN107532205B (zh) | 模板的表面连环化 | |
| CN109196115A (zh) | 跟踪核酸靶标来源以用于核酸测序的方法和试剂盒 | |
| JP2000512148A (ja) | パドロックプローブ検出 | |
| CN101484589B (zh) | 使用aflp的高通量物理作图 | |
| ES2889875T3 (es) | Secuenciación a partir de cebadores múltiples para incrementar la velocidad y la densidad de los datos | |
| CN109415761A (zh) | 用于原位分子检测的杂交链反应方法 | |
| CN108431223A (zh) | 每液滴分辨率下的多个珠 | |
| DK1314783T3 (da) | Nukleinsyrelinkere og deres anvendelse i gensyntese | |
| WO2014047556A1 (en) | Compositions and methods for long insert, paired end libraries of nucleic acids in emulsion droplets | |
| WO2025167161A1 (zh) | 一种基于5'连接的单链dna特异的高通量测序方法 | |
| CN106435744A (zh) | 使用y‑接头和消失限制位点的文库构建 | |
| JP2023504836A (ja) | サンプル処理バーコード付きビーズ組成物、方法、製造方法およびシステム | |
| KR20240113772A (ko) | 블록체인 및 대체 불가능 토큰을 위한 핵산 저장 |