JP2004507247A - Dna末端改変を使用する指向された分子進化のための方法および組成物 - Google Patents
Dna末端改変を使用する指向された分子進化のための方法および組成物 Download PDFInfo
- Publication number
- JP2004507247A JP2004507247A JP2002522312A JP2002522312A JP2004507247A JP 2004507247 A JP2004507247 A JP 2004507247A JP 2002522312 A JP2002522312 A JP 2002522312A JP 2002522312 A JP2002522312 A JP 2002522312A JP 2004507247 A JP2004507247 A JP 2004507247A
- Authority
- JP
- Japan
- Prior art keywords
- polynucleotides
- polynucleotide
- deletion
- library
- random
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 171
- 239000000203 mixture Substances 0.000 title claims description 70
- 230000004048 modification Effects 0.000 title description 2
- 238000012986 modification Methods 0.000 title description 2
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 324
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 324
- 239000002157 polynucleotide Substances 0.000 claims abstract description 324
- 238000012217 deletion Methods 0.000 claims abstract description 192
- 230000037430 deletion Effects 0.000 claims abstract description 192
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 107
- 239000002773 nucleotide Substances 0.000 claims abstract description 105
- 230000002068 genetic effect Effects 0.000 claims abstract description 73
- 230000008569 process Effects 0.000 claims abstract description 45
- 150000007523 nucleic acids Chemical class 0.000 claims description 57
- 101710163270 Nuclease Proteins 0.000 claims description 47
- 238000003776 cleavage reaction Methods 0.000 claims description 36
- 230000007017 scission Effects 0.000 claims description 35
- 102000039446 nucleic acids Human genes 0.000 claims description 24
- 108020004707 nucleic acids Proteins 0.000 claims description 24
- 238000007792 addition Methods 0.000 claims description 23
- 108060002716 Exonuclease Proteins 0.000 claims description 19
- 102000013165 exonuclease Human genes 0.000 claims description 19
- 150000003839 salts Chemical class 0.000 claims description 18
- 108010052305 exodeoxyribonuclease III Proteins 0.000 claims description 17
- 108010042407 Endonucleases Proteins 0.000 claims description 11
- 102000004533 Endonucleases Human genes 0.000 claims description 7
- 230000005257 nucleotidylation Effects 0.000 claims description 3
- 108090000623 proteins and genes Proteins 0.000 abstract description 145
- 238000005070 sampling Methods 0.000 abstract description 8
- 108020004414 DNA Proteins 0.000 description 146
- 238000003780 insertion Methods 0.000 description 64
- 230000037431 insertion Effects 0.000 description 64
- 102000004169 proteins and genes Human genes 0.000 description 64
- 230000006870 function Effects 0.000 description 49
- 239000013612 plasmid Substances 0.000 description 45
- 102000004190 Enzymes Human genes 0.000 description 42
- 108090000790 Enzymes Proteins 0.000 description 42
- 239000012634 fragment Substances 0.000 description 37
- 238000006243 chemical reaction Methods 0.000 description 31
- 210000004027 cell Anatomy 0.000 description 30
- 230000035772 mutation Effects 0.000 description 30
- 235000002639 sodium chloride Nutrition 0.000 description 29
- 102000053602 DNA Human genes 0.000 description 26
- 230000027455 binding Effects 0.000 description 26
- 238000003752 polymerase chain reaction Methods 0.000 description 26
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 24
- 150000001413 amino acids Chemical class 0.000 description 23
- 108090000765 processed proteins & peptides Proteins 0.000 description 23
- 229920001184 polypeptide Polymers 0.000 description 20
- 102000004196 processed proteins & peptides Human genes 0.000 description 20
- 241000588724 Escherichia coli Species 0.000 description 18
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 17
- 241000894007 species Species 0.000 description 16
- 230000000694 effects Effects 0.000 description 15
- 230000007246 mechanism Effects 0.000 description 15
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 14
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 14
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 14
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 14
- 239000013598 vector Substances 0.000 description 14
- 102000012410 DNA Ligases Human genes 0.000 description 13
- 108010061982 DNA Ligases Proteins 0.000 description 13
- 102000003960 Ligases Human genes 0.000 description 13
- 108090000364 Ligases Proteins 0.000 description 13
- 238000000338 in vitro Methods 0.000 description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 description 12
- 230000001965 increasing effect Effects 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 12
- 239000011780 sodium chloride Substances 0.000 description 12
- 238000013518 transcription Methods 0.000 description 12
- 230000035897 transcription Effects 0.000 description 12
- 108091005804 Peptidases Proteins 0.000 description 11
- 239000004365 Protease Substances 0.000 description 11
- 150000001768 cations Chemical class 0.000 description 11
- 239000002299 complementary DNA Substances 0.000 description 11
- 230000002939 deleterious effect Effects 0.000 description 11
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 10
- 230000001976 improved effect Effects 0.000 description 10
- 235000017281 sodium acetate Nutrition 0.000 description 10
- 239000001632 sodium acetate Substances 0.000 description 10
- 239000007858 starting material Substances 0.000 description 10
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 9
- 230000008859 change Effects 0.000 description 9
- 230000006798 recombination Effects 0.000 description 9
- 238000005215 recombination Methods 0.000 description 9
- OPIFSICVWOWJMJ-AEOCFKNESA-N 5-bromo-4-chloro-3-indolyl beta-D-galactoside Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1OC1=CNC2=CC=C(Br)C(Cl)=C12 OPIFSICVWOWJMJ-AEOCFKNESA-N 0.000 description 8
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 8
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 8
- 101710183280 Topoisomerase Proteins 0.000 description 8
- 239000000872 buffer Substances 0.000 description 8
- 239000000284 extract Substances 0.000 description 8
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 8
- 108010061833 Integrases Proteins 0.000 description 7
- 241000700605 Viruses Species 0.000 description 7
- 238000012216 screening Methods 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 230000003321 amplification Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 6
- 150000002500 ions Chemical class 0.000 description 6
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 6
- 238000005304 joining Methods 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- 108010017826 DNA Polymerase I Proteins 0.000 description 5
- 102000004594 DNA Polymerase I Human genes 0.000 description 5
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 5
- 241000701533 Escherichia virus T4 Species 0.000 description 5
- 102000012330 Integrases Human genes 0.000 description 5
- 108020004682 Single-Stranded DNA Proteins 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 102000005936 beta-Galactosidase Human genes 0.000 description 5
- 108010005774 beta-Galactosidase Proteins 0.000 description 5
- 230000003197 catalytic effect Effects 0.000 description 5
- 238000004925 denaturation Methods 0.000 description 5
- 230000036425 denaturation Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 108020001507 fusion proteins Proteins 0.000 description 5
- 102000037865 fusion proteins Human genes 0.000 description 5
- 230000002163 immunogen Effects 0.000 description 5
- 238000002703 mutagenesis Methods 0.000 description 5
- 231100000350 mutagenesis Toxicity 0.000 description 5
- -1 phosphate ester Chemical class 0.000 description 5
- 230000004962 physiological condition Effects 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 230000004568 DNA-binding Effects 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 102100031780 Endonuclease Human genes 0.000 description 4
- 108010054278 Lac Repressors Proteins 0.000 description 4
- 108010030975 Polyketide Synthases Proteins 0.000 description 4
- 108020004511 Recombinant DNA Proteins 0.000 description 4
- 108010006785 Taq Polymerase Proteins 0.000 description 4
- 108091023040 Transcription factor Proteins 0.000 description 4
- 102000040945 Transcription factor Human genes 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 239000000427 antigen Substances 0.000 description 4
- 108091007433 antigens Proteins 0.000 description 4
- 102000036639 antigens Human genes 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 230000008030 elimination Effects 0.000 description 4
- 238000003379 elimination reaction Methods 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 230000002401 inhibitory effect Effects 0.000 description 4
- 230000004481 post-translational protein modification Effects 0.000 description 4
- 239000001103 potassium chloride Substances 0.000 description 4
- 235000011164 potassium chloride Nutrition 0.000 description 4
- 230000004853 protein function Effects 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 229940113082 thymine Drugs 0.000 description 4
- 239000003053 toxin Substances 0.000 description 4
- 231100000765 toxin Toxicity 0.000 description 4
- 108700012359 toxins Proteins 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 3
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 3
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 3
- 108010021466 Mutant Proteins Proteins 0.000 description 3
- 102000008300 Mutant Proteins Human genes 0.000 description 3
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 3
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 239000011543 agarose gel Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 230000008827 biological function Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 230000005782 double-strand break Effects 0.000 description 3
- 108010092809 exonuclease Bal 31 Proteins 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 210000000987 immune system Anatomy 0.000 description 3
- 239000000411 inducer Substances 0.000 description 3
- 230000008463 key metabolic pathway Effects 0.000 description 3
- 239000008101 lactose Substances 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 210000004698 lymphocyte Anatomy 0.000 description 3
- MBABOKRGFJTBAE-UHFFFAOYSA-N methyl methanesulfonate Chemical compound COS(C)(=O)=O MBABOKRGFJTBAE-UHFFFAOYSA-N 0.000 description 3
- 238000001823 molecular biology technique Methods 0.000 description 3
- 230000001293 nucleolytic effect Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000002708 random mutagenesis Methods 0.000 description 3
- 150000003384 small molecules Chemical class 0.000 description 3
- 238000000527 sonication Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 230000014621 translational initiation Effects 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 108010006654 Bleomycin Proteins 0.000 description 2
- 108090000565 Capsid Proteins Proteins 0.000 description 2
- 101710132601 Capsid protein Proteins 0.000 description 2
- 102100023321 Ceruloplasmin Human genes 0.000 description 2
- 101710094648 Coat protein Proteins 0.000 description 2
- 101150097493 D gene Proteins 0.000 description 2
- 102000011724 DNA Repair Enzymes Human genes 0.000 description 2
- 108010076525 DNA Repair Enzymes Proteins 0.000 description 2
- 101710096438 DNA-binding protein Proteins 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 206010059866 Drug resistance Diseases 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 101710114810 Glycoprotein Proteins 0.000 description 2
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 101150008942 J gene Proteins 0.000 description 2
- 239000006142 Luria-Bertani Agar Substances 0.000 description 2
- 101710125418 Major capsid protein Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 101710141454 Nucleoprotein Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 208000002606 Paramyxoviridae Infections Diseases 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 2
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 2
- 101710083689 Probable capsid protein Proteins 0.000 description 2
- 241000702263 Reovirus sp. Species 0.000 description 2
- 102000009661 Repressor Proteins Human genes 0.000 description 2
- 101710167605 Spike glycoprotein Proteins 0.000 description 2
- 101150117115 V gene Proteins 0.000 description 2
- 230000002730 additional effect Effects 0.000 description 2
- 125000003275 alpha amino acid group Chemical group 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 229960001561 bleomycin Drugs 0.000 description 2
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 244000309466 calf Species 0.000 description 2
- 238000012219 cassette mutagenesis Methods 0.000 description 2
- 238000006555 catalytic reaction Methods 0.000 description 2
- 239000013043 chemical agent Substances 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000004440 column chromatography Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 230000004077 genetic alteration Effects 0.000 description 2
- 231100000118 genetic alteration Toxicity 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 230000000968 intestinal effect Effects 0.000 description 2
- 150000002597 lactoses Chemical class 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 208000024191 minimally invasive lung adenocarcinoma Diseases 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 239000002736 nonionic surfactant Substances 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N pentofuranose Chemical group OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000007423 screening assay Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 241001529453 unidentified herpesvirus Species 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 1
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 1
- 102100029075 Exonuclease 1 Human genes 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101001061851 Homo sapiens V(D)J recombination-activating protein 2 Proteins 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 description 1
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 108010059724 Micrococcal Nuclease Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 1
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 1
- 102000001183 RAG-1 Human genes 0.000 description 1
- 108060006897 RAG1 Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- 108700042075 T-Cell Receptor Genes Proteins 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 102100029591 V(D)J recombination-activating protein 2 Human genes 0.000 description 1
- ZVNYJIZDIRKMBF-UHFFFAOYSA-N Vesnarinone Chemical compound C1=C(OC)C(OC)=CC=C1C(=O)N1CCN(C=2C=C3CCC(=O)NC3=CC=2)CC1 ZVNYJIZDIRKMBF-UHFFFAOYSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 230000008860 allosteric change Effects 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 229960004261 cefotaxime Drugs 0.000 description 1
- AZZMGZXNTDTSME-JUZDKLSSSA-M cefotaxime sodium Chemical compound [Na+].N([C@@H]1C(N2C(=C(COC(C)=O)CS[C@@H]21)C([O-])=O)=O)C(=O)\C(=N/OC)C1=CSC(N)=N1 AZZMGZXNTDTSME-JUZDKLSSSA-M 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 238000012412 chemical coupling Methods 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- UFJPAQSLHAGEBL-RRKCRQDMSA-N dITP Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(N=CNC2=O)=C2N=C1 UFJPAQSLHAGEBL-RRKCRQDMSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000010429 evolutionary process Effects 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000002825 functional assay Methods 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 150000004712 monophosphates Chemical class 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 230000036438 mutation frequency Effects 0.000 description 1
- 239000006225 natural substrate Substances 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000003094 perturbing effect Effects 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 235000011056 potassium acetate Nutrition 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000002818 protein evolution Methods 0.000 description 1
- 239000002213 purine nucleotide Substances 0.000 description 1
- 239000002719 pyrimidine nucleotide Substances 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
- C12N15/1027—Mutagenizing nucleic acids by DNA shuffling, e.g. RSR, STEP, RPR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Abstract
図3に示されるように、指向された進化のための方法が記載され、ここで、遺伝的要素は、ランダムに切断され、ポリヌクレオチドの欠失もしくは付加または両方が、付加または欠失を有する関連した遺伝的要素のライブラリーを生成することを可能にする。対応するライブラリー集団もまた記載される。これらのプロセスは、遺伝子の指向された進化に必要である配列空間の重要なサンプリングを可能にする。目的の遺伝的要素において非常に小さいヌクレオチド欠失を行うための方法が、さらに記載される。
Description
【0001】
(発明の分野)
本発明は、指向された進化に関し、遺伝子操作およびタンパク質操作に適用することができる方法を包含する。指向された進化を用いて、遺伝子またはタンパク質の機能を改善または変化させることを目標に、遺伝子配列を進化させる。指向された進化は、医薬品開発、バイオレメディエーション(bioremediation)、バイオリーチング(bioleaching)、および化学産業を含むが、これらに限定されない多くの分野に適用することができる。
【0002】
(発明の背景)
近年、インビトロでの進化プロセスをシミュレートし、それにより特定遺伝子中で遺伝子変化を誘導して、それらの機能を変化または改善させる試みがなされてきた。遺伝子を変化させる技術がここ数年の間に知られてきたが、一般に、これらの方法を成功させるために、コードタンパク質構造および機能に関する詳細な特徴が必要とされた。DNAシャッフリング技術は、この障壁をある程度まで克服し、ここ数年でいくつかの遺伝子を首尾よく進化させるために適用されてきた[Minshull&Stemmer、米国特許第5,837,458号(1998年)]。
【0003】
天然の進化は、環境中の遺伝子に関して、何百万年もかけて起こった。インビトロ進化は、数日または数週間で天然プロセスを模倣することを試みるものである。インビトロ戦略が成功するためには、進化理論のいくつかの様相を理解しなくてはならない。第1に、配列空間の概念が、既定長のタンパク質の考え得る配列の総数を規定する[Kauffman,(1993)]。したがって、
【0004】
【数1】
であり、式中、配列空間Sは、考え得る配列数であり、Nは、タンパク質長である。インビトロ進化実験では、最も改善または変化した活性を有するタンパク質の分画を特定するために、目的のタンパク質のS配列を探索することが最も望ましい。中程度の50個のアミノ酸を有するタンパク質は、2050個の考え得る異なる配列のSを有することがすぐに理解でき、その数は、現在の分子生物学技術による分析に関して事実上無限である。第2に、ほとんどのアミノ酸変化が、タンパク質にとって有害であることが明らかである。これらの変化は、タンパク質を不活性にし得るか、適切なフォールディングの崩壊を引き起こし得るか、またはインビボでのタンパク質もしくはmRNAに対する不安定性を引き起こし得る。有害な変異に対する有利な変異の平均比率は、105分の1であると推定されている[Radmanら、Ann,N.Y.Acad.Sci.870:146−55(1999)]。これに関して、変異率は、それらの機能を改善するために遺伝子を変異させる場合に重要なパラメータである。変異率が高すぎると、有害な変異が、有利な変異とともにcisで生じ、その状態により、有利な変異を含有する得られたタンパク質が、付随する有害な変異に起因して不活性であるため、有利な変異を有する遺伝子を特定することが不可能となる。第3に、より高い変異率の結末を克服するために、相同組換えを利用して、二重クロスオーバー事象により有害な変異を除去し得る。第4に、任意のインビトロ進化技術は、タンパク質の機能を改善または変化させる配列を特定するために、選択スクリーニングを必要とする。
【0005】
現在の分子進化の主な障壁は、目的のタンパク質に関する配列空間を効率的に探索することができないことである。これに関して、1つより多い残基が異なる配列を生成および特定する能力が非常に重要であり、ここで、これらの配列は、タンパク質機能に対してさらな効果を有し得る。このさらなる効果は、アミノ酸相互依存にて記載し得る。例えば、残基iに単一の変異を有するタンパク質は、jでの付随する変異もまた存在しない限り、検出可能な機能のいかなる増大をも有さない場合がある。これに関して、進化が成功するためには、標的配列の考え得る2変異改変体すべてが、サンプリングされ、機能改善に関して試験されるべきである。一般に、長さNのタンパク質のR変異体数は、以下:
【0006】
【数2】
によって表され、ここで、Rは、変異改変体の数であり、20は、各位置での考え得るアミノ酸数を表す。したがって、長さ50のタンパク質に関しては、490,000個の異なる2変異改変体が存在する。
【0007】
配列空間のこれらの統計学的解析において、臨界値は、タンパク質長である(すなわち、R変異改変体数は、タンパク質長に依存する)。しかし、本質的には、任意の目的のタンパク質長は、三次元空間のアミノ酸残基の整列ほど、その機能にとって重要ではない場合がある。実際に、「触媒作業空間(catalytic task space)の仮説的概念は、この原理を説明すると提唱されている(Kauffman,1993)。タンパク質長Nを変化させることなくアミノ酸残基を変化させることは、Nを増加または減少させるいくつかの方法において、タンパク質の三次元構造に影響を及ぼし得ない。あるいは、Nの変化は、タンパク質の生物学的機能を全く変化させ得ない。相同タンパク質の事実上任意のファミリーの分析により、メンバーは、時には実質的な挿入または欠失を伴って異なる長さを有するが、区別不可能な生物学的機能を保持し得ることが明らかである。したがって、上記式は、おそらく、生物学的機能の改善または変化に関して探索する場合、スクリーニングされるべき様々なR変異改変体の正確な見解を提供しない。研究室では、タンパク質のR変異体の近隣と、ヌクレオチドがあらゆる位置で付加または欠失される多くの変異体数の全てを探索することが最適である。
【0008】
欠失の場合には、D変異体欠失数は、以下:
【0009】
【数3】
で表され、式中、Nは、タンパク質の初期長であり、Dは、欠失が起きる位置の数である。アミノ酸付加の場合には、考え得るすべての付加に関する同様の式が、20個のアミノ酸のいずれかが任意の位置で付加され得るという事実を説明し:
【0010】
【数4】
であり、式中、Aは、考え得る付加変異体数である。付加および欠失変異体の場合では、これらの式はともに、唯一のアミノ酸が各位置で付加または欠失されると仮定している。しかし、インビトロ分子進化に関しては、各位置で付加または欠失した1個、2個、3個、・・・C個全ての数のアミノ酸を探索することが最適である。したがって、欠失変異体に関して、各位置で欠失された可変アミノ酸を有する配列数は、以下:
【0011】
【数5】
であり、式中CDは、各位置で欠失したアミノ酸数を表し、Dは、欠失が起きる位置の数である。付加変異体に関して、式は、以下:
【0012】
【数6】
となり、式中、CAは、各位置での付加したアミノ酸数であり、Aは、付加が生じる位置の数である。
【0013】
現在の分子生物学技術のみが、空間全体の分画を、目的のタンパク質に関して生成およびサンプリングすることを可能にするため、生成されるべき実験空間について記載する式を定義することができる。この式はまた、ライブラリー構築技術の改善のモニタリングを可能とし、タンパク質機能に関連する空間の解析を可能にする。実験的に探索されるべき空間全体を、以下:
【0014】
【数7】
として定義することができ、ここで、アミノ酸は、様々な組合せおよび順列で、他の残基に対して変異される(SR)か、欠失される(SCD)か、または付加される(SCA)。もちろん、現在の分子化学技術により、ライブラリーを創出することが可能であり、ここでR=1であればSR=Nであり、D=1であればSCD=Nであり、A=1であればSCA=20Nである。続いて、N=50のタンパク質について、この仮説的ライブラリーは、20*N3=2.5×106個の異なる配列を有し、ここで1つの位置での変化、欠失および付加の順列すべてが表される。
【0015】
タンパク質進化に関する配列空間に関する上記議論は、種々の方法で、進化配列のインビトロ操作に適用してもよい。本質的に、酵素ファミリーの異なる触媒活性の進化は、大きく2つのカテゴリー:1)活性部位のアミノ酸は同一であるが、構造フォールド(fold)の差異が酵素に異なる基質特異性をもたせるもの[Perona&Craik,J.Biol.Chem.272:29987−90(1997)]、および2)酵素構造は同一であるが、活性部位の残基の差異が、酵素に異なる反応を触媒させるもの[Babbitt&Gerlt,J.Biol.Chem.272:30591−4(1997)]に類別することができる。前者の例は、セリンプロテアーゼファミリーであり、後者の例は、エノラーゼスーパーファミリーである。
【0016】
これらのカテゴリー間の差異は、取るに足らないことのように思えるが、それらは、分子進化の方法および配列空間の概念にとって重要な意味を持つ。類似の構造フォールドを有するファミリーの酵素に関して、触媒機構のために触媒活性部位が同一残基を必要とするようであるため、タンパク質長全体にわたって配列空間をサンプリングする分子進化アプローチは、酵素の特異性を変化させる最適な戦略であるようである。しかし、第2の型の酵素に関しては、タンパク質の全長にわたって探索する配列空間を増加することはおそらく必要ではない。それよりも、重要な触媒ドメインの配列空間サンプリングを増加させることが、分子進化プロセスを最適化する。これに関して、全遺伝子配列にわたって展開される205個の配列空間をサンプリングするよりも、20個のアミノ酸それぞれに対して重要な5個のアミノ酸を変化させ、このより限定された空間(205個)をサンプリングすることがより良好である。さらに、重要な領域における考え得る付加または欠失の変異体と同数をサンプリングすることはまた、インビトロ進化プロトコルの考え得る成功に寄与する。したがって、第2の型の酵素ファミリーに属する遺伝子の分子進化を最適化する方法は、非常に重要であり、かつ堅固な技術。
【0017】
遺伝子ドメインの交換(swapping)は、生体分子の新たな機能または改善された機能を進化させるために効率的な手段である。単一ヌクレオチド残基の変化は、遺伝子およびタンパク質機能に影響を及ぼし得るものの、遺伝子中の複数残基の大量の交換が、タンパク質機能に劇的に影響を及ぼし得る。例えば、E.coliおよびSalmonellaは、高度に関連した細菌種であるが、これらの遺伝的内容の差異は、単一残基の変化ではなく遺伝子交換事象にほぼ完全に起因する。さらに、大量のDNAの変換が遺伝子を創出する交換事象は、凝固カスケードのような経路で数回起きたと考えられ、ならびに転位により新規転写カセットを創出することが考えられる[Bell,(1997);Patthy,(1999)]。
【0018】
天然に存在する分子進化の周知の例は、免疫系での抗体産生の基礎を成すものである。哺乳類の前リンパ球(pre−lymphocyte)では、天然の分子進化が日常的に首尾よく生じる。抗体は、混乱させるアレイの種々の抗原を結合することが可能であるが、類似のアミノ酸配列および二次構造を有している。抗体遺伝子は、遺伝子セグメントとして生殖系列で整列される(図2)。リンパ球成熟中、これらのセグメント(可変または「V」、多様性または「D]、および結合性または「J」と呼ぶ)は、V(D)J組換えと称したプロセスにおいて互いに並置され、機能的抗体またはT細胞受容体遺伝子を創出する。複数のVセグメント、Dセグメント、およびJセグメントは、相当量の多様性を可能とし、したがって、種々の抗原結合特異性が、リンパ球の最終レパートリーで創出される。この機構により創出された多様性を、コンビナトリアル多様性(combinatorial deversity)と称する。別の型の多様性もまた、V(D)J組換え中に創出され、これは、コンビナトリアル多様性と同様に重要である[Davis&Bjorkman,Nature 334:395−402(1988)]。この多様性を結合多様性と称し、それは、ヌクレオチドが遺伝子セグメントの結合部で損失または獲得される場合に創出される。重要なことに、これらの結合部は、抗原と接触する抗体分子の領域をコードし、したがって、この型の多様性は、多様性であるが機能的な免疫系を創出するために重要である。
【0019】
免疫系によって利用される2つの型の多様性は、分子進化の実施に関して、以下の方法で特徴付けられ得る。免疫グロブリン遺伝子におけるコンビナトリアル多様性の生成は、複数の機能性V遺伝子セグメント、D遺伝子セグメントおよびJ遺伝子セグメントを提供することによって配列空間全体のサンプリングが可能となり、その各メンバーは、配列がわずかに異なるが、依然としてセグメントのファミリーの他のメンバーに対して相同である。これに関して、V遺伝子セグメント、D遺伝子セグメントおよびJ遺伝子セグメントの組合せ再配列は、新規抗体遺伝子を生成するために、「ドメイン交換」事象として機能する。結合多様性の生成は、連結されるべきDNAの末端にランダムヌクレオチドを付加または欠失させる機構により、抗原を接触するのに重要な残基で配列空間のより大きな局所的サンプリングを可能にする。
【0020】
遺伝子進化に関する上述の問題、すなわち莫大な配列空間の探索における困難、ランダム変異誘発の有害な変異の優勢、およびアミノ酸相互依存に起因して、研究室で機能的配列空間を探索する堅固な方法を考案することが困難であった。ライブラリー形式で変異タンパク質を創出するのに現在広範に使用される方法は、誤りがちなポリメラーゼ連鎖反応[Caldwell&Joyce,(1992);Gramら、Proc Natl Acad Sci 89:3576−80(1992)]、およびカセット変異誘発[Arkin&Youvan,Proc Natl Acad Sci 89:7811−5(1992);Hermesら、Proc Natl Acad Sci 87:696−700(1990);Oliphantら、Gene 44:177−83(1986);Stemmer&Morris,Biotechniques 13:214−20(1992)]であり、これらの方法では最適化される特定領域が、合成的に変異誘発されたオリゴヌクレオチドで置き換えられる。あるいは、宿主細胞の変異誘発遺伝子(mutator)系統が、変異頻度を加算するために使用されてきた[Greenerら、Mol Biotechnol 7:189−95(1997)]。各場合において、「変異雲(mutant cloud)」[Kauffman,(1993)]は、元の配列中のある種の部位付近に生成される。
【0021】
誤りがちなPCRは、長い配列にわたって低レベルの点変異をランダムに導入するために、低忠実度の重合条件を使用する。誤りがちなPCRをまた使用して、未知の配列のフラグメントの混合物を変異誘発し得る。誤りがちなPCRは、dITPの存在下でdNTPの個々の濃度を変化させることによって、遺伝子をランダムに変異させることができる[Caldwell&Joyce,(1992):Leung&Miyamoto,Nucleic Acids Res 17:1177−95(1989);Speeら、Nucleic Acids Res 21:777−8(1993)]。
【0022】
しかし、コンピュータシミュレーションは、点変異単独では、多くの場合緩やかすぎて、連続した配列進化に必要なブロック変化を可能にし得ないことを示唆した。公開されている誤りがちなPCRプロトコルは一般に、0.5〜1.0kbより長いDNAフラグメントの信頼性高い増幅に不適切であり、それらの実際の適用は限られる。さらに、誤りがちなPCRの繰り返しのサイクルは、中立変異の蓄積を引き起こし、それは例えば、タンパク質を免疫原性にし得る。
【0023】
オリゴヌクレオチド指向性変異誘発では、短い配列が、合成的に変異誘発されたオリゴヌクレオチドで置き換えられる。このアプローチは、遠位変異の組合せを生成せず、したがって有意にコンビナトリアルではない。莫大な配列長に対して限定されたライブラリーサイズは、タンパク質最適化のために多数回の選択が回避できないことを意味する。合成オリゴヌクレオチドによる変異誘発は、各回の選択後に個々のクローンを配列決定し、続いてファミリーに類別し、単一ファミリーを任意に選択し、そのファミリーをコンセンサスモチーフへと縮小させる必要があり、そのコンセンサスモチーフは、再合成され、単一遺伝子に再挿入され、続いてさらに選択される。このプロセスは、統計学的ボトルネックを構成し、それは多数回の変異誘発について集中的に労力を有し、また実用的ではない。
【0024】
制限部位を組込むランダムプライマーまたは部分的縮重プライマーを利用する飽和変異誘発方法についても記載されている[Hillら、Methods Enzymol 155:558−68(1987);Oliphantら、Gene 44;177−83(1986);Reidhaar−Olsonら、Methods Enzymol 208:564−86(1991)]。
【0025】
「カセット」変異誘発は、変異タンパク質のライブラリーを創出するための別の方法である[Bockら、米国特許第5,830,720号(1995年);Christou&McCabe、米国特許第5,830,728号(1998年);Hillら、Methods Enzymol 155:558−68(1987);Millerら、米国特許第5,830,740号(1998年);Shiraishi&Shimura,Gene 64:313−9(1988);Stemmer&Crameri、米国特許第5,830,721号(1998年)]。カセット変異誘発は典型的に、部分的にランダム化された配列で、鋳型の配列ブロック長を置き換える。したがって、得られ得る最大の情報内容は、カセットのランダム化された部分中のランダム配列の数に統計学的に限定される。
【0026】
プロトコルもまた開発されており、それにより、オリゴヌクレオチドの合成は、非天然ホスホルアミダイトで「ドープ(dope)」され、ランダム変異誘発を標的化する遺伝子セクションのランダム化を生じる[Wang&Hoover,J Bacteriol 179:5812−9(1997)]。この方法により、ランダム置換率を維持しながら、位置の選択の制御が可能となる。
【0027】
ZaccoloおよびGherardi(1999)は、ピリミジンヌクレオチシドアナログおよびプリンヌクレオチシドアナログを利用するランダム変異誘発方法について記載している[Zaccolo&Gherardi,J Mol Biol 285:775−83(1999)]。この方法は、セファロスポリン、セフォタキシムに対する触媒速度の増加を伴う −ラクタマーゼを示す置換変異を達成するのに成功した。Creaは、「ウォークスルー(walk through)」方法を記載し、ここでは、既定のアミノ酸が、あらかじめ選択された位置で標的配列に導入される[Crea,米国特許第5,798,208号(1998年)]。
【0028】
挿入変異および/または欠失変異により標的遺伝子を変異させる方法が開発されている。挿入変異は、staphylococcalヌクレアーゼの内部に蓄積され得ることが実証された[Keefeら、Protein Sci 3:391−401(1994)]。開発された欠失変異誘発方法の例としては、エキソヌクレアーゼ(例えば、エキソヌクレアーゼIIIまたはBal31)の利用、または点欠失を組み込むオリゴヌクレオチド指向性欠失によるものが挙げられる[Nerら、Nucleic Acids Res 17:4015−23(1989)]。さらに、Lietzは、ランダム配列を有するオリゴヌクレオチドが挿入および欠失を誘導するためにPCRと組合わせられ得る方法について記載する。この技術による機能の強化は示されておらず、過剰変異誘発(すなわち、ポリヌクレオチド1つ当たり多すぎる挿入または欠失を作製する)の容量が、この方法では重要である[Lietz,米国特許第6,251,604号(2001年)]。
【0029】
インビトロでタンパク質を進化させるのに最も頻繁に使用される技術は、「DNAシャッフリング」として知られている。この方法では、遺伝子改変のライブラリーは、遺伝子の相同配列をフラグメント化し、そのフラグメントを互いにランダムにアニーリングさせ、ポリメラーゼを用いてオーバーハングを充填することにより創出される。次に、完全長遺伝子ライブラリーは、ポリメラーゼ連鎖反応(PCR)により再構築される。この方法の有用性は、アニーリングの工程に生じ、それにより相同配列は、互いにアニーリングし得、両方の出発配列の特性を有する配列を産生し得る。実際に、この方法は、相同性であるが、いくつかの位置で有意な差異を含む2つ以上の遺伝子間の組換えに影響を及ぼす。いくつかの相同配列を用いるライブラリーの創出により、ランダムに変異した単一出発配列を用いる場合よりも多くの配列空間をサンプリングすることが可能となることを示した[Crameriら、Nature 391;288−91(1998)]。この効果は、進化の年月が、異なる種のホモログ間の種々の有利な変異または中立の変異に関してすでに選択されていたという事実に起因するようである。ホモログから出発すると、次いで、スクリーニングされるべきライブラリーの創出において有害な変異数をかなり限定する。ホモログの有利な位置をコンビナトリアルに再配列すると、明らかに生化学反応を触媒するのに最適な二次タンパク質構造を可能にすることができる。得られた進化タンパク質は、出発配列各々に起因する明確な特徴を含有するようであり、選択後、劇的に改善された機能を生じる。
【0030】
DNAシャッフリング技術の変法が考案された。一プロセスは、「付着伸長(staggered extension)」プロセス、またはStEPと呼ばれる。伸長プライマーにより創出されるフラグメントのプールを再構築するのではなく、完全長遺伝子を鋳型の存在下で直接アセンブリする。StEPは、変性、続く極端に省略されたアニーリング/伸長工程の繰り返しサイクルから構成される。各サイクルでは、伸長フラグメントを、相補性に基づいた種々の鋳型にアニーリングさせ得、さらに少し伸長して、「組換えカセット」を創出することができる。この鋳型転換により、ほとんどのポリヌクレオチドは、異なる親遺伝子由来の配列を含有する(すなわち、新規組換え体である)。このプロセスは、完全長遺伝子が形成するまで繰り返される。それに続いて、任意の遺伝子増幅工程を行うことができる[Arnoldら、米国特許第6,177,263号(2001年)]。
【0031】
別の技術では、初期DNAのフラグメント化は、標的遺伝子の付加物(adduct)形成を誘導することで、伸長反応中のポリメラーゼの早発性終結により達成することができる[Short、米国特許第5,965,408号(1999年)]。異なる技術では、融合遺伝子のライブラリーを生成するために2つのホモログの各々に漸増性切断を誘導することにより、ライブラリーが創出され、ライブラリーの各々が、各ホモログからのドメインを含有する[Ostermeierら、Nat.Biotechnol.17:1205−9(1999)]。このアプローチの利点は、以前の方法のアニーリング工程が省略されるため、出発配列間の有意な相同性が必要とされないことである。しかし、選択技術をライブラリーに適用する後に、この技術の変法が実際に改善された遺伝子機能の生成を引き起こすか否かは明らかではない。
【0032】
種々の生物体由来の遺伝子の対立遺伝子を用いる遺伝子シャッフリングのこれまで記載されてきた方法は、コンビナトリアル多様性を生じさせるが、出発配列に見出される相同性により限定される。さらに、これらの方法は、抗体遺伝子セグメントのV(D)J結合により形成される結合多様性を生成する機構を提供しない。本発明は、指向性様式またはランダム様式のいずれかでタンパク質配列または核酸配列由来の残基を付加および欠失させることで、結合多様性に類似した機構を利用する。本発明はまた、コンビナトリアルV(D)J組換えにより生成されるコンビナトリアル多様性に類似した「遺伝子交換」事象を提供する。これは、遺伝子をインビトロで進化させる手段を大いに強化する。
【0033】
(発明の要旨)
本発明は、以下の工程:
(a)ポリヌクレオチド中にランダムにヌクレオチド残基を付加または欠失させて、付加または欠失を含有するポリヌクレオチドのライブラリーを生成する工程;および
(b)必要に応じて、工程(a)のポリヌクレオチドのプールを、所望の機能または特徴をコードするポリヌクレオチドを特定することが可能な選択手順に供する工程、
による核酸配列の指向された分子進化を包含する。工程(a)および(b)は、必要に応じて反復し得る。本発明の方法により生成されるライブラリーもまた、記載され、そして意図される。
【0034】
独自に、本発明は、タンパク質二次構造に有意に影響を及ぼす配列を含む配列空間のサンプリングを可能とし、したがって進化した遺伝子中の変化した機能または改善した機能を特定する蓋然性を高めることが可能である。さらに、本発明は、他の現在の技術によりサンプリングすることができない配列空間のサンプリングを可能にする。さらに、本発明を用いて創出したポリヌクレオチドのライブラリーは、他の現在の技術を利用して得ることができない。
【0035】
いくつかの方法および組成物が、以下に記載されそして意図される。本発明の1つの方法は、遺伝的要素の配列中の異なる位置にヌクレオチド欠失を有するポリヌクレオチド配列のライブラリーを生成するための方法であって、以下の工程:
(a)この該遺伝的要素を含む複数コピーの環状ポリヌクレオチドを、ランダムな切断に供して、複数の線状ポリヌクレオチドを獲得する工程であって、このポリヌクレオチドの各々は、少なくとも1つの3’末端および5’末端を有する、工程;および
(b)工程(a)由来の上記ポリヌクレオチドを、このポリヌクレチドのDNA末端の1つから少なくとも1つのヌクレオチドを取り除くプロセスに供して、欠失ポリヌクレオチド配列のライブラリーを生成する工程であって、このライブラリーは、異なるランダムな位置に欠失を有する複数の欠失ポリヌクレオチド配列を含む、工程、を包含する。さらに所望される場合、工程(b)由来のポリヌクレオチドが、上記3’末端および5’末端を互いに共有結合するプロセスに供され得、そして上記ポリヌクレオチドのライブラリーは、目的の機能について選択するプロセスにさらに供され得る。欠失ポリヌクレオチドのライブラリーは、2個より多くかまたはそれ以上、例えば、少なくとも10個、20個もしくは30個またはそれ以上の欠失を含んでもよく、あるいはさらには各々が他と異なる位置にランダム欠失を有する50〜100個の別個のヌクレオチドが得られてもよい。作製される欠失数は、出発材料および技術者の目標に依存する。いくつかの実施形態では、欠失ポリヌクレオチドのライブラリーは、少なくとも1個、2個、3個、4個、もしくは5個またはそれ以上の別個のヌクレオチドの非常に短い欠失を含む。異なる実施形態では、ライブラリーは、50〜100個またはそれ以上のヌクレオチドのより大きな欠失を含んでもよい。別の実施形態では、環状ポリヌクレオチドの複数コピーの組成物は、遺伝的要素に対する天然に存在するホモログを含まない。さらに、工程(a)および(b)は、任意に反復され得る。別の任意の方法は、工程(b)で欠失位置にヌクレオチドを挿入するプロセスを包含する。
【0036】
各々異なる3’末端および5’末端を有する、複数の(好ましくは2個より多い、より好ましくは5個より多い、最も好ましくは10個より多い)線状ポリヌクレオチドのライブラリーを含む実質的に純粋な組成物であって、環化される場合には各々の線状ポリヌクレオチドが他のものと同一である組成物について、記載されそして意図される。
【0037】
異なるランダム欠失を有することによってのみ各々が他と異なる、少なくとも2個の(好ましくいは5個より多い、より好ましくは10個より多い)欠失ポリヌクレオチドのライブラリーを含む実質的に純粋な組成物もまた、記載されそして意図される。必要に応じて、このような欠失ポリヌクレオチドはさらに、欠失位置に挿入された少なくとも1つのヌクレオチドを含む。
【0038】
本発明の別の方法は、遺伝的要素中のランダムな位置にヌクレオチド付加を有するポリヌクレオチド配列のライブラリーを生成するための方法であって、以下の工程:
(a)この遺伝的要素を含む複数コピーの環状ポリヌクレオチドの組成物を、ランダムな切断に供して、複数の線状ポリヌクレオチドを獲得する工程であって、このポリヌクレオチドの各々は、少なくとも1つの3’末端および5’末端を有する、工程;および
(b)工程(a)由来のポリヌクレオチドを、このポリヌクレチドの末端の1つに少なくとも1つのヌクレオチドを付加するプロセスに供して、付加ポリヌクレオチド配列のライブラリーを生成する工程であって、このライブラリーは、異なるランダムな位置に付加を有する複数の付加配列を含む、工程、
を包含する。さらに、所望される場合、工程(b)由来の付加ポリヌクレオチドは、上記3’末端および5’末端を互いに共有結合するプロセスに供され得る。必要に応じて、上記ポリヌクレオチドのライブラリーは、目的の機能について選択するプロセスに供され得る。
【0039】
本明細書に記載される方法のいずれかにおいて、切断は好ましくは、エンドヌクレアーゼ、好ましくはS1の使用により起きる。この方法は、付加ポリヌクレオチドのライブラリーが、各々が他と異なる位置にヌクレオチドのランダム付加を有する任意数の異なるポリヌクレオチド、例えば、少なくとも5個、10個、20個または30個の別個のポリヌクレオチドを含むことを可能にする。本発明の1つの実施形態では、環状ポリヌクレオチドの複数コピーの組成物は、遺伝的要素に対する天然に存在するホモログを含まない。必要に応じて、この方法の工程(a)および(b)は、反復され得る。別のオプションは、工程(b)での付加点でヌクレオチドを欠失させるプロセスを包含する。任意数のヌクレオチドは、出発分子および技術者の目標に応じて、工程(b)で付加され得、例えば1〜3個、3〜50個、もしくは50〜100個またはそれ以上のヌクレオチドが、工程(b)で付加され得る。
【0040】
異なるランダム付加を有することでのみ各々が他と異なる、少なくとも2個(好ましくは、少なくとも5個、最も好ましくは、少なくとも10個)の付加ポリヌクレオチドのライブラリーを含む、実質的に純粋な組成物が、意図される。
【0041】
さらに、驚くべきことに、本発明は、ポリヌクレオチドの末端で短い欠失を作製して、末端に短い欠失(1〜100個、好ましくは1〜35個、最も好ましくは1〜10個)を有するポリヌクレオチドの集団を生産する方法を提供する。次いで、このような欠失を有するDNA末端を他のDNA末端と共有結合させることができ、特定の内部位置に欠失を含有するポリヌクレオチドのライブラリーを生成することができる。多くの場合、連結されるべき2つの末端は、得られた連結産物が環状ポリヌクレオチドを含むように、同一DNA分子上に存在する。このような方法および組成物は、タンパク質工学および指向された進化の領域で重要である。
【0042】
(発明の詳細な説明)
遺伝子交換(swapping)事象は、高分子の進化における主要な駆動力(driver)を構成する。交換事象は、ヌクレオチドの挿入、欠失、または置換を含み得る。交換事象は、相同組換えを介して発生し得るが、抗体遺伝子セグメントに用いられるV(D)J組換えおよびDNA末端結合機構において発生するように、非相同的手段によっても発生し得る[Smider&Chu,Sem.Immun.9:189−97(1997)]。分子進化に関する現在の技術は、遺伝子交換のために一般的に適用可能な非相同的手段を提供するものではない。
【0043】
本発明の適用には、改善した機能または変化した機能を有する新規な遺伝的要素の産生が含まれる。これらの遺伝的要素は、かなりの商業的価値を有し得る。例えば、遺伝的要素はタンパク質製剤の産生を強化し得る。遺伝的要素は、モノクローナル抗体、または病気を処置するために用いられる酵素などのタンパク質製剤をコードし得る。さらに、遺伝的要素は、化学品製造などの工業プロセスにおいて重要な酵素をコードし得るか、あるいは洗濯用界面活性剤(すなわち、プロテアーゼ、リパーゼまたはエステラーゼ)のような製品中に用いられ得る。さらに、遺伝的要素は、病原菌耐性のための手段を提供する、または、植物種による新規な栄養素の産生を可能にするといったような、農業における重要な用途を有し得る。さらに、遺伝的要素は、新規な抗生物質、色素または他の低分子のような、ヒトへの使用のための新規な製品を生産するため、微生物において用いられ得る。このように、その機能を改善または変化させるための遺伝的要素の改変は、いくつかの異なる産業に無数の適用を有する。
【0044】
本発明を記載する目的のために、以下の用語は有用であり、かつ、以下のような意味を有する。
【0045】
(定義)
用語「塩基」は、アデニン、グアニン、チミン、シトシンまたはウラシルのいずれかからなる核酸成分をいう。さらに、「プリン」は、アデニンまたはグアニンのいずれかを指し、「ピリミジン」は、チミン、シトシンまたはウラシルのいずれかをいう。
【0046】
用語「ヌクレオシド」は、ピリミジンまたはプリンのペントース環(例えば、リボースまたはデオキシリボース)との共有結合を含む分子をいう。
【0047】
用語「ヌクレオチド」は、ヌクレオシドのリン酸エステルをいう。
【0048】
用語「ポリヌクレオチド」は、ホスホジエステル結合のような結合を介して、少なくとも1個の他のヌクレオチドの1つの3’ヒドロキシルに共有結合したあるヌクレオチドの少なくとも1個の5’ヒドロキシルを含有する分子をいう。ポリヌクレオチドは必然的に、以下に定義されるような、「残基」を含有する「位置」からなる。
【0049】
ポリヌクレオチド配列またはポリペプチド配列に関する場合、用語「位置」は、ポリヌクレオチドまたはポリペプチド鎖中の目的の残基の場所をいう。例えば、ポリヌクレオチド配列中の「位置」は、少なくとも1個の他のヌクレオチドに関する、ポリヌクレオチド鎖中のヌクレオチドの場所として定義される。例えば、単純なポリヌクレオチドTGにおいて、Tは位置1(自身に関して)であり、Gは位置2(位置1のTに関して)である。最も遠位の5’ヌクレオチドを基準として標識し、位置1として標識することが慣例であることが多い。DNAのような、遺伝子をコードする二本鎖のポリヌクレオチドでは、時に、遺伝子の翻訳開始部位が位置1として標識されることが多い。これはしばしば、ATGの翻訳開始配列におけるアデニンである。ATGからの5’に配置された位置は、負の位置(例えば、−11、−35など)が与えられ、ATGに対して3’に配置された位置は正の位置が与えられる。当業者は、用語「位置」の性質を、ポリヌクレオチドの配列における番号付けスキームに関するものとして理解する。「配列」は、各位置を占める残基の構成に起因する記号列(string)をいう。例えば、配列ATGは、塩基アデニンがチミンの直前の位置を占め、チミンがグアニンの直前の位置を占めることを意味する。「特定の位置」は、その配列および構成が公知である少なくとも2個のヌクレオチド間のポリヌクレオチド中の位置をいう。
【0050】
ポリヌクレオチドまたはポリペプチドに関する場合、用語「残基」は、ポリヌクレオチドについてはプリンヌクレオチドまたはピリミジンヌクレオチドをいい、ポリペプチドについてはアミノ酸をいう。
【0051】
「遺伝的要素」は、機能をコードするポリヌクレオチドの配列を意味する。例えば、「遺伝的要素」は、ポリペプチド配列をコードし得、プロモーター機能、エンハンサー機能、翻訳開始部位または停止部位、あるいはRNAスプライシング部位などをコードし得る。遺伝的要素は、他の遺伝的要素と作動可能に連結することができ、例えば、プロモーターは、タンパク質をコードする遺伝的要素と作動可能に連結して、目的の細胞型でのタンパク質の発現を可能にする。用語「遺伝子」および「目的の遺伝子」は、ポリペプチドをコードすることができるポリヌクレオチドをいう。
【0052】
ポリヌクレオチドに関する用語「交換」または「遺伝子交換」は、以下のいずれかを意味する:1)ポリヌクレオチド中の連続した位置を占める少なくとも2個の残基の欠失の発生、または2)ポリヌクレオチドへの連続した位置を占める少なくとも2個の残基の付加の発生、または3)ポリヌクレオチド中の連続した位置を占める少なくとも2個の残基の、他の残基との置換。
【0053】
ポリヌクレオチドに適用される場合、用語「ヌクレオチド欠失」は、ポリヌクレオチドが、得られるポリヌクレオチドを親の配列、野生型配列または他の参照配列と比較した場合、ポリヌクレオチド鎖中の1以上の位置から1個以上の特定の残基が除去されたことを意味する。
【0054】
用語「ヌクレオチド挿入」または「ヌクレオチド付加」は、親の配列、野生型の配列、または他の参照配列と比較した場合、ポリヌクレオチドがポリヌクレオチド鎖に付加された特定の残基を有し、これにより少なくとも1個の元の残基がポリヌクレオチド中の新たな位置を現在占めていることを意味する。
【0055】
用語「ポリヌクレオチド配列のライブラリー」は、ポリヌクレオチドの混合物をいい、ここで、この混合物中の少なくとも1つの配列が少なくとも1つの他の配列と、配列の構成または長さにおいて異なっており、例えば、2つの配列を比較した場合に少なくとも1つの位置が異なるヌクレオチドによって占められているか、または、他方の配列と比較した場合に少なくとも1つのヌクレオチド位置がもう一方の配列中に存在しない、ポリヌクレオチドの混合物をいう。
【0056】
用語「DNA」は、デオキシリボ核酸をいう。当業者は、DNAに関して本明細書中で記載されている操作がRNAにも適用し得ることを理解する。
【0057】
用語「DNA末端」または末端は、ホスホジエステル結合が分解したDNA鎖中の位置をいう。一本鎖DNAの末端では、1個のヌクレオチドが他の1個のヌクレオチドと共有結合しているのみである。「二本鎖DNA末端またはRNAの末端」は、分子がもはや二本鎖でない、二本鎖DNA分子またはRNA分子における位置をいう。一般に、DNA末端は当業者に認識可能である。二本鎖DNAの末端は、5’オーバーハング、3’オーバーハングまたはヘアピン構造を有する平滑部分として特徴付けられる。DNA末端は5’リン酸基を含有してもしなくてもよい。
【0058】
本明細書中で使用される場合、用語「切断」は、ホスホジエステル結合のような2個のヌクレオチドの間の結合の開裂をいう。
【0059】
用語「環状ポリヌクレオチド」は、二本鎖DNA末端が全く存在しないポリヌクレオチドをいう。環状ポリヌクレオチドは一本鎖であっても二本鎖であってもよい。しかし、環状ポリヌクレオチドは一本鎖DNA末端を含有していてもよい。環状ポリヌクレオチドは、一本鎖DNA末端が存在するが互いにハイブリダイズした二本鎖分子の2つの鎖を水素結合が維持し、その結果二本鎖DNA末端が互いに接近した2つの一本鎖末端の存在により形成されない場合に存在する。このような環状二本鎖ポリヌクレオチドは、「ニック(nicked)」と呼ばれることが多い。
【0060】
用語「線状ポリヌクレオチド」は、少なくとも1つの、しかしほとんどは2つのDNA末端を含有するポリヌクレオチドである。線状ポリヌクレオチドは、一本鎖であっても二本鎖であってもよい。
【0061】
ポリヌクレオチドに適用される場合、用語「ランダム」または「ランダムな位置」は、任意の特定の残基位置が選択され得るプロセスをいう。本明細書中で用いられるランダムは、ヌクレオチドの切断点または位置のすべてが等しい頻度で選定(select)または選択される(chosen)ことを意味しない。むしろランダムは、プロセスの予測不可能な性質に関し、すなわち、ある事象がどこで発生するのか、または、任意の塩基がどの位置を有するかを作業者が演繹的に予測できない。最終的に、利用可能な位置または塩基についてランダムとなるべきプロセスに関して、すべての位置が切断のために利用可能である必要はない。例えば、長さNのポリヌクレオチドは、操作により影響を受けるその位置(すなわち、1、2、・・・N)のいずれかまたは全てを有し得る。残基の付加(挿入)または欠失では、ポリヌクレオチドは必然的に共有結合(例えばホスホジエステル結合)は切断されねばならず、その後その残基は欠失されるかまたは付加される(すなわち、位置の総数はそれぞれ増加するかまたは減少する)。長さNのポリヌクレオチド中の「ランダムな位置での欠失」と記載する際、任意またはすべてのN(環状ポリヌクレオチド中)またはN−1(線状ポリヌクレオチド中)のヌクレオチド間の共有結合(すなわち、ホスホジエステル結合)が分解し、末端における少なくとも1個のヌクレオチドが再連結に先立って除去されることを意味する。それゆえ、「ランダムな位置での欠失」を引き起こすプロセスでは、ポリヌクレオチドの最終的な長さ(N、すなわち位置の数)は必然的に減少する。同様に、長さNのポリヌクレオチド中の「ランダムな位置での挿入」と記載する際、任意またはすべてのN(環状ポリヌクレオチド中)またはN−1(線状ポリヌクレオチド中)のヌクレオチド間の共有結合(すなわち、ホスホジエステル結合)は分解し、少なくとも1個の新たなヌクレオチド(すなわち、新たな位置)が再連結に先立って末端に付加されることを意味する。それゆえ、「ランダムな位置での挿入」を引き起こすプロセスでは、ポリヌクレオチドの最終的な長さ(N、すなわち位置の数)は必然的に増加する。「ランダムな位置での欠失」および「ランダムな位置での挿入」を含むプロセスの組合せにより、ポリヌクレオチドの最終的な長さを不変に維持することが可能な場合もある(すなわち、付加が欠失を相殺し、最終的な位置の数が同じに維持されるが、その位置を占めるヌクレオチドが異なり得る)。長さNのポリヌクレオチド中の「ランダムな切断」または「シングルランダム分解(single random break)」と記載する場合、単一のポリヌクレオチド分子中の残基位置間のN(環状ポリヌクレオチド中)またはN−1(線状ポリヌクレオチド中)の共有結合のいずれか1つが切断されることを意味する。したがって、ポリヌクレオチドの多くのコピーを含む1つの容器中で、シングルランダム分解が種々の分子の種々の位置で発生し得る。
【0062】
本明細書中で使用される場合、「実質的に純粋な」とは、対象種が、存在する優先種であり(すなわち、モルを基準とした場合、組成物中に他のいかなる個別の高分子種よりもより多く存在している)、好ましくは、実質的に精製された分画が、存在するすべての高分子種の少なくとも約50%(モルを基準として)を対象種が含有する組成物であることを意味する。一般に、実質的に純粋な組成物は、組成物中に存在するすべての高分子種の約80〜90%を超えて構成する。最も好ましくは、対象種は、基本的に均一になるまで精製され(組成物中に従来の検出方法により汚染種を検出することができない)、ここで、この組成物は、基本的に単一の高分子種からなる。溶媒種、低分子(500ダルトン未満)および元素イオン種は、高分子種とはみなされない。
【0063】
用語「相同(homologous)」または「相同(homeologous)」は、1つの一本鎖核酸配列が相補的な一本鎖核酸配列にハイブリダイズし得ることを意味する。ハイブリダイゼーションの程度は、配列間の同一性の量、および後述するように温度や塩濃度といったハイブリダイゼーションの条件を含む多くの要因に依存し得る。好ましくは、同一性の領域は約5bpを超え、より好ましくは同一性の領域は10bpを超える。このように、「ホモログ」は、同一でないが、生理学的条件下で互いにハイブリダイズし得る核酸分子である。二本鎖ホモログは、変性させた後に互いにハイブリダイズし得る。
【0064】
用語「異種」は、1つの一本鎖核酸配列が、別の一本鎖核酸配列またはその相補体にハイブリダイズすることができないことを意味する。したがって、異種の範囲とは、核酸フラグメントまたはポリヌクレオチドが、配列中に別の核酸またはポリヌクレオチドにハイブリダイズすることができない範囲または領域を有することを意味する。このような領域または範囲は、例えば、変異領域である。
【0065】
用語「同一」または「同一性」は、2つの核酸配列が同一の配列または相補的配列を有することを意味する。したがって、「同一性領域」とは、核酸フラグメントまたはポリヌクレオチドの領域または範囲が、別のポリヌクレオチドまたは核酸フラグメントと同一であるかまたはそれに相補的であることを意味する。
【0066】
用語「増幅」は、核酸フラグメントのコピー数が増大することを意味する。
【0067】
用語「野生型」は、核酸フラグメントがいかなる変異をも含まないことを意味する。「野生型」タンパク質とは、このタンパク質が天然に見られる活性に匹敵するレベルで活性であることを意味し、天然に見られるアミノ酸配列を典型的に含む。本発明の1つの局面では、用語「野生型」または「親配列」は、配列の操作に先立つ、開始配列または参照配列を示す。
【0068】
用語「関連ポリヌクレオチド」は、ポリヌクレオチドの領域または範囲が同一であり、ポリヌクレオチドの領域または範囲が異種であることを意味する。
【0069】
用語「キメラポリヌクレオチド」は、野生型であるヌクレオチド領域および変異した領域をこのポリヌクレオチドが含むことを意味する。また、この用語は、このポリヌクレオチドが、あるポリヌクレオチド由来の野生型領域および別の関連ポリヌクレオチド由来の野生型領域を含むことを意味する。
【0070】
本明細書中で使用される場合、用語「集団」は、ポリヌクレオチド、核酸フラグメントまたはタンパク質のような構成成分を集めたものを意味する。「混合集団」とは、核酸またはタンパク質と同一のファミリーに属する(すなわち、関連する)が、配列が異なり(すなわち、同一でない)、したがって、その生物活性が異なる構成成分を集めたものを意味する。「ライブラリー」は、少なくとも2つの構成成分がいくつかの点(化学組成、長さ等)で異なっている集団を必然的に意味する。
【0071】
用語「特定の核酸フラグメント」は、特定の末端地点を有しかつ特定の核酸配列を有する、核酸フラグメントを意味する。1つの核酸フラグメントが第2の核酸フラグメントの一部と同一の配列を有するが異なる末端を有する、2つの核酸フラグメントは、2つの異なる特異的核酸フラグメントを含む。同一の配列を有するが異なる5’または3’末端を有する2つの核酸フラグメントは、2つの異なる特異的核酸フラグメントを含む。
【0072】
用語「変異」は、野生型の核酸配列の配列変化またはペプチドの配列変化を意味する。このような変異は、転位または転換などの点変異であり得る。変異は、欠失、挿入または複製であってもよい。
【0073】
本明細書中で使用されるポリペプチドの表記では、標準的な用法および慣例に従い、左向きの方向はアミノ末端方向であり、右向きの方向はカルボキシ末端方向である。同様に、特記しない限り、一本鎖ポリヌクレオチド配列の左側末端は5’末端であり、二本鎖ポリヌクレオチド配列の左向き方向は5’方向をいう。新生RNA転写物の5’から3’付加の方向は、転写方向をいい、このRNAと同一の配列を有し、かつRNA転写物のこの5’末端に対して5’であるDNA鎖上の配列領域を、「上流配列」と呼び、このRNAと同一の配列を有し、かつコードRNA転写物の3’末端に対して3’であるDNA鎖上の配列領域を、「下流配列」という。
【0074】
本明細書中である対象に対して適用される場合、用語「天然に存在する」は、対象が天然に見出しされ得るという事実をいう。例えば、天然の供給源から単離され得る生物(ウイルスを含む)中に存在し、研究室で人間の手により意図的に改変されていないポリペプチド配列またはポリヌクレオチド配列は、天然に存在する。一般に、用語天然に存在するは、非病理的(病気になっていない)個体中に存在するような対象、例えば、その種に典型的なものをいう。
【0075】
本明細書中で使用される場合、用語「生理学的条件」は、温度、pH、イオン強度、粘性などをいい、これは、生存可能な微生物に適合し、および/または生存可能な培養酵母細胞もしくは哺乳動物細胞中の細胞内に典型的に存在する生化学的パラメータをいう。例えば、典型的な研究培養条件下で増殖させた酵母細胞中の細胞内条件が、生理学的条件である。インビトロ転写カクテルに適したインビトロ反応条件が、通常、生理学的条件である。一般に、インビトロの生理学的条件は、50〜200mMのNaClまたはKCl、pH6.5〜8.5、20〜45℃、および0.001〜10mMの2価カチオン(例えば、Mg++、Ca++)、好ましくは、約150mM NaClまたはKCl、pH7.2〜7.6、5mM 2価カチオンを含み、0.01〜1.0%の非特異的タンパク質(例えば、BSA)を含む場合が多い。非イオン性界面活性剤(Tween、NP−40、Triton X−100)が、通常約0.001〜2%で、典型的には0.05〜0.2%(v/v)で、しばしば存在し得る。特定の水性条件が、従来の方法に従い専門家によって選択され得る。一般的な手引きとしては、以下の緩衝化水性条件が適用可能であり得る:10〜250mM NaCl、5〜50mMのTris HCl、pH5〜8、2価カチオン(複数可)および/または金属キレート剤および/または非イオン性界面活性剤および/または膜画分および/または消泡剤および/または閃光剤(scintillant)を任意に添加する。
【0076】
本明細書中で使用される場合、「リンカー」または「スペーサー」とは、DNA結合タンパク質およびランダムペプチドのような2個の分子を接続し、この2個の分子を好ましい配置に位置させるように機能し、例えば、その結果、ランダムペプチドがDNA結合タンパク質から最少の立体障害でレセプターに結合することができる分子または分子団をいう。
【0077】
本明細書中で使用される場合、用語「作動可能に連結された」は、機能的関連におけるポリヌクレオチド要素の連結をいう。核酸は、別の核酸配列との機能的関連に配置された場合、「作動可能に連結され」る。例えば、プロモーターまたはエンハンサーは、コード配列の転写を影響する場合、このコード配列に作動可能に連結される。作動可能に連結されるとは、連結されるDNA配列が典型的に連続し、2つのタンパク質コード領域を結合する必要がある場合に、連続し、リーディングフレーム中にある。
【0078】
(進化ランダム分子のライブラリー生産)
本発明は、ランダムな位置でのヌクレオチドの欠失、挿入または欠失および挿入の組合せのいずれかを含有するポリヌクレオチドのライブラリーを作製する方法を提供する。実際は、本発明は、相同性または増幅技術を必要とすることなく遺伝的要素を「交換」する手段を提供する。遺伝的要素の交換は高分子、細胞および生物の進化の推進力であることが知られている[Ostermeier&Benkovic,Adv Protein Chem 55:29−77(2000)]。PCRに基づく遺伝子シャッフリングのような現在の技術では、相同性と独立した遺伝的要素を有意に交換することができない。
【0079】
(欠失)
1つの実施形態では、本発明は、集団のメンバーが単一のランダムな位置での欠失の存在により互いに異なる、ヌクレオチド集団を作製する方法を提供する。本発明の一方法は、例えば、以下の工程:
(a)2つの末端を作製するために、複数コピーのポリヌクレオチドの組成物をランダムな位置で切断する工程;
(b)工程(a)からの上記ポリヌクレオチドを、上記ポリヌクレオチドの末端のうちの一末端から、少なくとも1個のヌクレオチドを除去するプロセスに供する工程;および
(c)工程(b)からの上記ポリヌクレオチドを、必要に応じて、上記末端を互いに共有結合させ、1つの位置での欠失により他のものと異なる少なくとも1個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスに供する工程、
を包含する。
【0080】
さらに、本発明は、ポリヌクレオチドの集団を提供し、この集団のメンバーは、単一のランダムな位置での欠失の存在により互いに異なる。欠失が、遺伝的要素の有害または不要な機能の除去を可能にすることが意図される。これらの機能は、プロテアーゼ部位、イオン結合ドメイン、阻害的転写因子に関するDNA結合配列、タンパク質の免疫原性ドメイン等を含み得る。
【0081】
さらなる実施形態では、本発明は、例えば、1つより多い位置で欠失を含有するポリヌクレオチドを生成する方法を提供する。1つの方法は、以下の工程:
(a)2つの末端を作製するために、ランダムな位置で複数コピーのポリヌクレオチドの組成物を切断する工程;
(b)工程(a)からの上記ポリヌクレオチドを、上記ポリヌクレオチドの上記末端から少なくとも1個のヌクレオチドを除去するプロセスに供する工程;および
(c)任意に、工程(b)からの上記ポリヌクレオチドを、上記末端を互いに共有結合させ、1つの位置での欠失により他のものと異なる少なくとも1個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスに供する工程、
を包含する。次いで、所望されるならば、目的の機能が、選択されてもよい(工程(d))。さらに、所望されるならば、工程(a)〜(c)または工程(a)〜(d)が、1〜50回以上反復され得る。
【0082】
さらに、本発明は、1つより多い位置での欠失を含有するポリヌクレオチドの集団を提供する。複数の位置での欠失が、遺伝的要素の多くの有害または不要な機能の除去を可能にすることが意図される。これらの機能は、当業者には十分理解されるように、プロテアーゼ部位、イオン結合ドメイン、阻害的転写因子に関するDNA結合配列、タンパク質の免疫原性ドメインまたは目的の他の機能の任意の組合せを含み得る。
【0083】
(挿入)
1つの実施形態では、本発明は、ポリヌクレオチドの集団を作製する方法を提供し、この集団のメンバーは、単一のランダムな位置での挿入の存在により互いに異なる。1つの方法は、以下の工程:
(a)2つの末端を作製するために、ランダムな位置でポリヌクレオチドの複数コピーの組成物を切断する工程;
(b)工程(a)からの上記ポリヌクレオチドを、上記ポリヌクレオチドの少なくとも1つの末端に、少なくとも1個のヌクレオチドを挿入するプロセスに供する工程;および
(c)任意に、工程(b)からの上記ポリヌクレオチドを、上記末端を互いに共有結合させ、1つの位置での挿入により他のものと異なる少なくとも1個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスを付す工程、
を包含する。
【0084】
さらに、本発明は、ポリヌクレオチドの集団を提供し、この集団のメンバーは、単一のランダムな位置での挿入の存在により互いに異なる。本発明のこの実施形態は、遺伝的要素に新たな融合を発生させ得る。例えば、毒素は、標的化される分子(例えば、抗体)に融合され得、重要な代謝経路の酵素モジュール(例えば、ポリケチドシンダーゼ(synthetase))は、新たな方法で融合され得、または結合ドメイン(すなわち、核酸結合ドメイン、低分子結合ドメインまたはイオン結合ドメイン、プロテアーゼ部位、または他の翻訳後修飾モジュール)のような新たな機能は、、既存の遺伝的要素中に組み込まれ得る。
【0085】
同様に、別の実施形態では、本発明は、1つより多い位置での挿入を含有するポリヌクレオチドを生成する方法を提供する。1つの方法は、以下の工程:
(a)ランダムな位置で複数コピーのポリヌクレオチドの組成物を切断する工程;
(b)工程(a)からの上記ポリヌクレオチドを、上記ヌクレオチドの少なくとも1つの上記末端に、少なくとも1個のヌクレオチドを挿入するプロセスに供する工程;および
(c)任意に、工程(b)からの上記ポリヌクレオチドを、上記DNA末端を互いに共有結合させ、1つの位置での挿入により他のものと異なる少なくとも1個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスに供する工程;および
(d)任意に、目的の機能を選択する工程、
を包含する。工程(a)〜(b)、(a)〜(c)または(a)〜(d)は、1〜50回以上繰り返されてもよい。
【0086】
さらに、本発明は、1つより多い位置での挿入を含有するポリペプチドの集団を提供する。本発明のこの実施形態は、遺伝的要素に複数の新たな融合を発生させ得る。例えば、以下のものは、目的の遺伝子にコンビナトリアル様式で融合され得る;毒素は、標的化される分子(例えば、抗体)に融合され得、重要な代謝経路の酵素モジュール(例えば、ポリケチドシンダーゼ)は、新たな方法で融合され得、または複数の結合ドメイン(すなわち、核酸結合部位、イオン結合ドメイン、プロテアーゼ部位、または他の翻訳後修飾モジュール)のような新たな機能は、既存の遺伝的要素中に組み込まれ得る。
【0087】
(挿入および欠失の組合せ)
1つの実施形態では、本発明は、ポリヌクレオチドの集団を作製する方法を提供し、この集団のメンバーが単一のランダムな位置での欠失および挿入の存在により互いに異なる。この方法は、以下の工程:
(a)2つの末端を作製するために、ランダムな位置で複数コピーのポリヌクレオチドの組成物を切断する工程;
(b)工程(a)からの上記ポリヌクレオチドを、上記ポリヌクレオチドの上記末端のうちの1つの末端から、少なくとも1個のヌクレオチドを除去するプロセスに供する工程;
(c)工程(b)からの上記ポリヌクレオチドを、工程(b)からの上記ポリヌクレオチドの上記DNA末端のうちの少なくとも1つの末端に、少なくとも1個のヌクレオチドを挿入するプロセスに供する工程;
(d)任意に、工程(c)からの上記ポリヌクレオチドを、上記DNA末端を互いに共有結合させ、1つの位置での欠失または挿入により他のものと異なる少なくとも1個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスに供する工程、
を包含する。
【0088】
さらに、本発明は、ポリペプチドの集団を提供し、そのメンバーが単一のランダムな位置での欠失および挿入の組合せにより互いに異なる。本実施形態は、新たな異種ドメインが目的の遺伝子中のドメインと置き換わることを可能にすることを意図する。これに関して、新たな機能、例えば、リガンド結合または酵素触媒が、遺伝的要素に付与され得る。同様に、ネイティブな機能は、本実施形態を利用して強化され得る。
【0089】
別の実施形態では、本発明は、1つより多い位置での挿入および欠失を含有するポリヌクレオチドを生成する方法を提供する。この点で、欠失は、挿入とは異なる位置で発生してもよく、または、欠失と挿入は、同じ位置で発生してもよい。さらに、欠失および/または挿入は、複数の位置で発生し得る。本方法は、以下の工程:
(a)2つの末端を作製するため、ランダムな位置で複数コピーのポリヌクレオチドの組成物を切断する工程;
(b)工程(a)からの上記ポリヌクレオチドを、上記ポリヌクレオチドの上記末端ののうちの1つの末端から、少なくとも1個のヌクレオチドを除去するプロセスに供する工程;
(c)任意に、工程(b)からの上記ポリヌクレオチドを、上記ポリヌクレオチドの上記末端のうちの少なくとも1つの末端に、少なくとも1個のヌクレオチドを挿入するプロセスに供する工程;
(d)任意に、工程(c)からの上記ポリヌクレオチドを、上記末端を互いに共有結合させ、1つの位置での欠失および挿入により他とのもの異なる少なくとも1個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスに供する工程;
(e)任意に、目的の機能について選択する工程;および、任意に工程(a)〜(d)のいずれかを、1〜50回以上繰り返す工程、
を含む。
【0090】
さらに、本発明は、1つより多い位置での挿入および欠失を含有するポリヌクレオチドの集団を提供する。本発明のこの実施形態は、古典的な指向された進化を可能にすることが意図され、この進化では、複数回のランダムな位置での挿入、ランダムな位置での欠失、ならびに挿入および欠失の組合せが生じ、各回の間で遺伝的要素は、必要に応じて選択に供される。本実施形態は、遺伝的要素の機能の改善または改変を可能にする。
【0091】
(出発材料)
本発明は、研究者にとって目的の任意のポリペプチドに適用可能である。ポリペプチドは、核酸、すなわち、RNAまたはDNAであってもよい。ポリヌクレオチドは、しばしば、遺伝的要素または1つ以上の目的の遺伝子からなるDNAである。出発材料は、天然の供給源より得ることができるか、あるいは、研究室で合成(例えば、遺伝子合成)されたポリヌクレオチドであっても、研究室で操作された天然の供給源由来のポリヌクレオチドであってもよい。ポリヌクレオチドのいくつかの供給源は、公共のデータバンク、例えば、Genbank(http://www.ncbi.nlm.nih.gov:80/Genbank/index.html)から入手できるか、または、市販されている(Celera,Rockville,MD;Incyte,Palo Alto,CA;Clontech,Palo Alto,CA;Invitrogen,Carlsbad,CA)。
【0092】
核酸は、任意の供給源から、例えば、pBR322のようなプラスミドから、クローニングされたDNAまたはRNAから、あるいは、細菌、酵母、ウイルスおよび植物または動物のようなより高等生物を含む任意の供給源からの天然のDNAまたはRNAから得られ得る。DNAまたはRNAは、血液または組織材料から抽出してもよい。鋳型ポリヌクレオチドは、ポリヌクレオチド連鎖反応(PCR)を用いた増幅により得てもよい[Mullis、米国特許第4,683,202号(1987年);Mullisら、米国特許第4,683,195号(1987年)]。あるいは、ポリヌクレオチドは、細胞中に存在するベクター中に存在してもよく、当該分野において公知の方法で細胞を培養し、細胞から核酸を抽出することにより、十分な核酸を得ることができる。
【0093】
ベクターの選択は、ポリヌクレオチド配列のサイズ、および、本発明の方法で用いられる宿主細胞に依存する。鋳型は、プラスミド、ファージ、コスミド、ファージミド、ウイルス(例えば、レトロウイルス、パラインフルエンザウイルス、ヘルペスウイルス、レオウイルス、パラミクソウイルスなど)、またはそれらの選択された部分(例えば、コートタンパク質、スパイク糖タンパク質、キャプシドタンパク質)であってもよい。例えば、コスミド、ファージミド、YACおよびBACが好ましく、ここで、これらのベクターは大きな核酸フラグメントを安定に増殖させることができるため、変異される特定の核酸配列はより大きい。
【0094】
特定の核酸配列がベクターにクローニングされる場合、各ベクターを宿主細胞に挿入し、宿主細胞にこのベクターを増幅させることによりクローン増幅され得る。核酸配列の絶対数が増大する一方、変異体の数は増大しないため、これはクローン増幅(clonal amplification)といわれる。
【0095】
出発材料は、実質的に純粋な形態であるべきである。ポリヌクレオチドは、二本鎖でも一本鎖でもよいが、より好ましいのは二本鎖である。さらに、ポリヌクレオチドは、線状でも環状でもよいが、好ましい実施形態では、ポリヌクレオチドは環状である。環状形態のポリヌクレオチドは、当業者に周知の技術により、細菌、酵母、植物、または哺乳動物の細胞ののような生物由来のプラスミドDNAの調製により調製されてもよい[Maniatisら、(1989)]。反応容器内の種々の特定の核酸フラグメントの数は、少なくとも約100個、好ましくは少なくとも約500個、より好ましくは少なくとも約1000個である。
【0096】
出発材料(すなわち、ポリヌクレオチド)は、実質的に純粋な形態であるものの、ホモログまたは関連配列無しで同様に存在し得る。換言すると、最初の容器中のポリヌクレオチドはすべて同一であり得るが、これらはまた関連しているか、関連していない、すなわち異種であり得る。実際、本発明の実施は、出発材料の配列により影響されることはない。さらに、出発材料の配列は、既知であっても既知でなくてもよい。指向された進化の目的のため、必要とされるものは、ポリペプチドの機能を検出する方法(例えば、スクリーニングアッセイ)だけである。
【0097】
(ランダムな位置でのポリヌクレオチドの切断)
概して、核酸フラグメントは、多くの異なる方法で切断されてもよい。核酸フラグメントは、容易に入手可能なDNAseI、S1ヌクレアーゼ、P1または大豆ヌクレアーゼ、あるいはRNAseのようなヌクレアーゼで消化され得る。他の酵素、例えば、RAG1およびRAG2、トポイソメラーゼおよびインテグラーゼは、ポリヌクレオチドを切断することができる。核酸は、超音波処理法により、または小型のオリフィス(orifice)を有するチューブに通すことにより、ランダムに剪断され得る。照射(例えば、γ線照射または紫外線照射)の使用もまた、ポリヌクレオチドを切断することができる。化学薬剤(例えば、ブレオマイシンまたはメタンスルホン酸メチル(MMS))もまた、ポリヌクレオチドを切断できる。
【0098】
挿入または欠失を含有する、機能的に変異した遺伝子の生成について実質的な重要なことは、ポリヌクレオチドを少ない回数、通常は、1回と10回との間、好ましくは1回と5回との間、最も好ましくは1回切断することである。本発明は、反応容器中で1個のポリヌクレオチド当り1つの位置でのみ切断が起こるようにポリヌクレオチドを切断するための手段を提供する。重要なことは、本発明が、ポリヌクレオチドのほぼランダムな切断(すなわち、異なる分子中のいくつかの異なる位置での切断)のための手段を提供することである。切断は、二本鎖または一本鎖で起こり得る(すなわち、一本鎖末端または二本鎖末端を生じる)。ポリヌクレオチドを切断できる酵素の例は、DNaseI、S1ヌクレアーゼ、P1ヌクレアーゼだけでなく、トポイソメラーゼ、トランスポゾン、およびインテグラーゼを含む。切断は、トポイソメラーゼ、トランスポゾンおよびインテグラーゼなどの酵素を用いて、一過的に発生し得る。これらの酵素はポリヌクレオチドを一回または2回以上切断する。S1ヌクレアーゼは、通常ランダムな様式で二本鎖または一本鎖ポリヌクレオチドを切断するのに使用され得る。好ましい実施形態では、環状の二本鎖DNAについて、S1ヌクレアーゼがポリヌクレオチドを1回だけ切断し、2つのDNA末端を生じる(図4)。
【0099】
高い頻度で(すなわち、ポリヌクレオチド内のいくつかの位置で)DNAを切断する1つ以上の制限酵素を用いて、特定のポリヌクレオチドが1回だけ切断され、得られる集団が、1回だけ切断されたが、異なる位置で切断された異なるポリヌクレオチドを有するポリヌクレオチドを含有するように、核酸も部分的に消化され得ることもまた意図される。制限酵素を用いた切断は、完全にランダムではないかもしれないが、目的の遺伝的要素が異なった位置に十分に特異的な制限部位を有さない場合には、切断パターンは、実質的な多様性を生成するのに十分有用であり得る。
【0100】
ポリヌクレオチドの一回の切断は、通常ポリヌクレオチドを数回切断する他の代替的機構を介して達成され得ることが意図される。ポリヌクレオチドは、超音波処理法により、または、小型のオリフィスを有するチューブに通すことにより、ランダムに剪断され得る。照射(例えば、γ線照射または紫外線照射)の使用もまた、ポリヌクレオチドを切断可能である。これらの様式のいずれかが注意深く滴定され、精製手段が使用される場合、一回切断された分子を、実質的に純粋な形態で得ることができる(すなわち、一回切断された分子は、切断されていないかまたは複数に切断された分子から分離させて精製することができる)。
【0101】
さらに、DNAを切断しかつ再結合させるよう作用する酵素(例えば、トポイソメラーゼ、トランスポゾンおよびインテグラーゼ)は、ポリヌクレオチドを効果的に切断するために用いられ得る[Singhら、Proc Natl Acad Sci 94:1304−9(1997)]。これらの場合、切断工程および再結合工程はあわせられ得る。好ましくは、DNA末端が連結されるか、または切断の後、互いに物理的に接近している。これは、欠失事象または挿入事象の後に、間違った末端が互いに再連結することを防ぐためである。結合された末端を維持する1つの機構は、出発材料としての環状ポリヌクレオチドの使用によるものである。この場合、末端は、介在するポリヌクレオチド鎖により連結される。このため、再連結は、分子間に対して、分子内事象であり、そしてより高い効率で進行する。末端を接近状態に保つ他の機構は、タンパク質の架橋(例えば、クロマチン(すなわち、ヒストンまたは他のDNA結合タンパク質)を介するか、または再連結と切断とを一緒にする酵素(例えば、トランスポゾン、インテグラーゼまたはトポイソメラーゼ)を介する)である。あるいは、末端は、固体支持体に反対の末端(非切断末端)の連結を介して、互いに接近状態のままであると考えられ得る。
【0102】
スーパーコイルプラスミドDNAから構成される環状ポリペプチドの切断は、0.1〜100μg、好ましくは1〜10μgで、S1ヌクレアーゼのようなヌクレアーゼとともにインキュベートすることにより達成され得る。ヌクレアーゼは、10μlの反応物中で、0.1〜1000ユニット、好ましくは1〜100ユニットの量で存在し得る。反応温度は、0℃と100℃との間、好ましくは4℃と50℃との間であってもよい。反応時間は、30秒〜1時間で変化させることができるが、好ましくは約1分と30分との間である。線状化の程度は、図4のような、アガロースゲル上でプラスミドDNAを分析することにより測定することができる。線状DNAは、好ましくは、当業者に周知の多数の方法のいずれかにより、切断されていないDNAから精製されるべきである。このような方法は、アガロースゲル精製キット(Qiagen,Valencia,CA)、HPLC、カラムクロマトグラフィーなどの利用を含む。
【0103】
(ヌクレオチドの欠失)
ヌクレオチドの欠失は、種々の方法により、DNA末端で生成され得る。例えば、エキソヌクレアーゼ、例えば、エキソヌクレアーゼIIIは、DNA末端から3’から5’方向でヌクレオチドを除去するために用いられ得る。次いで、得られるDNA末端は、一本鎖エンドヌクレアーゼ、例えば、P1ヌクレアーゼ、S1ヌクレアーゼまたは大豆ヌクレアーゼを用いたDNAの消化により除去され得る、5’オーバーハングを含有する。Bal31ヌクレアーゼは、5’から3’だけでなく3’から5’の核分解(nucleolytic)活性を有する酵素であり、DNA末端からヌクレオチドを欠失させるために用いられ得る。さらに、いくつかのヌクレアーゼ、例えば、E.coli由来のDNAポリメラーゼ、KlenowフラグメントおよびTaqポリメラーゼは、エキソヌクレアーゼ活性を有し、DNA末端からの欠失の作製に用いられ得ると考えられ得る。すべての生物からの細胞抽出物は、ヌクレオチドを欠失させるよう作用することができるDNA修復酵素を含有し、したがって、純粋ではない細胞抽出物が、エキソヌクレアーゼ活性の供給源として用いられ得ると考えられ得る。特定の条件下ではエキソヌクレアーゼ活性を有し得ない他のヌクレアーゼは、他の条件下ではDNA末端での欠失を生じ得る。例えば、S1ヌクレアーゼは、高い酵素濃度で用いられると、短い欠失を生じることができる。さらに、DNA末端が「解ける(frayed)」ような、DNA分子の穏やかな変性は、一本鎖ヌクレアーゼ、例えば、S1ヌクレアーゼ、P1ヌクレアーゼまたは大豆ヌクレアーゼの適用の際に欠失を発生させることが意図される。
【0104】
好ましい実施形態では、欠失反応の条件は、各DNA末端で発生する個々の欠失の数が十分制御され得るように設定される。例えば、塩濃度を変え、pHを変え、温度を変え、または反応の他の任意の生化学的パラメータを変えることにより、多少の欠失が研究者の意図に従って発生するように、ヌクレアーゼ酵素の活性を変化させることができる(例えば、温度を低下させるか、または塩を増大させることにより、エキソヌクレアーゼの処理能力(processivity)を低下させ、より少ない欠失を発生させることができる)。図5は、異なる数の欠失をDNA末端に発生させることが可能な、条件の変更を示す。いくつかの場合、大きな欠失(すなわち、遺伝的要素中の大きなドメインが完全に除去される)が保証され得、他の場合、小さな欠失(すなわち、単一のアミノ酸、またはプロテアーゼ部位を含むもののような数個のアミノ酸が除去される)が好ましい。概して、欠失は、1〜1000個の数で得ることができ、より好ましくはこれらは1〜100個である。特定の場合には、記載されるように、欠失は、1〜10個の数であってもよい。
【0105】
ポリヌクレオチド中のランダムな位置での切断のために、得られるポリヌクレオチド中の欠失の位置はまた、ランダムな位置に配置される。また、残基が分子の一方の末端から欠失されるので、欠失の総数は、5’末端および3’末端で発生する欠失の合計に等しい。
【0106】
(ヌクレオチドの付加)
ランダムな位置のポリヌクレオチドに付加を作製するため、ポリヌクレオチドは、上述のように、必然的にランダムな位置で切断される。挿入の前に、ヌクレオチドが切断事象の間に生産されるDNA末端から欠失されてもよい。また、切断反応により形成されるDNA末端は、新たなヌクレオチドまたはポリヌクレオチドが付加される基質として用いられててもよい。
【0107】
いくつかの異なる機構が、ポリヌクレオチドの末端にヌクレオチドを付加するために存在する。例えば、ヌクレオチドは、化学的カップリングにより付加され得る。ポリメラーゼ、例えば、末端デオキシヌクレオチジルトランスフェラーゼは、DNA末端にヌクレオチドをセミランダムな様式で付加するために用いられ得る[Gauss&Lieber,Mol Cell Biol 1996 16:258−69(1996)]。また、切断工程は、トランスポゾンまたはインテグラーゼを挿入事象に用いる場合があり得るように、挿入事象と一緒にされ得る。
【0108】
E.coliリガーゼまたはファージT4リガーゼのようなリガーゼが、新たなポリヌクレオチドを親ポリヌクレオチドに共有結合させるために用いられ得る。好ましい実施形態では、ポリヌクレオチドは、遺伝的要素または遺伝的要素のフラグメントである。遺伝的要素は本質的にいくつかの方法で機能的であるので、遺伝的要素によって、得られるポリヌクレオチドが機能を有しやすくなる。遺伝的要素は、遺伝子、遺伝子の調節要素、または有用なドメインをコードする遺伝的要素であり得る。遺伝的要素は、cDNAライブラリーまたはゲノムDNAライブラリーなどの遺伝的要素のライブラリーであり得る。遺伝的要素のフラグメントは、ポリヌクレオチドをヌクレアーゼ、例えば、DNAseI、S1ヌクレアーゼ、P1または大豆ヌクレアーゼ、あるいはRNAseを用いて消化することにより生産され得る。他の酵素、例えば、制限酵素およびトポイソメラーゼもまた、ポリヌクレオチドをフラグメントに切断し得る。ポリヌクレオチドは、超音波処理法により、または小型のオリフィスを有するチューブに通すことにより、ランダムに剪断され得る。照射(例えば、γ線照射または紫外線照射)の使用もまた、ポリヌクレオチドをフラグメントに切断し得る。化学薬剤(例えば、ブレオマイシンまたはMMS)もまた、ポリヌクレオチドをフラグメントに切断し得る。
【0109】
遺伝的要素の集団または遺伝的要素のフラグメントを有するランダムな位置で切断された親ポリヌクレオチドと、T4 DNAリガーゼのようなリガーゼとを、適当な塩、緩衝液および温度条件下で混合することにより、遺伝的要素が親ポリヌクレオチドと元の切断事象の位置で共有結合することができることが意図される。したがって、親ポリヌクレオチド内のランダムな位置での挿入を含むポリヌクレオチドの混合物が生産される。各挿入の内容(すなわち、配列)は、遺伝的要素または遺伝的要素のフラグメントが同一である場合には同一であり得、遺伝的要素のフラグメントが非同一である場合には異なる。
【0110】
(DNA末端の再結合)
DNA末端は、DNA末端を、DNA末端でヌクレオチド間にホスホジエステル結合を形成させる、DNAリガーゼのような酵素とともにインキュベートすることにより、共有結合的に再結合され得る。リガーゼの例には、E.coli DNAリガーゼ、ファージT4 DNAリガーゼまたはヒトDNAリガーゼが含まれる。これらの酵素は、当業者に周知の条件下で、DNAの連結に用いられ得る。他の酵素もまた、DNA末端でヌクレオチド間に共有結合(ホスホジエステル結合のような)を作製することができる。このような酵素は、トポイソメラーゼ、トランスポゾン、インテグラーゼ、および他の再結合酵素である。他の機構が、DNA末端の結合に用いられ得、例えば、いずれの末端(すなわち、5’および3’末端の両方)の配列にハイブリダイズして、これらの末端を水素結合で「架橋」し得る配列のオリゴヌクレオチドの利用が用いられ得る。反対側の鎖上の介在配列は、ポリメラーゼ、例えば、E.coliポリメラーゼ、Klenowフラグメント、ファージT4ポリメラーゼまたはTaqポリメラーゼで満たされ得る。次いで、ニックは、上述にように、DNAリガーゼにより修復され得る。細胞抽出物もまた、リガーゼ活性を有し、細胞または核抽出物はDNA末端の再結合に用いられ得る。あるいは、DNA分子は、無傷細胞中に導入され得、細胞の機構がDNA末端を相同的または非相同的に手段により再結合させ得る。
【0111】
(ライブラリー組成物)
本発明は、以下の組成物を例とする新規なライブラリーを提供する。
【0112】
(欠失)
本発明は、ポリヌクレオチドの集団を提供し、この集団のメンバーは、単一のランダムな位置での欠失の存在により互いに異なる。このような単一の欠失のライブラリーは、少なくとも2個の分子、好ましくは100個の分子、最も好ましくは少なくとも約1000個の分子を含み得る。欠失ライブラリーは、1つのランダムな位置での少なくとも1個のヌクレオチドの欠失により少なくとも1個の他の分子と異なる、少なくとも1個の分子を含むべきである。各位置での欠失の数は、1〜1000個であり得るが、少なくとも1個であるべきである。欠失が、遺伝的要素の有害または不要な機能の除去を可能にすることが意図される。これらの機能には、プロテアーゼ部位、イオン結合ドメイン、阻害的転写因子のためのDNA結合配列、タンパク質の免疫原性ドメインなどが含まれ得る。
【0113】
さらに、本発明は、1つより多い位置での欠失を含有するポリヌクレオチドの集団を提供する。このようなライブラリーは、少なくとも2個の分子、好ましくは100個の分子、最も好ましくは少なくとも約1000個の分子を含むべきである。これらの複数の欠失ライブラリーは、1つより多いランダムな位置での少なくとも1個のヌクレオチドの欠失により少なくとも1個の他の分子と異なる、少なくとも1個の分子を含むべきである。複数の位置での欠失が、遺伝的要素の複数の有害または不要な機能の除去を可能にすることが意図される。これらの機能には、複数のプロテアーゼ部位、イオン結合ドメイン、阻害的転写因子のためのDNA結合配列、タンパク質の免疫原性ドメインなどの任意の組合せが含まれ得る。
【0114】
(挿入)
本発明は、ポリヌクレオチドの集団を提供し、この集団のメンバーは、単一のランダムな位置での挿入の存在により互いに異なる。挿入ライブラリーは、少なくとも2個の分子、好ましくは100個の分子、最も好ましくは少なくとも約1000個の分子を含み得る。挿入ライブラリーは、1つのランダムな位置での少なくとも1個のヌクレオチドの挿入により少なくとも1個の他の分子と異なる、少なくとも1個の分子を含むべきである。各位置での挿入の数は、1〜10,000個であってもよいが、好ましくは少なくとも1個である。例えば、毒素は、標的化された分子(例えば、抗体)に融合され得、重要な代謝経路の酵素モジュール(例えば、ポリケチドシンダーゼ)は、新たな方法で融合され得、または、結合ドメイン(すなわち、核酸結合ドメイン、イオン結合ドメイン、プロテアーゼ部位または他の翻訳後修飾モジュール)のような新たな機能は、既存の遺伝的要素中に組み込まれ得る。
【0115】
さらに、本発明は、1つより多い位置での挿入を含有するポリヌクレオチドの集団を提供する。このようなライブラリーは、少なくとも2個の分子、好ましくは100個の分子、最も好ましくは少なくとも約1000個の分子を含むべきである。これらの複数の挿入ライブラリーは、1つより多いランダムな位置での少なくとも1個のヌクレオチドの挿入により少なくとも他の1個の分子と異なる少なくとも1個の分子を含むべきである。本発明のこの実施形態により、遺伝的要素の新規な融合が発生可能となることが意図される。本発明のこの実施形態により、遺伝的要素の複数の新たな融合が発生可能となることが意図される。例えば、以下のものは、コンビナトリアル様式で、目的の遺伝子に融合され得る:毒素は、標的化された分子(例えば、抗体)に融合され得、重要な代謝経路の酵素モジュール(例えば、ポリケチドシンダーゼ)は、新たな方法で融合され得、または、結合ドメイン(すなわち、核酸結合ドメイン、イオン結合ドメイン、プロテアーゼ部位または他の翻訳後修飾モジュール)は、既存の遺伝的要素中に組み込まれ得る。
【0116】
(挿入および欠失の組合せ)
本発明は、ポリヌクレオチドの集団を提供し、そのメンバーは、単一のランダムな位置での欠失および挿入の組合せによって互いに異なる。このようなライブラリーは、少なくとも2個の分子、好ましくは100個の分子、最も好ましくは少なくとも約1000個の分子を含むべきである。これらの組合せライブラリーは、1つのランダムな位置での1個のヌクレオチドの挿入および少なくとも1個のヌクレオチドの欠失によって少なくとも1個の他の分子と異なる、少なくとも1個の分子を含むべきである。本実施形態により、異種ドメインを、目的の遺伝子中のドメインと置き換えることが可能となることが意図される。これに関して、新たな機能(例えば、リガンド結合または酵素触媒)が遺伝的要素に付与され得る。また、ネイティブな機能が、本実施形態を利用して強化され得る。
【0117】
さらに、本発明は、1つより多い位置での挿入および欠失を含有するポリヌクレオチドの集団を提供する。このようなライブラリーは、少なくとも2個の分子、好ましくは100個の分子、最も好ましくは少なくとも約1000個の分子を含むべきである。これらの組合せライブラリーは、1つのランダムな位置での少なくとも1個のヌクレオチドの挿入、および、1つのランダムな位置での少なくとも1個のヌクレオチドの欠失により、少なくとも1個の他の分子と異なる少なくとも1個の分子を含むべきである。本発明のこの実施形態により、古典的な指向された進化が可能となり、この進化では、ランダムな位置での複数回の挿入、ランダムな位置での欠失、および挿入と欠失の組合せからが生じ、各回の間で目的の遺伝子は、必要に応じて選択に供される。本実施形態により、遺伝的要素の機能の改善または変更が可能となる。
【0118】
(組成物の分析)
このようなライブラリーの組成物は、当業者に周知の機構により決定され得る。ライブラリーが挿入または欠失を含むか否かを判定するため、このライブラリーは、アガロースまたはアクリルアミドゲルの電気泳動によって分析されることが可能であり、サイズは、親配列と比較可能である。他の方法、例えば、HPLC、質量分析、カラムクロマトグラフィーは、ポリヌクレオチド間のサイズの差を同定するために使用され得る。本発明は、ランダムな位置の挿入または欠失に関するので、ライブラリーの組成物を決定するための最も明確な方法は、組成物内の典型的なポリヌクレオチドを配列決定に供することであり、この方法は当業者に周知である。典型的なクローンの配列の比較により、欠失または挿入が、ライブラリーの異なった分子中のランダムな位置で発生したかどうかを判定することができる。
【0119】
得られるライブラリーは、ライブラリー内に含まれる、得られた変異体を発現するためのビヒクルとして用いるための発現ベクター内に連結することができる。発現ベクターの性質は、「スクリーニング」の項において後述する。
【0120】
(目的の機能に関するスクリーニング)
目的の機能に関するポリヌクレオチドのライブラリーの試験では、ライブラリーは、適当な発現ベクター中に挿入されるべきである。あるいは、ライブラリーは、発現ベクター中に構築され得る(すなわち、ライブラリーが発現ベクターを含む)。クローニングに用いられるベクターは、所望のサイズのDNAフラグメントを受容する限り、重要ではない。DNAフラグメントの発現が所望される場合には、クローニングビヒクルは、宿主細胞中のDNAフラグメントの発現を可能にするために、DNAフラグメントの挿入部位の隣に転写シグナルおよび翻訳シグナルをさらに含むべきである。細菌細胞でのスクリーニングのために好ましいベクターには、プラスミドのpUCシリーズおよびpBRシリーズが含まれる。
【0121】
得られる細菌集団は、ランダム変異を有する、多くの組換えDNAフラグメントを含む。この混合された集団を試験して、所望の組換え核酸フラグメントを同定し得る。選択方法は、所望のDNAフラグメントに依存する。
【0122】
ベクターの選択は、本発明の方法に用いられるべきポリヌクレオチド配列のサイズおよび宿主細胞に依存する。鋳型は、プラスミド、ファージ、コスミド、ファージミド、ウイルス(例えば、レトロウイルス、パラインフルエンザウイルス、ヘルペスウイルス、レオウイルス、パラミクソウイルスなど)またはこれらの選択された部分(例えば、コートタンパク質、スパイク糖タンパク質、キャプシドタンパク質)であってもよい。特定の核酸配列が比較的大きい場合、これらのベクターは、より大きな核酸フラグメントを安定に遺伝させるので、例えば、コスミド、ファージミド、YACおよびBACが好ましい。
【0123】
リガンドに対して増加された結合効率を有するタンパク質をコードするDNAフラグメントが所望される場合、集団またはライブラリー中のDNAフラグメントの各々により発現されるタンパク質を、当該分野において公知の方法(すなわち、パンニング、アフィニティクロマトグラフィー)により、リガンドに対する結合能力に関して試験することができる。増加された薬剤耐性を有するタンパク質をコードするDNAフラグメントが所望される場合、集団またはライブラリー中のDNAフラグメントの各々により発現されるタンパク質を、宿主生物に薬剤耐性を付与する能力に関して試験することができる。所望のタンパク質についての知識が与えられた当業者は、容易に集団を試験し、タンパク質に所望の特性を有するDNAフラグメントを同定できる。
【0124】
本発明の状況において、用語「陽性のポリペプチド改変体」は、対応する導入(input)DNA配列から生産可能なポリペプチドと比較して改善された機能特性を有する、得られたポリペプチド改変体を意味する。このような改善された特性の例は、例えば、強められるか、または弱められた生物学的活性、増大された洗浄性能、熱安定性、酸化安定性、基質特異性、抗生物質耐性あるいは目的であり得る他の特性と同様に異なってもよい。
【0125】
したがって、陽性改変体の同定のために用いられるべきスクリーニング方法は、変化が望まれる問題のポリペプチドの特性、および、その変化が望まれる方向にあるポリペプチドの特性に依存する。
【0126】
所望の生物学的活性について選択するための、多くの適したスクリーニング系または選択系が、当該分野において記載されている。例えば、Strausbergら[Strausbergら、Biotechnology(NY)13:669−73(1995)]は、カルシウム依存的安定性を有するサブチリシン改変体に対するスクリーニング系を記載している。Bryanら[Bryanら、Proteins 1:326−34(1986)]は、強められた熱安定性を有するプロテアーゼに関するスクリーニングアッセイを記載している。
【0127】
当業者であれば、タンパク質のフラグメントがファージ表面上に融合タンパク質として発現される、ファージディスプレイ系(Pharmacia,Milwaukee,Wis.)を使用できることが意図される。組換えDNA分子は、その一部が組換えDNA分子によりコードされる、融合タンパク質の転写をもたらす部位でファージDNAにクローニングされる。組換え核酸分子を含有するファージは、細胞での複製および転写を受ける。融合タンパク質のリーダー配列は、融合タンパク質の、ファージ粒子の先端への輸送を指向する。このため、組換えDNA分子により部分的にコードされる融合タンパク質は、ファージ粒子上に表示され、上述の方法により検出および選択される。
【0128】
(核酸中の標的化された短い欠失に影響する方法)
ポリヌクレオチドに短い欠失を作る能力は、通常、DNA末端で作用するエキソヌクレアーゼの高い活性および処理能力により阻害される。DNA末端における大きな(すなわち、100塩基より多い)欠失を作るためのいくつかの方法が存在する[Sambrookら、(1989)]。しかし、1〜100塩基などの短い欠失、または、1〜10塩基のような非常に短い欠失を制御された様式で作る方法は、可能ではない。特定の部位にこのような欠失を作る能力は、タンパク質工学の分野において重要であり[Altamiranoら、Nature 403:617−22(2000)]、V(D)J組換え法の末端結合機構において強調されており、この方法は、抗体遺伝子に実質的多様性をもたらす[Smider&Chu,Sem.Immun.9:189−97(1997)]。
【0129】
(出発材料)
この欠失生成機構は、研究者にとって目的の、任意のポリペプチドに適用され得る。ポリヌクレオチドは、核酸、すなわち、RNAまたはDNAであってもよい。ポリヌクレオチドは、遺伝的要素、あるいは1つまたは複数の目的の遺伝子からなるDNAである場合が多い。出発材料は、天然の供給源から得てもよく、または、研究室で合成(例えば、遺伝子合成)されたポリヌクレオチドであっても、研究室で操作された天然の供給源由来のポリヌクレオチドであってもよい。ポリヌクレオチドのいくつかの供給源は、Genbank(http://www.ncbi.nlm.nih.gov:80/Genbank/index.html)などの公共のデータバンクを介して入手可能であるか、または、市販されている(Celera,Rockville,MD;Incyte,Palo Alto,CA;Clontech,Palo Alto,CA;Invitrogen,Carlsbad,CA)。
【0130】
核酸は、任意の供給源から、例えば、pBR322などのプラスミドから、クローニングしたDNAまたはRNAから、あるいは、細菌、酵母、ウイルスおよび植物または動物などの高等生物を含む任意の供給源由来の天然のDNAまたはRNAから得ることができる。DNAまたはRNAは、血液材料または組織材料から抽出され得る。鋳型ポリヌクレオチドは、ポリヌクレオチド連鎖反応(PCR)を用いた増幅によって得られ得る[Mullis、米国特許第4,683,202号(1987年);Mullisら、米国特許第4,683,195号(1987年)]。また、ポリヌクレオチドは、細胞中に存在するベクター中に存在してもよく、この細胞を培養し、当該分野において公知の方法によって、細胞から核酸を抽出することにより、十分な核酸が得られ得る。
【0131】
(ヌクレオチドの欠失)
ヌクレオチドの欠失は、種々の手段によりDNA末端において生成され得る。例えば、エキソヌクレアーゼIIIなどのエキソヌクレアーゼを用いて、DNA末端から3’から5’方向にヌクレオチドを除去することができる。得られるDNA末端は、P1ヌクレアーゼ、S1ヌクレアーゼ、または大豆ヌクレアーゼなどの一本鎖エンドヌクレアーゼを用いるDNAの消化により除去され得る5’オーバーハングを含有する場合が多い。他のエキソヌクレアーゼもまた、本発明において用いられ得る。Bal31ヌクレアーゼは、5’から3’の核分解活性ならびに3’から5’の核分解活性を有する酵素であり、DNA末端からヌクレオチドを欠失させるために用いられ得る。エキソヌクレアーゼTは、3’から5’の方向にヌクレオチドを除去し得る。エキソヌクレアーゼ7は、5’から3’方向のヌクレオチドを除去し得、ニックまたはギャップのように一本鎖末端で作用し得る。エキソヌクレアーゼIは、3’から5’方向での一本鎖DNAからのヌクレオチドの除去を触媒する。λエキソヌクレアーゼは、5’から3’方向に作用し、二重鎖DNAからの5’モノヌクレオチドの除去を触媒する、非常に進行性の酵素である。RecJは、5’から3’方向にDNAからのデオキシヌクレオチドモノリン酸の除去を触媒する、一本鎖DNA特異的エキソヌクレアーゼである。さらに、いくつかのポリメラーゼ、例えば、E.coli由来のDNAポリメラーゼI、Klenowフラグメント、およびTaqポリメラーゼは、エキソヌクレアーゼ活性を有し、DNA末端から欠失を作るのに使用可能であると考えられ得る。すべての生物由来の細胞抽出物は、ヌクレオチドを欠失させるように作用し得るDNA修復酵素を含有し、したがって、不純な細胞抽出物が、エキソヌクレアーゼ活性の源として使用可能であると考えられ得る。特定の条件下ではエキソヌクレアーゼ活性を有し得る他のヌクレアーゼは、他の条件下ではDNA末端での欠失を生産し得る。例えば、S1ヌクレアーゼは、高い酵素濃度で使用されると、短い欠失を生産し得る。さらに、DNA末端が「解ける」ような、DNA分子の穏やかな変性により、一本鎖エンドヌクレアーゼ、例えば、S1ヌクレアーゼ、P1ヌクレアーゼまたは大豆ヌクレアーゼの適用の際に、欠失の発生が可能になる。
【0132】
好ましい実施形態では、欠失反応の条件は、各DNA末端で発生する個々の欠失の数が、十分制御され得るように設定される。例えば、塩濃度および温度を変え、pHを変え、または、反応の他の任意の生物学的パラメータを変えることにより、多少の欠失が研究者の目的に依存して発生するように、ヌクレアーゼの酵素活性を変えることができる。最も際立って、かつ驚くべきことに、本発明者らは、温度を低下させること、および/または、塩を増大させることにより、エキソヌクレアーゼの処理能力を低下させ、より制御された小さい欠失が得られることを見出した。反応に用いられる塩は、いかなる塩であってもよい。塩の例としては、塩化ナトリウム、酢酸ナトリウム、塩化カリウムまたは酢酸カリウムが挙げられる。好ましくは、塩は、塩化ナトリウムまたは塩化カリウムのいずれかである。塩濃度は、10mM〜1.0Mの範囲であり得るが、好ましくは50mMと500mMとの間である。反応温度も、本発明では、変化し得る。温度は、0℃〜30℃の範囲であり得るが、好ましくは0℃と24℃との間である。図5は、異なった数の欠失をDNA末端上に発生させ得る、条件の変更を示す。いくつかの場合、大きな欠失(すなわち、遺伝的要素中の大きなドメインを完全に除去すること)が保証され得、他の場合、小さな欠失(すなわち、単一のアミノ酸、または、プロテアーゼ部位を含むものなどの数個のアミノ酸を除去すること)が好ましくあり得る。得られるポリヌクレオチドの集団は、開始配列の末端に、種々の量の欠失を含む。概して、欠失は、1〜1000個の数で得ることができ、より好ましくはその数は1〜100個である。好ましい実施形態では、欠失は、1〜30個、または、ひいては1〜10個の数であり得る。
【0133】
(DNA末端の再結合)
いくつかの場合、欠失を含有する分子のDNA末端を、第2のDNA末端と結合させて、これにより、今度は欠失が内部位置で発生させることが有用であり得る。連結されるべき2つの末端が同一のDNA分子に存在することが多く、その結果、得られる接続産物は環状ポリヌクレオチドである。DNA末端でヌクレオチド間にホスホジエステル結合を形成させるDNAリガーゼのような酵素とともにDNA末端をインキュベートすることにより、DNA末端は、再結合され得る。リガーゼの例としては、E.coli DNAリガーゼ、ファージT4 DNAリガーゼ、またはヒトDNAリガーゼが挙げられる。これらの酵素は、DNAを連結するための当該分野において周知の条件下で用いられ得る。他の酵素もまた、DNA末端でヌクレオチド間に共有結合(ホスホジエステル結合のような)を作ることができる。このような酵素は、トポイソメラーゼ、トランスポゾン、インテグラーゼ、および他の組換え酵素である。他の機構(例えば、その配列がいずれかの末端(すなわち、5’および3’末端の両方)の配列とハイブリダイズして、末端同士を水素結合で「架橋」することのできるオリゴヌクレオチドの使用)が、DNA末端の結合に使用可能である。対向する鎖上の介在配列は、ポリメラーゼ、例えば、E.coliポリメラーゼ、Klenowフラグメント、ファージT4ポリメラーゼ、またはTaqポリメラーゼで満たされ得る。次いで、ニックは、上記のようにDNAリガーゼにより修復され得る。細胞抽出物も、リガーゼ活性を含有し、細胞または核の抽出物は、DNA末端の再結合に用いられ得る。あるいは、DNA分子は、インタクトな細胞内に導入することができ、細胞の機構部分が相同的または非相同的手段によりDNAを再結合させ得る。
【0134】
(欠失組成物)
1つの実施形態では、本発明は、ポリヌクレオチドの組成物を提供し、この集団のメンバーがポリヌクレオチドの一方または両方の末端での欠失の存在により互いに異なる。欠失の数は、各末端で1〜100個の範囲であるが、より好ましくは1〜30個である。
【0135】
さらに、本発明は、特定の内部位置(すなわち、末端ではない)での短い欠失により互いに異なるポリヌクレオチドの組成物を提供する。この組成物は、欠失を有するポリヌクレオチドの組成物を、その末端において他のDNA末端と結合させることにより得られ、その結果、今度は欠失が内部に発生する。連結されるべき2つの末端が同一のDNA分子にしばしば存在し、その結果、得られる連結産物は、環状ポリヌクレオチドである。欠失の数は、各末端で1〜100個の範囲であり得るが、より好ましくは1〜30個である。
【0136】
本明細書中において参照される全ての参考文献および特許公開は、本明細書中に参考として援用される。
【0137】
上記開示から理解されるように、本発明は、広範な種々の用途を有する。したがって、以下の実施例は、例示を目的として呈示されるものであり、決して本発明についての限定として解釈されることを意図するものではない。
(実施例)
(実施例1:プラスミドのランダムな切断)
挿入または欠失を利用する分子進化技術では、遺伝子が、少なくとも一時的に、少数回切断される必要がある。必要に応じて、混合物内の各分子は、異なるランダムな位置で一回切断される。一回切断されたDNAを調製することはかなり困難であり、切断はランダムな位置で発生する。Biondiらは、DNaseIおよびDNAポリメラーゼを用いてニックを誘発し、次いでこれらのニックをさらに切断して、二本鎖の分解を生成する、面倒な方法を記載している[Biondiら、Nucleic Acids Res 26:4946−52(1998)]。このプロセスは、冗長かつ時間がかかる塩化セシウムの勾配精製およびリンカーの連結工程を必要とし、分子進化のような、ハイスループット分子生物学的技術に一般的に適用できない。
【0138】
一本鎖エンドヌクレアーゼを用いてDNAのランダムな位置での二本鎖の分解を誘発する戦略は、これまで用いられてはいなかった。これは、S1、P1または大豆ヌクレアーゼのような一本鎖ヌクレアーゼが、緊密なスーパーコイルDNAの一本鎖領域を特異的に切断し、これによりニックを生成することを理由としていた。ニックは、これらの酵素についての自然の基質であり、次いで、二本鎖の分解を作り出す切断は、同じ反応で発生し得る。切断に続いて、プラスミドはもはやスーパーコイル状態ではないので、一本鎖領域はもはや存在せず、このためDNAは、もはや酵素にとっての基質ではない。それゆえ、切断は生じ、一度のみしか発生しない。本実施例は、この仮説の利用性を例示するものである。
【0139】
ポリヌクレオチドをランダムな位置で切断できる機構を例示するため、プラスミドpLacZi(Clonetech,Palo Alto,CA)を用いた。このプラスミドを、DH10B E.coli細胞(Invitrogen,Carlsbad,CA)中で増殖させ、プラスミドを、Qiagenマキシプレップカラム(Qiagen maxiprep column)(Qiagen,Valencia,CA)により調製した。200ng/μlのプラスミドDNAを、0.4、2.0、10または50ユニットのS1ヌクレアーゼ(Promega,Madison,WI)とともに、1×S1緩衝液(50mM酢酸ナトリウム、pH4.5、280mM NaCl、4.5mM ZnSO4)中で10分間、室温でインキュベートした。EDTAを0.025Mまで添加して、70℃で10分間加熱することにより、反応を停止させた。タンパク質を、等量のフェノール:クロロホルム:イソアミルアルコール(25:24:1)で2度、等量のエーテルで一度抽出して除去し、酢酸ナトリウムで沈殿させ、水に再懸濁させた。
【0140】
切断したpLacZiを、1.5%アガロースゲル電気泳動により分析した(図4、パネルA)。S1ヌクレアーゼで切断されたプラスミドをpLacZiを一度切断するClaIで切断されたpLacZiとともに移動することを、観察した。これにより、S1ヌクレアーゼは環状DNA分子を線状化させることができる。S1ヌクレアーゼが配列特異的な様式でDNAを切断することは知られていないが、S1によるプラスミドの切断は部位特異的でないと決定することは重要であった。このために、S1切断により生成された線状プラスミドをゲル精製するか(図4、パネルB、レーン5)、または精製してさらにClaIで切断した(レーン6)。コントロールは、スーパーコイルプラスミド(レーン2)、ClaIで線状化されたプラスミド(レーン3)またはS1ヌクレアーゼで線状化したが精製していないプラスミド(レーン4)を含んでいた。S1/ClaI切断プラスミドを、1つのスメアとして観察し、これはS1がプラスミドのいくつかの異なる位置で切断していることを示す。S1が1つの位置しか切断しない場合、S1/ClaI切断プラスミドは、2本のバンドとして移動する;S1が2つの位置で切断する場合、S1/ClaIプラスミドは3本のバンドなどとして移動する。本実施例の重要性は、ポリヌクレオチドが一度(すなわち、環の線状化)、しかも一度だけ、異なった複数の位置で切断されることが可能である。
【0141】
(実施例2:LacZ中の部位での欠失)
ヌクレオチド欠失が、遺伝子の構造分析を目的として、かつ、ヌクレオチド配列分析を目的としてなされている。一般にこれらの欠失は、100個のヌクレオチドをはるかに超える範囲の大きさである。通常の条件下では、例えば、エキソヌクレアーゼIIIは、1分間当り100個より多い塩基を除去する[Sambrookら、(1989)]。しかし、小型の欠失を作製する能力は、タンパク質中の小型のドメインを変化させるか、または、有害な機能を除去するのに有用である。ポリヌクレオチドの末端に小型の欠失を作るため、エキソヌクレアーゼIIIを、種々の塩(図5)および温度の条件下で用いた。pLacZi由来の、蛍光標識した232塩基対のPCR産物を、100mM、150mMおよび200mMのNaClに、10μlの66mM Tris−Cl(pH7.4)、0.66mMのMgCl2中の10UのエキソヌクレアーゼIII(New England Biolabs,Beverly,MA)の存在下で、15℃で5分間の反応中に暴露した。EDTAを0.025Mまで添加することにより反応を停止させ、等量のフェノール:クロロホルム:イソアミルアルコール(25:24:1)で一度、等量のエーテルで一度抽出し、酢酸ナトリウムで沈殿させた。DNAを、20μlの脱イオン化したホルムアミドに再び懸濁させ、0.5μlを、製造者の推薦に従い遺伝子スキャン(genescan)の設定にセットしたABI 373シーケンサー(Perkin−Elmer,Foster City,CA)中の6%ポリアクリルアミド変性ゲルに流した。
【0142】
約25個のヌクレオチドを、100mM NaClの条件下(図5、第2パネル)で、15個までのヌクレオチドを150mM NaClで、数個のヌクレオチドを200mM NaCl(下のパネル)で除去することができた。
【0143】
pLacZi中のClaI部位はLacZ遺伝子のコード領域に存在している。この部位は、遺伝子自体内に短い欠失を作るのに用いられ、次いでさらにPCRにより分析して、欠失が作られた程度を決定した。さらに、欠失を含むプラスミドを、40μg/mlのX−Galを含むLB寒天プレート上で選択し、LacZ遺伝子の機能性を決定した。pLacZiプラスミド(10μg)を、200μlのClaI中で線状化し、次いで、20UのS1ヌクレアーゼ400μl中でインキュベートして、2bpの5’オーバーハングを除去した。さらに、線状化したプラスミドを濃縮し、ウルトラフリーMC膜(ultrafree MC membrane)(30kD除去用、Millipore,Bedford,MA)を通して濾過し、100Uの仔ウシ腸ホスファターゼ(New England Biolabs,Beverly,MA)を含む容量400μlの1×仔ウシ腸ホスファターゼ緩衝液中に入れ、室温で45分間インキュベートした。プラスミドを、等量のフェノール:クロロホルム:イソアミルアルコール(25:24:1)で、等量のエーテルで一度抽出し、酢酸ナトリウムで沈殿させ、水に再懸濁させた。次いで、このプラスミドを、実施例1に記載したのと同様に、エキソヌクレアーゼIIIとともに、100mM、150mMまたは200mMのNaClの存在下で15℃で5分間、10μl反応物でインキュベートした。対照アームでは、プラスミドは、エキソヌクレアーゼIIIとともにインキュベートせず、欠失の無い状態での脱リン酸化プラスミドの再連結の発生頻度について調べた。エキソヌクレアーゼIII反応の5分後、S1ヌクレアーゼ50Uを1×S1緩衝液中に含む混合物を添加した。この混合物を、室温で15分間さらにインキュベートした。EDTAを0.025Mまで添加し、70℃で10分間加熱することにより、この反応を停止させた。次いで、DNAを等量のフェノール:クロロホルム:イソアミルアルコール(25:24:1)で一度、等量のエーテルで一度抽出し、酢酸ナトリウムで沈殿させ、1.0UのT4 DNAリガーゼ(Invitrogen,Carlsbad,CA)を含む10μlの1×リガーゼ緩衝液中に再び懸濁させた。連結反応物は15℃で12時間インキュベーションした。E.coli株DH10B(Invitrogen,Carlsbad,CA)の電気泳動を、1.0μlの連結混合物とともに行った。細胞を、40μg/mlのX−Galおよび100μg/mlのアンピシリンを含むLB寒天プレート上で平板培養し、30℃で一晩インキュベートした。表1に平板培養実験の結果を示す。
(表1.部位特異的欠失後のコロニー特性)
【0144】
【表1】
脱リン酸化プラスミドがエキソヌクレアーゼIIIに暴露されない場合(第1行、表1)、バックグラウンドが見られないことに、注意すべきである。いくつかの青色および白色のコロニーが、種々の塩濃度でのエキソヌクレアーゼIII処理で見出されている。興味深いことに、少なくとも2/3の再連結がフレーム外(out of frame)にあるべきであるので、青色/白色の比率の理論的最大値は0.33である。しかし、本実験での青色/白色比率は0.33をわずかに超えており、塩濃度が増大するにつれ増大するように思われる。この傾向は、一端からの1塩基対の欠失がインフレームでの再連結の発生を可能にし、塩が増大するにつれ欠失がより容易でなくなる事実に起因し得る。この結果の統計的有意性は分析されておらず、本当の発生頻度は0.33により近いものであるかもしれない。
【0145】
6つのコロニーを、ClaI部位に隣接するプライマーを用いてPCRにより分析した。図6にこれらの結果を示す。上側のパネルに、pLacZi由来の野生型の312塩基対のフラグメントを示す。クローン1は、291塩基のインフレーム欠失(291塩基のPCR産物)を含有し、青色の表現型を維持する。クローン2は、4塩基対のフレーム外の欠失(308塩基のPCR産物)を含有し、白色の表現型を有する。クローン3は、9塩基対のインフレーム欠失(303塩基のPCR産物)を含有し、白色の表現型を有する。クローン4は、6塩基対のインフレーム欠失(306塩基のPCR産物)を含有し、白色の表現型有する。クローン5は、7塩基対のフレーム外欠失(305塩基のPCR産物)を含有し、白色の表現型を有する。クローン6は、3塩基対の欠失(309塩基のPCR産物)を含有し、青色の表現型を有する。より短い欠失はより厳密性の低い表現型をもたらすと思われ得るが、本実験はこのことが必ずしも当てはまらないことを示す。クローン1は、7個のアミノ酸を含む欠失を含有するが機能を維持する。一方で、クローン3および4は、インフレームでのより短い欠失を含有するが機能を維持しない。さらに、本実施例は、機能的配列空間を探索するための欠失技術(deletional technology)の能力を示す。
【0146】
(実施例3:LacZへの挿入)
LacZ遺伝子へのランダムDNAの挿入は、DNaseIを用いてCHO細胞由来cDNAをフラグメント化し、続いてこれらのフラグメントを線状化pLacZi中に連結することにより達成された。cDNAは自明ながら機能的であるので、cDNAの使用が機能性タンパク質の獲得可能性を最適化するであろうことが意図される。CHO細胞のcDNA(5μg)を、0.001ユニットのDNaseIを用いて、40mM Tris−Cl(pH7.4)および10.0mM MgCl2を含む緩衝液中で、室温で5分間フラグメント化させた。EDTAを0.025Mまで添加し、10μgのプロテアーゼKの存在下で70℃まで加熱することにより、反応を停止させた。DNAを、等量のフェノール:クロロホルム:イソアミルアルコール(25:24:1)で、等量のエーテルで一度抽出し、酢酸ナトリウムで沈殿させた。ClaIおよびS1ヌクレアーゼで線状化したプラスミドを上記のように脱リン酸化し、次いで、再び等量のフェノール:クロロホルム:イソアミルアルコール(25:24:1)で、等量のエーテルで一度抽出し、酢酸ナトリウムで沈殿させた。ランダムcDNAフラグメントをプラスミドDNAに挿入するために、線状化し脱リン酸化したプラスミド0.2mgをcDNAフラグメント1ngとともに、T4DNAリガーゼ(1.0U)の存在下で、10mlの反応量で15℃12時間インキュベートした。コントロールとして、線状化プラスミドを、リガーゼとともにcDNAフラグメントの非存在下でインキュベートし、cDNAフラグメントを、リガーゼとともに線状化ベクター非存在下でインキュベートした。次いで、DH10B E.coliを、10μlの各連結反応混合物とともに電気泳動させた。
【0147】
いくつかのE.coliコロニーを、X−Galプレート上で白色、中間または青色の表現型のいずれかを示す実験のベクター+挿入物アームにおいて同定した。cDNAフラグメントに連結されたClaIで線状化されたベクターから発生したコロニーのClaI部位についてのPCRから、100〜300塩基対のサイズの挿入を含有するいくつかのクローンが明らかとなった。これらのうちの3つを図7に示す。このように、cDNAフラグメントの遺伝的要素への挿入が、本発明で達成可能である。
【0148】
(実施例4:ランダムな位置での機能的変化)
lacオペロンは、遺伝的要素が容易に研究されるモデル系である。酵素β−ガラクトシダーゼは、LacZ遺伝子によりコードされるが、通常、環境中にラクトースが存在している場合にのみ産生される。酵素レベルの制御は、転写レベルで達成される。lacリプレッサータンパク質は、LacZのATG開始部位の上流のオペレーター配列に結合し、RNAポリメラーゼによる転写を阻害する。しかし、ラクトースの存在下では、リプレッサーはオペレーターから除去され、転写が進行し得る。プロモーター活性化の機構は、インデューサーであるラクトースのlacリプレッサーへの結合、および、そのオペレーターに対する親和性を劇的に低下させるアロステリック変化の発生によるものである。研究室での設定では、E.coliを比色分析用基質X−Gal上で平板培養することにより、LacZ転写を評価することができ、この基質は、β−ガラクトシダーゼにより加水分解された場合にはコロニーを青変させる。オペレーターは、ラクトースのアナログであるIPTGを用いて抑制解除可能であり、このIPTGは加水分解されず、かつ、lacリプレッサーに結合することによりLacZの転写を強力に誘導する。
【0149】
ランダム欠失が遺伝子機能に影響を与える能力を調べるため、pBluescriptII KS+プラスミドを、実施例1および2に記載したように、S1ヌクレアーゼで線状化し、ゲル精製し、脱リン酸化し、エキソヌクレアーゼIIIで消化させた。20ng/μlの線状化プラスミドを、10UのエキソヌクレアーゼIIIとともに、66mM Tris−Cl(pH7.4)、0.66mM MgCl2緩衝液中で、15℃にて5分間インキュベートし、次いで、50mM酢酸ナトリウム(pH4.5)、280mM NaCl、4.5mM ZnSO4および10UのS1ヌクレアーゼを含む1×S1溶液を添加し、室温で15分間インキュベートした。EDTAを0.025Mまで添加して、等量のフェノール:クロロホルム:イソアミルアルコール(25:24:1)で、等量のエーテルで一度抽出することにより、反応を停止させ、酢酸ナトリウムで沈殿させた。DNAを、1.0UのT4DNAリガーゼを含む1×T4DNAリガーゼ緩衝液中に再懸濁させ、15℃で12時間インキュベートした。次いで、連結反応物(1μl)を用いて、lacリプレッサータンパク質を産生するE.coli株TOP10F’(Invitrogen,Carlsbad,CA)をエレクトロポレーションした。E.coliを、インデューサーとしてのIPTGを含むかまたは含まずに、かつX−Galが存在するLBプレート上でインキュベートし、β−ガラクトシダーゼ活性を測定した。さらに、pBluescriptプラスミドを、IPTGの存在下または非存在下で、X−Galを含むプレート上で平板培養した。表2に実験の結果を示す。
(表2.β−ガラクトシダーゼの転写における機能性変化)
【0150】
【表2】
いくつかのコロニーは、欠失がランダムな位置で作られた実験アームにおける、インデューサーであるIPTGの非存在下で、LacZを転写する能力を獲得した。さらに、いくつかのコロニーは、IPTGの存在下で機能性β−ガラクトシダーゼを産生する能力を失った。pBluescript/欠失アームからのIPTGの存在下における1つの白色のコロニーについて配列決定し、翻訳開始部位に8個の塩基対の欠失を有することがわかった。この配列を以下に示し、ここで、メチオニンのコドンをコードする翻訳開始部位(ATG)に下線を付している。
【0151】
【化1】
(それぞれ配列番号1および配列番号2)
このように、プラスミドのランダムな切断、その後のエキソヌクレアーゼIIIにより作製される短い欠失により、遺伝的要素の調節領域およびタンパク質コード領域における機能性変化を引き起こすことができる。次いで、これらの変化は、その後機能性アッセイで検出可能である。
【0152】
【表3】
【図面の簡単な説明】
【図1】図1は、分子進化を選抜するための従来法である、DNAシャッフリングプロセスの図である。目的の遺伝子のホモログをフラグメント化して、このホモログからの一本鎖フラグメントが伸長反応において互いにプライム(prime)することができるように、変性および再アニーリングに供する。次いで、完全長遺伝子の増幅により、ハイブリッド遺伝子ライブラリーが生成される。次いで、遺伝子スクリーニングを適用して、変化した遺伝子または改善した遺伝子を選択する。
【図2】図2は、コンビナトリアル多様性を生成するV(D)J組換え、および結合部多様性を生成するDNA末端結合のプロセスを示す、免疫グロブリン重鎖遺伝子座の図である。
【図3】図3は、ポリヌクレオチドにおいてランダムな位置でヌクレオチド欠失およびヌクレオチド挿入を生じる方法の例を示す図である。標的遺伝子を切断して、各々がこの遺伝子中のランダムな位置でフラグメント化される遺伝子プールを生産する。残基は、DNA末端で欠失される(左)か、または挿入されて(右)、ランダムな位置で欠失、挿入、またはその両方を含むライブラリーを生産し得る。
【図4】図4は、ポリヌクレオチドのランダムな切断を示す図である。パネルA(図4A)では、DNAプラスミドpLacZi(Clontech,Palo Alto,CA)を、切断しなかった(レーン2)か、単一切断制限酵素ClaIで切断した(レーン3)か、または漸増濃度のS1ヌクレアーゼで切断した(レーン4〜7)。レーン1および8は、λ/HindIII DNAマーカーである。パネルB(図4B)では、pLacZiプラスミドを、切断しなかった(レーン2)か、ClaIで切断した(レーン3)か、またはS1ヌクレアーゼで切断した(レーン4)。S1で切断したpLacZi試料をゲル精製し、レーン5に泳動したか、またはClaIで切断してレーン6で泳動した。等量のDNAを、レーン2〜4(1μg)、およびレーン5〜6(100ng)で泳動した。レーン6のスメアは、S1による切断が、部位特異的ではないことを示す。レーン1および7は、λ/HindIII DNAマーカーを含有する。
【図5】図5は、DNA末端に短ヌクレオチド欠失を生じる方法の例を示す図である。エキソヌクレアーゼIIIは、塩依存性反応で、蛍光標識した232bpのDNAフラグメントの末端からヌクレオチドを欠失させる。塩が増加するにつれ、欠失数が減少する。
【図6】図6は、LacZ遺伝子中のヌクレオチドの欠失を示す図である。プラスミドpLacZiをClaIで切断し、図5に記載するようにエキソヌクレアーゼIIIで処理して、再連結させて、E.coliにエレクトロポレーションして、比色ラクトースアナログX−Galを含有するプレート上で平板培養した。青色または白色を有するクローンを取り出し、LB中で増殖させて、DNAを調製した。ClaI部位に隣接するプライマーを用いて、プラスミドをPCRに供した。ここで1つのプライマーを蛍光標識した。PCR産物を、ABI 373DNAシーケンサーで、6%変性アクリルアミドゲル上で泳動し、Ganescanソフトウェア(Perkin Elmer,Foster City,CA)で分析した。最上部パネルは、312bpフラグメントを生産する野生型LacZ遺伝子を用いたPCRを示す。クローン1〜6には、多様な短い欠失が存在していた。クローン1および6は、青色表現型を有し、2〜5は、白色表現型を有した。
【図7】図7は、pLacZi中に挿入を含有する3個のクローンを示す1.5%アガロースゲルである。CHO細胞のcDNAを、DNaseIでフラグメント化して、pLacZiのClaI部位に連結させて、E.coliにエレクトロポレーションし、X−Galプレート上で平板培養した。ClaI部位に隣接するプライマーを用いたプラスミドDNAのPCRにより、3個のクローンを分析した。1〜3と表示したレーンは、異なるサイズの挿入を含有するクローンであり、レーン4は、pLacZiである。最初のレーンおよび最後のレーン中のDNAは、ΦX174/Hae III DNAマーカーであり、右側に示した塩基対のサイズを有する。
(発明の分野)
本発明は、指向された進化に関し、遺伝子操作およびタンパク質操作に適用することができる方法を包含する。指向された進化を用いて、遺伝子またはタンパク質の機能を改善または変化させることを目標に、遺伝子配列を進化させる。指向された進化は、医薬品開発、バイオレメディエーション(bioremediation)、バイオリーチング(bioleaching)、および化学産業を含むが、これらに限定されない多くの分野に適用することができる。
【0002】
(発明の背景)
近年、インビトロでの進化プロセスをシミュレートし、それにより特定遺伝子中で遺伝子変化を誘導して、それらの機能を変化または改善させる試みがなされてきた。遺伝子を変化させる技術がここ数年の間に知られてきたが、一般に、これらの方法を成功させるために、コードタンパク質構造および機能に関する詳細な特徴が必要とされた。DNAシャッフリング技術は、この障壁をある程度まで克服し、ここ数年でいくつかの遺伝子を首尾よく進化させるために適用されてきた[Minshull&Stemmer、米国特許第5,837,458号(1998年)]。
【0003】
天然の進化は、環境中の遺伝子に関して、何百万年もかけて起こった。インビトロ進化は、数日または数週間で天然プロセスを模倣することを試みるものである。インビトロ戦略が成功するためには、進化理論のいくつかの様相を理解しなくてはならない。第1に、配列空間の概念が、既定長のタンパク質の考え得る配列の総数を規定する[Kauffman,(1993)]。したがって、
【0004】
【数1】
であり、式中、配列空間Sは、考え得る配列数であり、Nは、タンパク質長である。インビトロ進化実験では、最も改善または変化した活性を有するタンパク質の分画を特定するために、目的のタンパク質のS配列を探索することが最も望ましい。中程度の50個のアミノ酸を有するタンパク質は、2050個の考え得る異なる配列のSを有することがすぐに理解でき、その数は、現在の分子生物学技術による分析に関して事実上無限である。第2に、ほとんどのアミノ酸変化が、タンパク質にとって有害であることが明らかである。これらの変化は、タンパク質を不活性にし得るか、適切なフォールディングの崩壊を引き起こし得るか、またはインビボでのタンパク質もしくはmRNAに対する不安定性を引き起こし得る。有害な変異に対する有利な変異の平均比率は、105分の1であると推定されている[Radmanら、Ann,N.Y.Acad.Sci.870:146−55(1999)]。これに関して、変異率は、それらの機能を改善するために遺伝子を変異させる場合に重要なパラメータである。変異率が高すぎると、有害な変異が、有利な変異とともにcisで生じ、その状態により、有利な変異を含有する得られたタンパク質が、付随する有害な変異に起因して不活性であるため、有利な変異を有する遺伝子を特定することが不可能となる。第3に、より高い変異率の結末を克服するために、相同組換えを利用して、二重クロスオーバー事象により有害な変異を除去し得る。第4に、任意のインビトロ進化技術は、タンパク質の機能を改善または変化させる配列を特定するために、選択スクリーニングを必要とする。
【0005】
現在の分子進化の主な障壁は、目的のタンパク質に関する配列空間を効率的に探索することができないことである。これに関して、1つより多い残基が異なる配列を生成および特定する能力が非常に重要であり、ここで、これらの配列は、タンパク質機能に対してさらな効果を有し得る。このさらなる効果は、アミノ酸相互依存にて記載し得る。例えば、残基iに単一の変異を有するタンパク質は、jでの付随する変異もまた存在しない限り、検出可能な機能のいかなる増大をも有さない場合がある。これに関して、進化が成功するためには、標的配列の考え得る2変異改変体すべてが、サンプリングされ、機能改善に関して試験されるべきである。一般に、長さNのタンパク質のR変異体数は、以下:
【0006】
【数2】
によって表され、ここで、Rは、変異改変体の数であり、20は、各位置での考え得るアミノ酸数を表す。したがって、長さ50のタンパク質に関しては、490,000個の異なる2変異改変体が存在する。
【0007】
配列空間のこれらの統計学的解析において、臨界値は、タンパク質長である(すなわち、R変異改変体数は、タンパク質長に依存する)。しかし、本質的には、任意の目的のタンパク質長は、三次元空間のアミノ酸残基の整列ほど、その機能にとって重要ではない場合がある。実際に、「触媒作業空間(catalytic task space)の仮説的概念は、この原理を説明すると提唱されている(Kauffman,1993)。タンパク質長Nを変化させることなくアミノ酸残基を変化させることは、Nを増加または減少させるいくつかの方法において、タンパク質の三次元構造に影響を及ぼし得ない。あるいは、Nの変化は、タンパク質の生物学的機能を全く変化させ得ない。相同タンパク質の事実上任意のファミリーの分析により、メンバーは、時には実質的な挿入または欠失を伴って異なる長さを有するが、区別不可能な生物学的機能を保持し得ることが明らかである。したがって、上記式は、おそらく、生物学的機能の改善または変化に関して探索する場合、スクリーニングされるべき様々なR変異改変体の正確な見解を提供しない。研究室では、タンパク質のR変異体の近隣と、ヌクレオチドがあらゆる位置で付加または欠失される多くの変異体数の全てを探索することが最適である。
【0008】
欠失の場合には、D変異体欠失数は、以下:
【0009】
【数3】
で表され、式中、Nは、タンパク質の初期長であり、Dは、欠失が起きる位置の数である。アミノ酸付加の場合には、考え得るすべての付加に関する同様の式が、20個のアミノ酸のいずれかが任意の位置で付加され得るという事実を説明し:
【0010】
【数4】
であり、式中、Aは、考え得る付加変異体数である。付加および欠失変異体の場合では、これらの式はともに、唯一のアミノ酸が各位置で付加または欠失されると仮定している。しかし、インビトロ分子進化に関しては、各位置で付加または欠失した1個、2個、3個、・・・C個全ての数のアミノ酸を探索することが最適である。したがって、欠失変異体に関して、各位置で欠失された可変アミノ酸を有する配列数は、以下:
【0011】
【数5】
であり、式中CDは、各位置で欠失したアミノ酸数を表し、Dは、欠失が起きる位置の数である。付加変異体に関して、式は、以下:
【0012】
【数6】
となり、式中、CAは、各位置での付加したアミノ酸数であり、Aは、付加が生じる位置の数である。
【0013】
現在の分子生物学技術のみが、空間全体の分画を、目的のタンパク質に関して生成およびサンプリングすることを可能にするため、生成されるべき実験空間について記載する式を定義することができる。この式はまた、ライブラリー構築技術の改善のモニタリングを可能とし、タンパク質機能に関連する空間の解析を可能にする。実験的に探索されるべき空間全体を、以下:
【0014】
【数7】
として定義することができ、ここで、アミノ酸は、様々な組合せおよび順列で、他の残基に対して変異される(SR)か、欠失される(SCD)か、または付加される(SCA)。もちろん、現在の分子化学技術により、ライブラリーを創出することが可能であり、ここでR=1であればSR=Nであり、D=1であればSCD=Nであり、A=1であればSCA=20Nである。続いて、N=50のタンパク質について、この仮説的ライブラリーは、20*N3=2.5×106個の異なる配列を有し、ここで1つの位置での変化、欠失および付加の順列すべてが表される。
【0015】
タンパク質進化に関する配列空間に関する上記議論は、種々の方法で、進化配列のインビトロ操作に適用してもよい。本質的に、酵素ファミリーの異なる触媒活性の進化は、大きく2つのカテゴリー:1)活性部位のアミノ酸は同一であるが、構造フォールド(fold)の差異が酵素に異なる基質特異性をもたせるもの[Perona&Craik,J.Biol.Chem.272:29987−90(1997)]、および2)酵素構造は同一であるが、活性部位の残基の差異が、酵素に異なる反応を触媒させるもの[Babbitt&Gerlt,J.Biol.Chem.272:30591−4(1997)]に類別することができる。前者の例は、セリンプロテアーゼファミリーであり、後者の例は、エノラーゼスーパーファミリーである。
【0016】
これらのカテゴリー間の差異は、取るに足らないことのように思えるが、それらは、分子進化の方法および配列空間の概念にとって重要な意味を持つ。類似の構造フォールドを有するファミリーの酵素に関して、触媒機構のために触媒活性部位が同一残基を必要とするようであるため、タンパク質長全体にわたって配列空間をサンプリングする分子進化アプローチは、酵素の特異性を変化させる最適な戦略であるようである。しかし、第2の型の酵素に関しては、タンパク質の全長にわたって探索する配列空間を増加することはおそらく必要ではない。それよりも、重要な触媒ドメインの配列空間サンプリングを増加させることが、分子進化プロセスを最適化する。これに関して、全遺伝子配列にわたって展開される205個の配列空間をサンプリングするよりも、20個のアミノ酸それぞれに対して重要な5個のアミノ酸を変化させ、このより限定された空間(205個)をサンプリングすることがより良好である。さらに、重要な領域における考え得る付加または欠失の変異体と同数をサンプリングすることはまた、インビトロ進化プロトコルの考え得る成功に寄与する。したがって、第2の型の酵素ファミリーに属する遺伝子の分子進化を最適化する方法は、非常に重要であり、かつ堅固な技術。
【0017】
遺伝子ドメインの交換(swapping)は、生体分子の新たな機能または改善された機能を進化させるために効率的な手段である。単一ヌクレオチド残基の変化は、遺伝子およびタンパク質機能に影響を及ぼし得るものの、遺伝子中の複数残基の大量の交換が、タンパク質機能に劇的に影響を及ぼし得る。例えば、E.coliおよびSalmonellaは、高度に関連した細菌種であるが、これらの遺伝的内容の差異は、単一残基の変化ではなく遺伝子交換事象にほぼ完全に起因する。さらに、大量のDNAの変換が遺伝子を創出する交換事象は、凝固カスケードのような経路で数回起きたと考えられ、ならびに転位により新規転写カセットを創出することが考えられる[Bell,(1997);Patthy,(1999)]。
【0018】
天然に存在する分子進化の周知の例は、免疫系での抗体産生の基礎を成すものである。哺乳類の前リンパ球(pre−lymphocyte)では、天然の分子進化が日常的に首尾よく生じる。抗体は、混乱させるアレイの種々の抗原を結合することが可能であるが、類似のアミノ酸配列および二次構造を有している。抗体遺伝子は、遺伝子セグメントとして生殖系列で整列される(図2)。リンパ球成熟中、これらのセグメント(可変または「V」、多様性または「D]、および結合性または「J」と呼ぶ)は、V(D)J組換えと称したプロセスにおいて互いに並置され、機能的抗体またはT細胞受容体遺伝子を創出する。複数のVセグメント、Dセグメント、およびJセグメントは、相当量の多様性を可能とし、したがって、種々の抗原結合特異性が、リンパ球の最終レパートリーで創出される。この機構により創出された多様性を、コンビナトリアル多様性(combinatorial deversity)と称する。別の型の多様性もまた、V(D)J組換え中に創出され、これは、コンビナトリアル多様性と同様に重要である[Davis&Bjorkman,Nature 334:395−402(1988)]。この多様性を結合多様性と称し、それは、ヌクレオチドが遺伝子セグメントの結合部で損失または獲得される場合に創出される。重要なことに、これらの結合部は、抗原と接触する抗体分子の領域をコードし、したがって、この型の多様性は、多様性であるが機能的な免疫系を創出するために重要である。
【0019】
免疫系によって利用される2つの型の多様性は、分子進化の実施に関して、以下の方法で特徴付けられ得る。免疫グロブリン遺伝子におけるコンビナトリアル多様性の生成は、複数の機能性V遺伝子セグメント、D遺伝子セグメントおよびJ遺伝子セグメントを提供することによって配列空間全体のサンプリングが可能となり、その各メンバーは、配列がわずかに異なるが、依然としてセグメントのファミリーの他のメンバーに対して相同である。これに関して、V遺伝子セグメント、D遺伝子セグメントおよびJ遺伝子セグメントの組合せ再配列は、新規抗体遺伝子を生成するために、「ドメイン交換」事象として機能する。結合多様性の生成は、連結されるべきDNAの末端にランダムヌクレオチドを付加または欠失させる機構により、抗原を接触するのに重要な残基で配列空間のより大きな局所的サンプリングを可能にする。
【0020】
遺伝子進化に関する上述の問題、すなわち莫大な配列空間の探索における困難、ランダム変異誘発の有害な変異の優勢、およびアミノ酸相互依存に起因して、研究室で機能的配列空間を探索する堅固な方法を考案することが困難であった。ライブラリー形式で変異タンパク質を創出するのに現在広範に使用される方法は、誤りがちなポリメラーゼ連鎖反応[Caldwell&Joyce,(1992);Gramら、Proc Natl Acad Sci 89:3576−80(1992)]、およびカセット変異誘発[Arkin&Youvan,Proc Natl Acad Sci 89:7811−5(1992);Hermesら、Proc Natl Acad Sci 87:696−700(1990);Oliphantら、Gene 44:177−83(1986);Stemmer&Morris,Biotechniques 13:214−20(1992)]であり、これらの方法では最適化される特定領域が、合成的に変異誘発されたオリゴヌクレオチドで置き換えられる。あるいは、宿主細胞の変異誘発遺伝子(mutator)系統が、変異頻度を加算するために使用されてきた[Greenerら、Mol Biotechnol 7:189−95(1997)]。各場合において、「変異雲(mutant cloud)」[Kauffman,(1993)]は、元の配列中のある種の部位付近に生成される。
【0021】
誤りがちなPCRは、長い配列にわたって低レベルの点変異をランダムに導入するために、低忠実度の重合条件を使用する。誤りがちなPCRをまた使用して、未知の配列のフラグメントの混合物を変異誘発し得る。誤りがちなPCRは、dITPの存在下でdNTPの個々の濃度を変化させることによって、遺伝子をランダムに変異させることができる[Caldwell&Joyce,(1992):Leung&Miyamoto,Nucleic Acids Res 17:1177−95(1989);Speeら、Nucleic Acids Res 21:777−8(1993)]。
【0022】
しかし、コンピュータシミュレーションは、点変異単独では、多くの場合緩やかすぎて、連続した配列進化に必要なブロック変化を可能にし得ないことを示唆した。公開されている誤りがちなPCRプロトコルは一般に、0.5〜1.0kbより長いDNAフラグメントの信頼性高い増幅に不適切であり、それらの実際の適用は限られる。さらに、誤りがちなPCRの繰り返しのサイクルは、中立変異の蓄積を引き起こし、それは例えば、タンパク質を免疫原性にし得る。
【0023】
オリゴヌクレオチド指向性変異誘発では、短い配列が、合成的に変異誘発されたオリゴヌクレオチドで置き換えられる。このアプローチは、遠位変異の組合せを生成せず、したがって有意にコンビナトリアルではない。莫大な配列長に対して限定されたライブラリーサイズは、タンパク質最適化のために多数回の選択が回避できないことを意味する。合成オリゴヌクレオチドによる変異誘発は、各回の選択後に個々のクローンを配列決定し、続いてファミリーに類別し、単一ファミリーを任意に選択し、そのファミリーをコンセンサスモチーフへと縮小させる必要があり、そのコンセンサスモチーフは、再合成され、単一遺伝子に再挿入され、続いてさらに選択される。このプロセスは、統計学的ボトルネックを構成し、それは多数回の変異誘発について集中的に労力を有し、また実用的ではない。
【0024】
制限部位を組込むランダムプライマーまたは部分的縮重プライマーを利用する飽和変異誘発方法についても記載されている[Hillら、Methods Enzymol 155:558−68(1987);Oliphantら、Gene 44;177−83(1986);Reidhaar−Olsonら、Methods Enzymol 208:564−86(1991)]。
【0025】
「カセット」変異誘発は、変異タンパク質のライブラリーを創出するための別の方法である[Bockら、米国特許第5,830,720号(1995年);Christou&McCabe、米国特許第5,830,728号(1998年);Hillら、Methods Enzymol 155:558−68(1987);Millerら、米国特許第5,830,740号(1998年);Shiraishi&Shimura,Gene 64:313−9(1988);Stemmer&Crameri、米国特許第5,830,721号(1998年)]。カセット変異誘発は典型的に、部分的にランダム化された配列で、鋳型の配列ブロック長を置き換える。したがって、得られ得る最大の情報内容は、カセットのランダム化された部分中のランダム配列の数に統計学的に限定される。
【0026】
プロトコルもまた開発されており、それにより、オリゴヌクレオチドの合成は、非天然ホスホルアミダイトで「ドープ(dope)」され、ランダム変異誘発を標的化する遺伝子セクションのランダム化を生じる[Wang&Hoover,J Bacteriol 179:5812−9(1997)]。この方法により、ランダム置換率を維持しながら、位置の選択の制御が可能となる。
【0027】
ZaccoloおよびGherardi(1999)は、ピリミジンヌクレオチシドアナログおよびプリンヌクレオチシドアナログを利用するランダム変異誘発方法について記載している[Zaccolo&Gherardi,J Mol Biol 285:775−83(1999)]。この方法は、セファロスポリン、セフォタキシムに対する触媒速度の増加を伴う −ラクタマーゼを示す置換変異を達成するのに成功した。Creaは、「ウォークスルー(walk through)」方法を記載し、ここでは、既定のアミノ酸が、あらかじめ選択された位置で標的配列に導入される[Crea,米国特許第5,798,208号(1998年)]。
【0028】
挿入変異および/または欠失変異により標的遺伝子を変異させる方法が開発されている。挿入変異は、staphylococcalヌクレアーゼの内部に蓄積され得ることが実証された[Keefeら、Protein Sci 3:391−401(1994)]。開発された欠失変異誘発方法の例としては、エキソヌクレアーゼ(例えば、エキソヌクレアーゼIIIまたはBal31)の利用、または点欠失を組み込むオリゴヌクレオチド指向性欠失によるものが挙げられる[Nerら、Nucleic Acids Res 17:4015−23(1989)]。さらに、Lietzは、ランダム配列を有するオリゴヌクレオチドが挿入および欠失を誘導するためにPCRと組合わせられ得る方法について記載する。この技術による機能の強化は示されておらず、過剰変異誘発(すなわち、ポリヌクレオチド1つ当たり多すぎる挿入または欠失を作製する)の容量が、この方法では重要である[Lietz,米国特許第6,251,604号(2001年)]。
【0029】
インビトロでタンパク質を進化させるのに最も頻繁に使用される技術は、「DNAシャッフリング」として知られている。この方法では、遺伝子改変のライブラリーは、遺伝子の相同配列をフラグメント化し、そのフラグメントを互いにランダムにアニーリングさせ、ポリメラーゼを用いてオーバーハングを充填することにより創出される。次に、完全長遺伝子ライブラリーは、ポリメラーゼ連鎖反応(PCR)により再構築される。この方法の有用性は、アニーリングの工程に生じ、それにより相同配列は、互いにアニーリングし得、両方の出発配列の特性を有する配列を産生し得る。実際に、この方法は、相同性であるが、いくつかの位置で有意な差異を含む2つ以上の遺伝子間の組換えに影響を及ぼす。いくつかの相同配列を用いるライブラリーの創出により、ランダムに変異した単一出発配列を用いる場合よりも多くの配列空間をサンプリングすることが可能となることを示した[Crameriら、Nature 391;288−91(1998)]。この効果は、進化の年月が、異なる種のホモログ間の種々の有利な変異または中立の変異に関してすでに選択されていたという事実に起因するようである。ホモログから出発すると、次いで、スクリーニングされるべきライブラリーの創出において有害な変異数をかなり限定する。ホモログの有利な位置をコンビナトリアルに再配列すると、明らかに生化学反応を触媒するのに最適な二次タンパク質構造を可能にすることができる。得られた進化タンパク質は、出発配列各々に起因する明確な特徴を含有するようであり、選択後、劇的に改善された機能を生じる。
【0030】
DNAシャッフリング技術の変法が考案された。一プロセスは、「付着伸長(staggered extension)」プロセス、またはStEPと呼ばれる。伸長プライマーにより創出されるフラグメントのプールを再構築するのではなく、完全長遺伝子を鋳型の存在下で直接アセンブリする。StEPは、変性、続く極端に省略されたアニーリング/伸長工程の繰り返しサイクルから構成される。各サイクルでは、伸長フラグメントを、相補性に基づいた種々の鋳型にアニーリングさせ得、さらに少し伸長して、「組換えカセット」を創出することができる。この鋳型転換により、ほとんどのポリヌクレオチドは、異なる親遺伝子由来の配列を含有する(すなわち、新規組換え体である)。このプロセスは、完全長遺伝子が形成するまで繰り返される。それに続いて、任意の遺伝子増幅工程を行うことができる[Arnoldら、米国特許第6,177,263号(2001年)]。
【0031】
別の技術では、初期DNAのフラグメント化は、標的遺伝子の付加物(adduct)形成を誘導することで、伸長反応中のポリメラーゼの早発性終結により達成することができる[Short、米国特許第5,965,408号(1999年)]。異なる技術では、融合遺伝子のライブラリーを生成するために2つのホモログの各々に漸増性切断を誘導することにより、ライブラリーが創出され、ライブラリーの各々が、各ホモログからのドメインを含有する[Ostermeierら、Nat.Biotechnol.17:1205−9(1999)]。このアプローチの利点は、以前の方法のアニーリング工程が省略されるため、出発配列間の有意な相同性が必要とされないことである。しかし、選択技術をライブラリーに適用する後に、この技術の変法が実際に改善された遺伝子機能の生成を引き起こすか否かは明らかではない。
【0032】
種々の生物体由来の遺伝子の対立遺伝子を用いる遺伝子シャッフリングのこれまで記載されてきた方法は、コンビナトリアル多様性を生じさせるが、出発配列に見出される相同性により限定される。さらに、これらの方法は、抗体遺伝子セグメントのV(D)J結合により形成される結合多様性を生成する機構を提供しない。本発明は、指向性様式またはランダム様式のいずれかでタンパク質配列または核酸配列由来の残基を付加および欠失させることで、結合多様性に類似した機構を利用する。本発明はまた、コンビナトリアルV(D)J組換えにより生成されるコンビナトリアル多様性に類似した「遺伝子交換」事象を提供する。これは、遺伝子をインビトロで進化させる手段を大いに強化する。
【0033】
(発明の要旨)
本発明は、以下の工程:
(a)ポリヌクレオチド中にランダムにヌクレオチド残基を付加または欠失させて、付加または欠失を含有するポリヌクレオチドのライブラリーを生成する工程;および
(b)必要に応じて、工程(a)のポリヌクレオチドのプールを、所望の機能または特徴をコードするポリヌクレオチドを特定することが可能な選択手順に供する工程、
による核酸配列の指向された分子進化を包含する。工程(a)および(b)は、必要に応じて反復し得る。本発明の方法により生成されるライブラリーもまた、記載され、そして意図される。
【0034】
独自に、本発明は、タンパク質二次構造に有意に影響を及ぼす配列を含む配列空間のサンプリングを可能とし、したがって進化した遺伝子中の変化した機能または改善した機能を特定する蓋然性を高めることが可能である。さらに、本発明は、他の現在の技術によりサンプリングすることができない配列空間のサンプリングを可能にする。さらに、本発明を用いて創出したポリヌクレオチドのライブラリーは、他の現在の技術を利用して得ることができない。
【0035】
いくつかの方法および組成物が、以下に記載されそして意図される。本発明の1つの方法は、遺伝的要素の配列中の異なる位置にヌクレオチド欠失を有するポリヌクレオチド配列のライブラリーを生成するための方法であって、以下の工程:
(a)この該遺伝的要素を含む複数コピーの環状ポリヌクレオチドを、ランダムな切断に供して、複数の線状ポリヌクレオチドを獲得する工程であって、このポリヌクレオチドの各々は、少なくとも1つの3’末端および5’末端を有する、工程;および
(b)工程(a)由来の上記ポリヌクレオチドを、このポリヌクレチドのDNA末端の1つから少なくとも1つのヌクレオチドを取り除くプロセスに供して、欠失ポリヌクレオチド配列のライブラリーを生成する工程であって、このライブラリーは、異なるランダムな位置に欠失を有する複数の欠失ポリヌクレオチド配列を含む、工程、を包含する。さらに所望される場合、工程(b)由来のポリヌクレオチドが、上記3’末端および5’末端を互いに共有結合するプロセスに供され得、そして上記ポリヌクレオチドのライブラリーは、目的の機能について選択するプロセスにさらに供され得る。欠失ポリヌクレオチドのライブラリーは、2個より多くかまたはそれ以上、例えば、少なくとも10個、20個もしくは30個またはそれ以上の欠失を含んでもよく、あるいはさらには各々が他と異なる位置にランダム欠失を有する50〜100個の別個のヌクレオチドが得られてもよい。作製される欠失数は、出発材料および技術者の目標に依存する。いくつかの実施形態では、欠失ポリヌクレオチドのライブラリーは、少なくとも1個、2個、3個、4個、もしくは5個またはそれ以上の別個のヌクレオチドの非常に短い欠失を含む。異なる実施形態では、ライブラリーは、50〜100個またはそれ以上のヌクレオチドのより大きな欠失を含んでもよい。別の実施形態では、環状ポリヌクレオチドの複数コピーの組成物は、遺伝的要素に対する天然に存在するホモログを含まない。さらに、工程(a)および(b)は、任意に反復され得る。別の任意の方法は、工程(b)で欠失位置にヌクレオチドを挿入するプロセスを包含する。
【0036】
各々異なる3’末端および5’末端を有する、複数の(好ましくは2個より多い、より好ましくは5個より多い、最も好ましくは10個より多い)線状ポリヌクレオチドのライブラリーを含む実質的に純粋な組成物であって、環化される場合には各々の線状ポリヌクレオチドが他のものと同一である組成物について、記載されそして意図される。
【0037】
異なるランダム欠失を有することによってのみ各々が他と異なる、少なくとも2個の(好ましくいは5個より多い、より好ましくは10個より多い)欠失ポリヌクレオチドのライブラリーを含む実質的に純粋な組成物もまた、記載されそして意図される。必要に応じて、このような欠失ポリヌクレオチドはさらに、欠失位置に挿入された少なくとも1つのヌクレオチドを含む。
【0038】
本発明の別の方法は、遺伝的要素中のランダムな位置にヌクレオチド付加を有するポリヌクレオチド配列のライブラリーを生成するための方法であって、以下の工程:
(a)この遺伝的要素を含む複数コピーの環状ポリヌクレオチドの組成物を、ランダムな切断に供して、複数の線状ポリヌクレオチドを獲得する工程であって、このポリヌクレオチドの各々は、少なくとも1つの3’末端および5’末端を有する、工程;および
(b)工程(a)由来のポリヌクレオチドを、このポリヌクレチドの末端の1つに少なくとも1つのヌクレオチドを付加するプロセスに供して、付加ポリヌクレオチド配列のライブラリーを生成する工程であって、このライブラリーは、異なるランダムな位置に付加を有する複数の付加配列を含む、工程、
を包含する。さらに、所望される場合、工程(b)由来の付加ポリヌクレオチドは、上記3’末端および5’末端を互いに共有結合するプロセスに供され得る。必要に応じて、上記ポリヌクレオチドのライブラリーは、目的の機能について選択するプロセスに供され得る。
【0039】
本明細書に記載される方法のいずれかにおいて、切断は好ましくは、エンドヌクレアーゼ、好ましくはS1の使用により起きる。この方法は、付加ポリヌクレオチドのライブラリーが、各々が他と異なる位置にヌクレオチドのランダム付加を有する任意数の異なるポリヌクレオチド、例えば、少なくとも5個、10個、20個または30個の別個のポリヌクレオチドを含むことを可能にする。本発明の1つの実施形態では、環状ポリヌクレオチドの複数コピーの組成物は、遺伝的要素に対する天然に存在するホモログを含まない。必要に応じて、この方法の工程(a)および(b)は、反復され得る。別のオプションは、工程(b)での付加点でヌクレオチドを欠失させるプロセスを包含する。任意数のヌクレオチドは、出発分子および技術者の目標に応じて、工程(b)で付加され得、例えば1〜3個、3〜50個、もしくは50〜100個またはそれ以上のヌクレオチドが、工程(b)で付加され得る。
【0040】
異なるランダム付加を有することでのみ各々が他と異なる、少なくとも2個(好ましくは、少なくとも5個、最も好ましくは、少なくとも10個)の付加ポリヌクレオチドのライブラリーを含む、実質的に純粋な組成物が、意図される。
【0041】
さらに、驚くべきことに、本発明は、ポリヌクレオチドの末端で短い欠失を作製して、末端に短い欠失(1〜100個、好ましくは1〜35個、最も好ましくは1〜10個)を有するポリヌクレオチドの集団を生産する方法を提供する。次いで、このような欠失を有するDNA末端を他のDNA末端と共有結合させることができ、特定の内部位置に欠失を含有するポリヌクレオチドのライブラリーを生成することができる。多くの場合、連結されるべき2つの末端は、得られた連結産物が環状ポリヌクレオチドを含むように、同一DNA分子上に存在する。このような方法および組成物は、タンパク質工学および指向された進化の領域で重要である。
【0042】
(発明の詳細な説明)
遺伝子交換(swapping)事象は、高分子の進化における主要な駆動力(driver)を構成する。交換事象は、ヌクレオチドの挿入、欠失、または置換を含み得る。交換事象は、相同組換えを介して発生し得るが、抗体遺伝子セグメントに用いられるV(D)J組換えおよびDNA末端結合機構において発生するように、非相同的手段によっても発生し得る[Smider&Chu,Sem.Immun.9:189−97(1997)]。分子進化に関する現在の技術は、遺伝子交換のために一般的に適用可能な非相同的手段を提供するものではない。
【0043】
本発明の適用には、改善した機能または変化した機能を有する新規な遺伝的要素の産生が含まれる。これらの遺伝的要素は、かなりの商業的価値を有し得る。例えば、遺伝的要素はタンパク質製剤の産生を強化し得る。遺伝的要素は、モノクローナル抗体、または病気を処置するために用いられる酵素などのタンパク質製剤をコードし得る。さらに、遺伝的要素は、化学品製造などの工業プロセスにおいて重要な酵素をコードし得るか、あるいは洗濯用界面活性剤(すなわち、プロテアーゼ、リパーゼまたはエステラーゼ)のような製品中に用いられ得る。さらに、遺伝的要素は、病原菌耐性のための手段を提供する、または、植物種による新規な栄養素の産生を可能にするといったような、農業における重要な用途を有し得る。さらに、遺伝的要素は、新規な抗生物質、色素または他の低分子のような、ヒトへの使用のための新規な製品を生産するため、微生物において用いられ得る。このように、その機能を改善または変化させるための遺伝的要素の改変は、いくつかの異なる産業に無数の適用を有する。
【0044】
本発明を記載する目的のために、以下の用語は有用であり、かつ、以下のような意味を有する。
【0045】
(定義)
用語「塩基」は、アデニン、グアニン、チミン、シトシンまたはウラシルのいずれかからなる核酸成分をいう。さらに、「プリン」は、アデニンまたはグアニンのいずれかを指し、「ピリミジン」は、チミン、シトシンまたはウラシルのいずれかをいう。
【0046】
用語「ヌクレオシド」は、ピリミジンまたはプリンのペントース環(例えば、リボースまたはデオキシリボース)との共有結合を含む分子をいう。
【0047】
用語「ヌクレオチド」は、ヌクレオシドのリン酸エステルをいう。
【0048】
用語「ポリヌクレオチド」は、ホスホジエステル結合のような結合を介して、少なくとも1個の他のヌクレオチドの1つの3’ヒドロキシルに共有結合したあるヌクレオチドの少なくとも1個の5’ヒドロキシルを含有する分子をいう。ポリヌクレオチドは必然的に、以下に定義されるような、「残基」を含有する「位置」からなる。
【0049】
ポリヌクレオチド配列またはポリペプチド配列に関する場合、用語「位置」は、ポリヌクレオチドまたはポリペプチド鎖中の目的の残基の場所をいう。例えば、ポリヌクレオチド配列中の「位置」は、少なくとも1個の他のヌクレオチドに関する、ポリヌクレオチド鎖中のヌクレオチドの場所として定義される。例えば、単純なポリヌクレオチドTGにおいて、Tは位置1(自身に関して)であり、Gは位置2(位置1のTに関して)である。最も遠位の5’ヌクレオチドを基準として標識し、位置1として標識することが慣例であることが多い。DNAのような、遺伝子をコードする二本鎖のポリヌクレオチドでは、時に、遺伝子の翻訳開始部位が位置1として標識されることが多い。これはしばしば、ATGの翻訳開始配列におけるアデニンである。ATGからの5’に配置された位置は、負の位置(例えば、−11、−35など)が与えられ、ATGに対して3’に配置された位置は正の位置が与えられる。当業者は、用語「位置」の性質を、ポリヌクレオチドの配列における番号付けスキームに関するものとして理解する。「配列」は、各位置を占める残基の構成に起因する記号列(string)をいう。例えば、配列ATGは、塩基アデニンがチミンの直前の位置を占め、チミンがグアニンの直前の位置を占めることを意味する。「特定の位置」は、その配列および構成が公知である少なくとも2個のヌクレオチド間のポリヌクレオチド中の位置をいう。
【0050】
ポリヌクレオチドまたはポリペプチドに関する場合、用語「残基」は、ポリヌクレオチドについてはプリンヌクレオチドまたはピリミジンヌクレオチドをいい、ポリペプチドについてはアミノ酸をいう。
【0051】
「遺伝的要素」は、機能をコードするポリヌクレオチドの配列を意味する。例えば、「遺伝的要素」は、ポリペプチド配列をコードし得、プロモーター機能、エンハンサー機能、翻訳開始部位または停止部位、あるいはRNAスプライシング部位などをコードし得る。遺伝的要素は、他の遺伝的要素と作動可能に連結することができ、例えば、プロモーターは、タンパク質をコードする遺伝的要素と作動可能に連結して、目的の細胞型でのタンパク質の発現を可能にする。用語「遺伝子」および「目的の遺伝子」は、ポリペプチドをコードすることができるポリヌクレオチドをいう。
【0052】
ポリヌクレオチドに関する用語「交換」または「遺伝子交換」は、以下のいずれかを意味する:1)ポリヌクレオチド中の連続した位置を占める少なくとも2個の残基の欠失の発生、または2)ポリヌクレオチドへの連続した位置を占める少なくとも2個の残基の付加の発生、または3)ポリヌクレオチド中の連続した位置を占める少なくとも2個の残基の、他の残基との置換。
【0053】
ポリヌクレオチドに適用される場合、用語「ヌクレオチド欠失」は、ポリヌクレオチドが、得られるポリヌクレオチドを親の配列、野生型配列または他の参照配列と比較した場合、ポリヌクレオチド鎖中の1以上の位置から1個以上の特定の残基が除去されたことを意味する。
【0054】
用語「ヌクレオチド挿入」または「ヌクレオチド付加」は、親の配列、野生型の配列、または他の参照配列と比較した場合、ポリヌクレオチドがポリヌクレオチド鎖に付加された特定の残基を有し、これにより少なくとも1個の元の残基がポリヌクレオチド中の新たな位置を現在占めていることを意味する。
【0055】
用語「ポリヌクレオチド配列のライブラリー」は、ポリヌクレオチドの混合物をいい、ここで、この混合物中の少なくとも1つの配列が少なくとも1つの他の配列と、配列の構成または長さにおいて異なっており、例えば、2つの配列を比較した場合に少なくとも1つの位置が異なるヌクレオチドによって占められているか、または、他方の配列と比較した場合に少なくとも1つのヌクレオチド位置がもう一方の配列中に存在しない、ポリヌクレオチドの混合物をいう。
【0056】
用語「DNA」は、デオキシリボ核酸をいう。当業者は、DNAに関して本明細書中で記載されている操作がRNAにも適用し得ることを理解する。
【0057】
用語「DNA末端」または末端は、ホスホジエステル結合が分解したDNA鎖中の位置をいう。一本鎖DNAの末端では、1個のヌクレオチドが他の1個のヌクレオチドと共有結合しているのみである。「二本鎖DNA末端またはRNAの末端」は、分子がもはや二本鎖でない、二本鎖DNA分子またはRNA分子における位置をいう。一般に、DNA末端は当業者に認識可能である。二本鎖DNAの末端は、5’オーバーハング、3’オーバーハングまたはヘアピン構造を有する平滑部分として特徴付けられる。DNA末端は5’リン酸基を含有してもしなくてもよい。
【0058】
本明細書中で使用される場合、用語「切断」は、ホスホジエステル結合のような2個のヌクレオチドの間の結合の開裂をいう。
【0059】
用語「環状ポリヌクレオチド」は、二本鎖DNA末端が全く存在しないポリヌクレオチドをいう。環状ポリヌクレオチドは一本鎖であっても二本鎖であってもよい。しかし、環状ポリヌクレオチドは一本鎖DNA末端を含有していてもよい。環状ポリヌクレオチドは、一本鎖DNA末端が存在するが互いにハイブリダイズした二本鎖分子の2つの鎖を水素結合が維持し、その結果二本鎖DNA末端が互いに接近した2つの一本鎖末端の存在により形成されない場合に存在する。このような環状二本鎖ポリヌクレオチドは、「ニック(nicked)」と呼ばれることが多い。
【0060】
用語「線状ポリヌクレオチド」は、少なくとも1つの、しかしほとんどは2つのDNA末端を含有するポリヌクレオチドである。線状ポリヌクレオチドは、一本鎖であっても二本鎖であってもよい。
【0061】
ポリヌクレオチドに適用される場合、用語「ランダム」または「ランダムな位置」は、任意の特定の残基位置が選択され得るプロセスをいう。本明細書中で用いられるランダムは、ヌクレオチドの切断点または位置のすべてが等しい頻度で選定(select)または選択される(chosen)ことを意味しない。むしろランダムは、プロセスの予測不可能な性質に関し、すなわち、ある事象がどこで発生するのか、または、任意の塩基がどの位置を有するかを作業者が演繹的に予測できない。最終的に、利用可能な位置または塩基についてランダムとなるべきプロセスに関して、すべての位置が切断のために利用可能である必要はない。例えば、長さNのポリヌクレオチドは、操作により影響を受けるその位置(すなわち、1、2、・・・N)のいずれかまたは全てを有し得る。残基の付加(挿入)または欠失では、ポリヌクレオチドは必然的に共有結合(例えばホスホジエステル結合)は切断されねばならず、その後その残基は欠失されるかまたは付加される(すなわち、位置の総数はそれぞれ増加するかまたは減少する)。長さNのポリヌクレオチド中の「ランダムな位置での欠失」と記載する際、任意またはすべてのN(環状ポリヌクレオチド中)またはN−1(線状ポリヌクレオチド中)のヌクレオチド間の共有結合(すなわち、ホスホジエステル結合)が分解し、末端における少なくとも1個のヌクレオチドが再連結に先立って除去されることを意味する。それゆえ、「ランダムな位置での欠失」を引き起こすプロセスでは、ポリヌクレオチドの最終的な長さ(N、すなわち位置の数)は必然的に減少する。同様に、長さNのポリヌクレオチド中の「ランダムな位置での挿入」と記載する際、任意またはすべてのN(環状ポリヌクレオチド中)またはN−1(線状ポリヌクレオチド中)のヌクレオチド間の共有結合(すなわち、ホスホジエステル結合)は分解し、少なくとも1個の新たなヌクレオチド(すなわち、新たな位置)が再連結に先立って末端に付加されることを意味する。それゆえ、「ランダムな位置での挿入」を引き起こすプロセスでは、ポリヌクレオチドの最終的な長さ(N、すなわち位置の数)は必然的に増加する。「ランダムな位置での欠失」および「ランダムな位置での挿入」を含むプロセスの組合せにより、ポリヌクレオチドの最終的な長さを不変に維持することが可能な場合もある(すなわち、付加が欠失を相殺し、最終的な位置の数が同じに維持されるが、その位置を占めるヌクレオチドが異なり得る)。長さNのポリヌクレオチド中の「ランダムな切断」または「シングルランダム分解(single random break)」と記載する場合、単一のポリヌクレオチド分子中の残基位置間のN(環状ポリヌクレオチド中)またはN−1(線状ポリヌクレオチド中)の共有結合のいずれか1つが切断されることを意味する。したがって、ポリヌクレオチドの多くのコピーを含む1つの容器中で、シングルランダム分解が種々の分子の種々の位置で発生し得る。
【0062】
本明細書中で使用される場合、「実質的に純粋な」とは、対象種が、存在する優先種であり(すなわち、モルを基準とした場合、組成物中に他のいかなる個別の高分子種よりもより多く存在している)、好ましくは、実質的に精製された分画が、存在するすべての高分子種の少なくとも約50%(モルを基準として)を対象種が含有する組成物であることを意味する。一般に、実質的に純粋な組成物は、組成物中に存在するすべての高分子種の約80〜90%を超えて構成する。最も好ましくは、対象種は、基本的に均一になるまで精製され(組成物中に従来の検出方法により汚染種を検出することができない)、ここで、この組成物は、基本的に単一の高分子種からなる。溶媒種、低分子(500ダルトン未満)および元素イオン種は、高分子種とはみなされない。
【0063】
用語「相同(homologous)」または「相同(homeologous)」は、1つの一本鎖核酸配列が相補的な一本鎖核酸配列にハイブリダイズし得ることを意味する。ハイブリダイゼーションの程度は、配列間の同一性の量、および後述するように温度や塩濃度といったハイブリダイゼーションの条件を含む多くの要因に依存し得る。好ましくは、同一性の領域は約5bpを超え、より好ましくは同一性の領域は10bpを超える。このように、「ホモログ」は、同一でないが、生理学的条件下で互いにハイブリダイズし得る核酸分子である。二本鎖ホモログは、変性させた後に互いにハイブリダイズし得る。
【0064】
用語「異種」は、1つの一本鎖核酸配列が、別の一本鎖核酸配列またはその相補体にハイブリダイズすることができないことを意味する。したがって、異種の範囲とは、核酸フラグメントまたはポリヌクレオチドが、配列中に別の核酸またはポリヌクレオチドにハイブリダイズすることができない範囲または領域を有することを意味する。このような領域または範囲は、例えば、変異領域である。
【0065】
用語「同一」または「同一性」は、2つの核酸配列が同一の配列または相補的配列を有することを意味する。したがって、「同一性領域」とは、核酸フラグメントまたはポリヌクレオチドの領域または範囲が、別のポリヌクレオチドまたは核酸フラグメントと同一であるかまたはそれに相補的であることを意味する。
【0066】
用語「増幅」は、核酸フラグメントのコピー数が増大することを意味する。
【0067】
用語「野生型」は、核酸フラグメントがいかなる変異をも含まないことを意味する。「野生型」タンパク質とは、このタンパク質が天然に見られる活性に匹敵するレベルで活性であることを意味し、天然に見られるアミノ酸配列を典型的に含む。本発明の1つの局面では、用語「野生型」または「親配列」は、配列の操作に先立つ、開始配列または参照配列を示す。
【0068】
用語「関連ポリヌクレオチド」は、ポリヌクレオチドの領域または範囲が同一であり、ポリヌクレオチドの領域または範囲が異種であることを意味する。
【0069】
用語「キメラポリヌクレオチド」は、野生型であるヌクレオチド領域および変異した領域をこのポリヌクレオチドが含むことを意味する。また、この用語は、このポリヌクレオチドが、あるポリヌクレオチド由来の野生型領域および別の関連ポリヌクレオチド由来の野生型領域を含むことを意味する。
【0070】
本明細書中で使用される場合、用語「集団」は、ポリヌクレオチド、核酸フラグメントまたはタンパク質のような構成成分を集めたものを意味する。「混合集団」とは、核酸またはタンパク質と同一のファミリーに属する(すなわち、関連する)が、配列が異なり(すなわち、同一でない)、したがって、その生物活性が異なる構成成分を集めたものを意味する。「ライブラリー」は、少なくとも2つの構成成分がいくつかの点(化学組成、長さ等)で異なっている集団を必然的に意味する。
【0071】
用語「特定の核酸フラグメント」は、特定の末端地点を有しかつ特定の核酸配列を有する、核酸フラグメントを意味する。1つの核酸フラグメントが第2の核酸フラグメントの一部と同一の配列を有するが異なる末端を有する、2つの核酸フラグメントは、2つの異なる特異的核酸フラグメントを含む。同一の配列を有するが異なる5’または3’末端を有する2つの核酸フラグメントは、2つの異なる特異的核酸フラグメントを含む。
【0072】
用語「変異」は、野生型の核酸配列の配列変化またはペプチドの配列変化を意味する。このような変異は、転位または転換などの点変異であり得る。変異は、欠失、挿入または複製であってもよい。
【0073】
本明細書中で使用されるポリペプチドの表記では、標準的な用法および慣例に従い、左向きの方向はアミノ末端方向であり、右向きの方向はカルボキシ末端方向である。同様に、特記しない限り、一本鎖ポリヌクレオチド配列の左側末端は5’末端であり、二本鎖ポリヌクレオチド配列の左向き方向は5’方向をいう。新生RNA転写物の5’から3’付加の方向は、転写方向をいい、このRNAと同一の配列を有し、かつRNA転写物のこの5’末端に対して5’であるDNA鎖上の配列領域を、「上流配列」と呼び、このRNAと同一の配列を有し、かつコードRNA転写物の3’末端に対して3’であるDNA鎖上の配列領域を、「下流配列」という。
【0074】
本明細書中である対象に対して適用される場合、用語「天然に存在する」は、対象が天然に見出しされ得るという事実をいう。例えば、天然の供給源から単離され得る生物(ウイルスを含む)中に存在し、研究室で人間の手により意図的に改変されていないポリペプチド配列またはポリヌクレオチド配列は、天然に存在する。一般に、用語天然に存在するは、非病理的(病気になっていない)個体中に存在するような対象、例えば、その種に典型的なものをいう。
【0075】
本明細書中で使用される場合、用語「生理学的条件」は、温度、pH、イオン強度、粘性などをいい、これは、生存可能な微生物に適合し、および/または生存可能な培養酵母細胞もしくは哺乳動物細胞中の細胞内に典型的に存在する生化学的パラメータをいう。例えば、典型的な研究培養条件下で増殖させた酵母細胞中の細胞内条件が、生理学的条件である。インビトロ転写カクテルに適したインビトロ反応条件が、通常、生理学的条件である。一般に、インビトロの生理学的条件は、50〜200mMのNaClまたはKCl、pH6.5〜8.5、20〜45℃、および0.001〜10mMの2価カチオン(例えば、Mg++、Ca++)、好ましくは、約150mM NaClまたはKCl、pH7.2〜7.6、5mM 2価カチオンを含み、0.01〜1.0%の非特異的タンパク質(例えば、BSA)を含む場合が多い。非イオン性界面活性剤(Tween、NP−40、Triton X−100)が、通常約0.001〜2%で、典型的には0.05〜0.2%(v/v)で、しばしば存在し得る。特定の水性条件が、従来の方法に従い専門家によって選択され得る。一般的な手引きとしては、以下の緩衝化水性条件が適用可能であり得る:10〜250mM NaCl、5〜50mMのTris HCl、pH5〜8、2価カチオン(複数可)および/または金属キレート剤および/または非イオン性界面活性剤および/または膜画分および/または消泡剤および/または閃光剤(scintillant)を任意に添加する。
【0076】
本明細書中で使用される場合、「リンカー」または「スペーサー」とは、DNA結合タンパク質およびランダムペプチドのような2個の分子を接続し、この2個の分子を好ましい配置に位置させるように機能し、例えば、その結果、ランダムペプチドがDNA結合タンパク質から最少の立体障害でレセプターに結合することができる分子または分子団をいう。
【0077】
本明細書中で使用される場合、用語「作動可能に連結された」は、機能的関連におけるポリヌクレオチド要素の連結をいう。核酸は、別の核酸配列との機能的関連に配置された場合、「作動可能に連結され」る。例えば、プロモーターまたはエンハンサーは、コード配列の転写を影響する場合、このコード配列に作動可能に連結される。作動可能に連結されるとは、連結されるDNA配列が典型的に連続し、2つのタンパク質コード領域を結合する必要がある場合に、連続し、リーディングフレーム中にある。
【0078】
(進化ランダム分子のライブラリー生産)
本発明は、ランダムな位置でのヌクレオチドの欠失、挿入または欠失および挿入の組合せのいずれかを含有するポリヌクレオチドのライブラリーを作製する方法を提供する。実際は、本発明は、相同性または増幅技術を必要とすることなく遺伝的要素を「交換」する手段を提供する。遺伝的要素の交換は高分子、細胞および生物の進化の推進力であることが知られている[Ostermeier&Benkovic,Adv Protein Chem 55:29−77(2000)]。PCRに基づく遺伝子シャッフリングのような現在の技術では、相同性と独立した遺伝的要素を有意に交換することができない。
【0079】
(欠失)
1つの実施形態では、本発明は、集団のメンバーが単一のランダムな位置での欠失の存在により互いに異なる、ヌクレオチド集団を作製する方法を提供する。本発明の一方法は、例えば、以下の工程:
(a)2つの末端を作製するために、複数コピーのポリヌクレオチドの組成物をランダムな位置で切断する工程;
(b)工程(a)からの上記ポリヌクレオチドを、上記ポリヌクレオチドの末端のうちの一末端から、少なくとも1個のヌクレオチドを除去するプロセスに供する工程;および
(c)工程(b)からの上記ポリヌクレオチドを、必要に応じて、上記末端を互いに共有結合させ、1つの位置での欠失により他のものと異なる少なくとも1個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスに供する工程、
を包含する。
【0080】
さらに、本発明は、ポリヌクレオチドの集団を提供し、この集団のメンバーは、単一のランダムな位置での欠失の存在により互いに異なる。欠失が、遺伝的要素の有害または不要な機能の除去を可能にすることが意図される。これらの機能は、プロテアーゼ部位、イオン結合ドメイン、阻害的転写因子に関するDNA結合配列、タンパク質の免疫原性ドメイン等を含み得る。
【0081】
さらなる実施形態では、本発明は、例えば、1つより多い位置で欠失を含有するポリヌクレオチドを生成する方法を提供する。1つの方法は、以下の工程:
(a)2つの末端を作製するために、ランダムな位置で複数コピーのポリヌクレオチドの組成物を切断する工程;
(b)工程(a)からの上記ポリヌクレオチドを、上記ポリヌクレオチドの上記末端から少なくとも1個のヌクレオチドを除去するプロセスに供する工程;および
(c)任意に、工程(b)からの上記ポリヌクレオチドを、上記末端を互いに共有結合させ、1つの位置での欠失により他のものと異なる少なくとも1個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスに供する工程、
を包含する。次いで、所望されるならば、目的の機能が、選択されてもよい(工程(d))。さらに、所望されるならば、工程(a)〜(c)または工程(a)〜(d)が、1〜50回以上反復され得る。
【0082】
さらに、本発明は、1つより多い位置での欠失を含有するポリヌクレオチドの集団を提供する。複数の位置での欠失が、遺伝的要素の多くの有害または不要な機能の除去を可能にすることが意図される。これらの機能は、当業者には十分理解されるように、プロテアーゼ部位、イオン結合ドメイン、阻害的転写因子に関するDNA結合配列、タンパク質の免疫原性ドメインまたは目的の他の機能の任意の組合せを含み得る。
【0083】
(挿入)
1つの実施形態では、本発明は、ポリヌクレオチドの集団を作製する方法を提供し、この集団のメンバーは、単一のランダムな位置での挿入の存在により互いに異なる。1つの方法は、以下の工程:
(a)2つの末端を作製するために、ランダムな位置でポリヌクレオチドの複数コピーの組成物を切断する工程;
(b)工程(a)からの上記ポリヌクレオチドを、上記ポリヌクレオチドの少なくとも1つの末端に、少なくとも1個のヌクレオチドを挿入するプロセスに供する工程;および
(c)任意に、工程(b)からの上記ポリヌクレオチドを、上記末端を互いに共有結合させ、1つの位置での挿入により他のものと異なる少なくとも1個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスを付す工程、
を包含する。
【0084】
さらに、本発明は、ポリヌクレオチドの集団を提供し、この集団のメンバーは、単一のランダムな位置での挿入の存在により互いに異なる。本発明のこの実施形態は、遺伝的要素に新たな融合を発生させ得る。例えば、毒素は、標的化される分子(例えば、抗体)に融合され得、重要な代謝経路の酵素モジュール(例えば、ポリケチドシンダーゼ(synthetase))は、新たな方法で融合され得、または結合ドメイン(すなわち、核酸結合ドメイン、低分子結合ドメインまたはイオン結合ドメイン、プロテアーゼ部位、または他の翻訳後修飾モジュール)のような新たな機能は、、既存の遺伝的要素中に組み込まれ得る。
【0085】
同様に、別の実施形態では、本発明は、1つより多い位置での挿入を含有するポリヌクレオチドを生成する方法を提供する。1つの方法は、以下の工程:
(a)ランダムな位置で複数コピーのポリヌクレオチドの組成物を切断する工程;
(b)工程(a)からの上記ポリヌクレオチドを、上記ヌクレオチドの少なくとも1つの上記末端に、少なくとも1個のヌクレオチドを挿入するプロセスに供する工程;および
(c)任意に、工程(b)からの上記ポリヌクレオチドを、上記DNA末端を互いに共有結合させ、1つの位置での挿入により他のものと異なる少なくとも1個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスに供する工程;および
(d)任意に、目的の機能を選択する工程、
を包含する。工程(a)〜(b)、(a)〜(c)または(a)〜(d)は、1〜50回以上繰り返されてもよい。
【0086】
さらに、本発明は、1つより多い位置での挿入を含有するポリペプチドの集団を提供する。本発明のこの実施形態は、遺伝的要素に複数の新たな融合を発生させ得る。例えば、以下のものは、目的の遺伝子にコンビナトリアル様式で融合され得る;毒素は、標的化される分子(例えば、抗体)に融合され得、重要な代謝経路の酵素モジュール(例えば、ポリケチドシンダーゼ)は、新たな方法で融合され得、または複数の結合ドメイン(すなわち、核酸結合部位、イオン結合ドメイン、プロテアーゼ部位、または他の翻訳後修飾モジュール)のような新たな機能は、既存の遺伝的要素中に組み込まれ得る。
【0087】
(挿入および欠失の組合せ)
1つの実施形態では、本発明は、ポリヌクレオチドの集団を作製する方法を提供し、この集団のメンバーが単一のランダムな位置での欠失および挿入の存在により互いに異なる。この方法は、以下の工程:
(a)2つの末端を作製するために、ランダムな位置で複数コピーのポリヌクレオチドの組成物を切断する工程;
(b)工程(a)からの上記ポリヌクレオチドを、上記ポリヌクレオチドの上記末端のうちの1つの末端から、少なくとも1個のヌクレオチドを除去するプロセスに供する工程;
(c)工程(b)からの上記ポリヌクレオチドを、工程(b)からの上記ポリヌクレオチドの上記DNA末端のうちの少なくとも1つの末端に、少なくとも1個のヌクレオチドを挿入するプロセスに供する工程;
(d)任意に、工程(c)からの上記ポリヌクレオチドを、上記DNA末端を互いに共有結合させ、1つの位置での欠失または挿入により他のものと異なる少なくとも1個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスに供する工程、
を包含する。
【0088】
さらに、本発明は、ポリペプチドの集団を提供し、そのメンバーが単一のランダムな位置での欠失および挿入の組合せにより互いに異なる。本実施形態は、新たな異種ドメインが目的の遺伝子中のドメインと置き換わることを可能にすることを意図する。これに関して、新たな機能、例えば、リガンド結合または酵素触媒が、遺伝的要素に付与され得る。同様に、ネイティブな機能は、本実施形態を利用して強化され得る。
【0089】
別の実施形態では、本発明は、1つより多い位置での挿入および欠失を含有するポリヌクレオチドを生成する方法を提供する。この点で、欠失は、挿入とは異なる位置で発生してもよく、または、欠失と挿入は、同じ位置で発生してもよい。さらに、欠失および/または挿入は、複数の位置で発生し得る。本方法は、以下の工程:
(a)2つの末端を作製するため、ランダムな位置で複数コピーのポリヌクレオチドの組成物を切断する工程;
(b)工程(a)からの上記ポリヌクレオチドを、上記ポリヌクレオチドの上記末端ののうちの1つの末端から、少なくとも1個のヌクレオチドを除去するプロセスに供する工程;
(c)任意に、工程(b)からの上記ポリヌクレオチドを、上記ポリヌクレオチドの上記末端のうちの少なくとも1つの末端に、少なくとも1個のヌクレオチドを挿入するプロセスに供する工程;
(d)任意に、工程(c)からの上記ポリヌクレオチドを、上記末端を互いに共有結合させ、1つの位置での欠失および挿入により他とのもの異なる少なくとも1個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスに供する工程;
(e)任意に、目的の機能について選択する工程;および、任意に工程(a)〜(d)のいずれかを、1〜50回以上繰り返す工程、
を含む。
【0090】
さらに、本発明は、1つより多い位置での挿入および欠失を含有するポリヌクレオチドの集団を提供する。本発明のこの実施形態は、古典的な指向された進化を可能にすることが意図され、この進化では、複数回のランダムな位置での挿入、ランダムな位置での欠失、ならびに挿入および欠失の組合せが生じ、各回の間で遺伝的要素は、必要に応じて選択に供される。本実施形態は、遺伝的要素の機能の改善または改変を可能にする。
【0091】
(出発材料)
本発明は、研究者にとって目的の任意のポリペプチドに適用可能である。ポリペプチドは、核酸、すなわち、RNAまたはDNAであってもよい。ポリヌクレオチドは、しばしば、遺伝的要素または1つ以上の目的の遺伝子からなるDNAである。出発材料は、天然の供給源より得ることができるか、あるいは、研究室で合成(例えば、遺伝子合成)されたポリヌクレオチドであっても、研究室で操作された天然の供給源由来のポリヌクレオチドであってもよい。ポリヌクレオチドのいくつかの供給源は、公共のデータバンク、例えば、Genbank(http://www.ncbi.nlm.nih.gov:80/Genbank/index.html)から入手できるか、または、市販されている(Celera,Rockville,MD;Incyte,Palo Alto,CA;Clontech,Palo Alto,CA;Invitrogen,Carlsbad,CA)。
【0092】
核酸は、任意の供給源から、例えば、pBR322のようなプラスミドから、クローニングされたDNAまたはRNAから、あるいは、細菌、酵母、ウイルスおよび植物または動物のようなより高等生物を含む任意の供給源からの天然のDNAまたはRNAから得られ得る。DNAまたはRNAは、血液または組織材料から抽出してもよい。鋳型ポリヌクレオチドは、ポリヌクレオチド連鎖反応(PCR)を用いた増幅により得てもよい[Mullis、米国特許第4,683,202号(1987年);Mullisら、米国特許第4,683,195号(1987年)]。あるいは、ポリヌクレオチドは、細胞中に存在するベクター中に存在してもよく、当該分野において公知の方法で細胞を培養し、細胞から核酸を抽出することにより、十分な核酸を得ることができる。
【0093】
ベクターの選択は、ポリヌクレオチド配列のサイズ、および、本発明の方法で用いられる宿主細胞に依存する。鋳型は、プラスミド、ファージ、コスミド、ファージミド、ウイルス(例えば、レトロウイルス、パラインフルエンザウイルス、ヘルペスウイルス、レオウイルス、パラミクソウイルスなど)、またはそれらの選択された部分(例えば、コートタンパク質、スパイク糖タンパク質、キャプシドタンパク質)であってもよい。例えば、コスミド、ファージミド、YACおよびBACが好ましく、ここで、これらのベクターは大きな核酸フラグメントを安定に増殖させることができるため、変異される特定の核酸配列はより大きい。
【0094】
特定の核酸配列がベクターにクローニングされる場合、各ベクターを宿主細胞に挿入し、宿主細胞にこのベクターを増幅させることによりクローン増幅され得る。核酸配列の絶対数が増大する一方、変異体の数は増大しないため、これはクローン増幅(clonal amplification)といわれる。
【0095】
出発材料は、実質的に純粋な形態であるべきである。ポリヌクレオチドは、二本鎖でも一本鎖でもよいが、より好ましいのは二本鎖である。さらに、ポリヌクレオチドは、線状でも環状でもよいが、好ましい実施形態では、ポリヌクレオチドは環状である。環状形態のポリヌクレオチドは、当業者に周知の技術により、細菌、酵母、植物、または哺乳動物の細胞ののような生物由来のプラスミドDNAの調製により調製されてもよい[Maniatisら、(1989)]。反応容器内の種々の特定の核酸フラグメントの数は、少なくとも約100個、好ましくは少なくとも約500個、より好ましくは少なくとも約1000個である。
【0096】
出発材料(すなわち、ポリヌクレオチド)は、実質的に純粋な形態であるものの、ホモログまたは関連配列無しで同様に存在し得る。換言すると、最初の容器中のポリヌクレオチドはすべて同一であり得るが、これらはまた関連しているか、関連していない、すなわち異種であり得る。実際、本発明の実施は、出発材料の配列により影響されることはない。さらに、出発材料の配列は、既知であっても既知でなくてもよい。指向された進化の目的のため、必要とされるものは、ポリペプチドの機能を検出する方法(例えば、スクリーニングアッセイ)だけである。
【0097】
(ランダムな位置でのポリヌクレオチドの切断)
概して、核酸フラグメントは、多くの異なる方法で切断されてもよい。核酸フラグメントは、容易に入手可能なDNAseI、S1ヌクレアーゼ、P1または大豆ヌクレアーゼ、あるいはRNAseのようなヌクレアーゼで消化され得る。他の酵素、例えば、RAG1およびRAG2、トポイソメラーゼおよびインテグラーゼは、ポリヌクレオチドを切断することができる。核酸は、超音波処理法により、または小型のオリフィス(orifice)を有するチューブに通すことにより、ランダムに剪断され得る。照射(例えば、γ線照射または紫外線照射)の使用もまた、ポリヌクレオチドを切断することができる。化学薬剤(例えば、ブレオマイシンまたはメタンスルホン酸メチル(MMS))もまた、ポリヌクレオチドを切断できる。
【0098】
挿入または欠失を含有する、機能的に変異した遺伝子の生成について実質的な重要なことは、ポリヌクレオチドを少ない回数、通常は、1回と10回との間、好ましくは1回と5回との間、最も好ましくは1回切断することである。本発明は、反応容器中で1個のポリヌクレオチド当り1つの位置でのみ切断が起こるようにポリヌクレオチドを切断するための手段を提供する。重要なことは、本発明が、ポリヌクレオチドのほぼランダムな切断(すなわち、異なる分子中のいくつかの異なる位置での切断)のための手段を提供することである。切断は、二本鎖または一本鎖で起こり得る(すなわち、一本鎖末端または二本鎖末端を生じる)。ポリヌクレオチドを切断できる酵素の例は、DNaseI、S1ヌクレアーゼ、P1ヌクレアーゼだけでなく、トポイソメラーゼ、トランスポゾン、およびインテグラーゼを含む。切断は、トポイソメラーゼ、トランスポゾンおよびインテグラーゼなどの酵素を用いて、一過的に発生し得る。これらの酵素はポリヌクレオチドを一回または2回以上切断する。S1ヌクレアーゼは、通常ランダムな様式で二本鎖または一本鎖ポリヌクレオチドを切断するのに使用され得る。好ましい実施形態では、環状の二本鎖DNAについて、S1ヌクレアーゼがポリヌクレオチドを1回だけ切断し、2つのDNA末端を生じる(図4)。
【0099】
高い頻度で(すなわち、ポリヌクレオチド内のいくつかの位置で)DNAを切断する1つ以上の制限酵素を用いて、特定のポリヌクレオチドが1回だけ切断され、得られる集団が、1回だけ切断されたが、異なる位置で切断された異なるポリヌクレオチドを有するポリヌクレオチドを含有するように、核酸も部分的に消化され得ることもまた意図される。制限酵素を用いた切断は、完全にランダムではないかもしれないが、目的の遺伝的要素が異なった位置に十分に特異的な制限部位を有さない場合には、切断パターンは、実質的な多様性を生成するのに十分有用であり得る。
【0100】
ポリヌクレオチドの一回の切断は、通常ポリヌクレオチドを数回切断する他の代替的機構を介して達成され得ることが意図される。ポリヌクレオチドは、超音波処理法により、または、小型のオリフィスを有するチューブに通すことにより、ランダムに剪断され得る。照射(例えば、γ線照射または紫外線照射)の使用もまた、ポリヌクレオチドを切断可能である。これらの様式のいずれかが注意深く滴定され、精製手段が使用される場合、一回切断された分子を、実質的に純粋な形態で得ることができる(すなわち、一回切断された分子は、切断されていないかまたは複数に切断された分子から分離させて精製することができる)。
【0101】
さらに、DNAを切断しかつ再結合させるよう作用する酵素(例えば、トポイソメラーゼ、トランスポゾンおよびインテグラーゼ)は、ポリヌクレオチドを効果的に切断するために用いられ得る[Singhら、Proc Natl Acad Sci 94:1304−9(1997)]。これらの場合、切断工程および再結合工程はあわせられ得る。好ましくは、DNA末端が連結されるか、または切断の後、互いに物理的に接近している。これは、欠失事象または挿入事象の後に、間違った末端が互いに再連結することを防ぐためである。結合された末端を維持する1つの機構は、出発材料としての環状ポリヌクレオチドの使用によるものである。この場合、末端は、介在するポリヌクレオチド鎖により連結される。このため、再連結は、分子間に対して、分子内事象であり、そしてより高い効率で進行する。末端を接近状態に保つ他の機構は、タンパク質の架橋(例えば、クロマチン(すなわち、ヒストンまたは他のDNA結合タンパク質)を介するか、または再連結と切断とを一緒にする酵素(例えば、トランスポゾン、インテグラーゼまたはトポイソメラーゼ)を介する)である。あるいは、末端は、固体支持体に反対の末端(非切断末端)の連結を介して、互いに接近状態のままであると考えられ得る。
【0102】
スーパーコイルプラスミドDNAから構成される環状ポリペプチドの切断は、0.1〜100μg、好ましくは1〜10μgで、S1ヌクレアーゼのようなヌクレアーゼとともにインキュベートすることにより達成され得る。ヌクレアーゼは、10μlの反応物中で、0.1〜1000ユニット、好ましくは1〜100ユニットの量で存在し得る。反応温度は、0℃と100℃との間、好ましくは4℃と50℃との間であってもよい。反応時間は、30秒〜1時間で変化させることができるが、好ましくは約1分と30分との間である。線状化の程度は、図4のような、アガロースゲル上でプラスミドDNAを分析することにより測定することができる。線状DNAは、好ましくは、当業者に周知の多数の方法のいずれかにより、切断されていないDNAから精製されるべきである。このような方法は、アガロースゲル精製キット(Qiagen,Valencia,CA)、HPLC、カラムクロマトグラフィーなどの利用を含む。
【0103】
(ヌクレオチドの欠失)
ヌクレオチドの欠失は、種々の方法により、DNA末端で生成され得る。例えば、エキソヌクレアーゼ、例えば、エキソヌクレアーゼIIIは、DNA末端から3’から5’方向でヌクレオチドを除去するために用いられ得る。次いで、得られるDNA末端は、一本鎖エンドヌクレアーゼ、例えば、P1ヌクレアーゼ、S1ヌクレアーゼまたは大豆ヌクレアーゼを用いたDNAの消化により除去され得る、5’オーバーハングを含有する。Bal31ヌクレアーゼは、5’から3’だけでなく3’から5’の核分解(nucleolytic)活性を有する酵素であり、DNA末端からヌクレオチドを欠失させるために用いられ得る。さらに、いくつかのヌクレアーゼ、例えば、E.coli由来のDNAポリメラーゼ、KlenowフラグメントおよびTaqポリメラーゼは、エキソヌクレアーゼ活性を有し、DNA末端からの欠失の作製に用いられ得ると考えられ得る。すべての生物からの細胞抽出物は、ヌクレオチドを欠失させるよう作用することができるDNA修復酵素を含有し、したがって、純粋ではない細胞抽出物が、エキソヌクレアーゼ活性の供給源として用いられ得ると考えられ得る。特定の条件下ではエキソヌクレアーゼ活性を有し得ない他のヌクレアーゼは、他の条件下ではDNA末端での欠失を生じ得る。例えば、S1ヌクレアーゼは、高い酵素濃度で用いられると、短い欠失を生じることができる。さらに、DNA末端が「解ける(frayed)」ような、DNA分子の穏やかな変性は、一本鎖ヌクレアーゼ、例えば、S1ヌクレアーゼ、P1ヌクレアーゼまたは大豆ヌクレアーゼの適用の際に欠失を発生させることが意図される。
【0104】
好ましい実施形態では、欠失反応の条件は、各DNA末端で発生する個々の欠失の数が十分制御され得るように設定される。例えば、塩濃度を変え、pHを変え、温度を変え、または反応の他の任意の生化学的パラメータを変えることにより、多少の欠失が研究者の意図に従って発生するように、ヌクレアーゼ酵素の活性を変化させることができる(例えば、温度を低下させるか、または塩を増大させることにより、エキソヌクレアーゼの処理能力(processivity)を低下させ、より少ない欠失を発生させることができる)。図5は、異なる数の欠失をDNA末端に発生させることが可能な、条件の変更を示す。いくつかの場合、大きな欠失(すなわち、遺伝的要素中の大きなドメインが完全に除去される)が保証され得、他の場合、小さな欠失(すなわち、単一のアミノ酸、またはプロテアーゼ部位を含むもののような数個のアミノ酸が除去される)が好ましい。概して、欠失は、1〜1000個の数で得ることができ、より好ましくはこれらは1〜100個である。特定の場合には、記載されるように、欠失は、1〜10個の数であってもよい。
【0105】
ポリヌクレオチド中のランダムな位置での切断のために、得られるポリヌクレオチド中の欠失の位置はまた、ランダムな位置に配置される。また、残基が分子の一方の末端から欠失されるので、欠失の総数は、5’末端および3’末端で発生する欠失の合計に等しい。
【0106】
(ヌクレオチドの付加)
ランダムな位置のポリヌクレオチドに付加を作製するため、ポリヌクレオチドは、上述のように、必然的にランダムな位置で切断される。挿入の前に、ヌクレオチドが切断事象の間に生産されるDNA末端から欠失されてもよい。また、切断反応により形成されるDNA末端は、新たなヌクレオチドまたはポリヌクレオチドが付加される基質として用いられててもよい。
【0107】
いくつかの異なる機構が、ポリヌクレオチドの末端にヌクレオチドを付加するために存在する。例えば、ヌクレオチドは、化学的カップリングにより付加され得る。ポリメラーゼ、例えば、末端デオキシヌクレオチジルトランスフェラーゼは、DNA末端にヌクレオチドをセミランダムな様式で付加するために用いられ得る[Gauss&Lieber,Mol Cell Biol 1996 16:258−69(1996)]。また、切断工程は、トランスポゾンまたはインテグラーゼを挿入事象に用いる場合があり得るように、挿入事象と一緒にされ得る。
【0108】
E.coliリガーゼまたはファージT4リガーゼのようなリガーゼが、新たなポリヌクレオチドを親ポリヌクレオチドに共有結合させるために用いられ得る。好ましい実施形態では、ポリヌクレオチドは、遺伝的要素または遺伝的要素のフラグメントである。遺伝的要素は本質的にいくつかの方法で機能的であるので、遺伝的要素によって、得られるポリヌクレオチドが機能を有しやすくなる。遺伝的要素は、遺伝子、遺伝子の調節要素、または有用なドメインをコードする遺伝的要素であり得る。遺伝的要素は、cDNAライブラリーまたはゲノムDNAライブラリーなどの遺伝的要素のライブラリーであり得る。遺伝的要素のフラグメントは、ポリヌクレオチドをヌクレアーゼ、例えば、DNAseI、S1ヌクレアーゼ、P1または大豆ヌクレアーゼ、あるいはRNAseを用いて消化することにより生産され得る。他の酵素、例えば、制限酵素およびトポイソメラーゼもまた、ポリヌクレオチドをフラグメントに切断し得る。ポリヌクレオチドは、超音波処理法により、または小型のオリフィスを有するチューブに通すことにより、ランダムに剪断され得る。照射(例えば、γ線照射または紫外線照射)の使用もまた、ポリヌクレオチドをフラグメントに切断し得る。化学薬剤(例えば、ブレオマイシンまたはMMS)もまた、ポリヌクレオチドをフラグメントに切断し得る。
【0109】
遺伝的要素の集団または遺伝的要素のフラグメントを有するランダムな位置で切断された親ポリヌクレオチドと、T4 DNAリガーゼのようなリガーゼとを、適当な塩、緩衝液および温度条件下で混合することにより、遺伝的要素が親ポリヌクレオチドと元の切断事象の位置で共有結合することができることが意図される。したがって、親ポリヌクレオチド内のランダムな位置での挿入を含むポリヌクレオチドの混合物が生産される。各挿入の内容(すなわち、配列)は、遺伝的要素または遺伝的要素のフラグメントが同一である場合には同一であり得、遺伝的要素のフラグメントが非同一である場合には異なる。
【0110】
(DNA末端の再結合)
DNA末端は、DNA末端を、DNA末端でヌクレオチド間にホスホジエステル結合を形成させる、DNAリガーゼのような酵素とともにインキュベートすることにより、共有結合的に再結合され得る。リガーゼの例には、E.coli DNAリガーゼ、ファージT4 DNAリガーゼまたはヒトDNAリガーゼが含まれる。これらの酵素は、当業者に周知の条件下で、DNAの連結に用いられ得る。他の酵素もまた、DNA末端でヌクレオチド間に共有結合(ホスホジエステル結合のような)を作製することができる。このような酵素は、トポイソメラーゼ、トランスポゾン、インテグラーゼ、および他の再結合酵素である。他の機構が、DNA末端の結合に用いられ得、例えば、いずれの末端(すなわち、5’および3’末端の両方)の配列にハイブリダイズして、これらの末端を水素結合で「架橋」し得る配列のオリゴヌクレオチドの利用が用いられ得る。反対側の鎖上の介在配列は、ポリメラーゼ、例えば、E.coliポリメラーゼ、Klenowフラグメント、ファージT4ポリメラーゼまたはTaqポリメラーゼで満たされ得る。次いで、ニックは、上述にように、DNAリガーゼにより修復され得る。細胞抽出物もまた、リガーゼ活性を有し、細胞または核抽出物はDNA末端の再結合に用いられ得る。あるいは、DNA分子は、無傷細胞中に導入され得、細胞の機構がDNA末端を相同的または非相同的に手段により再結合させ得る。
【0111】
(ライブラリー組成物)
本発明は、以下の組成物を例とする新規なライブラリーを提供する。
【0112】
(欠失)
本発明は、ポリヌクレオチドの集団を提供し、この集団のメンバーは、単一のランダムな位置での欠失の存在により互いに異なる。このような単一の欠失のライブラリーは、少なくとも2個の分子、好ましくは100個の分子、最も好ましくは少なくとも約1000個の分子を含み得る。欠失ライブラリーは、1つのランダムな位置での少なくとも1個のヌクレオチドの欠失により少なくとも1個の他の分子と異なる、少なくとも1個の分子を含むべきである。各位置での欠失の数は、1〜1000個であり得るが、少なくとも1個であるべきである。欠失が、遺伝的要素の有害または不要な機能の除去を可能にすることが意図される。これらの機能には、プロテアーゼ部位、イオン結合ドメイン、阻害的転写因子のためのDNA結合配列、タンパク質の免疫原性ドメインなどが含まれ得る。
【0113】
さらに、本発明は、1つより多い位置での欠失を含有するポリヌクレオチドの集団を提供する。このようなライブラリーは、少なくとも2個の分子、好ましくは100個の分子、最も好ましくは少なくとも約1000個の分子を含むべきである。これらの複数の欠失ライブラリーは、1つより多いランダムな位置での少なくとも1個のヌクレオチドの欠失により少なくとも1個の他の分子と異なる、少なくとも1個の分子を含むべきである。複数の位置での欠失が、遺伝的要素の複数の有害または不要な機能の除去を可能にすることが意図される。これらの機能には、複数のプロテアーゼ部位、イオン結合ドメイン、阻害的転写因子のためのDNA結合配列、タンパク質の免疫原性ドメインなどの任意の組合せが含まれ得る。
【0114】
(挿入)
本発明は、ポリヌクレオチドの集団を提供し、この集団のメンバーは、単一のランダムな位置での挿入の存在により互いに異なる。挿入ライブラリーは、少なくとも2個の分子、好ましくは100個の分子、最も好ましくは少なくとも約1000個の分子を含み得る。挿入ライブラリーは、1つのランダムな位置での少なくとも1個のヌクレオチドの挿入により少なくとも1個の他の分子と異なる、少なくとも1個の分子を含むべきである。各位置での挿入の数は、1〜10,000個であってもよいが、好ましくは少なくとも1個である。例えば、毒素は、標的化された分子(例えば、抗体)に融合され得、重要な代謝経路の酵素モジュール(例えば、ポリケチドシンダーゼ)は、新たな方法で融合され得、または、結合ドメイン(すなわち、核酸結合ドメイン、イオン結合ドメイン、プロテアーゼ部位または他の翻訳後修飾モジュール)のような新たな機能は、既存の遺伝的要素中に組み込まれ得る。
【0115】
さらに、本発明は、1つより多い位置での挿入を含有するポリヌクレオチドの集団を提供する。このようなライブラリーは、少なくとも2個の分子、好ましくは100個の分子、最も好ましくは少なくとも約1000個の分子を含むべきである。これらの複数の挿入ライブラリーは、1つより多いランダムな位置での少なくとも1個のヌクレオチドの挿入により少なくとも他の1個の分子と異なる少なくとも1個の分子を含むべきである。本発明のこの実施形態により、遺伝的要素の新規な融合が発生可能となることが意図される。本発明のこの実施形態により、遺伝的要素の複数の新たな融合が発生可能となることが意図される。例えば、以下のものは、コンビナトリアル様式で、目的の遺伝子に融合され得る:毒素は、標的化された分子(例えば、抗体)に融合され得、重要な代謝経路の酵素モジュール(例えば、ポリケチドシンダーゼ)は、新たな方法で融合され得、または、結合ドメイン(すなわち、核酸結合ドメイン、イオン結合ドメイン、プロテアーゼ部位または他の翻訳後修飾モジュール)は、既存の遺伝的要素中に組み込まれ得る。
【0116】
(挿入および欠失の組合せ)
本発明は、ポリヌクレオチドの集団を提供し、そのメンバーは、単一のランダムな位置での欠失および挿入の組合せによって互いに異なる。このようなライブラリーは、少なくとも2個の分子、好ましくは100個の分子、最も好ましくは少なくとも約1000個の分子を含むべきである。これらの組合せライブラリーは、1つのランダムな位置での1個のヌクレオチドの挿入および少なくとも1個のヌクレオチドの欠失によって少なくとも1個の他の分子と異なる、少なくとも1個の分子を含むべきである。本実施形態により、異種ドメインを、目的の遺伝子中のドメインと置き換えることが可能となることが意図される。これに関して、新たな機能(例えば、リガンド結合または酵素触媒)が遺伝的要素に付与され得る。また、ネイティブな機能が、本実施形態を利用して強化され得る。
【0117】
さらに、本発明は、1つより多い位置での挿入および欠失を含有するポリヌクレオチドの集団を提供する。このようなライブラリーは、少なくとも2個の分子、好ましくは100個の分子、最も好ましくは少なくとも約1000個の分子を含むべきである。これらの組合せライブラリーは、1つのランダムな位置での少なくとも1個のヌクレオチドの挿入、および、1つのランダムな位置での少なくとも1個のヌクレオチドの欠失により、少なくとも1個の他の分子と異なる少なくとも1個の分子を含むべきである。本発明のこの実施形態により、古典的な指向された進化が可能となり、この進化では、ランダムな位置での複数回の挿入、ランダムな位置での欠失、および挿入と欠失の組合せからが生じ、各回の間で目的の遺伝子は、必要に応じて選択に供される。本実施形態により、遺伝的要素の機能の改善または変更が可能となる。
【0118】
(組成物の分析)
このようなライブラリーの組成物は、当業者に周知の機構により決定され得る。ライブラリーが挿入または欠失を含むか否かを判定するため、このライブラリーは、アガロースまたはアクリルアミドゲルの電気泳動によって分析されることが可能であり、サイズは、親配列と比較可能である。他の方法、例えば、HPLC、質量分析、カラムクロマトグラフィーは、ポリヌクレオチド間のサイズの差を同定するために使用され得る。本発明は、ランダムな位置の挿入または欠失に関するので、ライブラリーの組成物を決定するための最も明確な方法は、組成物内の典型的なポリヌクレオチドを配列決定に供することであり、この方法は当業者に周知である。典型的なクローンの配列の比較により、欠失または挿入が、ライブラリーの異なった分子中のランダムな位置で発生したかどうかを判定することができる。
【0119】
得られるライブラリーは、ライブラリー内に含まれる、得られた変異体を発現するためのビヒクルとして用いるための発現ベクター内に連結することができる。発現ベクターの性質は、「スクリーニング」の項において後述する。
【0120】
(目的の機能に関するスクリーニング)
目的の機能に関するポリヌクレオチドのライブラリーの試験では、ライブラリーは、適当な発現ベクター中に挿入されるべきである。あるいは、ライブラリーは、発現ベクター中に構築され得る(すなわち、ライブラリーが発現ベクターを含む)。クローニングに用いられるベクターは、所望のサイズのDNAフラグメントを受容する限り、重要ではない。DNAフラグメントの発現が所望される場合には、クローニングビヒクルは、宿主細胞中のDNAフラグメントの発現を可能にするために、DNAフラグメントの挿入部位の隣に転写シグナルおよび翻訳シグナルをさらに含むべきである。細菌細胞でのスクリーニングのために好ましいベクターには、プラスミドのpUCシリーズおよびpBRシリーズが含まれる。
【0121】
得られる細菌集団は、ランダム変異を有する、多くの組換えDNAフラグメントを含む。この混合された集団を試験して、所望の組換え核酸フラグメントを同定し得る。選択方法は、所望のDNAフラグメントに依存する。
【0122】
ベクターの選択は、本発明の方法に用いられるべきポリヌクレオチド配列のサイズおよび宿主細胞に依存する。鋳型は、プラスミド、ファージ、コスミド、ファージミド、ウイルス(例えば、レトロウイルス、パラインフルエンザウイルス、ヘルペスウイルス、レオウイルス、パラミクソウイルスなど)またはこれらの選択された部分(例えば、コートタンパク質、スパイク糖タンパク質、キャプシドタンパク質)であってもよい。特定の核酸配列が比較的大きい場合、これらのベクターは、より大きな核酸フラグメントを安定に遺伝させるので、例えば、コスミド、ファージミド、YACおよびBACが好ましい。
【0123】
リガンドに対して増加された結合効率を有するタンパク質をコードするDNAフラグメントが所望される場合、集団またはライブラリー中のDNAフラグメントの各々により発現されるタンパク質を、当該分野において公知の方法(すなわち、パンニング、アフィニティクロマトグラフィー)により、リガンドに対する結合能力に関して試験することができる。増加された薬剤耐性を有するタンパク質をコードするDNAフラグメントが所望される場合、集団またはライブラリー中のDNAフラグメントの各々により発現されるタンパク質を、宿主生物に薬剤耐性を付与する能力に関して試験することができる。所望のタンパク質についての知識が与えられた当業者は、容易に集団を試験し、タンパク質に所望の特性を有するDNAフラグメントを同定できる。
【0124】
本発明の状況において、用語「陽性のポリペプチド改変体」は、対応する導入(input)DNA配列から生産可能なポリペプチドと比較して改善された機能特性を有する、得られたポリペプチド改変体を意味する。このような改善された特性の例は、例えば、強められるか、または弱められた生物学的活性、増大された洗浄性能、熱安定性、酸化安定性、基質特異性、抗生物質耐性あるいは目的であり得る他の特性と同様に異なってもよい。
【0125】
したがって、陽性改変体の同定のために用いられるべきスクリーニング方法は、変化が望まれる問題のポリペプチドの特性、および、その変化が望まれる方向にあるポリペプチドの特性に依存する。
【0126】
所望の生物学的活性について選択するための、多くの適したスクリーニング系または選択系が、当該分野において記載されている。例えば、Strausbergら[Strausbergら、Biotechnology(NY)13:669−73(1995)]は、カルシウム依存的安定性を有するサブチリシン改変体に対するスクリーニング系を記載している。Bryanら[Bryanら、Proteins 1:326−34(1986)]は、強められた熱安定性を有するプロテアーゼに関するスクリーニングアッセイを記載している。
【0127】
当業者であれば、タンパク質のフラグメントがファージ表面上に融合タンパク質として発現される、ファージディスプレイ系(Pharmacia,Milwaukee,Wis.)を使用できることが意図される。組換えDNA分子は、その一部が組換えDNA分子によりコードされる、融合タンパク質の転写をもたらす部位でファージDNAにクローニングされる。組換え核酸分子を含有するファージは、細胞での複製および転写を受ける。融合タンパク質のリーダー配列は、融合タンパク質の、ファージ粒子の先端への輸送を指向する。このため、組換えDNA分子により部分的にコードされる融合タンパク質は、ファージ粒子上に表示され、上述の方法により検出および選択される。
【0128】
(核酸中の標的化された短い欠失に影響する方法)
ポリヌクレオチドに短い欠失を作る能力は、通常、DNA末端で作用するエキソヌクレアーゼの高い活性および処理能力により阻害される。DNA末端における大きな(すなわち、100塩基より多い)欠失を作るためのいくつかの方法が存在する[Sambrookら、(1989)]。しかし、1〜100塩基などの短い欠失、または、1〜10塩基のような非常に短い欠失を制御された様式で作る方法は、可能ではない。特定の部位にこのような欠失を作る能力は、タンパク質工学の分野において重要であり[Altamiranoら、Nature 403:617−22(2000)]、V(D)J組換え法の末端結合機構において強調されており、この方法は、抗体遺伝子に実質的多様性をもたらす[Smider&Chu,Sem.Immun.9:189−97(1997)]。
【0129】
(出発材料)
この欠失生成機構は、研究者にとって目的の、任意のポリペプチドに適用され得る。ポリヌクレオチドは、核酸、すなわち、RNAまたはDNAであってもよい。ポリヌクレオチドは、遺伝的要素、あるいは1つまたは複数の目的の遺伝子からなるDNAである場合が多い。出発材料は、天然の供給源から得てもよく、または、研究室で合成(例えば、遺伝子合成)されたポリヌクレオチドであっても、研究室で操作された天然の供給源由来のポリヌクレオチドであってもよい。ポリヌクレオチドのいくつかの供給源は、Genbank(http://www.ncbi.nlm.nih.gov:80/Genbank/index.html)などの公共のデータバンクを介して入手可能であるか、または、市販されている(Celera,Rockville,MD;Incyte,Palo Alto,CA;Clontech,Palo Alto,CA;Invitrogen,Carlsbad,CA)。
【0130】
核酸は、任意の供給源から、例えば、pBR322などのプラスミドから、クローニングしたDNAまたはRNAから、あるいは、細菌、酵母、ウイルスおよび植物または動物などの高等生物を含む任意の供給源由来の天然のDNAまたはRNAから得ることができる。DNAまたはRNAは、血液材料または組織材料から抽出され得る。鋳型ポリヌクレオチドは、ポリヌクレオチド連鎖反応(PCR)を用いた増幅によって得られ得る[Mullis、米国特許第4,683,202号(1987年);Mullisら、米国特許第4,683,195号(1987年)]。また、ポリヌクレオチドは、細胞中に存在するベクター中に存在してもよく、この細胞を培養し、当該分野において公知の方法によって、細胞から核酸を抽出することにより、十分な核酸が得られ得る。
【0131】
(ヌクレオチドの欠失)
ヌクレオチドの欠失は、種々の手段によりDNA末端において生成され得る。例えば、エキソヌクレアーゼIIIなどのエキソヌクレアーゼを用いて、DNA末端から3’から5’方向にヌクレオチドを除去することができる。得られるDNA末端は、P1ヌクレアーゼ、S1ヌクレアーゼ、または大豆ヌクレアーゼなどの一本鎖エンドヌクレアーゼを用いるDNAの消化により除去され得る5’オーバーハングを含有する場合が多い。他のエキソヌクレアーゼもまた、本発明において用いられ得る。Bal31ヌクレアーゼは、5’から3’の核分解活性ならびに3’から5’の核分解活性を有する酵素であり、DNA末端からヌクレオチドを欠失させるために用いられ得る。エキソヌクレアーゼTは、3’から5’の方向にヌクレオチドを除去し得る。エキソヌクレアーゼ7は、5’から3’方向のヌクレオチドを除去し得、ニックまたはギャップのように一本鎖末端で作用し得る。エキソヌクレアーゼIは、3’から5’方向での一本鎖DNAからのヌクレオチドの除去を触媒する。λエキソヌクレアーゼは、5’から3’方向に作用し、二重鎖DNAからの5’モノヌクレオチドの除去を触媒する、非常に進行性の酵素である。RecJは、5’から3’方向にDNAからのデオキシヌクレオチドモノリン酸の除去を触媒する、一本鎖DNA特異的エキソヌクレアーゼである。さらに、いくつかのポリメラーゼ、例えば、E.coli由来のDNAポリメラーゼI、Klenowフラグメント、およびTaqポリメラーゼは、エキソヌクレアーゼ活性を有し、DNA末端から欠失を作るのに使用可能であると考えられ得る。すべての生物由来の細胞抽出物は、ヌクレオチドを欠失させるように作用し得るDNA修復酵素を含有し、したがって、不純な細胞抽出物が、エキソヌクレアーゼ活性の源として使用可能であると考えられ得る。特定の条件下ではエキソヌクレアーゼ活性を有し得る他のヌクレアーゼは、他の条件下ではDNA末端での欠失を生産し得る。例えば、S1ヌクレアーゼは、高い酵素濃度で使用されると、短い欠失を生産し得る。さらに、DNA末端が「解ける」ような、DNA分子の穏やかな変性により、一本鎖エンドヌクレアーゼ、例えば、S1ヌクレアーゼ、P1ヌクレアーゼまたは大豆ヌクレアーゼの適用の際に、欠失の発生が可能になる。
【0132】
好ましい実施形態では、欠失反応の条件は、各DNA末端で発生する個々の欠失の数が、十分制御され得るように設定される。例えば、塩濃度および温度を変え、pHを変え、または、反応の他の任意の生物学的パラメータを変えることにより、多少の欠失が研究者の目的に依存して発生するように、ヌクレアーゼの酵素活性を変えることができる。最も際立って、かつ驚くべきことに、本発明者らは、温度を低下させること、および/または、塩を増大させることにより、エキソヌクレアーゼの処理能力を低下させ、より制御された小さい欠失が得られることを見出した。反応に用いられる塩は、いかなる塩であってもよい。塩の例としては、塩化ナトリウム、酢酸ナトリウム、塩化カリウムまたは酢酸カリウムが挙げられる。好ましくは、塩は、塩化ナトリウムまたは塩化カリウムのいずれかである。塩濃度は、10mM〜1.0Mの範囲であり得るが、好ましくは50mMと500mMとの間である。反応温度も、本発明では、変化し得る。温度は、0℃〜30℃の範囲であり得るが、好ましくは0℃と24℃との間である。図5は、異なった数の欠失をDNA末端上に発生させ得る、条件の変更を示す。いくつかの場合、大きな欠失(すなわち、遺伝的要素中の大きなドメインを完全に除去すること)が保証され得、他の場合、小さな欠失(すなわち、単一のアミノ酸、または、プロテアーゼ部位を含むものなどの数個のアミノ酸を除去すること)が好ましくあり得る。得られるポリヌクレオチドの集団は、開始配列の末端に、種々の量の欠失を含む。概して、欠失は、1〜1000個の数で得ることができ、より好ましくはその数は1〜100個である。好ましい実施形態では、欠失は、1〜30個、または、ひいては1〜10個の数であり得る。
【0133】
(DNA末端の再結合)
いくつかの場合、欠失を含有する分子のDNA末端を、第2のDNA末端と結合させて、これにより、今度は欠失が内部位置で発生させることが有用であり得る。連結されるべき2つの末端が同一のDNA分子に存在することが多く、その結果、得られる接続産物は環状ポリヌクレオチドである。DNA末端でヌクレオチド間にホスホジエステル結合を形成させるDNAリガーゼのような酵素とともにDNA末端をインキュベートすることにより、DNA末端は、再結合され得る。リガーゼの例としては、E.coli DNAリガーゼ、ファージT4 DNAリガーゼ、またはヒトDNAリガーゼが挙げられる。これらの酵素は、DNAを連結するための当該分野において周知の条件下で用いられ得る。他の酵素もまた、DNA末端でヌクレオチド間に共有結合(ホスホジエステル結合のような)を作ることができる。このような酵素は、トポイソメラーゼ、トランスポゾン、インテグラーゼ、および他の組換え酵素である。他の機構(例えば、その配列がいずれかの末端(すなわち、5’および3’末端の両方)の配列とハイブリダイズして、末端同士を水素結合で「架橋」することのできるオリゴヌクレオチドの使用)が、DNA末端の結合に使用可能である。対向する鎖上の介在配列は、ポリメラーゼ、例えば、E.coliポリメラーゼ、Klenowフラグメント、ファージT4ポリメラーゼ、またはTaqポリメラーゼで満たされ得る。次いで、ニックは、上記のようにDNAリガーゼにより修復され得る。細胞抽出物も、リガーゼ活性を含有し、細胞または核の抽出物は、DNA末端の再結合に用いられ得る。あるいは、DNA分子は、インタクトな細胞内に導入することができ、細胞の機構部分が相同的または非相同的手段によりDNAを再結合させ得る。
【0134】
(欠失組成物)
1つの実施形態では、本発明は、ポリヌクレオチドの組成物を提供し、この集団のメンバーがポリヌクレオチドの一方または両方の末端での欠失の存在により互いに異なる。欠失の数は、各末端で1〜100個の範囲であるが、より好ましくは1〜30個である。
【0135】
さらに、本発明は、特定の内部位置(すなわち、末端ではない)での短い欠失により互いに異なるポリヌクレオチドの組成物を提供する。この組成物は、欠失を有するポリヌクレオチドの組成物を、その末端において他のDNA末端と結合させることにより得られ、その結果、今度は欠失が内部に発生する。連結されるべき2つの末端が同一のDNA分子にしばしば存在し、その結果、得られる連結産物は、環状ポリヌクレオチドである。欠失の数は、各末端で1〜100個の範囲であり得るが、より好ましくは1〜30個である。
【0136】
本明細書中において参照される全ての参考文献および特許公開は、本明細書中に参考として援用される。
【0137】
上記開示から理解されるように、本発明は、広範な種々の用途を有する。したがって、以下の実施例は、例示を目的として呈示されるものであり、決して本発明についての限定として解釈されることを意図するものではない。
(実施例)
(実施例1:プラスミドのランダムな切断)
挿入または欠失を利用する分子進化技術では、遺伝子が、少なくとも一時的に、少数回切断される必要がある。必要に応じて、混合物内の各分子は、異なるランダムな位置で一回切断される。一回切断されたDNAを調製することはかなり困難であり、切断はランダムな位置で発生する。Biondiらは、DNaseIおよびDNAポリメラーゼを用いてニックを誘発し、次いでこれらのニックをさらに切断して、二本鎖の分解を生成する、面倒な方法を記載している[Biondiら、Nucleic Acids Res 26:4946−52(1998)]。このプロセスは、冗長かつ時間がかかる塩化セシウムの勾配精製およびリンカーの連結工程を必要とし、分子進化のような、ハイスループット分子生物学的技術に一般的に適用できない。
【0138】
一本鎖エンドヌクレアーゼを用いてDNAのランダムな位置での二本鎖の分解を誘発する戦略は、これまで用いられてはいなかった。これは、S1、P1または大豆ヌクレアーゼのような一本鎖ヌクレアーゼが、緊密なスーパーコイルDNAの一本鎖領域を特異的に切断し、これによりニックを生成することを理由としていた。ニックは、これらの酵素についての自然の基質であり、次いで、二本鎖の分解を作り出す切断は、同じ反応で発生し得る。切断に続いて、プラスミドはもはやスーパーコイル状態ではないので、一本鎖領域はもはや存在せず、このためDNAは、もはや酵素にとっての基質ではない。それゆえ、切断は生じ、一度のみしか発生しない。本実施例は、この仮説の利用性を例示するものである。
【0139】
ポリヌクレオチドをランダムな位置で切断できる機構を例示するため、プラスミドpLacZi(Clonetech,Palo Alto,CA)を用いた。このプラスミドを、DH10B E.coli細胞(Invitrogen,Carlsbad,CA)中で増殖させ、プラスミドを、Qiagenマキシプレップカラム(Qiagen maxiprep column)(Qiagen,Valencia,CA)により調製した。200ng/μlのプラスミドDNAを、0.4、2.0、10または50ユニットのS1ヌクレアーゼ(Promega,Madison,WI)とともに、1×S1緩衝液(50mM酢酸ナトリウム、pH4.5、280mM NaCl、4.5mM ZnSO4)中で10分間、室温でインキュベートした。EDTAを0.025Mまで添加して、70℃で10分間加熱することにより、反応を停止させた。タンパク質を、等量のフェノール:クロロホルム:イソアミルアルコール(25:24:1)で2度、等量のエーテルで一度抽出して除去し、酢酸ナトリウムで沈殿させ、水に再懸濁させた。
【0140】
切断したpLacZiを、1.5%アガロースゲル電気泳動により分析した(図4、パネルA)。S1ヌクレアーゼで切断されたプラスミドをpLacZiを一度切断するClaIで切断されたpLacZiとともに移動することを、観察した。これにより、S1ヌクレアーゼは環状DNA分子を線状化させることができる。S1ヌクレアーゼが配列特異的な様式でDNAを切断することは知られていないが、S1によるプラスミドの切断は部位特異的でないと決定することは重要であった。このために、S1切断により生成された線状プラスミドをゲル精製するか(図4、パネルB、レーン5)、または精製してさらにClaIで切断した(レーン6)。コントロールは、スーパーコイルプラスミド(レーン2)、ClaIで線状化されたプラスミド(レーン3)またはS1ヌクレアーゼで線状化したが精製していないプラスミド(レーン4)を含んでいた。S1/ClaI切断プラスミドを、1つのスメアとして観察し、これはS1がプラスミドのいくつかの異なる位置で切断していることを示す。S1が1つの位置しか切断しない場合、S1/ClaI切断プラスミドは、2本のバンドとして移動する;S1が2つの位置で切断する場合、S1/ClaIプラスミドは3本のバンドなどとして移動する。本実施例の重要性は、ポリヌクレオチドが一度(すなわち、環の線状化)、しかも一度だけ、異なった複数の位置で切断されることが可能である。
【0141】
(実施例2:LacZ中の部位での欠失)
ヌクレオチド欠失が、遺伝子の構造分析を目的として、かつ、ヌクレオチド配列分析を目的としてなされている。一般にこれらの欠失は、100個のヌクレオチドをはるかに超える範囲の大きさである。通常の条件下では、例えば、エキソヌクレアーゼIIIは、1分間当り100個より多い塩基を除去する[Sambrookら、(1989)]。しかし、小型の欠失を作製する能力は、タンパク質中の小型のドメインを変化させるか、または、有害な機能を除去するのに有用である。ポリヌクレオチドの末端に小型の欠失を作るため、エキソヌクレアーゼIIIを、種々の塩(図5)および温度の条件下で用いた。pLacZi由来の、蛍光標識した232塩基対のPCR産物を、100mM、150mMおよび200mMのNaClに、10μlの66mM Tris−Cl(pH7.4)、0.66mMのMgCl2中の10UのエキソヌクレアーゼIII(New England Biolabs,Beverly,MA)の存在下で、15℃で5分間の反応中に暴露した。EDTAを0.025Mまで添加することにより反応を停止させ、等量のフェノール:クロロホルム:イソアミルアルコール(25:24:1)で一度、等量のエーテルで一度抽出し、酢酸ナトリウムで沈殿させた。DNAを、20μlの脱イオン化したホルムアミドに再び懸濁させ、0.5μlを、製造者の推薦に従い遺伝子スキャン(genescan)の設定にセットしたABI 373シーケンサー(Perkin−Elmer,Foster City,CA)中の6%ポリアクリルアミド変性ゲルに流した。
【0142】
約25個のヌクレオチドを、100mM NaClの条件下(図5、第2パネル)で、15個までのヌクレオチドを150mM NaClで、数個のヌクレオチドを200mM NaCl(下のパネル)で除去することができた。
【0143】
pLacZi中のClaI部位はLacZ遺伝子のコード領域に存在している。この部位は、遺伝子自体内に短い欠失を作るのに用いられ、次いでさらにPCRにより分析して、欠失が作られた程度を決定した。さらに、欠失を含むプラスミドを、40μg/mlのX−Galを含むLB寒天プレート上で選択し、LacZ遺伝子の機能性を決定した。pLacZiプラスミド(10μg)を、200μlのClaI中で線状化し、次いで、20UのS1ヌクレアーゼ400μl中でインキュベートして、2bpの5’オーバーハングを除去した。さらに、線状化したプラスミドを濃縮し、ウルトラフリーMC膜(ultrafree MC membrane)(30kD除去用、Millipore,Bedford,MA)を通して濾過し、100Uの仔ウシ腸ホスファターゼ(New England Biolabs,Beverly,MA)を含む容量400μlの1×仔ウシ腸ホスファターゼ緩衝液中に入れ、室温で45分間インキュベートした。プラスミドを、等量のフェノール:クロロホルム:イソアミルアルコール(25:24:1)で、等量のエーテルで一度抽出し、酢酸ナトリウムで沈殿させ、水に再懸濁させた。次いで、このプラスミドを、実施例1に記載したのと同様に、エキソヌクレアーゼIIIとともに、100mM、150mMまたは200mMのNaClの存在下で15℃で5分間、10μl反応物でインキュベートした。対照アームでは、プラスミドは、エキソヌクレアーゼIIIとともにインキュベートせず、欠失の無い状態での脱リン酸化プラスミドの再連結の発生頻度について調べた。エキソヌクレアーゼIII反応の5分後、S1ヌクレアーゼ50Uを1×S1緩衝液中に含む混合物を添加した。この混合物を、室温で15分間さらにインキュベートした。EDTAを0.025Mまで添加し、70℃で10分間加熱することにより、この反応を停止させた。次いで、DNAを等量のフェノール:クロロホルム:イソアミルアルコール(25:24:1)で一度、等量のエーテルで一度抽出し、酢酸ナトリウムで沈殿させ、1.0UのT4 DNAリガーゼ(Invitrogen,Carlsbad,CA)を含む10μlの1×リガーゼ緩衝液中に再び懸濁させた。連結反応物は15℃で12時間インキュベーションした。E.coli株DH10B(Invitrogen,Carlsbad,CA)の電気泳動を、1.0μlの連結混合物とともに行った。細胞を、40μg/mlのX−Galおよび100μg/mlのアンピシリンを含むLB寒天プレート上で平板培養し、30℃で一晩インキュベートした。表1に平板培養実験の結果を示す。
(表1.部位特異的欠失後のコロニー特性)
【0144】
【表1】
脱リン酸化プラスミドがエキソヌクレアーゼIIIに暴露されない場合(第1行、表1)、バックグラウンドが見られないことに、注意すべきである。いくつかの青色および白色のコロニーが、種々の塩濃度でのエキソヌクレアーゼIII処理で見出されている。興味深いことに、少なくとも2/3の再連結がフレーム外(out of frame)にあるべきであるので、青色/白色の比率の理論的最大値は0.33である。しかし、本実験での青色/白色比率は0.33をわずかに超えており、塩濃度が増大するにつれ増大するように思われる。この傾向は、一端からの1塩基対の欠失がインフレームでの再連結の発生を可能にし、塩が増大するにつれ欠失がより容易でなくなる事実に起因し得る。この結果の統計的有意性は分析されておらず、本当の発生頻度は0.33により近いものであるかもしれない。
【0145】
6つのコロニーを、ClaI部位に隣接するプライマーを用いてPCRにより分析した。図6にこれらの結果を示す。上側のパネルに、pLacZi由来の野生型の312塩基対のフラグメントを示す。クローン1は、291塩基のインフレーム欠失(291塩基のPCR産物)を含有し、青色の表現型を維持する。クローン2は、4塩基対のフレーム外の欠失(308塩基のPCR産物)を含有し、白色の表現型を有する。クローン3は、9塩基対のインフレーム欠失(303塩基のPCR産物)を含有し、白色の表現型を有する。クローン4は、6塩基対のインフレーム欠失(306塩基のPCR産物)を含有し、白色の表現型有する。クローン5は、7塩基対のフレーム外欠失(305塩基のPCR産物)を含有し、白色の表現型を有する。クローン6は、3塩基対の欠失(309塩基のPCR産物)を含有し、青色の表現型を有する。より短い欠失はより厳密性の低い表現型をもたらすと思われ得るが、本実験はこのことが必ずしも当てはまらないことを示す。クローン1は、7個のアミノ酸を含む欠失を含有するが機能を維持する。一方で、クローン3および4は、インフレームでのより短い欠失を含有するが機能を維持しない。さらに、本実施例は、機能的配列空間を探索するための欠失技術(deletional technology)の能力を示す。
【0146】
(実施例3:LacZへの挿入)
LacZ遺伝子へのランダムDNAの挿入は、DNaseIを用いてCHO細胞由来cDNAをフラグメント化し、続いてこれらのフラグメントを線状化pLacZi中に連結することにより達成された。cDNAは自明ながら機能的であるので、cDNAの使用が機能性タンパク質の獲得可能性を最適化するであろうことが意図される。CHO細胞のcDNA(5μg)を、0.001ユニットのDNaseIを用いて、40mM Tris−Cl(pH7.4)および10.0mM MgCl2を含む緩衝液中で、室温で5分間フラグメント化させた。EDTAを0.025Mまで添加し、10μgのプロテアーゼKの存在下で70℃まで加熱することにより、反応を停止させた。DNAを、等量のフェノール:クロロホルム:イソアミルアルコール(25:24:1)で、等量のエーテルで一度抽出し、酢酸ナトリウムで沈殿させた。ClaIおよびS1ヌクレアーゼで線状化したプラスミドを上記のように脱リン酸化し、次いで、再び等量のフェノール:クロロホルム:イソアミルアルコール(25:24:1)で、等量のエーテルで一度抽出し、酢酸ナトリウムで沈殿させた。ランダムcDNAフラグメントをプラスミドDNAに挿入するために、線状化し脱リン酸化したプラスミド0.2mgをcDNAフラグメント1ngとともに、T4DNAリガーゼ(1.0U)の存在下で、10mlの反応量で15℃12時間インキュベートした。コントロールとして、線状化プラスミドを、リガーゼとともにcDNAフラグメントの非存在下でインキュベートし、cDNAフラグメントを、リガーゼとともに線状化ベクター非存在下でインキュベートした。次いで、DH10B E.coliを、10μlの各連結反応混合物とともに電気泳動させた。
【0147】
いくつかのE.coliコロニーを、X−Galプレート上で白色、中間または青色の表現型のいずれかを示す実験のベクター+挿入物アームにおいて同定した。cDNAフラグメントに連結されたClaIで線状化されたベクターから発生したコロニーのClaI部位についてのPCRから、100〜300塩基対のサイズの挿入を含有するいくつかのクローンが明らかとなった。これらのうちの3つを図7に示す。このように、cDNAフラグメントの遺伝的要素への挿入が、本発明で達成可能である。
【0148】
(実施例4:ランダムな位置での機能的変化)
lacオペロンは、遺伝的要素が容易に研究されるモデル系である。酵素β−ガラクトシダーゼは、LacZ遺伝子によりコードされるが、通常、環境中にラクトースが存在している場合にのみ産生される。酵素レベルの制御は、転写レベルで達成される。lacリプレッサータンパク質は、LacZのATG開始部位の上流のオペレーター配列に結合し、RNAポリメラーゼによる転写を阻害する。しかし、ラクトースの存在下では、リプレッサーはオペレーターから除去され、転写が進行し得る。プロモーター活性化の機構は、インデューサーであるラクトースのlacリプレッサーへの結合、および、そのオペレーターに対する親和性を劇的に低下させるアロステリック変化の発生によるものである。研究室での設定では、E.coliを比色分析用基質X−Gal上で平板培養することにより、LacZ転写を評価することができ、この基質は、β−ガラクトシダーゼにより加水分解された場合にはコロニーを青変させる。オペレーターは、ラクトースのアナログであるIPTGを用いて抑制解除可能であり、このIPTGは加水分解されず、かつ、lacリプレッサーに結合することによりLacZの転写を強力に誘導する。
【0149】
ランダム欠失が遺伝子機能に影響を与える能力を調べるため、pBluescriptII KS+プラスミドを、実施例1および2に記載したように、S1ヌクレアーゼで線状化し、ゲル精製し、脱リン酸化し、エキソヌクレアーゼIIIで消化させた。20ng/μlの線状化プラスミドを、10UのエキソヌクレアーゼIIIとともに、66mM Tris−Cl(pH7.4)、0.66mM MgCl2緩衝液中で、15℃にて5分間インキュベートし、次いで、50mM酢酸ナトリウム(pH4.5)、280mM NaCl、4.5mM ZnSO4および10UのS1ヌクレアーゼを含む1×S1溶液を添加し、室温で15分間インキュベートした。EDTAを0.025Mまで添加して、等量のフェノール:クロロホルム:イソアミルアルコール(25:24:1)で、等量のエーテルで一度抽出することにより、反応を停止させ、酢酸ナトリウムで沈殿させた。DNAを、1.0UのT4DNAリガーゼを含む1×T4DNAリガーゼ緩衝液中に再懸濁させ、15℃で12時間インキュベートした。次いで、連結反応物(1μl)を用いて、lacリプレッサータンパク質を産生するE.coli株TOP10F’(Invitrogen,Carlsbad,CA)をエレクトロポレーションした。E.coliを、インデューサーとしてのIPTGを含むかまたは含まずに、かつX−Galが存在するLBプレート上でインキュベートし、β−ガラクトシダーゼ活性を測定した。さらに、pBluescriptプラスミドを、IPTGの存在下または非存在下で、X−Galを含むプレート上で平板培養した。表2に実験の結果を示す。
(表2.β−ガラクトシダーゼの転写における機能性変化)
【0150】
【表2】
いくつかのコロニーは、欠失がランダムな位置で作られた実験アームにおける、インデューサーであるIPTGの非存在下で、LacZを転写する能力を獲得した。さらに、いくつかのコロニーは、IPTGの存在下で機能性β−ガラクトシダーゼを産生する能力を失った。pBluescript/欠失アームからのIPTGの存在下における1つの白色のコロニーについて配列決定し、翻訳開始部位に8個の塩基対の欠失を有することがわかった。この配列を以下に示し、ここで、メチオニンのコドンをコードする翻訳開始部位(ATG)に下線を付している。
【0151】
【化1】
(それぞれ配列番号1および配列番号2)
このように、プラスミドのランダムな切断、その後のエキソヌクレアーゼIIIにより作製される短い欠失により、遺伝的要素の調節領域およびタンパク質コード領域における機能性変化を引き起こすことができる。次いで、これらの変化は、その後機能性アッセイで検出可能である。
【0152】
【表3】
【図面の簡単な説明】
【図1】図1は、分子進化を選抜するための従来法である、DNAシャッフリングプロセスの図である。目的の遺伝子のホモログをフラグメント化して、このホモログからの一本鎖フラグメントが伸長反応において互いにプライム(prime)することができるように、変性および再アニーリングに供する。次いで、完全長遺伝子の増幅により、ハイブリッド遺伝子ライブラリーが生成される。次いで、遺伝子スクリーニングを適用して、変化した遺伝子または改善した遺伝子を選択する。
【図2】図2は、コンビナトリアル多様性を生成するV(D)J組換え、および結合部多様性を生成するDNA末端結合のプロセスを示す、免疫グロブリン重鎖遺伝子座の図である。
【図3】図3は、ポリヌクレオチドにおいてランダムな位置でヌクレオチド欠失およびヌクレオチド挿入を生じる方法の例を示す図である。標的遺伝子を切断して、各々がこの遺伝子中のランダムな位置でフラグメント化される遺伝子プールを生産する。残基は、DNA末端で欠失される(左)か、または挿入されて(右)、ランダムな位置で欠失、挿入、またはその両方を含むライブラリーを生産し得る。
【図4】図4は、ポリヌクレオチドのランダムな切断を示す図である。パネルA(図4A)では、DNAプラスミドpLacZi(Clontech,Palo Alto,CA)を、切断しなかった(レーン2)か、単一切断制限酵素ClaIで切断した(レーン3)か、または漸増濃度のS1ヌクレアーゼで切断した(レーン4〜7)。レーン1および8は、λ/HindIII DNAマーカーである。パネルB(図4B)では、pLacZiプラスミドを、切断しなかった(レーン2)か、ClaIで切断した(レーン3)か、またはS1ヌクレアーゼで切断した(レーン4)。S1で切断したpLacZi試料をゲル精製し、レーン5に泳動したか、またはClaIで切断してレーン6で泳動した。等量のDNAを、レーン2〜4(1μg)、およびレーン5〜6(100ng)で泳動した。レーン6のスメアは、S1による切断が、部位特異的ではないことを示す。レーン1および7は、λ/HindIII DNAマーカーを含有する。
【図5】図5は、DNA末端に短ヌクレオチド欠失を生じる方法の例を示す図である。エキソヌクレアーゼIIIは、塩依存性反応で、蛍光標識した232bpのDNAフラグメントの末端からヌクレオチドを欠失させる。塩が増加するにつれ、欠失数が減少する。
【図6】図6は、LacZ遺伝子中のヌクレオチドの欠失を示す図である。プラスミドpLacZiをClaIで切断し、図5に記載するようにエキソヌクレアーゼIIIで処理して、再連結させて、E.coliにエレクトロポレーションして、比色ラクトースアナログX−Galを含有するプレート上で平板培養した。青色または白色を有するクローンを取り出し、LB中で増殖させて、DNAを調製した。ClaI部位に隣接するプライマーを用いて、プラスミドをPCRに供した。ここで1つのプライマーを蛍光標識した。PCR産物を、ABI 373DNAシーケンサーで、6%変性アクリルアミドゲル上で泳動し、Ganescanソフトウェア(Perkin Elmer,Foster City,CA)で分析した。最上部パネルは、312bpフラグメントを生産する野生型LacZ遺伝子を用いたPCRを示す。クローン1〜6には、多様な短い欠失が存在していた。クローン1および6は、青色表現型を有し、2〜5は、白色表現型を有した。
【図7】図7は、pLacZi中に挿入を含有する3個のクローンを示す1.5%アガロースゲルである。CHO細胞のcDNAを、DNaseIでフラグメント化して、pLacZiのClaI部位に連結させて、E.coliにエレクトロポレーションし、X−Galプレート上で平板培養した。ClaI部位に隣接するプライマーを用いたプラスミドDNAのPCRにより、3個のクローンを分析した。1〜3と表示したレーンは、異なるサイズの挿入を含有するクローンであり、レーン4は、pLacZiである。最初のレーンおよび最後のレーン中のDNAは、ΦX174/Hae III DNAマーカーであり、右側に示した塩基対のサイズを有する。
Claims (51)
- 遺伝的要素の配列中の異なる位置にヌクレオチド欠失を有するポリヌクレオチド配列のライブラリーを生成するための方法であって、該方法は、以下の工程:
(a)該遺伝的要素を含む複数コピーの環状ポリヌクレオチドを、ランダムな切断に供して、複数の線状ポリヌクレオチドを獲得する工程であって、該ポリヌクレオチドの各々は、少なくとも1つの3’末端および5’末端を有する、工程;および
(b)工程(a)由来の該ポリヌクレオチドを、該ポリヌクレチドの該末端の1つから少なくとも1つのヌクレオチドを取り除くプロセスに供して、欠失ポリヌクレオチド配列のライブラリーを生成する工程であって、該ライブラリーは、異なるランダムな位置に欠失を有する複数の欠失ポリヌクレオチド配列を含む、工程、
を包含する、方法。 - 工程(b)由来の前記ポリヌクレオチドが、前記3’末端および5’末端を互いに共有結合するプロセスに供される、請求項1に記載の方法。
- 前記ポリヌクレオチドのライブラリーが、目的の機能について選択するプロセスにさらに供される、請求項1に記載の方法。
- 前記切断がエンドヌクレアーゼで生じる、請求項1に記載の方法。
- 前記エンドヌクレアーゼがS1である、請求項4に記載の方法。
- 前記欠失ポリヌクレオチドのライブラリーが、少なくとも5個の個々のポリヌクレオチドを含み、該ポリヌクレオチドの各々は、他のポリヌクレオチドとは異なる位置にランダムな欠失を有する請求項1に記載の方法。
- 前記欠失ポリヌクレオチドのライブラリーが、少なくとも10個の個々のポリヌクレオチドを含み、該ポリヌクレオチドの各々は、他のポリヌクレオチドとは異なる位置にランダムな欠失を有する請求項1に記載の方法。
- 前記欠失ポリヌクレオチドのライブラリーが、少なくとも30個の個々のポリヌクレオチドを含み、該ポリヌクレオチドの各々は、他のポリヌクレオチドとは異なる位置にランダムな欠失を有する請求項1に記載の方法。
- 前記複数コピーの環状ポリヌクレオチドの組成物が、前記遺伝的要素に対する天然に存在するホモログを含まない、請求項1に記載の方法。
- 工程(a)および(b)が繰り返される、請求項1に記載の方法。
- 工程(b)が欠失の位置にヌクレオチドを挿入するためのプロセスをさらに含む、請求項1に記載の方法。
- 工程(b)で1〜3個のヌクレオチドが欠失されている、請求項1に記載の方法。
- 工程(b)で50〜100個のヌクレオチドが欠失されている、請求項1に記載の方法。
- 実質的に純粋な組成物であって、該組成物は、異なる3’末端および5’末端を各々有する複数の線状ポリヌクレオチドのライブラリーを含むが、該線状ポリヌクレオチドの各々は、環状にされる場合、他のポリヌクレオチドと同一である、組成物。
- 前記ライブラリーが、異なる3’末端および5’末端を有する少なくとも5個のポリヌクレオチドを含む、請求項14に記載の組成物。
- 少なくとも2個の欠失ポリヌクレオチドのライブラリーを含む実質的に純粋な組成物であって、該ポリヌクレオチドは、異なるランダムな欠失を有することによってのみ各々他と異なる、組成物。
- 前記欠失ポリヌクレオチドが、欠失の位置に挿入された少なくとも1個のヌクレオチドを更に含む、請求項16に記載の実質的に純粋な組成物。
- 前記ライブラリーが、少なくとも5個のポリヌクレオチドを有する、請求項16に記載の組成物であって、該ポリヌクレオチドは、異なるランダムな欠失を有することによってのみ各々他と異なる、組成物。
- 遺伝的要素中のランダムな位置にヌクレオチド付加を有するポリヌクレオチド配列のライブラリーを生成するための方法であって、該方法は、以下の工程:
(a)該遺伝的要素を含む複数コピーの環状ポリヌクレオチドの組成物を、ランダムな切断に供して、複数の線状ポリヌクレオチドを獲得する工程であって、該ポリヌクレオチドの各々は、少なくとも1つの3’末端および5’末端を有する、工程;および
(b)工程(a)由来の該ポリヌクレオチドを、該ポリヌクレチドの該末端の1つに少なくとも1つのヌクレオチドを付加するプロセスに供して、付加ポリヌクレオチド配列のライブラリーを生成する工程であって、該ライブラリーは、異なるランダムな位置に付加を有する複数の付加配列を含む、工程、
を包含する、方法。 - 工程(b)由来の前記付加ポリヌクレオチドが、前記3’末端および5’末端を互いに共有結合するプロセスに供される、請求項19に記載の方法。
- 前記ポリヌクレオチドのライブラリーを、目的の機能について選択するプロセスに供する工程をさらに包含する、請求項19に記載の方法。
- 前記切断がエンドヌクレアーゼで生じる、請求項19に記載の方法。
- 前記エンドヌクレアーゼがS1である、請求項22に記載の方法。
- 前記付加ポリヌクレオチドのライブラリーが、少なくとも5個の個々のポリヌクレオチドを含み、該ポリヌクレオチドの各々は、他のポリヌクレオチドとは異なる位置にランダムな付加を有する、請求項19に記載の方法。
- 前記付加ポリヌクレオチドのライブラリーが、少なくとも10個の個々のポリヌクレオチドを含み、該ポリヌクレオチドの各々は、他のポリヌクレオチドとは異なる位置にランダムな付加を有する、請求項19に記載の方法。
- 前記付加ポリヌクレオチドのライブラリーが、少なくとも30個の個々のポリヌクレオチドを含み、該ポリヌクレオチドの各々は、他のポリヌクレオチドとは異なる位置にランダムな付加を有する、請求項19に記載の方法。
- 前記複数コピーの環状ポリヌクレオチドの組成物が、前記遺伝的要素に対する天然に存在するホモログを含まない、請求項19に記載の方法。
- 工程(a)および(b)が繰り返される、請求項19に記載の方法。
- 工程(b)が付加の位置でヌクレオチドを欠失させるためのプロセスを含む、請求項19に記載の方法。
- 工程(b)で1〜3個のヌクレオチドが付加されている、請求項19に記載の方法。
- 工程(b)で3〜50個のヌクレオチドが付加されている、請求項19に記載の方法。
- 工程(b)で50〜100個のヌクレオチドが付加されている、請求項19に記載の方法。
- 少なくとも2個の付加ポリヌクレオチドのライブラリーを含む実質的に純粋な組成物であって、該ポリヌクレオチドは、異なるランダムな付加を有することによってのみ各々他と異なる、組成物。
- 少なくとも5個の付加ポリヌクレオチドのライブラリーを含む実質的に純粋な組成物であって、該ポリヌクレオチドは、異なるランダムな付加を有することによってのみ各々他と異なる、組成物。
- ポリヌクレオチドの末端から短い欠失を生成するための方法であって、該方法は、10〜500mM塩の存在下で0℃〜24℃の温度にて、エキソヌクレアーゼと共に該ポリヌクレオチドの集団をインキュベートし、それにより、該ポリヌクレオチドの少なくとも1つの末端からの1〜100残基の欠失を含むポリヌクレオチドの集団を生成することによる、方法。
- 前記ポリヌクレオチドが二本鎖である、請求項35に記載の方法。
- 前記エキソヌクレアーゼがエキソヌクレアーゼIIIである、請求項35に記載の方法。
- 前記二本鎖核酸が、平滑末端を生成するために一本鎖エンドヌクレアーゼと共にインキュベートされる、請求項36に記載の方法。
- 請求項35に記載の方法であって、さらに、前記末端に欠失を含む前記得られたポリヌクレオチドの集団が、少なくとも第2の末端に共有結合され、内部位置に欠失を含むポリヌクレオチドの集団を生成する、方法。
- 前記一本鎖エンドヌクレアーゼがS1ヌクレアーゼである、請求項38に記載の方法。
- 共有結合から生じた前記ポリヌクレオチドが、環状ポリヌクレオチドである、請求項39に記載の方法。
- 前記ポリヌクレオチドの集団が、該ポリヌクレオチドの少なくとも1つの末端からの1〜50残基の欠失を含む、請求項35に記載の方法。
- 前記ポリヌクレオチドの集団が、該ポリヌクレオチドの少なくとも1つの末端からの1〜30残基の欠失を含む、請求項35に記載の方法。
- 少なくとも2個のポリヌクレオチドの実質的に純粋な組成物であって、該ポリヌクレオチドは、各々2つの末端を有し、そして1つの末端または両方の末端で1〜100残基の異なる欠失を有することによってのみ各々互いに異なる、組成物。
- 前記ポリヌクレオチドの組成物が、1つの末端または両方の末端で1〜50残基の欠失によって互いに異なる、請求項44に記載の組成物。
- 前記ポリヌクレオチドの組成物が、1つの末端または両方の末端で1〜30残基の欠失によって互いに異なる、請求項44に記載の組成物。
- 前記ポリヌクレオチドの組成物が、1つの末端または両方の末端で1〜10残基の欠失によって互いに異なる、請求項44に記載の組成物。
- 少なくとも2つのポリヌクレオチドの実質的に純粋な組成物であって、該組成物の各々は、該ポリヌクレオチド内の特定の内部位置での1〜100残基の欠失によってのみ互いに異なる、組成物。
- 前記ポリヌクレオチドが、前記特定の内部位置での1〜50残基の欠失によって互いに異なる、請求項48に記載の実質的に純粋な組成物。
- 前記ポリヌクレオチドが、前記特定の内部位置での1〜30残基の欠失によって互いに異なる、請求項48に記載の実質的に純粋な組成物。
- 前記ポリヌクレオチドが、前記特定の内部位置での1〜10残基の欠失によって互いに異なる、請求項48に記載の実質的に純粋な組成物。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US22647700P | 2000-08-18 | 2000-08-18 | |
| PCT/US2001/025788 WO2002016642A1 (en) | 2000-08-18 | 2001-08-17 | Methods and compositions for directed molecular evolution using dna-end modification |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2004507247A true JP2004507247A (ja) | 2004-03-11 |
Family
ID=22849054
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002522312A Withdrawn JP2004507247A (ja) | 2000-08-18 | 2001-08-17 | Dna末端改変を使用する指向された分子進化のための方法および組成物 |
Country Status (5)
| Country | Link |
|---|---|
| EP (1) | EP1311709A4 (ja) |
| JP (1) | JP2004507247A (ja) |
| AU (1) | AU2001286528A1 (ja) |
| CA (1) | CA2419961A1 (ja) |
| WO (1) | WO2002016642A1 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011518564A (ja) * | 2008-04-23 | 2011-06-30 | ダニスコ・ユーエス・インク | 改良された微生物によるイソプレン産出用のイソプレンシンターゼ変異体 |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5791724B2 (ja) * | 2010-09-24 | 2015-10-07 | コバリス,インコーポレイテッド | 核酸を断片化する方法及び装置 |
-
2001
- 2001-08-17 CA CA002419961A patent/CA2419961A1/en not_active Abandoned
- 2001-08-17 WO PCT/US2001/025788 patent/WO2002016642A1/en not_active Ceased
- 2001-08-17 AU AU2001286528A patent/AU2001286528A1/en not_active Abandoned
- 2001-08-17 JP JP2002522312A patent/JP2004507247A/ja not_active Withdrawn
- 2001-08-17 EP EP01965982A patent/EP1311709A4/en not_active Withdrawn
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011518564A (ja) * | 2008-04-23 | 2011-06-30 | ダニスコ・ユーエス・インク | 改良された微生物によるイソプレン産出用のイソプレンシンターゼ変異体 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP1311709A4 (en) | 2006-08-02 |
| EP1311709A1 (en) | 2003-05-21 |
| WO2002016642A9 (en) | 2003-03-27 |
| WO2002016642A1 (en) | 2002-02-28 |
| AU2001286528A1 (en) | 2002-03-04 |
| CA2419961A1 (en) | 2002-02-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11939604B2 (en) | Modified cascade ribonucleoproteins and uses thereof | |
| US6251604B1 (en) | Random mutagenesis and amplification of nucleic acid | |
| US7087415B2 (en) | Methods and compositions for directed gene assembly | |
| CN107922931B (zh) | 热稳定的Cas9核酸酶 | |
| US6261808B1 (en) | Amplification of nucleic acid molecules via circular replicons | |
| KR102772997B1 (ko) | Acidaminococcus sp. cpf1의 dna 절단 활성을 향상시키는 신규한 돌연변이 | |
| JP6552969B2 (ja) | 定方向進化のためのライブラリーの作製方法 | |
| EP3594341A1 (en) | Rna-directed dna cleavage by the cas9-crrna complex | |
| AU4441699A (en) | Method for producing polynucleotides with desired properties | |
| US20100015667A1 (en) | Method of in vitro polynucleotide sequences shuffling by recursive circular dna molecules fragmentation and ligation | |
| CN116179513B (zh) | 一种Cpf1蛋白及其在基因编辑中的应用 | |
| LT5263B (lt) | Grandines specifiškai nikuojančių endonukleazių konstravimo iš restrikcijos endonukleazių būdas | |
| JP2005536213A (ja) | ポリヌクレオチドの選択的組合せランダム化の方法 | |
| JP2004507247A (ja) | Dna末端改変を使用する指向された分子進化のための方法および組成物 | |
| Chaudhuri | Recombinant DNA technology | |
| IL305151B1 (en) | Analyzing expression of protein-coding variants in cells | |
| CN117327683B (zh) | 一种在DNA的gC基序上实现高效C/G到T/A编辑的高保真LnCBE系统 | |
| Mallon et al. | Target discrimination and PAM profiling of the Thermotoga maritima type IB CRISPR system | |
| US20030092023A1 (en) | Method of shuffling polynucleotides using templates | |
| Berta | Analysis of specific cis-acting DNA sequences of the Himar1 mariner transposon | |
| JP2009125008A (ja) | ハイブリッドポリヌクレオチドの作製方法 | |
| KR20000015984A (ko) | 무작위 프라이머 또는 일정 프라이머를 이용한폴리뉴클레오티드 서열의 재조합 방법 | |
| KR20000022394A (ko) | 부위특이적변이도입방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20081104 |
