BRPI0714870A2 - mÉtodo para produzir um polipeptÍdeo secretado tendo atividade biolàgica, proteÍna de fusço isolada, polinucleotÍdeo isolado, construÇço de proteÍna de fusço, vetor de expressço, cÉlula hospedeira féngica, mÉtodos para degradar ou conventer um material celulàsico e para produzir uma substÂncia - Google Patents
mÉtodo para produzir um polipeptÍdeo secretado tendo atividade biolàgica, proteÍna de fusço isolada, polinucleotÍdeo isolado, construÇço de proteÍna de fusço, vetor de expressço, cÉlula hospedeira féngica, mÉtodos para degradar ou conventer um material celulàsico e para produzir uma substÂncia Download PDFInfo
- Publication number
- BRPI0714870A2 BRPI0714870A2 BRPI0714870-4A BRPI0714870A BRPI0714870A2 BR PI0714870 A2 BRPI0714870 A2 BR PI0714870A2 BR PI0714870 A BRPI0714870 A BR PI0714870A BR PI0714870 A2 BRPI0714870 A2 BR PI0714870A2
- Authority
- BR
- Brazil
- Prior art keywords
- polypeptide
- fusion protein
- endoglucanase
- polynucleotide
- catalytic domain
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 632
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 624
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 611
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 354
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 354
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 354
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 221
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 216
- 230000004071 biological effect Effects 0.000 title claims abstract description 164
- 238000000034 method Methods 0.000 title claims abstract description 141
- 239000000463 material Substances 0.000 title claims abstract description 40
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 38
- 239000013604 expression vector Substances 0.000 title claims abstract description 13
- 239000000126 substance Substances 0.000 title claims description 28
- 230000000593 degrading effect Effects 0.000 title claims description 5
- 108010059892 Cellulase Proteins 0.000 claims abstract description 312
- 230000003197 catalytic effect Effects 0.000 claims abstract description 219
- 108010076504 Protein Sorting Signals Proteins 0.000 claims abstract description 171
- 230000002538 fungal effect Effects 0.000 claims abstract description 24
- 230000028327 secretion Effects 0.000 claims abstract description 17
- 238000012258 culturing Methods 0.000 claims abstract description 7
- 239000001963 growth medium Substances 0.000 claims abstract description 6
- 230000001131 transforming effect Effects 0.000 claims abstract description 5
- 125000003729 nucleotide group Chemical group 0.000 claims description 221
- 239000002773 nucleotide Substances 0.000 claims description 219
- 210000004027 cell Anatomy 0.000 claims description 115
- 108090000623 proteins and genes Proteins 0.000 claims description 114
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 104
- 102000004190 Enzymes Human genes 0.000 claims description 91
- 108090000790 Enzymes Proteins 0.000 claims description 91
- 229940088598 enzyme Drugs 0.000 claims description 91
- 108010047754 beta-Glucosidase Proteins 0.000 claims description 85
- 238000000855 fermentation Methods 0.000 claims description 82
- 230000004151 fermentation Effects 0.000 claims description 81
- 102000006995 beta-Glucosidase Human genes 0.000 claims description 76
- 230000001461 cytolytic effect Effects 0.000 claims description 64
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 58
- 102000004169 proteins and genes Human genes 0.000 claims description 55
- 230000000694 effects Effects 0.000 claims description 50
- 108010038196 saccharide-binding proteins Proteins 0.000 claims description 50
- 239000000203 mixture Substances 0.000 claims description 42
- 150000001413 amino acids Chemical class 0.000 claims description 31
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 claims description 30
- 108090000371 Esterases Proteins 0.000 claims description 27
- 150000007524 organic acids Chemical class 0.000 claims description 27
- 230000008569 process Effects 0.000 claims description 24
- -1 immunodilator Substances 0.000 claims description 20
- 244000005700 microbiome Species 0.000 claims description 18
- 229940106157 cellulase Drugs 0.000 claims description 13
- 230000007062 hydrolysis Effects 0.000 claims description 13
- 238000006460 hydrolysis reaction Methods 0.000 claims description 13
- 108091005804 Peptidases Proteins 0.000 claims description 12
- 241001480714 Humicola insolens Species 0.000 claims description 11
- 238000003776 cleavage reaction Methods 0.000 claims description 11
- 230000007017 scission Effects 0.000 claims description 11
- 108010002430 hemicellulase Proteins 0.000 claims description 10
- 102000004157 Hydrolases Human genes 0.000 claims description 9
- 108090000604 Hydrolases Proteins 0.000 claims description 9
- 210000004899 c-terminal region Anatomy 0.000 claims description 9
- 239000004365 Protease Substances 0.000 claims description 8
- 230000002708 enhancing effect Effects 0.000 claims description 8
- 230000004927 fusion Effects 0.000 claims description 8
- 230000002573 hemicellulolytic effect Effects 0.000 claims description 8
- 102000003992 Peroxidases Human genes 0.000 claims description 7
- 150000002576 ketones Chemical class 0.000 claims description 6
- 108010029541 Laccase Proteins 0.000 claims description 5
- 102000004316 Oxidoreductases Human genes 0.000 claims description 5
- 108090000854 Oxidoreductases Proteins 0.000 claims description 5
- 108040007629 peroxidase activity proteins Proteins 0.000 claims description 5
- 102000004195 Isomerases Human genes 0.000 claims description 4
- 108090000769 Isomerases Proteins 0.000 claims description 4
- 102000004357 Transferases Human genes 0.000 claims description 4
- 108090000992 Transferases Proteins 0.000 claims description 4
- 108700042778 Antimicrobial Peptides Proteins 0.000 claims description 3
- 102000044503 Antimicrobial Peptides Human genes 0.000 claims description 3
- 102000003960 Ligases Human genes 0.000 claims description 3
- 108090000364 Ligases Proteins 0.000 claims description 3
- 102000004317 Lyases Human genes 0.000 claims description 3
- 108090000856 Lyases Proteins 0.000 claims description 3
- 101710172711 Structural protein Proteins 0.000 claims description 3
- 239000000427 antigen Substances 0.000 claims description 3
- 102000036639 antigens Human genes 0.000 claims description 3
- 108091007433 antigens Proteins 0.000 claims description 3
- 239000003102 growth factor Substances 0.000 claims description 3
- 229940059442 hemicellulase Drugs 0.000 claims description 3
- 239000005556 hormone Substances 0.000 claims description 3
- 229940088597 hormone Drugs 0.000 claims description 3
- 239000002858 neurotransmitter agent Substances 0.000 claims description 3
- 239000003910 polypeptide antibiotic agent Substances 0.000 claims description 3
- 108020003175 receptors Proteins 0.000 claims description 3
- 102000005962 receptors Human genes 0.000 claims description 3
- 239000003446 ligand Substances 0.000 claims description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims 1
- 230000014616 translation Effects 0.000 abstract description 9
- 238000010276 construction Methods 0.000 abstract description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 64
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 64
- 235000018102 proteins Nutrition 0.000 description 47
- 108091026890 Coding region Proteins 0.000 description 46
- 229920002678 cellulose Polymers 0.000 description 38
- 239000001913 cellulose Substances 0.000 description 38
- 241000223218 Fusarium Species 0.000 description 35
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 34
- 239000013598 vector Substances 0.000 description 29
- 235000001014 amino acid Nutrition 0.000 description 28
- 241000233866 Fungi Species 0.000 description 24
- 241000228212 Aspergillus Species 0.000 description 23
- 238000002360 preparation method Methods 0.000 description 23
- 241001494489 Thielavia Species 0.000 description 22
- 108020004414 DNA Proteins 0.000 description 20
- 241000193830 Bacillus <bacterium> Species 0.000 description 19
- 239000002609 medium Substances 0.000 description 18
- 240000006439 Aspergillus oryzae Species 0.000 description 17
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 17
- 230000010076 replication Effects 0.000 description 17
- 108010092413 endoglucanase V Proteins 0.000 description 15
- 102000039446 nucleic acids Human genes 0.000 description 15
- 108020004707 nucleic acids Proteins 0.000 description 15
- 150000007523 nucleic acids Chemical class 0.000 description 15
- 239000000523 sample Substances 0.000 description 15
- 108010065511 Amylases Proteins 0.000 description 13
- 239000002028 Biomass Substances 0.000 description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 description 13
- 239000012634 fragment Substances 0.000 description 13
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 12
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 12
- 241000499912 Trichoderma reesei Species 0.000 description 12
- 239000002299 complementary DNA Substances 0.000 description 12
- 102000013142 Amylases Human genes 0.000 description 11
- 241000228245 Aspergillus niger Species 0.000 description 11
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 11
- 235000019418 amylase Nutrition 0.000 description 11
- 230000001580 bacterial effect Effects 0.000 description 11
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 11
- 239000008103 glucose Substances 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- 239000000047 product Substances 0.000 description 11
- 230000001105 regulatory effect Effects 0.000 description 11
- 108010013043 Acetylesterase Proteins 0.000 description 10
- 239000004382 Amylase Substances 0.000 description 10
- 108010084185 Cellulases Proteins 0.000 description 10
- 241000223221 Fusarium oxysporum Species 0.000 description 10
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 10
- 102000035195 Peptidases Human genes 0.000 description 10
- 125000000539 amino acid group Chemical group 0.000 description 10
- 229910052799 carbon Inorganic materials 0.000 description 10
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 10
- 239000002853 nucleic acid probe Substances 0.000 description 10
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 9
- 102000005575 Cellulases Human genes 0.000 description 9
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 9
- 229920002488 Hemicellulose Polymers 0.000 description 9
- 108090001060 Lipase Proteins 0.000 description 9
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 9
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 9
- 239000003599 detergent Substances 0.000 description 9
- 150000004804 polysaccharides Chemical class 0.000 description 9
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 9
- 241000235070 Saccharomyces Species 0.000 description 8
- 241001271171 Thielavia terrestris NRRL 8126 Species 0.000 description 8
- 108090000637 alpha-Amylases Proteins 0.000 description 8
- 230000027455 binding Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 235000000346 sugar Nutrition 0.000 description 8
- 241000894006 Bacteria Species 0.000 description 7
- 241000221198 Basidiomycota Species 0.000 description 7
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 7
- 241000567178 Fusarium venenatum Species 0.000 description 7
- 102000004882 Lipase Human genes 0.000 description 7
- 241001495429 Thielavia terrestris Species 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 239000007789 gas Substances 0.000 description 7
- 229920001282 polysaccharide Polymers 0.000 description 7
- 239000005017 polysaccharide Substances 0.000 description 7
- 239000007787 solid Substances 0.000 description 7
- 241000894007 species Species 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 229920001221 xylan Polymers 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 6
- 241000351920 Aspergillus nidulans Species 0.000 description 6
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 6
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 6
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 6
- RGHNJXZEOKUKBD-SQOUGZDYSA-N D-gluconic acid Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)=O RGHNJXZEOKUKBD-SQOUGZDYSA-N 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 239000004367 Lipase Substances 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 102100036617 Monoacylglycerol lipase ABHD2 Human genes 0.000 description 6
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 6
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 6
- 235000010633 broth Nutrition 0.000 description 6
- 150000001720 carbohydrates Chemical group 0.000 description 6
- 235000014633 carbohydrates Nutrition 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 6
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 108010038658 exo-1,4-beta-D-xylosidase Proteins 0.000 description 6
- 229920005610 lignin Polymers 0.000 description 6
- 235000019421 lipase Nutrition 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 6
- 230000007935 neutral effect Effects 0.000 description 6
- 230000008488 polyadenylation Effects 0.000 description 6
- 150000008163 sugars Chemical class 0.000 description 6
- 150000004823 xylans Chemical class 0.000 description 6
- 241001225321 Aspergillus fumigatus Species 0.000 description 5
- 244000063299 Bacillus subtilis Species 0.000 description 5
- 235000014469 Bacillus subtilis Nutrition 0.000 description 5
- 241000146406 Fusarium heterosporum Species 0.000 description 5
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 5
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 5
- 238000002105 Southern blotting Methods 0.000 description 5
- 101000693619 Starmerella bombicola Lactone esterase Proteins 0.000 description 5
- 241000223258 Thermomyces lanuginosus Species 0.000 description 5
- 241000223259 Trichoderma Species 0.000 description 5
- 239000002253 acid Substances 0.000 description 5
- 102000004139 alpha-Amylases Human genes 0.000 description 5
- 229940024171 alpha-amylase Drugs 0.000 description 5
- 229940091771 aspergillus fumigatus Drugs 0.000 description 5
- 108010055059 beta-Mannosidase Proteins 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 239000003054 catalyst Substances 0.000 description 5
- 101150114858 cbh2 gene Proteins 0.000 description 5
- 108010005400 cutinase Proteins 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 230000002255 enzymatic effect Effects 0.000 description 5
- 230000007071 enzymatic hydrolysis Effects 0.000 description 5
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 5
- 108010041969 feruloyl esterase Proteins 0.000 description 5
- 238000009396 hybridization Methods 0.000 description 5
- 229910052739 hydrogen Inorganic materials 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 239000004310 lactic acid Substances 0.000 description 5
- 235000014655 lactic acid Nutrition 0.000 description 5
- HEBKCHPVOIAQTA-UHFFFAOYSA-N meso ribitol Natural products OCC(O)C(O)C(O)CO HEBKCHPVOIAQTA-UHFFFAOYSA-N 0.000 description 5
- 235000015097 nutrients Nutrition 0.000 description 5
- 230000037361 pathway Effects 0.000 description 5
- 230000003248 secreting effect Effects 0.000 description 5
- 239000013589 supplement Substances 0.000 description 5
- ALRHLSYJTWAHJZ-UHFFFAOYSA-N 3-hydroxypropionic acid Chemical compound OCCC(O)=O ALRHLSYJTWAHJZ-UHFFFAOYSA-N 0.000 description 4
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 4
- 241001513093 Aspergillus awamori Species 0.000 description 4
- 241000892910 Aspergillus foetidus Species 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- 108010001817 Endo-1,4-beta Xylanases Proteins 0.000 description 4
- 108010062466 Enzyme Precursors Proteins 0.000 description 4
- 102000010911 Enzyme Precursors Human genes 0.000 description 4
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 4
- 241000567163 Fusarium cerealis Species 0.000 description 4
- 241000221779 Fusarium sambucinum Species 0.000 description 4
- 101150108358 GLAA gene Proteins 0.000 description 4
- 229920001503 Glucan Polymers 0.000 description 4
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 4
- 101001035458 Humicola insolens Endoglucanase-5 Proteins 0.000 description 4
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 4
- 102100027612 Kallikrein-11 Human genes 0.000 description 4
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- 239000004472 Lysine Substances 0.000 description 4
- OFOBLEOULBTSOW-UHFFFAOYSA-N Malonic acid Chemical compound OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 4
- 101710152431 Trypsin-like protease Proteins 0.000 description 4
- WNLRTRBMVRJNCN-UHFFFAOYSA-N adipic acid Chemical compound OC(=O)CCCCC(O)=O WNLRTRBMVRJNCN-UHFFFAOYSA-N 0.000 description 4
- 108010030291 alpha-Galactosidase Proteins 0.000 description 4
- 102000005840 alpha-Galactosidase Human genes 0.000 description 4
- 108010005774 beta-Galactosidase Proteins 0.000 description 4
- 102000005936 beta-Galactosidase Human genes 0.000 description 4
- 239000012876 carrier material Substances 0.000 description 4
- 210000002421 cell wall Anatomy 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- XBDQKXXYIPTUBI-UHFFFAOYSA-N dimethylselenoniopropionate Natural products CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 229910052500 inorganic mineral Inorganic materials 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 4
- 239000011707 mineral Substances 0.000 description 4
- 235000010755 mineral Nutrition 0.000 description 4
- 238000003259 recombinant expression Methods 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- DNIAPMSPPWPWGF-VKHMYHEASA-N (+)-propylene glycol Chemical compound C[C@H](O)CO DNIAPMSPPWPWGF-VKHMYHEASA-N 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- YPFDHNVEDLHUCE-UHFFFAOYSA-N 1,3-propanediol Substances OCCCO YPFDHNVEDLHUCE-UHFFFAOYSA-N 0.000 description 3
- 102000004400 Aminopeptidases Human genes 0.000 description 3
- 108090000915 Aminopeptidases Proteins 0.000 description 3
- 241000223651 Aureobasidium Species 0.000 description 3
- 229920002498 Beta-glucan Polymers 0.000 description 3
- 102100032487 Beta-mannosidase Human genes 0.000 description 3
- 101150020139 CEL6B gene Proteins 0.000 description 3
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 3
- 108010006303 Carboxypeptidases Proteins 0.000 description 3
- 102000005367 Carboxypeptidases Human genes 0.000 description 3
- 241001619326 Cephalosporium Species 0.000 description 3
- 108010022172 Chitinases Proteins 0.000 description 3
- 102000012286 Chitinases Human genes 0.000 description 3
- 241000123346 Chrysosporium Species 0.000 description 3
- 241000259811 Cladorrhinum foecundissimum Species 0.000 description 3
- 241000193403 Clostridium Species 0.000 description 3
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 3
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 3
- RGHNJXZEOKUKBD-UHFFFAOYSA-N D-gluconic acid Natural products OCC(O)C(O)C(O)C(O)C(O)=O RGHNJXZEOKUKBD-UHFFFAOYSA-N 0.000 description 3
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 3
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 241000235649 Kluyveromyces Species 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- 241001344133 Magnaporthe Species 0.000 description 3
- 241000221961 Neurospora crassa Species 0.000 description 3
- 102000015439 Phospholipases Human genes 0.000 description 3
- 108010064785 Phospholipases Proteins 0.000 description 3
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 3
- 101100112955 Podospora anserina (strain S / ATCC MYA-4624 / DSM 980 / FGSC 10383) CEL6C gene Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- KDYFGRWQOYBRFD-UHFFFAOYSA-N Succinic acid Natural products OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 3
- TVXBFESIOXBWNM-UHFFFAOYSA-N Xylitol Natural products OCCC(O)C(O)C(O)CCO TVXBFESIOXBWNM-UHFFFAOYSA-N 0.000 description 3
- 241000235013 Yarrowia Species 0.000 description 3
- 241000588902 Zymomonas mobilis Species 0.000 description 3
- 108010048241 acetamidase Proteins 0.000 description 3
- 239000000654 additive Substances 0.000 description 3
- 230000000996 additive effect Effects 0.000 description 3
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 3
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 3
- 108010009043 arylesterase Proteins 0.000 description 3
- 102000028848 arylesterase Human genes 0.000 description 3
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 239000001569 carbon dioxide Substances 0.000 description 3
- 229910002092 carbon dioxide Inorganic materials 0.000 description 3
- 229910002091 carbon monoxide Inorganic materials 0.000 description 3
- 108010080434 cephalosporin-C deacetylase Proteins 0.000 description 3
- 235000013339 cereals Nutrition 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 108010091371 endoglucanase 1 Proteins 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 239000000446 fuel Substances 0.000 description 3
- 229930182830 galactose Natural products 0.000 description 3
- 239000000174 gluconic acid Substances 0.000 description 3
- 235000012208 gluconic acid Nutrition 0.000 description 3
- 229950006191 gluconic acid Drugs 0.000 description 3
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 125000003147 glycosyl group Chemical group 0.000 description 3
- 239000008187 granular material Substances 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 229920000166 polytrimethylene carbonate Polymers 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 235000019419 proteases Nutrition 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 239000000600 sorbitol Substances 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 229940088594 vitamin Drugs 0.000 description 3
- 229930003231 vitamin Natural products 0.000 description 3
- 235000013343 vitamin Nutrition 0.000 description 3
- 239000011782 vitamin Substances 0.000 description 3
- 239000002023 wood Substances 0.000 description 3
- 239000000811 xylitol Substances 0.000 description 3
- HEBKCHPVOIAQTA-SCDXWVJYSA-N xylitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)CO HEBKCHPVOIAQTA-SCDXWVJYSA-N 0.000 description 3
- 235000010447 xylitol Nutrition 0.000 description 3
- 229960002675 xylitol Drugs 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 2
- BJEPYKJPYRNKOW-REOHCLBHSA-N (S)-malic acid Chemical compound OC(=O)[C@@H](O)CC(O)=O BJEPYKJPYRNKOW-REOHCLBHSA-N 0.000 description 2
- RTBFRGCFXZNCOE-UHFFFAOYSA-N 1-methylsulfonylpiperidin-4-one Chemical compound CS(=O)(=O)N1CCC(=O)CC1 RTBFRGCFXZNCOE-UHFFFAOYSA-N 0.000 description 2
- ZIIUUSVHCHPIQD-UHFFFAOYSA-N 2,4,6-trimethyl-N-[3-(trifluoromethyl)phenyl]benzenesulfonamide Chemical compound CC1=CC(C)=CC(C)=C1S(=O)(=O)NC1=CC=CC(C(F)(F)F)=C1 ZIIUUSVHCHPIQD-UHFFFAOYSA-N 0.000 description 2
- RXMWXENJQAINCC-DMTCNVIQSA-N 2,5-didehydro-D-gluconic acid Chemical compound OCC(=O)[C@@H](O)[C@H](O)C(=O)C(O)=O RXMWXENJQAINCC-DMTCNVIQSA-N 0.000 description 2
- RXMWXENJQAINCC-UHFFFAOYSA-N 2,5-diketo-D-gluconic acid Natural products OCC(=O)C(O)C(O)C(=O)C(O)=O RXMWXENJQAINCC-UHFFFAOYSA-N 0.000 description 2
- JAHNSTQSQJOJLO-UHFFFAOYSA-N 2-(3-fluorophenyl)-1h-imidazole Chemical compound FC1=CC=CC(C=2NC=CN=2)=C1 JAHNSTQSQJOJLO-UHFFFAOYSA-N 0.000 description 2
- BWLBGMIXKSTLSX-UHFFFAOYSA-N 2-hydroxyisobutyric acid Chemical compound CC(C)(O)C(O)=O BWLBGMIXKSTLSX-UHFFFAOYSA-N 0.000 description 2
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 2
- ALYNCZNDIQEVRV-UHFFFAOYSA-N 4-aminobenzoic acid Chemical compound NC1=CC=C(C(O)=O)C=C1 ALYNCZNDIQEVRV-UHFFFAOYSA-N 0.000 description 2
- 108010011619 6-Phytase Proteins 0.000 description 2
- 241001438635 Acremonium brachypenium Species 0.000 description 2
- 241000228209 Acremonium persicinum Species 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 2
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 2
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- 102000004580 Aspartic Acid Proteases Human genes 0.000 description 2
- 108010017640 Aspartic Acid Proteases Proteins 0.000 description 2
- 241000228215 Aspergillus aculeatus Species 0.000 description 2
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- 241000193749 Bacillus coagulans Species 0.000 description 2
- 102100035687 Bile salt-activated lipase Human genes 0.000 description 2
- 241000193764 Brevibacillus brevis Species 0.000 description 2
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 2
- 108010053835 Catalase Proteins 0.000 description 2
- 102100035882 Catalase Human genes 0.000 description 2
- 108010031396 Catechol oxidase Proteins 0.000 description 2
- 102000030523 Catechol oxidase Human genes 0.000 description 2
- 241000146399 Ceriporiopsis Species 0.000 description 2
- 229920002101 Chitin Polymers 0.000 description 2
- 241000259808 Cladorrhinum Species 0.000 description 2
- 241000222511 Coprinus Species 0.000 description 2
- 244000251987 Coprinus macrorhizus Species 0.000 description 2
- 235000001673 Coprinus macrorhizus Nutrition 0.000 description 2
- 108010025880 Cyclomaltodextrin glucanotransferase Proteins 0.000 description 2
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 2
- HEBKCHPVOIAQTA-QWWZWVQMSA-N D-arabinitol Chemical compound OC[C@@H](O)C(O)[C@H](O)CO HEBKCHPVOIAQTA-QWWZWVQMSA-N 0.000 description 2
- QXKAIJAYHKCRRA-UHFFFAOYSA-N D-lyxonic acid Natural products OCC(O)C(O)C(O)C(O)=O QXKAIJAYHKCRRA-UHFFFAOYSA-N 0.000 description 2
- QXKAIJAYHKCRRA-FLRLBIABSA-N D-xylonic acid Chemical compound OC[C@@H](O)[C@H](O)[C@@H](O)C(O)=O QXKAIJAYHKCRRA-FLRLBIABSA-N 0.000 description 2
- 239000003298 DNA probe Substances 0.000 description 2
- 101710132690 Endo-1,4-beta-xylanase A Proteins 0.000 description 2
- 101710098247 Exoglucanase 1 Proteins 0.000 description 2
- 241000223194 Fusarium culmorum Species 0.000 description 2
- 241000223195 Fusarium graminearum Species 0.000 description 2
- 241001112697 Fusarium reticulatum Species 0.000 description 2
- 241001465753 Fusarium torulosum Species 0.000 description 2
- 102000048120 Galactokinases Human genes 0.000 description 2
- 108700023157 Galactokinases Proteins 0.000 description 2
- IAJILQKETJEXLJ-UHFFFAOYSA-N Galacturonsaeure Natural products O=CC(O)C(O)C(O)C(O)C(O)=O IAJILQKETJEXLJ-UHFFFAOYSA-N 0.000 description 2
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 2
- 102100022624 Glucoamylase Human genes 0.000 description 2
- 108010060309 Glucuronidase Proteins 0.000 description 2
- 102000053187 Glucuronidase Human genes 0.000 description 2
- 101000854529 Haloferax volcanii (strain ATCC 29605 / DSM 3757 / JCM 8879 / NBRC 14742 / NCIMB 2012 / VKM B-1768 / DS2) Pentonolactonase XacC Proteins 0.000 description 2
- 102100031415 Hepatic triacylglycerol lipase Human genes 0.000 description 2
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 2
- 241000223198 Humicola Species 0.000 description 2
- 241000223199 Humicola grisea Species 0.000 description 2
- 241000222342 Irpex Species 0.000 description 2
- 244000285963 Kluyveromyces fragilis Species 0.000 description 2
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 108010013563 Lipoprotein Lipase Proteins 0.000 description 2
- 102100024295 Maltase-glucoamylase Human genes 0.000 description 2
- 102000001696 Mannosidases Human genes 0.000 description 2
- 108010054377 Mannosidases Proteins 0.000 description 2
- 101000723939 Mus musculus Transcription factor HIVEP3 Proteins 0.000 description 2
- 241000226677 Myceliophthora Species 0.000 description 2
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 2
- 241000588653 Neisseria Species 0.000 description 2
- 241000233892 Neocallimastix Species 0.000 description 2
- 241000221960 Neurospora Species 0.000 description 2
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 2
- 241000233654 Oomycetes Species 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 241001496963 Penicillium brasilianum Species 0.000 description 2
- 108700020962 Peroxidase Proteins 0.000 description 2
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 2
- 108010059820 Polygalacturonase Proteins 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 108020004518 RNA Probes Proteins 0.000 description 2
- 239000003391 RNA probe Substances 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- VYGQUTWHTHXGQB-FFHKNEKCSA-N Retinol Palmitate Chemical compound CCCCCCCCCCCCCCCC(=O)OC\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C VYGQUTWHTHXGQB-FFHKNEKCSA-N 0.000 description 2
- 241000235403 Rhizomucor miehei Species 0.000 description 2
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 241000194017 Streptococcus Species 0.000 description 2
- 241000194048 Streptococcus equi Species 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- 241000187432 Streptomyces coelicolor Species 0.000 description 2
- 241000187398 Streptomyces lividans Species 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 241000203780 Thermobifida fusca Species 0.000 description 2
- 241001313536 Thermothelomyces thermophila Species 0.000 description 2
- 241000183053 Thielavia subthermophila Species 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 241000222354 Trametes Species 0.000 description 2
- 108060008539 Transglutaminase Proteins 0.000 description 2
- 241000223260 Trichoderma harzianum Species 0.000 description 2
- 241000378866 Trichoderma koningii Species 0.000 description 2
- 102000014384 Type C Phospholipases Human genes 0.000 description 2
- 108010079194 Type C Phospholipases Proteins 0.000 description 2
- 241000202898 Ureaplasma Species 0.000 description 2
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 2
- 229920002000 Xyloglucan Polymers 0.000 description 2
- 108700040099 Xylose isomerases Proteins 0.000 description 2
- 108010093941 acetylxylan esterase Proteins 0.000 description 2
- 108010058834 acylcarnitine hydrolase Proteins 0.000 description 2
- 239000001361 adipic acid Substances 0.000 description 2
- 235000011037 adipic acid Nutrition 0.000 description 2
- IAJILQKETJEXLJ-QTBDOELSSA-N aldehydo-D-glucuronic acid Chemical compound O=C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C(O)=O IAJILQKETJEXLJ-QTBDOELSSA-N 0.000 description 2
- 108010028144 alpha-Glucosidases Proteins 0.000 description 2
- 108010061261 alpha-glucuronidase Proteins 0.000 description 2
- BJEPYKJPYRNKOW-UHFFFAOYSA-N alpha-hydroxysuccinic acid Natural products OC(=O)C(O)CC(O)=O BJEPYKJPYRNKOW-UHFFFAOYSA-N 0.000 description 2
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- JFCQEDHGNNZCLN-UHFFFAOYSA-N anhydrous glutaric acid Natural products OC(=O)CCCC(O)=O JFCQEDHGNNZCLN-UHFFFAOYSA-N 0.000 description 2
- 235000010323 ascorbic acid Nutrition 0.000 description 2
- 239000011668 ascorbic acid Substances 0.000 description 2
- 229960005070 ascorbic acid Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 229940054340 bacillus coagulans Drugs 0.000 description 2
- 108010049297 beta-L-arabinosidase Proteins 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 235000013361 beverage Nutrition 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 235000015165 citric acid Nutrition 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000013256 coordination polymer Substances 0.000 description 2
- 235000013365 dairy product Nutrition 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 229940079919 digestives enzyme preparation Drugs 0.000 description 2
- 238000004821 distillation Methods 0.000 description 2
- 108010091384 endoglucanase 2 Proteins 0.000 description 2
- 238000001704 evaporation Methods 0.000 description 2
- 230000008020 evaporation Effects 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 2
- 235000019253 formic acid Nutrition 0.000 description 2
- 239000001530 fumaric acid Substances 0.000 description 2
- 235000011087 fumaric acid Nutrition 0.000 description 2
- HYBBIBNJHNGZAN-UHFFFAOYSA-N furfural Chemical compound O=CC1=CC=CO1 HYBBIBNJHNGZAN-UHFFFAOYSA-N 0.000 description 2
- 229940097043 glucuronic acid Drugs 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 150000004676 glycans Polymers 0.000 description 2
- 229930182470 glycoside Natural products 0.000 description 2
- 229940093915 gynecological organic acid Drugs 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- 230000003301 hydrolyzing effect Effects 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 239000001573 invertase Substances 0.000 description 2
- 235000011073 invertase Nutrition 0.000 description 2
- 238000005342 ion exchange Methods 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 239000001630 malic acid Substances 0.000 description 2
- 235000011090 malic acid Nutrition 0.000 description 2
- 238000012269 metabolic engineering Methods 0.000 description 2
- 230000037353 metabolic pathway Effects 0.000 description 2
- LVHBHZANLOWSRM-UHFFFAOYSA-N methylenebutanedioic acid Natural products OC(=O)CC(=C)C(O)=O LVHBHZANLOWSRM-UHFFFAOYSA-N 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 235000005985 organic acids Nutrition 0.000 description 2
- 235000006408 oxalic acid Nutrition 0.000 description 2
- 239000001814 pectin Substances 0.000 description 2
- 229920001277 pectin Polymers 0.000 description 2
- 235000010987 pectin Nutrition 0.000 description 2
- 101150019841 penP gene Proteins 0.000 description 2
- 150000002972 pentoses Chemical class 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 229940085127 phytase Drugs 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 235000019260 propionic acid Nutrition 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 101150054232 pyrG gene Proteins 0.000 description 2
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 description 2
- IUVKMZGDUIUOCP-BTNSXGMBSA-N quinbolone Chemical compound O([C@H]1CC[C@H]2[C@H]3[C@@H]([C@]4(C=CC(=O)C=C4CC3)C)CC[C@@]21C)C1=CCCC1 IUVKMZGDUIUOCP-BTNSXGMBSA-N 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 238000001694 spray drying Methods 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 2
- 102000003601 transglutaminase Human genes 0.000 description 2
- 230000009105 vegetative growth Effects 0.000 description 2
- TXXHDPDFNKHHGW-UHFFFAOYSA-N (2E,4E)-2,4-hexadienedioic acid Natural products OC(=O)C=CC=CC(O)=O TXXHDPDFNKHHGW-UHFFFAOYSA-N 0.000 description 1
- AXVIQHWRLSFEAC-KNYJJKDQSA-N (2r,3s,4s,5s)-2,3,4,5,6-pentahydroxy-7-oxooctanal Chemical compound CC(=O)C(O)[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O AXVIQHWRLSFEAC-KNYJJKDQSA-N 0.000 description 1
- FYGDTMLNYKFZSV-WFYNLLPOSA-N (2s,3r,4s,5s,6r)-2-[(2r,4r,5r,6s)-4,5-dihydroxy-2-(hydroxymethyl)-6-[(2r,3s,4r,5r,6s)-4,5,6-trihydroxy-2-(hydroxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1[C@@H](CO)O[C@@H](O[C@@H]2[C@H](O[C@H](O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-WFYNLLPOSA-N 0.000 description 1
- CEKUJDXLIOIGRR-JVLMNHKTSA-N (2z,4z)-6-methoxy-6-oxohexa-2,4-dienoic acid Chemical compound COC(=O)\C=C/C=C\C(O)=O CEKUJDXLIOIGRR-JVLMNHKTSA-N 0.000 description 1
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 1
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 1
- 108010091324 3C proteases Proteins 0.000 description 1
- BTJIUGUIPKRLHP-UHFFFAOYSA-N 4-nitrophenol Chemical compound OC1=CC=C([N+]([O-])=O)C=C1 BTJIUGUIPKRLHP-UHFFFAOYSA-N 0.000 description 1
- IFBHRQDFSNCLOZ-RMPHRYRLSA-N 4-nitrophenyl beta-D-glucoside Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1=CC=C([N+]([O-])=O)C=C1 IFBHRQDFSNCLOZ-RMPHRYRLSA-N 0.000 description 1
- 108010015134 4-pyridoxolactonase Proteins 0.000 description 1
- 101150100859 45 gene Proteins 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- 108010029731 6-phosphogluconolactonase Proteins 0.000 description 1
- 102000001762 6-phosphogluconolactonase Human genes 0.000 description 1
- 101150104118 ANS1 gene Proteins 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 241001134630 Acidothermus cellulolyticus Species 0.000 description 1
- 101100510736 Actinidia chinensis var. chinensis LDOX gene Proteins 0.000 description 1
- 241000222518 Agaricus Species 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 108010053754 Aldehyde reductase Proteins 0.000 description 1
- 241000609240 Ambelania acida Species 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 108010037870 Anthranilate Synthase Proteins 0.000 description 1
- 241000235349 Ascomycota Species 0.000 description 1
- 241001480052 Aspergillus japonicus Species 0.000 description 1
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 1
- 101000756530 Aspergillus niger Endo-1,4-beta-xylanase B Proteins 0.000 description 1
- 101900127796 Aspergillus oryzae Glucoamylase Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 101000775727 Bacillus amyloliquefaciens Alpha-amylase Proteins 0.000 description 1
- 241000193752 Bacillus circulans Species 0.000 description 1
- 241001328122 Bacillus clausii Species 0.000 description 1
- 241000193422 Bacillus lentus Species 0.000 description 1
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 1
- 241000194107 Bacillus megaterium Species 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 108091005658 Basic proteases Proteins 0.000 description 1
- 101710110830 Beta-agarase Proteins 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 101710130006 Beta-glucanase Proteins 0.000 description 1
- 241000222490 Bjerkandera Species 0.000 description 1
- 241000222478 Bjerkandera adusta Species 0.000 description 1
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- 108010051152 Carboxylesterase Proteins 0.000 description 1
- 102000013392 Carboxylesterase Human genes 0.000 description 1
- 102000004308 Carboxylic Ester Hydrolases Human genes 0.000 description 1
- 108090000863 Carboxylic Ester Hydrolases Proteins 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 241000259840 Chaetomidium Species 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 241000080524 Chrysosporium queenslandicum Species 0.000 description 1
- 241001579660 Chrysosporum Species 0.000 description 1
- 241000233652 Chytridiomycota Species 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 241001508811 Clavispora Species 0.000 description 1
- 241001508813 Clavispora lusitaniae Species 0.000 description 1
- 241001508812 Clavispora opuntiae Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 101710107329 Coniferin beta-glucosidase Proteins 0.000 description 1
- 241001085790 Coprinopsis Species 0.000 description 1
- 241000287781 Crassicarpon thermophilum Species 0.000 description 1
- 241001559589 Cullen Species 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- AUNGANRZJHBGPY-UHFFFAOYSA-N D-Lyxoflavin Natural products OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-UHFFFAOYSA-N 0.000 description 1
- DSLZVSRJTYRBFB-LLEIAEIESA-N D-glucaric acid Chemical compound OC(=O)[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)=O DSLZVSRJTYRBFB-LLEIAEIESA-N 0.000 description 1
- LXJXRIRHZLFYRP-VKHMYHEASA-N D-glyceraldehyde 3-phosphate Chemical class O=C[C@H](O)COP(O)(O)=O LXJXRIRHZLFYRP-VKHMYHEASA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- LIOOJQZRNLJKMU-UHFFFAOYSA-N Demethyl coniferin Natural products OCC=Cc1ccc(OC2OC(CO)C(O)C(O)C2O)c(O)c1 LIOOJQZRNLJKMU-UHFFFAOYSA-N 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010001682 Dextranase Proteins 0.000 description 1
- 101001096557 Dickeya dadantii (strain 3937) Rhamnogalacturonate lyase Proteins 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 102000016942 Elastin Human genes 0.000 description 1
- 108010014258 Elastin Proteins 0.000 description 1
- 108010061142 Endo-arabinase Proteins 0.000 description 1
- 241000194033 Enterococcus Species 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 102100023164 Epididymis-specific alpha-mannosidase Human genes 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- 101710112457 Exoglucanase Proteins 0.000 description 1
- 101710098246 Exoglucanase 2 Proteins 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 241000145614 Fusarium bactridioides Species 0.000 description 1
- 241001014439 Fusarium sarcochroum Species 0.000 description 1
- 241000605909 Fusobacterium Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 101000930822 Giardia intestinalis Dipeptidyl-peptidase 4 Proteins 0.000 description 1
- 241001019284 Gliomastix roseogrisea Species 0.000 description 1
- 102000004366 Glucosidases Human genes 0.000 description 1
- 108010056771 Glucosidases Proteins 0.000 description 1
- 108010017544 Glucosylceramidase Proteins 0.000 description 1
- 102000004547 Glucosylceramidase Human genes 0.000 description 1
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 1
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 102000051366 Glycosyltransferases Human genes 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- LPBWRHRHEIYAIP-KKUMJFAQSA-N His-Tyr-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LPBWRHRHEIYAIP-KKUMJFAQSA-N 0.000 description 1
- ZHMZWSFQRUGLEC-JYJNAYRXSA-N His-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZHMZWSFQRUGLEC-JYJNAYRXSA-N 0.000 description 1
- 241001497663 Holomastigotoides Species 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- 101000979031 Homo sapiens Epididymis-specific alpha-mannosidase Proteins 0.000 description 1
- 101001128911 Homo sapiens Neutral cholesterol ester hydrolase 1 Proteins 0.000 description 1
- 241000178583 Human rhinovirus B3 Species 0.000 description 1
- 108010003272 Hyaluronate lyase Proteins 0.000 description 1
- 102000009066 Hyaluronoglucosaminidase Human genes 0.000 description 1
- 239000004354 Hydroxyethyl cellulose Substances 0.000 description 1
- 101150098499 III gene Proteins 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000222435 Lentinula Species 0.000 description 1
- 108010036940 Levansucrase Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 241001344131 Magnaporthe grisea Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 101000763602 Manilkara zapota Thaumatin-like protein 1 Proteins 0.000 description 1
- 101000763586 Manilkara zapota Thaumatin-like protein 1a Proteins 0.000 description 1
- 229920000057 Mannan Polymers 0.000 description 1
- 241001184659 Melanocarpus albomyces Species 0.000 description 1
- 241000123318 Meripilus giganteus Species 0.000 description 1
- 102000005741 Metalloproteases Human genes 0.000 description 1
- 108010006035 Metalloproteases Proteins 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 229920001340 Microbial cellulose Polymers 0.000 description 1
- 241000243190 Microsporidia Species 0.000 description 1
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 1
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 1
- TXXHDPDFNKHHGW-CCAGOZQPSA-N Muconic acid Natural products OC(=O)\C=C/C=C\C(O)=O TXXHDPDFNKHHGW-CCAGOZQPSA-N 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 101000966653 Musa acuminata Glucan endo-1,3-beta-glucosidase Proteins 0.000 description 1
- 241001674208 Mycothermus thermophilus Species 0.000 description 1
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 1
- 108010063089 N-acetylgalactosaminoglycan deacetylase Proteins 0.000 description 1
- 102100032979 N-acetylglucosaminyl-phosphatidylinositol de-N-acetylase Human genes 0.000 description 1
- 108030006162 N-acetylglucosaminylphosphatidylinositol deacetylases Proteins 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 241001072230 Oceanobacillus Species 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710113020 Ornithine transcarbamylase, mitochondrial Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 241000194109 Paenibacillus lautus Species 0.000 description 1
- 102100033357 Pancreatic lipase-related protein 2 Human genes 0.000 description 1
- 102100036893 Parathyroid hormone Human genes 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 1
- 102100037883 Phospholipase B1, membrane-associated Human genes 0.000 description 1
- 102000011420 Phospholipase D Human genes 0.000 description 1
- 108090000553 Phospholipase D Proteins 0.000 description 1
- 108010058864 Phospholipases A2 Proteins 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241001234560 Phyllidia Species 0.000 description 1
- 241001495084 Phylo Species 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 241000222350 Pleurotus Species 0.000 description 1
- 101710130181 Protochlorophyllide reductase A, chloroplastic Proteins 0.000 description 1
- 241000959173 Rasamsonia emersonii Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 108050007056 Regucalcin Proteins 0.000 description 1
- 102100030262 Regucalcin Human genes 0.000 description 1
- 102100031176 Retinoid isomerohydrolase Human genes 0.000 description 1
- 101000968489 Rhizomucor miehei Lipase Proteins 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241000193448 Ruminiclostridium thermocellum Species 0.000 description 1
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000222480 Schizophyllum Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 241000223255 Scytalidium Species 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102100021837 Sialate O-acetylesterase Human genes 0.000 description 1
- 241000906075 Simplicillium obclavatum Species 0.000 description 1
- 108010055297 Sterol Esterase Proteins 0.000 description 1
- 241000264435 Streptococcus dysgalactiae subsp. equisimilis Species 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 241000958303 Streptomyces achromogenes Species 0.000 description 1
- 241001468227 Streptomyces avermitilis Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241001468239 Streptomyces murinus Species 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 241000228341 Talaromyces Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 101100157012 Thermoanaerobacterium saccharolyticum (strain DSM 8691 / JW/SL-YS485) xynB gene Proteins 0.000 description 1
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 1
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 1
- 241000182980 Thielavia ovispora Species 0.000 description 1
- 101710097834 Thiol protease Proteins 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 241000217816 Trametes villosa Species 0.000 description 1
- 108010087472 Trehalase Proteins 0.000 description 1
- 102100029677 Trehalase Human genes 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 1
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 1
- 108010039203 Tripeptidyl-Peptidase 1 Proteins 0.000 description 1
- 102100034197 Tripeptidyl-peptidase 1 Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- 101150100931 VI gene Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241001507667 Volvariella Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 241000758405 Zoopagomycotina Species 0.000 description 1
- 241000588901 Zymomonas Species 0.000 description 1
- OIPILFWXSMYKGL-UHFFFAOYSA-N acetylcholine Chemical compound CC(=O)OCC[N+](C)(C)C OIPILFWXSMYKGL-UHFFFAOYSA-N 0.000 description 1
- 229960004373 acetylcholine Drugs 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 108010075015 actinomycin lactonase Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 108010045649 agarase Proteins 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 108010061314 alpha-L-Fucosidase Proteins 0.000 description 1
- 102000012086 alpha-L-Fucosidase Human genes 0.000 description 1
- 108010034561 alpha-amino acid esterase Proteins 0.000 description 1
- 108010073901 aminoacyl-tRNA hydrolase Proteins 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229940025131 amylases Drugs 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 229920000617 arabinoxylan Polymers 0.000 description 1
- 150000004783 arabinoxylans Chemical class 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 239000010905 bagasse Substances 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108010019077 beta-Amylase Proteins 0.000 description 1
- 125000000188 beta-D-glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 238000010364 biochemical engineering Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 238000013452 biotechnological production Methods 0.000 description 1
- 108010042769 bis(2-ethylhexyl)phthalate esterase Proteins 0.000 description 1
- CDQSJQSWAWPGKG-UHFFFAOYSA-N butane-1,1-diol Chemical compound CCCC(O)O CDQSJQSWAWPGKG-UHFFFAOYSA-N 0.000 description 1
- KDYFGRWQOYBRFD-NUQCWPJISA-N butanedioic acid Chemical compound O[14C](=O)CC[14C](O)=O KDYFGRWQOYBRFD-NUQCWPJISA-N 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 108010089934 carbohydrase Proteins 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 1
- 125000002057 carboxymethyl group Chemical group [H]OC(=O)C([H])([H])[*] 0.000 description 1
- 229920003090 carboxymethyl hydroxyethyl cellulose Polymers 0.000 description 1
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 108010075867 cetraxate benzyl ester HCl hydrolyzing enzyme Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000224 chemical solution deposition Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 108010089807 chitosanase Proteins 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 108010025790 chlorophyllase Proteins 0.000 description 1
- OEYIOHPDSNJKLS-UHFFFAOYSA-N choline Chemical compound C[N+](C)(C)CCO OEYIOHPDSNJKLS-UHFFFAOYSA-N 0.000 description 1
- 229960001231 choline Drugs 0.000 description 1
- 238000011098 chromatofocusing Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- SFLMUHDGSQZDOW-FAOXUISGSA-N coniferin Chemical compound COC1=CC(\C=C\CO)=CC=C1O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 SFLMUHDGSQZDOW-FAOXUISGSA-N 0.000 description 1
- LIOOJQZRNLJKMU-UXXRCYHCSA-N coniferin Natural products OCC=Cc1ccc(O[C@@H]2O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)c(O)c1 LIOOJQZRNLJKMU-UXXRCYHCSA-N 0.000 description 1
- SFLMUHDGSQZDOW-IBEHDNSVSA-N coniferoside Natural products COC1=CC(C=CCO)=CC=C1O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 SFLMUHDGSQZDOW-IBEHDNSVSA-N 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- YTJJRAWFHJBAMT-UHFFFAOYSA-N depside Natural products OC(=O)CC1=C(O)C=C(O)C=C1OC(=O)C1=CC=C(O)C(O)=C1 YTJJRAWFHJBAMT-UHFFFAOYSA-N 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000004851 dishwashing Methods 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 229920002549 elastin Polymers 0.000 description 1
- 230000005672 electromagnetic field Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000007515 enzymatic degradation Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- IKUQEFGEUOOPGY-UHFFFAOYSA-N euoniside Natural products COC1=CC=2C=CC(=O)OC=2C(OC)=C1OC1OC(CO)C(O)C(O)C1O IKUQEFGEUOOPGY-UHFFFAOYSA-N 0.000 description 1
- 108010000165 exo-1,3-alpha-glucanase Proteins 0.000 description 1
- 108010093305 exopolygalacturonase Proteins 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 239000002979 fabric softener Substances 0.000 description 1
- 238000012262 fermentative production Methods 0.000 description 1
- 229960000304 folic acid Drugs 0.000 description 1
- 235000019152 folic acid Nutrition 0.000 description 1
- 239000011724 folic acid Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000004459 forage Substances 0.000 description 1
- 229940013688 formic acid Drugs 0.000 description 1
- 229960002598 fumaric acid Drugs 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 239000010437 gem Substances 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 229960002773 hyaluronidase Drugs 0.000 description 1
- 235000019447 hydroxyethyl cellulose Nutrition 0.000 description 1
- 108010002685 hygromycin-B kinase Proteins 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 108010090785 inulinase Proteins 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000001155 isoelectric focusing Methods 0.000 description 1
- 108010080576 juvenile hormone esterase Proteins 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 108010005131 levanase Proteins 0.000 description 1
- 108010076363 licheninase Proteins 0.000 description 1
- 239000012978 lignocellulosic material Substances 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000009996 mechanical pre-treatment Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 229940045641 monobasic sodium phosphate Drugs 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 229910000403 monosodium phosphate Inorganic materials 0.000 description 1
- 235000019799 monosodium phosphate Nutrition 0.000 description 1
- 239000010813 municipal solid waste Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 229960003512 nicotinic acid Drugs 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 229940014662 pantothenate Drugs 0.000 description 1
- 235000019161 pantothenic acid Nutrition 0.000 description 1
- 239000011713 pantothenic acid Substances 0.000 description 1
- 239000010893 paper waste Substances 0.000 description 1
- 108020004410 pectinesterase Proteins 0.000 description 1
- 230000002351 pectolytic effect Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- 239000002644 phorbol ester Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 150000003905 phosphatidylinositols Chemical class 0.000 description 1
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000010908 plant waste Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 239000005014 poly(hydroxyalkanoate) Substances 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920002643 polyglutamic acid Polymers 0.000 description 1
- 229920000903 polyhydroxyalkanoate Polymers 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 235000008160 pyridoxine Nutrition 0.000 description 1
- 239000011677 pyridoxine Substances 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108010054126 retinoid isomerohydrolase Proteins 0.000 description 1
- 108010089504 retinol-palmitate esterase Proteins 0.000 description 1
- 239000011769 retinyl palmitate Substances 0.000 description 1
- 235000019172 retinyl palmitate Nutrition 0.000 description 1
- 229940108325 retinyl palmitate Drugs 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 235000019192 riboflavin Nutrition 0.000 description 1
- 229960002477 riboflavin Drugs 0.000 description 1
- 239000002151 riboflavin Substances 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 108010015572 sialate O-acetylesterase Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- FQENQNTWSFEDLI-UHFFFAOYSA-J sodium diphosphate Chemical compound [Na+].[Na+].[Na+].[Na+].[O-]P([O-])(=O)OP([O-])([O-])=O FQENQNTWSFEDLI-UHFFFAOYSA-J 0.000 description 1
- 229940048086 sodium pyrophosphate Drugs 0.000 description 1
- 238000010563 solid-state fermentation Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 239000001384 succinic acid Substances 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 235000021092 sugar substitutes Nutrition 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 235000019818 tetrasodium diphosphate Nutrition 0.000 description 1
- 239000001577 tetrasodium phosphonato phosphate Substances 0.000 description 1
- 235000019157 thiamine Nutrition 0.000 description 1
- 229960003495 thiamine Drugs 0.000 description 1
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 1
- 239000011721 thiamine Substances 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- ILJSQTXMGCGYMG-UHFFFAOYSA-N triacetic acid Chemical compound CC(=O)CC(=O)CC(O)=O ILJSQTXMGCGYMG-UHFFFAOYSA-N 0.000 description 1
- 108010039189 tripeptidyl-peptidase 2 Proteins 0.000 description 1
- 108010050564 tropinesterase Proteins 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 108010060175 trypsinogen activation peptide Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241001148471 unidentified anaerobic bacterium Species 0.000 description 1
- 229960005356 urokinase Drugs 0.000 description 1
- 108010086346 uronolactonase Proteins 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 235000019155 vitamin A Nutrition 0.000 description 1
- 239000011719 vitamin A Substances 0.000 description 1
- 235000019156 vitamin B Nutrition 0.000 description 1
- 239000011720 vitamin B Substances 0.000 description 1
- 235000019154 vitamin C Nutrition 0.000 description 1
- 239000011718 vitamin C Substances 0.000 description 1
- 235000019166 vitamin D Nutrition 0.000 description 1
- 239000011710 vitamin D Substances 0.000 description 1
- 235000019165 vitamin E Nutrition 0.000 description 1
- 239000011709 vitamin E Substances 0.000 description 1
- 229940011671 vitamin b6 Drugs 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 229910001868 water Inorganic materials 0.000 description 1
- 108010062040 wax-ester hydrolase Proteins 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
- 108010083879 xyloglucan endo(1-4)-beta-D-glucanase Proteins 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2437—Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2445—Beta-glucosidase (3.2.1.21)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/02—Monosaccharides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/14—Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01004—Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/036—Fusion polypeptide containing a localisation/targetting motif targeting to the medium outside of the cell, e.g. type III secretion
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Mycology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Analytical Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
MÉTODO PARA PRODUZIR UM POLIPEPTÍDEO SECRETADO TENDO ATIVIDADE BIOLàGICA, PROTEÍNA DE FUSçO ISOLADA, POLINUCLEOTÍDEO ISOLADO, CONSTRUÇçO DE PROTEÍNA DE FUSçO, VETOR DE EXPRESSçO, CÉLULA HOSPEDEIRA FéNGICA, MÉTODOS PARA DEGRADAR OU CONVERTER UM MATERIAL CELULàSICO E PARA PRODUZIR UMA SUBSTÂNCIA. A presente invenção refere-se a métodos para produzir um polipeptídeo secretado tendo atividade biológica, compreendendo: (a) transformar uma célula hospedeira fúngica com uma construção de proteína de fusão codificando uma proteína de fusão, que compreende: (i) um primeiro polinucleotídeo codificando um peptídeo de sinal; (ii) um segundo polinucleotídeo codificando pelo menos um domínio catalítico de uma endoglucanase ou uma porção do mesmo; e (iii) um terceiro polinucleotídeo codificando pelo menos um domínio catalítico de um polipetídeo tendo atividade biológica; em que o peptídeo de sinal e pelo menos o domínio catalítico da endoglucanase aumenta a secreção do polipeptídeo tendo atividade biológica comparado com a ausência de pelo menos o domínio catalítico da endoglucanase; (b) cultivar a célula hospedeira fúngica transformada sob condições apropriadas para produção da proteína de fusão; e (c) recuperar a proteína de fusão, um componente da mesma, ou uma combinação da mesma; tendo atividade biológica, a partir do meio de cultivo.
Description
"MÉTODO PARA PRODUZIR UM POLIPEPTÍDEO SECRETADO TENDO ATIVIDADE BIOLÓGICA, PROTEÍNA DE FUSÃO ISOLADA, POLINUCLEOTÍDEO ISOLADO, CONSTRUÇÃO DE PROTEÍNA DE FUSÃO, VETOR DE EXPRESSÃO, CÉLULA HOSPEDEIRA FÚNGICA, MÉTODOS PARA DEGRADAR OU CONVERTER UM MATERIAL CELULÓSICO E PARA PRODUZIR UMA SUBSTÂNCIA" Declaração com Relação aos Direitos às Invenções Realizadas sob Pesquisa e Desenvolvimento Financiados pelo Governo Federal
Esta invenção foi feita com apoio governamental sob NREL Subcontrato no. ZCO-30017-02, Contrato Principal DE-AC36-98G010337, concedido pelo Departamento de Energia. O Governo Americano tem determinados direitos sobre esta invenção. Antecedentes da Invenção Campo da Invenção
A presente invenção refere-se a métodos de produzir polipeptídeos secretados tendo atividade biológica e a proteínas de fusão e polinucleotídeos dos mesmos. Descrição da Arte Relacionada
A produção recombinante de um polipeptídeo heterólogo em uma célula hospedeira fungica, particularmente uma célula fungica filamentosa como Aspergillus ou Trichoderma uma célula de levedura como Saccharomyces, pode prover um veículo mais desejável para produzir o polipeptídeo em quantidades comercialmente relevantes.
A produção recombinante de um polipeptídeo heterólogo secretado é geralmente obtida por construção de um cassete de expressão em que o DNA codificando para o polipeptídeo é ligado operativamente a um promotor apropriado para a célula hospedeira e uma região de codificação de peptídeo sinal que codifica para uma seqüência de aminoácido ligada em quadro ao término amino do polipeptídeo e dirige o polipeptídeo codificado na via secretória das células. O cassete de expressão é introduzido na célula hospedeira, geralmente por transformação mediada por plasmídeo. A produção da proteína heteróloga secretada é então obtida por cultivo da célula hospedeira transformada sob condições indutíveis necessárias para o funcionamento correto do promotor contido sobre o cassete de expressão.
Apesar da expressão de um polipeptídeo heterólogo em uma célula hospedeira poder ser melhorada, um obstáculo com freqüência encontrado é que o polipeptídeo é fracamente secretado no meio de cultura. Um método de melhorar a secreção do polipeptídeo é substituir a seqüência de codificação de peptídeo sinal nativa com uma região de codificação de peptídeo sinal estranho para melhorar a secreção do polipeptídeo. No entanto, em alguns casos, esta substituição não provê uma melhora suficiente para produzir o polipeptídeo em quantidades relevantes. Outro método consiste em fundir o polipeptídeo em outro polipeptídeo que é altamente secretado por uma célula hospedeira. O polipeptídeo altamente secretado funciona como um veículo para transportar o polipeptídeo fracamente secretado ou não secretado como uma proteína de fusão através da via secretória das células.
WO 05/093050 descreve uma proteína de fusão composta de um domínio catalítico exo-celobiohidrolase e um domínio catalítico de celulase para aumentar o rendimento de uma enzima celulase. Gouka et al, 1997, Applied and Environmental Microbiology Fev. 1997, ρ 488-497, descreve fusões de gene glucoamilase que aliviam as limitações para a produção de proteínas em Aspergillus awamori. Nyyssonen e Keranen, 1995 Current Genetics 10 28 71-79, descreve papéis múltiplos de celobiohidrolase I na melhora da produção de anticorpos de fusão por Trichoderma reesei.
r
E um objeto da presente invenção prover métodos para aumentar a secreção de polipeptídeos tendo atividade biológica. Sumário da Invenção
A presente invenção refere-se a métodos para produzir um polipeptídeo secretado tendo atividade biológica, compreendendo (a) transformar uma célula hospedeira fiíngica com uma construção de proteína de fusão codificando uma proteína de fusão, em que a construção de proteína de fusão compreende
(i) um primeiro polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal,
(ii) um segundo polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando pelo menos um domínio catalítico de uma endoglucanase ou uma porção da mesma, e
(iii) um terceiro polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando pelo menos um domínio catalítico de um polipeptídeo tendo atividade biológica ou uma porção do mesmo, em que o peptídeo sinal e pelo menos o domínio catalítico da endoglucanase ou a porção do mesmo aumenta secreção do polipeptídeo tendo atividade biológica ou a porção do mesmo comparado com a ausência de pelo menos o domínio catalítico da endoglucanase ou a porção do mesmo,
(b) cultivar a célula hospedeira fungica transformada sob condições apropriadas para a produção da proteína de fusão, e
(c) recuperar a proteína de fusão, um componente da mesma, ou uma combinação da mesma, a partir do meio de cultivo, em que a proteína de fusão ou o componente da mesma tem atividade biológica.
Em um aspecto, a extremidade 3' do primeiro polinucleotídeo é ligada operativãmente à extremidade 5' do segundo polinucleotídeo e a extremidade 3' do segundo polinucleotídeo é ligada operativamente à extremidade 5' do terceiro polinucleotídeo ou a extremidade 3' do primeiro polinucleotídeo é ligada operativamente à extremidade 5' do terceiro polinucleotídeo e a extremidade 3' do terceiro polinucleotídeo é ligada operativamente à extremidade 5' do segundo polinucleotídeo para codificar uma proteína de fusão. A presente invenção também refere-se a proteínas de fusão isoladas, compreendendo:
(a) uma primeira seqüência de aminoácidos compreendendo um peptídeo sinal,
(b) uma segunda seqüência de aminoácidos compreendendo
pelo menos um domínio catalítico de uma endoglucanase ou uma porção da mesma, e
(c) uma terceira seqüência de aminoácidos compreendendo pelo menos um domínio catalítico de um polipeptídeo tendo atividade biológica ou uma porção do mesmo.
A presente invenção também refere-se a polinucleotídeos codificando as proteínas de fusão, e construções de proteína de fusão, vetores de expressão e células hospedeiras recombinantes compreendendo tais polinucleotídeos.
Em outro aspecto, a extremidade C-terminal da primeira
seqüência de aminoácidos é ligada em armação à extremidade N-terminal da segunda seqüência de aminoácidos e a extremidade C-terminal da segunda seqüência de aminoácidos é ligada em armação à extremidade N-terminal da terceira seqüência de aminoácidos ou a extremidade C-terminal da primeira seqüência de aminoácidos é ligada em armação à extremidade N-terminal da terceira seqüência de aminoácidos e a extremidade C-terminal da terceira seqüência de aminoácidos é ligada em armação à extremidade N-terminal da segunda seqüência de aminoácidos.
A presente invenção ainda refere-se a métodos de usar proteínas de fusão ou componentes das mesmas. Breve Descrição das Figuras
Figura 1 mostra um mapa de restrição de pMJ04. Figura 2 mostra um mapa de restrição de pCaHj527. Figura 3 mostra um mapa de restrição de pMT2188. Figura 4 mostra um mapa de restrição de pCaHj568. Figura 5 mostra um mapa de restrição de pMJ05.
Figura 6 mostra um mapa de restrição de pSMail30.
Figura 7 mostra a seqüência de DNA e seqüência de aminoácidos de uma seqüência de sinal nativa de beta-glucosidase de Aspergillus oryzae (SEQ ID NOs 59 e 60).
Figura 8 mostra a seqüência de DNA e seqüência de aminoácidos de uma seqüência de sinal de endoglucanase V de Humicola insolens (SEQ ID NOs 63 e 64).
Figura 9 mostra um mapa de restrição de pSMail35.
Figura 10 mostra um mapa de restrição de pSMail40.
Figura 11 mostra um mapa de restrição de pSaMe-Fl.
Figura 12 mostra um mapa de restrição de pSaMe-FX.
Figura 13 mostra um mapa de restrição de pAILo47.
Figuras 14A, 14B, 14C, e 14D mostram uma seqüência de DNA e seqüência deduzida de aminoácidos da proteína de fusão variante de beta-glucosidase de Aspergillus oryzae (SEQ ID NOs 73 e 74, respectivamente).
Figuras 15A, 15B, 15C, e 15D mostram uma seqüência de DNA e seqüência deduzida de aminoácidos da proteína de fusão de beta- glucosidase de Aspergillus oryzae (SEQ ID NOs 75 e 76, respectivamente). Definições
Atividade de endoglucanase: O termo "atividade de endoglucanase" é definido aqui como uma endo-1,4-beta-D-glucano 4- glucanohidrolase (E.C. No. 3.2.1.4) que catalisa a endohidrólise de ligações 1,4-beta-D-glicosídicas em celulose, derivados de celulose (como carboximetil celulose e hidroxietil celulose), liquenina, ligações beta-1,4 em misturas de beta-1,3 glucanos como beta-D-glucanos ou xiloglucanos de cereais, e outro material de planta contendo componentes celulósicos. Para os fins da presente invenção, a atividade de endoglucanase é determinada usando hidrólise de carboximetil celulose (CMC) de acordo com o procedimento de Ghose, 1987, Pure and Appl. Chem. 59: 257 - 268. Uma unidade de atividade de endoglucanase é definida como 1,0 μιηοΐ de açúcares redutores produzidos por minuto a 50 0C, pH 4,8.
Atividade beta-glucosidase: O termo "beta-glucosidase" é definido aqui como uma beta-D-glucosídeo glucohidrolase (E.C. 32 1 21), que catalisa a hidrólise de resíduos de beta-D-glicose não redutores terminais com a liberação de beta-D-glicose. Para fins da presente invenção, atividade beta-glucosidase é determinada de acordo com o procedimento descrito por Venturi et al, 2002, J Basic Microbiol 42 55-66, exceto diferentes condições são empregadas como aqui descrito. Uma unidade de atividade beta- glucosidase é definida como 10 μηιοίε de p-nitrofenol produzido por minuto a 50 0C pH 5 de 4 mM p-nitrofenil-beta-D-glucopiranosídeo como substrato em 100 mM citrato de sódio 0 01 % TWEEN® 20.
Polipeptídeo de comprimento completo: O termo "comprimento completo polipeptídeo" é definido aqui como uma forma precursora de um polipeptídeo tendo atividade biológica, em que o precursor contém uma região de peptídeo sinal e alternativamente também uma região de propeptídeo, em que quando da secreção de uma célula, o peptídeo sinal é clivado e alternativamente também o propeptídeo é clivado dando um polipeptídeo com atividade biológica.
Peptídeo sinal: O termo "peptídeo sinal" é definido aqui como um peptídeo ligado em armação ao térmico amino de um polipeptídeo e dirige o polipeptídeo codificado em uma via secretória da célula.
Seqüência de codificação de peptídeo sinal: O termo " seqüência de codificação de peptídeo sinal " é definido aqui com uma região de codificação de peptídeo que codifica para uma seqüência de aminoácidos ligada em armação ao término amino de um polipeptídeo codificado e dirige o polipeptídeo codificado em uma via secretória da célula.
Propeptídeo: 0 termo "propeptídeo" é definido aqui como um peptídeo ligado em armação ao término amino de um polipeptídeo. 0 polipeptídeo resultante é conhecido como uma proenzima ou propolipeptídeo (ou um zimogênio em alguns casos) Um propolipeptídeo é geralmente inativo e pode ser convertido em um polipeptídeo ativo por clivagem catalítica ou autocatalítica do propeptídeo a partir do propolipeptídeo. Quando tanto as regiões do peptídeo sinal como do propeptídeo estão presentes no término amino de um polipeptídeo, a região de propeptídeo é ligada em armação ao término amino de um polipeptídeo e a região de peptídeo sinal é ligada em armação ao término amino da região de propeptídeo.
Seqüência de codificação de propeptídeo: O termo "seqüência de codificação de propeptídeo " é definido aqui como uma região de codificação de peptídeo que codifica para uma seqüência de aminoácidos ligada em armação ao término amino de um polipeptídeo formando uma proenzima ou propolipeptídeo (ou um zimogênio em alguns casos).
Polipeptídeo maduro: O termo "polipeptídeo maduro" é definido aqui como um polipeptídeo tendo atividade de endoglucanase que está em sua forma final após tradução e quaisquer modificações pós-tradução tais, como processamento N-terminal, truncagem C-terminal, glicosilação, fosforilação, etc.
Domínio catalítico: O termo "domínio catalítico" é definido aqui como uma porção estrutural ou região da seqüência de aminoácidos de uma endoglucanase ou um polipeptídeo tendo atividade biológica (por exemplo, atividade beta-glucosidase), que possui a atividade catalítica da endoglucanase ou do polipeptídeo tendo atividade biológica (por exemplo, beta- glucosidase). O domínio catalítico é também referido como a região de "núcleo" aqui.
Proteína de fusão: O termo "proteína de fusão " é definido aqui como um polipeptídeo que demonstra atividade biológica e que compreende pelo menos tanto um domínio catalítico de endoglucanase como um domínio catalítico de um polipeptídeo tendo atividade biológica (por exemplo, beta- glucosidase).
Proteína de fusão de beta-glucosidase: O termo " proteína de fusão de beta-glucosidase " é definido aqui como um polipeptídeo que demonstra atividade beta-glucosidase e que compreende pelo menos tanto um domínio catalítico de beta-glucosidase como um domínio catalítico de endoglucanase.
Componentes de uma proteína de fusão: O termo "componentes de uma proteína de fusão" é definido aqui como fragmentos individuais (clivados) de uma proteína de fusão, em que cada fragmento tem atividade biológica e inclui ou pelo menos o domínio catalítico de uma endoglucanase e pelo menos o domínio catalítico de um polipeptídeo tendo atividade biológica ou pelo menos o domínio catalítico de um polipeptídeo tendo atividade biológica. Por exemplo, a presença de um sítio de clivagem, por exemplo, sítio Kex2, entre os componentes de pelo menos o domínio catalítico de uma endoglucanase e pelo menos o domínio catalítico de um polipeptídeo tendo atividade biológica de uma proteína de fusão pode resultar na produção de um polipeptídeo tendo atividade endoglucanase e outro polipeptídeo tendo atividade biológica.
Componentes de uma proteína de fusão beta-glucosidase: O termo "componentes de uma proteína de fusão de beta-glucosidase " é definido aqui como fragmentos individuais (clivados) de uma proteína de fusão, em que cada fragmento tem atividade de beta-glucosidase e inclui ou pelo menos o domínio catalítico de uma endoglucanase e pelo menos o domínio catalítico da beta-glucosidase ou pelo menos o domínio catalítico da beta-glucosidase.
Por exemplo, a presença de um sítio de clivagem, por exemplo, sítio Kex2, entre os componentes endoglucanase e beta-glucosidase da proteína de fusão pode resultar na produção de um polipeptídeo tendo atividade endoglucanase e outro polipeptídeo tendo atividade beta- glucosidase.
Módulo de ligação de carboidrato. O termo "módulo de
ligação de carboidrato" (CBM)" é definido aqui como uma porção da seqüência de aminoácidos de uma endoglucanase (celulase) que está envolvida na ligação de uma endoglucanase a celulose (lignocelulose). Os módulos de ligação de carboidratos geralmente funcionam por ligação não covalente da endoglucanase em celulose, um derivado de celulose, ou um equivalente de polissacarídeo da mesma. CBMs tipicamente funcionam independentes de um domínio catai ítico.
Construção de proteína de fusão. O termo "construção de proteína de fusão" refere-se a uma construção de ácido nucleico que é composta de diferentes genes ou porções dos mesmos em ligação operativa. Os componentes incluem a partir da extremidade 5' uma molécula de DNA codificando pelo menos um domínio catalítico de endoglucanase e uma molécula de DNA codificando pelo menos um domínio catalítico de um polipeptídeo tendo atividade biológica. Construção de fusão de Beta-glucosidase: O termo "
construção de fusão de beta-glucosidase " refere-se a uma construção de ácido nucleico que é composta de diferentes genes ou porções dos mesmos em ligação operativa. Os componentes incluem a partir de uma extremidade 5' uma molécula de DNA codificando pelo menos um domínio catalítico de endoglucanase e uma molécula de DNA codificando pelo menos um domínio catalítico de beta-glucosidase.
Polipeptídeo isolado: O termo "polipeptídeo isolado" como usado aqui refere-se a um polipeptídeo que é pelo menos 20% puro, preferivelmente pelo menos 40% puro, mais preferivelmente pelo menos 60% puro, ainda mais preferivelmente pelo menos 80% puro, o mais preferivelmente pelo menos 90% puro, e ainda o mais preferivelmente pelo menos 95% puro, como determinado por SDS-PAGE.
Polipeptídeo substancialmente puro: O termo "polipeptídeo substancialmente puro " denota aqui uma preparação de polipeptídeo que contém no máximo 10%, preferivelmente no máximo 8%, mais preferivelmente no máximo 6%, mais preferivelmente no máximo 5%, mais preferivelmente no máximo 4%, mais preferivelmente no máximo 3%, ainda mais preferivelmente no máximo 2%, o mais preferivelmente no máximo 1%, e ainda o ais preferivelmente no máximo 0 5% em peso de outro material de polipeptídeo que é associado de modo nativo ou recombinante. Prefere-se, assim, que o polipeptídeo substancialmente puro seja pelo menos 92% puro, preferivelmente pelo menos 94% puro, mais preferivelmente pelo menos 95% puro, mais preferivelmente pelo menos 96% puro, mais preferivelmente pelo menos 96% puro, mais preferivelmente pelo menos 97% puro, mais preferivelmente pelo menos 98% puro, ainda mais preferivelmente pelo menos 99%, o mais preferivelmente pelo menos 99 5% puro, e ainda o mais preferivelmente 100% pure em peso do material de polipeptídeo total presente na preparação. Os polipeptídeos da presente invenção estão preferivelmente em uma forma substancialmente pura, isto é, a preparação de polipeptídeo é essencialmente livre de outro material de polipeptídeo como o qual é associado de modo nativo ou recombinante. Isto pode ser obtido, por exemplo, por preparação do polipeptídeo por meio de métodos recombinantes bem conhecidos ou por métodos de purificação clássicos.
Identidade: O parentesco entre duas seqüências de aminoácido ou entre duas seqüências de nucleotídeo é descrito pelo parâmetro "identidade".
Para os fins da presente invenção, o grau de identidade entre duas seqüências de aminoácido é determinado usando o algoritmo Needleman-Wunsch (Needleman e Wunsch, 1970, J. Mol. Biol. 48: 443 - 453) como implementado no programa Needle de EMBOSS package (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al, 2000, Trends in Genetics 16: 276-277), preferivelmente versão 3.0.0 ou posterior. Os parâmetros opcionais usados são penalidade de abertura de espaço de 10, penalidade de extensão de espaço de 0,5, e a matriz de substituição EBLOSUM62 (EMBOSS versão de BLOSUm 62). A saída de Needle rotulada "identidade mais longa" (obtida usando a opção -nobrief) é usada como a porcentagem de identidade e é calculada como a seguir:
(Resíduos idênticos χ 100)/(Comprimento de Alinhamento - Número de espaços em alinhamento)
Para os fins da presente invenção, o grau de identidade entre duas seqüências de nucleotídeo é determinado usando o algoritmo Needleman-Wunsch (Needleman e Wunsch, 1970, supra) como implementado no programa de Needle de EMBOSS package (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al, 2000) preferivelmente versão 3.0.0 ou posterior. Os parâmetros opcionais usados são penalidade de abertura de espaço de 10, penalidade de extensão de espaço de 0,5, e a matriz de substituição de EDNAFULL (Versão EMBOSS, de NCBI NUC4.4). A saída de Needle rotulada "identidade mais longa" (obtida usando a opção nobrief) é usada como a porcentagem de identidade e é calculada como a seguir:
(deoxirribonucleotídeos idênticos χ 100)/(Comprimento de Alinhamento - Número total de Espaços em Alinhamento)
Fragmento de polipeptídeo: O termo "fragmento de polipeptídeo" é definido aqui como um polipeptídeo tendo um ou mais aminoácidos deletados do término amino e/ou carboxila de uma proteína de fusão (por exemplo, proteína de fusão de beta-glucosidase) ou componentes dos mesmos, em que o fragmento tem atividade biológica (por exemplo, atividade beta-glucosidase)
Subsequência: O termo "subsequência" é definido aqui como uma seqüência de nucleotídeos tendo um ou mais nucleotídeos deletado da extremidade 5' e/ou 3' de um polinucleotídeo, em que a subsequência codifica um fragmento de polipeptídeo tendo atividade biológica, por exemplo, atividade beta-glucosidase ou atividade endoglucanase
Polinucleotídeo isolado: O termo "polinucleotídeo isolado" como usado aqui refere-se a um polinucleotídeo que é pelo menos 20% puro, preferivelmente pelo menos 40% puro, mais preferivelmente pelo menos 60% puro, ainda mais preferivelmente pelo menos 80% puro, o mais preferivelmente pelo menos 90% puro, e ainda o mais preferivelmente pelo menos 95% puro, como determinado por eletroforese de agarose.
Polinucleotídeo substancialmente puro: O termo "polinucleotídeo substancialmente puro" como usado aqui refere-se a uma preparação de polinucleotídeo livre de outros nucleotídeos estranhos ou indesejados e em uma forma apropriada para usar em sistemas de produção de proteína geneticamente engenheirados. Assim, um polinucleotídeo substancialmente puro contém no máximo 10%, preferivelmente no máximo 8%, mais preferivelmente no máximo 6%, mais preferivelmente no máximo 5%, mais preferivelmente no máximo 4%, mais preferivelmente no máximo 3%, ainda mais preferivelmente no máximo 2%, o mais preferivelmente no máximo 1%, e ainda o mais preferivelmente no máximo 0,5% em peso de outro material de polinucleotídeo com o qual ele é naturalmente ou recombinantemente associado. Um polinucleotídeo substancialmente puro pode, no entanto, incluir regiões 5' e 3' de ocorrência natural não traduzidas, como promotores e terminadores. Prefere-se que o polinucleotídeo substancialmente puro seja pelo menos 90% puro, preferivelmente pelo menos 92% puro, mais preferivelmente pelo menos 94% puro, mais preferivelmente pelo menos 95% puro, mais preferivelmente pelo menos 96% puro, mais preferivelmente pelo menos 97% puro, ainda mais preferivelmente pelo menos 98% puro, o mais preferivelmente pelo menos 99%, e ainda o mais preferivelmente pelo menos 99,5% puro em peso. Os polinucleotídeos estão preferivelmente em uma forma substancialmente pura, isto é, que a preparação de polinucleotídeo seja essencialmente livre de outro material de polinucleotídeo com o qual ele é naturalmente ou recombinantemente associado. Os polinucleotídeos podem ser de origem genômica, cDNA, RNA, semi-sintética, sintética, ou quais combinações dos mesmos.
cDNA: O termo "cDNA" é definido aqui como uma molécula de DNA que pode ser preparada por transcrição reversa de uma molécula de mRNA maduro, emendada, obtida de uma célula eucariótica. cDNA não tem as seqüências de íntrons que estão geralmente presentes no DNA genômico correspondente. O transcrito de RNA primário inicial é um precursor para mRNA que é processado através de uma série de etapas antes de aparecer como um mRNA emendado maduro. Estas etapas incluem a remoção de seqüências de intron por um processo chamado "emenda". cDNA derivado de mRNA não apresenta, assim, quaisquer seqüências de íntron.
Construção de ácido nucléico: O termo "construção de ácido nucléico" como usado aqui refere-se a uma molécula de ácido nucléico, de filamento único ou duplo, que é isolada de um gene de ocorrência natural ou que é modificada para conter segmentos de ácidos nucleicos em um modo que não iria de outra forma existir na natureza. O termo construção de ácido nucléico é sinônimo do termo "cassete de expressão" quando a construção de ácido nucléico contém as seqüências de controle requeridas para expressão de uma seqüência de codificação.
Seqüência de controle: O termo "seqüência de controle" é definido aqui para incluir todos componentes, que são necessários ou vantajosos para a expressão de um polinucleotídeo codificando um polipeptídeo. Cada seqüência de controle pode ser nativa ou estranha para a seqüência de nucleotídeos codificando o polipeptídeo ou nativa ou estranha para cada outro. Tais seqüências de controle incluem, mas não são limitados a um líder, seqüência de poliadenilação, seqüência de propetídeo, promotor, seqüência de peptídeo sinal, e terminador de transcrição. Em um mínimo, as seqüências de controle incluem um promotor, e sinais de parada transcripcional e translacional. As seqüências de controle podem ser providas com ligadores para o fim de introduzir sítios de restrição específicos facilitando a ligação das seqüências de controle com a região codificada da seqüência de nucleotídeos codificando um polipeptídeo. Ligado operativamente: O termo "ligado operativãmente"
denota aqui uma configuração em que uma seqüência de controle é colocada em uma posição apropriada relativa na seqüência de codificação da seqüência de polinucleotídeo de modo que a seqüência de controle dirige a expressão da seqüência de codificação de um polipeptídeo. Além disso, o termo "ligado operativamente " também se refere a dois polinucleotídeos que são ligados ou fusionados, que são expressados juntos como uma proteína fusionada ou de fusão.
Seqüência de codificação: Quando usado aqui o termo "seqüência de codificação" significa uma seqüência de nucleotídeo, que diretamente especifica a seqüência de aminoácido de seu produto de proteína. Os limites da seqüência de codificação geralmente são determinados por uma matriz de leitura aberta, que geralmente começa com o códon de partida ATG ou códons de partida alternativos como GTG e TTG e terminado com um códon de parada como TAA, TAG, e TGA. A seqüência de codificação pode ser uma seqüência de DNA, cDNA, ou de nucleotídeo recombinante.
Expressão: O termo "expressão" inclui qualquer etapa envolvida na produção do polipeptídeo incluindo, mas não limitado a transcrição, modificação pós-transcripcional, tradução, modificação pós- translacional, e secreção. Vetor de expressão: O termo "vetor de expressão" é definido aqui como uma molécula de DNA linear ou circular que compreende um polinucleotídeo codificando um polipeptídeo da invenção, e que é ligado operativamente a nucleotídeos adicionais que provê sua expressão.
Célula hospedeira: O termo "célula hospedeira", como usado aqui, inclui qualquer tipo de célula que é suscetível para transformação, transfecção, transdução, e outros com uma construção de ácido nucléico ou vetor de expressão compreendendo um polinucleotídeo.
Variante: Quando usado aqui, o termo "variante" significa um polipeptídeo tendo atividade biológica produzida por um organismo expressando uma seqüência de nucleotídeo modificada, por exemplo SEQ ID NO: 25, ou uma seqüência homóloga da mesma, ou a região de codificação madura da mesma. A seqüência de nucleotídeo modificada é obtida através de intervenção humana por modificação de uma seqüência de nucleotídeos, por exemplo SEQ ID NO: 23, ou uma seqüência homóloga da mesma, ou a região de codificação madura da mesma. A modificação pode ser uma substituição, uma deleção e/ou uma inserção de um ou mais aminoácidos assim como uma substituição de uma ou mais cadeias laterais de aminoácidos. Descrição Detalhada da Invenção
A presente invenção refere-se a métodos para produzir um polipeptídeo secretado tendo atividade biológica, compreendendo (a) transformar uma célula hospedeira fungica com uma construção de proteína de fusão codificando a proteína de fusão, em que a construção de proteína de fusão compreende (i) um primeiro polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, (ii) um segundo polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando pelo menos um domínio catalítico de uma endoglucanase ou uma porção da mesma, e (iii) um terceiro polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando pelo menos um domínio catalítico de um polipeptídeo tendo atividade biológica ou uma porção do mesmo, em que o peptídeo sinal e pelo menos o domínio catalítico da endoglucanase ou a porção do mesmo aumenta a secreção do polipeptídeo tendo atividade biológica ou a porção do mesmo comparado com a ausência de pelo menos o domínio catalítico da endoglucanase ou a porção do mesmo, (b) cultivar a célula hospedeira fungica transformada sob condições apropriadas para a produção da proteína de fusão, e (c) recuperar a proteína de fusão, um componente da mesma, ou uma combinação da mesma, a partir do meio de cultivo, em que a proteína de fusão ou o componente da mesma tem atividade biológica.
Em um aspecto preferido, a extremidade 3' do primeiro polinucleotídeo é ligada operativamente à extremidade 5' do segundo polinucleotídeo e a extremidade 3' do segundo polinucleotídeo é ligada operativamente à extremidade 5' do terceiro polinucleotídeo. Em outro aspecto preferido, a extremidade 3' do primeiro polinucleotídeo é ligada operativamente à extremidade 5' do terceiro polinucleotídeo e a extremidade 3' do terceiro polinucleotídeo é ligada operativamente à extremidade 5' do segundo polinucleotídeo para codificar a proteína de fusão.
A proteína de fusão é produzida por fusão de uma seqüência de nucleotídeos codificando um polipeptídeo tendo atividade biológica ou uma porção do mesmo para uma seqüência de nucleotídeos codificando um polipeptídeo tendo atividade endoglucanase ou uma porção da mesma e uma seqüência de nucleotídeos codificando um peptídeo sinal ligada operativamente à seqüência de nucleotídeos codificando o polipeptídeo tendo atividade endoglucanase ou uma porção da mesma. Técnicas para produzir proteínas de fusão são conhecidas na técnica, e incluem, por exemplo, ligação das seqüências de codificação codificando os polipeptídeos de modo que estejam em armação e expressão do polipeptídeo fusionado é ainda controlar o(s) mesmo(s) promotor (es) e terminador. As proteínas de fusão também podem ser construídas usando tecnologia de inteína em que as fusões são criadas pós-translacionalmente (Cooper et al, 1993, EMBO J 12 2575-2583, Dawson et al, 1994, Science 266 776-779).
A proteína de fusão tendo atividade biológica compreendendo um peptídeo sinal, pelo menos o domínio catalítico de uma endoglucanase ou uma porção da mesma, e pelo menos o domínio catalítico de um polipeptídeo tendo atividade biológica ou uma porção do mesmo, aumenta secreção de uma proteína de fusão comparado com a ausência de pelo menos o domínio catalítico da endoglucanase ou uma porção da mesma. O aumento na secreção de uma proteína de fusão tendo atividade biológica é pelo menos 5%, preferivelmente pelo menos 10%, mais preferivelmente pelo menos 25%, ainda mais preferivelmente pelo menos 50%, mais preferivelmente pelo menos 100%, ainda mais preferivelmente pelo menos 150%, ainda mais preferivelmente pelo menos 200%, o mais preferivelmente pelo menos 500%, e ainda o mais preferivelmente pelo menos 1000% comparado com a ausência de pelo menos o domínio catalítico da endoglucanas.
Em cada um dos aspectos preferidos abaixo, os componentes de uma construção de proteína de fusão (construção de ácido nucleico) são ligados operativamente a partir da extremidade 5' à extremidade 3' da construção.
Em um aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo de comprimento completo of uma endoglucanase (peptídeo sinal e polipeptídeo maduro), e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo de comprimento completo of uma endoglucanase (peptídeo sinal e polipeptídeo maduro). Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos 10
15
20
25
codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase. Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica. Em outro aspecto preferido, a construção de proteína de fusão
compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica, um polinucleotídeo 10
15
20
25
compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica; um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de um polipeptídeo tendo atividade biológica, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a construção de proteína de fusão compreende um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de um polipeptídeo tendo atividade biológica, e um polinucleotídeo codificando um ligador e/ou um polinucleotídeo codificando um módulo de ligação de carboidrato, um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando outro peptídeo sinal, e um polinucleotídeo compreendendo uma seqüência de nucleotídeos codificando um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, para cada um dos aspectos preferidos acima, os polinucleotídeos podem codificar uma porção do domínio catalítico, o polipeptídeo maduro, ou o polipeptídeo de comprimento completo de uma endoglucanase ou um polipeptídeo tendo atividade biológica. A porção da endoglucanase pode ter ou não pode ter atividade endoglucanase. Em um aspecto mais preferido, a porção da endoglucanase tem atividade endoglucanase.
Em cada um dos aspectos preferidos acima, os componentes das construções de proteína de fusão ainda compreendem uma região de promotor e/ou uma região de terminador.
Endoglucanases e polinucleotídeos das mesmas
Um polinucleotídeo codificando um domínio catalítico, polipeptídeo maduro, ou polipeptídeo de comprimento completo de uma endoglucanase, ou porções da mesma, pode ser obtido a partir de qualquer organismo. Para fins da presente invenção, o termo "polipeptídeo" será entendido para incluir um polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico, ou porções ou fragmentos dos mesmos que tem atividade. O termo "obtido a partir de", como usado aqui em conexão com uma dada fonte deve significar que o polipeptídeo codificado por uma seqüência de nucleotídeos é produzido pela fonte ou pela cepa em que a seqüência de nucleotídeos a partir da fonte foi inserida.
Muitas endoglucanases têm uma estrutura de múltiplos domínios consistindo de um domínio catalítico separado de um domínio de ligação de carboidratos (CBM) peptídeo ligador (Suurnakki et al, 2000, Celulose 7 189-209) O domínio catalítico contém o sítio ativo enquanto o CBM interage com celulose por ligação da enzima ao mesmo (van Tilbeurgh et al, 1986, FEBSLetters 204 223-227, Tomme et al, 1988, European Journal of Biochemistry 170 575-581)
Um polinucleotídeo codificando um polipeptídeo tendo atividade endoglucanase pode ser obtido a partir de um gene codificando um polipeptídeo bacteriano. Por exemplo, o polipeptídeo pode ser um polipeptídeo bacteriano Gram positivo, incluindo, mas não limitado a, polipeptídeo de Bacil lus, Streptocoeeus, Streptomyees, Staphyloeoeeus, Enterococcus, Lactobacillus, Lactoeoceus, Clostridium, Geobaeillus, ou Oceanobacillus polipeptídeo, por exemplo, um polipeptídeo de Bacillus alkalophilus, Bacillus amiloliquefaeiens, Bacillus brevis, Bacillus circulans. Bacillus coagulans, Bacillus lautus, Baeillus lentus, Bacillus lieheniformis, Bacillus megatenum, Bacillus stearothermophilus, Bacillus subtilis. Bacillus thuringiensis, Streptocoeeus equisimilis, Streptococcus pyogenes, Streptocoeeus ubens, e Streptococcus equi subsp Zooepidemicus, Streptomyces lividans, ou Streptomyces murinus, ou um polipeptídeo bacteriano Gram negativo, incluindo, mas não limitado a, um polipeptídeo de E coli, Pseudomonas, Salmonella, Campylobacter, Helicobacter, Flavobactenum, Fusobacterium, llyobaeter, Neisseria, ou Ureaplasma.
Os exemplos de endoglucanases bacterianas que podem ser usadas como fontes para os polinucleotídeos nos métodos da presente invenção, incluem, mas não são limitados a endoglucanase de Acidothermus celulolyticus (WO 91/05039, WO 93/15186, Patente US 5.275.944, WO 96/02551, Patente US 5.536.655, WO 00/70031, WO 05/093050), endoglucanase III de Thermobifida fusca (WO 05/093050), e endoglucanase V de Thermobifidafusca (WO 05/093050)
Um polinucleotídeo codificando um polipeptídeo tendo atividade endoglucanase pode ser obtido a partir de um gene codificando um polipeptídeo fungico, e mais preferivelmente polipeptídeo de levedura, como um polipeptídeo de Candida, Ktuyveromyees, Piehia, Saechammyees, Schizosaccharomyces, ou Yarrowia, ou mais preferivelmente um polipeptídeo de fungo filamentoso como um polipeptídeo de Aeremonium, Aspergillus, Aureobasidium, Cladorrhinum, Cryptoeoceus, Filibasidium, Fusarium, Humieola, Magnaporthe, Mueor, Myeehophthora, Neocallimastix, Neurospora, Paealomyees, Pemallium, Pimmyees, Schizophyltum, Talaromyees, Thermoaseus, Thielavia, Tolypocladium, ou Triehodema.
Em um aspecto preferido, um polinucleotídeo codificando um polipeptídeo tendo atividade endoglucanase pode ser obtido a partir de um gene codificando um polipeptídeo de Saechammyees earlsbergensis, Saechammyees eerevisiae, Saechammyces diastatieus, Saccharomyees douglasn, Saeehammyees kluyven, Saeehammyees norbensis, ou Saeehammyees oviformis
Em outro aspecto preferido, um polinucleotídeo codificando um polipeptídeo tendo atividade endoglucanase pode ser obtido a partir de um gene codificando um polipeptídeo de Aspergillus aeuleatus, Aspergillus awamoK, Aspergillus fumigatus, Aspergillus foetidus, Aspergillus japonieus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Cladorrhinum foecundissimum, Fusarium bactKdioides, Fusarium cerealis, Fusarium crookwellense, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium riseum, Fusarium sambuanum, Fusarium sarcochmum, Fusarium spomtKchioides, Fusarium sulphureum, Fusarium torulosum, Fusarium tnchothecioides, Fusarium venenatum, Humicola insolens, Humicola lanuginosa, Mueor miehei, Myeehophthora thermophila, Neurospora crassa, Pemallium purpumgenum, Thielavia achromatica, Thielavia albomyees, Thielavia albopilosa, Thielavia australeinsis, Thielavia fimeti, Thielavia microspora, Thielavia ovispora, Thielavia peruviana, Thielavia spededonium, Thielavia setosa, Thielavia sub thermophila, Thielavia terrestris, Thielavia temeola, Thielavia thermophila, Thielavia vanospora, Thielavia waremgii, Trichoderma harzianum, Triehoderma komngii, Triehoderma longibraehiatum, Triehoderma reesei, ou Triehoderma vinde.
Exemplos de endoglucanases füngicas que podem ser usadas como fontes para os polinucleotídeos nos métodos da presente invenção, incluem, mas não são limitados, a Triehoderma reesei EGl (Penttila et al, 1986, Gene 45 253-263, GENBANK™ número de acesso M15665), Triehoderma reesei EG2 (Saloheimo, et al, 1988, Gene 63 11- 22, GENBANK™ número de acesso Ml 9373), Triehoderma reesei EG3 (Okada et al, 1988, Appl Environ Microbiol 64 555-563, GENBANK™ número de acesso AB003694), Triehoderma reesei EG4 (Saloheimo et al, 1997, Eur. J. Bioehem 249 584-591, GENBANK™ número de acesso Yl 1113), e Trichoderma reesei EG5 (Saloheimo et al, 1994, Molecular Microbiology 13 219-228, GENBANK™ número de acesso Z33381), endoglucanase de Aspergillus aeuleatus (Ooi et al, 1990, Nueleie Aeid Research 18 5884), Aspergillus kawachn (Sakamoto et al, 1995, Current Genetics 27 435-439), endoglucanase de Erwinia carotovara (Saarilahti et al, 1990, Gene 90 9-14), Fusarium oxysporum (GENBANK™ número de acesso L29381), Humicola grisea var thermoidea (GENBANK™ número de acesso AB003107), Melanocarpus albomyces (GENBANK™ número de acesso MAL515703), e Neurospora crassa (GENBANK™ número de acesso XM_324477).
Outras endoglucanases são descritas em numerosas famílias de Glicosil Hidrolase usando a classificação de acordo com Henrissat B., 1991, A classification of glicosil hidrolases based on amino-acid sequence similarities, Biochem J. 280 309-316, e Henrissat B., e Bairoch A., 1996, Updating the sequence-based classification of glicosil hidrolases, Bioehem J. 316 695-696.
As técnicas usadas para isolar ou clonar um polinucleotídeo codificando um polipeptídeo tendo atividade endoglucanase são conhecidas na técnica e incluem isolamento do DNA genômico, preparação do cDNA ou uma combinação dos mesmos. A clonagem dos polinucleotídeos a partir deste DNA genômico pode ser efetuado, por exemplo, usando a reação de cadeia polimerase bem conhecida (PCR) ou triagem de anticorpos de bibliotecas de expressão para detectar os fragmentos de DNA clonados com aspectos estruturais compartilhados. Ver, por exemplo, lnnis et al, 1990, PCR A Guide to Methods and Application, Academic Press, New York. Outros procedimentos de amplificação de ácido nucleico como reação de cadeia ligase (LCR), transcrição ativada ligada (LAT) e amplificação com base em seqüência de nucleotídeos (NASBA) podem ser usados.
Será entendido que para as espécies acima mencionadas, a invenção engloba tanto os estados perfeitos como imperfeitos, e outros equivalentes taxonômicos, por exemplo anamorfos, sem levar em conta o nome da espécie pelo qual são conhecidos. Os versados na arte irão prontamente reconhecer a identidade de equivalentes apropriados.
As cepas destas espécies são prontamente acessíveis ao público em várias coleções de culturas, como o American Type Culture Collection (ATCC), Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH (DSM), Centraalbureau Voor Schimmelcultures (CBS), and Agricultural Research Service Patent Culture Collection, Northern Regional Research Center (NRRL).
Em um aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase I.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase II.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase III.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase IV.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase V. Em um aspecto mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase V de Humicola insolens Em um aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase V de Humicola insolens que codifica o polipeptídeo de SEQ ID NO 2. Em um outro aspecto o mais preferido, o polipeptídeo de comprimento completo da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase V de Humicola insolens que codifica o polipeptídeo de comprimento completo de SEQ ID NO 2. Em um outro aspecto o mais preferido, o polipeptídeo maduro da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase V de Humieola insolens que codifica o polipeptídeo maduro de SEQ ID NO 2. Em um outro aspecto o mais preferido, o domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase V de Humieola insolens que codifica o domínio catalítico de SEQ ID NO 2. Em um outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase V de Humieola insolens compreendendo SEQ ID NO 1. Em um outro aspecto o mais preferido, o polipeptídeo de comprimento completo da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase V de Humieola insolens compreendendo SEQ ID NO 1. Em um outro aspecto o mais preferido, o polipeptídeo maduro da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase V de Humieola insolens compreendendo o polipeptídeo maduro codificando seqüência de SEQ ID NO 1. Em um outro aspecto o mais preferido, o domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase V de Humieola insolens compreendendo o domínio catalítico codificando seqüência de SEQ ID NO 1.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase VI.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase da Família 5. Em um aspecto mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Mycehophthora thermophila CBS 117 65. Em um aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Myeehophthora thermophila CBS 117 65 que codifica o polipeptídeo de SEQ ID NO 4. Em um outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Myceliophthora thermophila CBS 117 65 compreendendo SEQ ID NO 3. Em um outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de basidiomicete CBS 495 95. Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de basidiomicete CBS 495 95 que codifica o polipeptídeo de SEQ ID NO 6. Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de basidiomicete CBS 495 95 compreendendo SEQ ID NO 5. Em um outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de basidiomicete CBS 494 95. Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de basidiomicete CBS 494 95 que codifica o polipeptídeo de SEQ ID NO 8. Em outro aspecto o mais preferido, polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de basidiomicete CBS 494 95 compreendendo SEQ ID NO 7.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase Família 6. Em um outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Thielavia terrestris NRRL 8126 CEL6B. Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Thielavia terrestris NRRL 8126 CEL6B que codifica o polipeptídeo de SEQ ID NO 10. Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Thielavia terrestis NRRL 8126 CEL6B compreendendo SEQ ID NO 9. Em um outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Thielavia terrestris NRRL 8126 CEL6C Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Thielavia terrestris NRRL 8126 CEL6C que codifica o polipeptídeo de SEQ ID NO 12. Em um outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Thielavia terrestris NRRL 8126 CEL6C compreendendo SEQ ID NO 11. Em outro aspecto preferido, o polipeptídeo de comprimento
completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Família 7. Em um outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Thielavia terrestris NRRL 8126 CEL7C. Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Thielavia terrestris NRRL 8126 CEL7C que codifica o polipeptídeo de SEQ ID NO 14. Em um outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Thielavia terrestis NRRL 8126 CEL7C compreendendo SEQ ID NO 13. Em um outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Thielavia terrestis NRRL 8126 CEL7E. Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Thielavia terrestis NRRL 8126 CEL7E que codifica o polipeptídeo de SEQ ID NO 16. Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Thielavia terrestis NRRL 8126 CEL7E compreendendo SEQ ID NO 15. Em um outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Thielavia terrestis NRRL 8126 CEL7F. Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Thielavia terrestis NRRL 8126 CEL7F que codifica o polipeptídeo de SEQ ID NO 18. Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Thielavia terrestis NRRL 8126 CEL7F compreendendo SEQ ID NO 17. Em um outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase Cladorrhinum foecundissimum ATCC 62373 CEL7A. Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Cladorrhinum foecundis simum ATCC 62373 CEL 7A que codifica o polipeptídeo de SEQ ID NO 20. Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Cladorrhinum foecundissimum ATCC 62373 CEL7A compreendendo SEQ IDNO 19.
Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Trichoderma reesei cepa No VTT-D-80133 que codifica o polipeptídeo de SEQ ID NO 22 (GENBANK™ número de acesso Ml5665).
Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase de Triehoderma reesei cepa No VTT-D- 80133 compreendendo SEQ ID NO 21 (GENBANK™ número de acesso M 15665).
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase da Família 9.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase da Família 12. Em outro aspecto preferido, o polipeptídeo de comprimento
completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase da Família 45.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene de endoglucanase da Família 74.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo obtido a partir de um gene codificando um polipeptídeo homólogo compreendendo uma seqüência de aminoácidos que tem um grau de identidade para as seqüências de aminoácidos do polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico de SEQ ID NO 2, SEQ ID NO 4, SEQ ID NO 6, ou SEQ ID NO 8, SEQ ID NO 10, SEQ ID NO 12, SEQ ID NO 14, SEQ ID NO 16, SEQ ID NO 18, SEQ ID NO 20, ou SEQ ID NO 22 de pelo menos 60%, preferivelmente pelo menos 65%, mais preferivelmente pelo menos 70%, mais preferivelmente pelo menos 75%, mais preferivelmente pelo menos 80%, mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90%, o mais preferivelmente pelo menos 95%, e ainda o mais preferivelmente 96%, 97%, 98% ou 99%, que tem atividade de endoglucanase. Em um aspecto preferido, o polipeptídeo homólogo tem uma seqüência de aminoácidos que difere por dez aminoácidos, preferivelmente por cinco aminoácidos, mais preferivelmente por quatro aminoácidos, ainda mais preferivelmente por três aminoácidos, o mais preferivelmente por dois aminoácidos, e ainda o mais preferivelmente por um aminoácido do polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico de SEQ ID NO 2, SEQ ID NO 4, SEQ ID NO 6, ou SEQ ID NO 8, SEQ ID NO 10, SEQ ID NO 12, SEQ ID NO 14, SEQ ID NO 16, SEQ ID NO 18, SEQ ID NO 20, ou SEQ ID NO 22.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da endoglucanase, ou uma porção do mesmo, é codificado por um polinucleotídeo compreendendo uma seqüência de nucleotídeos que hibridiza sob condições de estringência muito baixas, preferivelmente condições de estringência baixa, mais preferivelmente condições de estringência média, mais preferivelmente condições de estringência média elevada, ainda mais preferivelmente condições de estringência alta, e o mais preferivelmente condições de estringência muito alta com (i)) SEQ ID NO 1, SEQ ID NO 3, SEQ ID NO 5, ou SEQ ID NO 7, SEQ ID NO 9, SEQ ID NO 11, SEQ ID NO 13, SEQ ID NO 15, SEQ ID NO 17, SEQ ID NO 19 ou SEQ ID NO 21, (ii) a seqüência de cDNA contida em SEQ ID NO 1, SEQ ID NO 3, SEQ ID NO 5, ou SEQ ID NO 7, SEQ ID NO 9, SEQ ID NO 11, SEQ ID NO 13, SEQ ID NO 15, SEQ ID NO 17, SEQ ID NO 19, ou SEQ ID NO 21, (iii) uma subsequência de (i) ou (ii) ou (iv) de um filamento complementar de (i), (ii) ou (iii), (J Sambrook, E. F. Fritsch, e T. Maniatis, 1989, Molecular Cloning, A Laboratory Manual, 2d ed. Cold Spring Harbor, New York) A subsequência de SEQ ID NO 1, SEQ ID NO 3, SEQ ID NO 5, ou SEQ ID NO 7, SEQ ID NO 9, SEQ ID NO 11, SEQ ID NO 13, SEQ ID NO 15, SEQ ID NO 17, SEQ ID NO 19, ou SEQ ID NO 21 contém pelo menos 100 nucleotídeos contíguos ou preferivelmente pelo menos 200 nucleotídeos contíguos.
A seqüência de nucleotídeos de SEQ ID NO 1, SEQ ID NO 3, SEQ ID NO 5, ou SEQ ID NO 7, SEQ ID NO 9, SEQ ID NO 11, SEQ ID NO 13, SEQ ID NO 15, SEQ ID NO 17, SEQ ID NO 19, ou SEQ ID NO 21, ou a subsequência das mesmas, assim como a seqüência de aminoácidos de SEQ ID NO 2, SEQ ID NO 4, SEQ ID NO 6, ou SEQ ID NO 8, SEQ ID NO 10, SEQ ID NO 12, SEQ ID NO 14, SEQ ID NO 16, SEQ ID NO 18, SEQ ID NO 20, ou SEQ ID NO 22, ou um fragmento das mesmas, pode ser usada para projetar uma sonda de ácido nucleico para identificar e clonar polipeptídeos codificando DNA tendo atividade de endoglucanase a partir de cepas de diferentes gêneros ou espécies de acordo com métodos bem conhecidos na arte. Em particular, estas sondas podem ser usadas para hibridização com o cDNA ou genômico do gênero ou espécie de interesse, seguindo procedimentos de Southern blotting padrões, a fim de identificar e isolar o gene correspondente ai. Estas sondas podem ser consideravelmente mais curtas do que a seqüência completa, mas devem ser pelo menos 14, preferivelmente pelo menos 25, mais preferivelmente pelo menos 35, e o mais preferivelmente pelo menos 70 nucleotídeos em comprimento. No entanto, prefere-se que a sonda de ácido nucleico tenha pelo menos 100 nucleotídeos em comprimento. Por exemplo, a sonda de ácido nucleico pode ter pelo menos 200 nucleotídeos, preferivelmente pelo menos 300 nucleotídeos, mais preferivelmente pelo menos 400 nucleotídeos, ou o mais preferivelmente pelo menos 500 nucleotídeos de comprimento. Sondas ainda mais longas podem ser usadas, por exemplo, sondas de ácido nucleico que tem pelo menos 600 nucleotídeos, pelo menos preferivelmente pelo menos 700 nucleotídeos, mais preferivelmente pelo menos 800 nucleotídeos, ou o mais preferivelmente pelo menos 900 nucleotídeos em comprimento. Tanto sondas de DNA como de RNA podem ser usadas. As sondas são tipicamente rotuladas para detecção do gene correspondente (por exemplo com 32P, 3H, 35S, biotina, ou avidina). Estas sondas estão englobadas na presente invenção.
Uma biblioteca de DNA genômico ou cDNA preparada a partir destes outros organismos pode, assim, ser tríada para DNA que hibridiza com as sondas descritas acima e codifica um polipeptídeo tendo atividade de endoglucanase. DNA genômico ou outro a partir destes outros organismos pode ser separado por eletroforese de gel agarose ou poliacrilamida ou outras técnicas de separação. O DNA de bibliotecas ou o DNA separado pode ser transferido e imobilizado em nitrocelulose ou outro material de veículo apropriado. A fim de identificar um clone ou DNA que é homólogo com as seqüências acima, o material veículo é usado em Southern Blot.
Para fins da presente invenção, as hibridização indica que a seqüência nucleotídica hibridiza em uma sonda de ácido nucleico rotulada correspondendo a uma das seqüências de nucleotídeos descritas acima sob condições de estringência muito baixa a muito alta. As moléculas em que as sondas de ácido nucleico hibridizam sob estas condições podem ser detectadas usando filme de raio-X. Para sondas longas de pelo menos 100 nucleotídeos de
comprimento, as condições de estringência muito baixa a muito alta são definidas como pré-hibridização e hibridização a 42°C em 5X SSPE, 0 3% SDS, 200 μg/ml DNA de esperma de salmão desnaturado e cisalhado, e 25% formamida para estringências muito baixas e baixas, 35% formamida para estringências média e média-alta,, ou 50% formamida para estringências altas e muito altas, seguindo procedimentos Southern blotting padrões durante 12a 24 horas, otimamente.
Para sondas longas de pelo menos 100 nucleotídeos em comprimento, o material veículo é finalmente lavado três vezes cada durante minutos usando 2 X SSC, 02% SDS preferivelmente a 45°C (estringência muito baixa), mais preferivelmente a 50°C (estringência baixa), mais preferivelmente a 550C (estringência média), mais preferivelmente a 60 0C (estringência média elevada), ainda mais preferivelmente a 65 0C (estringência alta), e o mais preferivelmente a 70 0C (estringência muito alta).
Para sondas curtas que tem cerca de 15 nucleotídeos a cerca de 70 nucleotídeos em comprimento, condições de estringência são definidas como pré-hibridização, hibridização e pós-hibridização de lavagem, a cerca de
5°C a cerca de 10 0C abaixo do Tm calculado, usando o cálculo de acordo com Bolton e McCarthy (1962, Proceedings of the National Aeademy of Sciences USA 48 1390) em 0,9 M NaCI, 0,09 M Tris-HCI pH 7,6, 6 mM EDTA, 0,5% NP- 40, IX solução de Denhardt, 1 mM pirofosfato de sódio, 1 mM fosfato monobásico de sódio, 0,1 mM ATP, e 0,2 mg de RNA de levedura por ml seguindo os procedimentos de Southern blotting padrões durante 12 a 24 horas otimamente.
Para sondas curtas que tem cerca de 15 nucleotídeos a cerca de 70 nucleotídeos em comprimento, o material veículo é lavado uma vez em 6X SCC mais 0,1% SDS durante 15 minutos e duas vezes cada durante 15 min usando 6 X SSC a 5 0C a 10 0C abaixo do Tm calculado. Polipeptídeos tendo atividade biológica e polinucleotídeos dos mesmos
Qualquer polipeptídeo que é fracamente secretado ou não secretado de todo pode ser usado nos métodos da presente invenção. O polipeptídeo pode ser qualquer polipeptídeo tendo uma atividade biológica de interesse. O polipeptídeo tendo atividade biológica pode ser nativo ou heterólogo (estranho) para a célula hospedeira fungica de interesse. O termo "polipeptídeo heterólogo" é definido aqui como polipeptídeo que não é nativo para a célula hospedeira; ou um polipeptídeo nativo em que modificações estruturais foram feitas para alterar o polipeptídeo nativo. Em um aspecto preferido, o polipeptídeo é uma anticorpo, antígeno, peptídeo antimicrobiano, enzima, fator de crescimento, hormônio, imunodilatador, neurotransmissor, receptor, proteína repórter, ou proteína estrutural
Em outro aspecto preferido, o polipeptídeo é uma albumina, colágeno, tropoelastina, elastina, ou gelatina. Em um aspecto mais preferido, o polipeptídeo é uma oxidoreductase, transferase, hidrolase, liase, isomerase, ou ligase.
Em um aspecto ainda mais preferido, o polipeptídeo é uma alfa-amilase, alfa- 1,3-glucanase, alfa-galactosidase, alfa-glucosidase, alfa- 1,6-mannosidase, aminopeptidase, amilase, arabinase, beta-agarase beta- amilase, beta-1,3-glucanase beta-1,6-glucanase, beta-galactosidase, beta- glucosidase, beta-mannosidase carbohidrase, carboxipeptidase, catalase, celulase, chitinase, quitosanase, cutinase ciclodextrano glicosiltransferase, deoxÍ7cbonuclease, dextranase, endo-1,4-beta- galactanase, endo-l,6-beta- galactanase, esterase, fucosidase, glucoamilase, glucocerebrosidase, hialuronidase, inulinase, invertase, laccase, levanase, liqueninase, lipase, lisozime, mannosidase, mutanase, oxidase, enzima pectinolítica, peroxidase, fosfolipase, fitase, poligalacturonase, polifenoloxidase, enzima proteolítica, rhamnogalacturonase, rhamnosidase, ribonuclease, trehalase, transglutaminase, transglicosilase, uroquinase, ou xilanase.
Em ainda outro aspecto mais preferido, o polipeptídeo é uma enzima celulolítica ou celulase. Exemplos de enzimas celulolíticas incluem, mas não são limitados a endoglucanases, celobiohidrolases, e beta- glucosidases. Outras proteínas que auxiliam a ação da enzima celulolítica são polipeptídeos tendo atividade melhora dora celulolítica (ver, por exemplo, WO 2005/074647, WO 2005/074656, e pedido US publicado 2007/0077630). Em um aspecto o mais preferido, o polipeptídeo é uma endoglucanase. Em outro aspecto o mais preferido, o polipeptídeo é uma celobiohidrolase. Em outro aspecto o mais preferido, o polipeptídeo é uma beta-glucosidase. Em outro aspecto o mais preferido, o polipeptídeo é um polipeptídeo tendo atividade melhoradora celulolítica.
Em um outro aspecto o mais preferido, o polipeptídeo é uma hemicelulase. Hemicelulases podem ser colocadas em três categorias gerais: as enzimas de endo-atuação que atacam as ligações internas dentro da cadeia de polissacarídeo, as enzima de exo-atuação que atuam sucessivamente a partir ou da extremidade de redução ou não redução de cadeia de polissacarídeo, e as enzimas acessórias, acetilesterases e esterases que hidrolisam ligações de lignina glicosídeos, como esterase de ácido cumárico e esterase de ácido ferúlico (Wong, Κ. K. Y., Tan, L. U. L., e Saddler, J N, 1988, Multiplicity of P-l,4-xilanase in microorganisms: Functions and applications, Microbiol Rev 52 305-317, Tenkanen, M., e Poutanen, K, 1992, Significance of esterases in the degradation of xilans in Xilans and Xylanases, Visser, J., Beldman, G, Kuster-van Someren, M.A., e Voragen, A. G. J., eds, Elsevier, New York, NY, 203-212, Coughlan, M. P., e Hazlewood, G P, 1993, Hemicellulose and hemicellulases, Portland, London, UK, Brigham, J.S., Adney, W.S., e Mimmel, M. E., 1996, Hemicellulases Diversity and applications, em Handbook on Bioethanol Produetion and Utilization, Wyman, C E, ed, Taylor & Francis, Washington, DC, 119-141)
Hemicelulases incluem, mas não são limitadas a xilanases, arabinofuranosidases, acetil xilano esterase, glucuronidases, endo- galactanase, mananases, endo- ou exo- arabinases, exo-galactanases, e misturas das mesmas. Exemplos de hemicelulases de endo-atuação e enzimas auxiliares incluem, mas não são limitados a endoarabinanase, endoarabinogalactanase, endoglucanase, endomannanase, endoxilanase, e feraxano endoxilanase. Exemplos de hemicelulases de exo-atuação e enzimas auxiliares incluem, mas não são limitados a, alfa-L-arabinosidase, beta-L- arabinosidase, alfa-l,2-L- fucosidase, alfa-D-galactosidase, beta-D- galactosidase, beta-D-glucosidase, beta-D- glucuronidase, beta-D- mannosidase, beta-D-xilosidase, exoglucosidase, exocelobiohidrolase, exomanobiohidrolase, exomananase, exoxilanase, xilano alfa-glucuronidase, e coniferina beta-glucosidase. Exemplos de esterases incluem, mas não são limitados a, acetil esterases (acetilgalactano esterase, acetilmanano esterase, e acetilxilano esterase) e aril esterases (esterase de ácido cumárico e esterase de ácido ferúlico).
Em outro aspecto o mais preferido, o polipeptídeo é uma xilanase. Em outro aspecto o mais preferido, o polipeptídeo é uma xiloglucanase. Em outro aspecto o mais preferido, o polipeptídeo é uma arabinofuranosidase. Em outro aspecto o mais preferido, o polipeptídeo é uma glucuronidase, por exemplo, alfa-glucuronidase. Em outro aspecto o mais preferido, o polipeptídeo é uma endo-galactanase. Em outro aspecto o mais preferido, o polipeptídeo é uma mannanase. Em outro aspecto o mais preferido, o polipeptídeo é uma endo-arabinase. Em outro aspecto o mais preferido, o polipeptídeo é uma exo-arabinase. Em outro aspecto o mais preferido, o polipeptídeo é uma endoarabinanase. Em outro aspecto o mais preferido, o polipeptídeo é uma endoarabinogalactanase. Em outro aspecto o mais preferido, o polipeptídeo é uma endoglucanase. Em outro aspecto o mais preferido, o polipeptídeo é uma endomannanase. Em outro aspecto o mais preferido, o polipeptídeo é uma endoxilanase. Em outro aspecto o mais preferido, o polipeptídeo é uma feraxuma endoxilanase. Em outro aspecto o mais preferido, o polipeptídeo é uma alfa-L- arabinosidase. Em outro aspecto o mais preferido, o polipeptídeo é uma beta-L- arabinosidase. Em outro aspecto o mais preferido, o polipeptídeo é uma beta-glucanase. Em outro aspecto o mais preferido, o polipeptídeo é uma alfa- 1,2-L-fucosidase. Em outro aspecto o mais preferido, o polipeptídeo é uma alfa-D-galactosidase. Em outro aspecto o mais preferido, o polipeptídeo é uma beta-D- galactosidase. Em outro aspecto o mais preferido, o polipeptídeo é uma beta- D-glucosidase. Em outro aspecto o mais preferido, o polipeptídeo é uma beta- D-glucuronidase. Em outro aspecto o mais preferido, o polipeptídeo é uma beta-D-mannosidase. Em outro aspecto o mais preferido, o polipeptídeo é uma beta-D-xilosidase. Em outro aspecto o mais preferido, o polipeptídeo é uma exoglucosidase. Em outro aspecto o mais preferido, o polipeptídeo é uma exomannobiohidrolase. Em outro aspecto o mais preferido, o polipeptídeo é uma exomananase. Em outro aspecto o mais preferido, o polipeptídeo é uma exoxilanase. Em outro aspecto o mais preferido, o polipeptídeo é uma xilano alfa-glucuronidase. Em outro aspecto o mais preferido, o polipeptídeo é uma coniferina beta-glucosidase.
Em um outro aspecto o mais preferido, o polipeptídeo é uma esterase. Como usado aqui, uma "esterase" também conhecida como hidrolase de éster carboxílico, refere-se a enzimas atuando em ligações éster, e inclui enzimas classificadas em Hidrolases de éster carboxílico EC 3.1.1 de acordo com Nomenclatura de enzimas (Enzime Nomenclature, 1992, Academic Press, San Diego, Califórnia, com Suplemento 1 (1993), Suplemento 2 (1994), Suplemento 3 (1995), Suplemento 4 (1997) e Suplemento 5, em Eur. J. Biochem 223 1-5, 1994, Eur. J. Biochem 232 1-6, 1995, Eur. J. Bioehem 237 1-5, 1996, Eur. J. Bioehem 250 1-6, 1997, e Eur. J. Bioehem 264 610- 650, 1999, respectivamente). Os exemplos não limitativos de esterases incluem arilesterase, triacilglicerol lipase, acetilesterase, acetilcolinaesterase, colinaesterase, tropinaesterase, pectinaesterase, esterol esterase, clorofilase, L-arabinonolactonase gluconolactonase, uronolactonase, tanase, retinil- palmitato esterase, hidroxibutirato- dímero hidrolase, acilglicerol lipase, 3- oxoadipato enol-lactonase, 1,4-lactonase, galactolipase, 4-piridoxolactonase, acilcarnitina hidrolase, aminoacil-tRNA hidrolase, D-arabinonolactonase, 6- fosfogluconolactonase, fosfolipase Al, 6-acetilglicose deacetilase, lipoproteína lipase, dihidrocoumarina lipase, limonina-D-anel-lactonase, esteróide-lactonase, triacetato-lactonase, actinomicina lactonase, orselinato- depsídeo hidrolase, cefalosporina-C deacetilase, clorogenato hidrolase, alfa- aminoácido esterase, 4-metiloxaloacetato esterase, carboximetilno butenolidase, deoxilimonate A-anel-lactonase, 2-acetil-l-
alquilglicerofosfocolina esterase, fusarinina- C- ornitinaesterase, sinapina esterase, cera - éster hidrolase, forbol-diéster hidrolase, fosfatidilinositol deacilase, sialato O-acetilesterase, acetoxibutinilbitiofeno deacetilase, acetilsalicilato deacetilase, metilumbelliferil-acetato deacetilase, 2-pirona-4,6- dicarboxilato lactonase, N- acetilgalactosaminoglicano deacetilase, esterase de hormônio juvenil, bis(2- etilhexil)ftalato esterase, proteína-glutamato metilesterase, 11-eis retinil-palmitato hidrolase, todo- trans-retinil-palmitato hidrolase, L-rhamnono-l,4-lactonase, 5-(3,4- diacetoxibut-l-inil)-2,2'- bitiofeno deacetilase, ácido graxo - étil- éster sintase, xilono-l,4-lactonase, N- acetilglucosaminilfosfatidilinositol deacetilase, cetraxato benzilesterase, e acetilalquilglicerol acetilhidrolase Esterases que podem ser usadas para a bioconversaõ de celulose incluem acetil esterases como acetilgalactano esterase, acetilmanano esterase, e acetilxilano esterase, e esterases que hidrolisam ligações lignina glicosídeos, como esterase de ácido cumárico e esterase de ácido ferúlico.
Em outro aspecto o mais preferido, o polipeptídeo é uma acetil esterase. Em outro aspecto o mais preferido, o polipeptídeo é uma acetilgalactano esterase codificando, o polipeptídeo é uma acetilmannano esterase. Em outro aspecto o mais preferido, o polipeptídeo é uma acetil xilano esterase. Em outro aspecto o mais preferido, o polipeptídeo é uma aril esterase. Em outro aspecto o mais preferido, o polipeptídeo é uma esterase de ácido cumárico. Em outro aspecto o mais preferido, o polipeptídeo é uma esterase de ácido ferúlico.
Em um outro aspecto o mais preferido, o polipeptídeo é uma lipase. Em um outro aspecto o mais preferido, o polipeptídeo é uma fosfolipase, por exemplo, fosfolipase Al, fosfolipase A2, fosfolipase C, fosfolipase C, ou fosfolipase D.
Em um outro aspecto o mais preferido, o polipeptídeo é uma
cutinase.
Em outro aspecto o mais preferido, o polipeptídeo é uma glicose isomerase. Em outro aspecto o mais preferido, o polipeptídeo é uma xilose isomerase.
Em um outro aspecto o mais preferido, o polipeptídeo é uma enzima proteolítica. Proteases são bem conhecidas na arte e se referem a enzimas que catalisam a clivagem de ligações de peptídeos.
Em outro aspecto o mais preferido, o polipeptídeo é uma serina protease. Em outro aspecto o mais preferido, o polipeptídeo é uma metaloprotease. Em outro aspecto o mais preferido, o polipeptídeo é uma tiol protease.
Em um outro aspecto o mais preferido, o polipeptídeo é uma peptidase. Em outro aspecto o mais preferido, o polipeptídeo é uma aminopeptidase, por exemplo dipeptidilaminopeptidase ou tripeptidilaminopeptidase. Em outro aspecto o mais preferido, o polipeptídeo é uma carboxipeptidase.
Em um outro aspecto o mais preferido, o polipeptídeo é uma
laccase.
Em um outro aspecto o mais preferido, o polipeptídeo é uma
peroxidase.
Em um outro aspecto o mais preferido, o polipeptídeo é uma enzima degradando amido. Em outro aspecto o mais preferido, o polipeptídeo é uma alfa-amilase. Em outro aspecto o mais preferido, o polipeptídeo é uma amiloglucosidase. Em outro aspecto o mais preferido, o polipeptídeo é pululanase. Em outro aspecto o mais preferido, o polipeptídeo é uma enzima desramifícadora. Em outro aspecto o mais preferido, o polipeptídeo é uma ciclodextrina glicosiltransferase. Um polinucleotídeo codificando um domínio catalítico, polipeptídeo maduro, ou polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica, ou uma porção da mesma, podem ser obtidos a partir de qualquer organismo.
Um polinucleotídeo codificando um polipeptídeo tendo atividade biológica pode ser obtido a partir de um gene codificando um polipeptídeo bacteriano. Por exemplo, o polipeptídeo pode ser um polipeptídeo bacteriano Gram positivo incluindo, mas não limitado a, um polipeptídeo de Bacillus, Streptococcus, Streptomyees, Staphylococeus, Enteroeoccus, Lactobacillus, Lactoeoceus, Clostridium, Geobaeillus, ou Oceanobaccillus, ou um polipeptídeo bacteriano Gram negativo, incluindo, mas não limitado a, polipeptídeo de E. eoli, Pseudomonas, Salmonella, Campylobaeter, Helieobaeter, Flavobaetenum, Fusobaetenum, llyobaeter Neisseria, ou Ureaplasma.
Em um aspecto preferido, um polinucleotídeo codificando um polipeptídeo tendo atividade biológica pode ser obtido a partir de um gene codificando um polipeptídeo de Bacillus alkalophilus, Bacillus amiloliquefacens, Bacillus brevis, Bacillus circulans, Bacillus clausii, Bacillus coagulans, Bacillus firmus, Bacillus tautus, Bacillus lentus, Bacillus hcheniformis, Bacillus megaterium, Bacillus pumitus, Bacillus stearothermophilus, Bacillus subtilis, ou Bacillus thunngiensis.
Em outro aspecto preferido, um polinucleotídeo codificando um polipeptídeo tendo atividade biológica pode ser obtido a partir de um gene codificando um polipeptídeo de Streptococcus equisimilis, Streptococcus pyogenes, Streptococcus ubens, ou Streptococcus equi subsp Zooepidemicus.
Em outro aspecto preferido, um polinucleotídeo codificando um polipeptídeo tendo atividade biológica pode ser obtido a partir de um gene codificando um polipeptídeo de Streptomyces achromogenes, Streptomyces avermitilis, Streptomyces coelicolor, Streptomyces grtseus, ou Streptomyces lividans.
Um polinucleotídeo codificando um polipeptídeo tendo atividade biológica também pode ser obtido a partir de um gene codificando um polipeptídeo fungico, e mais preferivelmente um polipeptídeo de levedura como um polipeptídeo de Candida, Kluyveromyces, Piehia, Saccharomyces, Schtzosaccharomyces, ou Yarrowia, ou mais preferivelmente um polipeptídeo de fungo filamentoso como um polipeptídeo de Aeremonium, Agaricus, Atternana, Aspergillus, Aureobasidium, Botryospaer ia, Ceriporiopsis, Chaetomidium, Chrysosporium, Clavieeps, Coehliobotus, Coprinopsis, Coptotermes, Corynaseus, Cryphoneetria, Cryptocoeeus, Diplodia, Exidia, Filibasidium, Fusarium, Gibberella, Holomastigotoides, Humieola, Irpex, Lentinula, Leptospaena, Magnaporthe, Melanoearpus, Menpilus, Mueor, Myeehophthora, Neocallimastix, Neurospora, Paeeilomyees, Penieillium, Phaneroehaete, Piromyees, Poitrasia, Pseudoplectania Pseudotnehonympha, Rhizomueor, Schizophyllum, Seytalidium, Talaromyees, Thermoaseus, Thielavia, Totypodadium, Triehoderma, Triehophaea, Verticiallium, Volvariella, ow Xilaria.
Em um aspecto preferido, um polinucleotídeo codificando um polipeptídeo tendo atividade biológica pode ser obtido a partir de um gene codificando um polipeptídeo de Saceharomyces eartsbergensis, Saccharomyees eerevisiae, Saccharomyces diastatieus, Saccharomyees douglasu, Saccharomyees kluyven, Saccharomyees norbensis, om Saccharomyees oviformis
Em outro aspecto preferido, um polinucleotídeo codificando um polipeptídeo tendo atividade endoglucanase pode ser obtido a partir de um gene codificando um polipeptídeo de Aeremonium celulolytieus, Aspergillus aculeatus, Aspergillus awamori, Aspergillus fumigatus Aspergillus foetidus, Aspergillus japonieus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Chrysosponum keratinophilum, Chrysosponum lueknowense, Chtysosponum tmpicum, Chrysosponum merdarium, Chrysosporium mops, Chrysosponum pannicola, Chrysosponum queenslandicum, Chrysosponum zonatum, Cladorrhinum foecundissimum, Fusarium bactndioides, Fusarium cerealis, Fusarium crookwellense, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambuanum, Fusarium sarcochroum, Fusarium sporotnchioides, Fusarium sulphureum, Fusarium torulosum, Fusarium trichothecioides, Fusarium venenatum, Humicola grisea, Humicola insolens, Humicola lanuginosa, Irpex laeteus, Mueor miehei, Myceliophthora thermophila, Neurospora crassa, Penieillmm funieulosum, Pemallium purpurogenum, Phaneroehaete ehrysosponum, Thielavia aehromatiea, Thielavia albomyees, Thielavia albopilosa, Thielavia australeinsis, Thielavia fimeti, Thielavia mierospore, Thielavia ovispora, Thielavia peruviana, Thielavia spededomum, Thielavia setosa, Thielavia subthermophila, Thielavia terrestris, Thielavia vanospora, Thielavia wareingii, Triehoderma harzianum, Triehoderma kontngii, Triehoderma longibrachiatum Triehoderma reesei, ou Triehoderma viride.
Em um aspecto particularmente preferido, o polipeptídeo tendo atividade biológica é uma beta-glucosidase. Exemplos de beta- glucosidases que podem ser usadas como fontes para os polinucleotídeos nos métodos da presente invenção, incluem, mas não são limitados a, beta- glucosidase de Aspergillus oryzae (WO 02/095014, WO 04/099228), beta- glucosidase de Aspergillus aeuleatus (Kawaguchi et al, 1996, Gene 173 287- 288), Aspergillus avenaeeus (GENBANK™ número de acesso AY943971), Aspergillus fumigatus (GENBANK™ número de acesso XM745234), Aspergillus £mvac/z/7(GENBANK™ número de acesso AB003470), Aspergillus niger (GENBANK™ AJ132386), Magnaporthe grisea (GENBANK™ número de acesso AY849670), Phaneroehaete ehrysosponum (GENBANK™ número de acesso AB253327), Talaromyces emersonii (GENBANK™ número de acesso AY072918), e Triehoderma reesei (GENBANK™ números de acesso U09580, AB003110, AY281374, AY281375, AY281377, AY281378, e AY281379). Variantes de beta- glucosidases também podem ser usadas como fontes para os polinucleotídeos como os descritos em WO 04/099228.
Em um aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da beta-glucosidase, ou uma porção da mesma, é codificado por um polinucleotídeo obtido a partir de um gene de beta-glucosidase Família 1.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da beta-glucosidase, ou uma porção da mesma, é codificado por um polinucleotídeo obtido a partir de um gene de beta-glucosidase Família 3. Em outro aspecto preferido, o polipeptídeo de comprimento
completo, polipeptídeo maduro, ou domínio catalítico da beta-glucosidase, ou uma porção da mesma, é codificado por um polinucleotídeo obtido a partir de um gene de beta-glucosidase de Aspergillus oryzae. Em um aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da beta-glucosidase, ou uma porção da mesma, é codificado por um polinucleotídeo obtido a partir de um gene beta- glucosidase de Aspergillus oryzae compreendendo SEQ ID NO 23 que codifica o polipeptídeo de SEQ ID NO 24 ou um gene mutante de beta- glucosidase de Aspergillus oryzae compreendendo SEQ ID NO 25 que codifica o polipeptídeo de SEQ ID NO 26.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da beta-glucosidase, ou uma porção da mesma, é codificado por um polinucleotídeo obtido a partir de um gene de beta-glucosidase de Aspergillus fumigatus. Em um aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da beta-glucosidase, ou uma porção da mesma, é codificado por um polinucleotídeo obtido a partir de um gene de beta- glucosidase de Aspergillus fumigatus compreendendo SEQ ID NO 35 27 que codifica o polipeptídeo de SEQ ID NO 28.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da beta-glucosidase, ou uma porção da mesma, é codificado por um polinucleotídeo obtido a partir de um gene beta-glucosidase de Penicillium brasilianum cepa IBT 20888. Em um aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da beta-glucosidase, ou uma porção da mesma, é codificado por um polinucleotídeo obtido a partir de um gene de beta- glucosidase de Penicillium brasilianum cepa IBT 20888 compreendendo SEQ ID NO 29 que codifica o polipeptídeo de SEQ ID NO 30.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da beta-glucosidase, ou uma porção da mesma, é codificado por um polinucleotídeo obtido a partir de um gene de beta-glucosidase de Triehoderma reesei cepa No QM9414. Em outro aspecto o mais preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da beta-glucosidase, ou uma porção da mesma, é codificado por um polinucleotídeo obtido a partir de um gene de beta-glucosidase de Triehoderma reesei cepa No QM9414 compreendendo SEQ ID NO 31 que codifica o polipeptídeo de SEQ ID NO 32 (GENBANK™ número de acesso U09580). Em outro aspecto preferido, a beta-glucosidase é naturalmente secretada. Em outro aspecto preferido, a beta-glucosidase não é naturalmente secretada.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da beta-glucosidase, ou uma porção da mesma, é codificado por um polinucleotídeo obtido a partir de um gene codificando um polipeptídeo homólogo compreendendo uma seqüência de aminoácidos que tem um grau de identidade para as seqüências de aminoácidos do polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico de SEQ ID NO 24, SEQ ID NO 26, SEQ ID NO 28, SEQ ID NO 30, ou SEQ ID NO 32 de pelo menos 60%, preferivelmente pelo menos 65%, mais preferivelmente pelo menos 70%, mais preferivelmente pelo menos 75%, mais preferivelmente pelo menos 80%, mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90%, o mais preferivelmente pelo menos 95%, e ainda o mais preferivelmente 96%, 97%, 98%, ou 99%, que tem atividade endoglucanase. Em um aspecto preferido, o polipeptídeo homólogo tem uma seqüência de aminoácidos que difere por dez aminoácidos, preferivelmente por cinco aminoácidos, mais preferivelmente por quatro aminoácidos, ainda mais preferivelmente por três aminoácidos, o mais preferivelmente por dois aminoácidos, e ainda o mais preferivelmente por um aminoácido a partir do polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico de SEQ ID NO 24, SEQ ID NO 26, SEQ ID NO 28, SEQ ID NO 30, ou SEQ ID NO 32.
Em outro aspecto preferido, o polipeptídeo de comprimento completo, polipeptídeo maduro, ou domínio catalítico da beta-glucosidase, ou uma porção da mesma, é codificado por um polinucleotídeo que hibridiza sob condições de estringência muito baixa, preferivelmente condições de estringência baixa, mais preferivelmente condições de estringência média, mais preferivelmente condições de estringência média- alta, ainda mais preferivelmente condições de estringência alta, e o mais preferivelmente condições de estringência muito alta com (i) SEQ ID NO 23, SEQ ID NO 25, SEQ ID NO 27, SEQ ID NO 29, ou SEQ ID NO 31, (ii) a seqüência de cDNA contida em SEQ ID NO 23, SEQ ID NO 25, SEQ ID NO 27, SEQ ID NO 29, ou SEQ ID NO 31, (ii) a subsequência de (i) ou (ii) ou (iv) um filamento complementar de (i), (ii) ou (iii), (J.Sambrook, E.F. Fritsch, e T. Maniatis, 1989, Molecular Cloning, A Laboratory Manual, 2d ed., Cold Spring Harbor, New York). A subsequência de SEQ ID NO 23, SEQ ID NO 25, SEQ ID NO 27, SEQ ID NO 29, ou SEQ ID NO 31 contém pelo menos 100 nucleotídeos contíguos ou preferivelmente pelo menos 200 nucleotídeos contíguos.
A seqüência de nucleotídeos de SEQ ID NO 23, SEQ ID NO 25, SEQ ID NO 27 SEQ ID NO 29, ou SEQ ID NO 31, ou a subsequência da mesma, assim como a seqüência de aminoácidos de SEQ ID NO 24, SEQ ID NO 26, SEQ ID NO 28, SEQ ID NO 30, ou SEQ ID NO 32, ou um fragmento da mesma, pode ser usada para projetar uma sonda de ácido nucleico para identificar e clonar polipeptídeos codificando DNA tendo atividade beta- glucosidase a partir de cepas de diferentes gêneros ou espécies acordo com métodos bem conhecidos na arte. Em particular, estas sondas podem ser usadas para hibridização com o cDNA ou genômico do gênero ou espécie de interesse, seguindo os procedimentos de Southern blotting padrões, ou a fim de identificar e isolar o gene correspondente ai. Estas sondas são consideravelmente mais curtas do que a seqüência completa, mas devem ser de pelo menos 14, preferivelmente pelo menos 25, mais preferivelmente pelo menos 35, e o mais preferivelmente pelo menos 70 nucleotídeos em comprimento. No entanto, prefere-se que a sonda de ácido nucleico tenha pelo menos 100 nucleotídeos em comprimento. Por exemplo, a sonda de ácido nucleico pode ter pelo menos 200 nucleotídeos, preferivelmente pelo menos 300 nucleotídeos, mais preferivelmente pelo menos 400 nucleotídeos, ou o mais preferivelmente pelo menos 500 nucleotídeos em comprimento. Sondas ainda mais longas podem ser usadas, por exemplo, sondas de ácido nucleico que tem pelo menos 600 nucleotídeos, pelo menos preferivelmente pelo menos 700 nucleotídeos, mais preferivelmente pelo menos 800 nucleotídeos, ou o mais preferivelmente pelo menos 900 nucleotídeos em comprimento. Ambas as sondas de DNA e RNA podem ser usadas. As sondas são tipicamente rotuladas para detectar o gene correspondente (por exemplo, com
32 3 35
Ρ, H, S, biotina, ou avidina). Estas sondas são englobadas pela presente invenção.
Peptídeos sinal.
O peptídeo sinal pode ser qualquer peptídeo sinal apropriado reconhecido por uma célula hospedeira para secreção extracelular de uma proteína de fusão da presente invenção. A seqüência de sinal é preferivelmente a que está naturalmente associada com o componente endoglucanase de uma proteína de fusão a ser expressada.
A extremidade 5' da seqüência de codificação da seqüência de nucleotídeos codificando um polipeptídeo que contém inerentemente uma região de codificação de peptídeo naturalmente ligada em matriz de leitura de tradução com o segmento da região de codificação que codifica o polipeptídeo secretado. Alternativamente, a extremidade 5' da seqüência de codificação pode conter uma região de codificação de peptídeo sinal que é estranha para a seqüência de codificação. A região de codificação de peptídeo sinal estranho pode ser requerida onde a seqüência de codificação não contém naturalmente uma região de codificação de peptídeo sinal. Alternativamente, a região de codificação de peptídeo sinal estranho pode simplesmente substituir a região de codificação de peptídeo sinal natural a fim de melhorar a secreção do polipeptídeo. No entanto, qualquer região de codificação de peptídeo sinal que dirige a proteína de fusão expressada na via secretória da célula hospedeira de escolha, isto é, secretada em um meio de cultura, pode ser usada na presente invenção.
As seqüências de codificação de peptídeo sinal eficazs para células hospedeiras de fungos filamentosos são a seqüência de codificação de peptídeo sinal obtidas a partir dos genes para TAKA amilase de Aspergillus oryzae, amilase neutral de Aspergillus niger, glucoamilase de Aspergillus niger, aspártica proteinase de Rhizomucor miehei, celulase de Humicola insolens, endoglucanase V de Humieola insolens, e lipase de Humicola lanuginosa, celobiohidrolase I de Triehoderma reesei, celobiohidrolase II de Triehoderma reesei, endoglucanase I de Triehoderma reesei, endoglucanase II de Triehoderma reesei, endoglucanase III Triehoderma reesei, endoglucanase IV Triehoderma reesei, endoglucanase V Triehoderma reesei, xilanase I de Triehoderma reesei, xilanase II de Triehoderma reesei, e beta- xilosidase de Triehoderma reesei.
As seqüências de codificação de peptídeo sinal utilizáveis para células hospedeiras de levedura são obtidas dos genes para alfa-fator de Saccharomyees eerevisiae e invertase de Saccharomyees eerevisiae. Outra seqüência de codificação de peptídeo sinal utilizável é descrita por Romanos et al, 1992, supra.
Em um aspecto preferido, a seqüência de codificação de peptídeo sinal é obtida a partir de um gene que codifica uma endoglucanase. Em um aspecto mais preferido, a seqüência de codificação de peptídeo sinal é obtido a partir de um gene que codifica uma endoglucanase VI. Em um aspecto ainda mais preferido, a seqüência de codificação de peptídeo sinal é obtido a partir de um gene de Humieola insolens que codifica uma endoglucanase V. Em um aspecto ainda mais preferido, a seqüência de codificação de peptídeo sinal codifica aminoácidos 1 a 21 de SEQ ID NO 2. Em outro aspecto o mais preferido, a seqüência de codificação de peptídeo sinal é de nucleotídeos 1 a 63 de SEQ ID NO 1.
A proteína de fusão pode ainda compreender um segundo peptídeo sinal que é associado com o componente de beta-glucosidase de uma proteína de fusão. A seqüência de codificação de peptídeo sinal pode ser uma seqüência de codificação de peptídeo sinal que está naturalmente associada com a seqüência de codificação do polipeptídeo tendo atividade biológica ou pode ser uma seqüência de codificação de peptídeo sinal diferente como uma das descritas acima.
Em um aspecto preferido, a seqüência de codificação de peptídeo sinal é uma seqüência naturalmente associada com a seqüência de codificação de beta-glucosidase. Ligadores
Como mencionado supra, muitas endoglucanases tem uma estrutura de múltiplos domínios consistindo de um domínio catalítico separado de um ou mais módulos de ligação de carboidratos por um peptídeo (s) ligador (es). Nos métodos da presente invenção, as construções de proteína de fusão pode ainda compreender uma seqüência de codificação de ligador localizada 3' à seqüência compreendendo o domínio catalítico de endoglucanase e 5' para a seqüência compreendendo o domínio catalítico do polipeptídeo tendo atividade biológica.
O ligador pode ser obtido do mesmo gene que o domínio catalítico da endoglucanase ou de um gene de endoglucanase diferente. Por outro lado, o ligador pode ser de origem sintética.
Os exemplos de ligadores que podem ser usados nos métodos da presente invenção incluem, mas não limitados a ligadores obtidos dos genes de genes de celobiohidrolase I de Trichoderma reesei (Srisodsuk et al, 1Θ93, Journal of Biologieal Chemistry 268 20765-20761), celobiohidrolase de Hypoerea jeeonna (antes Triehoderma reesei) Cel7A (Mulakala et al, 2005, Proteins 60 598-605), endoglucanase V de Humieola insolens, e endoglucanase de Thielavia terrestris NRRL 8126 CEL7C.
Em um aspecto preferido, o ligador é obtido a partir de um gene de endoglucanase de Humicola insolens. Em outro aspecto preferido, o ligador é obtido a partir de um gene de endoglucanase de Triehoderma reesei. Em um aspecto mais preferido, o ligador é obtido a partir de um gene de endoglucanase V de Humieola insolens (eg5).
Em outro aspecto preferido, o ligador é obtido a partir de um gene de endoglucanase de Thielavia terrestris. Em um outro aspecto o mais preferido, o ligador é obtido a partir de um gene de endoglucanase de Thielavia terrestris NRRL 8126 CEL7C.
Em um aspecto preferido, o ligador tem pelo menos 5 resíduos de aminoácido. Em um aspecto mais preferido, o ligador tem pelo menos 15 resíduos de aminoácido. Em um aspecto o mais preferido, o ligador tem pelo menos 25 resíduos de aminoácido.
Em um aspecto preferido, o ligador tem entre cerca de 5 a cerca de 60 resíduos de aminoácido. Em um aspecto mais preferido, o ligador tem entre cerca de 15 a cerca de 50 resíduos de aminoácido. Em um aspecto o mais preferido, o ligador tem entre cerca de 25 a cerca de 45 resíduos de aminoácido.
Módulos de ligação de carboidratos
Módulos de ligação de carboidratos (CBMs) são definidos como seqüências de aminoácidos contíguas com uma duplicação discreta tendo atividade de ligação de carboidrato s, e são comumente encontrados dentro de enzimas ativas para carboidratos. Vários tipos de CBMS foram descritos e a maior parte liga a polissacarídeos insolúveis (ver Boraston et al, 2004, BioChem J. 382 769-781)
Módulos de ligação de carboidratos foram caracterizados os quais mediam a interação com, por exemplo, celulose cristalina, celulose não cristalina, quitina, beta-l,3-glucanos e beta-l,3-l,4-glucanos de ligação mista, xilano, mannano, galactano e amido. Módulos de ligação de carboidratos ocorrem com freqüência em celulases de múltiplos domínios. Apesar de alguns CBMS conferirem ligação específica a um subconjunto de estruturas de carboidratos, outros são mais gerais em sua capacidade de se associar com vários polissacarídeos. CBMs que conferem ligação a celulose são às vezes referidos como domínios de ligação de celulose, ou CBDs (Boraston et al, 2004, Biochem J. 382 769-781). CBMs são agrupados por similaridade com aminoácido, atualmente 48 famílias de CBM são descritas.
As glicosídeo hidrolases podem compreender mais de um domínio catalítico e um, dois, três ou mais CBMs, e opcionalmente ainda compreender uma ou mais regiões de seqüência de aminoácido de polipeptídeo ligando os CBM(s) com o(s) domínio(s) catalítico(s), uma região do último tipo geralmente sendo denotada um "ligador". Os exemplos de enzimas hidrolíticas compreendendo um CBM são e celulases, xilanases, mannanases, arabinofuranosidases acetilesterases e quitinases (ver P. Tomme et al, Cellulose -Binding Domains - Classification and Properties in Enzymatic Degradation of Insoluble Carbohydrates, John N. Saddler e Michael H. Penner (Eds ), ACS Symposium Series, No 618, 1996).
Um CBM pode estar localizado no término N ou C ou em uma posição interna de uma proteína ou polipeptídeo. A região de um polipeptídeo ou proteína que constituí um CBM tipicamente consiste de mais do que cerca de 30 e menos do que cerca de 250 resíduos de aminoácidos. Por exemplo os CBMs listados e classificados em Família I consistem de 33-37 resíduos de aminoácido, os listados e classificados em Família 2a consistem de 95-108 resíduos de aminoácido, e os listados e classificados em Família 6 consistem de 85-92 resíduos de aminoácido. Assim, o peso molecular de uma seqüência de aminoácidos constituindo um CBM estará tipicamente na faixa de cerca de 4 kDa a cerca de 40 kDa, e geralmente abaixo de cerca de 35 kDa.
Nos métodos da presente invenção, qualquer CBM pode ser usado. O CBM pode ser naturalmente associado com a endoglucanase ou pode ser estranho para a endoglucanase.
Em um aspecto preferido, um CBM é obtido a partir de um gene de endoglucanase de Trichoderma reesei (EG). Em um aspecto mais preferido, um CBM é obtido a partir de um gene de endoglucanase EGI de Triehoderma reesei. Em um outro aspecto o mais preferido, um CBM é obtido a partir de um gene endoglucanase EGII de Triehoderma reesei. Em um outro aspecto o mais preferido, um CBM é obtido a partir de um gene de endoglucanase EGV de Trichoderma reesei. Em outro aspecto preferido, um CBM é obtido a partir de um gene de celobiohidrolase (CBH) de Triehoderma reesei gene. Em outro aspecto preferido, um CBM é obtido a partir de um gene CBHI Trichoderma reesei (Tern et al, 1987, Gene 51 42-52, Linder e Teen, 1996, Biochemistry 93 12251-12255). Em outro aspecto preferido, um CBM é obtido a partir de um gene CBHII de Triehoderma reesei.
Em outro aspecto preferido, um CBM é obtido a partir de um gene de endoglucanase de Thielavia terrestris. Em um outro aspecto o mais preferido, um CBM é obtido a partir de um gene de endoglucanase de Thielavia terrestris NRRL 8126 CEL7C. Sítio de clivagem
Nos métodos da presente invenção, as construções de proteína de fusão podem ainda compreender uma seqüência de nucleotídeos codificando um sítio de clivagem. O sítio de clivagem está preferivelmente localizado entre a seqüência compreendendo pelo menos o domínio catalítico de endoglucanase e a seqüência compreendendo pelo menos o domínio catalítico do polipeptídeo tendo atividade biológica. Quando da secreção de uma proteína de fusão, o sítio é clivado liberando o polipeptídeo tendo atividade biológica de uma proteína de fusão.
Exemplos de sítios de clivagem incluem, mas não são limitados a, sítio Kex2 que codifica o dipeptídeo Lys-Arg (Martin et al, 2003, J. Ind. Mierobiol.Biotechnol 3 568- 76, Svetina et al, 2000, J Bioteehnol 76 245-251, Rasmussen-Wilson Et al, 1997, Appl Environ Microbiol 63 3488- 3493, Ward et al, 1995, Biotechnology 13 498-503, e Contreras et al, 1991, Biotechnology 9 378-381), um sítio Me-(Glu ou Asp)-Gly-Arg, que é clivado por um Fator Xa protease após o resíduo arginina (Eaton et al, 1986, Biochem 505-512), um sítio Asp-Asp-Asp-Asp-Lys site, que é clivado por uma enteroquinase após a lisina (Colhns-Racie et al, 1995, Bioteehnology ( 982- 987), um sítio His-Tyr-Glu ou sítio His-Tyr-Asp, que é clivado por Genenase I (Carter ef al, 1989, Proteins Structure, Funetion, and Genetics 240-248), um sítio Leu-Val-Pro-Arg-Gly-Ser que é clivado por trombina após o Arg (Stevens, 2003, Drug Discovery World 4 35- 48J, um sítio Glu-Asn-Leu-Tyr- Phe-Gln-Gly, que é clivado por TEV protease após o Gln (Stevens, 2003, supra), e um sítio Leu- Glu-Val-Leu-Phe-Gln-Gly-Pro, que é clivado por forma geneticamente engenheirada de rhinovírus humano 3 C protease após o Gln (Stevens, 2003, supra) Proteínas de fusão
Uma proteína de fusão tendo atividade biológica da presente invenção compreendendo um peptídeo sinal, pelo menos o domínio catalítico de uma endoglucanase ou uma porção da mesma, e pelo menos o domínio catalítico de um polipeptídeo tendo atividade biológica ou uma porção do mesmo, aumenta a secreção de uma proteína de fusão comparado com a ausência de pelo menos o domínio catalítico da endoglucanase ou uma porção da mesma. Em cada um dos aspectos preferidos abaixo, os componentes de uma proteína de fusão são ligados em armação a partir do término N para o término C da proteína.
Em um aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de uma endoglucanase, e um domínio catalítico de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de um polipeptídeo tendo atividade biológica, e um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de uma endoglucanase, e um domínio catalítico de um polipeptídeo tendo atividade biológica
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de um polipeptídeo tendo atividade biológica, e um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de uma endoglucanase, e um polipeptídeo maduro de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de um polipeptídeo tendo atividade biológica, e um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de uma endoglucanase, e um polipeptídeo maduro de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de um polipeptídeo tendo atividade biológica, e um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de uma endoglucanase, e um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica, e um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de uma endoglucanase, e um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica, e um polipeptídeo maduro de uma endoglucanase. Em outro aspecto preferido, a proteína de fusão compreende um polipeptídeo de comprimento completo de uma endoglucanase (peptídeo sinal e polipeptídeo maduro), e um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica e um polipeptídeo de comprimento completo de uma endoglucanase (peptídeo sinal e polipeptídeo maduro).
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de uma endoglucanase, um ligador e/ou um módulo de ligação de carboidrato, e um domínio catalítico de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de um polipeptídeo tendo atividade biológica, um ligador e/ou um módulo de ligação de carboidrato, e um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de uma endoglucanase, um ligador e/ou um módulo de ligação de carboidrato, e um domínio catalítico de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de um polipeptídeo tendo atividade biológica, um ligador e/ou um módulo de ligação de carboidrato, e um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de uma endoglucanase, um ligador e/ou um módulo de ligação de carboidrato, e um polipeptídeo maduro de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de um polipeptídeo tendo atividade biológica, um ligador e/ou um módulo de ligação de carboidrato e um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de uma endoglucanase, um ligador e/ou um módulo de ligação de carboidrato, e um polipeptídeo maduro de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de um polipeptídeo tendo atividade biológica, um ligador e/ou um módulo de ligação de carboidrato, e um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de uma endoglucanase, um ligador e/ou um módulo de ligação de carboidrato, e um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica, um ligador e/ou um módulo de ligação de carboidrato, e um domínio catalítico de uma endoglucanase. Em outro aspecto preferido, a proteína de fusão compreende
um peptídeo sinal, um polipeptídeo maduro de uma endoglucanase, um ligador e/ou um módulo de ligação de carboidrato, e um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo de comprimento completo de um polipeptídeo tendo atividade biológica, um ligador e/ou um módulo de ligação de carboidrato, e um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de uma endoglucanase, um segundo peptídeo sinal, e um domínio catalítico de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de um polipeptídeo tendo atividade biológica, um segundo peptídeo sinal, e um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de uma endoglucanase, um segundo peptídeo sinal, e um domínio catalítico de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de um polipeptídeo tendo atividade biológica, um segundo peptídeo sinal, e um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de uma endoglucanase, um segundo peptídeo sinal, e um polipeptídeo maduro de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de um polipeptídeo tendo atividade biológica, um segundo peptídeo sinal, e um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de uma endoglucanase, um segundo peptídeo sinal, e um polipeptídeo maduro de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de um polipeptídeo tendo atividade biológica, um segundo peptídeo sinal, e um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de uma endoglucanase, um ligador e/ou um módulo de ligação de carboidrato, um segundo peptídeo sinal; e um domínio catalítico de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de um polipeptídeo tendo atividade biológica, um ligador e/ou um módulo de ligação de carboidrato, um segundo peptídeo sinal, e um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de uma endoglucanase, um ligador e/ou um módulo de ligação de carboidrato, um segundo peptídeo sinal, e um domínio catalítico de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de um polipeptídeo tendo atividade biológica, um ligador e/ou um módulo de ligação de carboidrato, um segundo peptídeo sinal, e um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um domínio catalítico de uma endoglucanase, um ligador e/ou um módulo de ligação de carboidrato, um segundo peptídeo sinal, e um polipeptídeo maduro de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de um polipeptídeo tendo atividade biológica, um ligador e/ou um módulo de ligação de carboidrato, um segundo peptídeo sinal, e um domínio catalítico de uma endoglucanase.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, um polipeptídeo maduro de uma endoglucanase, um ligador e/ou um módulo de ligação de carboidrato, um segundo peptídeo sinal, e um polipeptídeo maduro de um polipeptídeo tendo atividade biológica.
Em outro aspecto preferido, a proteína de fusão compreende um peptídeo sinal, e um polipeptídeo maduro de um polipeptídeo tendo atividade biológica, um ligador e/ou um módulo de ligação de carboidrato, um segundo peptídeo sinal, e um polipeptídeo maduro de uma endoglucanase.
Em outro aspecto preferido, para cada um dos aspectos preferidos acima, a proteína de fusão pode compreender alternativamente uma porção do domínio catalítico, o polipeptídeo maduro, ou o polipeptídeo de comprimento completo de uma endoglucanase ou um polipeptídeo tendo atividade biológica. A porção da endoglucanase pode ter ou não ter atividade de endoglucanase. Em um aspecto mais preferido, a porção da endoglucanase tem atividade endoglucanase. Promotores
A região de promotor pode ser qualquer seqüência de promotor apropriada reconhecida por uma célula hospedeira para expressão de uma proteína de fusão. A seqüência de promotor contém seqüências de controle transcripcional que mediam a expressão do polipeptídeo. O promotor pode ser qualquer seqüência de nucleotídeo que mostra atividade transcripcional na célula hospedeira de escolha incluindo promotores mutantes, truncados, tandem, e híbridos e pode ser obtido de genes codificando polipeptídeos extracelulares ou intracelulares ou nativos ou estranhos (heterólogos) para a célula hospedeira. Os promotores exemplares incluem tanto promotores constitutivos como indutíveis.
Os exemplos de promotores apropriados para dirigir a transcrição das construções de proteína de fusão da presente invenção, especialmente em uma célula hospedeira bacteriana, são os promotores obtidos de operon Iac de E. coli, gene agarase de Streptomyces coelicolor (dagA), gene levansucrase de Bacillus subtilis (sacB), gene alfa- amilase de Bacillus lieheniformis (amyL), gene maltogênico amilase de Bacillus stearothermophilus (amyM), gene alfa-amilase de Bacillus amiloliquefaciens (amyQ), gene penicillinase de Bacillus licheniformis (penP), genes xylA e xylB de Bacillus subtilis, e gene beta-lactamase procariótico (Villa-Kamaroff et al, 1978, Proeeedings of the National Academy of Sciences USA 75 3727- 3731), assim como um promotor tac (DeBoer et al, 1983, Proceedings of the National Academy of Sciences USA 80 21-25) outros promotores são descritos em "Useful proteins from recombinant bactéria" in Scientific American, 1980, 242 74-94, e em Sambrook et al, 1989, supra.
Exemplos de promotores apropriadas para dirigir a transcrição de construções de fusão da presente invenção em uma célula hospedeira de fungo filamentoso são promotores obtidos a partir dos genes para TAKA amilase de Aspergillus oryzae, proteinase aspártica de Rhizomucor miehei, alfa-amilase neutral de Aspergillus niger, alfa-amilase estável em ácido de Aspergillus niger acid stable, glucoamilase de Aspergillus niger ou Aspergillus awamori (glaA), lipase de Rhizomucor miehei, protease alcalina de Aspergillus oryzae, triose fosfato isomerase de Aspergillus oryzae, acetamidase de Aspergillus nidulans, amiloglucosidase de Fusarium venenatum (WO 00/56900), Fusarium venenatum Dana (WO 00/56900), Fusarium venenatum Quinn (WO 00/56900), protease tipo tripsina de Fusarium oxysporum (WO 96/00787), beta-glucosidase de Trichoderma reesei, celobiohidrolase I de Triehoderma reesei, celobiohidrolase II de Triehoderma reesei, endoglucanase I de Triehoderma reesei, endoglucanase II de Trichoderma reesei, endoglucanase III de Triehoderma reesei, endoglucanase IV de Triehoderma reesei, endoglucanase V de Triehoderma reesei, xilanase I de Triehoderma reesei, xilanase II de Triehoderma reesei, beta-xilosidase de Triehoderma reesei, beta-tubulina de Coprinus einereus e swollenina de Triehoderma reesei, assim como promotor NA2-tpi (um híbrido dos promotores dos genes para alfa-amilase neutral Aspergillus niger e triose fosfato isomerase Aspergillus oryzae), e os promotores mutantes, truncados e híbridos dos mesmos.
Em hospedeiro de levedura, promotores apropriados são obtidos a partir de genes para enolase de Saccharomyces cerevísiae (ENOl), galactoquinase de Saccharomyees eerevisiae (GAL1), álcool dehidrogenase/gliceraldeído-3- fosfato dehidrogenase Saccharomyees eerevisiae (ADH1, ADH2/GAP), triose fosfato isomerase Saccharomyees eerevisiae (TPI), metalotionina Saccharomyees eerevisiae (CUP1), e fosfoglicerato quinase de Saccharomyees eerevisiae. Outros promotores utilizáveis para as células hospedeiras de levedura são descritos por Romanos et al, 1992, Yeast 8 423-488.
Em um aspecto preferido, o promotor é um promotor de celobiohidrolase. Em um aspecto mais preferido, o promotor é um promotor de celobiohidrolase I (cbhl). Em um aspecto ainda mais preferido, o promotor é um promotor do gene celobiohidrolase I de Triehoderma reesei (cbhl). Em um aspecto o mais preferido, o promotor é o promotor de Triehoderma reesei CbM de nucleotídeos 505 a 1501 de SEQ ID NO 29 (GENBANK™ número de acesso D86235). Em um outro aspecto o mais preferido, o promotor é um promotor de celobiohidrolase II (cbh2). Em ainda outro aspecto mais preferido, o promotor é um promotor do gene de celobiohidrolase II de Triehoderma reesei (cbh2). Em outro aspecto o mais preferido, o promotor é o promotor d e Triehoderma reesei cbh2 de nucleotídeos 1 a 582 de SEQ ID NO 30 (GENBANK™ número de acesso M55080).
Em outro aspecto preferido, o promotor é o promotor de NA2- tpi. Em outro aspecto preferido, o promotor é um promotor de TAKA amilase. Em outro aspecto preferido, o promotor é um promotor de amiloglucosidase de Fusarium venenatum. Em outro aspecto preferido, o promotor é um promotor de protease tipo tripsina de Fusarium oxysporum. Em outro aspecto preferido, o promotor é um promotor de glucoamilase (glaA) de Aspergillus niger ou Aspergillus awamori. Em um aspecto preferido, a região de promotor dirige a expressão do primeiro, segundo e terceiro polinucleotídeos, e alternativamente também o quarto polinucleotídeo. Terminadores
O terminador pode ser qualquer seqüência de terminador de transcrição reconhecida por uma célula hospedeira para terminar a transcrição. A seqüência do terminador é ligada operativamente ao término 3' da seqüência de nucleotídeos codificando o polipeptídeo. Qualquer terminador que é funcional na célula hospedeira de escolha pode ser usado na presente invenção.
Os terminadores preferidos para células hospedeiras de fungo filamentoso são obtidos a partir dos genes para TAKA amilase de Aspergillus oryzae, glucoamilase de Aspergillus niger, antranilato sintase de Aspergillus nidulans, alfa-glucosidase de Aspergillus niger, e protease tipo tripsina de Fusarium oxysporum.
Os terminadores preferidos para células hospedeiras de levedura são obtidos a partir de genes para enolase de Saccharomyces eerevisiae, citocromo Saccharomyees eerevisiae C (CYC1), e gliceraldeído-3- fosfato dehidrogenase de Saccharomyees eerevisiae. Outros terminadores utilizáveis para células hospedeiras de levedura são descritos por Romanos et al, 1992, supra.
Em um aspecto preferido, o terminador é um terminador de gene de celobiohidrolase. Em um aspecto mais preferido, o terminador é um terminador de gene de celobiohidrolase I (ebhl). Em um aspecto ainda mais preferido, o terminador é um terminador de gene de celobiohidrolase I de Triehoderma reesei {ebhl). Em um aspecto o mais preferido, o terminador é o terminador ebhl de Triehoderma reesei de SEQ ID NO 31. Em um outro aspecto o mais preferido, o terminador é um terminador de gene celobiohidrolase \\{ebh2). Em ainda outro aspecto mais preferido, o terminador é um terminador de gene de celobiohidrolase II de Trichoderma reesei (cbh2). Em outro aspecto o mais preferido, o terminador é o terminador cbh2 de SEQ ID NO 32 de Trichoderma reesei.
Em outro aspecto preferido, o terminador é um terminador de TAKA amilase. Em outro aspecto preferido, o promotor é a terminador de protease de tipo tripsina de Fusarium oxysporum. Em outro aspecto preferido, o promotor é um terminador de glucoamilase (glaA) de Aspergillus niger ou Aspergillus awamori. Outras seqüências regulatórias
As construções de proteína de fusão podem ainda compreender outros elementos regulatórios, como um líder, seqüência de poliadenilação e outros elementos.
A seqüência regulatórios também pode ser uma seqüência líder apropriada, uma região não traduzida de um mRNA que é importante para tradução pela célula hospedeira. A seqüência líder é ligada operativamente ao término 5' da seqüência de nucleotídeos codificando uma proteína de fusão. Qualquer seqüência líder que é funcional na célula hospedeira de escolha pode ser usada na presente invenção.
Os líderes preferidos para células hospedeiras de fungo filamentoso são obtidos a partir de genes para TAXA amilase de Aspergillus oryzae e triose fosfato isomerase de Aspergillus nidulans.
Os líderes apropriados para células hospedeiras de levedura são obtidos a partir de genes para enolase de Saccharomyces cerevisiae (ENO-I) 3- fosfoglicerato quinase de Saccharomyees cerevisiae, alfa-fator de Saccharomyees cerevisiae, e álcool dehidrogenase/gliceraldeído-3-fosfato dehidrogenase de Saccharomyces cerevisiae e (ADH2/GAP).
A seqüência regulatória também pode ser uma seqüência de poliadenilação, uma seqüência ligada operativamente ao término 3' da seqüência de nucleotídeos e, quando transcrita, é reconhecida pela célula hospedeira como um sinal para adicionar resíduos de poliadenosina a mRNA transcrito. Qualquer seqüência de poliadenilação que é funcional na célula hospedeira de escolha pode ser usada na presente invenção.
As seqüências de poliadenilação preferidas para células hospedeiras de fungo filamentoso são obtidas dos genes para TAKA amilase de Aspergillus oryzae, glucoamilase de Aspergillus niger, antranilato sintase de Aspergillus nidulans, protease tipo tripsina de Fusarium oxysporum, e alfa- glucosidase de Aspergillus niger.
As seqüências de poliadenilação utilizáveis para células hospedeiras de levedura são descritas por Guo e Sherman, 1995, Molecular CellularBiology, 15 5983-5990.
Pode ser desejável adicionar seqüências regulatórias que permitem a regulação da expressão do polipeptídeo com relação ao crescimento da célula hospedeira. Os exemplos de sistemas regulatórios são os que causam a expressão do gene a ser ligado ou desligado em resposta a um estímulo químico ou físico, incluindo a presença de um composto regulatório. Os sistemas regulatórios em sistemas procarióticos incluem os sistemas de operador lac, tac, e trp. Em levedura, o sistema ADH2 ou sistema GALl pode ser usado. Em fungo filamentoso, o promotor de TAKA alfa- amilase, promotor glucoamilase de Aspergillus niger, e promotor glucoamilase de Aspergillus oryzae podem ser usados como seqüências regulatórias. Outros exemplos de seqüências regulatórias são os que permitem a amplificação do gene. Em sistemas eucarióticos, estes incluem o gene dihidrofolato reductase, que é amplificado na presença de r metotrexato e genes de metalotioneina que são amplificados em metais pesados. Nestes casos, a seqüência de nucleotídeos codificando o polipeptídeo deve ser ligada operativamente com a seqüência regulatória.
As construções de proteína de fusão contém preferivelmente um ou mais marcadores selecionáveis que permitem a seleção fácil de células transformadas, transfectadas, transduzidas ou outras. Um marcador selecionável é um gene cujo produto provê resistência a biocida ou viral, resistência a metais pesados, prototrofia a auxotróficos, e outros.
Exemplos de marcadores bacterianos selecionáveis são os genes dal de Bacillus subtilis ou Bacillus lieheniformis, ou marcadores que conferem resistência a antibióticos como ampicilina, canamicina, cloranfenicol, ou resistência a tetraciclina. Os marcadores apropriados para células hospedeiras de levedura são ADE2, HIS3, LEU2, LYS2, MET3, TRP1, e URA3. Os marcadores selecionáveis para uso em uma célula hospedeira de fungo filamentoso incluem, mas não são limitados a, amdS (acetamidase), argB (ornitina carbamoiltransferase), bar (fosfinotricina acetiltransferase), hph (higromicina fosfotransferase), niaD (nitrato reductase), pyrG (orotidina-5'- fosfato decarboxilase), sC (sulfato adenilransferase), e trpC (antranilato sintase), assim como equivalentes dos mesmos. Preferidos para uso em uma célula de Aspergillus são os genes amdS e pyrG de Aspergillus nidulans ou Aspergillus oryzae e o gene bar de Streptomyees hygroseopicus. Vetores de expressão
A presente invenção também refere-se aos vetores de expressão recombinante compreendendo um polinucleotídeo codificando uma proteína de fusão, um promotor e sinais de parada transcripcional e translacional. Os vários ácidos nucleicos e seqüências de controle descritos aqui podem ser unidos juntos para produzir um vetor de expressão recombinante que pode incluir um ou mais sítios de restrição convenientes para permitir a inserção ou substituição da seqüência de nucleotídeo codificando o polipeptídeo em tais sítios. Alternativamente,um polinucleotídeo codificando uma proteína de fusão pode ser expressado por inserção da seqüência de nucleotídeo ou uma construção de proteína de fusão compreendendo a seqüência em um vetor apropriado para expressão. Ao criar o vetor de expressão, a seqüência de codificação está localizada no vetor de modo que a seqüência de codificação é ligada operativamente com as seqüências de controle apropriadas para expressão.
O vetor de expressão recombinante pode ser qualquer vetor (por exemplo, um plasmídeo ou vírus) que pode ser convenientemente submetido a procedimentos de DNA recombinantes e pode ocasionar a expressão da seqüência de nucleotídeo. A escolha do vetor tipicamente irá depender da compatibilidade do vetor com a célula hospedeira em que o vetor deve ser introduzido. Os vetores podem ser lineares ou plasmídeos circulares fechados.
O vetor pode ser um vetor autonomamente replicante, isto é, um vetor que existe como uma entidade extracromossômica, cuja replicação é independente da replicação cromossômica, por exemplo, um plasmídeo, um elemento extracromossômico, um minicromossomo, ou um cromossomo artificial. O vetor pode conter qualquer meio para assegurar uma auto- replicação. Alternativamente, o vetor pode ser um que, quando introduzido na célula hospedeira, é integrado no genoma e replicado junto com o (s) cromossomo (s) em que ele foi integrado. Além disso, um vetor único ou plasmídeo ou dois ou mais vetores ou plasmídeos que juntos contém o DNA total a ser introduzido no genoma da célula hospedeira, ou um transposon pode ser usado.
Os vetores da presente invenção preferivelmente contêm um ou mais marcadores selecionáveis que permitem uma seleção fácil de células transformadas, transfectadas, transduzidas, ou semelhantes. Exemplos de marcadores selecionáveis de fungo filamentoso, leveduras, bacterianos são descritos aqui.
Um vetor da presente invenção preferivelmente contém um elemento(s) que permite a integração do vetor no genoma da célula hospedeira ou replicação autônoma do vetor na célula independente do genoma.
Para integração no genoma de célula hospedeira, o vetor pode se basear na seqüência de polinucleotídeo codificando o polipeptídeo ou qualquer outro elemento do vetor para integração no genoma por recombinação homóloga ou não homóloga. Alternativamente, o vetor pode conter seqüências de nucleotídeos adicionais para dirigir a integração por recombinação homóloga no genoma da célula hospedeira em um local (s) preciso no (s) cromossomo (s). Para aumentar a probabilidade de integração em um local preciso, os elementos integracionais devem conter preferivelmente um número suficiente de ácidos nucleicos, como 100 a 10.000 pares de base, preferivelmente 400 a 10.000 pares de base, e o mais preferivelmente 800 a 10.000 pares de base, tendo um grau elevado de identidade com a seqüência de marcação correspondente para melhorar a probabilidade de recombinação homóloga. Os elementos integracionais podem ser qualquer seqüência, isto é, homóloga com a seqüência de marcação no genoma da célula hospedeira. Além disso, os elementos integracionais podem ser as seqüências de nucleotídeo de não codificação e de codificação. Por outro lado, o vetor pode ser integrado no genoma da célula hospedeira por recombinação não homóloga.
Para replicação autônoma, o vetor pode ainda compreender uma origem de replicação permitindo ao vetor replicar autonomamente na célula hospedeira em questão. A origem de replicação pode ser qualquer replicador de plasmídeo mediando a replicação autônoma que funciona em uma célula. O termo "origem de replicação " ou "replicador de plasmídeo" é definido aqui como uma seqüência de nucleotídeo que permite a um plasmídeo ou vetor replicar in vivo.
Exemplos de origens bacterianas de replicação são as de origens de replicação de plasmídeos pBR322, pUC19, pACYC177, e pACYC 184 permitindo a replicação em E. coli, e pUBl 10, pE194, pTA1060, e ρΑΜβΙ permitindo a replicação em Bacillus.
Exemplos de origens de replicação para uso em uma célula hospedeira de levedura são a origem de replicação de 2 microns, ARS1, ARS4, a combinação de ARSl e CEN3, e a combinação de ARS4 e CEN6.
Exemplos de origens de replicação utilizáveis em uma célula de fungo filamentoso são AMAI e ANSl (Gems et al, 1991, Gene 98: 61 - 67; Cullen et al, 1987, Nucleic Acids Research 15: 9163 - 9175; WO 00/24883). Isolamento do gene AMAI e construção de plasmídeo ou vetores compreendendo o gene podem ser alcançados de acordo com os métodos descritos em WO 00/24883.
Mais do que uma cópia de um polinucleotídeo codificando uma proteína de fusão pode ser inserida em uma célula hospedeira para aumentar a produção do produto de gene. Um aumento no número de cópia do polinucleotídeo pode ser obtido por integração de pelo menos uma cópia adicional da seqüência no genoma de célula hospedeira ou por inclusão de um gene de marcador selecionável amplificável com o polinucleotídeo onde células contendo cópias amplificadas do gene de marcador selecionável, e assim cópias adicionais do polinucleotídeo, podem ser selecionadas por cultivo das células na presença do agente selecionável apropriado.
Os procedimentos usados para ligar os elementos descritos acima para construir os vetores de expressão recombinante da presente invenção são bem conhecidos do versado na técnica (ver, por exemplo, Sambrook et al, 1989, supra). Células hospedeiras
A presente invenção também refere-se a células hospedeiras de fungos recombinantes, compreendendo um polinucleotídeo codificando uma proteína de fusão da presente invenção, que são usados com vantagem na produção recombinante da proteína. Um vetor compreendendo um polinucleotídeo da presente invenção é introduzido em uma célula hospedeira fungica de modo que o vetor é mantido como um integrante cromossômico ou como um vetor extra-cromossômico auto-replicante como descrito acima. O termo "célula hospedeira" engloba qualquer progênie ou célula parental que não é idêntica à célula parental devido às mutações que ocorrem durante a replicação.
A célula hospedeira fungica pode ser qualquer célula fungica utilizável na produção recombinante de um polipeptídeo da presente invenção.
"Fungos", como usado aqui, incluem os filos Ascomycota, Basidiomycota, Chytridiomycota, e Zygomycota (como definidos por Hawksworth et al., In, Ainsworth and Bisby's Dictionary of The Fungi, 8a. edição, 1995, CAB International, University Press, Cambridge, UK) assim como Oomycota (como citado em Hawksworth et al., 1995, supra, página 171) e todos os fungos mitospóricos (Hawksworth et al., 1995, supra).
Em um aspecto mais preferido, a célula hospedeira de fungo é uma célula de levedura. "Levedura" como usada aqui inclui levedura ascosporogenosa (Endomicetales), levedura basidiosporogenosa, e levedura pertencendo aos Fungi imperfecti (Blastomicetes). Porque a classificação de levedura pode mudar no futuro, para os fins desta invenção, levedura deve ser definida como descrito em Biology and Aetivities of Yeast (Skinner, F. A., Passmore, S. M., e Davenport, R. R., eds, Soe. App. Baeteriol. Symposium série n°. 9, 1980).
Em um aspecto ainda mais preferido, a célula hospedeira de levedura é uma célula de Candida, Hansenula, Kluyveromyces, Piehia, Saccharomyees, Schizosaceharomyees, ou Yarrowia.
Em um aspecto o mais preferido, a célula hospedeira de levedura é uma célula de Saccharomyees earlsbergensis, Saccharomyees cerevisiae, Saccharomyees diastatieus, Saccharomyees douglasii, Saccharomyees kluyveri, Saccharomyees norbensis, ou Saccharomyees oviformis. Em outro aspecto o mais preferido, a célula hospedeira de levedura é uma célula de Kluyveromyces lactis. Em outro aspecto o mais preferido, a célula hospedeira de levedura é uma célula de Yarrowia lipolytica.
Em outro aspecto mais preferido, a célula hospedeira de fungo é uma célula de fungo filamentoso. "Fungos filamentosos" incluem todas as formas filamentosas da subdivisão Eumycota e Oomycota (como definido por Hawksworth et al., 1995, supra). Os fungos filamentosos geralmente são caracterizados por uma parede miceliana composta de quitina, celulose, glucano, quitosana, manano, e outros polissacarídeos complexos. Crescimento vegetativo é por alongamento das hifas e catabolismo de carbono é obrigatoriamente aeróbico. Em contraste, crescimento vegetativo por leveduras como Saccharomyces eerevisiae é por formação de broto de um talo unicelular e catabolismo de carbono pode ser fermentativo.
Em um aspecto mais preferido, a célula hospedeira de fungo filamentoso é uma célula de Aeremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Chrysosporium, Coprinus, Conolus, Cryptoeoceus, Fihbasidium, Fusarium, Humieula, Magnaporthe, Mueor, Myeeliophthora, Neoeallimastix, Neurospora, Paealomyees, Penieillium, Phaneroehaete, Phtebia, Piromyoes, Pleurotus, Schizophyllum, Talaromyces, Thermoaseus, Thielavia, Tolypoeladium, Trametes, ou triehoderma. Em um aspecto o mais preferido, célula hospedeira de fungo filamentoso é uma célula de Aspergillus awamori, Aspergillus fumigatus, Aspergillus foetidus, Aspergillus japonieus, Aspergillus nidulans, Aspergillus niger ou Aspergillus oryzae. Em outro aspecto o mais preferido, célula hospedeira de fungo filamentoso é uma célula de Fusarium baetridioides, Fusarium eerealis, Fusarium erookwellense, Fusarium eulmorum, Fusarium grammearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium retieulatum, Fusarium roseum, Fusarium sambuanum, Fusarium sarcoehroum, Fusarium sporotnehioides, Fusarium sulphureum, Fusarium torulosum, Fusarium tnchotheaoides, ou Fusarium venenatum. Em outro aspecto o mais preferido, a célula hospedeira de fungo filamentoso é uma célula de Bjerkandera adusta, Cenporiopsis aneirina, Cenporiopsis aneirina, Cenponopsis caregiea, Cenporiopsis gilvescens, Cenporiopsis pannoanta, Cenponopsis nvulosa Cenporiopsis subrufa, Cenponopsis subvermispora, Chrysosporium keratmophilum, Chrysosporium lucknowense, Chrysosporium troucum, Chrysosponum merdanum, Chrysosporium mops, Chrysosponum pannicola, Chrysosporium queenslandicum, Chrysosponum zonatum, Coprinus cinereus, Conolus hirsutus, Humicola insolens, Humicola lanuginosa, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Pemallium purpurogenum, Phaneroehaete ehrysosponum, Phlebia radiata, Pleurotus eryngii, Thielavia terrestris, Trametes villosa, Trametes versieolor, Trichodenva harzianum, Tnchodenna konmgii, Triehoderma longibrachiatum, Triehoderma reesei, ou Trichodenva vinde. As células fungicas podem ser transformadas por um processo
envolvendo a formação de protoplastos, transformação de protoplastos, e regeneração da parece celular em um modo conhecido. Os procedimentos apropriados para a transformação de células hospedeiras de Aspergillus e Trichoderma são descritos em EP 238 023 e Yelton et al., 1984, Proeeedings of the National Aeademy of Sciences USA 81: 1470 - 1474. Os métodos apropriados para transformar a espécie Fusarium são descritos por Malardier et al., 1989, Gene 78: 147 - 158, e WO 96/00787. A levedura pode ser transformada usando os procedimentos descritos por Becker e Guarente, In Abelson, J. N. e Simon, Μ. I., editores, Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, volume 194, pp 182 - 187, Academic Press, Inc., New York; Ito et al., 1983, Journal of Bacteriology 153: 163; e Hinnen et al., 1978, Proceedings of the National Academy of Sciences USA 75: 1920. Produção e recuperação Nos métodos da presente invenção, a célula hospedeira fungica é cultivada em um meio nutriente apropriado para a produção de um polipeptídeo tendo atividade biológica usando métodos bem conhecidos na arte. Por exemplo, a célula pode ser cultivada por cultivo em frasco de agitação, e fermentação em grande escala ou pequena escala (incluindo fermentações em estado contínuo, batelada, batelada alimentada, ou sólido) em laboratório ou fermentadores industriais realizada em um meio apropriado e sob condições permitindo ao polipeptídeo ser expresso e/ou isolado. O cultivo ocorre em um meio nutriente apropriado compreendendo fontes de carbono e nitrogênio e sais inorgânicos, usando procedimentos conhecidos na arte. Os meios apropriados são disponíveis de fornecedores comerciais ou podem ser preparados de acordo com as composições publicadas (por exemplo, em catálogos do American Type Culture Collection).
Nos métodos da presente invenção, o polipeptídeo tendo atividade biológica é selecionado dentre um grupo incluindo uma proteína de fusão, componentes da proteína de fusão e uma combinação da proteína de fusão e componentes da mesma.
Em um aspecto preferido, o polipeptídeo tendo atividade biológica é a proteína de fusão.
Em outro aspecto preferido, o polipeptídeo tendo atividade biológica é um componente(s) de uma proteína de fusão.
Em outro aspecto preferido, o polipeptídeo tendo atividade biológica é uma combinação de uma proteína de fusão e componentes da mesma.
Os polipeptídeos tendo atividade biológica podem detectados usando métodos conhecidos na técnica que são específicos para os polipeptídeos. Estes métodos de detecção podem incluir uso de anticorpos específicos, formação de um produto de enzima, ou desaparecimento de um substrato de enzima. Por exemplo, um teste de enzima pode ser usado para determinar a atividade do polipeptídeo como descrito aqui, que pode incluir atividade de endoglucanase e uma atividade biológica específica.
O polipeptídeo resultante tendo atividade biológica, por exemplo proteína de fusão beta-glucosidase ou um componente da mesma, pode ser recuperado usando métodos conhecidos na arte. Por exemplo, o polipeptídeo pode ser recuperado do meio nutriente por procedimentos convencionais incluindo, mas não limitados a, centrifugação, filtração, extração, secagem por pulverização, evaporação, ou precipitação.
Os polipeptídeos da presente invenção podem ser purificados por uma variedade de procedimentos conhecidos na técnica incluindo, mas não limitados a, cromatografia (por exemplo, troca iônica, afinidade, hidrofóbico, cromatofocalização, e exclusão por tamanho), procedimentos eletroforéticos (por exemplo, focalização isoelétrica preparativa), solubilidade diferencial (por exemplo, precipitação por sulfato de amônio), SDS-PAGE, ou extração (ver, por exemplo, Protein Purification, J. -C, Janson e Lars Ryden, editores, VCH Publishers, New York, 1989) para obter polipeptídeos substancialmente puros. Composições
A presente invenção também refere-se às composições compreendendo um polipeptídeo tendo atividade biológica da presente invenção. Preferivelmente, as composições são enriquecidas em tal polipeptídeo. O termo "enriquecido" indica que a atividade de endoglucanase da composição foi aumentada, por exemplo, com um fator de enriquecimento de pelo menos 1.1.
A composição pode compreender um polipeptídeo da presente
invenção como o componente enzimático principal, por exemplo, uma composição mono-componente. Alternativamente, a composição pode compreender atividades enzimáticas múltiplas, como um aminopeptidase, amilase, carbohidrase, carboxipeptidase, catalase, celulase, quitinase, cutinase, ciclodextrina glicosiltransferase, deoxiribonuclease, esterase, alfa- galactosidase, beta-galactosidase, glucoamilase, alfa-glucosidase, beta- glucosidase, haloperoxidase, invertase, lacase, lipase, manosidase, oxidase, enzima pectinolítica, peptidoglutaminase, peroxidase, fitase, polifenoloxidase, enzima proteolítica, ribonuclease, transglutaminase, ou xilanoase. A(s) enzima (s) adicional(ais) pode(m) ser produzida(s), por exemplo, por um microorganismo pertencendo no gênero Aspergillus, preferivelmente Aspergillus aculeatus, Aspergillus awamori, Aspergillus fumigatus, Aspergillus foetidus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger, ou Aspergillus oryzae; Fusarium, preferivelmente Fusarium bactridioides, Fusarium cerealis, Fusarium crookwellense, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarcochroum, Fusarium sulphureum, Fusarium toruloseum, Fusarium trichothecioides, ou Fusarium venenatum; Humicola, preferivelmente Humicola insolens ou Humicola lanuginosa; ou Trichoderma, preferivelmente Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Trichoderma reesei, ou Trichoderma viride.
As composições de polipeptídeo podem ser preparadas de acordo com os métodos conhecidos na técnica e podem estar na forma de um líquido ou uma composição em pó. Por exemplo, a composição de polipeptídeo pode estar na forma de um granulado ou um microgranulado. O polipeptídeo a ser incluído na composição pode ser estabilizado de acordo com os métodos conhecidos na arte.
Exemplos são dados abaixo de usos preferidos das composições de polipeptídeo da invenção. A dosagem da composição de polipeptídeo da invenção e outras condições sob as quais a composição é usada podem ser determinadas com base em métodos conhecidos na arte. Usos
A presente invenção é também dirigida a métodos para usar as proteínas de fusão ou componentes da mesma ou composições da mesma. Métodos de processamento de material celulósico
Os métodos da presente invenção são particularmente utilizáveis para melhorar a secreção de polipeptídeos tendo atividade celulolítica ou hemicelulolítica em quantidades comercialmente importantes, que podem ser usadas para degradar ou converter material lignocelulósico. Estes polipeptídeos incluem, mas não são limitados a endoglucanases, celobiohidrolases, beta-glucosidases, xilanases, beta-xilosidases, arabinofuranosidases, acetil xilano I esterases, e esterase de ácido ferúlicos. Consequentemente, a presente invenção também refere-se a métodos para degradar ou converter um material celulósico, compreendendo: tratar o material celulósico com uma quantidade eficaz de uma composição de enzima celulolítica na presença de uma quantidade eficaz de uma proteína de fusão ou um componente da mesma tendo atividade celulolítica ou hemicelulolítica obtida de acordo com os presentes métodos. Para fins de ilustração, um polipeptídeo tendo atividade beta- glucosidase obtido de acordo com os métodos da presente invenção, por exemplo uma proteína de fusão de beta- glucosidase ou um componente da mesma, é usado para fins ilustrativos.
Biomassa celulósica pode incluir, mas não é limitada a recursos de madeira, refugo sólido municipal, papel usado, colheitas, e resíduos de colheitas (ver, por exemplo, Wiselogel et ai, 1995, in Handbook on Bioethanol (Charles E. Wyman, editor), pp. 105 - 118, Taylor & Francis, Washington D. C.; Wyman, 1994, Bioresource Technology 50: 3-16; Lynd, 1990, Applied Biochemistry and Biotechnology 24/25: 695 - 719; Mosier et al., 1999, Recent Progress in Bioconversion of Lignocellulosics, in Advances in Bioehemieal EngineeringlBioteehnology, T. Scheper, editor responsável, volume 65, pp. 23 - 40, Springer-Verlag, New York). O polissacarídeo predominante na parede celular primária de biomassa é celulose, o segundo o mais abundante é hemi-celulose, e o terceiro é pectina. A parede celular secundária, produzida depois da célula ter parado de crescer, também contém polissacarídeos e é reforçada por lignina polimérica covalentemente reticulada em hemicelulose. Celulose é um homopolímero de anidrocelobiose e assim um beta-(l-4)-D-glucano linear, enquanto hemiceluloses incluem uma variedade de compostos, como xilanos, xiloglucanos, arabinoxilanos, e mananos em estruturas ramificadas complexas com um espectro de substituintes. Apesar de geralmente polimorfa, celulose é encontrada em tecido de planta primariamente como uma matriz cristalina insolúvel de cadeias glucano paralelas. Hemiceluloses geralmente ligam por ponte hidrogênio a celulose, assim como a outras hemiceluloses, que ajudam a estabilizar a matriz da parede celular. Será entendido aqui que o termo "material celulósico" ou "celulose" também engloba lignocelulose. Nos métodos da presente invenção, a composição de enzima
celulolítica pode compreender qualquer proteína envolvida no processamento de material celulósico em glicose, ou hemicelulose em xilose, mannose, galactose, e arabinose, seus polímeros, ou produtos derivados dos mesmos como descrito abaixo. A composição de enzima celulolítica pode ser uma preparação de mono-componente, por exemplo uma endoglucanase, uma preparação de múltiplos componentes, por exemplo, endoglucanase, celobiohidrolase, beta-glucosidase, ou uma combinação de preparações de proteína de multicomponentes e monocomponente. As proteínas celulolíticas pode ter atividade, isto é hidrolisar celulose, ou na faixa de pH ácido, neutro ou alcalino. A composição de enzima celulolítica pode ainda compreender um polipeptídeo tendo atividade melhoradora celulolítica de acordo com WO 2005/074647, WO 2005/074656, e pedido publicado US 2007/0077630
A proteína celulolítica pode ser de origem de fungo ou bacteriana, que pode ser obtenível ou isolada e purificada de microorganismos que são conhecidos como capazes de produzir enzimas celulolíticas, por exemplo espécies de Bacillus, Pseudomonas, Humicola, Coprinus, Thielavia Fusarium, Myceliophthora, Acremonium, Cephalosporium, Scytalidium, Penicillium ou Aspergillus (ver, por exemplo, EP 458162), especialmente as produzidas por uma cepa selecionada dentre Humicola insolens (reclassificada como Scytalidium thermophilum, ver por exemplo, Patente US No 4.435.307), Coprinus cinereus, Fusarium oxysporum, Myceliophthora theimophila, Meripilus giganteus, Thielavia terrestris, Acremonium sp, Acremonium persicinum, Acremonium acremonium, Acremonium brachypenium, Acremonium dichromosporum, Acremonium obclavatum, Acremonium pinkertoniae, Acremonium roseogriseum, Acremonium incoloratum, e Acremonium furatum, preferivelmente de Humicola insolens DSM 1800, Fusarium oxysporum DSM 2672, Myceliophthora thermophila CBS 117 65, Cephalosporium sp RYM-202, Acremonium sp CBS 47894, Acremonium sp CBS 265 95, Acremonium persicinum CBS 169 65, Acremonium acremonium AHU 9519, Cephalosporium sp CBS 535 71, Acremonium brachypenium CBS 866 73, Acremonium dichromosporium CBS 683 73, Acremonium obclavatum CBS 311 74, Acremonium pmkertoniae CBS 157 70, Acremonium roseogriseum CBS 134 56, Acremonium incoloratum CBS 146 62, e Acremonium furatum CBS 29970H. As proteínas celulolíticas também podem ser obtidas a partir de Trichoderma (particularmente Trichoderma vinde, Trichoderma reesei, e Trichoderma koningii), Bacillus alcalofílico (ver, por exemplo, Patente US No 3.844.890 e EP 458162), e Streptomyces (ver, por exemplo, EP 458162). Os mutantes quimicamente modificados ou engenheirados em proteínas de proteínas celulolíticas também podem ser usados.
As proteínas celulolíticas especialmente apropriadas são as celulases descritas em EP 495.257, EP 531.372, WO 96/11262, WO 96/29397, WO 98/08940. Outros exemplos são variantes de celulase como as descritas em WO 94/07998, EP 531.315, Patente US No 4.435.307, Patente US No 5.457.046, Patente US No 5.648.263, Patente US No 5.686.593, Patente US No 5.691.178, Patente US No 5.763.254, Patente US No 5.776.757, WO 89/09259, WO 95/24471, WO 98/12307, e PCT/DK98/00299.
Como mencionado acima, as proteínas celulolíticas usadas nos métodos da presente invenção podem ser preparações de monocomponente, isto é, um componente essencialmente isento de outro componentes celulolíticos. O componente único pode ser um componente recombinante, isto é, produzindo por clonagem de uma seqüência de DNA codificando o componente único e subseqüentemente a célula transformada com a seqüência de DNA e expressada no hospedeiro (ver, por exemplo, WO 91/17243 e WO 91/17244). O hospedeiro é preferivelmente um hospedeiro heterólogo (enzima é estranha para o hospedeiro), mas o hospedeiro pode sob algumas condições também ser um hospedeiro homólogo (enzima é nativa para o hospedeiro). As proteínas celulolíticas de monocomponente também podem ser preparadas por purificação desta proteína a partir do caldo de fermentação.
As proteínas celulolíticas usadas nos métodos da presente invenção podem ser produzidas por fermentação das cepas microbianas acima notadas em um meio nutriente contendo fontes de carbono e nitrogênio apropriadas e sais inorgânicos, usando procedimentos conhecidos na arte (ver, por exemplo, Bennett, JWe LaSure, L (eds ), More Gene Manipulations in Fungi, Academic Press, CA, 1991). Os meios apropriados são disponíveis de fornecedores comerciais ou podem ser preparados de acordo com composições publicadas (por exemplo, nos catálogos do American Type Culture Collection). As faixas de temperatura e outras condições apropriadas para crescimento e produção de proteínas celulolíticas são bem conhecidas na arte (ver, por exemplo, Bailey, J E, e Ollis, D F, Biochemical Engineering Fundamentais, McGraw-Hill Book Company, NY, 1986).
A fermentação pode ser qualquer método de cultivo de uma célula resultante na expressão ou isolamento de uma proteína celulolítica. A fermentação porem, assim, ser entendida como compreendendo cultivo em frasco de agitação, e fermentação em grande escala ou pequena escala (incluindo fermentações em contínuo, batelada, batelada alimentada, ou estado sólido) em laboratório ou fermentadores industriais realizada em um meio apropriado e sob condições permitindo à proteína celulolítica ser expressada e/ou isolada. As proteínas celulolíticas resultantes produzidas pelos métodos descritos acima podem ser recuperadas do meio de fermentação e purificadas por procedimentos convencionais como aqui descrito.
Os exemplos de preparações de enzima celulolítica comerciais apropriados para uso na presente invenção incluem, por exemplo,, CELLUCLAST™ (disponível de Novozymes A/S) e NOVOZYM™ 188 (disponível de Novozymes A/S). Outras preparações comercialmente disponíveis compreendendo celulase que podem ser usadas incluem CELLUZYME™, CEREFLO™ e ULTRAFLO™ (Novozymes A/S), LAMINEX™ e SPEZYME™ CP (Genencor Int. ), ROHAMENT™ 7069 W (Rohm GmbH), e FIBREZYME® LDI, FIBREZYME® LBR, ou VISCOSTAR® 150L (Dyadic International, Inc, Júpiter, FL, USA) As enzimas celulase são adicionadas em quantidades eficazs de cerca de 0,001 % a cerca de 5,0 % em peso de sólidos, mais preferivelmente de cerca de 0,025% a cerca de 4,0% em peso de sólidos, e o mais preferivelmente de cerca de 0,005% a cerca de 2,0% em peso de sólidos.
As proteínas celulolíticas resultantes ou proteínas de beta- glucosidase produzidas pelos métodos acima mencionados podem ser recuperadas do meio de fermentação por procedimentos convencionais incluindo, mas não limitados a centrifugação, filtração, secagem por pulverização, evaporação ou precipitação. A proteína recuperada pode ser ainda purificada por vários procedimentos de cromatografia, por exemplo cromatografia de troca iônica, cromatografia de filtração de gel, cromatografia de afinidade, ou outros.
A atividade da enzima celulolítica pode ser determinada usando qualquer método bem conhecido na arte.
Os exemplos de preparações celulolíticas apropriados para uso na presente invenção incluem, por exemplo, CELLUCLAST™ (disponível de Novozymes A/S) e NOVOZYM™ 188 (disponível de Novozymes A/S). Outras preparações comercialmente disponíveis compreendendo celulase que podem ser usadas incluem CELLUZYME™, CEREFLO™ e ULTRAFLO™ (Novozymes A/S), LAMINEXtm e SPEZYME™ CP (Genencor Int ), e ROHAMENT™ 7069 W (Rohm GmbH). As enzimas celulase são adicionadas em quantidades eficazs de cerca de 0,001% a cerca de 5,0 % em peso de sólidos, mais preferivelmente de cerca de 0,025% a cerca de 4,0% em peso de sólidos, e o mais preferivelmente de cerca de 0,005% a cerca de 2, 0% em peso de sólidos.
Como acima mencionado, as proteínas celulolíticas usadas nos métodos da presente invenção podem ser preparações de monocomponente, isto é, um componente essencialmente isento de outro componentes celulolíticos. O componente único pode ser um componente recombinante, isto é, produzindo por clonagem de uma seqüência de DNA codificando o componente único e subseqüentemente a célula transformada com a seqüência de DNA e expressada no hospedeiro (ver, por exemplo, WO 91/17243 e WO 91/17244). Outros exemplos proteínas celulolíticas mono componente incluem, mas não limitados aos descritos em JP-07203960-A e WO-9206209- O hospedeiro é preferivelmente um hospedeiro heterólogo (enzima é estranha para o hospedeiro), mas o hospedeiro pode sob algumas condições também ser um hospedeiro homólogo (enzima é nativa para o hospedeiro). As proteínas celulolíticas de monocomponente também podem ser preparadas por purificação desta proteína a partir do caldo de fermentação. Os exemplos de proteínas celulolíticas de monocomponente utilizáveis na prática dos métodos da presente invenção incluem, mas não são limitados a, endoglucanase, celobiohidrolase, e outras enzimas utilizáveis na degradação de biomassa celulósica.
O termo "endoglucanase" já foi definido aqui. O termo "celobiohidrolase" é definido aqui como uma 1,4-beta-D-glucano celobiohidrolase (E.C. 32 1 91), que catalisa a hidrólise de 1,4-beta-D- ligações glucosídicas, celooligosacarídeos, ou qualquer polímero contendo beta-1,4 ligada glicose, liberando celobiose a partir das extremidades redutoras ou não redutoras da cadeia. Para fins da presente invenção, a atividade de celobiohidrolase pode ser determinada de acordo com os procedimentos descrito por Lever et al, 1972, Anal Biochem 47 273-279 e por van Tilbeurgh et al, 1982, FEBS Letters 149 152-156, van Tilbeurgh e Claeyssens, 1985 FEBS Letters 187 283-288. Napresente invenção, o método de Lever et al foi empregado para avaliar a hidrólise de celulose em forragem de milho.
Os polipeptídeos da presente invenção são usado em conjunto com proteínas celulolíticas para degradar o componente celulósico do substrato da biomassa, (ver, por exemplo, Brigham et al, 1995, em Handbook on Bioethanol (Charles E Wyman, editor), pp 119-141, Taylor & Francis, Washington D C, Lee, 1997, Journal of Biotechnology 56 1-24).
As quantidades ótimas de um polipeptídeo tendo atividade de beta- glucosidase e outras proteínas celulolíticas dependem de vários fatores incluindo, mas não limitados a mistura de proteínas de componentes celulolíticos, o substrato celulósico, a concentração de substrato celulósico, o pré-tratamento (s) do substrato celulósico, temperatura, tempo, pH, e inclusão de organismo de fermentação (por exemplo, levedura para sacarificação e fermentação simultâneas). O termo "proteína celulolíticas" é definido aqui como as proteínas ou misturas de proteínas mostradas como sendo capazes de hidrolisar ou converter ou degradar celulose sob as condições testadas. Suas quantidades são geralmente medidas por um teste comum como BCA (ácido bicinconiníco, Ρ. K. Smith ef al, 1985, Anal Biochem 150 76), e a quantidade preferida adicionada em proporção à quantidade de biomassa sendo hidrolisada.
Em um aspecto preferido, a quantidade de polipeptídeo tendo atividade beta-glucosidase por g de material celulósico é cerca de 0,01 a cerca de 2,0 mg, preferivelmente cerca de 0,025 a cerca de 1,5 mg, mais preferivelmente cerca de 0, 05 a cerca de 1,25 mg, mais preferivelmente cerca de 0,075 a cerca de 1,25 mg, mais preferivelmente cerca de 0,1 a cerca de 1,25 mg, ainda mais preferivelmente cerca de 0,15 a cerca de 1,25 mg, e o mais preferivelmente cerca de 0,25 a cerca de 1,0 mg por g de material celulósico.
Em outro aspecto preferido, a quantidade de proteínas celulolíticas por g de material celulósico é cerca de 0,5 a cerca de 50 mg, preferivelmente cerca de 0,5 a cerca de 40 mg, mais preferivelmente cerca de 0,5 a cerca de 25 mg, mais preferivelmente cerca de 0,75 a cerca de 20 mg, mais preferivelmente cerca de 0,75 a cerca de 15 mg, ainda mais preferivelmente cerca de 0,5 a cerca de 10 mg, e o mais preferivelmente cerca de 2,5 a cerca de 10 mg por g de material celulósico.
Os métodos da presente invenção podem ser usados para degradar ou converter um material celulósico, por exemplo lignocelulose, em muitas substâncias utilizáveis, por exemplo, produtos químicos e combustíveis. Além disso, para etanol, algumas mercadorias e especialmente produtos químicos especiais que podem ser produzidos a partir de celulose incluem xilose, acetona, acetato, glicina, lisina, ácidos orgânicos (por exemplo, ácido láctico), 1,3-propanodiol, butanodiol, glicerol, etileno glicol, furfural, polihidroxialcanoatos, e ácido cis,cis-mucônico, (Lynd, L. R., Wyman, C. E., e Gerngross, T. U., 1999, Biocommodity Engineering, Biotechnol, Prog., 15: 777 - 793; Philippidis, G. P., 1996, Cellulose bioconversion technology, in Handbook on Bioethanol: Production and Utilization, Wyman, C. E., ed., Taylor & Francis, Washington, DC, 179-212, e Ryu, D. D. Y., e Mandeis, M., 1980, Cellulases: biosynthesis and applications, Enz. Microb. Technol., 2: 91 - 102). Benefícios de coprodução potenciais se estendem além da síntese de produtos orgânicos múltiplos de carboidrato fermentável. Resíduos ricos em lignina restantes após processamento biológico podem ser convertidos em produtos químicos derivados de lignina, ou usados para a produção de energia. Métodos convencionais usados para processar o material
celulósico de acordo com os métodos da presente invenção são bem entendidos pelo versado na técnica. Os métodos da presente invenção podem ser implementados usando qualquer aparelho de processamento de biomassa convencional configurado para operar de acordo com a invenção. Este aparelho pode incluir um reator agitado de batelada, um
reator agitado de fluxo contínuo com ultrafiltração, um reator de coluna de fluxo tampão contínuo (Fernanda de Castilhos Corazza, Flavio Faria de Moraes, Gisella Maria Zanin e Ivo Neitzel, 2003, Optimal control in fed-batch reactor for the celobiose hidrolysis, Aeta Seientiarum Technology 25(1) 33- 38, Gusakov, Α. V., e Sinitsyn, A. P., 1985, Kinetics of the enzymatic hydrolysis of cellulose: 1. A mathematical model for a batch reactor process, Enz. Microb. Technol. 7: 346 - 352), um reator por atrito (Ryu, S. K., e Lee, J. M., 1983, Biconversion of waste cellulose by using an attrition bioreactor, Biotechnol. Bioeng. 25: 53 - 65), ou um reator com agitação intensiva induzida por um campo eletromagnético (Gusakov, Α. V., Sinitsyn, A. P., Davydkin, I. Y., Davydkin, V. Y., Protas, O. V., 1996, Enhancement of enzymatic cellulose hydrolysis using a novel type of bioreactor with intensive stirring induced by electromagnetic fleld, Appl. Biochem. Biotechnol. 56: 141 - 153). Os métodos convencionais incluem, mas não são limitados a, sacarificação, fermentação, hidrólise e fermentação separadas (SHF), sacarificação e fermentação simultâneas (SSF), sacarificação e cofermentação simultâneas (SSCF), hidrólise e fermentação híbridas (HHF), e conversão microbiana direta (DMC).
SHF usa etapas de processo separadas para primeiro hidrolisar enzimaticamente a celulose em glicose e então, em uma etapa subseqüente, fermentar a glicose em etanol. Em SSF, a hidrólise enzimática de celulose e a fermentação de glicose em etanol é combinada em uma etapa (Philippidis, G. P., 1996, Cellulose bioconversion technology, in Handbook on Bioethanol: Production and Utilization, Wyman, C. E., ed., Taylor & Francis, Washington, DC, 179 - 212). SSCF inclui a cofermentação de açúcares múltiplos (Sheehan, J., e Himmel, M., 1999, Enzymes, energy and the environment: A strategic perspective on the U.S. Department of Energy's research and development activities for bioethanol, Biotechnol. Prog. 15: 817 - 827). HHF inclui duas etapas separadas realizadas no mesmo reator mas em temperaturas diferentes, isto é, sacarificação enzimática de temperatura elevada seguido por SSF em uma temperatura inferior que a cepa de fermentação pode tolerar. DMC combina todos os três processos (produção de celulase, hidrólise de celulose, e fermentação) em uma etapa (Lynd, L. R., Weimer, P. J., van Zyl, W. H., e Pretorius, I. S., 2002, Microbial cellulose utilization: Fundamentais and biotechnology, Mierobiol. Mol. Biol. Reviews 66: 506 - 577).
"Fermentação" ou "processo de fermentação" refere-se a qualquer processo de fermentação ou qualquer processo compreendendo uma etapa de fermentação. Um processo de fermentação inclui, sem limitação, processos de fermentação usados para produzir produtos de fermentação incluindo álcoois (por exemplo, arabinitol, butanol, etanol, glicerol, metanol, 1,3-propanodiol, sorbitol, e xilitol); ácidos orgânicos (por exemplo, ácido acético, ácido acetônico, ácido adípico, ácido ascórbico, ácido cítrico, ácido 2,5-diceto-D-glucônico, ácido fórmico, ácido fumárico, ácido glucárico, ácido glucônico, ácido glucurônico, ácido glutárico, ácido 3-hidroxipropiônico, ácido itacônico, ácido láctico, ácido málico, ácido malônico, ácido oxálico, ácido propiônico, ácido succínico, e ácido xilônico); cetonas (por exemplo, acetona); aminoácidos (por exemplo, ácido aspártico, ácido glutâmico, glicina, lisina, serina, e treonina); gases (por exemplo, metano, hidrogênio (H2), dióxido de carbono (CO2), e monóxido de carbono (CO)). Processos de fermentação também incluem processos de fermentação usados na indústria de álcool consumível (por exemplo, cerveja e vinho), indústria de laticínios (por exemplo, laticínios fermentados), indústria de couro, e indústria de fumo.
A proteína de fusão ou um componente da mesma tendo atividade celulolítica ou atividade hemi-celulolítica obtida de acordo com os métodos da presente invenção, por exemplo, uma proteína de fusão beta- glucosidase ou um componente da mesma, e células hospedeiras da mesma, pode ser usada na produção de monossacarídeos, dissacarídeos, e polissacarídeo s, como cargas de alimentação químicas ou de fermentação a partir da biomassa para a produção de etanol, plásticos e outros produtos ou intermediários. Em particular, os polipeptídeos e as células hospedeiras da presente invenção podem ser usados para aumentar o valor de resíduos de processamento (grãos secos de destiladores, grãos gastos de cervejaria, bagaço de cana de açúcar, etc.) por degradação completa ou parcial de celulose ou hemicelulose. Para reforçar o processamento de materiais celulósicos pela preparação de enzima celulolítica em glicose, xilose, manose, galactose e arabinose, seus polímeros ou produtos derivados dos mesmos como mostrado abaixo, os polipeptídeos podem estar na forma de caldo de fermentação bruto com ou sem as células ou na forma de uma preparação de enzima semi-purificada ou purificada. O polipeptídeo pode ser uma preparação de mono-componente, uma preparação de proteína de multi- componentes ou uma combinação de preparações de proteína multi- componentes e mono-componente. Alternativamente, uma célula hospedeira pode ser usada como uma fonte de tal polipeptídeo em um processo de fermentação com a biomassa. A célula hospedeira também pode conter genes heterólogos ou nativos que codificam proteína celulolítica, assim como outras enzimas utilizáveis no processamento de biomassa.
A presente invenção ainda refere-se a métodos para produzir uma substância orgânica, compreendendo: (a) sacarificar um material celulósico com uma quantidade eficaz de uma composição de enzima celulolítica na presença de uma quantidade eficaz de uma proteína de fusão ou componente da mesma tendo atividade celulolítica ou atividade hemi- celulolítica obtida de acordo com os presentes métodos, (b) fermentar o material celulósico sacarificado de etapa (a) com um ou mais microorganismos de fermentação; e (c) recuperar a substância orgânica da fermentação. Como indicado acima, para fins de ilustração, um polipeptídeo tendo atividade beta-glucosidase obtido de acordo com os métodos da presente invenção, por exemplo proteína de fusão de beta-glucosidase ou um componente da mesma, é usado para fins ilustrativos. O polipeptídeo tendo atividade beta-glucosidase pode estar na forma de um caldo de fermentação bruto com ou sem as células ou na forma de uma preparação de enzima semi- purificada ou purificada. A proteína beta-glucosidase pode ser uma preparação mono-componente, uma preparação de proteína multi- componentes ou uma combinação de preparações multi-componentes e mono- componente.
A substância pode ser qualquer substância derivada da
fermentação. Em um aspecto preferido, a substância é um álcool. Deve-se entender que o termo "álcool" engloba uma substância que contém uma ou mais porções de hidroxila. Em um aspecto mais preferido, o álcool é arabinitol. Em outro aspecto mais preferido, o álcool é butanol. Em outro aspecto mais preferido, o álcool é etanol. Em outro aspecto mais preferido, o álcool é glicerol. Em outro aspecto mais preferido, o álcool é metanol. Em outro aspecto mais preferido, o álcool é 1,3-propanodiol. Em outro aspecto mais preferido, o álcool é sorbitol. Em outro aspecto mais preferido, o álcool é xilitol. Ver, por exemplo, Gong, C. S., Cao, N, J., Du, J., e Tsao, G, T., 1999, Ethanol production from renewable resources, in Advances in Biochemieal Engineering/Bioteehnology, Scheper, T., ed., Springer-Verlag Berlin Heideiberg, Alemanha, 65: 207 - 241; Silveira, M. M., e Jonas, R., 2002, The biotechnological production of sorbitol, Appl. Mierobiol. Bioteehnol. 59: 400 - 408; Nigam, P., e Singh, D., 1995, Processes for fermentative production of xylitol - a sugar substitute, Proeess Bioehemistry (2): 117 - 124; Ezeji, T. C., Qureshi, N. e Blaschek, H. P., 2003, Production of acetone, butanol and ethanol by Clostridium beijerinekii BA101 and in situ recovery by gas stripping, World Journal of Mierobiology and Bioteehnology 19 (6): 595 - 603.
Em outro aspecto preferido, a substância é um ácido orgânico. Em outro aspecto mais preferido, o ácido orgânico é ácido acético. Em outro aspecto mais preferido, o ácido orgânico é ácido acetônico. Em outro aspecto mais preferido, o ácido orgânico é ácido adípico. Em outro aspecto mais preferido, o ácido orgânico é ácido ascórbico. Em outro aspecto mais preferido, o ácido orgânico é ácido cítrico. Em outro aspecto mais preferido, o ácido orgânico é ácido 2,5-diceto-D-glucônico. Em outro aspecto mais preferido, o ácido orgânico é ácido fórmico. Em outro aspecto mais preferido, o ácido orgânico é ácido fumárico. Em outro aspecto mais preferido, o ácido orgânico é ácido glucárico. Em outro aspecto mais preferido, o ácido orgânico é ácido glucônico. Em outro aspecto mais preferido, o ácido orgânico é ácido glucurônico. Em outro aspecto mais preferido, o ácido orgânico é ácido glutárico. Em outro aspecto preferido, o ácido orgânico é ácido 3- hidroxipropiônico. Em outro aspecto mais preferido, o ácido orgânico é ácido itacônico. Em outro aspecto mais preferido, o ácido orgânico é ácido láctico. Em outro aspecto mais preferido, o ácido orgânico é ácido málico. Em outro aspecto mais preferido, o ácido orgânico é ácido malônico. Em outro aspecto mais preferido, o ácido orgânico é ácido oxálico. Em outro aspecto mais preferido, o ácido orgânico é ácido propiônico. Em outro aspecto mais preferido, o ácido orgânico é ácido succínico. Em outro aspecto mais preferido, o ácido orgânico é ácido xilônico. Ver, por exemplo, Chen, R., e Lee, Y. Y., 1997, Membrane-mediated extractive fermentation for lactic acid production from cellulosic biomass, Appl. Biochem, Biotechnol. 63-65: 435 - 448.
Em outro aspecto preferido, a substância é uma cetona. Deve- se entender que o termo "cetona" engloba uma substância que contém uma ou mais porções de cetona. Em outro aspecto mais preferido, a cetona é acetona. Ver, por exemplo, Qureshi e Blaschek, 2003, supra.
Em outro aspecto preferido, a substância é um aminoácido. Em outro aspecto mais preferido, o ácido orgânico é ácido aspártico. Em outro aspecto mais preferido, o aminoácido é ácido glutâmico. Em outro aspecto mais preferido, o aminoácido é glicina. Em outro aspecto mais preferido, o aminoácido é lisina. Em outro aspecto mais preferido, o aminoácido é serina. Em outro aspecto mais preferido, o aminoácido é treonina. Ver, por exemplo, Richard, A., e Margaritis, A., 2004, Empirical modeling of batch fermentation kinetics for poly (glutamic acid) production and other microbial biopolymers, Biotechnology andBioenginnering 87 (4): 501 - 515.
Em outro aspecto preferido, a substância é um gás. Em outro aspecto mais preferido, o gás é metano. Em outro aspecto mais preferido, o gás é H2. Em outro aspecto mais preferido, o gás é CO2. Em outro aspecto mais preferido, o gás é CO. Ver, por exemplo, Kataoka, N., A. Miya, e K. Kiriyama, 1997, Studies on hydrogen production by continuous culture system of hydrogen-producing anaerobic bactéria, Water Science and Technology 38 (6-7): 41 - 47; e Gunaseelan V. Ν. in Biomass and Bioenergy, vol. 13 (1-2), pp. 83 - 114, 1997, Anaerobic digestion of biomass for methane production: A review.
Produção de uma substância a partir de material celulósico tipicamente requer quatro etapas principais. Estas quatro etapas são pré- tratamento, hidrólise enzimática, fermentação, e recuperação. Exemplificado abaixo é um processo para produzir etanol, mas deve-se entender que processos similares podem ser usados para produzir outras substâncias, por exemplo, as substâncias descritas acima.
Pré-tratamento. No pré-tratamento ou etapa de pré-hidrólise, o material celulósico é aquecido para romper a lignina e estrutura de carboidrato, solubilizar a maior parte da hemicelulose, e tornar a fração de celulose accessível para enzimas celulolíticas. O aquecimento é realizado ou diretamente com vapor ou em suspensão onde um catalisador também pode ser adicionado no material para acelerar as reações. Os catalisadores incluem ácidos fortes, como ácido sulfurico e SO2, ou alcalino, como hidróxido de sódio. O propósito do estágio de pré-tratamento é para facilitar a penetração das enzimas e microorganismos. A biomassa celulósica também pode ser submetida a um pré-tratamento de explosão a vapor hidrotérmico (ver pedido de patente 20020164730). No entanto, entende-se que na prática dos métodos da presente invenção, qualquer pré-tratamento pode ser usado empregando pré-tratamento térmico, químico e/ou mecânico.
Sacarificação. Na etapa de hidrólise enzimática, também conhecida como sacarificação, as enzimas como descrito aqui são adicionadas no material prétratado para converter a fração de celulose para glicose e/ou outros açúcares. A sacarificação geralmente é realizada em reatores de tanques agitados ou fermentadores sob condições controladas de pH, temperatura, e mistura. Uma etapa de sacarificação pode durar 200 horas. A sacarificação pode ser realizada em temperaturas de cerca de 30 0C a cerca de 65 °C, em particular, em torno de 50 0C, e a um pH na faixa entre cerca de 4 a cerca de 5, especialmente em torno de pH 4,5. Para produzir glicose que pode ser metabolizada por levedura, a hidrólise é tipicamente realizada na presença de uma beta-glucosidase.
Fermentação. Na etapa de fermentação, açúcares, liberados do material celulósico como um resultado das etapas de hidrólise enzimática e pré-tratamento, são fermentados em etanol por um organismo de fermentação, como levedura. A fermentação também pode ser realizada simultaneamente com a hidrólise enzimática no mesmo vaso, novamente sob condições controladas de pH, temperatura, e mistura. Quando a sacarificação e fermentação são realizadas simultaneamente no mesmo vaso, o processo geralmente é chamado sacarificação e fermentação simultâneas ou S SF.
Qualquer material celulósico ou matéria prima apropriado pode ser usado em etapa de fermentação na prática da presente invenção. O material geralmente é selecionado com base no produto de fermentação desejado, isto é, a substância a ser obtida da fermentação, e o processo empregado, como é bem conhecido na arte. Exemplos de substratos apropriados para usar nos métodos da presente invenção incluem materiais contendo celulose, como resíduos de madeira ou planta ou açúcares de baixo peso molecular DP1-3 obtidos a partir de material celulósico processado que pode ser metabolizado pelo microorganismo de fermentação, e que pode ser fornecido por adição direta ao meio de fermentação.
O termo "meio de fermentação" será entendido como fazendo referência a um meio antes do(s) microorganismo (s) de fermentação ser adicionado(s), como, um meio resultante de um processo de sacarificação, assim como um meio usado em um processo de sacarificação e fermentação simultâneas (SSF).
"Microorganismo de fermentação" refere-se a qualquer microorganismo apropriado para uso em um processo de fermentação desejado. Os microorganismos de fermentação apropriados de acordo com a invenção são capazes de fermentar, isto é, converter, açúcares, como glicose, xilose, arabinose, manose, galactose, ou oligossacarídeos diretamente ou indiretamente no produto de fermentação desejado. Exemplos de microorganismos de fermentação incluem organismos de fungos, como leveduras. As leveduras preferidas incluem cepas de Saccharomyces spp., e em particular, Saccharomyees cerevisiae. A levedura comercialmente disponível inclui, por exemplo, Red Star®/™/Lesaffre Ethanol Red (disponível de Red Star/Lesaffre, USA) FALI (disponível de Fleischmann's Yeast, uma divisão de Burns Philp Food Inc., USA), SUPERSTART (disponível de Alltech), GERT STRAND (disponível de Gert Strand AB, Suécia) e FERMIOL (disponível de DSM Specialties).
Em um aspecto preferido, a levedura é Saccharomyees spp. Em um aspecto mais preferido, a levedura é Saccharomyees cerevisiae. Em outro aspecto mais preferido, a levedura é Saccharomyees distatieus. Em outro aspecto mais preferido, a levedura é Saccharomyees uvarium. Em outro aspecto preferido, a levedura é Kluyveromyces. Em outro aspecto mais preferido, a levedura é Kluyveromyces marxianus. Em outro aspecto mais preferido, a levedura é Kluyveromyces fragilis. Em outro aspecto preferido, a levedura é Candida. Em outro aspecto mais preferido, a levedura é Candida pseudotropiealis. Em outro aspecto mais preferido, a levedura é Candida brassieae. Em outro aspecto preferido, a levedura é uma Clavispora. Em outro aspecto mais preferido, a levedura é Clavispora lusitaniae. Em outro aspecto mais preferido, a levedura é Clavispora opuntiae. Em outro aspecto preferido, a levedura é Paehysolen. Em outro aspecto mais preferido, a levedura é Paehysolen tannophilus. Em outro aspecto preferido, a levedura é Bretannomyees. Em outro aspecto mais preferido, a levedura é Bretannomyees elausenii (Philippidis, G. P., 1996, Cellulose bioconversion technology, in Handbook on Bioethanol: Produetion and Utilization, Wyman, C. E., ed., Taylor & Francis, Washington, DC, 179-212).
Bactérias que podem eficientemente fermentar glicose em etanol incluem, por exemplo, Zymomonas mobilis e Clostridium thermocellum (Philippidis, 1996, supra).
É bem conhecido na técnica que os organismos descritos acima também podem ser usados para produzir outras substâncias, como descrito aqui.
A clonagem de genes heterólogos em Saccharomyces eerevisiae (Chen, Z., Ho, N. W. Y., 1993, Cloning and improving the expression of Piehia stipitis xylose reductase gene in Saccharomyees eerevisiae, Appl. Bioehem. Bioteehnol. 39 - 40: 135 - 147; Ho, N. W. Y., Chen, Z, Brainard, A. P., 1998, Genetically engineering Saccharomyees yeast capable of effectively cofermenting glicose and xylose, Appl. Environ. Mierobiol. 64: 1852 - 1859), ou em bactérias como Eseheriehia eoli (Beall, D. S., Qhta, K., Ingram, L. O., 1991, Parametric studies of ethanol production from xylose and other sugars by recombinant Eseheriehia eoli, Biotech. Bioeng, 38: 296 - 303), Klebsiella oxytoea (Ingram, L. O., Gomes, P. F., Lai, X., Moniruzzaman, M., Wood, B. E., Yomano, L. P., York, S. W., 1998, Metabolic engineering of bactéria for ethanol production, Bioteehnol. Bioeng. 58: 204 - 214), e Zymomonas mobilis (Zhang, M., Eddy, C., Deanda, K., Finkelstein, M., e Picataggio, S., 1995, Metabolic engineering of a pentose metabolism pathway in ethanologenic Zymomonas mobitis, Science 267: 240 - 243; Deanda, K., Zhang, M., Eddy, C., e Picataggio, S., 1996, Development of an arabinose-fermenting Zymomonas mobilis strain by metabolic pathway engineering, Appl. Environ. Mierobiol, 62: 4465 - 4470) têm levado à construção de organismos capazes de converter hexoses e pentoses em etanol (cofermentação).
Levedura ou outro microorganismo tipicamente é adicionado à celulose ou hidrolisado degradado e a fermentação prossegue durante cerca de 24 a cerca de 96 horas, como cerca de 35 e a cerca de 60 horas. A temperatura está tipicamente entre cerca de 26 0C a cerca de 40 °C, em particular de cerca de 32 °C, a cerca de pH 3 a cerca de pH 6, em particular em torno de pH 4-5.
Em aspecto preferido, levedura ou outro microorganismo é aplicado na celulose degradada ou hidrolisado e a fermentação é realizada durante cerca de 24 a cerca de 96 horas, como tipicamente 35-60 horas. Em um aspecto preferido, a temperatura geralmente é entre cerca de 26 a cerca de 40 °C, em particular de cerca de 32 0C, e o pH geralmente é de cerca de pH 3 a cerca de pH 6, preferivelmente em torno de pH 4-5. Levedura ou outro microorganismo é preferivelmente aplicado em quantidades de aproximadamente IO5 a IO12, preferivelmente de aproximadamente IO7 a IO10, especialmente aproximadamente 5x107 contagem viável por ml de caldo de fermentação. Durante uma fase de produção de etanol, a contagem de célula de levedura deve preferivelmente estar na faixa de aproximadamente IO7 a IO10, especialmente em torno de aproximadamente 2 χ IO8. Outra diretriz com relação ao uso de levedura para fermentação pode ser encontrada em, por exemplo, "The Alcohol Textbook" (Editores K. Jacques, Τ. P. Lyons e D. R. Kelsall, Nottingham University Press, Reino Unido 1999), que é incorporado aqui por referência.
O processo na técnica mais amplamente usado é o processo de
sacarificação e fermentação simultâneas (SSF) onde não se tem um estágio de manutenção para a sacarificação, significando que a levedura e a enzima são adicionadas juntas.
Para a produção de etanol, após a fermentação, a massa é destilada para extrair o etanol. O etanol obtido de acordo com o processo da invenção pode ser usado como, por exemplo, etanol combustível; etanol para bebidas, isto é, álcool neutro potável, ou etanol industrial.
Um estimulador de fermentação pode ser usado em combinação com qualquer um dos processos enzimáticos descritos aqui para ainda melhorar o processo de fermentação, e em particular, o desempenho do microorganismo de fermentação, como, melhora da taxa e rendimento de etanol. Um "estimulador de fermentação" refere-se a estimuladores para crescimento dos microorganismos de fermentação, em particular, levedura. Estimuladores de fermentação preferidos para crescimento incluem vitaminas e minerais. Exemplos de vitaminas incluem multivitaminas, biotina, pantotenato, ácido nicotínico, meso-inositol, tiamina, piridoxina, ácido para- aminobenzóico, ácido fólico, riboflavina, e vitaminas A, B, C, D, e E. Ver, por exemplo, Alfenore et al., Improving ethanol production and viability of Saccharomyces eerevisiae by a vitamin feeding strategy during fed-batch process, Springer-Verlag (2002), que é incorporado aqui por referência. Exemplos de minerais incluem minerais e sais minerais que podem suprir nutrientes compreendendo Ρ, K, Mg, S, Ca, Fe, Zn, Mn, e Cu.
Recuperação. O álcool é separado do material celulósico fermentado e purificado por métodos convencionais de destilação. Etanol com uma pureza de até cerca de 96% em volume de etanol pode ser obtido, que pode ser usado como, por exemplo, etanol combustível, etanol para bebidas, isto é, álcool neutro potável, ou etanol industrial.
Para outras substâncias, qualquer método conhecido na técnica pode ser usado incluindo, mas não limitado a, cromatografia (por exemplo, troca iônica, afinidade, hidrofóbico, cromatofocalização, e exclusão por tamanho), procedimentos eletroforéticos (por exemplo, focalização isoelétrica preparativa), solubilidade diferencial (por exemplo, precipitação com sulfato de amônio), SDS-PAGE, destilação, ou extração.
Nos métodos da presente invenção, além de beta-glucosidase, a preparação de enzima celulolítica e polipeptídeo(s) melhorador(es) celulolítico(s) podem ser suplementados por uma ou mais atividades de enzima adicionais para melhorar a degradação do material celulósico. As enzimas adicionais preferidas são hemicelulases, esterases (por exemplo, lipases, fosfolipases, e/ou cutinases), proteases, lacases, peroxidases, ou misturas das mesmas.
Nos métodos da presente invenção, a (s) enzima (s) adicional (ais) pode (m) ser adicionada (s) antes ou durante a fermentação, incluindo durante ou após a propagação do (s) microorganismo (s) de fermentação.
As enzimas referidas aqui podem ser derivadas ou obtidas de qualquer origem apropriada, incluindo, origem de bactérias, fungos, leveduras ou mamíferos. O termo "obtido" significa aqui que a enzima pode ter sido isolada de um organismo que naturalmente produz a enzima como uma enzima nativa. O termo "obtido" também significa aqui que a enzima pode ter sido produzida recombinantemente em um organismo hospedeiro, em que a enzima recombinantemente produzida é ou nativa ou estranha para o organismo hospedeiro ou tem uma seqüência de aminoácido modificada, por exemplo, tendo um ou mais aminoácidos que são deletados, inseridos e/ou substituídos, isto é, uma enzima recombinantemente produzida que é um mutante e/ou um fragmento de uma seqüência de aminoácido nativa ou uma enzima produzida por processos de embaralhamento de ácido nucléico conhecidos na arte. Estão englobadas dentro do significado de uma enzima nativa as variantes naturais e dentro do significado de uma enzima estranha as variantes recombinantemente obtidas, como por mutagênese sítio-dirigido ou embaralhamento.
As enzimas também podem ser purificadas. O termo "purificado" como usado aqui cobre as enzimas livres de outros componentes do organismo das quais ele é derivado. O termo "purificado" também cobre as enzimas livres de componentes do organismo nativo a partir das quais ele é obtido. As enzimas podem ser purificadas, com somente quantidades menores de outras proteínas estando presentes. A expressão "outras proteínas" refere- se em particular a outras enzimas. O termo "purificado" como usado aqui também refere-se à remoção de outros componentes, particularmente outras proteínas e o mais particularmente outras enzimas presentes na célula de origem da enzima da invenção. A enzima pode ser "substancialmente pura," isto é, livre de outros componentes do organismo em que é produzida, isto é, por exemplo, um organismo hospedeiro para enzimas recombinantemente produzidas.
As enzimas usadas na presente invenção podem estar em qualquer forma apropriada para uso nos processos descritos aqui, como, por exemplo, um caldo de fermentação bruto com ou sem células, um pó seco ou granulado, um granulado não pulverulento, um líquido, um líquido estabilizado, ou uma enzima protegida. Granulados podem ser produzidos, por exemplo, como descrito na patente U.S. 4.106.991 e 4.661.452, e opcionalmente podem ser revestidos por processos conhecidos na arte. Preparações de enzima líquida podem, por exemplo, ser estabilizadas por adição de estabilizadores como um açúcar, um álcool de açúcar ou outro poliol, e/ou ácido láctico ou outro ácido orgânico de acordo com o processo estabelecido. As enzimas protegidas podem ser preparadas de acordo com o processo descrito em EP 238.216. Composições detergentes
Os métodos da presente invenção são particularmente utilizáveis para melhorar a secreção de polipeptídeos em quantidades comercialmente importantes para uso em composições detergentes. Estes polipeptídeos incluem, mas não são limitados a proteases, enzimas celulolíticas, amilases e peroxidases, ou qualquer outra enzima ou proteína biológica utilizável para a indústria de detergentes. A composição detergente da presente invenção pode ser por
exemplo, formulada como uma composição detergente para lavagem manual ou em máquina, incluindo uma composição aditiva para lavagem de roupas, apropriada para pré-tratamento de tecidos manchados e uma composição amaciante de tecido adicionada no enxágüe, ou formulada como uma composição detergente para uso em operações de limpeza de superfícies duras domésticas em geral ou formuladas para operações de lavagem de louça manual ou em máquina.
Em um aspecto específico, a presente invenção provê um aditivo detergente compreendendo um polipeptídeo tendo atividade biológica, (por exemplo, proteína de fusão, um componente da mesma, ou combinações) obtidos de acordo com a presente invenção. O aditivo detergente assim como a composição detergente podem compreender uma ou mais de outras enzimas como uma protease, lipase, cutinase, uma amilase, carbohidrase celulase, pectinase, mannanase, arabinase, galactanase, xilanase, oxidase, por exemplo, uma laccase, e/ou peroxidase.
Em geral, as propriedades dos componentes enzimáticos devem ser compatíveis com o detergente selecionado (isto é, ótimo pH, compatibilidade com outros ingredientes enzimáticos e não enzimáticos, etc), e os componentes enzimáticos devem estar presentes em quantidades eficazs.
Proteases - As proteases apropriadas incluem as de origem animal, vegetal ou microbiana. A origem microbiana é preferida. Os mutantes engenheirados por proteínas ou quimicamente modificados são incluídos. A protease pode ser serina protease, ou uma metalo protease, preferivelmente uma protease microbiana alcalina ou protease de tipo tripsina. Os exemplos de proteases alcalinas são as subtilisinas, especialmente as derivadas de Bacillus, por exemplo, subtilisina Novo, subtilisina Carlsberg, subtilisina 309, subtilisina 147 e subtilisina 168 (descritas em WO 89/06279). Exemplos de proteases de tipo tripsina são tripsina (por exemplo, de origem de porcinos ou bovinos) e a protease de Fusarim, como descrito em WO 89/06270 e WO 94/25583.
Exemplos de proteases úteis são as variantes, como descrito em WO 92/19729, W035 98/20115, WO 98/20116, e WO 98/34946, especialmente as variantes com substituições em uma ou mais das seguintes posições 27, 36, 57, 76, 87, 97, 101, 104, 120, 123, 167, 170, 194, 206, 218, 222, 224, 235 e 274.
As enzimas de protease comercialmente disponíveis preferidas incluem ALCALASE™, SAVINASE™, PRIMASE™, DURALASE™, ESPERASE™, e KANNASE™ (NOVOZYMES A/S), MAXATASE™, MAXACAL™, MAXAPEM™, PROPERASE™, PURAFECT™, PURAFECT OXP™, FN2™, e FN3™ (Genencor International Inc ).
Lipases. As lipases apropriadas incluem as de origem bacteriana ou fungica. Os mutantes engenheirados por proteínas ou quimicamente modificados são incluídos. Os exemplos de lipases úteis incluem lipases de Humicola (sinônimo Thermomyces) por exemplo, de H. Ianuginosa (T lanuginosus) como descrito em EP. 258 068 e EP. 305 216 ou de H. insolens como descrito em WO 96/13580, uma lipase de Pseudomonas, por exemplo, de P. alealigenes ou P. pseudoalealigenes (EP. 218 272), P. eepaeia (EP. 331 376), P. stutzeri (GB 1.372.034), P. fluoreseens, Pseudomonas sp cepa SD 705 (WO 95/06720 e WO 96/27002), P. wiseonsinensis (WO 96/12012), uma lipase de Bacillus, por exemplo, de B. subtilis (Dartois et al, 1993, Bioehemiea et Biophysiea Aeta, 1131, 253-360), B. stearothermophilus (JP. 64/744992) ou B. pumilus (WO 91/16422). Outros exemplos são variantes de lipase como descrito em WO
92/05249,WO 94/01541, EP 407 225, EP 260 105, WO 95/35381, WO 96/00292, WO 95/30744, WO 94/25578, WO 95/14783 WO 95/22615, WO 97/04079 e WO 97/07202.
As lipases comercialmente disponíveis preferidas incluem LIPOLASE™, LIPEX™, e Lipolase ULTRA™ (Novozymes A/S).
Amilases. As amilases apropriadas (a e/ou β) incluem as de origem bacteriana ou fungica. Os mutantes engenheirados por proteínas ou quimicamente modificados são incluídos. As amilases incluem, por exemplo, a-amilases obtidas a partir de Baeillus, por exemplo, uma cepa especial de Bacillus licheniformis, como descrito em maiores detalhes em GB 1.296.839.
Exemplos de amilases utilizáveis são as variantes como descrito em WO 94/02597, WO 94/18314, WO 96/23873, e WO 97/43424, especialmente as variantes com substituições em uma ou mais das seguintes posições: 15, 23, 105, 106, 124, 128, 133, 154, 156, 181, 188, 190, 197, 202, 208, 209, 243, 264, 304, 305, 391, 408, e 444.
As amilases comercialmente disponíveis são DURAMYL™, TERMAMYL™, FUNGAMYL™ e ΒΑΝ™ (Novozymes A/S), Rapidase™ e Purastar™ (de Genencor International Inc ).
Celulases As celulases apropriadas incluem as de origem bacteriana ou fungica. Os mutantes engenheirados por proteínas ou quimicamente modificados são incluídos. As celulases apropriadas incluem celulases dos gêneros Bacillus, Pseudomonas, Humicola, Fusarium, Thielavia, Aeremonium, ou Triehoderma por exemplo, celulases fungicas produzidas a partir de Humicola insolens, Myeeliophthora thermophila e Fusarium oxysporum descritas em Patente US No 4.435.307, Patente US No 5.648.263, Patente US No 5.691.178, Patente US No 5.776.757 e WO 89/09259.
As celulases especialmente apropriadas são as celulases
neutras ou alcalinas tendo benefícios de cuidado da cor. Os exemplos de tais celulases são celulases como descrito em EP 0 495 257, EP 0 531 372, WO 96/11262, WO 96/29397, WO 98/08940. Outros exemplos são variantes de celulase como as descritas em WO 94/07998, EP 0 531 315, Patente US No 5.457.046, Patente US No 5.686.593, Patente US No 5.763.254, WO 95/24471, WO 98/12307 e PCT/DK98/00299.
As celulases comercialmente disponíveis incluem CELLUCLAST®, CELLUZYME™, e CAREZYME™ (Novozymes A/S), Clazinase™, e Puradax HA™ (Genencor International Inc ), e KAC-500(B)™ (Kao Corporation).
Peroxidases/Qxidases. Apropriadas peroxidases/oxidases incluem as de origem de plantas, bacterianas ou fungicas. Os mutantes engenheirados por proteínas ou quimicamente modificados são incluídos. Os exemplos de peroxidases utilizáveis incluem peroxidases de Coprinus, por exemplo, de C. cinereus, e variantes das mesmas, como descrito em WO 93/24618, WO 95/10602, e WO 98/15257.
As peroxidases comercialmente disponíveis incluem GUARDZYME™ (Novozymes A/S).
Os componente(s) enzimático(s) podem ser incluídos em uma composição detergente por adição de aditivos separados contendo uma ou mais enzimas, ou por adição de um aditivo combinado compreendendo todas estas enzimas. Um aditivo detergente da presente invenção, isto é, um aditivo separado ou aditivo combinado, pode ser formulado, por exemplo, como um granulado, líquido, suspensão, etc. As formulações aditivas detergentes preferidas são granulados, particularmente granulados não pulverulentos, líquidos, particularmente líquidos estabilizados ou suspensões.
Granulados não pulverulentos podem ser produzidos, por exemplo, como descrito na patente U.S. 4.106.991 e 4.661.452, e opcionalmente podem ser revestidos por processos conhecidos na arte. Os exemplos de materiais de revestimento ceroso são produtos de poli (óxido de etileno) (polietileno glicol PEG) com pesos molares médios de 1.000 a 20.000; nonilfenóis etoxilados tendo de 16 a 50 unidades de óxido de etileno, álcoois graxos etoxilados, em que o álcool contém de 12 a 20 átomos de carbono, e em que se tem 15 a 80 unidades de óxido de etileno; álcoois graxos, ácidos graxos; e mono- e di- e triglicerídeos de ácidos graxos. Exemplos de materiais de revestimento de formação de películas apropriados para aplicação por técnicas de leito fluido são dados em GB 1483591. Preparações de enzima líquida podem, por exemplo, ser estabilizadas por adição de um poliol como propileno glicol, um açúcar, um álcool de açúcar ou ácido bórico, de acordo com os processos estabelecidos. As enzimas protegidas podem ser preparadas de acordo com o processo descrito em EP 238.216.
A composição detergente da presente invenção pode estar em qualquer forma conveniente, por exemplo uma barra, um tablete, um pó, um grânulo, uma pasta ou um liquido. Um detergente líquido pode ser aquoso, tipicamente contendo até 70% de água e 0-30% de solvente orgânico, ou não aquoso.
A composição detergente compreende um ou mais tensoativos, que podem ser não iônicos incluindo semi-polar e/ou aniônico e/ou catiônica e/ou zwiterriônico. Os tensoativos estão tipicamente presentes em um nível de 0,1 a 60 % em peso.
Quando incluído ai, o detergente irá geralmente conter de cerca de 1% a cerca de 40% de um tensoativo aniônico como alquilbenzenossulfato linear, alfa-olefina sulfonato, alquil sulfato (sulfato de álcool graxo), etoxissulfato de álcool, alcanossulfonato secundário, éster metílico de alfa-sulfo ácido graxo, ácido alquil ou alquenil succínico ou sabão.
Quando incluído ai, o detergente irá geralmente conter de cerca de 0,2% a cerca de cerca de 40% de um tensoativo não iônico como etoxilato de álcool, etoxilato de nonilfenol, alquilpoliglicosídeo, óxido de alquildimetilamina etoxilada, monoetanolamida de ácido graxo etoxilada,
Monoetanolamida de ácido graxo, polihidroxi alquil amida de ácido graxo, ou derivado de N-acil N-alquila de glucosamina ("glucamidas").
O detergente pode conter de 0-65 % de um reforçador de detergente ou agente complexantes, como zeólito, difosfato, trifosfato, fosfonato, carbonato, citrato, ácido nitrilotriacético, ácido etilenodiaminatetraacético, ácido dietilenotriaminapentaacético, ácido alquil- ou alquenilsuccínico, silicatos solúveis ou silicatos em camadas (por exemplo, SKS-6 de Hoechst).
O detergente pode compreender um ou mais polímeros. Os exemplos são carboximetilcelulose, polivinilpirrolidona), polietileno glicol), poli( álcool vinílico), poli( vinilpiridina-N- óxido)), poli(vinilimidazol), policarboxilatos como poliacrilatos, copolímeros de ácido maleico/ acrílico, e copolímeros de metacrilato de laurila / ácido acrílico.
O detergente pode conter um sistema alvejante que pode compreender uma fonte de H2O2 como perborato ou percarbonato que pode ser combinada com um ativador alvejante formador de perácido, como tetraacetiletileno diamina ou nonanoiloxibenzenossulfonato. Alternativamente, o sistema alvejante pode compreender peroxiácidos de, por exemplo, o tipo amida, imida ou sulfona.
O(s) componente(s) enzimático(s) da composição detergente da presente invenção pode ser estabilizado usando agentes estabilizantes convencionais, por exemplo um poliol como propileno glicol ou glicerol, um açúcar ou álcool de açúcar, ácido bórico ou derivado de ácido bórico, por exemplo um éster de borato aromático, ou derivado de ácido fenil borônico como ácido 4- formilfenil borônico, e a composição pode ser formulada como descrito em, por exemplo, WO 30 92/19709 e WO 92/19708.
O detergente pode também conter outros ingredientes detergentes convencionais, como condicionadores de tecido incluindo argilas, reforçadores de espuma, supressores de espuma, agentes anti-corrosão, agentes de colocar em suspensão as sujeiras, agentes anti-redeposição de sujeira, corantes, bactericidas, abrilhantadores ópticos, hidrótroos, inibidores de manchas, ou perfumes.
Nas composições detergentes, qualquer componente enzimático, particularmente os polipeptídeos tendo atividade biológica da presente invenção podem ser adicionados em uma quantidade correspondendo a 0,01- 100 mg de proteína de enzima por litro de licor de lavagem, preferivelmente 0,05 - 5 mg de proteína de enzima por litro de licor de lavagem, particularmente 0,1 - 1 mg de proteína de enzima por litro de licor de lavagem.
Os polipeptídeos tendo atividade biológica da presente invenção podem ser incorporados adicionalmente nas formulações detergentes descritas em WO 97/07202, que se incorpora aqui por referência. Outros usos
Polipeptídeos tendo atividade biológica (por exemplo, proteína de fusão, um componente da mesma ou combinações das mesmas) obtidos de acordo com a presente invenção também podem ser usados em combinação com outras glicohidrolases e enzimas relacionadas, com aqui descrito, no tratamento de têxteis como agentes de biopolimento ou para redução de felpas, bolinhas, modificação da textura e lavagem com pedra (Ν. K. Lange, in P. Suominen, T. Reimkainen (Eds ), Trichoderma reesei Cellulases and Other Hidrolases, Foundation for Biotechnical and Industrial Fermentation Research, Helsinki, 1993, pp 263-272). Além disso, os polipeptídeos descrito também podem ser usados em combinação com outras glicohidrolases e enzimas relacionadas, como aqui descrito, em processamento de madeira para formação de biopasta ou remoção de cascas, fabricação de papel para modificação de fibras, branqueamento, e redução de custos de energias de refinaria, tratamento de água branca, importantes para o reciclo de água de refugo, reciclagem de fibras lignocelulósicas, como remoção de tinta e processamento secundário da fibra, e utilização de resíduos de madeira (S. D. Mansfield e A. R. Esteghlalian em S D, Mansfield e J. N. Saddler (Eds ), Applications of Enzimas to lignoeelulosics, ACS Symposium Series 855, Washington, D C, 2003 pp 2-29)
A presente invenção é ainda descrita nos seguintes exemplos que não devem ser construídos como limitando o escopo da invenção. Exemplos
Produtos químicos usados como tampões e substratos foram produtos comerciais de pelo menos tipo reagente. Sequencimento de DNA
O Sequencimento de DNA foi realizado usando um analisador genético modelo 3130X de Applied Biosystems (Applied Biosystems, Foster City, CA, USA) usando química de terminador de corante (Giesecke et al., 1992, Journal of Virol. Methods 38: 47 - 60). As seqüências foram montadas usando phred/phrap/consed (University of Washington, Seattle, WA, USA) com iniciadores de seqüência específicos. Cepa
RutC30 de Trichoderma reesei (ATCC 56765; Montenecourt e Eveleigh, 1979, Adv. Chem. Ser. 181: 289 - 301) foi derivado de Trichoderma reesei Qm6A (ATCC 13631; Mandeis e Reese, 1957, J. Bacteriol. 73: 269 - 278). RutC30 de Trichoderma reesei e cepa Aspergillus oryzae Jal355 (WO 02/062973) foram usados para expressão da proteína de fusão beta- glucosidase.
Meios de cultura e soluções
Meio YP foi composto por litro de 10 g de extrato de levedura e 20 g de bacto triptona.
Meio induzindo celulase foi composto por litro de 20 g de celulose, 10 g de sólidos de licor de milho, 1,45 g de (NH4)2SO4, 2,08 g de KH2PO4, 0,28 g de CaCl2, 0,42 g de MgS04-7H20, e 0,42 ml de solução de metais trace.
Solução de metais de traço foi composta por litro de 216 g de FeCl3 6H20, 58 g de ZnS04-7H20, 27 g de MnSO4H2O, 10 g de CuSO4 SH2O, 24 g de H3BO3, e 336 g de ácido cítrico.
STC foi composto de 1 M de sorbitol, 10 mM de CaCl2, e 10 mM de Tris-HCl, pH 7,5. Placas COVE foram compostas por litro de 342 g de sacarose, ml de solução de sais COVE, 10 ml de 1 M de acetamida, 10 ml de 1,5 M de CsCl, e 25 g de ágar Noble.
Solução de sais COVE foi composta por litro de 26 g de KCl, 26 g de MgSO4, 76 g de KH2PO4, e 50 ml de solução de metais trace COVE.
Solução de metais de traço COVE foi composta por litro de 0,04 g de Na2B4O7-IOH2O, 0,4 g de CuS04-5H20, 1,2 g de FeS04-7H20, 0,7 g de MnSO4-H2O, 0,8 g de Na2MoO2-H2O, e 10 g de ZnS04-7H20.
Placas COVE2 foram compostas por litro de 30 g de sacarose, ml de solução de sais COVE, 25 g de ágar Noble, e 10 ml de 1 M de acetamida.
Placas PDA foram compostas por litro de 39 gramas de ágar dextrose de batata.
O meio LB foi composto por litro de 10 g de triptona, 5 g de extrato de levedura, 5 g de cloreto de sódio.
Placas 2X YT foram compostas por litro de 10 g de triptona, 5 g de extrato de levedura, 5 g de cloreto de sódio, e 15 g de ágar Bacto.
O meio MDU2BP foi composto por litro de 45 g de maltose, 1 g de MgS04-7H20, 1 g de NaCl, 2 g de K2HSO4, 12 g de KH2PO4, 2 g de uréia, e 500 μΐ de solução de metais trace AMG, o pH foi ajustado a 5,0 e então o filtro esterilizado com uma unidade de filtração de 0,22 μηι.
Solução de metais de traço AMG foi composta por litro de 14,3 g de ZnSO4-7H20, 2,5 g de CuS04-5H20, 0,5 g de NiCl2-6H20, 13,8 g de FeSO4-7H20, 85 g de MnS04-7H20, e 3 g de ácido cítrico.
Placas de meio mínimo foram compostas por litro de 6 g de NaNO3, 0,52 de KCl, 1,52 g de KH2PO4, 1 ml de solução de metais trace COVE, 20 g de ágar Noble, 20 ml de 50% de glicose, 2,5 ml de 20% de MgSO4-7H20, e 20 ml de solução de carga biotina.
Solução de carga biotina foi composta por litro de 0,2 g de biotina.
O meio SOC foi composto de 2% de triptona, 0,5% de extrato de levedura, 10 mM de NaCl, 2,5 mM de KCl, 10 mM de MgCl2, e 10 mM de MgSO4, seguido por adição de glicose de filtro esterilizado a 20 mM após autoclavagem.
Exemplo 1: Construção de vetor de expressão pMJ04
Vetor de expressão pMJ04 foi construído por amplificação PCR do gene celobiohidrolase 1 dQTrichoderma reesei (cbhl, CEL7A) terminador de DNA genômico RutC30 de Trichoderma reesei usando iniciadores 993429 (anti-sentido) e 993428 (sentido) mostrados abaixo. O iniciador anti-sentido foi engenheirado para ter um sítio Pac I na extremidade 5' e um sítio Spe I na extremidade 3' do iniciador anti-sentido. Iniciador 993429 (anti-sentido):
5'-AACGTTAATTAAGGAATCGTTTTGTGTTT-31 (SEQ ID NO:33) Iniciador 993428 (sentido):
5'-AGTACTAGTAGCTCCGTGGCGAAAGCCTG-31 (SEQ ID NO: 34)
DNA genômico RutC30 de Triehoderma reesei foi isolado usando um kit DNEASY® Plant Maxi (QIAGEN Inc., Valencia, CA, USA).
As reações de amplificação (50 μΐ) foram compostas de tampão de reação IX ThermoPol (New England Biolabs, Beverly, MA USA), 0,3 mM de dNTPs, 100 ng de DNA genômico RutC30 de Triehoderma reesei, 0,3 μΜ de iniciador 993429, 0,3 μΜ de iniciador 993428, e 2 unidades de Vent DNA polimerase (New England Biolabs, Beverly, MA, USA). As reações foram incubadas em um EPPENDORF® MASTERCYCLER® 5333 (Eppendorf Scientific, Inc., Westbury, NY, USA) programado para 5 ciclos cada durante 30 segundos a 94 °C, 30 segundos a 50 0C, e 60 segundos a 72 0C, seguido por 25 ciclos cada durante 30 segundos a 94 °C, 30 segundos a 65 0C, e 120 segundos a 72 0C (extensão final de 5 minutos). Os produtos de reação foram isolados em um gel agarose a 1,0% usando 40 mM Tris base-20 mM de acetato de sódio-1 mM dissódico EDTA (TAE) tampão onde uma banda de produto de 229 bp foi excisada do gel e purificada usando um kit de extração de gel QIAQUICK® (QIAGEN Inc., Valencia, CA, USA) de acordo com as instruções do fabricante.
O fragmento PCR resultante foi digerido com Pac I e Spe I e ligado em pAILol (WO 05/067531) digerido com as mesmas enzimas de restrição usando um kit de ligação rápido (Roche, Indianápolis, IN, USA), para gerar pMJ04 (figura 1). Exemplo 2: Construção de pCaHj568
Plasmídeo pCaHj568 foi construído de pCaHjl70 (patente US no. 5.763.254) e pMT2188. Plasmídeo pCaHjl70 compreende a região de codificação de comprimento completo de endoglucanase V de Humicola insolens (CEL45A) (SEQ ID NO:l, que codifica a seqüência de aminoácido de SEQ ID NO: 2). Construção de pMT2188 foi iniciada por amplificar PCR a origem de replicação de pUC19 de pCaHj483 (WO 98/00529) usando iniciadores 142779 e 142780 mostrados abaixo. Iniciador 142780 introduz um sítio Bbu I no fragmento PCR. 142779:
5'-TTGAATTGAAAATAGATTGATTTAAAACTTC-3' (SEQ ID NO: 35) 142780:
5'-TTGCATGCGTAATCATGGTCATAGC-3* (SEQ ID NO: 36)
Um sistema EXPAND® PCR (Roche Molecular Biochemicals, Basel, Suiça) foi usado seguindo as instruções do fabricante para esta amplificação. Produtos PCR foram separados em um gel de agarose e um fragmento de 1160 bp foi isolado e purificado usando um Kit Spin de extração de gel Jetquick (Genomed, Wielandstr, Alemanha). O gene URA3 foi amplificado do vetor de clonagem geral de Saccharomyees eerevisiae pYES2 (Invitrogen, Carlsbad, CA, USA) usando iniciadores 140288 e 142778 mostrados abaixo usando um sistema EXPAND® PCR. Iniciador 140288 introduziu um sítio Eco RI no fragmento PCR. 5'-TTGAATTCATGGGTAATAACTGATAT-3' (SEQ ID NO: 37) 142778:
5'-AAATCAATCTATTTTCAATTCAATTCATCATT-31 (SEQ ID NO: 38)
Produtos PCR foram separados em um gel de agarose e um fragmento 1126 bp foi isolado e purificado usando um Kit Spin de extração de gel Jetquick.
Os dois fragmentos PCR foram fusionados por misturação e amplificados usando iniciadores 142780 e 140288 mostrados acima pelo método de emenda de sobreposição (Horton et al., 1989, Gene 77: 61 - 68). Produtos PCR foram separados em um gel de agarose e um fragmento 2263 bp foi isolado e purificado usando um Kit Spin de extração de gel Jetquick.
O fragmento resultante foi digerido com Eco RI e Bbu I e ligado usando protocolos padrões para o fragmento maior de pCaHj483 digerido com as mesmas enzimas de restrição. A mistura de ligação foi transformada em cepa E. coli DB6507 pyrF-negativa (ATCC 35673) tornada competente pelo método de Mandei e Higa, 1970, J. Mol. Biol. 45: 154. Transformantes foram selecionados em meio sólido M9 (Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, 2a. edição, Cold Spring Harbor Laboratory Press) suplementado por litro com 1 g de casaminoácidos, 500 μg de tiamina, e 10 mg de canamicina. Um plasmídeo de um transformante foi isolado e designado pCaHj527 (figura 2).
O promotor NA2-tpi presente em pCaHj527 foi submetido a mutagênese sítio-dirigida por uma abordagem de PCR simples usando um sistema EXPAND® PCR de acordo com as instruções do fabricante. Nucleotídeos 134-144 foram convertidos de GTACTAAAACC (SEQ ID NO: 39) a CCGTTAAATTT (SEQ ID NO: 40) usando iniciador mutagênico 141223 mostrado abaixo. Iniciador 141223:
5' -GGATGCTGTTG ACTCCGGAAATTTAACGGTTTGGTCTTGC ATC CC-3' (SEQ ID NO: 41)
Nucleotídeos 423-436 foram convertidos de ATGCAATTTAAACT (SEQ ID NO: 42) a CGGCAATTTAACGG (SEQ ID NO: 43) usando inieiador mutagênieo 141222 mostra abaixo. Inieiador 141222:
5' -GGT ATTGTCCTGC AGACGGC AATTT AACGGCTTCTGCGAATCGC- 3' (SEQ ID NO: 44) O plasmídeo resultante foi designado pMT2188 (figura 3).
A região de codificação de endoglucanase V de Humicola insolens foi transferida de pCaHjl70 como um fragmento Bam Wl-Sal I em pMT2188 digerido com Bam HI e Xho I para gerar pCaHj568 (figura 4). Plasmídeo pCaHj568 compreende um promotor NA2-tpi mudado, ligado operativamente à seqüência de codificação de comprimento completo de endoglucanase V de Humicola insolens. Exemplo 3: Construção de pMJ05
Plasmídeo pMJ05 foi construído por amplificação PCR da região de codificação de comprimento completo de endoglucanase V de Humieola insolens de 915 bp de pCaHj568 usando iniciadores HiEGV-F e HiEGV-R mostrados abaixo. HiEGV-F (sentido):
5'-AAGCTTAAGCATGCGTTCCTCCCCCCTCC-3' (SEQ ID NO: 45) HiEGV-R (anti-sentido) 5'-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3' (SEQ ID NO: 46)
As reações de amplificação (50 μΐ) foram compostas de tampão de reação IX ThermoPol (New England Biolabs, Beverly, MA, USA), 0,3 mM de dNTPs, 10 ng/μΐ de pCaHj568, 0,3 μΜ de inieiador HiEGV-F, 0,3 μΜ de inieiador HiEGV-R, e 2 unidades de Vent DNA polimerase (New England Biolabs, Beverly, MA, USA). As reações foram incubadas em um EPPENDORF® MASTERCYCLER® 5333 programado para 5 ciclos cada durante 30 segundos a 94°C, 30 segundos a 50°C, e 60 segundos a 72°C, seguido por 25 ciclos cada durante 30 segundos a 94°C, 30 segundos a 65°C, e 120 segundos a 72°C (extensão final de 5 minutos). Os produtos de reação foram isolados em um gel de agarose a 1,0% usando tampão TAE onde uma banda de produto de 937 bp foi excisada do gel e purificada usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante. O fragmento 937 bp purificado foi usado como DNA gabarito
para amplificações subsequentes usando os seguintes iniciadores: HiEGV-R (anti-sentido):
5'-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3' (SEQ ID NO: 47) HiEGV-F-sobreposição (sentido): y-ACCGCGGACTGCGCATCATGCGTTCCICCCCCCYCC-y (SEQ ID NO: 48)
Seqüências do iniciador em itálico são homólogas para 17 bp do promotor do gene de celobiohidrolase I de Trichoderma reesei (<cbhl) e seqüências do iniciador sublinhadas são homólogos para 29 bp da região de codificação de endoglucanase V de Humicola insolens. Uma sobreposição de 36 bp entre o promotor e a seqüência de codificação permitiu a fusão precisa do fragmento de 994 bp compreendendo o promotor de Trichoderma reesei cbhl para o fragmento de 918 bp compreendendo a região de codificação de endoglucanase V de Humicola insolens. As reações de amplificação (50 μΐ) foram compostas de
tampão de reação IX ThermoPol, 0,3 mM de dNTPs, 1 μΐ do fragmento PCR de 937 bp purificado, 0,3 μΜ de iniciador de sobreposição HiEGV-F, 0,3 μΜ de iniciador HiEGV-R, e 2 unidades de Vent DNA polimerase. As reações foram incubadas em um EPPENDORF® MASTERCYCLER® 5333 programado para 5 ciclos cada durante 30 segundos a 94°C, 30 segundos a 50°C, e 60 segundos a 72°C, seguido por 25 ciclos cada durante 30 segundos a 94°C, 30 segundos a 65°C, e 120 segundos a 72°C (extensão final de 5 minutos). Os produtos de reação foram isolados em um gel de agarose a 1,0% usando tampão TAE onde uma banda de produto de 945 bp foi excisada do gel e purificada usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante.
Um PCR separado foi realizado para amplificar a seqüência do promotor de Trichoderma reesei cbhl se estendendo de 994 bp a montante do códon de partida ATG do gene de DNA genômico RutC30 de Triehoderma reesei usando os iniciadores mostrados abaixo (o iniciador sentido foi engenheirado para ter um sítio de restrição Sal I na extremidade 5'). DNA genômico RutC30 de Trichoderma reesei foi isolado usando um kit DNEASY® Plant Maxi. TrCBHIpro-F (sentido):
5'-AAACGTCGACCGAATGTAGGATTGTTATC-3' (SEQ ID NO: 49) TrCBHIpro-R (anti-sentido): -GATGCGCAGTCCGCGGT-3' (SEQ ID NO: 50)
As reações de amplificação (50 μΐ) foram compostas de tampão de reação IX ThermoPol, 0,3 mM de dNTPs, 100 ng/μΐ de DNA genômico RutC30 de Trichoderma reesei, 0,3 μΜ de iniciador TrCBHIpro-F, 0,3 μΜ de iniciador TrCBHIpro-R, e 2 unidades de Vent DNA polimerase. As reações foram incubadas em um EPPENDORF® MASTERCYCLER® 5333 programado para 30 ciclos cada durante 30 segundos a 94°C, 30 segundos a 55°C, e 120 segundos a 12°C (extensão final de 5 minutos). Os produtos de reação foram isolados em um gel agarose a 1,0% usando tampão TAE onde uma banda de produto de 998 bp foi excisada do gel e purificada usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante. O fragmento PCR de 998 bp purificado foi usado como DNA gabarito para amplificações subsequentes usando os iniciadores mostrados abaixo.
TrCBHIpro-F:
5AAACGTCGACCGAATGTAGGATTGTTATC-3' (SEQ ID NO: 51) TrCBHIpro-R-sobreposição:
5'-GGAGGGGGGAGGAACGC ATG ATGCGC A GTCCGCGGT-3' (SEQ ID NO: 52)
Seqüências em itálico são homólogas para 17 bp do promotor cbhl de Trichoderma reesei e seqüências sublinhadas são homólogas a 29 bp da região de codificação de endoglucanase V de Humicola insolens. Uma sobreposição de 36 bp entre o promotor e a seqüência de codificação permitiu a fusão precisa do fragmento de 994 bp compreendendo o promotor cbhl de Trichoderma reesei para o fragmento de 918 bp compreendendo a região de codificação de comprimento completo de endoglucanase V de Humieola insolens.
As reações de amplificação (50 μΐ) foram compostas de tampão de reação IX ThermoPol, 0,3 mM de dNTPs, 1 μΐ do fragmento PCR de 998 bp purificado, 0,3 μΜ TrCBHlpro-F iniciador, 0,3 μΜ iniciador de sobreposição TrCBHlpro-R, e 2 unidades de Vent DNA polimerase. As reações foram incubadas em um EPPENDORF® MASTERCYCLER® 5333 programado para 5 ciclos cada durante 30 segundos a 94°C, 30 segundos a 50°C, e 60 segundos a 72°C, seguido por 25 ciclos cada durante 30 segundos a 94°C, 30 segundos a 65°C, e 120 segundos a 72°C (extensão final de 5 minutos). Os produtos de reação foram isolados em um gel de agarose a 1,0% usando tampão TAE onde uma banda de produto de 1017 bp foi excisada do gel e purificada usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante.
O fragmento PCR de promotor cbhl de Trichoderma reesei de 1017 bp e o fragmento PCR de endoglucanase V de Humicola insolens de 945 bp foram usados como DNA gabarito para amplificação subsequente usando os seguintes iniciadores para precisamente fusionar o promotor cbhl de 994 bp para a região de codificação de comprimento completo de endoglucanase V de 918 bp usando PCR de sobreposição. TrCBHIpro-F:
5'-AAACGTCGACCGAATGTAGGATTGTTATC-3' (SEQ ID NO: 53) HiEGV-R:
5'-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3' (SEQ ID NO: 54) As reações de amplificação (50 μΐ) foram compostas de
tampão de reação IX ThermoPol, 0,3 mM de dNTPs, 0,3 μΜ de iniciador TrCBH Ipro-F, 0,3 μΜ de iniciador HiEGV-R, e 2 unidades de Vent DNA polimerase. As reações foram incubadas em um EPPENDORF® MASTERCYCLER® 5333 programado para 5 ciclos cada durante 30 segundos a 94°C, 30 segundos a 50°C, e 60 segundos a 72°C, seguido por 25 ciclos cada durante 30 segundos a 94°C, 30 segundos a 65°C, e 120 segundos a 72°C (extensão final de 5 minutos). Os produtos de reação foram isolados em um gel agarose a 1,0% usando Tampão TAE onde uma banda de produto de 1926 bp foi excisada do gel e purificada usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante.
O fragmento de 1926 bp resultante foi clonado em um vetor pCR®-Blunt-II-TOPO® (Invitrogen, Carlsbad, CA, USA) usando um kit de clonagem PCR ZEROBLUNT® TOPO® (Invitrogen, Carlsbad, CA, USA) seguindo o protocolo de fabricação. O plasmídeo resultante foi digerido com Not I e Sal Ieo fragmento de 1926 bp foi purificado em gel usando um kit de extração de gel QIAQUICK® e ligado usando T4 DNA ligase (Roche, Indianápolis, IN, USA) em pMJ04, que também foi digerido com as mesmas duas enzimas de restrição, para gerar pMJ05 (figura 5). Plasmídeo pMJ05 compreende o promotor de celobiohidrolase I de Trichoderma reesei e terminador ligado operativamente à seqüência de codificação de comprimento completo de endoglucanase V de Humicola insolens. Exemplo 4: Construção de vetor de expressão pSMail30
Um fragmento de DNA de 2586 bp se estendendo a partir do códon de partida ATG para o códon de parada TAA da seqüência de codificação de comprimento completo de beta-glucosidase de Aspergillus oryzae (SEQ ID NO: 21 para seqüência de cDNA e SEQ ID NO:22 para a seqüência de aminoácido deduzida; E. coli DSM 14240) foi amplificado por PCR de pJaL660 (WO 2002/095014) como gabarito com iniciadores 993467 (sentido) e 993456 (anti-sentido) mostra abaixo. Um sítio Spe I foi engenheirado na extremidade 5' do iniciador anti-sentido para facilitar a ligação. Seqüências do iniciador em itálico são homólogas para 24 bp do promotor de cbhl de Trichoderma reesei e seqüências sublinhadas são homólogas a 22 bp à região de codificação de beta-glucosidase de Aspergillus oryzae.
Iniciador 993467:
'-A TA GTCAA CCGCGGA CTGCGCA TCATGAAGCTTGGTTGGATCGA GG-3' (SEQ ID NO: 55) Iniciador 993456:
5-ACTAGTTTACTGGGCCTTAGGCAGCG-3' (SEQ ID NO: 56)
As reações de amplificação (50 μΐ) foram compostas de tampão de amplificação Pfic (Invitrogen, Carlsbad, CA, USA), 0,25 mM de dNTPs, 10 ng de pJaL660, 6,4 μΜ de iniciador 993467, 32 μΜ de iniciador 993456, 1 mM de MgCl2, e 2,5 unidades de Pfic DNA polimerase (Invitrogen, Carlsbad, CA, USA). As reações foram incubadas em um EPPENDORF® MASTERCYCLER® 5333 programado para 30 ciclos cada durante 1 minuto a 94°C, 1 minuto a 55°C, e 3 minutos a 72°C (extensão final de 15 minutos). Os produtos de reação foram isolados em um gel agarose a 1,0% usando tampão TAE onde uma banda de produto de 2586 bp foi excisada do gel e purificada usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante.
Um PCR separado foi realizado para amplificar a seqüência de promotor de cbhl de Trichoderma reesei se estendendo de 1000 bp a montante do códon de partida ATG do gene, usando iniciador 993453 (sentido) e iniciador 993463 (anti-sentido) mostrados abaixo para gerar um fragmento PCR de 1000 bp. Iniciador 993453:
5'-GTCGACTCGAAGCCCGAATGTAGGAT-3* (SEQ ID NO: 57) Iniciador 993463:
5'- CCTCGATCCAACCAAGCTTCAT04 TGCGCA GTCCGCGGTTG ACTA-3' (SEQ ID NO: 58)
Seqüências do iniciador em itálico são homólogas para 24 bp do promotor de cbhl de Trichoderma reesei e seqüências do iniciador sublinhadas são homólogas a 22 bp à região de codificação de comprimento completo de beta-glucosidase de Aspergillus oryzae. A sobreposição de 46 bp entre o promotor e a seqüência de codificação permitiu a fusão precisa do fragmento de 1000 bp compreendendo o promotor de cbhl de Trichoderma reesei para o fragmento de 2586 bp compreendendo a região de codificação de beta-glucosidase de Aspergillus oryzae.
As reações de amplificação (50 μΐ) foram compostas de tampão de amplificação de Pfa, 0,25 mM de dNTPs, 100 ng de DNA genômico de RutC30 de Trichoderma reesei, 6,4 μΜ de iniciador 993453, 32 μΜ de iniciador 993463, 1 mM de MgCl2, e 2,5 unidades de Pfa DNA polimerase. As reações foram incubadas em um EPPENDORF® MASTERCYCLER® 5333 programado para 30 ciclos cada durante 1 minuto a 94°C, 1 minuto a 55°C, e 3 minutos a 72°C (extensão final de 15 minutos). Os produtos de reação foram isolados em um gel agarose a 1,0% usando tampão TAE onde uma banda de produto de 1000 bp foi excisada do gel e purificada usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante.
Os fragmentos purificados foram usados como DNA gabarito para amplificação subsequente por PCR de sobreposição usando iniciador 993453 (sentido) e iniciador 993456 (anti-sentido) mostrados acima para precisamente fiisionar o fragmento de 1000 bp compreendendo o promotor de cbhl de Trichoderma reesei para o fragmento de 2586 bp compreendendo a região de codificação de comprimento completo de beta-glucosidase de Aspergillus oryzae.
As reações de amplificação (50 μΐ) foram compostas de tampão de amplificação Pfie, 0,25 mM de dNTPs, 6,4 μΜ de iniciador 99353, 3,2 μΜ de iniciador 993456, 1 mM de MgCl2, e 2,5 unidades de Pfic DNA polimerase. As reações foram incubadas em um EPPENDORF® MASTERCYCLER® 5333 programado para 30 ciclos cada durante 1 minuto a 94°C, 1 minuto a 60°C, e 4 minutos a 72°C (extensão final de 15 minutos).
O fragmento de 3586 bp resultante foi digerido com Sal I e Spe I e ligado em pMJ04, digerido com as mesmas duas enzimas de restrição, para gerar pSMail30 (figura 6). Plasmídeo pSMail30 compreende o promotor de gene de celobiohidrolase I de Triehoderma reesei e terminador ligado operativamente à seqüência sinal de beta-glucosidase nativa de Aspergillus oryzae e seqüência de codificação (isto é, seqüência de codificação de beta-glucosidase de Aspergillus oryzae). Exemplo 5: Construção de pSMail35
A seqüência de codificação de mature de beta-glucosidase de Aspergillus oryzae (menos a seqüência de sinal nativa, ver figura 7; SEQ ID NOs: 59 e 60) de Lys-20 para o códon parado TAA foi amplificado por PCR a partir de pJaL660 como gabarito com iniciador 993728 (sentido) e iniciador 993727 (anti-sentido) mostra abaixo. Iniciador 993728: 5'-TGCCGGTGTTGGCCCTTGCCAAGGATGATCTCGCGTACTCCC-3' (SEQ ID NO: 61) Iniciador 993727:
5'-GACTAGTCTTACTGGGCCTTAGGCAGCG-3' (SEQ ID NO: 62) Seqüências em itálico são homólogas para 20 bp da seqüência
de sinal de endoglucanase V de Humicola insolens e seqüências sublinhadas são homólogas a 22 bp à região de codificação de beta-glucosidase de Aspergillus oryzae. Um sítio Spe I foi engenheirado na extremidade 5' do iniciador anti-sentido. As reações de amplificação (50 μΐ) foram compostas de
tampão de amplificação Pfic, 0,25 mM de dNTPs, 10 ng/μΐ de pJaL660, 6,4 μΜ de iniciador 993728, 3,2 μΜ de iniciador 993727, 1 mM de MgCl2, e 2,5 unidades de Pfa DNA polimerase. As reações foram incubadas em um EPPENDORF® MASTERCYCLER® 5333 programado para 30 ciclos cada durante 1 minuto a 94°C, 1 minuto a 55°C, e 3 minutos a Il0C (extensão final de 15 minutos). Os produtos de reação foram isolados em um gel agarose a 1,0% usando tampão TAE onde uma banda de produto de 2523 bp foi excisada do gel e purificada usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante. Uma amplificação PCR separada foi realizada para amplificar
1000 bp do promotor de ebhl de Triehoderma reesei e 63 bp à seqüência de sinal de endoglucanase V de Humieola insolens (códon de partida ATG para Ala-21, figura 8, SEQ ID NOs: 63 e 64), usando iniciador 993724 (sentido) e iniciador 993729 (anti-sentido) mostrados abaixo. Iniciador 993724:
5'-ACGCGTCGACCGAATGTAGGATTGTTATCC-3' (SEQ ID NO: 65) Iniciador 993729:
5'-GGGAGTACGCGAGATCATCCTT GGCAAGGGCCAACACCGGCA-3' (SEQ ID NO: 66) Seqüências do iniciador em itálico são homólogas para 20 bp à seqüência de sinal de endoglucanase V de Humicola insolens e seqüências de iniciador sublinhadas são homólogas para 22 bp à região de codificação de beta-glucosidase de Aspergillus oryzae.
Plasmídeo pMJ05, que compreende a região de codificação de endoglucanase V de Humieola insolens sob o controle do promotor ebhl, foi usado como gabarito para gerar um fragmento de 1063 bp compreendendo o promotor de ebhl de Triehoderma reesei e fragmento de seqüência de sinal de endoglucanase V de Humieola insolens. Uma sobreposição de 42 bp foi compartilhada entre o promotor ebhl de Triehoderma reesei e a seqüência de sinal de endoglucanase V de Humieola insolens e a seqüência de codificação mature de beta-glucosidase de Aspergillus oryzae para prover uma ligação perfeita entre o promotor e o códon de partida ATG à região de codificação de beta-glucosidase de 2523 bp de Aspergillus oryzae.
As reações de amplificação (50 μΐ) foram compostas de tampão de amplificação Pfic, 0,25 mM de dNTPs, 10 ng/μΐ de pMJ05, 6,4 μΜ de iniciador 993728, 32 μΜ de iniciador 993727, 1 mM de MgCl2, e 2,5 unidades de Pfic DNA polimerase. As reações foram incubadas em um EPPENDORF® MASTERCYCLER® 5333 programado para 30 ciclos cada durante 1 minuto a 94°C, 1 minuto a 60°C, e 4 minutos a 72°C (extensão final de 15 minutos). Os produtos de reação foram isolados em um gel agarose a 1,0% usando tampão TAE onde uma banda de produto de 1063 bp foi excisada do gel e purificada usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante.
Os fragmentos de sobreposição purificados foram usados como gabaritos para amplificação usando iniciador 993724 (sentido) e iniciador 993727 (anti-sentido) descritos acima para precisamente fusionar o fragmento de 1063 bp compreendendo o promotor ebhl de Triehoderma reesei e seqüência de sinal de endoglucanase V de Humieola insolens para o fragmento de 2523 bp compreendendo a armação da região de codificação madura de beta-glucosidase de Aspergillus oryzae por PCR de sobreposição.
As reações de amplificação (50 μΐ) foram compostas de tampão de amplificação Pfic, 0,25 mM de dNTPs, 6,4 μΜ de iniciador 993724, 3,2 μΜ de iniciador 993727, 1 mM de MgCl2, e 2,5 unidades de Pfic DNA polimerase. As reações foram incubadas em um EPPENDORF® MASTERCYCLER® 5333 programado para 30 ciclos cada durante 1 minuto a 94°C, 1 minuto a 60°C, e 4 minutos a 72°C (extensão final de 15 minutos). Os produtos de reação foram isolados em um gel agarose a 1,0% usando tampão TAE onde uma banda de produto de 3591 bp foi excisada do gel e purificada usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante.
O fragmento de 3591 bp resultante foi digerido com Sal I e Spe I e ligado em pMJ04 digerido com as mesmas enzimas de restrição para gerar pSMail35 (figura 9). Plasmídeo pSMail35 compreende o promotor de gene de celobiohidrolase I de Trichoderma reesei e terminador ligado operativamente à seqüência de sinal de endoglucanase V de Humicola insolens e a seqüência de codificação madura de beta-glucosidase de Aspergillus oryzae.
Exemplo 6: Expressão de beta-glucosidase de Aspergillus oryzae com o sinal de secreção de endoglucanase V de Humicola insolens
Plasmídeo pSMail35 codificando a beta-glucosidase madura de Aspergillus oryzae ligada ao sinal de secreção de endoglucanase V de Humieola insolens (figura 8) foi introduzido em RutC30 de Triehoderma reesei por transformação mediada de PEG (Penttila et al., 1987, Gene 61 155 - 164). O plasmídeo continha o gene de amdS de Aspergillus nidulans para permitir aos transformantes crescer em acetamida como a única fonte de nitrogênio.
RutC30 de Triehoderma reesei foi cultivado a 27°C e 90 rpm em 25 ml de meio YP suplementado com 2% (p/v) glicose e 10 mM de uridina durante 17 horas. Micélios foram coletados por filtração usando um sistema de filtração descartável acionado a vácuo (Millipore, Bedford, MA, USA) e lavado duas vezes com água deionizada e duas vezes com 1,2 M de sorbitol. Protoplastos foram gerados por colocação em suspensão do micélia lavado em 20 ml de 1,2 M de sorbitol contendo 15 mg de GLUCANEX® (Novozymes A/S, Bagsvaerd, Dinamarca) por ml e 03,6 unidades de quitinase (Sigma Chemical Co., St. Louis, MO, USA) por ml e incubando durante 15- minutos a 34°C com agitação suave a 90 rpm. Protoplastos foram coletados por centrifugar durante 7 minutos a 400 χ g e lavados duas vezes com 1,2 M de sorbitol frio. Os protoplastos foram contados usando um hemacitômetro e re-colocados em suspensão em STC para uma concentração final de 1 X IO8 protoplastos por ml. Os protoplastos em excesso foram armazenados em um recipiente de congelamento Cryo 1°C (Nalgene, Rochester, NY, USA) a -80°C.
Aproximadamente 7 μg de pSMail35 digerido com Pme I foram adicionados a 100 μΐ de solução de protoplasto e misturado suavemente, seguido por 260 μΐ de tampão PEG, misturado, e incubados em temperatura ambiente durante 30 minutos. STC (3 ml) foi então adicionado e misturado e a solução de transformação foi colocada sobre placas COVE usando seleção de amsdS de Aspergillus nidulans. As placas foram incubadas a 28°C durante 5-7 dias. Transformantes foram sub-cultivados sobre placas COVE2 e cultivados a 28°C.
Sessenta e sete transformantes designados SMA135 obtidos com pSMail35 foram subcultivados sobre placas congeladas contendo acetamida e deixados esporular durante 7 dias a 28°C.
Sessenta e sete transformantes de SMAl35 de Trichoderma reesei foram cultivados em 125 ml de frascos com agitação com anteparos contendo 25 ml de meio induzindo celulase a pH 6,0 inoculado com esporos dos transformantes e incubados a 28°C e 200 rpm durante 7 dias. RutC30 de Trichoderma reesei foi ciclado como um controle. Amostras do caldo de cultura foram removidas no dia 7. Um ml de cada caldo de cultura foi centrifugado a 15.700 χ g durante 5 minutos em uma micro-centrífuga e os sobrenadantes transferidos para novos tubos. As amostras foram armazenadas a 4°C até teste de enzima. Os sobrenadantes foram testados para atividade de beta-glucosidase usando p-nitrofenil-beta-D-glucopiranosídeo como substrato, como descrito abaixo.
Atividade de beta-glucosidase foi determinada em temperatura ambiente usando 25 μΐ de alíquotas de sobrenadantes de cultura, diluída 1:10 em 50 mM de sucinato pH 5,0, em 200 μΐ de 0,5 mg/ml de p-nitrofenil-beta- D-glucopiranosideo como substrato em 50 mM de sucinato pH 5,0. Após 15 minutos de incubação a reação foi parada por adição de 100 μΐ de 1 M de Tris-HCl pH 8,0 e a absorção foi lida espectrofotometricamente a 405 nm. Uma unidade de atividade de beta-glucosidase correspondendo à produção de 1 μηιοί de /?-nitrofenila por minuto por litro a pH 5,0, temperatura ambiente. Beta-glucosidase de Aspergillus niger (NOVOZYM™ 188, Novozymes A/S, Bagsvaerd, Dinamarca) foi usado como um padrão de enzima.
Um número dos transformantes de SMAl 35 mostrou atividades de beta-glucosidase várias vezes maior do que a secretada por RutC30 de Trichoderma reesei. Dentre os transformantes SMA135 triados, transformante SMA135-04 produziu a maior atividade de beta-glucosidase.
SDS-PAGE foi realizado usando Tris-HCl CRITERION® (5% resolução) géis (Bio-Rad, Hercules, CA, USA) com o sistema CRITERION® (Bio-Rad, Hercules, CA, USA). Cinco μΐ de sobrenadantes de dia 7 (ver acima) foram colocados em suspensão em 2X concentração de tampão de amostra Laemmli (Bio-Rad, Hercules, CA, USA) e fervidos na presença de 5% beta-mercaptoetanol durante 3 minutos. As amostras de sobrenadante foram carregadas sobre um gel de poliacrilamida e submetidas a eletroforese com IX de Tris/glicina/SDS como tampão de ciclo (Bio-Rad, Hercules, CA, USA). O gel resultante foi colorido com corante Coomassie BIO-SAFE® (Bio-Rad, Hercules, CA, USA).
Dentre os transformantes de SMA13538 Trichoderma reesei analisados por SDS-PAGE, 26 produziram uma proteína de aproximadamente 110 kDa que não foi visível em RutC30 de Triehoderma reesei como controle. Transformante Trichoderma reesei SMAl35-04 produziu o maior nível de beta-glucosidase como evidenciado por abundância da banda de 110 kDa vista por SDS-PAGE.
Exemplo 7: Construção de vetor de expressão pSMail40
Vetor de expressão pSMail40 foi construído por digestão de plasmídeo pSATelllBG41 (WO 04/099228), que transporta uma região de codificação de comprimento completo de variante BG41 de beta-glucosidase de Aspergillus oryzae (SEQ ID NO: 23 que codifica a seqüência de aminoácido de SEQ ID NO: 24), com Nco I. O fragmento de 1243 bp resultante foi isolado em um gel agarose a 1,0% usando tampão TAE e purificado usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante.
O vetor de expressão pSMail35 foi digerido com Neo I e um fragmento de 8286 bp foi isolado em um gel agarose a 1,0% usando tampão TAE e purificado usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante. O fragmento de variante BG41 de beta- glucosidase de 1243 bp Nco I de Aspergillus oryzae digerido foi então ligado no vetor 8286 bp, usando T4 DNA ligase (Roche, Indianápolis, IN, USA) de acordo com o protocolo de fabricação, para criar o vetor de expressão pSMail40 (figura 10). Plasmídeo pSMail40 compreende o promotor de gene de celobiohidrolase I (CEL7A) de Trichoderma reesei e terminador ligado operativamente na seqüência de sinal de endoglucanase V de Humieola insolens e a seqüência de codificação mature variante de beta-glucosidase de Aspergillus oryzae.
Exemplo 8: Transformação de RutC30 de Trichoderma reesei com pSMail40
Plasmídeo pSMail40 foi linearizado com Pme I e transformado na cepa de RutC30 de Trichoderma reesei como descrito no exemplo 6. Um total de 100 transformantes foram obtidos a partir de quatro experimentos de transformação independentes, todos sendo cultivados em frascos de agitação em meio induzindo celulase, e a atividade de beta- glucosidase foi medida a partir do meio de cultura dos transformantes como descrito no exemplo 6. Um número de transformantes de SMA140 de Trichoderma reesei mostrou atividades de beta-glucosidase várias vezes maiores do que a de RutC30 de Triehoderma reesei.
A presença da proteína de variante BG41 de beta-glucosidase de Aspergillus oryzae no meio de cultura foi detectada por eletroforese de gel de SDS-poliacrilamida como descrito no exemplo 6 e a coloração Coomassie dos mesmos 13 sobrenadantes de cultura dos quais as atividades de enzimas foram analisadas. Todos os treze transformantes que têm atividade de β- glucosidase elevada, também expressaram a variante BG41 de aproximadamente 110 KDa de beta-glucosidase de Aspergillus oryzae, em rendimentos variados.
O transformante expressando variante de beta-glucosidase maior, como avaliado por teste de atividade de beta-glucosidase e eletroforese gel de SDS-poliacrilamida, foi designado SMAl 40-43 Trichoderma reesei. Exemplo 9: Construção de vetor de expressão pSaMe-Fl
Um fragmento de DNA contendo 209 bp do promotor de gene de celobiohidrolase I de Trichoderma reesei e a região do núcleo (nucleotídeos 1 a 702 de SEQ ID NO: 1 que codifica aminoácidos 1 a 234 de SEQ ID NO: 2; WO 91/17243) do gene de endoglucanase V de Humieola insolens foi amplificado por PCR usando pMJ05 como gabarito usando os iniciadores mostrados abaixo. 995103:
5'-cccaagcttagccaagaaca-3' (SEQ ID NO: 67) 995137:
5'-gggggaggaacgcatgggatctggacggc-3' (SEQ ID NO: 68)
As reações de amplifícação (50 μΐ) foram compostas de tampão de amplifícação IX Pfic, 10 mM de dNTPs, 50 mM de MgSO4, 10 ng/μΐ de pMJ05, 50 picomoles de iniciador 995103, 50 picomoles de iniciador 995137, e 2 unidades de Pfic DNA polimerase. As reações foram incubadas em um EPPENDORF® MASTERCYCLER® 5333 programado para 30 ciclos cada durante 30 segundos a 94°C, 30 segundos a 55°C, e 60 segundos a 72°C (extensão final de 3 minutos).
Os produtos de reação foram isolados em um gel agarose a 1,0% usando tampão TAE onde uma banda de produto de 911 bp foi excisada do gel e purificada usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante.
Um fragmento de DNA contendo 806 bp do gene de variante BG41 de beta-glucosidase de Aspergillus oryzae foi PCR amplificado usando pSMail40 como gabarito e os iniciadores mostrados abaixo. 995133:
5'-gccgtccagatccccatgcgttcctccccc-3' (SEQ ID NO: 69) 995111:
5'-ccaagcttgttcagagtttc-3' (SEQ ID NO: 70)
As reações de amplifícação (50 μΐ) foram compostas de tampão de amplifícação IX Pfic, 10 mM de dNTPs, 50 mM MgSO4, 100 ng de pSMail40, 50 picomoles de iniciador 995133, 50 picomoles de iniciador 995111, e 2 unidades de Pfx DNA polimerase. As reações foram incubadas em um EPPENDORF® MASTERCYCLER® 5333 programado para 30 ciclos cada durante 30 segundos a 94°C, 30 segundos a 55°C, e 120 segundos a 72°C (extensão final de 3 minutos).
Os produtos de reação foram isolados em um gel agarose a 1,0% usando tampão TAE onde uma banda de produto de 806 bp foi excisada do gel e purificada usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante.
Os dois fragmentos PCR acima foram então submetidos a PCR de sobreposição. Os fragmentos de sobreposição purificados foram usados como gabaritos para amplificação usando iniciador 995103 (sentido) e iniciador 995111 (anti-sentido) descritos acima para precisamente fusionar o fragmento de 702 bp compreendendo 209 bp do promotor de gene de celobiohidrolase I de Trichoderma reesei e a seqüência de núcleo de endoglucanase V de Humicola insolens para o fragmento de 806 bp compreendendo uma porção da região de codificação de variante BG41 de beta-glucosidase de Aspergillus oryzae por PCR de sobreposição.
As reações de amplificação (50 μΐ) foram compostas de tampão de amplificação YXPfici 10 mM de dNTPs, 50 mM de MgSO4, 2,5 μΐ de cada fragmento (20 ng/μΐ), 50 picomoles de iniciador 995103, 50 picomoles de iniciador 995111, e 2 unidades de Pfic DNA polimerase de alta fidelidade. As reações foram incubadas em um EPPENDORF® MASTERCYCLER® 5333 programado para uma desnaturação inicial de 3 minutos a 95°C seguido por 30 ciclos cada durante 1 minuto de desnaturação, 1 minuto anelando a 60°C, e uma extensão de 3 minutos a 72°C.
Os produtos de reação foram isolados em um gel agarose a 1,0% usando tampão TAE onde uma banda de produto de 1,7 kb foi excisada do gel e purificada usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante.
O fragmento de 1,7 kb foi ligado em um vetor de pCR®4 Blunt (Invitrogen, Carlsbad, CA, USA) de acordo com as instruções do fabricante. A construção foi então transformada em células E. eoli ONE SHOT® TOPlO quimicamente competentes (Invitrogen, Carlsbad, CA, USA) de acordo com o procedimento de transformação de produtos químicos rápido do fabricante. Colônias foram selecionadas e analisadas por isolamento de plasmídeo e digestão com Hind III para liberar o fragmento PCR de sobreposição de 1,7 kb.
Plasmídeo pSMaiHO também foi digerido com Hind III para linearizar o plasmídeo. Ambos fragmentos digeridos foram combinados em uma reação de ligação usando um kit de ligação de DNA rápido seguindo as instruções do fabricante para produzir pSaMe-Fl (figura 11).
Células competentes de E. coli XLl-Blue Subcloning-Grade (Stratagene, La JoIIa, CA, USA) foram transformadas com o produto de ligação. A identidade da construção foi confirmada por Sequencimento de DNA do promotor de gene de celobiohidrolase I de Trichoderma reesei, seqüência de sinal de endoglucanase V de Humieola insolens, núcleo de endoglucanase V de Humieola insolens, seqüência de sinal de endoglucanase V de Humieola insolens, variante de BG41 de beta-glucosidase de Aspergillus oryzae, e a seqüência de terminador de gene de celobiohidrolase I de Triehoderma reesei de plasmídeos purificados de E. coli transformados. Um clone contendo o plasmídeo recombinante foi designado pSaMe-Fl. Plasmídeo pSaMe-Fl compreende o promotor de gene de celobiohidrolase I de Trichoderma reesei e terminador e a seqüência de peptídeo de sinal de endoglucanase V de Humieola insolens ligado diretamente no polipeptídeo de núcleo de endoglucanase V de Humieola insolens que são diretamente fusionados no peptídeo de sinal de endoglucanase V de Humieola insolens que é diretamente ligado na seqüência de codificação madura de variante BG41 de beta-glucosidase de Aspergillus oryzae. A seqüência de DNA e a seqüência de aminoácido deduzidas da proteína de fusão de variante BG de beta-glucosidase de Aspergillus oryzae são mostradas em SEQ ID NOs: 73 e 74, respectivamente (ver figuras 14A, 14B, 14C, e 14D). Exemplo 10: Transformação de RutC30 de Trichoderma reesei com pSaMe-Fl
Frascos de agitação contendo 25 ml de meio YP suplementado com 2% de glicose e 10 raM de uridina foram inoculados com 5 X IO7 esporos de RutC30 de Trichoderma reesei. Seguindo incubação durante a noite durante aproximadamente 16 horas a Il0C, 90 rpm, os micélios foram coletados usando um sistema de filtração descartável acionado por vácuo. Os micélios foram lavados duas vezes em 100 ml de água deionizada e duas vezes em 1,2 M de sorbitol. Protoplastos foram gerados como descrito em exemplo 6.
Duas microgramas de pSaMe-Fl DNA linearizado com Pme 1, 100 μΐ de protoplastos de RutC30 de Triehoderma reesei, e 50% de PEG (4000) foram misturados e incubados durante 30 minutos em temperatura ambiente. Então 3 ml de STC foram adicionados e os conteúdos foram despejados sobre uma placa COVE suplementada com 10 mM de uridina. A placa foi então incubada a 28°C. Transformantes começaram a aparecer pelo dia 6 e foram tirados das placas COVE2 durante crescimento a 28°C e 6 dias. Vinte e dois transformantes de Triehoderma reesei foram recuperados.
Transformantes foram cultivados em frascos de agitação em meio induzindo celulase, e atividade de beta-glucosidase foi medida como descrito no exemplo 6. Um número de transformantes pSaMe-Fl produziu atividade de beta-glucosidase. Um transformante, designado de Triehoderma reesei SaMeF 1-9, produziu a quantidade maior de beta- glucosidase, e tem duas vezes a atividade de uma cepa expressando a variante de beta- glucosidase de Aspergillus oryzae (exemplo 9).
A atividade de endoglucanase foi testada usando um teste de deposição de carboximetil celulose (CMC), de acordo com Beguin, 1983, Analytical Biochem. 131(2): 333 - 336. Cinco μg de proteína total dentre as cinco amostras do caldo (as tendo a atividade de beta-glucosidase maior) foram diluídos em tampão de amostra nativo (Bio-Rad, Hercules, CA, USA) e ciclados em um gel Tris-HCl CRITERION® 8-16% (Bio-Rad, Hercules, CA, USA) usando IOX de tampão de ciclo Tris/glicina (Bio-Rad, Hercules, CA, USA) e então o gel foi depositado no topo de uma placa contendo 1% de carboximetilcelulose (CMC). Após 1 hora de incubação a 37°C, o gel foi colorido com 0,1% Congo Red durante 20 minutos. A placa foi então descolorida usando 1 M de NaCl a fim de identificar regiões de depuração indicativas de atividade de endoglucanase. Duas zonas de depuração foram visíveis, uma zona superior a aproximadamente 110 kDa e uma zona inferior a aproximadamente 25 kDa. O tamanho de proteína previsto da fusão de variante BG41 de endoglucanase V de Humicola insolens e beta-glucosidase de Aspergillus oryzae é de 118 kDa se as duas proteínas não forem clivadas e permanecerem como um polipeptídeo único, glicosilação do domínio do núcleo de endoglucanase V individual e dos fios de beta-glucosidase para migração das proteínas individuais em um maior peso molecular do que previsto a partir da seqüência primária. Se as duas proteínas são clivadas então os tamanhos previstos para o domínio de núcleo de endoglucanase V de Humieola insolens é de 24 kDa e 94 kDa para variante BG41 de beta- glucosidase de Aspergillus oryzae. Porque se tem uma zona de depuração em aproximadamente 110 kDa, este resultado indicou que minimamente uma população da proteína de fusão de endoglucanase e beta-glucosidase permanece intacta como uma proteína grande única. A zona de depuração inferior representa, o mais provavelmente, uma atividade de endoglucanase endógena, e possivelmente adicionalmente resulta de clivagem parcial do domínio do núcleo de endoglucanase V de Humieola insolens a partir de β- glucosidase de Aspergillus oryzae.
Os resultados demonstraram que o núcleo de endoglucanase V de Humieola insolens estava ativo mesmo enquanto fusionado a beta- glucosidase de Aspergillus oryzae. Além disso, o aumento em atividade de beta-glucosidase pareceu resultar de secreção aumentada de proteína com relação à eficiência de secreção da beta-glucosidase não fusão. Por ligação da seqüência de variante BG41 de beta-glucosidase de Aspergillus oryzae para o núcleo de endoglucanase V de Humicola insolens eficientemente secretado, mais beta-glucosidase foi secretada. Exemplo 11: Construção de vetor pSaMe-FX
Plasmídeo pSaMe-FX foi construído por modificação de pSaMe-F 1. Plasmídeo pSaMe-Fl foi digerido com Bst Zl7 e Eco RI para gerar um fragmento de 1 kb que continha a seqüência de codificação de variante BG41 de beta-glucosidase e um fragmento de 9,2 kb contendo o restante do plasmídeo. Os fragmentos foram separados em um gel agarose a 1,0% usando tampão TAE e o fragmento de 9,2 kb foi excisado e purificado usando um kit de extração de gel QIAQUICK® de acordo com as instruções do fabricante. Plasmídeo pSMail35 também foi digerido com Bst Zl7 e Eco RI para gerar um fragmento de 1 kb contendo bases homólogas à seqüência de codificação de variante BG41 de beta-glucosidase de Aspergillus oryzae e um fragmento de 8,5 kb contendo o restante do plasmídeo. O fragmento de 1 kb foi isolado e purificado como acima.
Os fragmentos de 9,2 kb e 1 kb foram combinados em uma reação de ligação usando um kit de ligação de DNA rápido seguindo as instruções do fabricante para produzir pSaMe-FX, que é idêntico para pSaMe- Fl exceto que continha a seqüência de codificação madura de beta- glucosidase de tipo selvagem em vez de uma seqüência de codificação madura variante.
Células competentes de E. eoli SURE® (Stratagene, La Jolla, CA, USA) foram transformadas com o produto de ligação. A identidade da construção foi confirmada por sequenciamento de DNA do promotor de gene de celobiohidrolase I de Trichoderma reesei, seqüência de sinal de endoglucanase V de Humicola insolens, seqüência de núcleo de endoglucanase V de Humicola insolens, seqüência de sinal de endoglucanase V de Humicola insolens, seqüência de codificação madura de beta- glucosidase de Aspergillus oryzae, e a seqüência de terminador de gene de celobiohidrolase I de Trichoderma reesei de plasmídeos purificados a partir de E. coli transformado. Um clone contendo o plasmídeo recombinante foi designado pSaMe-FX (figura 12). A seqüência de DNA e a seqüência de aminoácido deduzidas da proteína de fusão de beta-glucosidase de Aspergillus oryzae são mostradas nas SEQ ID NOs: 75 e 76, respectivamente (ver figuras 15A, 15B, 15C, e 15D). Exemplo 12: Transformação e expressão de transformantes Trichoderma
A construção de pSaMe-FX foi linearizada com Pme I e transformada na cepa RutC30 de Triehoderma reesei como descrito no exemplo 10. Um total de 63 transformantes foi obtido a partir de uma transformação única. Os transformantes foram cultivados em frascos de agitação em meio induzindo celulase, e atividade de beta-glucosidase foi medida como descrito no exemplo 6. Um número de transformantes pSaMe- FX produziu atividade de beta-glucosidase. Um transformante designado SaMe-FX 16 produziu duas vezes a quantidade de atividade de beta- glucosidase comparado a SaMeF 1-9 de Trichoderma reesei (exemplo 10). Exemplo 13: Análise de transformantes de Trichoderma reesei
Uma proteína de fusão foi construída como descrito no exemplo 9 por fusão do núcleo de endoglucanase V de Humieola insolens (contendo sua seqüência de sinal própria nativa) com a seqüência de codificação madura de variante BG41 de beta-glucosidase de Aspergillus oryzae ligada à seqüência de sinal de endoglucanase V de Humieola insolens. Esta construção de fusão resultou em um aumento de duas vezes em atividade de beta-glucosidase secretada comparado à seqüência de codificação madura de variante BG41 de beta-glucosidase de Aspergillus oryzae ligada à seqüência de sinal de endoglucanase V de Humieola insolens. Uma segunda construção de fusão foi feita como descrito no exemplo 11 consistindo do núcleo de endoglucanase V de Humicola insolens (contendo sua seqüência de sinal própria) fusionado com a seqüência de codificação de beta-glucosidase de tipo selvagem de Aspergillus oryzae ligada à seqüência de sinal de endoglucanase V de Humieola insolens, e isto levou a uma melhora ainda maior na atividade de beta-glucosidase. A cepa transformada com a fusão de tipo selvagem tem duas vezes a atividade de beta-glucosidase secretada relativa à cepa transformada com a fusão de variante BG41 de beta- glucosidase.
Exemplo 14: Clonagem da seqüência de codificação de proteína de fusão de beta-glucosidase em um vetor de expressão de Aspergillus oryzae
Dois iniciadores de oligonucleotídeo sintéticos, mostrados abaixo, foram designados para amplificar PCR a matriz de leitura aberta de comprimento completo de pSaMeFX codificando a proteína de fusão de beta- glucosidase.
Iniciador dianteiro PCR:
5'-GGACTGCGCAGCATGCGTTC-3' (SEQ ID NO: 71) Iniciador reverso PCR:
5-AGTTAATTAATTACTGGGCCTTAGGCAGCG-3' (SEQ ID NO: 72)
As letras em negrito representam a seqüência de codificação.
0 "G" sublinhado no iniciador dianteiro representa uma mudança de base introduzida para criar o sítio de restrição Sph I. A seqüência restante contém a identidade de seqüência comparada com os sítios de inserção de pSaMeFX. A seqüência sublinhada no iniciador reverso representa um sítio de restrição Pac
1 adicionado para facilitar a clonagem deste gene no vetor de expressão pAILo2 (WO 04/099228).
Cinqüenta picomoles de cada dos iniciadores acima foram usados em uma reação de PCR contendo 50 ng de pSaMeFX DNA, IX de tampão de amplificação Pfic, 6 μΐ de 10 mM de mistura de dATP, dTTP, dGTP, e dCTP, 2,5 unidades de PLATINUM® Pfa DNA Polimerase, e 1 μΐ de 50 mM de MgSO4 em um volume final de 50 μΐ. Um EPPENDORF® MASTERCYCLER® 5333 foi usado para amplificar o fragmento programado durante 1 ciclo a 98°C durante 2 minutos; e 35 ciclos cada a 96°C durante 30 segundos, 610C durante 30 segundos, e 68°C durante 3 minutos. Após os 35 ciclos, a reação foi incubada a 68°C durante 10 minutos e então resfriada a IO0C até ser ainda processado. Um produto de reação de PCR de 3,3 kb foi isolado em um GTG-agarose a 0,8% (Cambrex Bioproducts One Meadowlands Plaza East Rutherford, NJ, USA) usando tampão TAE e 0,1 μg de brometo de etídio por ml. O DNA foi visualizado com o auxiliar de um DARK READER™ (Clare Chemical Research, Dolores, CO, USA) para evitar mutações induzidas por UY. Uma banda de DNA de 3,3 kb foi excisada com uma lâmina de barbear descartável e purificada com um copo de girar ULTRAFREE®-DA (Millipore, Billerica, MA, USA) de acordo com as instruções do fabricante.
O produto PCR de 3,3 kb purificado foi clonado em um vetor de pCR®4B lunt-TOPO® (Invitrogen, Carlsbad, CA, USA). Quatro microlitros do produto PCR purificado foram misturados com 1 μΐ de uma solução de 2 M de cloreto de sódio e 1 μΐ do vetor TOPO®. A reação foi incubada em temperatura ambiente durante 15 minutos e então 2 μΐ da reação foram usados para transformar células de E. coli One Shot® TOPlO quimicamente competentes, de acordo com as instruções do fabricante. Três alíquotas de 83 μΐ cada da reação de transformação foram espalhadas sobre as três placas de 150 mm 2X YT suplementadas com 100 μg de ampicilina por ml e incubadas durante a noite a 37°C.
Oito colônias recombinantes foram usadas para inocular culturas líquidas contendo 3 ml de meio LB suplementado com 100 μg de ampicilina por ml. DNA de plasmídeo foi preparado a partir destas culturas usando um BIOROBOT® 9600 (QIAGEN Inc., Valencia, CA, USA). Clones foram analisados por digestão de enzima de restrição com Pac I. DNA de plasmídeo de cada clone foi digerido com Pac I e analisado por eletroforese de gel agarose a 1,0% usando tampão TAE. Todos os oito clones têm o padrão de digestão de restrição esperado e clones 5, 6, 7, e 8 foram selecionados para serem sequenciados para confirmar que não se tem mutações no inserto clonado. Análise de seqüência de suas extremidades 5' e 3' indicam que todos os 4 clones têm a seqüência correta. Os clones 5 e 7 foram selecionados para outro sequenciamento. Ambos os clones foram sequenciados para valores Phred Q maiores do que 40 para assegurar que não se tem erros induzidos por PCR. Os clones 5 e 7 foram mostrados como tendo a seqüência esperada e o clone 5 foi selecionado para re-clonagem em pAILo2.
DNA de plasmídeo de clone 5 foi linearizado por digestão com Sph I. O clone linearizado foi então terminado de modo cego por adição de 1,2 μΐ de uma mistura a 10 mM de dATP, dTTP, dGTP, e dCTP e 6 unidades de T4 DNA polimerase (New England Bioloabs, Inc., Ipswich, MA, USA). A mistura foi incubada a 12°C durante 20 minutos e então a reação foi parada por adição de 1 μΐ de 0,5 M de EDTA e aquecimento a 75°C durante 20 minutos para inativar a enzima. Um fragmento de 3,3 kb codificando a proteína de fusão de beta-glucosidase foi purificado por eletroforese gel e ultrafiltração como descrito acima.
O vetor pAILo2 foi linearizado por digestão com Nco I. O vetor linearizado foi então terminado cego por adição de 0,5 μΐ de uma mistura a 10 mM de dATP, dTTP, dGTP, e dCTP e uma unidade de DNA polimerase I. A mistura foi incubada a 25°C durante 15 minutos e então a reação foi parada por adição de 1 μΐ de 0,5M de EDTA e aquecimento a 750C durante 15 minutos para inativar as enzimas. Então o vetor foi digerido com Pae I. O vetor terminado de modo cego foi purificado por gel de eletroforese e ultrafiltração como descrito acima. Clonagem do fragmento de 3,3 kb codificando a proteína de fusão de beta-glucosidase no vetor pAILo2 linearizado e purificado foi realizada com um kit de ligação rápido. Uma amostra de 1 μΐ da reação foi usada para transformar as células de E. coli XLlO SOLOPACK® Gold (Stratagene, La Jolla, CA, USA) de acordo com as instruções do fabricante. Após o período recuperado, duas alíquotas de 100 μΐ de uma reação de transformação foram colocadas sobre duas placas de 150 mm 2X YT suplementadas com 100 μg de ampicilina por ml e incubadas durante a noite a 37°C. Um conjunto de oito clones recombinantes putativos foi selecionado de modo aleatório dentre as placas de seleção e DNA de plasmídeo foi preparado dentre cada um usando um BIOROBOT® 9600. Os clones 1-4 foram selecionados para sequenciamento com iniciadores pAILo2 específicos para confirmar que a junção vetor/inserto apresenta a seqüência correta. O clone 3 tem uma junção de vetor/inserto perfeita e foi designado pAILo47 (figura 13). A fim de criar uma cepa de expressão isenta de marcador, uma
digestão de endonuclease de restrição foi realizada para separar o gene blaA que confere resistência ao antibiótico ampicilina dentre o resto da construção de expressão. Trinta microgramas de pAILo47 foram digeridos com Pme I. O DNA digerido foi então purificado por eletroforese gel agarose como descrito acima. Uma banda de DNA de 6,4 kb contendo a construção de expressão mas faltando o gene blaA foi excisada com uma lâmina de barbear e purificada com um kit de extração de gel QIAQUICK®. Exemplo 15: Expressão da proteína de fusão de beta-glucosidase em JaL355 de Aspergillus oryzae Protoplastos de JaL355 de Aspergillus oryzae (WO
00/240694) foram preparados de acordo com o método de Christensen et al., 1988, Bio/Technology 6: 1419 - 1422. Dez microlitros da construção de expressão purificado de exemplo 14 foram usados para transformar protoplastos de JaL355 de Aspergillus oryzae. A transformação de JaL355 de Aspergillus oryzae rendeu aproximadamente 90 transformantes. Cinqüenta transformantes foram isolados para placas de PDA individuais e incubados durante cinco dias a 34°C.
Quarenta e oito placas de esporos confluentes foram lavadas com 3 ml de 0,01% de TWEEN® 80 e a suspensão de esporo foi usada para inocular 25 ml de meio MDU2BP em 125 ml de frascos de agitação de vidro. Culturas transformantes foram incubadas a 34°C com agitação constante a 200 rpm. Após 5 dias, 1 ml de alíquotas de cada cultura foi centrifugado a 12.000 xge seus sobrenadantes coletados. Cinco μΐ de cada sobrenadante foram misturados com um volume igual de tampão de carga 2X (10% de beta- mercaptoetanol) e carregados sobre um gel SDS-PAGE 1,5 mm 8%-16 % Tris-glicina e coloridos com coloração de proteína tipo BIO-SAFE® Coomassie Blue G250 (Bio-Rad, Hercules, CA, USA). Os perfis de SDS- PAGE dos caldos de cultura mostraram que 33 dentre os 48 transformantes foram capazes de expressar uma proteína nova com um peso molecular aparente muito próximo do esperado de 118 kDa. Transformante 21 produziu o melhor rendimento e foi selecionado para outros estudos. Exemplo 16: Isolamento de esporo único de transformante 21 de JaL355 de Aspergillus oryzae
Os esporos do transformante 21 de JaL355 de Aspergillus oryzae foram espalhados sobre uma placa de PDA e incubados durante cinco dias a 34°C. Uma pequena área da placa de esporo confluente foi lavada com 0,5 ml de 0,01% de TWEEN® 80 para recolocar em suspensão os esporos. Uma alíquota de 100 μΐ da suspensão de esporo foi diluída em um volume final de 5 ml com 0,01% de TWEEN® 80. Com o auxílio de um hemocitômetro, a concentração de esporo foi determinada e diluída em uma concentração final de 0,1 esporos por microlitro. Uma alíquota de 200 μΐ da diluição de esporo foi espalhada sobre 150 mm de placas de meio mínimo e incubada durante 2-3 dias a 34°C. As colônias emergindo foram excisadas dentre as placas e transferidas para placas de PDA e incubadas durante 3 dias a 34°C. Então os esporos foram espalhados através das placas e incubados novamente durante 5 dias a 34°C.
As placas de esporos confluentes foram lavadas com 3 ml de 0,01% de TWEEN® 80 e a suspensão de esporo foi usada para inocular 25 ml de meio MDU2BP em 125 ml de frascos de agitação de vidro. As culturas de esporos únicas foram incubadas a 34°C com agitação constante a 200 rpm. Após 5 dias, uma alíquota de 1 ml de cada cultura foi centrifugada a 12.000 χ g e seus sobrenadantes coletados. Cinco μΐ de cada sobrenadante foram misturados com um volume igual de tampão de carga 2X (10% de beta- mercaptoetanol) e carregados sobre um gel de SDS-PAGE 1,5 mm 8%-16% Tris-glicina e coloridos com coloração de proteína ΒΙΟ-SAFE® Commassie Blue G250. Os perfis de SDS-PAGE dos caldos de cultura mostraram que todos os oito transformantes foram capazes de expressar a proteína de fusão de beta-glucosidase em muitos níveis elevados e uma das culturas designada JaL355AILo47 de Aspergillus oryzae produziu o melhor rendimento.
A invenção descrita e reivindicada aqui não é limitada em escopo pelos aspectos específicos aqui descritos, porque estes aspectos se destinam a ser ilustrações de vários aspectos da invenção. Quaisquer aspectos equivalentes se destinam a estar dentro do escopo da invenção. De fato, várias modificações da invenção além das mostradas e aqui descritas serão evidentes para os versados na arte da descrição acima. Estas modificações também se destinam a estar dentro do escopo das reivindicações anexas. No caso de conflito, a presente descrição incluindo as definições será o controle.
Várias referências são citadas aqui, cujas descrições são incorporadas por referência em suas totalidades LISTAGEM DE SEQUENCIA
<110> Novozymes, Inc.
<120> Métodos para aumentar secreção de polipeptideos tendo atividade
biológica
<130> 10916.204-W0
<150> US 60/832,511
<151> 2006-07-21
<160> 76
<170> PatentIn version 3.4 <210> 1 <211> 923 <212> DNA
<213> Humicola insolens <400> 1
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120 aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180 gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240 accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300 agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360 gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420 ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480 ggcggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540 cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600 ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660 cgccgcaacg acgacggcaa cttccctgcc gtccagatcc cctccagcag caccagctct 720 ccggtcaacc agcctaccag caccagcacc acgtccacct ccaccacctc gagcccgcca 780 gtccagccta cgactcccag cggctgcact gctgagaggt gggctcagtg cggcggcaat 840 ggctggagcg gctgcaccac ctgcgtcgct ggcagcactt gcacgaagat taatgactgg 900 taccatcagt gcctgtagaa ttc 923
<210> 2 <211> 305 <212> PRT
<213> Humicola insolens <400> 2
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln 65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe 145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val 195 200 205 235
Thr Ser Thr Ser Thr Thr 250
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly 210 215 Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Ser 225 230
Pro Val Asn Gln Pro 245
Ser Ser Pro Pro Val Gln Pro Thr Thr Pro Ser
260 265
Arg Trp Ala Gln Cys Gly Gly Asn Gly Trp Ser
275 280
Val Ala Gly Ser Thr Cys Thr Lys Ile Asn Asp 290 295
Leu 305
<210> 3 <211> 1188 <212> DNA
<213> Myceliophthora thermophila <400> 3
cgacttgaaa cgccccaaat gaagtcctcc atcctcgcca gtggctcaaa gtggtccgtg gcagcaatgt ggtggcatcg tgtgtgtcgg gctaccactg cgtctaccag aacgattggt gcggcgtcga caacgctgca gacatcgacc acgtccaggc cctccgtcgt ccaccacctc gcctagcaag ggcaagctga tcgggcgccg agttcgggga gggcaattac cccggcctct ccgtcgactt cggcgattca gacgctcatc aatgatggat ttctcgatgg agcgtctggt gcccaaccag ttgacgtcgt cgcaacctga ccgaggtggt caacttcgtg acgaacgcgg ccgcacaact acggccggta ctacggcaac atcatcacgg ttctggacca acctggccaa gcagttcgcc tccaactcgc aacgagtaca acacgatgga ccagaccctg gtgctcaacc ggcatccggg ccgccggcgc gacctcgcag tacatcttcg ggggcctgga gctggaacac gaccaacacc aacatggccg aagatcgtgt acgagatgca ccagtacctc gactcggaca tgcgtcagca gcaccatcgg cgcccagcgc gtcgtcggag aacggcaagc tcggcgtcct cggcgagttc gccggcggcg gccgtcaccg gcctcctcga ccacctccag gacaacagcg tggtgggccg ccggtccctg gtggggcgac tacatgtact accggctatg tcaactacaa ctcgatcttg aagaagtact <210> 4 <211> 389 <212> PRT
<213> Myceliophthora thermophila <400> 4
Met Lys Ser Ser I] 1 5
Cys Arg Arg Asn Asp 220
Ser Ser Thr Ser Ser 240
Ser Thr Ser Thr Thr 255
Gly Cys Thr Ala Glu 270
Gly Cys Thr Thr Cys 285
Trp Tyr His Gln Cys 300
gcgtcttcgc gatggcaagg acagccagtg ccaccgccac agtggctcgg ggggcaagca acaacatctt ccttcgacca gcaagtacgc acacgaacgc tcgtcatctt tcaaccaggc tcgagggcaa ccctgacgga gctcgggcac ccacccagtg ccaacgccgt acgtctggct cgttcgagcc tgccgtaa
cacgggcgcc atcgaccgac cgtgcctggc cagcaccgcc cagcaacgag cttcatcttc ccggatcgac gggttacctc cgtcctggac gttccggacc cgacaccaac cgccatcgac cgcgtggagc cccgcagaac ccacgccgag gctccgcgcc ctgccagcag gggtgccctc tccttcgggc
Gln Ser Gly Pro 20 Thr Asp Cys Val 35 Ser Gln Cys Val 50 Thr Ser Arg Pro 65 Ser Pro Ser Lys Ala Glu Phe Gly 100 Ile Phe Pro Ser 115 Asn Ile Phe Arg 130 Leu Thr Ser Ser
55
70
Jly Lys Í5
Ser Val Phe Ala Thr Gly Ala Val Ala 10 15 Cys Gly Gly Ile Gly Trp Gln Gly Ser 25 30 His Cys Val Tyr Gln Asn Asp Trp Tyr 40 45 Ala Ser Thr Thr Leu Gln Thr Ser Thr 60 Ser Thr Ala Pro Pro Ser Ser Thr Thr 75 80 Lys Trp Leu Gly Ser Asn Glu Ser Gly 90 95 Tyr Pro Gly Leu Trp Gly Lys His Phe 105 110 Ile Gln Thr Leu Ile Asn Asp Gly Tyr 120 125 Ser Met Glu Arg Leu Val Pro Asn Gln
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1188
135 140
Leu Thr Ser Ser Phe Asp Gln Gly Tyr Leu Arg Asn Leu Thr Glu Val 145 150 155 160
Val Asn Phe Val Thr Asn Ala Gly Lys Tyr Ala Val Leu Asp Pro His 165 170 175 Asn Tyr Gly Arg Tyr Tyr Gly Asn Ile Ile Thr Asp Thr Asn Ala Phe 180 185 190 Arg Thr Phe Trp Thr Asn Leu Ala Lys Gln Phe Ala Ser Asn Ser Leu 195 200 205 Val Ile Phe Asp Thr Asn Asn Glu Tyr Asn Thr Met Asp Gln Thr Leu 210 215 220 Val Leu Asn Leu Asn Gln Ala Ala Ile Asp Gly Ile Arg Ala Ala Gly 225 230 235 240 Ala Thr Ser Gln Tyr Ile Phe Val Glu Gly Asn Ala Trp Ser Gly Ala 245 250 255 Trp Ser Trp Asn Thr Thr Asn Thr Asn Met Ala Ala Leu Thr Asp Pro 260 265 270 Gln Asn Lys Ile Val Tyr Glu Met His Gln Tyr Leu Asp Ser Asp Ser 275 280 285 Ser Gly Thr His Ala Glu Cys Val Ser Ser Thr Ile Gly Ala Gln Arg 290 295 300 Val Val Gly Ala Thr Gln Trp Leu Arg Ala Asn Gly Lys Leu Gly Val 305 310 315 320 Leu Gly Glu Phe Ala Gly Gly Ala Asn Ala Val Cys Gln Gln Ala Val 325 330 335 Thr Gly Leu Leu Asp His Leu Gln Asp Asn Ser Asp Val Trp Leu Gly 340 345 350 Ala Leu Trp Trp Ala Ala Gly Pro Trp Trp Gly Asp Tyr Met Tyr Ser 355 360 365 Phe Glu Pro Pro Ser Gly Thr Gly Tyr Val Asn Tyr Asn Ser Ile Leu 370 375 380 Lys Lys Tyr Leu Pro
385
<210> 5 <211> 1232 <212> DNA
<213> Myceliophthora thermophila <400> 5
ggatccactt agtaacggcc gccagtgtgc tggaaagcat gaagtctctc ttcctgtcac 60
ttgtagcgac cgtcgcgctc agctcgccag tattctctgt cgcagtctgg gggcaatgcg 120 gcggcattgg cttcagcgga agcaccgtct gtgatgcagg cgccggctgt gtgaagctca 180 acgactatta ctctcaatgc caacccggcg ctcccactgc tacatccgcg gcgccaagta 240 gcaacgcacc gtccggcact tcgacggcct cggccccctc ctccagcctt tgctctggca 300 gccgcacgcc gttccagttc ttcggtgtca acgaatccgg cgcggagttc ggcaacctga 360 acatccccgg tgttctgggc accgactaca cctggccgtc gccatccagc attgacttct 420 tcatgggcaa gggaatgaat accttccgta ttccgttcct catggagcgt cttgtccccc 480 ctgccactgg catcacagga cctctcgacc agacgtactt gggcggcctg cagacgattg 540 tcaactacat caccggcaaa ggcggctttg ctctcattga cccgcacaac tttatgatct 600 acaatggcca gacgatctcc agtaccagcg acttccagaa gttctggcag aacctcgcag 660 gagtgtttaa atcgaacagt cacgtcatct tcgatgttat gaacgagcct cacgatattc 720 ccgcccagac cgtgttccaa ctgaaccaag ccgctgtcaa tggcatccgt gcgagcggtg 780 cgacgtcgca gctcattctg gtcgagggca caagctggac tggagcctgg acctggacga 840 cctctggcaa cagcgatgca ttcggtgcca ttaaggatcc caacaacaac gtcgcgatcc 900 agatgcatca gtacctggat agcgatggct ctggcacttc gcagacctgc gtgtctccca 960 ccatcggtgc cgagcggttg caggctgcga ctcaatggtt gaagcagaac aacctcaagg 1020 gcttcctggg cgagatcggc gccggctcta actccgcttg catcagcgct gtgcagggtg 1080 cgttgtgttc gatgcagcaa tctggtgtgt ggctcggcgc tctctggtgg gctgcgggcc 1140 cgtggtgggg cgactactac cagtccatcg agccgccctc tggcccggcg gtgtccgcga 1200 tcctcccgca ggccctgctg ccgttcgcgt aa 1232
<210> 6 <211> 397 <212> PRT
<213> Myceliophthora thermophila <400> 6
Met Lys Ser Leu Phe Leu Ser Leu Val Ala Thr Val Ala Leu Ser Ser 1 5 10 15
Pro Val Phe Ser Val Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe
25 30
Ser Gly Ser Thr Val Cys Asp Ala Gly Ala Gly Cys Val Lys Leu Asn
40 45
Asp Tyr Tyr Ser Gln Cys Gln Pro Gly Ala Pro Thr Ala Thr Ser Ala
50 55 60
Ala Pro Ser Ser Asn Ala Pro Ser Gly Thr Ser Thr Ala Ser Ala Pro 65 70 75 80
Ser Ser Ser Leu Cys Ser Gly Ser Arg Thr Pro Phe Gln Phe Phe Gly
85 90 95
Val Asn Glu Ser Gly Ala Glu Phe Gly Asn Leu Asn Ile Pro Gly Val
100 105 110
Leu Gly Thr Asp Tyr Thr Trp Pro Ser Pro Ser Ser Ile Asp Phe Phe
115 120 125
Met Gly Lys Gly Met Asn Thr Phe Arg Ile Pro Phe Leu Met Glu Arg
130 135 140
Leu Val Pro Pro Ala Thr Gly Ile Thr Gly Pro Leu Asp Gln Thr Tyr 145 150 155 160
Leu Gly Gly Leu Gln Thr Ile Val Asn Tyr Ile Thr Gly Lys Gly Gly
165 170 175
Phe Ala Leu Ile Asp Pro His Asn Phe Met Ile Tyr Asn Gly Gln Thr
180 185 190
Ile Ser Ser Thr Ser Asp Phe Gln Lys Phe Trp Gln Asn Leu Ala Gly
195 200 205
Val Phe Lys Ser Asn Ser His Val Ile Phe Asp Val Met Asn Glu Pro
210 215 220
His Asp Ile Pro Ala Gln Thr Val Phe Gln Leu Asn Gln Ala Ala Val 225 230 235 240
Asn Gly Ile Arg Ala Ser Gly Ala Thr Ser Gln Leu Ile Leu Val Glu
245 250 255
Gly Thr Ser Trp Thr Gly Ala Trp Thr Trp Thr Thr Ser Gly Asn Ser
260 265 270
Asp Ala Phe Gly Ala Ile Lys Asp Pro Asn Asn Asn Val Ala Ile Gln
275 280 285
Met His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Ser Gln Thr Cys
290 295 300
Val Ser Pro Thr Ile Gly Ala Glu Arg Leu Gln Ala Ala Thr Gln Trp 305 310 315 320
Leu Lys Gln Asn Asn Leu Lys Gly Phe Leu Gly Glu Ile Gly Ala Gly
325 330 335
Ser Asn Ser Ala Cys Ile Ser Ala Val Gln Gly Ala Leu Cys Ser Met
340 345 350
Gln Gln Ser Gly Val Trp Leu Gly Ala Leu Trp Trp Ala Ala Gly Pro
355 360 365
Trp Trp Gly Asp Tyr Tyr Gln Ser Ile Glu Pro Pro Ser Gly Pro Ala
370 375 380
Val Ser Ala Ile Leu Pro Gln Ala Leu Leu Pro Phe Ala 385 390 395
<210> 7 <211> 1303 <212> DNA
<213> BASIDIOMYCETE CBS 495.95 <4 00> 7
ggaaagcgtc agtatggtga aatttgcgct tgtggcaact gtcggcgcaa tcttgagcgc 60
ttctgcggcc aatgcggctt ctatctacca gcaatgtgga ggcattggat ggtctgggtc 120 cactgtttgc gacgccggtc tcgcttgcgt tatcctcaat gcgtactact ttcagtgctt 180 gacgcccgcc gcgggccaga caacgacggg ctcgggcgca ccggcgtcaa catcaacctc 24 0 tcactcaacg gtcactacgg ggagctcaca ctcaacaacc gggacgacgg cgacgaaaac 300 aactaccact ccgtcgacca ccacgaccct acccgccatc tctgtgtctg gtcgcgtctg 360 ctctggctcc aggacgaagt tcaagttctt cggtgtgaat gaaagcggcg ccgaattcgg 420 gaacactgct tggccagggc agctcgggaa agactataca tggccttcgc ctagcagcgt 480 ggactacttc atgggggctg gattcaatac attccgtatc accttcttga tggagcgtat 540 gagccctccg gctaccggac tcactggccc attcaaccag acgtacctgt cgggcctcac 600 caccattgtc gactacatca cgaacaaagg aggatacgct cttattgacc cccacaactt 660 catgcgttac aacaacggca taatcagcag cacatctgac ttcgcgactt ggtggagcaa 720 tttggccact gtattcaaat ccacgaagaa cgccatcttc gacatccaga acgagccgta 780 cggaatcgat gcgcagaccg tatacgaact gaatcaagct gccatcaatt cgatccgcgc 840 cgctggcgct acgtcacagt tgattctggt tgaaggaacg tcatacactg gagcttggac 900 gtgggtctcg tccggaaacg gagctgcttt cgcggccgtt acggatcctt acaacaacac 960 ggcaattgaa atgcaccaat acctcgacag cgacggttct gggacaaacg aagactgtgt 1020 ctcctccacc attgggtcgc aacgtctcca agctgccact gcgtggctgc aacaaacagg 1080 actcaaggga ttcctcggag agacgggtgc tgggtcgaat tcccagtgca tcgacgccgt 1140 gttcgatgaa ctttgctata tgcaacagca aggcggctcc tggatcggtg cactctggtg 1200 ggctgcgggt ccctggtggg gcacgtacat ttactcgatt gaacctccga gcggtgccgc 1260 tatcccagaa gtccttcctc agggtctcgc tccattcctc tag 1303
<210> 8 <211> 429 <212> PRT
<213> BASIDIOMYCETE CBS 4 95.95 <400> 8
Met Val Lys Phe Ala Leu Val Ala Thr Val Gly Ala Ile Leu Ser Ala 1S 10 15
Ser Ala Ala Asn Ala Ala Ser Ile Tyr Gln Gln Cys Gly Gly Ile Gly
25 30
Trp Ser Gly Ser Thr Val Cys Asp Ala Gly Leu Ala Cys Val Ile Leu
40 45
Asn Ala Tyr Tyr Phe Gln Cys Leu Thr Pro Ala Ala Gly Gln Thr Thr
50 55 60
Thr Gly Ser Gly Ala Pro Ala Ser Thr Ser Thr Ser His Ser Thr Val 65 70 75 80
Thr Thr Gly Ser Ser His Ser Thr Thr Gly Thr Thr Ala Thr Lys Thr
85 90 95
Thr Thr Thr Pro Ser Thr Thr Thr Thr Leu Pro Ala Ile Ser Val Ser
100 105 110
Gly Arg Val Cys Ser Gly Ser Arg Thr Lys Phe Lys Phe Phe Gly Val
115 120 125
Asn Glu Ser Gly Ala Glu Phe Gly Asn Thr Ala Trp Pro Gly Gln Leu
130 135 140
Gly Lys Asp Tyr Thr Trp Pro Ser Pro Ser Ser Val Asp Tyr Phe Met 145 150 155 160
Gly Ala Gly Phe Asn Thr Phe Arg Ile Thr Phe Leu Met Glu Arg Met
165 170 175
Ser Pro Pro Ala Thr Gly Leu Thr Gly Pro Phe Asn Gln Thr Tyr Leu
180 185 190
Ser Gly Leu Thr Thr Ile Val Asp Tyr Ile Thr Asn Lys Gly Gly Tyr
195 200 205
Ala Leu Ile Asp Pro His Asn Phe Met Arg Tyr Asn Asn Gly Ile Ile
210 215 220
Ser Ser Thr Ser Asp Phe Ala Thr Trp Trp Ser Asn Leu Ala Thr Val 225 230 235 240
Phe Lys Ser Thr Lys Asn Ala Ile Phe Asp Ile Gln Asn Glu Pro Tyr
245 250 255
Gly Ile Asp Ala Gln Thr Val Tyr Glu Leu Asn Gln Ala Ala Ile Asn
260 265 270
Ser Ile Arg Ala Ala Gly Ala Thr Ser Gln Leu Ile Leu Val Glu Gly
275 280 285
Thr Ser Tyr Thr Gly Ala Trp Thr Trp Val Ser Ser Gly Asn Gly Ala
290 295 300
Ala Phe Ala Ala Val Thr Asp Pro Tyr Asn Asn Thr Ala Ile Glu Met 305 310 315 320
His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Asn Glu Asp Cys Val
325 330 335
Ser Ser Thr Ile Gly Ser Gln Arg Leu Gln Ala Ala Thr Ala Trp Leu
340 345 350
Gln Gln Thr Gly Leu Lys Gly Phe Leu Gly Glu Thr Gly Ala Gly Ser 355 360
Asn Ser Gln Cys Ile Asp Ala Val
370 375
Gln Gln Gly Gly Ser Trp Ile Gly 385 390
Trp Trp Gly Thr Tyr Ile Tyr Ser 405
Ile Pro Glu Val Leu Pro Gln Gly 420
<210> 9 <211> 1580 <212> DNA
<213> Thielavia terrestris <400> 9
agccccccgt tcaggcacac ttggcatcag atcagcttag cagcgcctgc acagcatgaa 60
gctctcgcag tcggccgcgc tggcggcact caccgcgacg gcgctcgccg ccccctcgcc 120 cacgacgccg caggcgccga ggcaggcttc agccggctgc tcgtctgcgg tcacgctcga 180 cgccagcacc aacgtttgga agaagtacac gctgcacccc aacagctact accgcaagga 240 ggttgaggcc gcggtggcgc agatctcgga cccggacctc gccgccaagg ccaagaaggt 300 ggccgacgtc ggcaccttcc tgtggctcga ctcgatcgag aacatcggca agctggagcc 360 ggcgatccag gacgtgccct gcgagaacat cctgggcctg gtcatctacg acctgccggg 420 ccgcgactgc gcggccaagg cgtccaacgg cgagctcaag gtcggcgaga tcgaccgcta 480 caagaccgag tacatcgaca gtgagtgctg ccccccgggt tcgagaagag cgtgggggaa 540 agggaaaggg ttgactgact gacacggcgc actgcagaga tcgtgtcgat cctcaaggca 600 caccccaaca cggcgttcgc gctggtcatc gagccggact cgctgcccaa cctggtgacc 660 aacagcaact tggacacgtg ctcgagcagc gcgtcgggct accgcgaagg cgtggcttac 720 gccctcaaga acctcaacct gcccaacgtg atcatgtacc tcgacgccgg ccacggcggc 780 tggctcggct gggacgccaa cctgcagccc ggcgcgcagg agctagccaa ggcgtacaag 840 aacgccggct cgcccaagca gctccgcggc ttctcgacca acgtggccgg ctggaactcc 900 tggtgagctt ttttccattc catttcttct tcctcttctc tcttcgctcc cactctgcag 960 ccccccctcc cccaagcacc cactggcgtt ccggcttgct gactcggcct ccctttcccc 1020 gggcaccagg gatcaatcgc ccggcgaatt ctcccaggcg tccgacgcca agtacaacaa 1080 gtgccagaac gagaagatct acgtcagcac cttcggctcc gcgctccagt cggccggcat 1140 gcccaaccac gccatcgtcg acacgggccg caacggcgtc accggcctgc gcaaggagtg 1200 gggtgactgg tgcaacgtca acggtgcagg ttcgttgtct tctttttctc ctcttttgtt 1260 tgcacgtcgt ggtccttttc aagcagccgt gtttggttgg gggagatgga ctccggctga 1320 tgttctgctt cctctctagg cttcggcgtg cgcccgacga gcaacacggg cctcgagctg 1380 gccgacgcgt tcgtgtgggt caagcccggc ggcgagtcgg acggcaccag cgacagctcg 1440 tcgccgcgct acgacagctt ctgcggcaag gacgacgcct tcaagccctc gcccgaggcc 1500 ggcacctgga acgaggccta cttcgagatg ctgctcaaga acgccgtgcc gtcgttctaa 1560 gacggtccag catcatccgg 1580
<210> 10 <211> 396 <212> PRT
<213> Thielavia terrestris <4 00> 10 Met Lys Leu Ser Gln Ser Ala Ala Leu Ala Ala Leu Thr Ala Thr Ala 1 5 10 15 Leu Ala Ala Pro Ser Pro Thr Thr Pro Gln Ala Pro Arg Gln Ala Ser 20 25 30 Ala Gly Cys Ser Ser Ala Val Thr Leu Asp Ala Ser Thr Asn Val Trp 35 40 45 Lys Lys Tyr Thr Leu His Pro Asn Ser Tyr Tyr Arg Lys Glu Val Glu 50 55 60 Ala Ala Val Ala Gln Ile Ser Asp Pro Asp Leu Ala Ala Lys Ala Lys 65 70 75 80 Lys Val Ala Asp Val Gly Thr Phe Leu Trp Leu Asp Ser Ile Glu Asn 85 90 95 Ile Gly Lys Leu Glu Pro Ala Ile Gln Asp Val Pro Cys Glu Asn Ile 100 105 110 Leu Gly Leu Val Ile Tyr Asp Leu Pro Gly Arg Asp Cys Ala Ala Lys 115 120 125 Ala Ser Asn Gly Glu Leu Lys Val Gly Glu Ile Asp Arg Tyr Lys Thr
365
Phe Asp Glu Leu Cys Tyr Met Gln 380
Ala Leu Trp Trp Ala Ala Gly Pro 395 400
Ile Glu Pro Pro Ser Gly Ala Ala
410 415
Leu Ala Pro Phe Leu 425 130 135 140 Glu Tyr Ile Asp Lys Ile Val Ser Ile Leu Lys Ala His Pro Asn Thr 145 150 155 160 Ala Phe Ala Leu Val Ile Glu Pro Asp Ser Leu Pro Asn Leu Val Thr 165 170 175 Asn Ser Asn Leu Asp Thr Cys Ser Ser Ser Ala Ser Gly Tyr Arg Glu 180 185 190 Gly Val Ala Tyr Ala Leu Lys Asn Leu Asn Leu Pro Asn Val Ile Met 195 200 205 Tyr Leu Asp Ala Gly His Gly Gly Trp Leu Gly Trp Asp Ala Asn Leu 210 215 220 Gln Pro Gly Ala Gln Glu Leu Ala Lys Ala Tyr Lys Asn Ala Gly Ser 225 230 235 240 Pro Lys Gln Leu Arg Gly Phe Ser Thr Asn Val Ala Gly Trp Asn Ser 245 250 255 Trp Asp Gln Ser Pro Gly Glu Phe Ser Gln Ala Ser Asp Ala Lys Tyr 260 265 270 Asn Lys Cys Gln Asn Glu Lys Ile Tyr Val Ser Thr Phe Gly Ser Ala 275 280 285 Leu Gln Ser Ala Gly Met Pro Asn His Ala Ile Val Asp Thr Gly Arg 290 295 300 Asn Gly Val Thr Gly Leu Arg Lys Glu Trp Gly Asp Trp Cys Asn Val 305 310 315 320 Asn Gly Ala Gly Phe Gly Val Arg Pro Thr Ser Asn Thr Gly Leu Glu 325 330 335 Leu Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly 340 345 350 Thr Ser Asp Ser Ser Ser Pro Arg Tyr Asp Ser Phe Cys Gly Lys Asp 355 360 365 Asp Ala Phe Lys Pro Ser Pro Glu Ala Gly Thr Trp Asn Glu Ala Tyr 370 375 380 Phe Glu Met Leu Leu Lys Asn Ala Val Pro Ser Phe 385 390 395 <210> 11 <211> 1203 <212> DNA
<213> Thielavia terrestris <4 00> 11
atgaagtacc tcaacctcct cgcagctctc ctcgccgtcg ctcctctctc cctcgctgca 60
cccagcatcg aggccagaca gtcgaacgtc aacccataca tcggcaagag cccgctcgtt 120
attaggtcgt acgcccaaaa gcttgaggag accgtcagga ccttccagca acgtggcgac 180
cagctcaacg ctgcgaggac acggacggtg cagaacgttg cgactttcgc ctggatctcg 24 0
gataccaatg gtattggagc cattcgacct ctcatccaag atgctctcgc ccagcaggct 300
cgcactggac agaaggtcat cgtccaaatc gtcgtctaca acctcccaga tcgcgactgc 360
tctgccaacg cctcgactgg agagttcacc gtaggaaacg acggtctcaa ccgatacaag 420
aactttgtca acaccatcgc ccgcgagctc tcgactgctg acgctgacaa gctccacttt 480
gccctcctcc tcgaacccga cgcacttgcc aacctcgtca ccaacgcgaa tgcccccagg 540
tgccgaatcg ccgctcccgc ttacaaggag ggtatcgcct acaccctcgc caccttgtcc 600
aagcccaacg tcgacgtcta catcgacgcc gccaacggtg gctggctcgg ctggaacgac 660
aacctccgcc ccttcgccga actcttcaag gaagtctacg acctcgcccg ccgcatcaac 720
cccaacgcca aggtccgcgg cgtccccgtc aacgtctcca actacaacca gtaccgcgct 780
gaagtccgcg agcccttcac cgagtggaag gacgcctggg acgagagccg ctacgtcaac 840
gtcctcaccc cgcacctcaa cgccgtcggc ttctccgcgc acttcatcgt tgaccaggga 900
cgcggtggca agggcggtat caggacggag tggggccagt ggtgcaacgt taggaacgct 960
gggttcggta tcaggcctac tgcggatcag ggcgtgctcc agaacccgaa tgtggatgcg 1020
attgtgtggg ttaagccggg tggagagtcg gatggcacga gtgatttgaa ctcgaacagg 1080
tatgatccta cgtgcaggag tccggtggcg catgttcccg ctcctgaggc tggccagtgg 1140
ttcaacgagt atgttgttaa cctcgttttg aacgctaacc cccctcttga gcctacctgg 1200
taa 1203 <210> 12 <211> 400 <212> PRT
<213> Thielavia terrestris <4 00> 12
Met Lys Tyr Leu Asn Leu Leu Ala Ala Leu Leu Ala Val Ala Pro Leu 10 15
Ser Leu Ala Ala Pro Ser Ile Glu Ala Arg Gln Ser Asn Val Asn Pro
25 30
Tyr Ile Gly Lys Ser Pro Leu Val Ile Arg Ser Tyr Ala Gln Lys Leu
40 45
Glu Glu Thr Val Arg Thr Phe Gln Gln Arg Gly Asp Gln Leu Asn Ala
50 55 60
Ala Arg Thr Arg Thr Val Gln Asn Val Ala Thr Phe Ala Trp Ile Ser 65 70 75 80
Asp Thr Asn Gly Ile Gly Ala Ile Arg Pro Leu Ile Gln Asp Ala Leu
85 90 95
Ala Gln Gln Ala Arg Thr Gly Gln Lys Val Ile Val Gln Ile Val Val
100 105 110
Tyr Asn Leu Pro Asp Arg Asp Cys Ser Ala Asn Ala Ser Thr Gly Glu
115 120 125
Phe Thr Val Gly Asn Asp Gly Leu Asn Arg Tyr Lys Asn Phe Val Asn
130 135 140
Thr Ile Ala Arg Glu Leu Ser Thr Ala Asp Ala Asp Lys Leu His Phe 145 150 155 160
Ala Leu Leu Leu Glu Pro Asp Ala Leu Ala Asn Leu Val Thr Asn Ala
165 170 175
Asn Ala Pro Arg Cys Arg Ile Ala Ala Pro Ala Tyr Lys Glu Gly Ile
180 185 190
Ala Tyr Thr Leu Ala Thr Leu Ser Lys Pro Asn Val Asp Val Tyr Ile
195 200 205
Asp Ala Ala Asn Gly Gly Trp Leu Gly Trp Asn Asp Asn Leu Arg Pro
210 215 220
Phe Ala Glu Leu Phe Lys Glu Val Tyr Asp Leu Ala Arg Arg Ile Asn 225 230 235 240
Pro Asn Ala Lys Val Arg Gly Val Pro Val Asn Val Ser Asn Tyr Asn
245 250 255
Gln Tyr Arg Ala Glu Val Arg Glu Pro Phe Thr Glu Trp Lys Asp Ala
260 265 270
Trp Asp Glu Ser Arg Tyr Val Asn Val Leu Thr Pro His Leu Asn Ala
275 280 285
Val Gly Phe Ser Ala His Phe Ile Val Asp Gln Gly Arg Gly Gly Lys
290 295 300
Gly Gly Ile Arg Thr Glu Trp Gly Gln Trp Cys Asn Val Arg Asn Ala 305 310 315 320
Gly Phe Gly Ile Arg Pro Thr Ala Asp Gln Gly Val Leu Gln Asn Pro
325 330 335
Asn Val Asp Ala Ile Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
340 345 350
Thr Ser Asp Leu Asn Ser Asn Arg Tyr Asp Pro Thr Cys Arg Ser Pro
355 360 365
Val Ala His Val Pro Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr
370 375 380
Val Val Asn Leu Val Leu Asn Ala Asn Pro Pro Leu Glu Pro Thr Trp 385 390 395 400
<210> 13 <211> 1501 <212> DNA
<213> Thielavia terrestris <400> 13
gccgttgtca agatgggcca gaagacgctg cacggattcg ccgccacggc tttggccgtt 60
ctcccctttg tgaaggctca gcagcccggc aacttcacgc cggaggtgca cccgcaactg 120 ccaacgtgga agtgcacgac cgccggcggc tgcgttcagc aggacacttc ggtggtgctc 180 gactggaact accgttggat ccacaatgcc gacggcaccg cctcgtgcac gacgtccagc 240 ggggtcgacc acacgctgtg tccagatgag gcgacctgcg cgaagaactg cttcgtggaa 300 ggcgtcaact acacgagcag cggtgtcacc acatccggca gttcgctgac gatgaggcag 360 tatttcaagg ggagcaacgg gcagaccaac agcgtttcgc ctcgtctcta cctgctcggc 420 tcggatggaa actacgtaat gctcaagctg ctcggccagg agctgagctt cgatgtcgat 480 ctctccacgc tcccctgcgg cgagaacggc gcgctgtacc tgtccgagat ggacgcgacc 540 ggtggcagga accagtacaa caccggcggt gccaactacg gctcgggcta ctgtgacgcc 600 cagtgtcccg tgcagacgtg gatgaacggc acgctgaaca ccaacgggca gggctactgc 660 tgcaacgaga tggacatcct cgaggccaac tcccgcgcca acgcgatgac acctcacccc 720 tgcgccaacg gcagctgcga caagagcggg tgcggactca acccctacgc cgagggctac 780 aagagctact acggaccggg cctcacggtt gacacgtcga agcccttcac catcattacc 840 cgcttcatca ccgacgacgg cacgaccagc ggcaccctca accagatcca gcggatctat 900 gtgcagaatg gcaagacggt cgcgtcggct gcgtccggag gcgacatcat cacggcatcc 960 ggctgcacct cggcccaggc gttcggcggg ctggccaaca tgggcgcggc gcttggacgg 1020 ggcatggtgc tgaccttcag catctggaac gacgctgggg gctacatgaa ctggctcgac 1080 agcggcaaca acggcccgtg cagcagcacc gagggcaacc cgtccaacat cctggccaac 1140 tacccggaca cccacgtggt cttctccaac atccgctggg gagacatcgg ctcgacggtc 1200 caggtctcgg gaggcggcaa cggcggctcg accaccacca cgtcgaccac cacgctgagg 1260 acctcgacca cgaccaccac caccgccccg acggccactg ccacgcactg gggacaatgc 1320 ggcggaatcg gggtacgtca accgcctcct gcattctgtt gaggaagtta actaacgtgg 1380 cctacgcagt ggactggacc gaccgtctgc gaatcgccgt acgcatgcaa ggagctgaac 1440 ccctggtact accagtgcct ctaaagtatt gcagtgaagc catactccgt gctcggcatg 1500 9 1501
<210> 14 <211> 464 <212> PRT
<213> Thielavia terrestris <4 00> 14
Met Gly Gln Lys Thr Leu His Gly Phe Ala Ala Thr Ala Leu Ala Val 10 15
Leu Pro Phe Val Lys Ala Gln Gln Pro Gly Asn Phe Thr Pro Glu Val
25 30
His Pro Gln Leu Pro Thr Trp Lys Cys Thr Thr Ala Gly Gly Cys Val
40 45
Gln Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Ile His
50 55 60
Asn Ala Asp Gly Thr Ala Ser Cys Thr Thr Ser Ser Gly Val Asp His 65 70 75 80
Thr Leu Cys Pro Asp Glu Ala Thr Cys Ala Lys Asn Cys Phe Val Glu
85 90 95
Gly Val Asn Tyr Thr Ser Ser Gly Val Thr Thr Ser Gly Ser Ser Leu
100 105 110
Thr Met Arg Gln Tyr Phe Lys Gly Ser Asn Gly Gln Thr Asn Ser Val
115 120 125
Ser Pro Arg Leu Tyr Leu Leu Gly Ser Asp Gly Asn Tyr Val Met Leu
130 135 140
Lys Leu Leu Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Thr Leu 145 150 155 160
Pro Cys Gly Glu Asn Gly Ala Leu Tyr Leu Ser Glu Met Asp Ala Thr
165 170 175
Gly Gly Arg Asn Gln Tyr Asn Thr Gly Gly Ala Asn Tyr Gly Ser Gly
180 185 190
Tyr Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Met Asn Gly Thr Leu
195 200 205
Asn Thr Asn Gly Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu
210 215 220
Ala Asn Ser Arg Ala Asn Ala Met Thr Pro His Pro Cys Ala Asn Gly 225 230 235 240
Ser Cys Asp Lys Ser Gly Cys Gly Leu Asn Pro Tyr Ala Glu Gly Tyr
245 250 255
Lys Ser Tyr Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Pro Phe
260 265 270
Thr Ile Ile Thr Arg Phe Ile Thr Asp Asp Gly Thr Thr Ser Gly Thr
275 280 285
Leu Asn Gln Ile Gln Arg Ile Tyr Val Gln Asn Gly Lys Thr Val Ala
290 295 300
Ser Ala Ala Ser Gly Gly Asp Ile Ile Thr Ala Ser Gly Cys Thr Ser 305 310 315 320 Ala Gln Ala Phe Gly Gly Leu Ala Asn Met Gly Ala Ala Leu Gly Arg 325 330 335 Gly Met Val Leu Thr Phe Ser Ile Trp Asn Asp Ala Gly Gly Tyr Met 340 345 350 Asn Trp Leu Asp Ser Gly Asn Asn Gly Pro Cys Ser Ser Thr Glu Gly 355 360 365 Asn Pro Ser Asn Ile Leu Ala Asn Tyr Pro Asp Thr His Val Val Phe 370 375 380 Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Val Gln Val Ser Gly 385 390 395 400 Gly Gly Asn Gly Gly Ser Thr Thr Thr Thr Ser Thr Thr Thr Leu Arg
405
Thr Ser Thr Thr Thr Thr Thr Thr 420
Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly
435
440
410 415
Ala Pro Thr Ala Thr Ala Thr His 425 430
Pro Thr Val Cys Glu 445
Tyr Tyr Gln Cys Leu 460
Ser Pro Tyr Ala Cys Lys Glu Leu Asn Pro Trp
450 455
<210> 15 <211> 1368 <212> DNA
<213> Thielavia terrestris <4 00> 15
accgatccgc tcgaagatgg cgcccaagtc tacagttctg gccgcctggc tgctctcctc 60
gctggccgcg gcccagcaga tcggcaaagc cgtgcccgag gtccacccca aactgacaac 120 gcagaagtgc actctccgcg gcgggtgcaa gcctgtccgc acctcggtcg tgctcgactc 180 gtccgcgcgc tcgctgcaca aggtcgggga ccccaacacc agctgcagcg tcggcggcga 240 cctgtgctcg gacgcgaagt cgtgcggcaa gaactgcgcg ctcgagggcg tcgactacgc 300 ggcccacggc gtggcgacca agggcgacgc cctcacgctg caccagtggc tcaagggggc 360 cgacggcacc tacaggaccg tctcgccgcg cgtatacctc ctgggcgagg acgggaagaa 420 ctacgaggac ttcaagctgc tcaacgccga gctcagcttc gacgtcgacg tgtcccagct 480 cgtctgcggc atgaacggcg ccctgtactt ctccgagatg gagatggacg gcggccgcag 540 cccgctgaac ccggcgggcg ccacgtacgg cacgggctac tgcgacgcgc agtgccccaa 600 gttggacttt atcaacggcg aggtatttct tctctcttct gtttttcttt tccatcgctt 660 tttctgaccg gaatccgccc tcttagctca acaccaacca cacgtacggg gcgtgctgca 720 acgagatgga catctgggag gccaacgcgc tggcgcaggc gctcacgccg cacccgtgca 780 acgcgacgcg ggtgtacaag tgcgacacgg cggacgagtg cgggcagccg gtgggcgtgt 84 0 gcgacgaatg ggggtgctcg tacaacccgt ccaacttcgg ggtcaaggac tactacgggc 900 gcaacctgac ggtggacacg aaccgcaagt tcacggtgac gacgcagttc gtgacgtcca 960 acgggcgggc ggacggcgag ctgaccgaga tccggcggct gtacgtgcag gacggcgtgg 1020 tgatccagaa ccacgcggtc acggcgggcg gggcgacgta cgacagcatc acggacggct 1080 tctgcaacgc gacggccacc tggacgcagc agcggggcgg gctcgcgcgc atgggcgagg 1140 ccatcggccg cggcatggtg ctcatcttca gcctgtgggt tgacaacggc ggcttcatga 1200 actggctcga cagcggcaac gccgggccct gcaacgccac cgagggcgac ccggccctga 1260 tcctgcagca gcacccggac gccagcgtca ccttctccaa catccgatgg ggcgagatcg 1320 gcagcacgta caagagcgag tgcagccact agagtagagc ttgtaatt 1368
<210> 16 <211> 423 <212> PRT
<213> Thielavia terrestris <4 00> 16
Met Ala Pro Lys Ser Thr Val Leu Ala Ala Trp
1
10
Ala Ala Ala Gln Gln Ile Gly Lys Ala Val Pro
20
25
Leu Thr Thr Gln Lys Cys Thr Leu Arg Gly Gly
40
Thr Ser Val Val Leu Asp Ser Ser Ala Arg Ser
50 55
Asp Pro Asn Thr Ser Cys Ser Val Gly Gly Asp 65 70 75
Lys Ser Cys Gly Lys Asn Cys Ala Leu Glu Gly
Leu Leu Ser Ser Leu 15
Glu Val His Pro Lys 30
Cys Lys Pro Val Arg 45
Leu His Lys Val Gly 60
Leu Cys Ser Asp Ala 80
Val Asp Tyr Ala Ala 85 90 95 His Gly Val Ala Thr Lys Gly Asp Ala Leu Thr Leu His Gln Trp Leu 100 105 110 Lys Gly Ala Asp Gly Thr Tyr Arg Thr Val Ser Pro Arg Val Tyr Leu 115 120 125 Leu Gly Glu Asp Gly Lys Asn Tyr Glu Asp Phe Lys Leu Leu Asn Ala 130 135 140 Glu Leu Ser Phe Asp Val Asp Val Ser Gln Leu Val Cys Gly Met Asn 145 150 155 160 Gly Ala Leu Tyr Phe Ser Glu Met Glu Met Asp Gly Gly Arg Ser Pro 165 170 175 Leu Asn Pro Ala Gly Ala Thr Tyr Gly Thr Gly Tyr Cys Asp Ala Gln 180 185 190 Cys Pro Lys Leu Asp Phe Ile Asn Gly Glu Leu Asn Thr Asn His Thr 195 200 205 Tyr Gly Ala Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn Ala Leu 210 215 220 Ala Gln Ala Leu Thr Pro His Pro Cys Asn Ala Thr Arg Val Tyr Lys 225 230 235 240 Cys Asp Thr Ala Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp Glu 245 250 255 Trp Gly Cys Ser Tyr Asn Pro Ser Asn Phe Gly Val Lys Asp Tyr Tyr 260 265 270 Gly Arg Asn Leu Thr Val Asp Thr Asn Arg Lys Phe Thr Val Thr Thr 275 280 285 Gln Phe Val Thr Ser Asn Gly Arg Ala Asp Gly Glu Leu Thr Glu Ile 290 295 300 Arg Arg Leu Tyr Val Gln Asp Gly Val Val Ile Gln Asn His Ala Val 305 310 315 320 Thr Ala Gly Gly Ala Thr Tyr Asp Ser Ile Thr Asp Gly Phe Cys Asn 325 330 335 Ala Thr Ala Thr Trp Thr Gln Gln Arg Gly Gly Leu Ala Arg Met Gly 340 345 350 Glu Ala Ile Gly Arg Gly Met Val Leu Ile Phe Ser Leu Trp Val Asp 355 360 365 Asn Gly Gly Phe Met Asn Trp Leu Asp Ser Gly Asn Ala Gly Pro Cys 370 375 380 Asn Ala Thr Glu Gly Asp Pro Ala Leu Ile Leu Gln Gln His Pro Asp 385 390 395 400 Ala Ser Val Thr Phe Ser Asn Ile Arg Trp Gly Glu Ile Gly Ser Thr 405 410 415 Tyr Lys Ser Glu Cys Ser His 420
<210> 17 <211> 1011 <212> DNA
<213> Thielavia terrestris <4 00> 17
atgaccctac ggctccctgt catcagcctg ctggcctcgc tggcagcagg cgccgtcgtc 60
gtcccacggg cggagtttca cccccctctc ccgacttgga aatgcacgac ctccgggggc 120
tgcgtgcagc agaacaccag cgtcgtcctg gaccgtgact cgaagtacgc cgcacacagc 180
gccggctcgc ggacggaatc ggattacgcg gcaatgggag tgtccacttc gggcaatgcc 240
gtgacgctgt accactacgt caagaccaac ggcaccctcg tccccgcttc gccgcgcatc 300
tacctcctgg gcgcggacgg caagtacgtg cttatggacc tcctcaacca ggagctgtcg 360
gtggacgtcg acttctcggc gctgccgtgc ggcgagaacg gggccttcta cctgtccgag 420
atggcggcgg acgggcgggg cgacgcgggg gcgggcgacg ggtactgcga cgcgcagtgc 480
cagggctact gctgcaacga gatggacatc ctcgaggcca actcgatggc gacggccatg 54 0
acgccgcacc cgtgcaaggg caacaactgc gaccgcagcg gctgcggcta caacccgtac 600
gccagcggcc agcgcggctt ctacgggccc ggcaagacgg tcgacacgag caagcccttc 660
accgtcgtca cgcagttcgc cgccagcggc ggcaagctga cccagatcac ccgcaagtac 720
atccagaacg gccgggagat cggcggcggc ggcaccatct ccagctgcgg ctccgagtct 780
tcgacgggcg gcctgaccgg catgggcgag gcgctggggc gcggaatggt gctggccatg 840
agcatctgga acgacgcggc ccaggagatg gcatggctcg atgccggcaa caacggccct 900 tgcgccagtg gccagggcag cccgtccgtc attcagtcgc gtcttctcca acatcaggtg gggcgacatc gggtctacca <210> 18 <211> 336 <212> PRT
<213> Thielavia terrestris <4 00> 18
Met Thr Leu Arg Leu Pro Val Ile Ser Leu Leu 10
Gly Ala Val Val Val Pro Arg Ala Glu Phe His
25
Trp Lys Cys Thr Thr Ser Gly Gly Cys Val Gln
40
Val Leu Asp Arg Asp Ser Lys Tyr Ala Ala His
50 55
Thr Glu Ser Asp Tyr Ala Ala Met Gly Val Ser 65 70 75
Val Thr Leu Tyr His Tyr Val Lys Thr Asn Gly
85 90
Ser Pro Arg Ile Tyr Leu Leu Gly Ala Asp Gly
100 105
Asp Leu Leu Asn Gln Glu Leu Ser Val Asp Val
115 120
Pro Cys Gly Glu Asn Gly Ala Phe Tyr Leu Ser
130 135
Gly Arg Gly Asp Ala Gly Ala Gly Asp Gly Tyr 145 150 155
Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu
165 170
Ala Thr Ala Met Thr Pro His Pro Cys Lys Gly
180 185
Ser Gly Cys Gly Tyr Asn Pro Tyr Ala Ser Gly
195 200
Gly Pro Gly Lys Thr Val Asp Thr Ser Lys Pro
210 215
Gln Phe Ala Ala Ser Gly Gly Lys Leu Thr Gln 225 230 235
Ile Gln Asn Gly Arg Glu Ile Gly Gly Gly Gly
245 250
Gly Ser Glu Ser Ser Thr Gly Gly Leu Thr Gly
260 265
Gly Arg Gly Met Val Leu Ala Met Ser Ile Trp
275 280
Glu Met Ala Trp Leu Asp Ala Gly Asn Asn Gly
290 295
Gln Gly Ser Pro Ser Val Ile Gln Ser Gln His 305 310 315
Val Phe Ser Asn Ile Arg Trp Gly Asp Ile Gly 325 330
<210> 19 <211> 1480 <212> DNA
<213> Cladorrhinum foecundissimum <4 00> 19
gatccgaatt cctcctctcg ttctttagtc acagaccaga caagttcgcc ctcctcaccg gcctcgccgc ctccctcgca cgtcgtcccc gagtctcacc ccaagcttcc caccaagcgc ccagaccgtc gacacctcca tcgtcatcga cgccttccag cgacccttcc actccttgcg tcgtcggcgg ccctctctgc tgagaactgc gcgctcgagg gtgtcgacta tgcctcctgg cgccctaact ctcaaccagt ggatgcccga cccggcgaac tactccccgt acttaccttg ttgctgagga cggcaagaac ggctaaggag atctcgtttg atgccgatgt cagcaacctt
agcatcccga cacccacgtc cgaagaacta g
960 1011
Ala Ser
Pro Pro
Gln Asn
45
Ser Ala 60
Thr Ser
Thr Leu
Lys Tyr
Asp Phe 125 Glu Met 140
Cys Asp
Glu Ala
Asn Asn
Gln Arg 205 Phe Thr 220
Ile Thr
Thr Ile
Met Gly
Asn Asp 285 Pro Cys 300
Pro Asp Ser Thr
Leu Ala Ala 15
Leu Pro Thr 30
Thr Ser Val
Gly Ser Arg
Gly Asn Ala 80
Val Pro Ala 95
Val Leu Met 110
Ser Ala Leu
Ala Ala Asp
Ala Gln Cys 160
Asn Ser Met 175
Cys Asp Arg 190
Gly Phe Tyr
Val Val Thr
Arg Lys Tyr 240
Ser Ser Cys
255 Glu Ala Leu 270
Ala Ala Gln
Ala Ser Gly
Thr His Val 320
Thr Lys Asn 335
catctgccca tctgcccagc tgcactctcg cgtcccctcc cccgacgcca ggcatcaaga cctggccagt tacgaggatg ccctgcggca
cgatggttca agatcggcac ccggtggctg acaagatcgg agtcctgcgc ccgagggcga acaagacgac tgaagctcct tgaacggtgc
60 120 180 240 300 360 420 480 540 tttctacttg tctgagatgt tgatggatgg tggacgtggc gacctcaacc ctgctggtgc 600
cgagtatggt accggttact gtgatgcgca gtgcttcaag ttggatttca tcaacggcga 660
ggccaacatc gaccaaaagc acggcgcctg ctgcaacgaa atggacattt tcgaatccaa 720
ctcgcgcgcc aagaccttcg tcccccaccc ctgcaacatc acgcaggtct acaagtgcga 780
aggcgaagac gagtgcggcc agcccgtcgg cgtgtgcgac aagtgggggt gcggcttcaa 840
cgagtacaaa tggggcgtcg agtccttcta cggccggggc tcgcagttcg ccatcgactc 900
ctccaagaag ttcaccgtca ccacgcagtt cctgaccgac aacggcaagg aggacggcgt 960
cctcgtcgag atccgccgct tgtggcacca ggatggcaag ctgatcaaga acaccgctat 1020
ccaggttgag gagaactaca gcacggactc ggtgagcacc gagttctgcg agaagactgc 1080
ttctttcacc atgcagcgcg gtggtctcaa ggcgatgggc gaggctatcg gtcgtggtat 1140
ggtgctggtt ttcagcatct gggcggatga ttcgggtttt atgaactggt tggatgcgga 1200
gggtaatggc ccttgcagcg cgactgaggg cgatccgaag gagattgtca agaataagcc 1260
ggatgctagg gttacgttct caaacattag gattggtgag gttggtagca cgtatgctcc 1320
gggtgggaag tgcggtgtta agagcagggt tgctaggggg cttactgctt cttaaggggg 1380
gtgtgaagag aggaggaggt gttgttgggg gttggagatg ataattgggc gagatggtgt 1440
agagcgggtt ggttggatat gaatacgttg aattggatgt 1480 <210> 20 <211> 440 <212> PRT
<213> Cladorrhinum foecundissimum <400> 20
Met Val His Lys Phe Ala Leu Leu Thr Gly Leu Ala Ala Ser Leu Ala 1 5 10 15 Ser Ala Gln Gln Ile Gly Thr Val Val Pro Glu Ser His Pro Lys Leu 20 25 30 Pro Thr Lys Arg Cys Thr Leu Ala Gly Gly Cys Gln Thr Val Asp Thr 35 40 45 Ser Ile Val Ile Asp Ala Phe Gln Arg Pro Leu His Lys Ile Gly Asp 50 55 60 Pro Ser Thr Pro Cys Val Val Gly Gly Pro Leu Cys Pro Asp Ala Lys 65 70 75 80 Ser Cys Ala Glu Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ser Trp 85 90 95 Gly Ile Lys Thr Glu Gly Asp Ala Leu Thr Leu Asn Gln Trp Met Pro 100 105 110 Asp Pro Ala Asn Pro Gly Gln Tyr Lys Thr Thr Thr Pro Arg Thr Tyr 115 120 125 Leu Val Ala Glu Asp Gly Lys Asn Tyr Glu Asp Val Lys Leu Leu Ala 130 135 140 Lys Glu Ile Ser Phe Asp Ala Asp Val Ser Asn Leu Pro Cys Gly Met 145 150 155 160 Asn Gly Ala Phe Tyr Leu Ser Glu Met Leu Met Asp Gly Gly Arg Gly 165 170 175 Asp Leu Asn Pro Ala Gly Ala Glu Tyr Gly Thr Gly Tyr Cys Asp Ala 180 185 190 Gln Cys Phe Lys Leu Asp Phe Ile Asn Gly Glu Ala Asn Ile Asp Gln 195 200 205 Lys His Gly Ala Cys Cys Asn Glu Met Asp Ile Phe Glu Ser Asn Ser 210 215 220 Arg Ala Lys Thr Phe Val Pro His Pro Cys Asn Ile Thr Gln Val Tyr 225 230 235 240 Lys Cys Glu Gly Glu Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp 245 250 255 Lys Trp Gly Cys Gly Phe Asn Glu Tyr Lys Trp Gly Val Glu Ser Phe 260 265 270 Tyr Gly Arg Gly Ser Gln Phe Ala Ile Asp Ser Ser Lys Lys Phe Thr 275 280 285 Val Thr Thr Gln Phe Leu Thr Asp Asn Gly Lys Glu Asp Gly Val Leu 290 295 300 Val Glu Ile Arg Arg Leu Trp His Gln Asp Gly Lys Leu Ile Lys Asn 305 310 315 320 Thr Ala Ile Gln Val Glu Glu Asn Tyr Ser Thr Asp Ser Val Ser Thr 325 330 335 Glu Phe Cys Glu Lys Thr Ala Ser Phe Thr Met Gln Arg Gly Gly Leu 340 345 350 Lys Ala Met Gly Glu Ala Ile Gly Arg Gly Met Val Leu Val Phe Ser 355 360 365 Ile Trp Ala Asp Asp Ser Gly Phe Met Asn Trp Leu Asp Ala Glu Gly 370 375 380 Asn Gly Pro Cys Ser Ala Thr Glu Gly Asp Pro Lys Glu Ile Val Lys 385 390 395 400 Asn Lys Pro Asp Ala Arg Val Thr Phe Ser Asn Ile Arg Ile Gly Glu 405 410 415 Val Gly Ser Thr Tyr Ala Pro Gly Gly Lys Cys Gly Val Lys Ser Arg 420 425 430 Val Ala Arg Gly Leu Thr Ala Ser
435 440
<210> 21 <211> 1380 <212> DNA
<213> Trichoderma reesei <400> 21
atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg acatggagga acggcaccct caacactagc caccagggct tctgctgcaa atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca <210> 22 <211> 459 <212> PRT
<213> Trichoderma reesei <400> 22
Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile 10
Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr
25
His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly
40 45
Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg
50 55 60
Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val 65 70 75
Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe
85 90
Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser
100 105
Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser 115 120 125
ccggctcgtc aacctacaag ctggaactac caacaccacg cgactacgcc gcccagcagc cggtgagtac tgctctgccg cgccaaccag ccccgtccag cgagatggat ggccacggcc ctactacggc caacacggac aaacggcgtc cgcctcagcc cgtgttcagc cggcccctgc gcacgtcgtc gcccccgccc ttcgagcagc cgggtgcaag atgcctttag
Leu Ala Ile 15
Pro Glu Val 30
Gly Cys Val
Trp Met His
Asn Thr Thr 80
Ile Glu Gly 95
Ser Leu Thr 110
Ser Val Ser
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys
130 135 140
Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro 145 150 155 160
Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly
165 170 175
Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr
180 185 190
Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn
195 200 205
Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly
210 215 220
Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala 225 230 235 240
Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys
245 250 255
Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr
260 265 270
Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu
275 280 285
Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser
290 295 300
Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala 305 310 315 320
Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val
325 330 335
Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu
340 345 350
Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser
355 360 365
Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile
370 375 380
Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro 385 390 395 400
Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr
405 410 415
Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly
420 425 430
Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys
435 440 445
Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu
450 455
<210> 23 <211> 2586 <212> DNA
<213> Aspergillus oryzae <400> 23
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag 60
gatgatctcg cgtactcccc tcctttctac ccttccccat gggcagatgg tcagggtgaa 120 tgggcggaag tatacaaacg cgctgtagac atagtttccc agatgacgtt gacagagaaa 180 gtcaacttaa cgactggaac aggatggcaa ctagagaggt gtgttggaca aactggcagt 240 gttcccagac tcaacatccc cagcttgtgt ttgcaggata gtcctcttgg tattcgtttc 300 tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg 360 ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca gtgataaggg tattgacgtt 420 cagctgggtc ctgctgctgg ccctctcggt gctcatccgg atggcggtag aaactgggaa 480 ggtttctcac cagatccagc cctcaccggt gtactttttg cggagacgat taagggtatt 540 caagatgctg gtgtcattgc gacagctaag cattatatca tgaacgaaca agagcatttc 600 cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac 660 gttgatgaca agactatgca tgaattgtac ctctggccct tcgcggatgc agtacgcgct 720 ggagtcggtg ctgtcatgtg ctcttacaac caaatcaaca acagctacgg ttgcgagaat 780 agcgaaactc tgaacaagct tttgaaggcg gagcttggtt tccaaggctt cgtcatgagt 840 gattggaccg ctcatcacag cggcgtaggc gctgctttag caggtctgga tatgtcgatg 900 cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt 960 gtccttaacg gtacaatccc ccaatggcgt gttgatgaca tggctgtccg tatcatggcc 1020
gcttattaca aggttggccg cgacaccaaa tacacccctc ccaacttcag ctcgtggacc 1080
agggacgaat atggtttcgc gcataaccat gtttcggaag gtgcttacga gagggtcaac 1140
gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc gtcgcatcgg cgcgcagagc 1200
actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc 1260
cttctgggag aggatgcggg ttccaactcg tggggcgcta acggctgtga tgaccgtggt 1320
tgcgataacg gtacccttgc catggcctgg ggtagcggta ctgcgaattt cccatacctc 1380
gtgacaccag agcaggcgat tcagaacgaa gttcttcagg gccgtggtaa tgtcttcgcc 1440
gtgaccgaca gttgggcgct cgacaagatc gctgcggctg cccgccaggc cagcgtatct 1500
ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc 1560
gatcgtaaca acatcactct gtggaagaac ggcgacaatg tggtcaagac cgcagcgaat 1620
aactgtaaca acaccgttgt catcatccac tccgtcggac cagttttgat cgatgaatgg 1680
tatgaccacc ccaatgtcac tggtattctc tgggctggtc tgccaggcca ggagtctggt 1740
aactccattg ccgatgtgct gtacggtcgt gtcaaccctg gcgccaagtc tcctttcact 1800
tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac 1860
ggagcgcccc agtctgattt cacccagggt gttttcatcg attaccgcca tttcgataag 1920
ttcaatgaga cccctatcta cgagtttggc tacggcttga gctacaccac cttcgagctc 1980
tccgacctcc atgttcagcc cctgaacgcg tcccgataca ctcccaccag tggcatgact 2040
gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg agtacgtgta tccggagggg 2100
ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg 2160
tctgacgatt ctaactacgg ctgggaagac tccaagtata ttcccgaagg cgccacggat 2220
gggtctgccc agccccgttt gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac 2280
gaggatcttt tccgcgtctc tgtgaaggtc aagaacacgg gcaatgtcgc cggtgatgaa 2340
gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc ccaaggtggt actgcgcaag 2400
tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt 24 60
cgtgaccttg caaactggga cgtttcggct caggactgga ccgtcactcc ttaccccaag 2520
acgatctacg ttggaaactc ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc 2580
cagtaa 2586 <210> 24 <211> 861 <212> PRT
<213> Aspergillus oryzae <4 00> 24 Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val 1 5 10 15 Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser 20 25 30 Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala 35 40 45 Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr 50 55 60 Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser 65 70 75 80 Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu 85 90 95 Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn 100 105 110 Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala 115 120 125 Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro 130 135 140 Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu 145 150 155 160 Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr 165 170 175 Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr 180 185 190 Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly 195 200 205 Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys 210 215 220 Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala 225 230 235 240 Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr 245 250 255 Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu 260 265 270 Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly 275 280 285 Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val 290 295 300 Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly 305 310 315 320 Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val 325 330 335 Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr 340 345 350 Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His 355 360 365 Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp 370 375 380 Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser 385 390 395 400 Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu 405 410 415 Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly 420 425 430 Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met 435 440 445 Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu 450 455 460 Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala 465 470 475 480 Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln 485 490 495 Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr 500 505 510 Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp 515 520 525 Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn 530 535 540 Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp 545 550 555 560 Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly 565 570 575 Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn 580 585 590 Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr 595 600 605 Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln 610 615 620 Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys 625 630 635 640 Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr 645 650 655 Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg 660 665 670 Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu 675 680 685 Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile 690 695 700 His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser 705 710 715 720 Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu 725 730 735 Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly 740 745 750 Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val 755 760 765 Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu 770 775 780 Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys 785 790 795 800 Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr 805 810 815 Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp 820 825 830 Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser 835 840 845 Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
850 855 860
<210> 25 <211> 2586 <212> DNA
<213> Aspergillus oryzae <400> 25
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag 60
gatgatctcg cgtactcccc tcctttctac ccttccccat gggcagatgg tcagggtgaa 120
tgggcggaag tatacaaacg cgctgtagac atagtttccc agatgacgtt gacagagaaa 180
gtcaacttaa cgactggaac aggatggcaa ctagagaggt gtgttggaca aactggcagt 240
gttcccagac tcaacatccc cagcttgtgt ttgcaggata gtcctcttgg tattcgtttc 300
tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg 360
ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca gtgataaggg tattgacgtt 420
cagctgggtc ctgctgctgg ccctctcggt gctcatccgg atggcggtag aaactgggaa 480
agtttctcac cagatccagc cctcaccggt gtactttttg cggagacgat taagggtatt 540
caagatgctg gtgtcattgc gacagctaag cattatatca tgaacgaaca agagcatttc 600
cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac 660
gttgatgaca agactatgca tgaattgtac ctctggccct tcgcggatgc agtacgcgct 720
ggagtcggtg ctgttatgtg ctcttacaac caaatcaaca acagctacgg ttgcgagaat 780
agcgaaactc tgaacaagct tttgaaggcg gagcttggtt tccaaggctt cgtcatgagt 84 0
gattggaccg ctcaacacag cggcgtaggc gctgctttag caggtctgga tatgtcgatg 900
cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt 960
gtccttaacg gtacaatccc ccaatggcgt gttgatgaca tggctgtccg tatcatggcc 1020
gcttattaca aggttggccg cgacaccaaa tacacccctc ccaacttcag ctcgtggacc 1080
agggacgaat atggtttcgc gcataaccat gtttcggaag gtgcttacga gagggtcaac 1140
gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc gtcgcatcgg cgcgcagagc 1200
actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc 1260
cttctgggag aggatgcggg ttccaactcg tggggcgcta acggctgtga tgaccgtggt 1320
tgcgataacg gtacccttgc catggcctgg ggtagcggta ctgcgaattt cccatacctc 1380
gtgacaccag agcaggcgat tcagaacgaa gttcttcagg gccgtggtaa tgtcttcgcc 1440
gtgaccgaca gttgggcgct cgacaagatc gctgcggctg cccgccaggc cagcgtatct 1500
ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc 1560
gatcgtaaca acatcactct gtggaagaac ggcgacaatg tggtcaagac cgcagcgaat 1620
aactgtaaca acaccgttgt catcatccac tccgtcggac cagttttgat cgatgaatgg 1680
tatgaccacc ccaatgtcac tggtattctc tgggctggtc tgccaggcca ggagtctggt 1740
aactccattg ccgatgtgct gtacggtcgt gtcaaccctg gcgccaagtc tcctttcact 1800
tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac 1860
ggagcgcccc agtctgattt cacccagggt gttttcatcg attaccgcca tttcgataag 1920
ttcaatgaga cccctatcta cgagtttggc tacggcttga gctacaccac cttcgagctc 1980
tccgacctcc atgttcagcc cctgaacgcg tcccgataca ctcccaccag tggcatgact 2040
gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg agtacgtgta tccggagggg 2100
ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg 2160
tctgacgatt ctaactacgg ctgggaagac tccaagtata ttcccgaagg cgccacggat 2220
gggtctgccc agccccgttt gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac 2280
gaggatcttt tccgcgtctc tgtgaaggtc aagaacacgg gcaatgtcgc cggtgatgaa 2340
gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc ccaaggtggt actgcgcaag 2400
tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt 2460
cgtgaccttg caaactggga cgtttcggct caggactgga ccgtcactcc ttaccccaag 2520
acgatctacg ttggaaactc ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc 2580 cagtaa 2586
<210> 26 <211> 861 <212> PRT
<213> Aspergillus oryzae <400> 26
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val 1 5 10 15 Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser 20 25 30 Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala 35 40 45 Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr 50 55 60 Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser 65 70 75 80 Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu 85 90 95 Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn 100 105 110 Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala 115 120 125 Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro 130 135 140 Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu 145 150 155 160 Ser Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr 165 170 175 Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr 180 185 190 Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly 195 200 205 Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys 210 215 220 Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala 225 230 235 240 Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr 245 250 255 Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu 260 265 270 Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala Gln His Ser Gly 275 280 285 Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val 290 295 300 Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly 305 310 315 320 Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val 325 330 335 Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr 340 345 350 Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His 355 360 365 Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp 370 375 380 Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser 385 390 395 400 Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu 405 410 415 Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly 420 425 430 Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met 435 440 445 Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu 450 455 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala 465 470 475 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
485 490 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr
500 505 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
515 520 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
530 535 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp 545 550 555 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys 625 630 635 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
660 665 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
675 680 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
690 695 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser 705 710 715 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
725 730 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
740 745 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
755 760 765
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
770 775 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys 785 790 795 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
805 810 815
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
820 825 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
835 840 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
850 855 860
<210> 27 <211> 3060 <212> DNA
<213> Aspergillus fumigatus <400> 27
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc 120 aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt 180 gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg 24 0 ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc 300 actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc 360 aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag 420 acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga 480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc 540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact 600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt 660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg 720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca 780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg 840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt 900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga 960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga 1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt 1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa 1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg 1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga 1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt 1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac 1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat 1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc 1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg 1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc 1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat 1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc 1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact 1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct 1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg 1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac 1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac 2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat 2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac 2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg 2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt 2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc 2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct 2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag 24 60
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag 2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat 2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg 2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt 2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat 2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc 2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac 2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat 2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg 3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag 3060 <210> 28 <211> 863 <212> PRT
<213> Aspergillus fumigatus <400> 28
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val 1 5 10 15 Ala Asn Ala Gln 20 Glu Leu Ala Phe Ser 25 Pro Pro Phe Tyr Pro 30 Ser Pro Trp Ala Asp 35 Gly Gln Gly Glu Trp 40 Ala Asp Ala His Arg 45 Arg Ala Val Glu Ile 50 Val Ser Gln Met Thr 55 Leu Ala Glu Lys Val 60 Asn Leu Thr Thr Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val 65 70 75 80 Pro Arg Leu Gly Ile 85 Asn Trp Gly Leu Cys 90 Gly Gln Asp Ser Pro 95 Leu Gly Ile Arg Phe 100 Ser Asp Leu Asn Ser 105 Ala Phe Pro Ala Gly 110 Thr Asn Val Ala Ala Thr
Met Gly Glu Glu 130
Ala Ala Gly Pro 145
Gly Phe Ser Pro
Ile Lys Gly Ile 180
Ile Leu Asn Glu 195
Tyr Gly Tyr Asn 210
Thr Met His Glu 225
Gly Val Gly Ala
Gly Cys Gln Asn 260
Gly Phe Gln Gly 275
Val Gly Ala Ala 290
Ser Phe Asp Asp 305
Val Leu Asn Gly
Arg Ile Met Thr 340
Pro Pro Asn Phe 355
Ser Ala Val Ser 370
Val Gln Arg Ser 385
Thr Val Leu Leu
Val Lys Val Gly 420
Ala Asn Gly Cys 435
Ala Trp Gly Ser 450
Gln Ala Ile Gln 465
Val Thr Asp Asn
Ser Ser Val Ser 500
Ile Ser Val Asp 515
Lys Asn Gly Glu 530
Thr Ile Val Val 545
Tyr Asp Asn Pro
Gln Glu Ser Gly 580
Pro Ser Ala Lys 595
Gly Ala Pro Leu
Trp Asp Lys Thr 120
Phe Asn Asp Lys 135
Leu Gly Lys Tyr 150
Asp Pro Val Leu 165
Gln Asp Ala Gly
Gln Glu His Phe 200
Ile Thr Glu Thr 215
Leu Tyr Leu Trp 230
Val Met Cys Ser 245
Ser Gln Thr Leu
Phe Val Met Ser 280
Leu Ala Gly Leu 295
Gly Leu Ser Phe 310
Thr Val Pro Ala 325
Ala Tyr Tyr Lys
Ser Ser Trp Thr 360
Glu Gly Ala Trp 375
His Ser Gln Ile 390
Lys Asn Thr Gly 405
Val Leu Gly Glu
Pro Asp Arg Gly 440
Gly Thr Ala Asn 455
Arg Glu Val Ile 470
Gly Ala Leu Ser 485
Leu Val Phe Val
Gly Asn Glu Gly 520
Ala Val Ile Asp 535
Ile His Ser Val 550
Asn Val Thr Ala 565
Asn Ser Leu Val
Thr Pro Phe Thr 600
Leu Thr Glu Pro
22
Leu Ala Tyr Leu
Gly Val Asp Ile 140
Pro Asp Gly Gly 155
Thr Gly Val Leu 170
Val Ile Ala Thr 185
Arg Gln Val Gly
Ile Ser Ser Asn 220
Pro Phe Ala Asp 235
Tyr Asn Gln Ile 250
Asn Lys Leu Leu 265
Asp Trp Ser Ala
Asp Met Ser Met 300
Trp Gly Thr Asn 315
Trp Arg Val Asp 330
Val Gly Arg Asp 345
Arg Asp Glu Tyr
Thr Lys Val Asn 380
Ile Arg Glu Ile 395
Ala Leu Pro Leu 410
Asp Ala Gly Ser 425
Cys Asp Asn Gly
Phe Pro Tyr Leu 460
Ser Asn Gly Gly 475
Gln Met Ala Asp 490
Asn Ala Asp Ser 505
Asp Arg Lys Asn
Thr Val Val Ser 540
Gly Pro Val Leu 555
Ile Ile Trp Ala 570
Asp Val Leu Tyr 585
Trp Gly Lys Thr Asn Asn Gly Asn
Arg Gly Lys Ala 125
Leu Leu Gly Pro
Arg Ile Trp Glu 160
Phe Ala Glu Thr 175
Ala Lys His Tyr 190
Glu Ala Gln Gly 205
Val Asp Asp Lys
Ala Val Arg Ala 240
Asn Asn Ser Tyr 255
Lys Ala Glu Leu 270
His His Ser Gly 285
Pro Gly Asp Ile
Leu Thr Val Ser 320
Asp Met Ala Val 335
Arg Leu Arg Ile 350
Gly Trp Glu His 365
Asp Phe Val Asn
Gly Ala Ala Ser 400
Thr Gly Lys Glu 415
Asn Pro Trp Gly 430
Thr Leu Ala Met 445
Val Thr Pro Glu
Asn Val Phe Ala 480
Val Ala Ser Gln 495
Gly Glu Gly Phe 510
Leu Thr Leu Trp 525
His Cys Asn Asn
Ile Asp Arg Trp 560
Gly Leu Pro Gly 575
Gly Arg Val Asn 590
Arg Glu Ser Tyr 605
Gly Ala Pro Gln 610 615 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys 625 630 635 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
660 665 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
675 680 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
690 695 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu 705 710 715 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
725 730 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
740 745 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
755 760 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
770 775 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu 785 790 795 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
805 810 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
820 825 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
835 840 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
850 855 860
<210> 29 <211> 2800 <212> DNA
<213> Penicillium brasilianum <400> 29
tgaaaatgca gggttctaca atctttctgg ctttcgcctc atgggcgagc caggttgctg 60
ccattgcgca gcccatacag aagcacgagg tttgttttat cttgctcatg gacgtgcttt 120 gacttgacta attgttttac atacagcccg gatttctgca cgggccccaa gccatagaat 180 cgttctcaga accgttctac ccgtcgccct ggatgaatcc tcacgccgag ggctgggagg 240 ccgcatatca gaaagctcaa gattttgtct cgcaactcac tatcttggag aaaataaatc 300 tgaccaccgg tgttgggtaa gtctctccga ctgcttctgg gtcacggtgc gacgagccac 360 tgactttttg aagctgggaa aatgggccgt gtgtaggaaa cactggatca attcctcgtc 420 tcggattcaa aggattttgt acccaggatt caccacaggg tgttcggttc gcagattatt 480 cctccgcttt cacatctagc caaatggccg ccgcaacatt tgaccgctca attctttatc 540 aacgaggcca agccatggca caggaacaca aggctaaggg tatcacaatt caattgggcc 600 ctgttgccgg ccctctcggt cgcatccccg agggcggccg caactgggaa ggattctccc 660 ctgatcctgt cttgactggt atagccatgg ctgagacaat taagggcatg caggatactg 720 gagtgattgc ttgcgctaaa cattatattg gaaacgagca ggagcacttc cgtcaagtgg 780 gtgaagctgc gggtcacgga tacactattt ccgatactat ttcatctaat attgacgacc 840 gtgctatgca tgagctatac ttgtggccat ttgctgatgc cgttcgcgct ggtgtgggtt 900 ctttcatgtg ctcatactct cagatcaaca actcctacgg atgccaaaac agtcagaccc 960 tcaacaagct cctcaagagc gaattgggct tccaaggctt tgtcatgagc gattggggtg 1020 cccatcactc tggagtgtca tcggcgctag ctggacttga tatgagcatg ccgggtgata 1080 ccgaatttga ttctggcttg agcttctggg gctctaacct caccattgca attctgaacg 1140 gcacggttcc cgaatggcgc ctggatgaca tggcgatgcg aattatggct gcatacttca 1200 aagttggcct tactattgag gatcaaccag atgtcaactt caatgcctgg acccatgaca 1260 cctacggata taaatacgct tatagcaagg aagattacga gcaggtcaac tggcatgtcg 1320 atgttcgcag cgaccacaat aagctcattc gcgagactgc cgcgaagggt acagttctgc 1380 tgaagaacaa ctttcatgct ctccctctga agcagcccag gttcgtggcc gtcgttggtc 1440 aggatgccgg gccaaacccc aagggcccta acggctgcgc agaccgagga tgcgaccaag 1500 gcactctcgc aatgggatgg ggctcagggt ctaccgaatt cccttacctg gtcactcctg 1560 acactgctat tcagtcaaag gtcctcgaat acgggggtcg atacgagagt atttttgata 1620 actatgacga caatgctatc ttgtcgcttg tctcacagcc tgatgcaacc tgtatcgttt 1680
ttgcaaatgc cgattccggt gaaggctaca tcactgtcga caacaactgg ggtgaccgca 1740
acaatctgac cctctggcaa aatgccgatc aagtgattag cactgtcagc tcgcgatgca 1800
acaacacaat cgttgttctc cactctgtcg gaccagtgtt gctaaatggt atatatgagc 1860
acccgaacat cacagctatt gtctgggcag ggatgccagg cgaagaatct ggcaatgctc 1920
tcgtggatat tctttggggc aatgttaacc ctgccggtcg cactccgttc acctgggcca 1980
aaagtcgaga ggactatggc actgatataa tgtacgagcc caacaacggc cagcgtgcgc 2040
ctcagcagga tttcaccgag agcatctacc tcgactaccg ccatttcgac aaagctggta 2100
tcgagccaat ttacgagttt ggattcggcc tctcctatac caccttcgaa tactctgacc 2160
tccgtgttgt gaagaagtat gttcaaccat acagtcccac gaccggcacc ggtgctcaag 2220
caccttccat cggacagcca cctagccaga acctggatac ctacaagttc cctgctacat 2280
acaagtacat caaaaccttc atttatccct acctgaacag cactgtctcc ctccgcgctg 2340
cttccaagga tcccgaatac ggtcgtacag actttatccc accccacgcg cgtgatggct 2400
cccctcaacc tctcaacccc gctggagacc cagtggccag tggtggaaac aacatgctct 2460
acgacgaact ttacgaggtc actgcacaga tcaaaaacac tggcgacgtg gccggcgacg 2520
aagtcgtcca gctttacgta gatctcgggg gtgacaaccc gcctcgtcag ttgagaaact 2580
ttgacaggtt ttatctgctg cccggtcaga gctcaacatt ccgggctaca ttgacgcgcc 2640
gtgatttgag caactgggat attgaggcgc agaactggcg agttacggaa tcgcctaaga 2700
gagtgtatgt tggacggtcg agtcgggatt tgccgctgag ctcacaattg gagtaatgat 2760
catgtctacc aatagatgtt gaatgtctgg tgtggatatt 2800 <210> 30 <211> 878 <212> PRT
<213> Penicillium brasilianum <400> 30
Met Gln Gly Ser Thr Ile Phe Leu Ala Phe Ala
Ser Trp
Val Ala Ala Ile Ala Gln Pro Ile Gln Lys His Glu Pro
10
20
25
His Gly Pro Gln Ala Ile Glu Ser Phe Ser Glu
35
40
Pro Trp Met Asn Pro His Ala Glu Gly Trp Glu
50 55
Ala Gln Asp Phe Val Ser Gln Leu Thr Ile Leu 65 70 75
Thr Thr Gly Val Gly Trp Glu Asn Gly Pro Cys
85 90
Ser Ile Pro Arg Leu Gly Phe Lys Gly Phe Cys
100 105
Gln Gly Val Arg Phe Ala Asp Tyr Ser Ser Ala
115
120
Met Ala Ala Ala Thr Phe Asp Arg Ser Ile Leu
130
135
Ala Met Ala Gln Glu His Lys Ala Lys Gly Ile
145
150
155
Pro Val Ala Gly Pro Leu Gly Arg Ile Pro Glu
165 170
Glu Gly Phe Ser Pro Asp Pro Val Leu Thr Gly
180 185
Thr Ile Lys Gly Met Gln Asp Thr Gly Val Ile
195 200
Tyr Ile Gly Asn Glu Gln Glu His Phe Arg Gln
215
210
Gly His Gly Tyr Thr Ile Ser Asp
225
230
Thr Ile Ser 235
Pro Phe
45 Ala Ala 60
Glu Lys
Val Gly
Thr Gln
Phe Thr 125 Tyr Gln 140
Thr Ile
Gly Gly
Ile Ala
Ala Cys 205 Val Gly 220
Ser Asn
Arg Ala Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp
245 250
Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Ser Gln Ile
260
265
Tyr Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys
275
280
Leu Gly Phe Gln Gly Phe Val Met Ser Asp Trp
290
295
Leu Leu 285 Gly Ala 300
Ala Ser Gln 15
Gly Phe Leu 30
Tyr Pro Ser
Tyr Gln Lys
Ile Asn Leu 80
Asn Thr Gly 95
Asp Ser Pro 110
Ser Ser Gln
Arg Gly Gln
Gln Leu Gly 160
Arg Asn Trp 175
Met Ala Glu 190
Ala Lys His
Glu Ala Ala
Ile Asp Asp 240
Ala Val Arg
255 Asn Asn Ser 270
Lys Ser Glu His His Ser Gly Val Ser Ser 305
Thr Glu Phe Asp
Ala Ile Leu Asn 340
Met Arg Ile Met 355
Gln Pro Asp Val 370
Lys Tyr Ala Tyr 385
Asp Val Arg Ser
Gly Thr Val Leu 420
Pro Arg Phe Val 435
Gly Pro Asn Gly 450
Met Gly Trp Gly 465
Asp Thr Ala Ile
Ser Ile Phe Asp 500
Gln Pro Asp Ala 515
Gly Tyr Ile Thr 530
Leu Trp Gln Asn 545
Asn Asn Thr Ile
Gly Ile Tyr Glu 580
Pro Gly Glu Glu 595
Val Asn Pro Ala 610
Asp Tyr Gly Thr 625
Pro Gln Gln Asp
Asp Lys Ala Gly 660
Tyr Thr Thr Phe 675
Gln Pro Tyr Ser 690
Gly Gln Pro Pro 705
Tyr Lys Tyr Ile
Ser Leu Arg Ala 740
Ile Pro Pro His 755
Gly Asp Pro Val 770
Tyr Glu Val Thr 785
Glu Val Val Gln
Ala Leu Ala Gly 310
Ser Gly Leu Ser 325
Gly Thr Val Pro
Ala Ala Tyr Phe 360
Asn Phe Asn Ala 375
Ser Lys Glu Asp 390
Asp His Asn Lys 405
Leu Lys Asn Asn
Ala Val Val Gly 440
Cys Ala Asp Arg 455
Ser Gly Ser Thr 470
Gln Ser Lys Val 485
Asn Tyr Asp Asp
Thr Cys Ile Val 520
Val Asp Asn Asn 535
Ala Asp Gln Val 550
Val Val Leu His 565
His Pro Asn Ile
Ser Gly Asn Ala 600
Gly Arg Thr Pro 615
Asp Ile Met Tyr 630
Phe Thr Glu Ser 645
Ile Glu Pro Ile
Glu Tyr Ser Asp 680
Pro Thr Thr Gly 695
Ser Gln Asn Leu 710
Lys Thr Phe Ile 725
Ala Ser Lys Asp
Ala Arg Asp Gly 760
Ala Ser Gly Gly 775
Ala Gln Ile Lys 790
Leu Tyr Val Asp
Leu Asp Met Ser 315
Phe Trp Gly Ser 330
Glu Trp Arg Leu 345
Lys Val Gly Leu
Trp Thr His Asp 380
Tyr Glu Gln Val 395
Leu Ile Arg Glu 410
Phe His Ala Leu 425
Gln Asp Ala Gly
Gly Cys Asp Gln 460
Glu Phe Pro Tyr 475
Leu Glu Tyr Gly 490
Asn Ala Ile Leu 505
Phe Ala Asn Ala
Trp Gly Asp Arg 540
Ile Ser Thr Val 555
Ser Val Gly Pro 570
Thr Ala Ile Val 585
Leu Val Asp Ile
Phe Thr Trp Ala 620
Glu Pro Asn Asn 635
Ile Tyr Leu Asp 650
Tyr Glu Phe Gly 665
Leu Arg Val Val
Thr Gly Ala Gln 700
Asp Thr Tyr Lys 715
Tyr Pro Tyr Leu 730
Pro Glu Tyr Gly 745
Ser Pro Gln Pro
Asn Asn Met Leu 780
Asn Thr Gly Asp 795
Leu Gly Gly Asp
Met Pro Gly Asp 320
Asn Leu Thr Ile 335
Asp Asp Met Ala 350
Thr Ile Glu Asp 365
Thr Tyr Gly Tyr
Asn Trp His Val 400
Thr Ala Ala Lys 415
Pro Leu Lys Gln 430
Pro Asn Pro Lys 445
Gly Thr Leu Ala
Leu Val Thr Pro 480
Gly Arg Tyr Glu 495
Ser Leu Val Ser 510
Asp Ser Gly Glu 525
Asn Asn Leu Thr
Ser Ser Arg Cys 560
Val Leu Leu Asn 575
Trp Ala Gly Met 590
Leu Trp Gly Asn 605
Lys Ser Arg Glu
Gly Gln Arg Ala 640
Tyr Arg His Phe 655
Phe Gly Leu Ser 670
Lys Lys Tyr Val 685
Ala Pro Ser Ile
Phe Pro Ala Thr 720
Asn Ser Thr Val 735
Arg Thr Asp Phe 750
Leu Asn Pro Ala 765
Tyr Asp Glu Leu
Val Ala Gly Asp 800
Asn Pro Pro Arg 805 810 815
Gln Leu Arg Asn Phe Asp Arg Phe Tyr Leu Leu Pro Gly Gln Ser Ser 820 825 830 Thr Phe Arg Ala Thr Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Ile 835 840 845 Glu Ala Gln Asn Trp Arg Val Thr Glu Ser Pro Lys Arg Val Tyr Val 850 855 860 Gly Arg Ser Ser Arg Asp Leu Pro Leu Ser Ser Gln Leu Glu
865 870 875
<210> 31 <211> 2235 <212> DNA
<213> Trichoderma reesei <400> 31
atgcgttacc gaacagcagc tgcgctggca cttgccactg ggccctttgc tagggcagac 60
agtcactcaa catcgggggc ctcggctgag gcagttgtac ctcctgcagg gactccatgg 120
ggaaccgcgt acgacaaggc gaaggccgca ttggcaaagc tcaatctcca agataaggtc 180
ggcatcgtga gcggtgtcgg ctggaacggc ggtccttgcg ttggaaacac atctccggcc 240
tccaagatca gctatccatc gctatgcctt caagacggac ccctcggtgt tcgatactcg 300
acaggcagca cagcctttac gccgggcgtt caagcggcct cgacgtggga tgtcaatttg 360
atccgcgaac gtggacagtt catcggtgag gaggtgaagg cctcggggat tcatgtcata 420
cttggtcctg tggctgggcc gctgggaaag actccgcagg gcggtcgcaa ctgggagggc 480
ttcggtgtcg atccatatct cacgggcatt gccatgggtc aaaccatcaa cggcatccag 540
tcggtaggcg tgcaggcgac agcgaagcac tatatcctca acgagcagga gctcaatcga 600
gaaaccattt cgagcaaccc agatgaccga actctccatg agctgtatac ttggccattt 660
gccgacgcgg ttcaggccaa tgtcgcttct gtcatgtgct cgtacaacaa ggtcaatacc 720
acctgggcct gcgaggatca gtacacgctg cagactgtgc tgaaagacca gctggggttc 780
ccaggctatg tcatgacgga ctggaacgca cagcacacga ctgtccaaag cgcgaattct 840
gggcttgaca tgtcaatgcc tggcacagac ttcaacggta acaatcggct ctggggtcca 900
gctctcacca atgcggtaaa tagcaatcag gtccccacga gcagagtcga cgatatggtg 960
actcgtatcc tcgccgcatg gtacttgaca ggccaggacc aggcaggcta tccgtcgttc 1020
aacatcagca gaaatgttca aggaaaccac aagaccaatg tcagggcaat tgccagggac 1080
ggcatcgttc tgctcaagaa tgacgccaac atcctgccgc tcaagaagcc cgctagcatt 1140
gccgtcgttg gatctgccgc aatcattggt aaccacgcca gaaactcgcc ctcgtgcaac 1200
gacaaaggct gcgacgacgg ggccttgggc atgggttggg gttccggcgc cgtcaactat 1260
ccgtacttcg tcgcgcccta cgatgccatc aataccagag cgtcttcgca gggcacccag 1320
gttaccttga gcaacaccga caacacgtcc tcaggcgcat ctgcagcaag aggaaaggac 1380
gtcgccatcg tcttcatcac cgccgactcg ggtgaaggct acatcaccgt ggagggcaac 1440
gcgggcgatc gcaacaacct ggatccgtgg cacaacggca atgccctggt ccaggcggtg 1500
gccggtgcca acagcaacgt cattgttgtt gtccactccg ttggcgccat cattctggag 1560
cagattcttg ctcttccgca ggtcaaggcc gttgtctggg cgggtcttcc ttctcaggag 1620
agcggcaatg cgctcgtcga cgtgctgtgg ggagatgtca gcccttctgg caagctggtg 1680
tacaccattg cgaagagccc caatgactat aacactcgca tcgtttccgg cggcagtgac 1740
agcttcagcg agggactgtt catcgactat aagcacttcg acgacgccaa tatcacgccg 1800
cggtacgagt tcggctatgg actgtcttac accaagttca actactcacg cctctccgtc 1860
ttgtcgaccg ccaagtctgg tcctgcgact ggggccgttg tgccgggagg cccgagtgat 1920
ctgttccaga atgtcgcgac agtcaccgtt gacatcgcaa actctggcca agtgactggt 1980
gccgaggtag cccagctgta catcacctac ccatcttcag cacccaggac ccctccgaag 2040
cagctgcgag gctttgccaa gctgaacctc acgcctggtc agagcggaac agcaacgttc 2100
aacatccgac gacgagatct cagctactgg gacacggctt cgcagaaatg ggtggtgccg 2160
tcggggtcgt ttggcatcag cgtgggagcg agcagccggg atatcaggct gacgagcact 2220
ctgtcggtag cgtag 2235 <210> 32 <211> 744 <212> PRT
<213> Trichoderma reesei <400> 32
Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe 10 15
Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val
25 30
Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys 40 45 Ala Ala Leu Ala
Gly Val Gly Trp 65
Ser Lys Ile Ser
Val Arg Tyr Ser 100
Ala Ser Thr Trp 115
Gly Glu Glu Val 130
Ala Gly Pro Leu 145
Phe Gly Val Asp
Asn Gly Ile Gln 180
Leu Asn Glu Gln 195
Asp Arg Thr Leu 210
Gln Ala Asn Val 225
Thr Trp Ala Cys
Gln Leu Gly Phe 260
Thr Thr Val Gln 275
Thr Asp Phe Asn 290
Ala Val Asn Ser 305
Thr Arg Ile Leu
Tyr Pro Ser Phe 340
Asn Val Arg Ala 355
Ala Asn Ile Leu 370
Ser Ala Ala Ile 385
Asp Lys Gly Cys
Ala Val Asn Tyr 420
Arg Ala Ser Ser 435
Thr Ser Ser Gly 450
Phe Ile Thr Ala 465
Ala Gly Asp Arg
Val Gln Ala Val 500
Ser Val Gly Ala 515
Lys Ala Val Val 530
Leu Val Asp Val
Lys Leu Asn Leu 55
Asn Gly Gly Pro 70
Tyr Pro Ser Leu 85
Thr Gly Ser Thr
Asp Val Asn Leu 120
Lys Ala Ser Gly 135
Gly Lys Thr Pro 150
Pro Tyr Leu Thr 165
Ser Val Gly Val
Glu Leu Asn Arg 200
His Glu Leu Tyr 215
Ala Ser Val Met 230
Glu Asp Gln Tyr 245
Pro Gly Tyr Val
Ser Ala Asn Ser 280
Gly Asn Asn Arg 295
Asn Gln Val Pro 310
Ala Ala Trp Tyr 325
Asn Ile Ser Arg
Ile Ala Arg Asp 360
Pro Leu Lys Lys 375
Ile Gly Asn His 390
Asp Asp Gly Ala 405
Pro Tyr Phe Val
Gln Gly Thr Gln 440
Ala Ser Ala Ala 455
Asp Ser Gly Glu 470
Asn Asn Leu Asp 485
Ala Gly Ala Asn
Ile Ile Leu Glu 520
Trp Ala Gly Leu 535
Leu Trp Gly Asp
27
Gln Asp Lys Val 60
Cys Val Gly Asn 75
Cys Leu Gln Asp 90
Ala Phe Thr Pro 105
Ile Arg Glu Arg
Ile His Val Ile 140
Gln Gly Gly Arg 155
Gly Ile Ala Met 170
Gln Ala Thr Ala 185
Glu Thr Ile Ser
Thr Trp Pro Phe 220
Cys Ser Tyr Asn 235
Thr Leu Gln Thr 250
Met Thr Asp Trp 265
Gly Leu Asp Met
Leu Trp Gly Pro 300
Thr Ser Arg Val 315
Leu Thr Gly Gln 330
Asn Val Gln Gly 345
Gly Ile Val Leu
Pro Ala Ser Ile 380
Ala Arg Asn Ser 395
Leu Gly Met Gly 410
Ala Pro Tyr Asp 425
Val Thr Leu Ser
Arg Gly Lys Asp 460
Gly Tyr Ile Thr 475
Pro Trp His Asn 490
Ser Asn Val Ile 505
Gln Ile Leu Ala
Pro Ser Gln Glu 540
Val Ser Pro Ser
Gly Ile Val Ser
Thr Ser Pro Ala 80
Gly Pro Leu Gly 95
Gly Val Gln Ala 110
Gly Gln Phe Ile 125
Leu Gly Pro Val
Asn Trp Glu Gly 160
Gly Gln Thr Ile 175
Lys His Tyr Ile 190
Ser Asn Pro Asp 205
Ala Asp Ala Val
Lys Val Asn Thr 240
Val Leu Lys Asp 255
Asn Ala Gln His 270
Ser Met Pro Gly 285
Ala Leu Thr Asn
Asp Asp Met Val 320
Asp Gln Ala Gly 335
Asn His Lys Thr 350
Leu Lys Asn Asp 365
Ala Val Val Gly
Pro Ser Cys Asn 400
Trp Gly Ser Gly 415
Ala Ile Asn Thr 430
Asn Thr Asp Asn 445
Val Ala Ile Val
Val Glu Gly Asn 480
Gly Asn Ala Leu 495
Val Val Val His 510
Leu Pro Gln Val 525
Ser Gly Asn Ala Gly Lys Leu Val 545 550 555 560
Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser
565 570 575
Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His
580 585 590
Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu
595 600 605
Ser Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala
610 615 620
Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp 625 630 635 640
Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly
645 650 655
Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser
660 665 670
Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu
675 680 685
Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg
690 695 700
Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro 705 710 715 720
Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg
725 730 735
Leu Thr Ser Thr Leu Ser Val Ala 740
<210> 33 <211> 29 <212> DNA
<213> Trichoderma reesei <400> 33
aacgttaatt aaggaatcgt tttgtgttt <210> 34 <211> 29 <212> DNA
<213> Trichoderma reesei <400> 34
agtactagta gctccgtggc gaaagcctg <210> 35 <211> 31 <212> DNA
<213> Saccharomyces cerevisiae <400> 35
ttgaattgaa aatagattga tttaaaactt c <210> 36 <211> 25 <212> DNA
<213> Saccharomyces cerevisiae <400> 36
ttgcatgcgt aatcatggtc atagc <210> 37 <211> 26 <212> DNA
<213> Saccharomyces cerevisiae <400> 37
ttgaattcat gggtaataac tgatat <210> 38 <211> 32 <212> DNA
<213> Saccharomyces cerevisiae <400> 38
aaatcaatct attttcaatt caattcatca tt <210> 39 <211> 11 <212> DNA
<213> Aspergillus niger <400> 39 gtactaaaac c
<210> 40 11
<211> Il <212> DNA
<213> Aspergillus niger <400> 40 ccgttaaatt t
<210> 41 11
<211> 45 <212> DNA
<213> Aspergillus niger <400> 41
SlSr4Tt gaCtCCggaa a^ttaaeggt ttggtcttgc atccc 45
<211> 14 <212> DNA
<213> Aspergillus niger <4 00> 42 atgcaattta aact
<210> 43 14
<211> 14 <212> DNA
<213> Aspergillus niger <400> 43 cggcaattta acgg
<210> 44 14
<211> 44 <212> DNA
<213> Aspergillus niger <4 00> 44
<2ΪθΓ495αθ tgCagaCggC aa^ttaacgg cttctgcgaa tcgc 44
<211> 29 <212> DNA
<213> Humicola insolens <400> 45
aagcttaagc atgcgttcct cccccctcc
<210> 46 29
<211> 32 <212> DNA
<213> Humicola insolens <400> 46
ctgcagaatt ctacaggcac tgatggtacc ag
<210> 47 32
<211> 32 <212> DNA
<213> Triehoderma reesei <400> 47
ctgcagaatt ctacaggcac tgatggtacc aa
<210> 48 32
<211> 36 <212> DNA
<213> Trichoderma reesei <400> 48
accgcggact gcgcatcatg cgttcctccc ccctcc
<210> 49 36
<211> 29 <212> DNA
<213> Trichoderma reesei <400> 49 aaacgtcgac cgaatgtagg attgttatc 29
<210> 50 <211> 17 <212> DNA
<213> Trichoderma reesei <400> 50
gatgcgcagt ccgcggt 17
<210> 51 <211> 29 <212> DNA
<213> Trichoderma reesei <400> 51
aaacgtcgac cgaatgtagg attgttatc 29
<210> 52 <211> 36 <212> DNA
<213> Trichoderma reesei <400> 52
ggagggggga ggaacgcatg atgcgcagtc cgcggt 36
<210> 53 <211> 29 <212> DNA
<213> Trichoderma reesei <4 00> 53
aaacgtcgac cgaatgtagg attgttatc 29
<210> 54 <211> 32 <212> DNA
<213> Trichoderma reesei <400> 54
ctgcagaatt ctacaggcac tgatggtacc ag 32
<210> 55 <211> 46 <212> DNA
<213> Aspergillus oryzae <400> 55
atagtcaacc gcggactgcg catcatgaag cttggttgga tcgagg 4 6
<210> 56 <211> 26 <212> DNA
<213> Aspergillus oryzae <400> 56
actagtttac tgggccttag gcagcg 26
<210> 57 <211> 26 <212> DNA
<213> Trichoderma reesei <4 00> 57
gtcgactcga agcccgaatg taggat 26
<210> 58 <211> 45 <212> DNA
<213> Trichoderma reesei <400> 58
cctcgatcca accaagcttc atgatgcgca gtccgcggtt gacta 4 5
<210> 59 <211> 57 <212> DNA
<213> Aspergillus oryzae <400> 59
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgcc 57
<210> 60 <211> 19 <212> PRT
<213> Aspergillus oryzae <400> 60
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val Val Ser Ala 10 15
<210> 61 <211> 42 <212> DNA
<213> Aspergillus oryzae <400> 61
ItwlgIft ggCCCttgCC aaggatgatc tcgcgtactc cc
<211> 28 <212> DNA
<213> Aspergillus oryzae <400> 62
gactagtctt actgggcctt aggcaqcg <210> 63 <211> 63 <212> DNA
<213> Humicola insolens <400> 63
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt
<210> 64 <211> 21 <212> PRT
<213> Humicola insolens <400> 64
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
10
Val Leu Ala Leu Ala 15
20
<210> 65 <211> 30 <212> DNA
<213> Trichoderma reesei <400> 65
acgcgtcgac cgaatgtagg attgttatcc <210> 66 <211> 42 <212> DNA
<213> Trichoderma reesei <400> 66
Siofe?90 gagatCatCC "ggcaaggg ccaacaccgg ca
<211> 20 <212> DNA
<213> Trichoderma reesei <4 00> 67
ceeaagetta gccaagaaea <210> 68 <211> 29 <212> DNA
<213> Trichoderma reesei <400> 68
gggggaggaa egeatgggat ctqqacqac <210> 69 <211> 30 <212> DNA
<213> Aspergillus oryzae <400> 69
gccgtccaga tccccatgcg ttcctccccc 30 <210> 70 <211> 20 <212> DNA
<213> Aspergillus oryzae <4 00> 70
ccaagcttgt tcagagtttc 20 <210> 71 <211> 20 <212> DNA
<213> Aspergillus oryzae <4 00> 71
ggactgcgca gcatgcgttc 20 <210> 72 <211> 30 <212> DNA
<213> Aspergillus oryzae <400> 72
agttaattaa ttactgggcc ttaggcagcg 30 <210> 73 <211> 3294 <212> DNA
<213> Aspergillus oryzae <4 00> 73
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 54 0
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 84 0
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaagg tttctcacca 1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440
gtcatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560
catcacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 204 0
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280 atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 2460
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294 <210> 74 <211> 1097 <212> PRT
<213> Aspergillus oryzae <4 00> 74
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro 1 5 10 15 Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys 20 25 30 Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro 35 40 45 Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala 50 55 60 Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln 65 70 75 80 Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr 85 90 95 Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu 100 105 110 Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln 115 120 125 Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn 130 135 140 Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe 145 150 155 160 Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu 165 170 175 Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe 180 185 190 Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val 195 200 205 Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp 210 215 220 Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu
225
230
235
Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala
245 250
Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro
260
265
Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg
275
280
Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu
290 295
Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly
305 310 315
Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly
Ala Val 285 Thr Thr 300
Ser Val
240
Leu Ala Lys
255 Trp Ala Asp 270
Asp Ile Val
Gly Thr Gly
Pro Arg Leu 320
Ile Arg Phe 325 330 335 Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr 340 345 350 Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu 355 360 365 Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro 370 375 380 Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Gly Phe Ser Pro 385 390 395 400 Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile 405 410 415 Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu 420 425 430 Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn 435 440 445 Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu 450 455 460 Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala 465 470 475 480 Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn 485 490 495 Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly 500 505 510 Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly Val Gly Ala Ala 515 520 525 Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser 530 535 540 Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly 545 550 555 560 Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala 565 570 575 Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe 580 585 590 Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser 595 600 605 Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp 610 615 620 His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu 625 630 635 640 Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala 645 650 655 Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys 660 665 670 Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser 675 680 685 Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln 690 695 700 Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser 705 710 715 720 Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser 725 730 735 Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp 740 745 750 Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp 755 760 765 Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile 770 775 780 Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro 785 790 795 800 Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly 805 810 815 Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys 820 825 830 Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu 835 840 845 Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr 850 855 860 Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr 865 870 875 880 Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu 885 890 895 Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr 900 905 910 Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala 915 920 925 Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile 930 935 940 Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser 945 950 955 960 Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp 965 970 975 Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn 980 985 990 Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser ■ Val Lys Val Lys As: 995 1000 1005 Thr Gly Asn Val Ala ι Gly Asp ι Glu Val Pro Gln Leu Tyr Val Ser
1010 1015
Leu Gly Gly Pro Asn Glu Pro
1025 1030
Arg Ile His Leu Ala Pro Ser
1040 1045
Leu Thr Arg Arg Asp Leu Ala
1055 1060
Trp Thr Val Thr Pro Tyr Pro
1075
Lys Leu Pro Leu Gln 1090
1020
Lys Val Val Leu Arg 1035
Gln Glu Ala Val Trp 1050
Asn Trp Asp Val Ser 1065
Lys Phe Glu Thr Thr Thr Ala Gln Asp Gly Asn Ser
1080
Ala Ser Leu Pro Lys 1095
Ala Gln
Lys Thr Ile Tyr Val
1070 Ser Arg
1085 <210> 75 <211> 3294 <212> DNA
<213> Aspergillus oryzae <400> 75
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 840
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaaag tttctcacca 1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440 gttatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560
caacacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 2040
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280
atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 24 60
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294 <210> 76 <211> 1097 <212> PRT
<213> Aspergillus oryzae <4 00> 76
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro 1 5 10 15 Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys 20 25 30 Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro 35 40 45 Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala 50 55 60 Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln 65 70 75 80 Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr 85 90 95 Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu 100 105 110 Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln 115 120 125 Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn 130 135 140 Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe 145 150 155 160 Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu 165 170 175 Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe 180 185 190 Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val 195 200 205 Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp 210 215 220 Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu 225 230 235 240 Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys 245 250 255 Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp 260 265 270 Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val 275 280 285 Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly 290 295 300 Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu 305 310 315 320 Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe 325 330 335 Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr 340 345 350 Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu 355 360 365 Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro 370 375 380 Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Ser Phe Ser Pro 385 390 395 400 Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile 405 410 415 Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu 420 425 430 Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn 435 440 445 Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu 450 455 460 Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala 465 470 475 480 Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn 485 490 495 Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly 500 505 510 Phe Val Met Ser Asp Trp Thr Ala Gln His Ser Gly Val Gly Ala Ala 515 520 525 Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser 530 535 540 Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly 545 550 555 560 Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala 565 570 575 Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe 580 585 590 Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser 595 600 605 Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp 610 615 620 His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu 625 630 635 640 Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala 645 650 655 Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys 660 665 670 Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser 675 680 685 Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln 690 695 700 Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser 705 710 715 720 Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser
725 730 735
Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp
740 745 750
Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp
755 760 765
Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile
770 775 780
Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro 785 790 795 800
Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly
805 810 815
Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys
820 825 830
Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu
835 840 845
Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr
850 855 860
Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr 865 870 875 880
Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu
885 890 895
Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr
900 905 910
Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala
915 920 925
Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile
930 935 940
Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser 945 950 955 960
Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp
965 970 975
Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn
980 985 990
Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn
995 1000 1005
Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser
1010 1015 1020
Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu
1025 1030 1035
Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr
1040 1045 1050
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
1055 1060 1065
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser
1070 1075 1080
Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln 1085 1090 1095
Claims (56)
1. Método para produzir um polipeptídeo secretado tendo atividade biológica, caracterizado pelo fato de compreender: (a) transformar uma célula hospedeira fungica com uma construção de proteína de fusão codificando uma proteína de fusão, em que a construção de proteína de fusão compreende: (i) um primeiro polinucleotídeo compreendendo uma seqüência nucleotídica codificando um peptídeo de sinal; (ii) um segundo polinucleotídeo codificando uma seqüência nucleotídica codificando pelo menos um domínio catalítico de uma endoglucanase ou uma porção da mesma; e (iii) um terceiro polinucleotídeo compreendendo uma seqüência nucleotídica codificando pelo menos um domínio catalítico de um polipeptídeo tendo atividade biológica ou uma porção da mesma; em que o peptídeo de sinal e pelo menos o domínio catalítico da endoglucanase ou da porção da mesma aumenta a secreção do polipeptídeo tendo atividade biológica ou a porção da mesma comparada à ausência de pelo menos o domínio catalítico da endoglucanase ou a porção da mesma; (b) cultivar a célula hospedeira fungica transformada sob condições apropriadas para a produção da proteína de fusão, e (c) recuperar a proteína de fusão, um componente da mesma, ou uma combinação da mesma, do meio de cultivo, em que a proteína de fusão ou o componente da mesma tem atividade biológica.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a extremidade 3' do primeiro polinucleotídeo é ligada operativamente à extremidade 5' do segundo polinucleotídeo e a extremidade 3' do segundo polinucleotídeo é ligada operativamente à extremidade 5' do terceiro polinucleotídeo ou a extremidade 3' do primeiro polinucleotídeo é ligada operativamente à extremidade 5' do terceiro polinucleotídeo e a extremidade 3' do terceiro polinucleotídeo é ligada operativãmente à extremidade 5' do segundo polinucleotídeo para codificar uma proteína de fusão.
3. Método de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que o primeiro polinucleotídeo codificando o peptídeo de sinal é obtido de um gene de endoglucanase CEL45 de Humicola insolens (cel45).
4. Método de acordo com qualquer uma das reivindicações 1- 3, caracterizado pelo fato de que o segundo polinucleotídeo compreendendo a seqüência nucleotídica codificando pelo menos o domínio catalítico de endoglucanase ou a porção do mesmo é obtido a partir de um gene de endoglucanase CEL45 de Humicola insolens (cel45).
5. Método de acordo com qualquer uma das reivindicações 1- 3, caracterizado pelo fato de que o segundo polinucleotídeo compreendendo a seqüência nucleotídica codificando pelo menos o domínio catalítico de endoglucanase ou a porção do mesmo é obtido de um gene codificando uma endoglucanase compreendendo uma seqüência de aminoácido tendo pelo menos 70%, preferivelmente pelo menos 75%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, o mais preferivelmente pelo menos 90%, e ainda mais preferivelmente pelo menos 95% de identidade para SEQ ID NO: 2.
6. Método de acordo com qualquer uma das reivindicações 1- 5, caracterizado pelo fato de que a construção de proteína de fusão ainda compreende um polinucleotídeo codificando um módulo de ligação de carboidrato.
7. Método de acordo com qualquer uma das reivindicações Ι- ό, caracterizado pelo fato de que o segundo polinucleotídeo codifica um domínio catalítico ou uma porção do mesmo, um polipeptídeo maduro, ou um polipeptídeo de comprimento completo da endoglucanase.
8. Método de acordo com qualquer uma das reivindicações 1- -7, caracterizado pelo fato de que o terceiro polinucleotídeo codifica um domínio catalítico ou uma porção do mesmo, um polipeptídeo maduro, ou um polipeptídeo de comprimento completo do polipeptídeo tendo atividade biológica.
9. Método de acordo com qualquer uma das reivindicações 1- 8, caracterizado pelo fato de que a construção de proteína de fusão ainda compreende um polinucleotídeo codificando um ligando localizado entre a seqüência nucleotídica codificando pelo menos o domínio catalítico de endoglucanase ou a porção do mesmo e a seqüência nucleotídica codificando pelo menos o domínio catalítico de um polipeptídeo tendo atividade biológica ou a porção do mesmo e alternativamente também um polinucleotídeo codificando um sítio de clivagem localizado entre a seqüência nucleotídica codificando pelo menos o domínio catalítico de endoglucanase ou a porção do mesmo e a seqüência nucleotídica codificando pelo menos o domínio catalítico de um polipeptídeo tendo atividade biológica ou a porção do mesmo.
10. Método de acordo com qualquer uma das reivindicações 1- 9, caracterizado pelo fato de que a construção de proteína de fusão ainda compreende um quarto polinucleotídeo codificando um segundo peptídeo de sinal.
11. Método de acordo com a reivindicação 10, caracterizado pelo fato de que a extremidade 3' do quarto polinucleotídeo é ligado operativamente para a extremidade 5' do segundo polinucleotídeo ou o terceiro polinucleotídeo.
12. Método de acordo com qualquer uma das reivindicações 1-11, caracterizado pelo fato de que a construção de proteína de fusão ainda compreende um promotor e/ou terminador.
13. Método de acordo com a reivindicação 12, caracterizado pelo fato que o promotor aciona a expressão do primeiro, segundo e terceiro polinucleotídeos, e alternativamente também do quarto polinucleotídeo.
14. Método de acordo com qualquer uma das reivindicações 1- 13, caracterizado pelo fato de que o polipeptídeo tendo atividade biológica é um anticorpo, antígeno, peptídeo antimicrobiano, enzima, fator de crescimento, hormônio, imunodilatador, neurotransmissor, receptor, proteína de repórter, ou proteína estrutural.
15. Método de acordo com qualquer uma das reivindicações 1- 14, caracterizado pelo fato de que o polipeptídeo tendo atividade biológica é uma oxidoreductase, transferase, hidrolase, liase, isomerase ou ligase.
16. Método de acordo com qualquer uma das reivindicações 1- 15, caracterizado pelo fato de que o polipeptídeo tendo atividade biológica é uma enzima celulolítica ou uma enzima hemicelulolítica.
17. Método de acordo com a reivindicação 16, caracterizado pelo fato de que a enzima celulolítica é uma beta-glucosidase.
18. Método de acordo com a reivindicação 17, caracterizado pelo fato de que a beta-glucosidase compreende uma seqüência de aminoácido tendo pelo menos 70%, preferivelmente pelo menos 75%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, o mais preferivelmente pelo menos 90%, e ainda o mais preferivelmente pelo menos 95% de identidade para SEQ ID NO: 24, ou uma beta-glucosidase variante compreendendo uma seqüência de aminoácido tendo pelo menos 70%, preferivelmente pelo menos 75%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, o mais preferivelmente pelo menos 90%, e ainda o mais preferivelmente pelo menos 95% de identidade para SEQ ID NO: 35.
19. Método de acordo com qualquer uma das reivindicações 1- 18, caracterizado pelo fato de que a proteína de fusão, um componente da mesma, ou uma combinação da mesma, tem atividade celulolítica ou atividade hemicelulolítica.
20. Proteína de fusão isolada, caracterizada pelo fato de compreender: (a) uma primeira seqüência de aminoácido compreendendo um peptídeo de sinal; (b) uma segunda seqüência de aminoácido compreendendo pelo menos um domínio catalítico de uma endoglucanase ou uma porção da mesma; e (c) uma terceira seqüência de aminoácido compreendendo pelo menos um domínio catalítico de um polipeptídeo tendo atividade biológica ou uma porção da mesma.
21. Proteína de fusão de acordo com a reivindicação 20, caracterizada pelo fato de que a extremidade C-terminal da primeira seqüência de aminoácido é ligada em armação à extremidade N-terminal da segunda seqüência de aminoácido e a extremidade C-terminal da segunda seqüência de aminoácido é ligada em armação à extremidade N-terminal da terceira seqüência de aminoácido ou a extremidade C-terminal da primeira seqüência de aminoácido é ligada em armação à extremidade N-terminal da terceira seqüência de aminoácido e a extremidade C-terminal da terceira seqüência de aminoácido é ligada em armação à extremidade N-terminal da segunda seqüência de aminoácido.
22. Proteína de fusão de acordo com a reivindicação 20 ou 21, caracterizada pelo fato de que a primeira seqüência de aminoácido compreendendo o peptídeo de sinal é obtida de endoglucanase CEL45 de Humicola insolens.
23. Proteína de fusão de acordo com qualquer uma das reivindicações 20-22, caracterizada pelo fato de que a segunda seqüência de aminoácido compreendendo pelo menos o domínio catalítico de endoglucanase é obtida de uma endoglucanase CEL45 de Humicola insolens.
24. Proteína de fusão de acordo com qualquer uma das reivindicações 20-22, caracterizada pelo fato de que a segunda seqüência de aminoácido compreendendo pelo menos o domínio catalítico de endoglucanase é obtida de uma endoglucanase compreendendo uma seqüência de aminoácido tendo pelo menos 70%, preferivelmente pelo menos 75%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, o mais preferivelmente pelo menos 90%, e ainda mais preferivelmente pelo menos 95% de identidade para SEQ ID NO: 2.
25. Proteína de fusão de acordo com qualquer uma das reivindicações 20-24, caracterizada pelo fato de ainda compreender um módulo de ligação de carboidrato.
26. Proteína de fusão de acordo com qualquer uma das reivindicações 20-25, caracterizada pelo fato de que a segunda seqüência de aminoácido compreende um domínio catalítico ou uma porção do mesmo, um polipeptídeo maduro, ou um polipeptídeo de comprimento completo da endoglucanase.
27. Proteína de fusão de acordo com qualquer uma das reivindicações 20-26, caracterizada pelo fato de que a terceira seqüência de aminoácido compreende um domínio catalítico ou uma porção do mesmo, um polipeptídeo maduro, ou um polipeptídeo de comprimento completo do polipeptídeo tendo atividade biológica.
28. Proteína de fusão de acordo com qualquer uma das reivindicações 20-27, caracterizada pelo fato de ainda compreender um ligador localizado entre pelo menos o domínio catalítico de endoglucanase ou a porção do mesmo e pelo menos o domínio catalítico do polipeptídeo tendo atividade biológica ou a porção do mesmo e alternativamente também um sítio de clivagem localizado entre pelo menos o domínio catalítico de endoglucanase ou a porção do mesmo e pelo menos o domínio catalítico de um polipeptídeo tendo atividade biológica ou a porção do mesmo.
29. Proteína de fusão de acordo com qualquer uma das reivindicações 20-28, caracterizada pelo fato de ainda compreender uma quarta seqüência de aminoácido compreendendo um segundo peptídeo de sinal.
30. Proteína de fusão de acordo com qualquer uma das reivindicações 20-29, caracterizada pelo fato de que o segundo peptídeo de sinal é ligado em armação ao N-terminal da seqüência de aminoácido compreendendo pelo menos o domínio catalítico do polipeptídeo tendo atividade biológica ou a porção do mesmo ou pelo menos o domínio catalítico da endoglucanase ou a porção do mesmo.
31. Proteína de fusão de acordo com qualquer uma das reivindicações 20-30, caracterizada pelo fato de que o polipeptídeo tendo atividade biológica é um anticorpo, antígeno, peptídeo antimicrobiano, enzima, fator de crescimento, hormônio, imunodilatador, neurotransmissor, receptor, proteína de repórter, ou proteína estrutural.
32. Proteína de fusão de acordo com qualquer uma das reivindicações 20-31, caracterizada pelo fato de que o polipeptídeo tendo atividade biológica é uma oxidoreductase, transferase, hidrolase, liase, isomerase ou ligase.
33. Proteína de fusão de acordo com qualquer uma das reivindicações 20-32, caracterizada pelo fato de que o polipeptídeo tendo atividade biológica é uma enzima celulolítica ou uma enzima hemicelulolítica.
34. Proteína de fusão de acordo com a reivindicação 33, caracterizada pelo fato de que a enzima celulolítica é uma beta-glucosidase.
35. Proteína de fusão de acordo com a reivindicação 34, caracterizada pelo fato de que a beta-glucosidase compreende uma seqüência de aminoácido tendo pelo menos 70%, preferivelmente pelo menos 75%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%>, o mais preferivelmente pelo menos 90%, e ainda mais preferivelmente pelo menos 95%> de identidade para SEQ ID NO: 24 ou uma beta-glucosidase variante compreendendo uma seqüência de aminoácido tendo pelo menos 70%, preferivelmente pelo menos 75%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, o mais preferivelmente pelo menos 90%, e mesmo o mais preferivelmente pelo menos 95% de identidade para SEQ ID NO: 35.
36. Proteína de fusão de acordo com a reivindicação 34, caracterizada pelo fato de que a beta-glucosidase é SEQ ID NO: 24 ou SEQ ID NO: 35.
37. Proteína de fusão de acordo com qualquer uma das reivindicações 20-36, caracterizada pelo fato de que é uma proteína de fusão de beta-glucosidase ou componentes da mesma.
38. Proteína de fusão de acordo com a reivindicação 37, caracterizada pelo fato de que compreende SEQ ID NO: 74 ou SEQ ID NO: 76.
39. Proteína de fusão de acordo com a reivindicação 38, caracterizada pelo fato de que SEQ ID NO: 74 é codificada por SEQ ID NO: 73 e SEQ ID NO: 76 é codificada por SEQ ID NO: 75.
40. Proteína de fusão de acordo com qualquer uma das reivindicações 20-40, caracterizada pelo fato de que a proteína de fusão, um componente a mesma, ou uma combinação da mesma, tem atividade celulolítica ou atividade hemicelulolítica.
41. Polinucleotídeo isolado, caracterizado pelo fato de codificar a proteína de fusão como definida em qualquer uma das reivindicações 20-40.
42. Construção de proteína de fusão, caracterizada pelo fato de compreender o polinucleotídeo definido na reivindicação 41.
43. Vetor de expressão, caracterizado pelo fato de compreender a construção de proteína de fusão definida na reivindicação 42.
44. Célula hospedeira fungica, caracterizada pelo fato de ser transformada com a construção de proteína de fusão definida na reivindicação 43.
45. Método para degradar ou converter um material celulósico, caracterizado pelo fato de compreender: tratar o material celulósico com uma quantidade eficaz de uma composição de enzima celulolítica na presença de uma quantidade eficaz da proteína de fusão da reivindicação 40 ou um componente da mesma.
46. Método de acordo com a reivindicação 45, caracterizado pelo fato de que a composição de enzima celulolítica compreende uma ou mais proteínas celulolíticas que são selecionadas dentre o grupo consistindo de uma celulase, uma endoglucanase, uma celobiohidrolase, e um polipeptídeo tendo atividade de melhora celulolítica.
47. Método de acordo com a reivindicação 45 ou 46, caracterizado pelo fato de ainda compreender tratar o material celulósico com uma quantidade eficaz de uma ou mais enzimas selecionadas dentre o grupo consistindo de uma hemicelulase, esterase, protease, laccase, peroxidase, ou uma mistura das mesmas.
48. Método de acordo com qualquer uma das reivindicações 45-47, caracterizado pelo fato de que o método é um processo de pré- tratamento, uma etapa em um processo de sacarificação e fermentação simultâneas (SSF), uma etapa em uma hidrólise e fermentação separadas (SHF) ou uma etapa em um processo de hidrólise e fermentação híbrido (HHF).
49. Método de acordo com qualquer uma das reivindicações 45-48, caracterizado pelo fato de ainda compreender recuperar o material celulósico degradado.
50. Método de acordo com a reivindicação 45, caracterizado pelo fato de que a proteína celulolítica e/ou proteína de fusão ou o componente das mesmas estão na forma de um caldo de fermentação com ou sem células.
51. Método para produzir uma substância, caracterizado pelo fato de compreender: (a) sacarifícar um material celulósico com uma quantidade eficaz de uma composição de enzima celulolítica na presença de uma quantidade eficaz da proteína de fusão da reivindicação 40 ou um componente da mesma; (b) fermentar o material celulósico sacarificado da etapa (a) com um ou mais microorganismos de fermentação, e (c) recuperar a substância orgânica da fermentação.
52. Método de acordo com a reivindicação 51, caracterizado pelo fato de que a composição de enzima celulolítica compreende uma ou mais proteínas que são selecionadas dentre o grupo consistindo de uma celulase, uma endoglucanase, uma celobiohidrolase, e um polipeptídeo tendo atividade de melhora celulolítica.
53. Método de acordo com a reivindicação 51 ou 52, caracterizado pelo fato de ainda compreender tratar o material celulósico com uma quantidade eficaz de uma ou mais enzimas selecionadas dentre o grupo consistindo de uma hemicelulase, esterase, protease, laccase, peroxidase ou uma mistura das mesmas.
54. Método de acordo com qualquer uma das reivindicações 51-53, caracterizado pelo fato de que as etapas (a) e (b) são realizadas simultaneamente em uma sacarificação e fermentação simultâneas.
55. Método de acordo com qualquer uma das reivindicações 51-53, caracterizado pelo fato de que a substância é um álcool, ácido orgânico, cetona, aminoácido ou gás.
56. Método de acordo com qualquer uma das reivindicações 51-55, caracterizado pelo fato de que a composição de enzima celulolítica e/ou proteína de fusão ou um componente das mesmas estão na forma de um caldo de fermentação com ou sem células.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US83251106P | 2006-07-21 | 2006-07-21 | |
| US60/832511 | 2006-07-21 | ||
| PCT/US2007/074038 WO2008057637A2 (en) | 2006-07-21 | 2007-07-20 | Methods of increasing secretion of polypeptides having biological activity |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| BRPI0714870A2 true BRPI0714870A2 (pt) | 2013-05-28 |
Family
ID=39365161
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| BRPI0714870-4A BRPI0714870A2 (pt) | 2006-07-21 | 2007-07-20 | mÉtodo para produzir um polipeptÍdeo secretado tendo atividade biolàgica, proteÍna de fusço isolada, polinucleotÍdeo isolado, construÇço de proteÍna de fusço, vetor de expressço, cÉlula hospedeira féngica, mÉtodos para degradar ou conventer um material celulàsico e para produzir uma substÂncia |
Country Status (8)
| Country | Link |
|---|---|
| US (4) | US8546106B2 (pt) |
| EP (1) | EP2046819B1 (pt) |
| CN (1) | CN101516906B (pt) |
| BR (1) | BRPI0714870A2 (pt) |
| CA (1) | CA2658610A1 (pt) |
| DK (1) | DK2046819T3 (pt) |
| ES (1) | ES2538360T3 (pt) |
| WO (1) | WO2008057637A2 (pt) |
Families Citing this family (186)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| AU2012205191B2 (en) * | 2007-05-31 | 2013-03-21 | Novozymes, Inc. | Compositions for degrading cellulosic material |
| EP2235173A2 (en) | 2007-12-19 | 2010-10-06 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
| BRPI0910091A2 (pt) | 2008-03-27 | 2017-05-30 | Novozymes As | processo para produzir um produto de fermentação |
| BRPI0919525A2 (pt) | 2008-09-30 | 2015-08-18 | Novozymes North America Inc | Métodos para produzir um produto de fermentação a partir de um material contendo lignocelulose, para intensificar hidrólise enzimática e para reduzir o efeito prejudicial de lignina na hidrólise de um material contendo lignocelulose, e, produto de fermentação |
| EP2356136A1 (en) * | 2008-11-10 | 2011-08-17 | Novozymes Inc. | Polypeptides having feruloyl esterase activity and polynucleotides encoding same |
| EP2373788A1 (en) | 2008-12-04 | 2011-10-12 | Novozymes Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
| US20120028299A1 (en) | 2008-12-30 | 2012-02-02 | Novozymes North America, Inc. | Enzymatic Hydrolysis Of Pretreated Lignocellulose-Containing Material With Dissolved Air Flotation Sludge |
| WO2010078392A2 (en) | 2008-12-31 | 2010-07-08 | Novozymes North America, Inc. | Processes of producing fermentation products |
| US8629324B2 (en) * | 2009-01-30 | 2014-01-14 | Novozymes, Inc. | Polypeptides having expansin activity and polynucleotides encoding same |
| CA2752007A1 (en) | 2009-03-24 | 2010-09-30 | Novozymes A/S | Polypeptides having acetyl xylan esterase activity and polynucleotides encoding same |
| WO2010129287A2 (en) | 2009-04-27 | 2010-11-11 | The Board Of Trustees Of The University Of Illinois | Hemicellulose-degrading enzymes |
| WO2010141325A1 (en) | 2009-06-02 | 2010-12-09 | Novozymes, Inc. | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
| EP2449092B1 (en) | 2009-06-30 | 2015-08-12 | Novozymes A/S | Biomass hydrolysis process |
| WO2011005867A1 (en) | 2009-07-07 | 2011-01-13 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity activity and polynucleotides encoding same |
| WO2011035027A2 (en) | 2009-09-17 | 2011-03-24 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
| EP2478095A1 (en) | 2009-09-18 | 2012-07-25 | Novozymes Inc. | Polypeptides having beta-glucosidase activity and polynucleotides encoding same |
| MX2012003473A (es) | 2009-09-29 | 2012-05-22 | Novozymes Inc | Polipeptidos que tienen actividad celulitica mejorada y polinucleotidos que codifican para los mismos. |
| DK2483403T3 (en) | 2009-09-29 | 2018-02-12 | Novozymes Inc | POLYPEPTIDES WITH XYLANASE ACTIVITY AND POLYNUCLEOTIDES CODING THEM |
| WO2011041504A1 (en) | 2009-09-30 | 2011-04-07 | Novozymes, Inc. | Polypeptides derived from thermoascus crustaceus having cellulolytic enhancing activity and polynucleotides encoding same |
| EP2483402A1 (en) | 2009-09-30 | 2012-08-08 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
| US9267125B2 (en) | 2009-11-06 | 2016-02-23 | Novozymes, Inc. | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
| CN104694517B (zh) | 2009-11-06 | 2019-06-28 | 诺维信股份有限公司 | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 |
| CN102947442B (zh) * | 2009-11-06 | 2016-03-09 | 诺维信股份有限公司 | 用于糖化纤维素材料的组合物 |
| AU2010333801B2 (en) * | 2009-12-23 | 2015-12-17 | Danisco Us Inc. | Methods for improving the efficiency of simultaneous saccharification and fermentation reactions |
| US20130040354A1 (en) | 2010-01-29 | 2013-02-14 | Novozymes A/S | Biogas Production Process With Enzymatic Pre-Treatment |
| EP2553111B1 (en) | 2010-03-30 | 2016-05-11 | Novozymes A/S | Methods for enhancing by-products from fermentation processes |
| CN102918151B (zh) | 2010-03-31 | 2015-09-09 | 诺维信股份有限公司 | 纤维二糖水解酶变体及编码其的多核苷酸 |
| EP2588604B1 (en) | 2010-06-30 | 2016-06-29 | Novozymes, Inc. | Polypeptides having beta-glucosidase activity and polynucleotides encoding same |
| WO2012006642A1 (en) | 2010-07-07 | 2012-01-12 | Novozymes North America, Inc. | Fermentation process |
| WO2012012590A2 (en) | 2010-07-23 | 2012-01-26 | Novozymes A/S | Processes for producing fermentation products |
| US9187742B2 (en) | 2010-08-30 | 2015-11-17 | Novozymes, Inc. | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
| US9303074B2 (en) | 2010-08-30 | 2016-04-05 | Novoyzmes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
| WO2012030844A1 (en) | 2010-08-30 | 2012-03-08 | Novozymes A/S | Polypeptides having endoglucanase activity and polynucleotides encoding same |
| US20130212746A1 (en) | 2010-08-30 | 2013-08-15 | Novoyzmes A/S | Polypeptides Having Hemicellulolytic Activity And Polynucleotides Encoding Same |
| US8629325B2 (en) | 2010-08-30 | 2014-01-14 | Novozymes A/S | Polypeptides having beta-glucosidase activity and polynucleotides encoding same |
| US8624082B2 (en) | 2010-08-30 | 2014-01-07 | Novozymes A/S | Polypeptides having xylanase activity and polynucleotides encoding same |
| WO2012058293A1 (en) | 2010-10-26 | 2012-05-03 | Novozymes North America, Inc. | Methods of saccharifying sugarcane trash |
| US9212354B2 (en) | 2010-11-04 | 2015-12-15 | Novozymes Inc. | Polypeptides having cellobiohydrolase activitiy and polynucleotides encoding same |
| BR112013009026A2 (pt) | 2010-11-12 | 2016-07-12 | Novozymes Inc | polipeptídeo isolado, célula hospedeira recombinante, métodos para produzir um polipeptídeo, um mutante de uma célula precursora, uma proteína, e um produto de fermentação, para inibir a expressão de um polipeptídeo, para degradar ou converter um material celulósico, e método para fermentar um material celulósico, planta transgênica, parte de planta ou célula de planta, molécula de rna inibidora de filamento duplo, polinucleotídeo isolado, e, formulação de caldo integral ou composição de cultura de célula |
| EP2649188A1 (en) | 2010-12-06 | 2013-10-16 | Novozymes North America, Inc. | Methods of hydrolyzing oligomers in hemicellulosic liquor |
| US9284588B2 (en) * | 2010-12-16 | 2016-03-15 | Novozymes, Inc. | Promoters for expressing genes in a fungal cell |
| EP2661499A1 (en) | 2011-01-04 | 2013-11-13 | Novozymes A/S | Process for producing biogas from pectin and lignocellulose containing material |
| US9353363B2 (en) | 2011-01-26 | 2016-05-31 | Novozymes A/S | Glycoside hydrolases from thermophilic fungi |
| WO2012103350A1 (en) | 2011-01-26 | 2012-08-02 | Novozymes A/S | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
| DK2668266T3 (en) | 2011-01-26 | 2018-03-26 | Novozymes Inc | POLYPEPTIDES WITH CELLOBIO HYDROASE ACTIVITY AND POLYNUCLEOTIDES CODING THEM |
| CN103517986B (zh) | 2011-01-26 | 2016-12-07 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸 |
| WO2012103322A1 (en) | 2011-01-26 | 2012-08-02 | Novozymes A/S | Polypeptides having endoglucanase activity and polynucleotides encoding same |
| US9434972B2 (en) | 2011-01-31 | 2016-09-06 | Novozymes North America, Inc. | Processes for enzymatic refining of pretreated cellulosic material for saccharification |
| CN103384678B (zh) | 2011-02-23 | 2017-01-18 | 诺维信股份有限公司 | 具有纤维素水解增强活性的多肽及其编码多核苷酸 |
| US9150842B2 (en) | 2011-03-09 | 2015-10-06 | Novozymes A/S | Methods of increasing the cellulolytic enhancing activity of a polypeptide |
| US9409958B2 (en) | 2011-03-10 | 2016-08-09 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
| WO2012130120A1 (en) | 2011-03-25 | 2012-10-04 | Novozymes A/S | Method for degrading or converting cellulosic material |
| EP2691519A1 (en) | 2011-03-31 | 2014-02-05 | Novozymes, Inc. | Cellulose binding domain variants and polynucleotides encoding same |
| WO2012135659A2 (en) | 2011-03-31 | 2012-10-04 | Novozymes A/S | Methods for enhancing the degradation or conversion of cellulosic material |
| CN103649308A (zh) | 2011-04-28 | 2014-03-19 | 诺维信股份有限公司 | 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸 |
| US9624518B2 (en) | 2011-04-29 | 2017-04-18 | Novozymes, Inc. | Methods for enhancing the degradation or conversion of cellulosic material |
| US8993286B2 (en) | 2011-05-19 | 2015-03-31 | Novozymes, Inc. | Methods for enhancing the degradation of cellulosic material with chitin binding proteins |
| WO2012159007A1 (en) | 2011-05-19 | 2012-11-22 | Novozymes, Inc. | Methods for enhancing the degradation of cellulosic material with chitin binding proteins |
| MX2013014236A (es) | 2011-06-28 | 2014-01-23 | Novozymes As | Biogas a partir de bagazo tratado con enzimas. |
| EP2734633B1 (en) | 2011-07-22 | 2019-05-01 | Novozymes North America, Inc. | Processes for pretreating cellulosic material and improving hydrolysis thereof |
| BR112014002405A2 (pt) | 2011-08-04 | 2017-04-04 | Novozymes As | polopeptídeo e polinucleotídeo isolados, composição, construto de ácido nucleico ou vetor de expressão, célula hospedeira recombinante, planta transgênica, parte da planta ou célula de planta, métodos para produzir um polipeptídeo e uma proteína, e, processos para degradar um material celulóssico, para produzir um produto de fermentação, e para fermentar um material celulósico |
| DK3382016T3 (da) | 2011-08-04 | 2019-11-18 | Novozymes Inc | Polypeptider med xylanaseaktivitet og polynukleotider, der koder for dem |
| EP2748321A2 (en) | 2011-08-24 | 2014-07-02 | Novozymes, Inc. | Methods for obtaining positive transformants of a filamentous fungal host cell |
| US9493790B2 (en) | 2011-08-24 | 2016-11-15 | Novozymes, Inc. | Methods for producing multiple recombinant polypeptides in a filamentous fungal host cell |
| US9670510B2 (en) | 2011-09-13 | 2017-06-06 | Novozymes A/S | Methods of hydrolyzing and fermenting cellulosic material |
| WO2013043910A1 (en) | 2011-09-20 | 2013-03-28 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
| CN108373498A (zh) | 2011-09-23 | 2018-08-07 | 诺维信公司 | 纤维素分解酶组合物及其用途 |
| BR112014007651A2 (pt) | 2011-09-30 | 2017-04-11 | Novozymes Inc | polipeptídeo quimérico isolado, polinucleotídeo isolado, métodos para produzir um polipeptídeo quimérico e um produto de fermentação, para degradar ou converter um material celulósico, e para fermentar um material celulósico, planta, parte de planta ou célula de planta transgênica, e, formulação de caldo inteiro ou composição de cultura de células |
| DK2773656T3 (da) | 2011-10-31 | 2019-09-09 | Novozymes Inc | Polypeptider med cellulolyseforbedrende aktivitet og polynukleotider, som koder for dem |
| US9708591B2 (en) | 2011-11-18 | 2017-07-18 | Novozymes Inc. | Polypeptides having endoglucanase activity and polynucleotides encoding same |
| EP3409769A1 (en) | 2011-11-18 | 2018-12-05 | Novozymes A/S | Polypeptides having beta-glucosidase activity, beta-xylosidase activity, or beta-glucosidase and beta-xylosidase activity and polynucleotides encoding same |
| DK3219794T3 (da) | 2011-11-21 | 2019-12-16 | Novozymes Inc | GH61-polypeptidvarianter og polynukleotider, som koder for dem |
| WO2013075644A1 (en) | 2011-11-22 | 2013-05-30 | Novozymes, Inc. | Polypeptides having beta-xylosidase activity and polynucleotides encoding same |
| BR112014012417A2 (pt) | 2011-12-01 | 2017-06-06 | Novozymes Inc | polipeptídeo e polinucleotídeo isolados, célula hospedeira recombinante, métodos para a produção de um polipeptídeo, de um mutante de uma célula de origem, e de uma proteína, e para a inibição da expressão de um polipeptídeo, planta transgênica, parte da planta ou célula de planta, molécula de rna, processos para degradar ou converter um material celulósico ou contendo xilano, para produzir um produto de fermentação, e de fermentação de um material celulósico ou contendo xilano, e, formulação de caldo integral ou composição de cultura de células |
| WO2013083801A2 (en) | 2011-12-09 | 2013-06-13 | Novozymes A/S | Biogas from substrates comprising animal manure and enzymes |
| EP3272862A1 (en) | 2011-12-16 | 2018-01-24 | Novozymes, Inc. | Polypeptides having laccase activity and polynucleotides encoding same |
| US20140342038A1 (en) | 2011-12-19 | 2014-11-20 | Novozymes A/S | Processes and Compositions For Increasing The Digestibility of Cellulosic Materials |
| BR112014014697A2 (pt) | 2011-12-19 | 2020-10-27 | Novozymes, Inc. | polipeptídeo isolado, composição, polinucleotídeo isolado, construto de ácido nucleico ou vetor de expressão, célula hospedeira recombinante, métodos para produzir um polipeptídeo e uma proteína, para gerar oxigênio molecular, e para remover peróxido de hidrogênio do tecido, processos para degradar ou converter um material celulósico, e para produzir um produto de fermentação, e, formulação de caldo integral ou composição de cultura de células |
| BR112014015228B1 (pt) | 2011-12-20 | 2022-07-05 | Novozymes, Inc. | Variante de celobiohidrolase genitora, processos para degradação ou conversão de um material celulósico, para produção de um produto de fermentação, e de fermentação de um material celulósico, formulação de caldo inteiro ou composição de cultura celular, e, célula hospedeira microbiana transgênica |
| EP2794899A1 (en) | 2011-12-21 | 2014-10-29 | Novozymes, Inc. | Methods for determining the degradation of a biomass material |
| CA2862703A1 (en) | 2012-03-26 | 2013-10-03 | Novozymes North America, Inc. | Methods of preconditioning cellulosic material |
| ES2935920T3 (es) | 2012-03-30 | 2023-03-13 | Novozymes North America Inc | Procesos de elaboración de productos de fermentación |
| CN104334738B (zh) | 2012-03-30 | 2019-01-29 | 诺维信北美公司 | 生产发酵产物的方法 |
| EP2841569A2 (en) | 2012-04-23 | 2015-03-04 | Novozymes A/S | Polypeptides having alpha-glucuronidase activity and polynucleotides encoding same |
| US9394556B2 (en) | 2012-04-23 | 2016-07-19 | Novozymes A/S | Polypeptides having glucuronyl esterase activity and polynucleotides encoding same |
| CA2868308A1 (en) | 2012-04-27 | 2013-10-31 | Novozymes, Inc. | Gh61 polypeptide variants and polynucleotides encoding same |
| US20150184144A1 (en) | 2012-07-06 | 2015-07-02 | Novozymes A/S | Liquid Enzyme Composition and Method for Enzyme Recovery |
| CN104685052A (zh) | 2012-09-19 | 2015-06-03 | 诺维信股份有限公司 | 用于增强纤维素材料的降解或转化的方法 |
| US10035996B2 (en) | 2012-10-08 | 2018-07-31 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
| US20150275194A1 (en) | 2012-10-24 | 2015-10-01 | Novozymes A/S | Polypeptides Having Cellulolytic Enhancing Activity And Polynucleotides Encoding Same |
| CA2888753A1 (en) * | 2012-10-31 | 2014-05-08 | Danisco Us Inc. | Beta-glucosidase from magnaporthe grisea |
| EP2925877A4 (en) | 2012-11-27 | 2016-06-08 | Novozymes As | milling |
| EP2925790B1 (en) | 2012-11-27 | 2021-07-07 | Novozymes A/S | Milling process |
| WO2014093835A1 (en) | 2012-12-14 | 2014-06-19 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
| US20150337280A1 (en) | 2012-12-19 | 2015-11-26 | Novozymes A/S | Polypeptides Having Cellulolytic Enhancing Activity And Polynucleotides Encoding Same |
| CN105074001A (zh) | 2013-02-21 | 2015-11-18 | 诺维信公司 | 糖化和发酵纤维素材料的方法 |
| CN110628749A (zh) | 2013-03-08 | 2019-12-31 | 诺维信公司 | 纤维二糖水解酶变体和编码它们的多核苷酸 |
| BR112016003339B1 (pt) | 2013-08-30 | 2023-02-14 | Novozymes A/S | Composição de enzima, e, processo de produção de um produto de fermentação a partir de material contendo amido |
| US9951364B2 (en) | 2013-09-11 | 2018-04-24 | Novozymes A/S | Processes for producing fermentation products |
| DK3063285T3 (da) | 2013-11-01 | 2019-05-13 | Novozymes As | Fremgangsmåder til forsukring og fermentering af et celluloseholdigt materiale |
| CN106795477A (zh) * | 2014-05-16 | 2017-05-31 | 中央研究院 | 用以制备虾红素的重组多核苷酸序列及其应用 |
| US10647947B2 (en) | 2014-06-04 | 2020-05-12 | Novozymes A/S | Detergent composition |
| JP2017524363A (ja) * | 2014-08-08 | 2017-08-31 | ザイレコ,インコーポレイテッド | アグリコシル化された酵素およびその使用 |
| WO2016029107A1 (en) | 2014-08-21 | 2016-02-25 | Novozymes A/S | Process for saccharifying cellulosic material under oxygen addition |
| WO2016026977A1 (en) | 2014-08-22 | 2016-02-25 | Danmarks Tekniske Universitet | A process for producing a fermentation product from a lignocellulose-containing material |
| EP3594335B1 (en) | 2014-09-05 | 2024-05-01 | Novozymes A/S | Carbohydrate binding module variants and polynucleotides encoding same |
| CN107109346B (zh) | 2014-09-23 | 2021-07-20 | 诺维信公司 | 用于生产乙醇的方法和发酵生物 |
| MX2017003881A (es) * | 2014-09-26 | 2017-05-12 | Xyleco Inc | Enzima solubilizada y usos de la misma. |
| CN105695439B (zh) | 2014-11-27 | 2023-08-01 | 丰益(上海)生物技术研发中心有限公司 | 一种β-葡萄糖苷酶基因的重组表达方法 |
| WO2016120298A1 (en) | 2015-01-28 | 2016-08-04 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
| EP3250698B1 (en) | 2015-01-28 | 2019-11-27 | DSM IP Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
| EP4001419A1 (en) | 2015-01-28 | 2022-05-25 | DSM IP Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
| DK3739045T3 (da) | 2015-02-24 | 2024-10-21 | Novozymes As | Cellobiohydrolasevarianter og polynukleotider, som koder for dem |
| US10308963B2 (en) | 2015-02-27 | 2019-06-04 | Novozymes A/S | Processes of producing ethanol using a fermenting organism |
| WO2016145084A1 (en) | 2015-03-09 | 2016-09-15 | Novozymes A/S | Methods of introducing multiple expression constructs into a eukaryotic cell |
| WO2016145358A1 (en) | 2015-03-12 | 2016-09-15 | Novozymes A/S | Enzymatic hydrolysis with hemicellulolytic enzymes |
| US20180044707A1 (en) | 2015-03-12 | 2018-02-15 | Novozymes A/S | Multi-Stage Enzymatic Hydrolysis of Lignocellulosic Biomass |
| EP3067428A1 (en) | 2015-03-12 | 2016-09-14 | BETA RENEWABLES S.p.A. | A process for producing a hydrolyzed mixture from a pre-treated ligno-cellulosic slurry comprising a slurry liquid and slurry solids |
| WO2016145363A1 (en) | 2015-03-12 | 2016-09-15 | Novozymes A/S | Multi-stage enzymatic hydrolysis of lignocellulosic biomass employing an oxidoreductase with an aa9 polypeptide |
| WO2016169892A1 (en) | 2015-04-20 | 2016-10-27 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
| WO2016169893A1 (en) | 2015-04-20 | 2016-10-27 | Dsm Ip Assets B.V. | Whole fermentation broth |
| US10676727B2 (en) | 2015-06-18 | 2020-06-09 | Novozymes A/S | Polypeptides having trehalase activity and the use thereof in process of producing fermentation products |
| WO2016207144A1 (en) | 2015-06-22 | 2016-12-29 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
| CN108350044B (zh) | 2015-09-22 | 2022-05-24 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽以及对其进行编码的多核苷酸 |
| CN108699570A (zh) | 2015-12-22 | 2018-10-23 | 诺维信公司 | 从酒糟水提取油的工艺 |
| ES2964738T3 (es) | 2015-12-23 | 2024-04-09 | Envirozyme Llc | Métodos para potenciar el drenaje de residuos con tratamiento enzimático |
| WO2017211957A1 (en) | 2016-06-09 | 2017-12-14 | Dsm Ip Assets B.V. | Seed train for large scale enzyme production |
| WO2018019948A1 (en) | 2016-07-29 | 2018-02-01 | Dsm Ip Assets B.V. | Polypeptides having cellulolytic enhancing activity and uses thereof |
| US10889836B2 (en) | 2016-11-23 | 2021-01-12 | Novozymes A/S | Yeast for ethanol production |
| MY198644A (en) | 2016-11-24 | 2023-09-13 | Dsm Ip Assets Bv | Enzyme composition |
| MY206033A (en) | 2016-11-24 | 2024-11-26 | Dsm Ip Assets Bv | Enzyme composition |
| CN110168095A (zh) | 2016-12-06 | 2019-08-23 | 诺维信公司 | 用于使用工程化酵母菌株从含有木糖的纤维素基质生产乙醇的改善方法 |
| WO2018185071A1 (en) | 2017-04-03 | 2018-10-11 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
| US11091753B2 (en) | 2017-05-31 | 2021-08-17 | Novozymes A/S | Xylose fermenting yeast strains and processes thereof for ethanol production |
| WO2018222990A1 (en) | 2017-06-02 | 2018-12-06 | Novozymes A/S | Improved yeast for ethanol production |
| ES2908190T3 (es) | 2017-06-28 | 2022-04-28 | Novozymes As | Polipéptidos con actividad de trehalasa y polinucleótidos que los codifican |
| CA3070281A1 (en) | 2017-08-08 | 2019-02-14 | Novozymes A/S | Polypeptides having trehalase activity and the use thereof in process of producing fermentation products |
| US12227784B2 (en) | 2017-09-15 | 2025-02-18 | Novozymes A/S | Enzyme blends and processes for improving the nutritional quality of animal feed |
| CN107513549A (zh) * | 2017-09-29 | 2017-12-26 | 天津大学 | 一种复合霉菌降解玉米秸秆的方法 |
| WO2019072732A1 (en) | 2017-10-09 | 2019-04-18 | Dsm Ip Assets B.V. | PROCESS FOR ENZYMATIC HYDROLYSIS OF LIGNOCELLULOSIC MATERIAL AND FERMENTATION OF SUGARS |
| BR112020007814A2 (pt) | 2017-10-23 | 2020-10-20 | Novozymes A/S | processos para reduzir e/ou prevenir um aumento nos níveis de ácido lático em um sistema de fermentação de biocombustível e para produção de um produto de fermentação a partir de um material contendo amido, e, uso de um polipeptídeo, ou uma composição enzimática |
| WO2019086370A1 (en) | 2017-10-30 | 2019-05-09 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
| CN111278986A (zh) | 2017-10-30 | 2020-06-12 | 帝斯曼知识产权资产管理有限公司 | 用于酶促水解木质纤维素材料和发酵糖的方法 |
| CN111511771A (zh) | 2017-12-22 | 2020-08-07 | 诺维信公司 | 小麦研磨方法和gh8木聚糖酶 |
| CA3089135A1 (en) | 2018-01-29 | 2019-08-01 | Novozymes A/S | Microorganisms with improved nitrogen utilization for ethanol production |
| US11473109B2 (en) | 2018-02-15 | 2022-10-18 | Novozymes A/S | Yeast for ethanol production |
| BR112020018791A2 (pt) | 2018-03-28 | 2020-10-13 | Dsm Ip Assets B.V. | composição de enzima |
| WO2019185681A1 (en) | 2018-03-28 | 2019-10-03 | Dsm Ip Assets B.V. | Enzyme composition |
| MY202507A (en) | 2018-05-17 | 2024-05-01 | Dsm Ip Assets Bv | Process for producing a polypeptide |
| FI3802843T3 (fi) | 2018-05-30 | 2023-05-08 | Versalis Spa | Menetelmä lignoselluloosamateriaalin entsymaattista hydrolyysiä ja sokerien käymistä varten |
| CA3098718A1 (en) | 2018-05-31 | 2019-12-05 | Novozymes A/S | Processes for enhancing yeast growth and productivity |
| BR112021001282A2 (pt) | 2018-07-25 | 2021-04-27 | Novozymes A/S | levedura expressando enzimas para produção de etanol |
| WO2020058253A1 (en) | 2018-09-18 | 2020-03-26 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars |
| WO2020058248A1 (en) | 2018-09-18 | 2020-03-26 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars |
| WO2020058249A1 (en) | 2018-09-18 | 2020-03-26 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars |
| CA3114783A1 (en) | 2018-10-08 | 2020-04-16 | Novozymes A/S | Enzyme-expressing yeast for ethanol production |
| CN112912511A (zh) | 2018-10-24 | 2021-06-04 | 帝斯曼知识产权资产管理有限公司 | 用于碳水化合物材料酶促水解和糖发酵的方法 |
| EP3653706A1 (en) * | 2018-11-13 | 2020-05-20 | AB Enzymes Oy | Fusion protein |
| WO2020160126A1 (en) | 2019-01-31 | 2020-08-06 | Novozymes A/S | Polypeptides having xylanase activity and use thereof for improving the nutritional quality of animal feed |
| EP3938525A1 (en) | 2019-03-12 | 2022-01-19 | DSM IP Assets B.V. | Process for producing a fermentation broth |
| EP4004029A1 (en) | 2019-07-26 | 2022-06-01 | Novozymes A/S | Microorganisms with improved nitrogen transport for ethanol production |
| BR112022002203A2 (pt) | 2019-08-05 | 2022-09-06 | Novozymes As | Misturas de enzimas e processos para produção de um ingrediente alimentar com alto teor de proteína a partir de um subproduto de vinhaça completa |
| MX2021015818A (es) | 2019-08-06 | 2022-02-03 | Novozymes As | Proteinas de fusion para mejorar la expresion de enzimas. |
| WO2021048164A1 (en) | 2019-09-10 | 2021-03-18 | Dsm Ip Assets B.V. | Enzyme composition |
| CA3152952A1 (en) | 2019-09-16 | 2021-03-25 | Novozymes A/S | Polypeptides having beta-glucanase activity and polynucleotides encoding same |
| AU2020402990A1 (en) | 2019-12-10 | 2022-06-09 | Novozymes A/S | Microorganism for improved pentose fermentation |
| MX2022006438A (es) | 2019-12-16 | 2022-06-22 | Novozymes As | Procesos para obtener productos de fermentacion. |
| US20240228996A1 (en) | 2020-02-10 | 2024-07-11 | Novozymes A/S | Polypeptides having alpha-amylase activity and polynucleotides encoding same |
| WO2022013148A1 (en) | 2020-07-13 | 2022-01-20 | Dsm Ip Assets B.V. | Process for the production of biogas |
| AU2021338555A1 (en) | 2020-09-04 | 2023-03-09 | Microbiogen Pty. Ltd. | Improved fermenting organism for ethanol production |
| WO2022090564A1 (en) | 2020-11-02 | 2022-05-05 | Novozymes A/S | Glucoamylase variants and polynucleotides encoding same |
| CN114606143A (zh) * | 2020-12-08 | 2022-06-10 | 青岛蔚蓝康成生物科技有限公司 | 一种高产鼠李糖苷酶的里氏木霉突变菌株及其应用 |
| CN112592849A (zh) * | 2020-12-14 | 2021-04-02 | 宁夏泰胜生物科技有限公司 | 利用兽疫链霉菌发酵生产高分子量透明质酸的培养基和培养方法 |
| CN113201464B (zh) * | 2020-12-30 | 2023-01-20 | 广东省科学院生物工程研究所 | 一株产α-葡聚糖酶的毕赤酵母工程菌及其构建方法、培养方法与应用 |
| CN117178059A (zh) | 2021-04-06 | 2023-12-05 | 帝斯曼知识产权资产管理有限公司 | 酶组合物 |
| BR112023020370A2 (pt) | 2021-04-06 | 2023-11-21 | Dsm Ip Assets Bv | Composição de enzimas |
| EP4320258A1 (en) | 2021-04-06 | 2024-02-14 | DSM IP Assets B.V. | Enzyme composition |
| CN116670296A (zh) | 2021-04-08 | 2023-08-29 | 维尔萨利斯股份公司 | 用于制备糖产品和发酵产品的方法 |
| BR112023025624A2 (pt) | 2021-06-07 | 2024-02-27 | Novozymes As | Célula de levedura recombinante, célula hospedeira recombinante, composição, cocultura, métodos de produção de um derivado de uma célula hospedeira recombinante e de produção de um produto de fermentação, e, uso de uma célula hospedeira recombinante |
| CN113215135A (zh) * | 2021-06-17 | 2021-08-06 | 福建中烟工业有限责任公司 | 一种内切葡聚糖酶在卷烟原料改良中的应用 |
| CN114317304B (zh) * | 2021-12-21 | 2024-03-15 | 浙江工业大学 | 酿酒酵母产绿原酸工程菌株的构建方法及其应用 |
| CN119630280A (zh) | 2022-05-14 | 2025-03-14 | 诺维信公司 | 用于预防、处理、抑制和/或消除植物病原性侵染和感染的组合物和方法 |
| CA3267559A1 (en) | 2022-09-23 | 2024-03-28 | Novozymes A/S | IMPROVED FERMENTATION ORGANISM FOR ETHANOL PRODUCTION |
| WO2025088155A1 (en) | 2023-10-25 | 2025-05-01 | Novozymes A/S | Improved fermenting organism for ethanol production |
| CN118005728B (zh) * | 2024-02-26 | 2025-04-15 | 杭州禾泰健宇生物科技有限公司 | 一种抗光老化多肽及其应用 |
| CN120683075B (zh) * | 2025-06-18 | 2026-04-14 | 江西省科学院微生物研究所(江西省流域生态研究所) | 一种植酸酶-普鲁兰水解酶融合蛋白y-l4-t及其应用 |
Family Cites Families (90)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB1296839A (pt) | 1969-05-29 | 1972-11-22 | ||
| GB1372034A (en) | 1970-12-31 | 1974-10-30 | Unilever Ltd | Detergent compositions |
| JPS5028515B2 (pt) | 1971-09-30 | 1975-09-16 | ||
| GB1483591A (en) | 1973-07-23 | 1977-08-24 | Novo Industri As | Process for coating water soluble or water dispersible particles by means of the fluid bed technique |
| GB1590432A (en) | 1976-07-07 | 1981-06-03 | Novo Industri As | Process for the production of an enzyme granulate and the enzyme granuate thus produced |
| DK187280A (da) | 1980-04-30 | 1981-10-31 | Novo Industri As | Ruhedsreducerende middel til et fuldvaskemiddel fuldvaskemiddel og fuldvaskemetode |
| DK263584D0 (da) | 1984-05-29 | 1984-05-29 | Novo Industri As | Enzymholdige granulater anvendt som detergentadditiver |
| JPH0697997B2 (ja) | 1985-08-09 | 1994-12-07 | ギスト ブロカデス ナ−ムロ−ゼ フエンノ−トチヤツプ | 新規の酵素的洗浄剤添加物 |
| EG18543A (en) | 1986-02-20 | 1993-07-30 | Albright & Wilson | Protected enzyme systems |
| DK122686D0 (da) | 1986-03-17 | 1986-03-17 | Novo Industri As | Fremstilling af proteiner |
| ATE110768T1 (de) | 1986-08-29 | 1994-09-15 | Novo Nordisk As | Enzymhaltiger reinigungsmittelzusatz. |
| NZ221627A (en) | 1986-09-09 | 1993-04-28 | Genencor Inc | Preparation of enzymes, modifications, catalytic triads to alter ratios or transesterification/hydrolysis ratios |
| DE3854249T2 (de) | 1987-08-28 | 1996-02-29 | Novonordisk As | Rekombinante Humicola-Lipase und Verfahren zur Herstellung von rekombinanten Humicola-Lipasen. |
| JPS6474992A (en) | 1987-09-16 | 1989-03-20 | Fuji Oil Co Ltd | Dna sequence, plasmid and production of lipase |
| DK6488D0 (da) | 1988-01-07 | 1988-01-07 | Novo Industri As | Enzymer |
| EP0471265B1 (en) | 1988-01-07 | 1995-10-25 | Novo Nordisk A/S | Specific protease |
| JP3079276B2 (ja) | 1988-02-28 | 2000-08-21 | 天野製薬株式会社 | 組換え体dna、それを含むシュードモナス属菌及びそれを用いたリパーゼの製造法 |
| WO1989009259A1 (en) | 1988-03-24 | 1989-10-05 | Novo-Nordisk A/S | A cellulase preparation |
| US5776757A (en) | 1988-03-24 | 1998-07-07 | Novo Nordisk A/S | Fungal cellulase composition containing alkaline CMC-endoglucanase and essentially no cellobiohydrolase and method of making thereof |
| GB8915658D0 (en) | 1989-07-07 | 1989-08-23 | Unilever Plc | Enzymes,their production and use |
| US5275944A (en) | 1989-09-26 | 1994-01-04 | Midwest Research Institute | Thermostable purified endoglucanas from acidothermus cellulolyticus ATCC 43068 |
| US5110735A (en) | 1989-09-26 | 1992-05-05 | Midwest Research Institute | Thermostable purified endoglucanase from thermophilic bacterium acidothermus cellulolyticus |
| US5536655A (en) | 1989-09-26 | 1996-07-16 | Midwest Research Institute | Gene coding for the E1 endoglucanase |
| EP0528828B2 (de) | 1990-04-14 | 1997-12-03 | Genencor International GmbH | Alkalische bacillus-lipasen, hierfür codierende dna-sequenzen sowie bacilli, die diese lipasen produzieren |
| CA2082279C (en) | 1990-05-09 | 2007-09-04 | Grethe Rasmussen | Cellulase preparation comprising an endoglucanase enzyme |
| DK115890D0 (da) | 1990-05-09 | 1990-05-09 | Novo Nordisk As | Enzym |
| JPH0427386A (ja) | 1990-05-24 | 1992-01-30 | Kao Corp | プロテアーゼ耐性セルラーゼ、これを産生する微生物及び該セルラーゼの製造法 |
| DE69129988T2 (de) | 1990-09-13 | 1999-03-18 | Novo Nordisk A/S, Bagsvaerd | Lipase-varianten |
| DK0553280T4 (da) | 1990-10-05 | 2010-11-15 | Genencor Int | Fremgangsmåde til behandling af bomuldsholdige tekstiler med cellulase |
| DE69133035T2 (de) | 1991-01-16 | 2003-02-13 | The Procter & Gamble Company, Cincinnati | Kompakte Waschmittelzusammensetzungen mit hochaktiven Cellulasen |
| EP0511456A1 (en) | 1991-04-30 | 1992-11-04 | The Procter & Gamble Company | Liquid detergents with aromatic borate ester to inhibit proteolytic enzyme |
| DK0583420T3 (da) | 1991-04-30 | 1996-07-29 | Procter & Gamble | Builderholdige flydende detergenter med borsyre-polyol-kompleks til inhibering af proteolytisk enzym |
| KR100258460B1 (ko) | 1991-05-01 | 2000-06-01 | 한센 핀 베네드 | 안정화 효소 및 세제 조성물 |
| DK72992D0 (da) | 1992-06-01 | 1992-06-01 | Novo Nordisk As | Enzym |
| DK88892D0 (da) | 1992-07-06 | 1992-07-06 | Novo Nordisk As | Forbindelse |
| EP0651794B1 (en) | 1992-07-23 | 2009-09-30 | Novozymes A/S | MUTANT $g(a)-AMYLASE, DETERGENT AND DISH WASHING AGENT |
| EP1431389A3 (en) | 1992-10-06 | 2004-06-30 | Novozymes A/S | Cellulase variants |
| CZ293163B6 (cs) | 1993-02-11 | 2004-02-18 | Genencor International, Inc. | Mutanta alfa-amylázy, její použití, kódová DNA pro tuto mutantu, vektor pro expresi, hostitelské buňky, čisticí prostředek a prostředek pro zkapalnění škrobu |
| ATE287946T1 (de) | 1993-04-27 | 2005-02-15 | Genencor Int | Neuartige lipasevarianten zur verwendung in reinigungsmitteln |
| DK52393D0 (pt) | 1993-05-05 | 1993-05-05 | Novo Nordisk As | |
| BR9407066A (pt) * | 1993-07-12 | 1996-03-12 | Novo Nordisk As | Composição detergente aditivo detergente e processo para tratar tecidos em uma máquina de lavar |
| JP2859520B2 (ja) | 1993-08-30 | 1999-02-17 | ノボ ノルディスク アクティーゼルスカブ | リパーゼ及びそれを生産する微生物及びリパーゼ製造方法及びリパーゼ含有洗剤組成物 |
| EP0724631A1 (en) | 1993-10-13 | 1996-08-07 | Novo Nordisk A/S | H 2?o 2?-stable peroxidase variants |
| JPH07143883A (ja) | 1993-11-24 | 1995-06-06 | Showa Denko Kk | リパーゼ遺伝子及び変異体リパーゼ |
| JP3081434B2 (ja) | 1994-01-24 | 2000-08-28 | 花王株式会社 | アルカリセルラーゼ |
| EP0746618B1 (en) | 1994-02-22 | 2002-08-21 | Novozymes A/S | A method of preparing a variant of a lipolytic enzyme |
| WO1995024471A1 (en) | 1994-03-08 | 1995-09-14 | Novo Nordisk A/S | Novel alkaline cellulases |
| JP3851656B2 (ja) | 1994-05-04 | 2006-11-29 | ジェネンコア インターナショナル インコーポレーテッド | 改善された界面活性剤耐性を有するリパーゼ |
| WO1995035381A1 (en) | 1994-06-20 | 1995-12-28 | Unilever N.V. | Modified pseudomonas lipases and their use |
| WO1996000292A1 (en) | 1994-06-23 | 1996-01-04 | Unilever N.V. | Modified pseudomonas lipases and their use |
| ATE294871T1 (de) | 1994-06-30 | 2005-05-15 | Novozymes Biotech Inc | Nicht-toxisches, nicht-toxigenes, nicht- pathogenes fusarium expressionssystem und darin zu verwendende promotoren und terminatoren |
| DE69535733T2 (de) | 1994-10-06 | 2009-04-23 | Novozymes A/S | Ein enzympräparat mit endoglucanase aktivität |
| BE1008998A3 (fr) | 1994-10-14 | 1996-10-01 | Solvay | Lipase, microorganisme la produisant, procede de preparation de cette lipase et utilisations de celle-ci. |
| BR9509525A (pt) | 1994-10-26 | 1995-10-26 | Novo Nordisk As | Construção de dna vetor de expressão recombinante célula processo para produzir a enzima que exibe atividade lipolítica enzima que exibe atividade lipolítica preparação de enzima aditivo de detergente e composição de detergente |
| AR000862A1 (es) | 1995-02-03 | 1997-08-06 | Novozymes As | Variantes de una ó-amilasa madre, un metodo para producir la misma, una estructura de adn y un vector de expresion, una celula transformada por dichaestructura de adn y vector, un aditivo para detergente, composicion detergente, una composicion para lavado de ropa y una composicion para la eliminacion del |
| JPH08228778A (ja) | 1995-02-27 | 1996-09-10 | Showa Denko Kk | 新規なリパーゼ遺伝子及びそれを用いたリパーゼの製造方法 |
| EP0815209B2 (en) * | 1995-03-17 | 2015-02-25 | Novozymes A/S | Novel endoglucanases |
| AU6414196A (en) | 1995-07-14 | 1997-02-18 | Novo Nordisk A/S | A modified enzyme with lipolytic activity |
| WO1997007202A1 (en) | 1995-08-11 | 1997-02-27 | Novo Nordisk A/S | Novel lipolytic enzymes |
| US5763385A (en) | 1996-05-14 | 1998-06-09 | Genencor International, Inc. | Modified α-amylases having altered calcium binding properties |
| JP2000514289A (ja) | 1996-06-28 | 2000-10-31 | ノボ ノルディスク アクティーゼルスカブ | デキストラナーゼ活性を有する組換え酵素 |
| CN1154739C (zh) * | 1996-07-24 | 2004-06-23 | 明治制果株式会社 | 利用腐质霉属微生物大量生产蛋白南或肽的体系 |
| AU3938997A (en) | 1996-08-26 | 1998-03-19 | Novo Nordisk A/S | A novel endoglucanase |
| BR9711479B1 (pt) | 1996-09-17 | 2009-08-11 | variante de celulase tendo uma resistência aumentada a tensìdeo de ánion. | |
| CA2265734A1 (en) | 1996-10-08 | 1998-04-16 | Novo Nordisk A/S | Diaminobenzoic acid derivatives as dye precursors |
| AU4551097A (en) | 1996-10-11 | 1998-05-11 | Novo Nordisk A/S | Alpha-amylase fused to cellulose binding domain, for starch degradation |
| US6300116B1 (en) | 1996-11-04 | 2001-10-09 | Novozymes A/S | Modified protease having improved autoproteolytic stability |
| BR9712473B1 (pt) | 1996-11-04 | 2009-08-11 | variantes de subtilase e composições. | |
| WO1998034946A1 (en) | 1997-02-12 | 1998-08-13 | Massachusetts Institute Of Technology | Daxx, a novel fas-binding protein that activates jnk and apoptosis |
| AU7564198A (en) | 1998-05-01 | 1999-11-23 | Procter & Gamble Company, The | Laundry detergent and/or fabric care compositions comprising a modified cellulase |
| DK1124949T3 (da) | 1998-10-26 | 2006-11-06 | Novozymes As | Konstruktion og screening af et DNA-bibliotek af interesse i trådformede svampeceller |
| CN100482801C (zh) | 1999-03-22 | 2009-04-29 | 诺沃奇梅兹有限公司 | 用于在真菌细胞中表达基因的启动子 |
| CA2372594A1 (en) | 1999-05-19 | 2000-11-23 | Midwest Research Institute | E1 endoglucanase variants y245g, y82r and w42r |
| ES2166316B1 (es) | 2000-02-24 | 2003-02-16 | Ct Investig Energeticas Ciemat | Procedimiento de produccion de etanol a partir de biomasa lignocelulosica utilizando una nueva levadura termotolerante. |
| US7122330B2 (en) * | 2000-04-13 | 2006-10-17 | Mark Aaron Emalfarb | High-throughput screening of expressed DNA libraries in filamentous fungi |
| AU2002223504A1 (en) | 2000-11-17 | 2002-05-27 | Novozymes A/S | Heterologous expression of taxanes |
| CN1491278A (zh) | 2001-02-07 | 2004-04-21 | ŵά�Ź�˾ | 脂酶变体 |
| JP2004527261A (ja) | 2001-05-18 | 2004-09-09 | ノボザイムス アクティーゼルスカブ | セロビアーゼ活性を有するポリペプチド及びそれをコードするポリヌクレオチド |
| DK1495055T3 (da) * | 2002-04-18 | 2013-11-11 | Genencor Int | Produktion af funktionelle antistoffer i filamentøse svampe |
| DK1622921T3 (da) | 2003-05-02 | 2010-09-13 | Novozymes Inc | Varianter af beta-glucosidaser |
| CN1836038B (zh) * | 2003-05-02 | 2011-04-06 | 诺维信股份有限公司 | 制备分泌型多肽的方法 |
| EP2330199B1 (en) * | 2003-12-08 | 2015-04-08 | Meiji Seika Pharma Co., Ltd. | Surfactant tolerant cellulase and method for modification thereof |
| CN1934249B (zh) * | 2004-01-16 | 2012-11-14 | 诺维信股份有限公司 | 降解木质素纤维素材料的方法 |
| ES2468366T3 (es) | 2004-01-30 | 2014-06-16 | Novozymes Inc. | Polip�ptidos con actividad de mejora celulol�tica y polinucle�tidos que los codifican |
| WO2005074656A2 (en) | 2004-02-06 | 2005-08-18 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
| EP2354222A1 (en) | 2004-03-25 | 2011-08-10 | Genencor International, Inc. | Cellulase fusion protein and heterologous cellulase fusion construct encoding the same |
| DK1781785T3 (da) * | 2004-07-20 | 2011-02-14 | Novozymes Inc | Fremgangsmåde til fremstilling af mutant-polynukleotider |
| CN104404106A (zh) | 2005-09-30 | 2015-03-11 | 诺维信股份有限公司 | 用于增强纤维素材料降解或转化的方法 |
| US7361487B2 (en) * | 2006-04-13 | 2008-04-22 | Ab Enzymes Oy | Enzyme fusion proteins and their use |
| KR101507402B1 (ko) | 2007-05-31 | 2015-04-02 | 노보자임스 인코포레이티드 | 폴리펩티드의 셀룰로오스 가수분해 증진 활성을 증가시키는 방법 |
-
2007
- 2007-07-20 DK DK07868319.0T patent/DK2046819T3/da active
- 2007-07-20 EP EP07868319.0A patent/EP2046819B1/en not_active Not-in-force
- 2007-07-20 BR BRPI0714870-4A patent/BRPI0714870A2/pt not_active IP Right Cessation
- 2007-07-20 WO PCT/US2007/074038 patent/WO2008057637A2/en not_active Ceased
- 2007-07-20 CA CA002658610A patent/CA2658610A1/en not_active Abandoned
- 2007-07-20 ES ES07868319.0T patent/ES2538360T3/es active Active
- 2007-07-20 US US11/781,151 patent/US8546106B2/en not_active Expired - Fee Related
- 2007-07-20 CN CN2007800352244A patent/CN101516906B/zh not_active Expired - Fee Related
-
2013
- 2013-09-11 US US14/024,292 patent/US8735549B2/en not_active Expired - Fee Related
-
2014
- 2014-05-16 US US14/279,624 patent/US8871486B2/en not_active Expired - Fee Related
- 2014-10-27 US US14/524,793 patent/US9006409B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| US8735549B2 (en) | 2014-05-27 |
| EP2046819A2 (en) | 2009-04-15 |
| ES2538360T3 (es) | 2015-06-19 |
| US8871486B2 (en) | 2014-10-28 |
| WO2008057637A3 (en) | 2008-10-09 |
| DK2046819T3 (da) | 2015-06-22 |
| US20150044756A1 (en) | 2015-02-12 |
| WO2008057637A9 (en) | 2008-07-17 |
| US20140248671A1 (en) | 2014-09-04 |
| CN101516906A (zh) | 2009-08-26 |
| US9006409B2 (en) | 2015-04-14 |
| WO2008057637A2 (en) | 2008-05-15 |
| US20090298126A1 (en) | 2009-12-03 |
| EP2046819B1 (en) | 2015-03-18 |
| US20140011256A1 (en) | 2014-01-09 |
| US8546106B2 (en) | 2013-10-01 |
| CN101516906B (zh) | 2013-11-06 |
| CA2658610A1 (en) | 2008-05-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN101516906B (zh) | 提高具有生物学活性之多肽的分泌的方法 | |
| CN101970651B (zh) | 用于降解纤维素材料的组合物 | |
| EP2195424B1 (en) | Polypeptides having cellobiohydrolase ii activity and polynucleotides encoding same | |
| CN102770534B (zh) | 具有纤维素分解增强活性的多肽及编码其的多核苷酸 | |
| CN103384678B (zh) | 具有纤维素水解增强活性的多肽及其编码多核苷酸 | |
| CN103237891B (zh) | 具有纤维素分解增强活性的多肽变体及其编码多核苷酸 | |
| CA2689910A1 (en) | Compositions for degrading cellulosic material | |
| CN103282489B (zh) | 具有纤维素分解增强活性的多肽变体及其编码多核苷酸 | |
| KR20100105849A (ko) | 셀룰로오스 가수분해 향상 활성을 가지는 폴리펩티드 및 그것을 암호화하는 폴리뉴클레오티드 | |
| CA2709371A1 (en) | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same | |
| CN106167796A (zh) | 用于糖化纤维素材料的组合物 | |
| CN104245926B (zh) | Gh61多肽变体以及编码其的多核苷酸 | |
| US8586828B2 (en) | Polypeptides having beta-glucosidase activity and polynucleotides encoding same |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| B07D | Technical examination (opinion) related to article 229 of industrial property law [chapter 7.4 patent gazette] | ||
| B07E | Notice of approval relating to section 229 industrial property law [chapter 7.5 patent gazette] |
Free format text: NOTIFICACAO DE ANUENCIA RELACIONADA COM O ART 229 DA LPI |
|
| B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
| B08F | Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette] | ||
| B08K | Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette] |
Free format text: EM VIRTUDE DO ARQUIVAMENTO PUBLICADO NA RPI 2471 DE 15-05-2018 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDO O ARQUIVAMENTO DO PEDIDO DE PATENTE, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013. |