KR20140099251A - 아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인 - Google Patents
아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인 Download PDFInfo
- Publication number
- KR20140099251A KR20140099251A KR1020147014591A KR20147014591A KR20140099251A KR 20140099251 A KR20140099251 A KR 20140099251A KR 1020147014591 A KR1020147014591 A KR 1020147014591A KR 20147014591 A KR20147014591 A KR 20147014591A KR 20140099251 A KR20140099251 A KR 20140099251A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- gly
- val
- ser
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/22—Processes using, or culture media containing, cellulose or hydrolysates thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
- C12P7/08—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
- C12P7/08—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
- C12P7/10—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01006—Glycerol dehydrogenase (1.1.1.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/0101—Acetaldehyde dehydrogenase (acetylating) (1.2.1.10)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Molecular Biology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 헥소스, 펜토즈 및 아세트산을 포함하는 목질 섬유 가수분해물로부터 에탄올을 생성하는 방법에 관한 것으로, 이에 따라 아세트알데히드 디하이드로게나아제를 암호화하는 외인성 유전자 및 NAD+-결합된 글리세롤 디하이드로게나아제 활성을 갖는 효소를 암호화하는 박테리아 유전자를 포함하는 유전적으로 변형된 이스트 세포가 사용된다. 상기 방법은 또한, 글리세롤이 배지에 존재하거나 또는 이와 함께 공급되며, 이에 따라 변형된 이스트 세포는 헥소스, 펜토즈, 아세트산 및 글리세롤을 에탄올로 발효하는 것을 특징으로 한다. 본 발명은 또한 이러한 방법에 사용되는 이스트 세포에 관한 것이다. 상기 이스트 세포는 유리하게 하나 이상의 디히드록시아세톤 키나아제 활성 및 글리세롤을 세포내로 수송하는 능력을 증가시키는 변형과 같이 글리세롤 이용을 향상시키는 유전적 변형을 포함한다. 상기 이스트 세포는 또한 바람직하게 L-아라비노즈를 D-자일룰로즈 5-포스페이트로 전환하는 능력을 세포에 부여하는 기능적 외인성 자일로즈 이소머라아제 유전자 및/또는 기능적 외인성 유전자를 포함하며, 그리고 이들은 아세틸-CoA 합성효소 활성을 증가시키는 유전적 변형을 포함할 수 있다.
Description
본 발명은 이스트와 같은 미생물에서의 대사 공학(metabolic engineering)에 관한 것이다. 구체적으로, 본 발명은 아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인에 관한 것이다. 아세트산 및 글리세롤에 부가적으로, 이스트 스트레인은 또한 에탄올의 생성을 위한 헥소스 및 펜토스를 소비할 수 있다. 본 발명은 또한 본 발명의 합성 스트레인이 아세트산 및 글리세롤로부터 에탄올을 생성하는 방법에 관한 것이다.
2세대 바이오에탄올은, 에탄올로의 발효를 위해 예를 들어 헥소스 및 펜토스와 같이 유리 단량체 당질로 가수분해되는 식물 바이오매스의 목질 섬유 분획으로부터 생성된다. 목질 섬유 가수분해물은 고량의 아세트산을 함유하며, 이는 이스트와 같은 에탄올 생성에 사용되는 미생물의 발효 능력의 강한 억제제이다.
Sonderegger 등(2004, Appl. Environ. Microbiol. 70: 2892-2897)은 자일로스-발효 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 스트레인에서 포스포트랜스아세틸라아제 및 아세트알데히드 디하이드로게나아제의 이종성 발현에 대해 개시하였다. 이에 따라, Sonderegger 등은 고유의 포스포케톨라아제와 함께, 상기 스트레인에서 자일로스 활용에 사용되는 자일로스 환원효소 및 자일로스 디하이드로게나아제의 이종성 발현에 의해 생성된 NADH의 순 재산화(net reoxidation)를 할 수 있는 기능성 포스포케톨라아제 경로를 생성하였다.
Guadalupe 등(2009, Appl. Environ. Microbiol. doi:10.1128/AEM.01772-09)은 부산물 글리세롤의 생성이 내생성 NAD-의존적 글리세롤 3-포스페이트 디하이드로게나아제 유전자(GPD1 및 GPD2)의 붕괴에 의해 제거되는 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 스트레인을 개시하였다. 아세틸레이팅 NAD-의존적 아세트알데히드 디하이드로게나아제를 암호화하는 이. 콜라이(E. coli) mhpF 유전자의 발현은 아세트산을 함유하는 배지로 보충함으로써 혐기적으로 성장하는 GPD-붕괴된 스트레인의 능력을 회복시켰다.
Yu 등(2010, Bioresour. Technol. 101(11):4157-61. Epub 2010 Feb 9)은 글리세롤 디하이드로게나아제(GCY), 디하이드록시아세톤 키나아제(DAK) 및 글리세롤 흡수 단백질(GUP1)의 동시 과발현에 의해 글리세롤로부터 향상된 에탄올 생성을 위해 대사적으로 합성된 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 스트레인을 개시하였다.
Lee 및 Dasilva(2006, Metab Eng. 8(1):58-65)는 그 중에서도 에스케리챠 콜라이(Escherichia coli) mgs 및 gldA 유전자의 발현을 도입하여 글리세롤로부터 1,2-프로판디올을 생성하도록 합성된 이스트 사카로미세스 세레비지아에(Saccharomyces cerevisiae)를 개시하였다.
본 발명의 목적은 아세트산 및 글리세롤 (및 헥소스 및 펜토스)로부터 에탄올을 생성할 수 있는 이스트뿐만 아니라, 이러한 스트레인이 에탄올 및/또는 다른 발효 산물의 생성을 위해 사용되는 공정을 제공하는 것이다.
정의
본 명세서에서 서열 동일성은 서열을 비교함으로써 측정되는 둘 이상의 아미노산(폴리펩타이드 또는 단백질) 서열 또는 둘 이상의 핵산(폴리뉴틀레오타이드) 서열 사이의 관계로서 정의된다. 당해 기술분야에서, "동일성(identity)"은 또한 아미노산 또는 핵산 서열 사이의 서열 관련 정도를 의미하며, 경우에 따라 이러한 서열들의 스트링들 사이를 매칭함으로써 측정된다. 두 아미노산 서열 사이의 "유사성(similarity)"은 한 폴리펩타이드의 아미노산 서열 및 이의 보존 아미노산 치환체를 제2 폴리펩타이드의 서열과 비교함으로써 측정된다. "동일성" 및 "유사성"은 공지된 방법에 의해 쉽게 산출될 수 있다. 용어 "서열 동일성" 또는 "서열 유사성"은 최적으로 정렬된 경우에, 바람직하게 (비교시 적어도 가장 짧은 서열의) 전체 길이에 걸쳐 그리고 디폴트 파라미터를 이용하는 프로그램 ClustalW(1.83), GAP 또는 BESTFIT에 의한 것과 같이 매치의 수를 최대화하고 갭의 수를 최소화하는 것으로 정렬된 경우에, 두 (폴리)펩타이드 또는 두 뉴클레오타이드 서열이, 적어도 본 명세서에 정의된 바와 같은 서열 동일성의 특정 퍼센트를 공유함을 의미한다. GAP은 이들의 전체 길이에 걸쳐 두 서열을 정렬하기 위해 Needleman and Wunsch 글로벌 정렬 알고리즘을 사용하여 매치의 수를 최대화하고 갭의 수를 최소화한다. 일반적으로, GAP 디폴트 파라미터는 갭 생성 패널티 = 50(뉴클레오타이드)/8(단백질) 및 갭 확장 패널티 = 3(뉴클레오타이드)/2(단백질)로 사용된다. 뉴클레오타이드에 대해, 사용되는 디폴트 스코어링 매트릭스는 nwsgapdna이며, 단백질에 대한 디폴트 스코어링 매트릭스는 Blosum62(Heinkoff & Heinkoff, 1992, PNAS 89, 915-919)이다. 본 발명의 단백질 서열을 정렬하기에 바람직한 다중 정렬 프로그램은 블로섬 매트릭스 및 디폴트 세팅(갭 오프닝 패널티: 10; 갭 확장 패널티: 0.05)을 이용하는 ClustalW(1.83)이다. RNA 서열이 DNA 서열과 본질적으로 유사하거나 특정 정도의 서열 동일성을 갖는 것으로 언급되는 경우에, DNA 서열에서 티민(T)은 RNA 서열에서 우라실(U)과 동등한 것으로 간주된다. 서열 정렬 및 퍼센트 서열 동일성에 대한 스코어는 GCG 위스콘신 패키지 버전 10.3(Accelrys Inc., 9685 Scranton Road, San Diego, CA 92121-3752 USA) 또는 오픈 소스 소프트웨어 윈도우용 엠보스(현재 버전 2.7.1-07)와 같은 컴퓨터 프로그램을 이용하여 검출될 수 있다.
동일성을 검출하는 바람직한 방법은 시험되는 서열들 간의 가장 많은 매치를 제공하도록 디자인된다. 동일성 및 유사성을 검출하는 방법은 공개적으로 이용가능한 컴퓨터 프로그램으로 편성된다. 두 서열 간에 동일성 및 유사성을 검출하는 바람직한 컴퓨터 프로그램 방법은 예를 들어 GCG 프로그램 패키지(Devereux, J., et al., Nucleic Acids Research 12 (1):387 (1984)), BestFit, BLASTP, BLASTN, 및 FASTA(Altschul, S. F. et al., J. Mol. Biol. 215:403-410 (1990))을 포함한다. BLAST X 프로그램은 NCBI 및 다른 공급원(BLAST Manual, Altschul, S., et al., NCBI NLM NIH Bethesda, MD 20894; Altschul, S., et al., J. Mol. Biol. 215:403-410 (1990))으로부터 공개적으로 이용가능하다. 잘 알려진 스미스 워터맨 알고리즘이 또한 동일성을 검출하는데 사용될 수 있다.
폴리펩타이드 서열 비교를 위한 바람직한 파라미터는 다음을 포함한다: 알고리즘: Needleman 및 Wunsch, J. Mol. Biol. 48:443-453 (1970); 비교 매트릭스: BLOSSUM62(Hentikoff 및 Hentikoff, Proc. Natl. Acad. Sci. USA. 89:10915-10919 (1992)); 갭 패널티: 12; 및 갭 길이 패널티: 4. 이러한 파라미터와 함께 유용한 프로그램은 "오갭(Ogap)" 프로그램(Genetics Computer Group, Madison, WI)으로서 공개적으로 이용가능하다. 상기 언급된 파라미터는 (엔드 갭을 위한 패널티가 없이) 아미노산 비교를 위한 디폴트 파라미터이다.
핵산 비교를 위한 바람직한 파라미터는 다음을 포함한다: 알고리즘: Needleman 및 Wunsch, J. Mol. Biol. 48:443-453 (1970); 비교 매트릭스: 매치=+10, 미스매치=0; 갭 패널티: 50; 및 갭 길이 패널티: 3. 갭(Gap) 프로그램(Genetics Computer Group, Madison, WI)으로서 공개적으로 이용가능하다. 상기 언급된 파라미터는 핵산 비교를 위한 디폴트 파라미터이다.
선택적으로, 아미노산 유사성 정도 검출시, 통상의 기술자는 또한 통상의 기술자에게 알 수 있는 바와 같이 소위 "보존적(conservative)" 아미노산 치환을 고려할 수 있다. 보존적 아미노산 치환은 유사한 측쇄를 갖는 잔기들의 호환성을 칭한다. 예를 들어, 지방족 측쇄를 갖는 아미노산 그룹은 글리신, 알라닌, 발린, 루신 및 이소루신이며; 지방족-히드록실 측쇄를 갖는 아미노산 그룹은 세린 및 트레오닌이며; 아미드-함유 측쇄를 갖는 아미노산 그룹은 아스파라긴 및 글루타민이며; 방향족 측쇄를 갖는 아미노산 그룹은 페닐알라닌, 티로신 및 트립토판이며; 염기성 측쇄를 갖는 아미노산 그룹은 리신, 아르기닌 및 히스티딘이며; 그리고 황-함유 측쇄를 갖는 아미노산 그룹은 시스테인 및 메티오닌이다. 바람직한 보존적 아미노산 치환기는 발린-루신-이소루신, 페닐알라닌-티로신, 리신-아르기닌, 알라닌-발린 및 아스파라긴-글루타민이다. 본 명세서에 개시된 아미노산 서열의 치환 변이체는 개시된 서열내의 적어도 하나의 잔기가 제거되고 그 자리에 다른 잔기가 삽입된 것들이다. 바람직하게, 아미노산 변화는 보존적이다. 자연적으로 발생하는 각각의 아미노산에 대한 바람직한 보존적 치환은 다음과 같다: Ala 대 ser; Arg 대 lys; Asn 대 gln 또는 his; Asp 대 glu; Cys 대 ser 대 ala; Gln 대 asn; Glu 대 asp; Gly 대 pro; His 대 asn 또는 gln; Ile 대 leu 또는 val; Leu 대 ile 또는 val; Lys 대 arg; gln 또는 glu; Met 대 leu 또는 ile; Phe 대 met, leu 또는 tyr; Ser 대 thr; Thr 대 ser; Trp 대 tyr; Tyr 대 trp 또는 phe; 및, Val 대 ile 또는 leu.
또한, 본 발명의 뉴클레오타이드 서열은 각각, 중간의 또는 바람직하게 엄격한 하이브리드화 조건하에서 본 명세서에 개시된 특정 뉴클레오타이드 서열의 일부와 하이브리드되는 이들의 능력에 의해 정의될 수 있다. 본 명세서에서 엄격한 하이브리드화 조건은 적어도 약 25, 바람직하게 약 50 뉴클레오타이드, 75 또는 100 및 가장 바람직하게 약 200 이상의 뉴클레오타이드가 약 1M 염, 바람직하게 6 x SSC를 포함하는 용액에서 또는 이에 상당하는 이온 강도를 갖는 용액에서 약 60℃의 온도에서 하이브리드화되고, 약 0.1M 염 이하, 바람직하게 0.2 x SSC를 포함하는 용액에서 또는 이에 상당하는 이온 강도를 갖는 다른 용액에서 65℃에서 세정하는 조건으로 정의된다. 바람직하게, 하이브리드화는 밤새, 즉, 적어도 10시간 동안 수행되며, 그리고 바람직하게 세정은 적어도 세정 용액을 2회 교체해 주면서 적어도 1시간 동안 수행된다. 이러한 조건은 보통 약 90% 이상의 서열 동일성을 갖는 서열의 특이적 하이브리드화를 가능케 할 것이다.
중간 조건은 적어도 50 뉴클레오타이드, 바람직하게 약 200 이상의 뉴클레오타이드의 핵산 서열이 약 1M 염, 바람직하게 6 x SSC를 포함하는 용액에서 또는 이에 상당하는 이온 강도를 갖는 어느 다른 용액에서 약 45℃의 온도에서 하이브리드화되고, 약 1M 염 이하, 바람직하게 6 x SSC를 포함하는 용액에서 또는 이에 상당하는 이온 강도를 갖는 다른 용액에서 실온에서 세정하는 조건으로 정의된다. 바람직하게, 하이브리드화는 밤새, 즉, 적어도 10시간 동안 수행되며, 그리고 바람직하게 세정은 적어도 세정 용액을 2회 교체해 주면서 적어도 1시간 동안 수행된다. 이러한 조건은 최대 50%의 서열 동일성을 갖는 서열의 특이적 하이브리드화를 가능케 할 것이다. 당해 기술분야의 통상의 기술자는 50%와 90% 사이의 동일성 범위의 서열을 특이적으로 식별하기 위한 이러한 하이브리드화 조건을 조절할 수 있을 것이다.
"핵산 구조물(nucleic acid construct)" 또는 "핵산 벡터(nucleic acid vector)"는 본 명세서에서 재조합 DNA 기술의 사용으로부터 형성되는 인공 합성 핵산 분자를 의미하는 것으로 이해된다. 용어 "핵산 구조물"은 따라서 자연적으로 발생하는 핵산 분자를 포함하지 않으나, 그럼에도 불구하고 핵산 구조물은 자연적으로 발생하는 핵산 분자(의 일부)를 포함할 수 있다. 용어 "발현 벡터(expression vector)" 또는 "발현 구조물(expression construct)"은 이러한 서열과 호환적인 숙주 세포 또는 숙주 유기체에서 유전자의 발현에 영향을 줄 수 있는 뉴클레오타이드 서열을 칭한다. 이러한 발현 벡터는 전형적으로 적어도 적절한 전사 조절 서열 및 선택적으로, 3' 전사 종료 신호를 포함한다. 또한 발현 인핸서 엘리멘트와 같은 발현에 영향을 주는데 필요하거나 도움이 되는 부가적인 인자들이 존재할 수 있다. 발현 벡터는 적절한 숙주 세포에 도입되며, 숙주 세포의 시험관내 세포 배양시 암호 서열의 발현에 영향을 줄 수 있다. 발현 벡터는 본 발명의 숙주 세포 또는 유기체에서 복제에 적절할 것이다.
본 명세서에 사용된, 용어 "프로모터" 또는 "전사 조절 서열"은 하나 이상의 암호서열의 전사를 조절하는 기능을 하며, 암호 서열의 전사 개시 부위의 전사 방향에 대하여 상향 흐름에 위치하며, 그리고 DNA-의존적 RNA 폴리머라아제에 대한 바인딩 사이트, 전사 제한부위, 및 이에 한정하는 것은 아니나, 전사 인자 바인딩 부위, 리프레서 및 액티베이터 단백질 바인딩 부위, 및 프로모터로부터 전사의 양을 직접 또는 간접적으로 조절하는 것으로 당해 기술분야의 통상의 기술자에게 알려진 어느 다른 뉴클레오타이드 서열울 포함하는 어느 다른 DNA 서열의 존재에 의해 구조적으로 식별되는 핵산 프래그먼트를 칭한다. "구성적인(constitutive)" 프로모터는 대부분의 생리학적 및 발달 조건하에서 대부분의 조직에서 활성적인 프로모터이다. "유도성(inducible)" 프로모터는 예를 들어, 화학 인듀서의 적용에 의해 생리학적으로 또는 발달학적으로 조절된 프로모터이다.
용어 "선별가능한 마커"는 당해 기술분야의 숙련자에게 익숙한 용어이며, 본 명세서에서 발현시 선별가능한 마커를 함유하는 세포 또는 세포들을 선별하는데 사용될 수 있는 어느 유전학적 엔티티를 나타내는데 사용된다. 용어 "리포터"는 마커와 호환적으로 사용될 수 있으나, 주로 녹색 형광 단백질(GFP)과 같은 가시적 마커를 칭하는데 사용된다. 선별가능한 마커는 우성적이거나 열성적이거나 또는 양방향성일 수 있다.
본 명세서에 사용된 용어 "작동가능하게 연결된(operably linked)"이란 기능적 관계에서 폴리뉴클레오타이드 엘리먼트의 결합을 칭한다. 핵산이 다른 핵산 서열과 기능적 관계로 놓여질 경우에 핵산이 "작동가능하게 연결된"다. 예를 들어, 전사 조절 서열은 암호 서열의 전사에 영향을 줄 경우에 암호 서열에 작동가능하게 연결된다. 작동가능하게 연결된이란 연결되는 DNA 서열이 전형적으로 인접되어 있으며, 두 단백질 암호부위를 연결하는 것이 필요한 경우에 인접되어 있으며 리딩 프래임내에 존재하는 것을 의미한다.
용어 "단백질" 또는 "폴리펩타이드"는 특정 활성 모드, 크기, 3-차원 구조 또는 오리진에 대한 레퍼런스가 없는 경우에 호환적으로 사용되며 아미노산의 사슬로 구성되는 분자를 칭한다.
"균류(fungi)"(단수 fungus)는 본 명세서에서 이들의 음식을 외부로 소화하고, 영양 분자를 이들의 세포내로 흡수하는 종속 영양 진행 미생물로서 이해된다. 균류는 진핵 유기체의 별도 계이며, 이스트, 곰팡이 및 버섯을 포함한다. 본 명세서에 사용된 용어, 균류(fungi, fungus) 및 균류의는 따라서 이스트뿐만 아니라 필라멘트성 균류를 포함한다.
용어 "유전자"는 세포에서 RNA 분자(예, mRNA)로 전사되는 부위(전사 부위)를 포함하며, 적절한 조절 부위(예, 프로모터)에 작동가능하게 연결된 DNA 프래그먼트를 의미한다. 유전자는 보통 프로모터 5' 리더 서열, 암호 부위 및 폴리아데닐화 부위를 포함하는 3' 비번역 서열(3'말단)과 같은 여러 작동가능하게 연결된 프래그먼트를 포함할 것이다. "유전자의 발현"은 적절한 조절 부위, 특히 프로모터에 작동가능하게 연결된 DNA 부위가 생물학적으로 활성적인, 즉, 생물학적으로 활성적인 단백질 또는 펩타이드로 번역될 수 있는 RNA로 전사되는 프로세스를 칭한다.
주어진 (재조합) 핵산 또는 폴리펩타이드 분자 및 주어진 숙주 유기체 또는 숙주 세포 사이의 관계를 나타내는데 사용될 경우에 용어 "동종성(homologous)"은 사실상 핵산 또는 폴리펩타이드 분자가 동일한 종, 바람직하게 동일한 변종 또는 스트레인의 숙주 세포 또는 유기체에 의해 생성되는 것을 의미하는 것으로 이해된다. 숙주 세포에 동종성인 경우에, 폴리펩타이드를 암호화하는 핵산 서열은 전형적으로(하지만 필수적은 것은 아님) 다른 (이종성) 프로모터 서열과 작동가능하게 연결되며, 그리고 적용가능할 경우에 이의 천연 환경에 비해 다른 (이종성) 분비 신호 서열 및/또는 종결 서열에 작동가능하게 연결된다. 조절 서열, 신호 서열, 종결 서열 등은 또한 숙주 세포에 동종성일 수 있는 것으로 이해된다. 이러한 정황에서, 단지 "동종성" 서열 엘리먼트의 사용은 "자가-복제된(self-cloned)" 유전적으로 변형된 유기체(GMO's)의 구조가 가능하다(여기서 자가 복제는 유럽 지령 98/81/EC 부록 II에 정의된 바와 같음). 두 핵산 서열의 관련성을 나타내는데 사용될 경우에, 용어 "동종성"은 단일-가닥 핵산 서열이 완전히 단일-가닥 핵산 서열과 하이브리드될 수 있음을 의미한다. 하이브리드화 정도는 서열간의 동일성의 양 및 이후에 언급되는 온도 및 염 농도와 같은 하이브리드화 조건을 포함하는 다수의 인자들에 따라 달라질 수 있다.
핵산(DNA 또는 RNA) 또는 단백질과 관련하여 사용되는 용어 "이종성(heterologous)" 및 "외인성(exogenous)"은 그 안에 존재하는 유기체, 세포, 게놈 또는 DNA 또는 RNA 서열의 일부로서 자연적으로 발생하지 않거나, 또는 자연적으로 발견되는 것과 다른 세포에서 또는 그 게놈 또는 DNA 또는 RNA 서열 는 핵산 또는 단백질내의 위치 또는 위치들에서 발견되는 핵산 또는 단백질을 칭한다. 이종성 및 외인성 핵산 또는 단백질은 그 내부로 도입되는 세포에 대해 내인성은 아니나, 다른 세포로부터 획득되며, 또는 합성적으로 또는 재조합적으로 생성된다. 일반적으로, 필수적인 것은 아니나, 이러한 핵산은 단백질, 즉, DNA가 전사되거나 발현되는 세포에 의해 정상적으로 생성되지 않는 외인성 단백질을 암호화한다. 마찬가지로, 외인성 RNA는 외인성 RNA가 존재하는 세포에서 정상적으로 발현되지 않는 단백질을 암호화한다. 이종성/외인성 핵산 및 단백질은 또한 외부 핵산 또는 단백질로 칭하여질 수 있다. 당해 기술분야의 통상의 기술자가 그 내부에서 발현되는 세포에 대하여 외부로서 인지하는 어느 핵산 또는 단백질은 본 명세서에 이종성 또는 외인성 핵산 또는 단백질로 포함된다. 용어 이종성 및 외인성은 또한 핵산 또는 아미노산 서열의 비-자연적 조합, 즉, 적어도 두개의 복합 서열이 서로에 대해 외래인 조합에 대해 적용된다.
효소의 "특이적 활성(specific activity)"은 본 명세서에서 총 숙주 세포 단백질의 양 당 특정 효소의 활성량을 의미하는 것으로 이해되며, 보통 총 숙주 세포 단백질 mg 당 효소 활성의 유닛으로 표현된다. 본 발명의 정황에서, 특정 효소의 특이적 활성은 (다른 동일한) 와일드 타입 숙주 세포에서 그 효소의 특이적 활성에 비해 증가 또는 감소될 수 있다.
"혐기적 조건(anaerobic conditions)" 또는 혐기적 발효 공정은 본 명세서에서 산소의 부재하에서 또는 실질적으로 산소가 소비되지 않는, 바람직하게 5, 2.5 또는 1mmol/L/h 이하, 또는 바람직하게 0 mmol/L/h가 소비되며(즉, 산소 소비가 검출불가한), 유기 분자가 전자 도너 및 전자 어셉터 모두로 제공되는 조건 또는 발효 공정 작업으로 정의된다.
도 1. 시간 경과(hours)에 따른 순 글리세롤 수준(g/l)(즉, 생산 - 소비)의 평가를 S. cerevisiae 스트레인 RN1041, RN1041+pRN595, RN1186, RN1187, RN1188 및 RN1189에 대해 나타내었다.
도 2. 시간 경과(hours)에 따른 순 아세트산 수준(g/l)(즉, 생산 - 소비)의 평가를 S. cerevisiae 스트레인 RN1041, RN1041+pRN595, RN1186, RN1187, RN1188 및 RN1189에 대해 나타내었다.
도 2. 시간 경과(hours)에 따른 순 아세트산 수준(g/l)(즉, 생산 - 소비)의 평가를 S. cerevisiae 스트레인 RN1041, RN1041+pRN595, RN1186, RN1187, RN1188 및 RN1189에 대해 나타내었다.
이스트에서 외인성 아세트알데히드 디하이드로게나아제의 발현은 이스트가 목질섬유 가수분해물에 고량 존재할 수 있는 아세트산을 에탄올로 전환하도록 해준다. 아세트산의 에탄올로의 NADH 의존적 환원은 에스. 세레비지아에(S. cerevisiae)의 혐기적 글루코즈-성장 배양에서 레독스 싱크(redox sink)로서 글리세롤 형성에 대한 대체물로서 제시되어, 이에 따라 산업적 에탄올 제조 중에 글리세롤 생성(부산물로서)의 제거에 대한 화학량론적 베이시스를 제공하며, 결과적으로 보다 높은 에탄올 수율을 제공한다(Guadalupe et al. 상기 참조). 그러나, 이러한 반응의 화학량론은 아세트산의 에탄올로의 한 분자의 환원은 2개의 글리세롤 분자를 필요로 하나 이러한 2개의 글리세롤 분자는 생성되지 않는다. 그러나, 본 발명자들은 산업적 목질섬유 가수분해물에 전형적으로 존재하는 아세트산의 양이 실제로 에탄올로 환원되는데 필요한 NADH의 양이 혐기적 조건하에서 성장되는 이스트에서 글리세롤 생성을 억제하는에 이용가능한 NADH의 양을 초과하는 것을 발견하였다. 본 발명자들은 이제 상당히 보다 많은 양의 아세트산이 글리세롤 생성 억제에 의한 것 보다는, 이스트에 의해 글리세롤의 동시적 소비에 의해 에탄올로 환원될 수 있음을 예기치 않게 발견하였다.
다량의 글리세롤이 식물성 오일 또는 동물 지방 및 알코올을 이용하여 트랜스에스테르화 반응으로부터 바이오디젤 생성시 부산물로서 생성된다. 크루드 글리세롤의 이용가능성은 따라서 전 세계적인 바이오디젤 생성의 성장 결과로 내년에 증가할 것으로 예상된다. 결론적으로, 다량의 글리세롤이 저가로 이용될 것이다. 본 발명은 예를 들어, 바이오디젤 생성으로부터 부산물로서 얻어지는 글리세롤을 바이오연료로 사용될 수 있는 에탄올로 전환시킴으로써 가치화하는 수단 및 방법을 제공한다. 동시에, 본 발명은 목질섬유 가수분해물에 존재하는 고량의 아세트산 및 이러한 가수분해물로부터 에탄올을 생성하는 이스트의 발효 성능을 저해하는 고량의 아세트산의 문제를 해소한다. 본 발명의 추가적인 이점은 본 발명의 이스트 세포에서 온전한 고-삼투성 글리세롤 반응 경로를 떠남으로써((모든) 글리세롤포스페이트 디하이드로게나아제가 Guadalupe 등(상기 참조)에 의해 기재된 바와 같이 불활성화되는 스트레인과 반대됨), 산업적 발효 조건하에서 발생할 수 있는 삼투성 스트레스를 더욱 잘 다스릴 수 있는 보다 강건한 이스트 스트레인이 획득되는 것이다.
제1견지로, 본 발명은 아세틸CoA를 아세트알데히드로 환원시키는 능력을 갖는 효소를 암호화하는 외인성 유전자를 포함하며, 상기 유전자는 아세트산을 에탄올로 전환시키는 능력을 세포에 부여하는 균류 숙주 세포에 관한 것이다. 아세틸CoA를 아세트알데히드로 환원시키는 능력을 가진 효소는 본 명세서에서 반응을 촉매하는 효소(ACDH; EC 1.2.1.10)로 이해된다.
아세트알데히드 + NAD+ + 조효소 A ↔ 아세틸-조효소 A + NADH + H+
따라서, 상기 효소는 아세틸CoA를 아세트알데히드로 전환(및 그 역도 같음)을 촉매하며, (아세틸레이팅 NDA-의존적) 아세트알데히드 디하이드로게나아제 또는 아세틸-CoA 환원효소로 칭하여진다. 상기 효소는 아세트알데히드의 에탄올로의 전환(및 그 역도 같은; 하기 참조)을 더욱 촉매하는 이중 기능성 효소일 수 있다. 편의상, 본 명세서에서 적어도 아세틸CoA를 아세트알데히드 또는 에탄올로 환원하는 능력을 가진 효소를 "아세트알데히드 디하이드로게나아제"라 칭한다. 또한, 균류 숙주 세포가 내인성 아세틸-CoA 합성효소 및 알코올 디하이드로게나아제 활성을 가지며, 아세트알데히드 디하이드로게나아제 활성과 함께 제공되는 세포가 아세트산의 에탄올로의 완전한 전환을 가능케 하는 것으로 이해된다.
외인성 유전자는 예를 들어, 이. 콜라이(E. coli) mhpF 유전자에 의해 암호화되는 아세트알데히드 디하이드로게나아제와 같은 아세트알데히드 디하이드로게나아제 활성만을 갖는 단일 기능 효소(즉, 아세틸CoA를 아세트알데히드로 환원하는 능력만을 갖는 효소)를 암호할 수 있다. 아세트알데히드 디하이드로게나아제 활성을 갖는 효소를 암호화하는 적절한 외인성 유전자는 SEQ ID NO: 1과 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 아세트알데히드 디하이드로게나아제 활성을 갖는 단일 기능 효소를 포함하는 원핵 생물의 적절한 예는 표 1에 제공된다. 이러한 단일 기능 효소의 아미노산 서열은 공개 데이터 베이스에서 이용가능하며, 이에 상응하는 단일 기능 효소를 암호화하는 코돈-최적화된 뉴클레오타이드 서열(참조 예, SEQ ID NO: 2)을 디자인하는데 통상의 기술자에 의해 사용될 수 있다.
| 유기체 | 아미노산 동일성 (%) |
| Escherichia coli str. K12 substr. MG1655 | 100% |
| Shigella sonnei | 100% |
| Escherichia coli IAI39 | 99% |
| Citrobacter youngae ATCC 29220 | 93% |
| Citrobacter sp. 30_2 | 92% |
| Klebsiella pneumoniae 342) | 87% |
| Klebsiella variicola | 87% |
| Pseudomonas putida | 81% |
| Ralstonia eutropha JMP134 | 82% |
| Burkholderia sp. H160 | 81% |
| Azotobacter vinelandii DJ | 79% |
| Ralstonia metallidurans CH34 | 70% |
| Xanthobacter autotrophicus Py2 | 67% |
| Burkholderia cenocepacia J2315 | 68% |
| Frankia sp. EAN1pec | 67% |
| Polaromonas sp. JS666 | 68% |
| Burkholderia phytofirmans PsJN | 70% |
| Rhodococcus opacus B4 | 64% |
바람직하게, 숙주 세포는 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 활성을 갖는 이중 기능성 효소를 암호화하며, 세포에 아세트산을 에탄올로 전환하는 능력을 부여하는 외인성 유전자를 포함한다. 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 각각의 활성에 대한 개별 효소에 비해, 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 활성을 갖는 이중 기능성 효소를 이용하는 이점은, 경로에서 연속적 반응을 촉매하는 효소들 사이에 중간물의 직접적인 채널링이 효율적이고, 독점적이고, 보호되는 수단의 대사물 운반을 제공할 수 있는 것이다. 이에 따라 기질 채널링은 중간물의 수송 시간을 감소시키고, 확산에 의한 중간물의 손실을 억제하고, 용매로부터 불안정한 중간물을 보호하고, 중간물의 경합 대사 경로로의 입장을 미연에 방지한다. 따라서, 이중 기능성 효소는 개별 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 효소에 비해 아세트산의 에탄올로의 보다 효율적인 전환을 가능케 한다. 이중 기능성 효소의 다른 이점은, 이는 또한 예를 들어, 혐기적 조건 및/또는 이화 대사 억제와 같은 사용되는 조건하에서 알코올 디하이드로게나아제 활성이 거의 없거나 전혀 없이 숙주 세포에서 사용될 수 있는 것이다.
아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 활성을 갖는 이중 기능성 효소는 원핵 생물 및 프로토조아 기술분야에 알려져 있으며, 예를 들어, 에스케리차 콜라이(Escherichia coli) adhE 및 엔타모에바 히스톨리티카(Entamoeba histolytica) ADH2 유전자에 의해 암호화되는 이중 기능성 효소를 포함한다(참조 Bruchaus and Tannich, 1994, J. Biochem. 303: 743-748; Burdette and Zeikus, 1994, J. Biochem. 302: 163-170; Koo et al., 2005, Biotechnol. Lett. 27: 505-510; Yong et al., 1996, Proc Natl Acad Sci USA, 93: 6464-6469). 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 활성을 갖는 이중 기능성 효소는 약 900 아미노산으로 구성되는 보다 큰 단백질이며, 이들은 아세트알데히드 디하이드로게나아제(ACDH; EC 1.2.1.10) 및 알코올 디하이드로게나아제 활성(ADH; EC 1.1.1.1) 모두를 나타내는 이중 기능성이다. E. coli adhE과 Entamoeba histolytica ADH2는 45% 아미노산 동일성을 나타낸다. 따라서, 본 발명의 일 구현으로, 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 활성을 갖는 이중 기능성 효소을 암호화하는 적절한 외인성 유전자는 SEQ ID NO: 3 중 적어도 하나의 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 활성을 갖는 이중 기능성 효소를 포함하는 원핵 생물의 적절한 예는 표 2 및 3에 제공된다. 이러한 이중 기능성 효소의 아미노산 서열은 이에 상응하는 이중 기능성 효소를 암호화하는 코돈-최적화된 뉴클레오타이드 서열(참조 예, SEQ ID NO: 4 또는 6)을 디자인하기 위해 공개된 데이타 베이스에서 이용가능하며, 통상의 기술자에 의해 사용될 수 있다.
| 유기체 | 아미노산 동일성 (%) |
| Escherichia coli O157:H7 str. Sakai | 100% |
| Shigella sonnei | 100% |
| Shigella dysenteriae 1012 | 99% |
| Klebsiella pneumoniae 342 | 97% |
| Enterobacter sp. 638 | 94% |
| Yersinia pestis biovar Microtus str. 91001 | 90% |
| Serratia proteamaculans 568 | 90% |
| Pectobacterium carotovorum WPP14 | 90% |
| Sodalis glossinidius str. 'morsitans' | 87% |
| Erwinia tasmaniensis Et1/99 | 86% |
| Aeromonas hydrophila ATCC 7966 | 81% |
| Vibrio vulnificus YJ016] | 76% |
| 유기체 | 아미노산 동일성 (%) |
| Entamoeba histolytica HM-1:IMSS | 99% |
| Entamoeba dispar SAW760 | 98% |
| Mollicutes bacterium D7 | 65% |
| Fusobacterium mortiferum ATCC 9817 | 64% |
| Actinobacillus succinogenes 130Z | 63% |
| Pasteurella multocida Pm70 | 62% |
| Mannheimia succiniciproducens MBEL55E | 61% |
| Streptococcus sp. 2_1_36FAA] | 61% |
아세트알데히드 디하이드로게나아제 활성을 갖는 효소에 있어서, 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 활성을 갖는 이중 기능성 효소를 암호화하는 외인성 유전자는 바람직하게 본 발명의 숙주 세포내로 발현 구조물의 트랜스포메이션시 효소의 발현을 확실히 하도록 적절한 발현 조절 부위/서열에 작동가능하게 연결된 효소를 암호화하는 뉴클레오타이드 서열을 포함하는 발현 구조물이다. 따라서, 유전자 또는 발현 구조물은 암호 서열에 작동가능하게 연결된 숙주 세포에 기능적인 프로모터를 적어도 포함할 것이다. 유전자 또는 구조물은 암호 부위의 상향흐름의 5' 리더 서열 및 암호화 서열의 하향흐름의 폴리아데닐화 부위 및 전사 종결 부위를 포함하는 3'-비번역 서열(3'말단)을 더 포함할 수 있다.
일 견지로 본 발명은 본 발명의 이스트 세포를 제조 및 구축하는 방법에 관한 것이다. 이러한 목적으로, 표준 유전학 및 분자생물학 기술이 사용되며, 이는 일반적으로 당해 기술분야에 알려져 있으며, 예를 들어, Sambrook and Russell (2001, "Molecular cloning: a laboratory manual" (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press) and Ausubel et al. (1987, eds., "Current protocols in molecular biology", Green Publishing and Wiley Interscience, New York)에 기술되어 있다. 또한, 돌연변이된 숙주 이스트 스트레인의 구축은 결과적으로 형성된 디플로이드의 유전학적 크로스, 포자형성, 원하는 영양요구성 마커를 함유하는 하플로이드 스포어의 테트라드 절개 및 적절한 선별 배지에서 이러한 하플로이드 숙주 이스트의 콜로니 정제에 의해 수행된다. 이러한 모든 방법들은 당해 기술분야에 알려진 표준 이스트 유전학 방법이다. 참조 예, Sherman et al., Methods Yeast Genetics, Cold Spring Harbor Laboratory, NY (1978) and Guthrie et al. (Eds.) Guide To Yeast Genetics and Molecular Biology Vol. 194, Academic Press, San Diego (1991).
아세트알데히드 디하이드로게나아제 및 선택적으로 알코올 디하이드로게나아제 활성을 갖는 효소 (뿐만 아니라 하기 본 발명의 다른 효소)를 암호화하는 뉴클레오타이드 서열의 발현을 위한 적절한 프로모터는 바람직하게, 이화 생성물(글루코즈) 억제에 민감하지 않으며, 혐기적 조건하에서 활성적이며 그리고/또는 바람직하게 유도를 위해 자일로즈 또는 아라비노즈를 필요로 하지 않는 프로모터들을 포함한다. 이러한 특성을 갖는 프로모터는 광범위하게 이용가능하며, 통상의 기술자에 의해 알려져 있다. 이러한 프로모터의 적절한 예는 이스트의 프로모터들인, 포스포프룰토키나아제(PPK), 트리오즈 포스페이트 이소머라아제(TPI), 글리세르알데히드-3-포스페이트 디하이드로게나아제(GDP , TDH3 또는 GAPDH), 피루베이트 키나아제(PYK), 포스포글리세레이트 키나아제(PGK), 글루코즈-6-포스페이트 이소머라아제 프로모터(PG11)와 같은 당분해 유전자의 프로모터를 포함한다. 이스트의 이러한 프로모터들에 대한 보다 상세한 사항은 (WO 93/03159)에서 찾아볼 수 있다. 다른 유용한 프로모터는 리보좀 단백질 암호 유전자 프로모터(TEF1), 락타아제 유전자 프로모터(LAC4), 알코올 디하이드로게나아제 프로모터(ADH1, ADH4 등), 에놀라아제 프로모터(ENO) 및 헥소즈(글루코즈) 트랜스포터 프로모터(HXT7)이다. 변형적으로, 아세트알데히드 디하이드로게나아제 및 선택적으로 알코올 디하이드로게나아제 활성을 갖는 효소를 암호화하는 뉴클레오타이드 서열은 S. cerevisiae ANB1 프로모터(SEQ ID NO: 19)와 같은 무산소 프로모터를 이용하여 혐기적 조건하에서 과발현된다. 모두 구성적이며 유도적인 다른 프로모터들 및 인핸서 또는 상향흐름 활성화 서열은 당해 기술분야의 통상의 기술자에게 알려져 있다. 바람직하게, 상기 정의된 뉴클레오타이드 서열에 작동가능하게 연결된 프로모터는 숙주 세포에 동종성이다. 적절한 종결 서열은 예를 들어 시토크롬 c1(CYC1) 유전자 또는 알코올 디하이드로게나아제 유전자(예, ADH1)로부터 획득가능하다.
아세트알데히드 디하이드로게나아제 및 선택적으로 알코올 디하이드로게나아제 활성을 갖는 효소가 본 발명의 형질전환된 숙주 세포에서 충분한 수준으로 그리고 활성적인 형태로 발현되는 가능성을 증가시키기 위해, 이러한 효소를 암호화하는 뉴클레오타이드 서열뿐만 아니라, 본 발명의 다른 효소(하기 참조)는 바람직하게 문제의 숙주 세포의 효소에 대해 이들의 코돈 사용을 최적화하도록 개작된다. 숙주 세포의 코돈 사용에 대한 효소를 암호화하는 뉴클레오타이드 서열의 적용성은 코돈 적응 지수(CAI)로 표현될 수 있다. 코돈 적응 지수는 본 명세서에서 특정 숙주 세포 또는 유기체에서 고 발현되는 유전자의 코돈 사용에 대한 유전자의 코돈 사용의 상대적 적응성의 측정으로 정의된다. 각 코돈의 상대적 적응성(w)은 각 코돈의 동일한 아미노산에 대한 가장 풍부한 코돈의 적응성에 대한 사용의 비율이다. CAI 지수는 이러한 상대적인 적응성 값의 기하학적 평균으로 정의된다. 비슷하지 않은 코돈 및 종결 코돈(유전학적 암호에 따라 달라짐)은 배제된다. CAI 값은 0 내지 1이며, 보다 높은 값은 보다 높은 비율의 가장 풍부한 코돈을 나타낸다(Sharp and Li , 1987, Nucleic Acids Research 15: 1281-1295; also see: Jansen et al., 2003, Nucleic Acids Res. 31(8):2242-51). 적응된 뉴클레오타이드 서열은 바람직하게 적어도 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8 또는 0.9의 CAI를 갖는다. 가장 바람직하게 예를 들어, S. cerevisiae 세포와 같은 문제의 균류 숙주 세포에서 발현을 위하 코돈 최적화된 서열이다.
상기 뉴클레오타이드 서열은, 바람직하게 형질전환된 숙주 세포에서 활성 형태로 발현되는 아세트알데히드 디하이드로게나아제 및 선택적으로 알코올 디하이드로게나아제 활성을 갖는 효소를 암호화한다. 따라서, 숙주 세포에서 상기 뉴클레오타이드 서열의 발현은 본 명세서에 실시예에 기재된 바와 같이 30℃에서 형질전환된 숙주 세포의 세포 추출물에서 아세틸-CoA 의존적 NADH 환원비로 측정시 적어도 0.005, 0.010, 0.020, 0.050 또는 0.10μmol min-1 (mg protein)-1의 특정 활성을 갖는 아세트알데히드 디하이드로게나아제를 생성한다.
아세트알데히드 디하이드로게나아제 및 선택적으로 알코올 디하이드로게나아제 활성을 갖는 효소를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산 구조물로 형질전환되는 숙주 세포는 바람직하게 이스트 숙주 세포이다. 바람직하게, 상기 숙주 세포는 배양된 세포이다. 본 발명의 숙주 세포는 바람직하게 펜토즈(자일로즈 및 바람직하게 또한 아라미노즈)를 세포내로 능동적 또는 수동적으로 수송할 수 있는 숙주이다. 상기 숙주 세포는 바람직하게 활성 당분해를 함유한다. 상기 숙주 세포는 또한 바람직하게, 자일로즈로부터 이소머화된 자일룰로즈가 피루베이트로 대사될 수 있도록, 내인성 펜토즈 포스페이트 경로를 함유하며, 내인성 자일룰로즈 키나아제 활성을 함유할 수 있다. 상기 숙주는 또한 바람직하게 에탄올, 락틱산, 3-히드록시-프로피온산, 아크릴산, 1,3-프로판-디올, 부탄올(1-부탄올, 2-부탄올, 이소부탄올) 및 이소프레노이드-유래 산물과 같은 원하는 발효 산물로의 (바람직하게 피루베이트를 통해) 펜토즈의 전환을 위한 효소 함유한다. 특히 바람직한 숙주 세포는 자연적으로 알코올 발효가능한, 바람직하게는 혐기적 알코올 발효가능한 이스트 세포이다. 이스트 숙주 세포는 또한 바람직하게 에탄올에 대해 높은 내성, 저 pH에 높은 내성(즉, pH 5, 4 또는 3이하에서 성장이 가능함)을 가지며, 프루프랄 및 히드록시-메틸프루프랄과 같은 락틱산, 아세트산 또는 포름산 및 당 분해물과 같은 유기산에 대해 높은 내성을 가지며, 그리고 상승된 온도에 대해 높은 내성을 갖는다. 상기 숙주 세포의 이러한 어느 특성 또는 활성은 숙주 세포에 자연적으로 존재하거나 또는 유전적 변형에 의해 도입되거나 변형될 수 있으며, 바람직하게는 자가 클로닝에 의해 또는 하기 본 발명의 방법에 의해 도입되거나 변형될 수 있다. 적절한 세포는 배양된 세포, 예를 들어 수중 또는 고상 발효에서와 같은 발효 공정에서 배양될 수 있는 세포이다. 특히 적절한 세포는 예를 들어, 균류와 같은 진핵 미생물이나, 본 발명에 사용되기에 가장 적절한 것은 이스트이다.
본 명세서에서 이스트는 진행 미생물로서 정의되며, 주로 단세포 형태로 성장하는 모든 하위 분류의 진균류종을 포함한다(Yeasts: characteristics and identification, J.A. Barnett, R.W. Payne, D. Yarrow, 2000, 3rd ed., Cambridge University Press, Cambridge UK; and, The yeasts, a taxonomic study, C.P. Kurtzman and J.W. Fell (eds) 1998, 4th ed., Elsevier Science Publ. B.V., Amsterdam, The Netherlands). 이스트는 단세포 엽상체의 출아에 의해 성장하거나 유기체의 분열에 의해 성장할 수 있다. 본 발명에 사용하기에 바람직한 이스트 세포는 속 Saccharomyces, Kluyveromyces, Candida, Pichia , Schizosaccharomyces, Hansenula, Kloeckera, Schwanniomyces, 및 Yarrowia 에 속한다. 바람직하게 상기 이스트는 혐기적 발효가 가능하며, 보다 바람직하게 혐기적 알코올 발효가 가능하다. 수년간, 당료 작물로부터 바이오-에탄올의 생성을 위한 다양한 미생물의 도입에 대한 제안이 이루어져 왔다. 그러나, 실제로, 모든 주요 바이오-에탄올 생성 공정은 에탄올 생산자로서 속 Saccharomyces의 이스트를 계속 사용하였다. 이는 산업적 공정을 위한 Saccharomyces의 많은 매력적 특징들, 즉, 높은 산-, 에탄올- 및 삼투압-내성, 혐기적 성장의 능력 및 물론 이의 높은 알코올 발효 성능에 기인한다. 숙주 세포로서 바람직한 이스트종은 S. cerevisiae, S. exiguus, S. bayanus, K. lactis , K. marxianus 및 Schizosaccharomyces pombe를 포함한다.
다른 구현으로, 본 발명의 숙주 세포는 세포안에 NAD+-결합된 글리세롤 디하이드로게나아제 활성을 도입하는 유전적 변형을 더 포함한다. 내인성 이스트 GCY1 유전자에 의해 암호화되는 글리세롤 디하이드로게나아제는 NAD+(EC 1.1.1.6)과 상반적으로 보조인자 NADP+(EC 1.1.1.72)에 특이적인 것으로 나타났다. S. cerevisiae와 같은 이스트는 NAD+-의존적 글리세롤 디하이드로게나아제 활성이 결여된 것으로 나타났다(EC 1.1.1.6) (참조 예. KEGG pathway 00561). NAD--결합된 글리세롤 디하이드로게나아제는 본 명세서에서 화학 반응을 촉매하는 효소로 이해된다(EC 1.1.1.6).
글리세롤 + NAD+ ↔ 글리세론 + NADH + H+
일반적으로 사용되는 다른 명칭은 글리세린 디하이드로게나아제 및 글리세롤:NAD+ 2-옥시도리덕타아제를 포함한다.
바람직하게, 숙주 세포에 NAD+-결합 글리세롤 디하이드로게나아제 활성을 도입하는 유전학적 변형은 숙주 세포에 이종성인 NAD+-결합 글리세롤 디하이드로게나아제의 발현이다. 보다 바람직하게, 본 발명의 세포에서 이종성 글리세롤 디하이드로게나아제의 발현을 위한 뉴클레오타이드 서열은 보조인자로서 NAD+를 사용하는 박테리아 글리세롤 디하이드로게나아제를 암호화하는 서열이다. 본 발명의 숙주 세포에서 발현을 위한 박테리아 NAD+-결합 글리세롤 디하이드로게나아제의 적절한 예는 예를 들어, Truniger 및 Boos(1994, J Bacteriol. 176(6):1796-1800)에 기재된 E. coli의 gldA 유전자이며, 이스트에서 이의 발현은 이미 보고된바 있다(Lee 및 Dasilva, 2006, Metab Eng. 8(1):58-65). 바람직하게, 이종성 글리세롤 디하이드로게나아제를 암호화하는 뉴클레오타이드 서열은 SEQ ID NO: 7과 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열 또는 SEQ ID NO: 7과 비교하여 하나 또는 여러 개의 치환, 삽입 및/또는 결실을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 바람직한 구현으로, 상기 이종성 글리세롤 디하이드로게나아제를 암호화하는 코돈-최적화된(상기 참조) 뉴클레오타이드 서열은, 예를 들어, SEQ ID NO: 7의 글리세롤 디하이드로게나아제의 아미노산 서열을 암호화하는 코돈-최적화된 뉴클레오타이드 서열과 같이 과발현된다. 이러한 코돈-최적화된 뉴클레오타이드 서열은 SEQ ID NO: 21(위치 10 - 1113; CAI = 0.976)에 제공된다.
상기 글리세롤 디하이드로게나아제를 암호화하는 뉴클레오타이드 서열의 과발현을 위해, (발현될) 상기 뉴클레오타이드 서열은 본 발명의 숙주 세포내로 발현 구조물의 형질전환시 글리세롤 디하이드로게나아제 효소의 과발현을 확실히 하도록 적절한 발현 조절 부위/서열에 작동가능하게 연결되는 발현 구조물에 넣어진다(상기 참조). 글리세롤 디하이드로게나아제 활성을 갖는 효소를 암호화하는 뉴클레오타이드 서열의 (과)발현을 위해 적절한 프로모터는, 바람직하게 이화대사(글루코즈) 억제에 민감하지 않으며, 혐기적 조건하에서 활성적이며 그리고/또는 바람직하게 유도를 위해 자일로즈 또는 아라비노즈를 필요로 하지 않는 프로모터들을 포함한다.
이러한 프로모터들의 예는 상기 주어진다. 숙주 세포에서 뉴클레오타이드 서열의 발현은 본 실시예에 기재된 바와 같이 30℃에서 형질전환된 숙주 세포의 세포 추출물에서 측정시 적어도 0.2, 0.5, 1.0, 2.0, or 5.0 U min-1 (mg protein)-1의 특이적 NAD+-결합 글리세롤 디하이드로게나아제 활성을 생성한다.
다른 구현으로, 본 발명의 숙주 세포는 또한 세포에서 히히드록시아세톤 키나아제의 특이적 활성을 증가시키는 유전적 변형을 포함한다. 내인성 DAK1 디히드록시아세톤 키나아제가 이미 S. cerevisiae에서 고 수준으로 발현되는 것으로 전사체 데이터는 보여주었다. 본 발명의 세포에서 디히드록시아세톤 키나아제 활성의 추가 증가는 따라서 엄격히 필요하지 않을 수 있다. 그러나, 바람직한 구현으로, 최적 전환율을 위해, 따라서 본 발명의 숙주 세포는 세포내에 디히드록시아세톤 키나아제의 특이적 활성을 증가시키는 유전적 변형을 포함한다. 디히드록시아세톤 키나아제는 본 명세서에서 화학반응(EC 2.7.1.29)을 촉매하는 효소로 이해된다:
ATP + 글리세론 ↔ ADP + 글리세론 포스페이트
일반적으로 사용되는 다른 명칭은 글리세론 키나아제, ATP:글리세론 포스포트랜스퍼라아제 및 (포스포릴화) 아세톨 키나아제를 포함한다. 글리세론 및 디히드록시아세톤은 동일한 분자인 것으로 이해된다. 바람직하게, 유전적 변형은 예를 들어, 디히드록시아세톤 키나아제를 암호화하는 뉴클레오타이드 서열의 과발현에 의해 디히드록시아세톤 키나아제의 과발현을 일으킨다. 디히드록시아세톤 키나아제를 암호화하는 뉴클레오타이드 서열은 세포에 내인성이거나 또는 세포에 이종성인 디히드록시아세톤 키나아제일 수 있다. 본 발명의 세포에서 디히드록시아세톤 키나아제의 과발현에 사용될 수 있는 뉴클레오타이드 서열은 예를 들어, Molin et al(2003, J. Biol. Chem. 278:1415-1423)에 의해 기재된 S. cerevisiae의 디히드록시아세톤 키나아제 유전자(DAK1) 및 (DAK2)이다. 바람직하게, 디히드록시아세톤 키나아제를 암호화하는 뉴클레오타이드 서열은 SEQ ID NOs: 8 및 9 중 적어도 하나와 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다. 바람직한 구현으로, 디히드록사아세톤 키나아제를 암호화하는 코돈-최적화된(상기 참조) 뉴클레오타이드 서열은, 예를 들어, SEQ ID NO: 8의 디히드록시아세톤 키나아제를 암호화하는 코돈 최적화된 뉴클레오타이드 서열 또는 SEQ ID NO: 9의 디히드록시아세톤 키나아제를 암호화하는 코돈 최적화된 뉴클레오타이드 서열과 같이 과발현된다. 디히드록시아세톤 키나아제의 과발현을 위한 바람직한 뉴클레오타이드 서열은 디히드록시아세톤 키타아제를 암호화하는 뉴클레오타이드 서열이며, SEQ ID NOs: 8(S. cerevisiae(DAK1)) 또는 SEQ ID NO: 8과 비교하여 하나 또는 여러 개의 치환, 삽입 및/또는 결실을 갖는 것 중 적어도 하나와 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다.
본 발명의 세포에서 이종성 디히드록시아세톤 키나아제의 과발현에 사용될 수 있는 뉴클레오타이드 서열은 예를 들어, Daniel 등(1995, J. Bacteriol. 177:4392-4401)에 의해 기재된 Citobacter freundii의 dhaK 유전자와 같은 박테리아 디히드록시아세톤 키나아제를 암호화하는 서열이다. 바람직하게, 이종성 디히드록시아세톤 키나아제를 암호화하는 뉴클레오타이드 서열은 SEQ ID NO: 25와 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열 또는 SEQ ID NO: 25와 비교하여 하나 또는 여러 개의 치환, 삽입 및/또는 결실을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 바람직한 구현으로, 이종성 디히드록시아세톤 키나아제를 암호화하는 코돈-최적화된(상기 참조) 뉴클레오타이드 서열은, 예를 들어 SEQ ID NO: 25의 디히드록시아세톤 키나아제의 아미노산 서열을 암호화하는 코돈 최적화된 뉴클레오타이드 서열과 같이 과발현된다. 이러한 코돈-최적화된 뉴클레오타이드 서열은 예를 들어, SEQ ID NO: 26(위치 10 - 1668)에 제공된다.
디히드록시아세톤 키나아제를 암호화하는 뉴클레오타이드 서열의 과발현을 위해, (과발현되는) 뉴클레오타이드 서열은 바람직하게 본 발명의 숙주 세포내로 발현 구조물의 형질전환시 디히드록시아세톤 키나아제 효소의 과발현을 확실히 하도록 적절한 발현 조절 부위/서열에 작동가능하게 연결된 발현 구조물에 넣어진다(상기 참조). 디히드록시아세톤 키나아제 활성을 갖는 효소를 암호화하는 뉴클레오타이드 서열의 (과)발현을 위해 적절한 프로모터는, 바람직하게 이화대사(글루코즈) 억제에 민감하지 않으며, 혐기적 조건하에서 활성적이며 그리고/또는 바람직하게 유도를 위해 자일로즈 또는 아라비노즈를 필요로 하지 않는 프로모터들을 포함한다. 이러한 프로모터들의 예는 상기에 주어진다. 본 발명의 세포에서, 과발현되는 디히드록시아세톤 키나아제는 바람직하게 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인과 비교하여 적어도 팩터 1.1, 1.2, 1.5, 2, 5, 10 또는 20이 과발현된다. 바람직하게, 상기 디히드록시아세톤 키나아제는 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인과 비교하여 적어도 팩터 1.1, 1.2, 1.5, 2, 5, 10 또는 20이 혐기적 조건하에서 과발현된다. 이러한 수준의 과발현은 세포에서 안정한 상태 수준의 효소의 활성(세포에서 특이적 활성), 안정한 상태 수준의 효소의 단백질뿐만 아니라, 안정한 상태 수준의 효소를 암호하는 전사체에 적용될 수 있는 것으로 이해된다. 숙주 세포에서 뉴클레오타이드 서열의 과발현은 본 명세서에서 실시예에 기재된 바와 같이 30℃에서 형질전환된 숙주 세포의 세포 추출물에서 검출시, 적어도 0.002, 0.005, 0.01, 0.02 또는 0.05 U min-1(mg protein)-1의 특이적 디히드록시아세톤 키나아제 활성을 생성한다.
다른 구현으로, 본 발명의 숙주 세포는 또한 글리세롤의 세포내로의 수송을 증가시키는 유전적 변형을 포함한다. 바람직하게, 글리세롤의 세포내로의 수송을 증가시키는 유전적 변형은 바람직하게 글리세롤 흡수 단백질 및 글리세롤 채널 중 적어도 하나를 암호화하는 뉴클레오타이드 서열의 관발현을 일으키는 유전적 변형이다.
글리세롤 흡수 단백질은 본 명세서에서, 예를 들어, GUP1 및 GUP2 유전자에 의해 암호화되는 S. cerevisiae 글리세롤 흡수 단백질을 포함하는 멤브레인 바운드 O-아실트랜스퍼라아제(MBOAT) 수퍼패밀리에 포함되는 것들에 속하는 멀티멤브레인-스패닝 단백질로 이해된다. 바람직하게, 상기 유전적 변형은 예를 들어, 글리세롤 흡수 단백질을 암호화하는 뉴클레오타이드 서열의 과발현에 의해 글리세롤 흡수 단백질의 과발현을 일으킨다. 글리세롤 흡수 단백질을 암호화하는 뉴클레오타이드 서열은 상기 세포에 내인성이거나 또는 상기 세포에 이종성인 글리세롤 흡수 단백질일 수 있다. 본 발명의 세포에서 글리세롤 흡수 단백질의 과발현에 사용될 수 있는 뉴클레오타이드 서열은 예를 들어, Neves 등(2004, FEMS Yeast Res. 5:51-62)에 의해 기재된 바와 같은, 예를 들어, S. cerevisiae (GUP1) 및 (GUP2)의 글리세롤 흡수 단백질 유전자 및 이의 상동 유전자이다. 바람직하게, 상기 글리세롤 흡수 단백질을 암호화하는 뉴클레오타이드 서열은 SEQ ID NO's: 10(Gup1p) 및 11(Gup2p) 중 적어도 하나와 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 바람직한 구현으로, 글리세롤 흡수 단백질을 암호화하는 코돈-최적화된(상기 참조) 뉴클레오타이드 서열은, 예를 들어, SEQ ID NO: 10의 글리세롤 흡수 단백질을 암호화하는 코돈 최적화된 뉴클레오타이드 서열 또는 SEQ ID NO: 11의 글리세롤 흡수 단백질을 암호화하는 코돈 회적화된 뉴클레오타이드 서열과 같이 과발현된다. 글리세롤 수송에 대한 GUP1의 영향의 정확한 특성이 아직 불투명함에도 불구하고, Yu 등(2010, 상기 참조)은 S. cerevisiae에서 GUP1의 과발현이 글리세롤 성장 세포에서 에탄올 생성을 향상시키는 것으로 나타났다. 글리세롤 흡수 단백질의 과발현에 대한 바람직한 뉴클레오타이드 서열은 따라서 Neves 등(2004, 상기 참조)에 의해 기술된 바와 같은 상보성에 의해 S. cerevisiae gup1 Δ 돌연변이의 염 스트레스-관련 표현형을 구조할 수 있는 글리세롤 흡수 단백질을 암호화하는 뉴클레오타이드 서열이다. 이러한 S. cerevisiae GUP1의 상보성 상동 유전자는 SEQ ID NO: 10의 아미노산 서열과 적어도 60, 68, 72, 75, 80, 85, 90, 95, 98, 99% 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함하며, Saccharomyces, Zygosaccharomyces, Kluyveromyces, Candida, Pichia, Hansenula, Kloeckera, Schwanniomyces, 및 Yarrowia의 속에 속하는 이스트종으로부터 획득될 수 있다.
본 명세서에서 글리세롤 채널은 Reizer 등(1993, CRC Crit. Rev. Biochem. Mol. Biol., 28: 235-257)에 의해 리뷰된 MIP과의 채널 단백질의 멤버로서 이해되며, 이 채널 단백질은 6 멤브래인-스패닝 도메인으로 구성되는 250-280 아미노산 트랜스멤브레인 도메인을 포함하며, S. cerevisiae FPS1 아쿠아글리세로포린, SEQ ID NO: 12의 아미노산 250 및 530 사이의 아미노산 서열과 적어도 30, 35, 40, 45, 50, 60, 70, 80, 90, 95, 98 또는 99% 아미노산 동일성, 또는 적어도 55, 60, 65, 70, 80, 90, 95, 98 또는 99% 아미노산 동일성을 갖는다. 본 발명의 세포에서 글리세롤 채널의 과발현에 사용될 수 있는 뉴클레오타이드 서열은 예를 들어, S. cerevisiae의 이스트 아쿠아글리세로포린 FPS1 유전자(Van Aelst et al., 1991, EMBO J. 10:2095-2104) 및 예를 들어, Neves 등(2004, 상기 참조)에 의해 기재된 바와 같은 Kluyveromyces lactis, Kluyveromyces marxianus 및 Zygosaccharomyces rouxii 를 포함하는 다른 이스트들의 이의 상동 유전자를 암호화하는 뉴클레오타이드 서열을 포함한다. 그러나, 예를 들어, Luyten 등(1995, EMBO J. 14:1360-1371)이 S. cerevisiae FPS1 아쿠아글리세로포린의 아미노산 250 내지 530 사이의 아미노산 서열과 단지 30% 서열 동일성을 갖는 E. coli 글리세롤 패실리태이터가 S. cerevisiae fps1 Δ 돌연변이에서 상보적인 글리세롤 흡수를 할 수 있다는 것을 보여준 바와 같이, 박테리아 또는 식물 글리세롤 채널의 사용이 배제되지 않는다. 글리세롤 채널을 암호화하는 뉴클레오타이드 서열은 세포에 내인성이거나 또는 세포에 외인성인 글리세롤 채널일 수 있다. 바람직한 구현으로, SEQ ID NO: 12의 아쿠아글리세로포린을 암호화하는 코돈 최적화된 뉴클레오타이드 서열과 같이 글리세롤 채널을 암호화하는 코돈-최적화된(상기 참조) 뉴클레오타이드 서열은 과발현된다.
글리세롤 흡수 단백질 및/또는 글리세롤 채널 단백질을 암호화하는 뉴클레오타이드 서열의 과발현을 위해, (과발현되는) 뉴클레오타이드 서열은 바람직하게 본 발명의 숙주 세포내로 발현 구조물의 형질전환시 글리세롤 흡수 단백질 및/또는 글리세롤 채널 단백질의 과발현을 확실히 하도록 적절한 발현 조절 부위/서열에 작동가능하게 연결된 발현 구조물에 넣어진다(상기 참조). 글리세롤 흡수 단백질 및/또는 글리세롤 채널 단백질을 암호화하는 뉴클레오타이드 서열의 (과)발현을 위해 적절한 프로모터는, 바람직하게 이화대사(글루코즈) 억제에 민감하지 않으며, 혐기적 조건하에서 활성적이며 그리고/또는 바람직하게 유도를 위해 자일로즈 또는 아라비노즈를 필요로 하지 않는 프로모터들을 포함한다. 이러한 프로모터들의 예는 상기에 주어진다. 본 발명의 세포에서, 과발현되는 글리세롤 흡수 단백질 및/또는 글리세롤 채널 단백질은 바람직하게 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인과 비교하여 적어도 팩터 1.1, 1.2, 1.5, 2, 5, 10 또는 20이 과발현된다. 바람직하게, 상기 글리세롤 흡수 단백질 및/또는 글리세롤 채널 단백질은 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인과 비교하여 적어도 팩터 1.1, 1.2, 1.5, 2, 5, 10 또는 20이 혐기적 조건하에서 과발현된다. 이러한 수준의 과발현은 세포에서 안정한 상태 수준의 효소의 활성(세포에서 특이적 활성), 안정한 상태 수준의 효소의 단백질뿐만 아니라, 안정한 상태 수준의 효소를 암호하는 전사체에 적용될 수 있는 것으로 이해된다.
본 발명의 숙주 세포의 바람직한 구현으로, 상기 정의된 글리세롤 채널 단백질의 발현은 감소되거나 불활성화된다. 글리세롤 채널 단백질의 발현을 감소시키거나 불활성화시키는 유전적 변형은 세포 외로 글리세롤의 수송을 감소 또는 억제하는데 유용할 수 있다. 바람직하게, 글리세롤 채널 단백질의 발현의 감소 또는 불활성화는 상기 정의한 바와 같이 글리세롤 흡수 단백질을 암호화하는 뉴클레오타이드 서열의 과발현과 조합된다.
다른 구현으로, 본 발명의 숙주 세포는 또한 세포에서, 특이적 아세틸-CoA 합성 효소 활성을 증가시키는, 바람직하게 이러한 활성이 이러한 조건하에서 속도-제한되는 혐기적 조건하에서, 특이적 아세틸-CoA 합성 효소 활성을 증가시키는 유전적 변형을 포함한다. 아세틸-CoA 합성효소 또는 아세테이트-CoA 리가아제(EC 6.2.1.1)는 본 명세서에서 아세테이트와 조효소 A(CoA) 사이의 새로운 화학 결합의 형성을 촉매하는 효소로 이해된다. 바람직하게, 유전적 변형은 예를 들어, 아세틸-CoA 합성효소를 암호화하는 뉴클레오타이드 서열의 과발현에 의해 아세틸-CoA 합성효소의 과발현을 일으킨다. 아세틸-CoA 합성효소를 암호화하는 뉴클레오타이드 서열은 세포에 내인성이거나 또는 세포에 이종성인 아세틸-CoA 합성효소일 수 있다. 본 발명의 세포에서 아세틸-CoA 합성효소의 과발현에 사용될 수 있는 뉴클레오타이드 서열은 예를 들어, Jong-Gubbels 등(1998, FEMS Microbiol Lett. 165: 15-20)에 의해 기술된 바와 같이, S. cerevisiae (ACS1 및 ACS2)의 아세틸-CoA 합성효소 유전자이다. 바람직하게, 아세틸-CoA 합성효소를 암호화하는 뉴클레오타이드 서열은 SEQ ID NOs: 13 및 14 중 적어도 하나와 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다.
일 구현으로, 과발현되는 뉴클레오타이드 서열은 아세테이트에 대해 고 친화도로 아세틸-CoA 합성효소를 암호화한다. 아세테이트에 대해 고 친화도를 갖는 아세틸-CoA 합성효소의 사용은, 예를 들어 배지 L당 2g 이하의 아세트산과 같이 배지내에 상대적으로 저 농도의 아세트산이 존재하는 조건하에서 행하는 것이 바람직하다. 아세테이트에 대해 고 친화도를 갖는 아세틸-CoA 합성효소는 S. cerevisiae ACS2에 의해 암호화되는 아세틸-CoA 합성효소보다 더 높은 아세테이트 친화도를 갖는 아세틸-CoA 합성효소로 정의된다. 바람직하게, 아세테이트에 대해 고 친화도를 갖는 아세틸-CoA 합성효소는 S. cerevisiae ACS1 유전자에 의해 암호화되는 아세틸-CoA 합성효소와 같이 10, 5, 2, 1, 0.5, 0.2 또는 0.1 mM 이하의 아세테이트에 대한 Km을 갖는다. 보다 바람직하게 SEQ ID NO: 13의 아미노산 서열을 암호화하는 코돈-최적화된(상기 참조) 뉴클레오타이드 서열이 과발현된다.
다른 구현으로, 과발현되는 뉴클레오타이드 서열은 높은 최대 속도(Vmax)로 아세틸-CoA 합성효소를 암호화한다. 높은 최대 속도로 아세틸-CoA 합성효소의 사용은, 예를 들어, 배지 L당 적어도 2, 3, 4 또는 5g 아세트산과 같이 배지내에 상대적으로 높은 농도의 아세트산이 존재하는 조건하에서 수행되는 것이 바람직하다. 높은 최대 속도를 갖는 아세틸-CoA 합성효소는 본 명세서에서 S. cerevisiae ACS1에 의해 암호화되는 아세틸-CoA 합성효소보다 더 높은 최대 속도를 갖는 아세틸-CoA 합성효소로 정의된다. 바람직하게, 높은 최대 속도를 갖는 아세틸-CoA 합성효소는 S. cerevisiae ACS2 유전자 의해 암호화되는 아세틸-CoA 합성효소이다. 보다 바람직하게, SEQ ID NO: 14의 아미노산 서열을 암호화하는 코돈-최적화된(상기 참조) 뉴클레오타이드 서열이 과발현된다.
(과발현되는) 아세틸-CoA 합성효소를 암호화하는 뉴클레오타이드 서열의 과발현을 위해, (과발현되는) 뉴클레오타이드 서열은 바람직하게 본 발명의 숙주 세포내로 발현 구조물의 형질전환시 아세틸-CoA 합성효소의 과발현을 확실히 하도록 적절한 발현 조절 부위/서열에 작동가능하게 연결된 발현 구조물에 넣어진다(상기 참조). 아세틸-CoA 합성효소 활성을 갖는 상기 효소를 암호화하는 뉴클레오타이드 서열의 (과)발현을 위해 적절한 프로모터는, 바람직하게 이화대사(글루코즈) 억제에 민감하지 않으며, 혐기적 조건하에서 활성적이며 그리고/또는 바람직하게 유도를 위해 자일로즈 또는 아라비노즈를 필요로 하지 않는 프로모터들을 포함한다. 이러한 프로모터들의 예는 상기에 주어진다. 본 발명의 세포에서, 과발현되는 아세틸-CoA 합성효소는 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인과 비교하여 적어도 팩터 1.1, 1.2, 1.5, 2, 5, 10 또는 20이 과발현된다. 바람직하게, 상기 아세틸-CoA 합성효소는 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인과 비교하여 적어도 팩터 2, 5, 10, 20, 50 또는 100이 혐기적 조건하에서 과발현된다. 이러한 수준의 과발현은 세포에서 안정한 상태 수준의 효소의 활성(세포에서 특이적 활성), 안정한 상태 수준의 효소의 단백질뿐만 아니라, 안정한 상태 수준의 효소를 암호하는 전사체에 적용될 수 있는 것으로 이해된다.
다른 구현으로, 본 발명의 숙주 세포는 또한 세포에서 특이적 NAD+-의존적 글리세롤 3-포스페이트 디하이드로게나아제 활성을 감소시키는 유전적 변형을 포함한다. 글리세롤 3-포스페이트 디하이드로게나아제 또는 글리세롤포스페이트 디하이드로게나아제(EC 1.1.1.8)는 NADH를 NAD+로 산화시키며 sn-글리세롤 3-포스페이트에 대한 디하이드로게나아제 포스페이트의 환원을 촉매한다. 본 발명의 세포에서, 특이적 글리세롤포스페이트 디하이드로게나아제 활성은 바람직하게 과발현을 일으키는, 바람직하게 혐기적 조건하에서 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인에 비해 바람직하게 적어도 팩터 0.8, 0.5, 0.3, 0.1, 0.05 또는 0.01 감소된다.
바람직하게, 글리세롤포스페이트 디하이드로게나아제 활성은 숙주 세포에서 글리세롤포스페이트 디하이드로게나아제를 암호화하는 유전자의 발현을 감소시키거나 불활성화시키는 하나 이상의 유전적 변형에 의해 감소된다. 바람직하게, 유전적 변형은 세포 게놈에서 특이적 글리세롤포스페이트 디하이드로게나아제를 암호화하는 유전자의 각 내인성 카피의 발현을 감소시키거나 불활성화시킨다. 주어진 세포는 디-, 폴리- 또는 이수성의 결과로서 하나 및 이와 동일한 아미노산 서열을 갖는 특이적 글리세롤포스페이트 디하이드로게나아제를 암호화하는 유전자의 다중 카피를 포함할 수 있다. 이러한 예에서, 바람직하게 글리세롤포스페이트 디하이드로게나아제를 암호화하는 특이적 유전자의 각 카피의 발현은 감소되거나 불활성화된다. 변형적으로, 세포는 아미노산 서열이 다르며 다른 유전자에 의해 각각 암호화된 글리세롤포스페이트 디하이드로게나아제 활성을 갖는 여러 다른 (이소)효소를 함유할 수 있다. 이러한 예에서, 본 발명의 일부 구현으로, 상기 이소효소의 한 특정 타입은 감소되거나 불활성화되고 다른 타입은 영향을 받지 않는 것이 바람직하다(하기 참조). 바람직하게, 상기 유전자는 상기 유전자의 적어도 일부의 결실에 의해 또는 상기 유전자의 붕괴에 의해 불활성화되며, 이러한 정황에서 용어 유전자는 또한 암호 서열의 상향 또는 하향-흐름의 어느 논코딩 서열을 포함하며, 이의 (부분) 결실 또는 불활성화는 숙주 세포에서 글리세롤포스페이트 디하이드로게나아제 활성의 발현 감소를 일으킨다.
본 발명의 세포에서 이의 활성이 감소되거나 불활성화되는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 바람직한 유전자는 SEQ ID NO: 15의 아미노산 서열을 암호화하는 Eriksson 등(1995, Mol. Microbiol. 17: 95-107)에 의해 기재된 바와 같은 S. cerevisiae GPD2 유전자 및 다른 종에서 이의 상동 유전자이다. 따라서, 본 발명의 세포에서 이의 활성이 감소되거나 불활성화되는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 유전자는 SEQ ID NO: 15와 적어도 70, 75, 80, 85, 90, 95, 98 또는 99% 서열 동일성을 갖는 아미노산 서열을 갖는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 유전자이다.
본 발명의 바람직한 구현으로, 본 발명의 숙주 세포는 기능성 고-삼투성 글리세롤 반응 경로를 포함한다. 따라서, 바람직하게 SEQ ID NO: 15와 적어도 70% 서열 동일성을 갖는 아미노산 서열을 갖는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 유전자(들)의 활성만이 감소되거나 불활성화되며, 한편 SEQ ID NO: 16과 적어도 70, 75, 80, 85, 90, 95, 98 또는 99% 서열 동일성을 갖는 아미노산 서열을 갖는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 적어도 하나의 내인성 유전자는 기능적이다. SEQ ID NO: 16은 Albertyn 등(1994, Mol. Cell. Biol. 14: 4135-4144)에 의해 기재된 바와 같은 S. cerevisiae GPD1 유전자에 의해 암호화되는 아미노산 서열을 나타내며, 이는 S. cerevisiae GPD2 글리세롤포스페이트 디하이드로게나아제와 69% 아미노산 동일성을 갖는다. S. cerevisiae GPD1 유전자는 S. cerevisiae의 스트레스-유도 글리세롤포스페이트 디하이드로게나아제이며, 이는 산업적 발효 조건하에서 일어날 수 있는 삼투압 스트레스하에서 성장에 중요하다. 이의 발현은 특히 고-삼투성 글리세롤 반응 경로에 의해 조절된다. 따라서, 본 발명의 숙주 세포는 SEQ ID NO: 16과 적어도 70, 75, 80, 85, 90, 95, 98 또는 99% 서열 동일성을 갖는 아미노산 서열을 갖는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 내인성 유전자의 적어도 하나의 기능적 카피를 갖는 것이 유리하다.
상기에도 불구하고, 본 발명자들은 S. cerevisiae GPD1 글리세롤포스페이트 디하이드로게나아제의 불활성화가, S. cerevisiae GPD2 글리세롤포스페이트 디하이드로게나아제의 불활성화에 비해, 글리세롤 생성의 감소 및 글리세롤 및 아세테이트 소비의 증가에 보다 유리한 효과를 갖는다는 것을 이제 예기치않게 발견하였다. 따라서, 보다 바람직한 구현으로, 본 발명의 숙주 세포는 SEQ ID NO: 16(GDP1)에 대해 적어도 70, 75, 80, 85, 90, 95, 98 또는 99% 서열 동일성을 갖는 아미노산 서열을 갖는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 유전자(들)의 발현을 감소시키거나 불활성화시키는 유전적 변형을 포함한다.
다른 구현으로, 글리세롤포스페이트 디하이드로게나아제를 암호화하는 숙주 세포에서 모든 유전자의 활성이 감소되거나 불활성화된다. 이러한 세포에서, 바람직하게 SEQ ID NO: 15 또는 16에 대해 적어도 70, 75, 80, 85, 90, 95, 98 또는 99% 서열 동일성을 갖는 아미노산 서열을 갖는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 내인성 유전자의 모든 카피는 발현이 불활성화되거나 적어도 감소된다.
본 발명의 다른 구현으로, 상기 숙주 세포는 피부베이트 및 조효소-A를 포메이트 및 아세틸-CoA로 전환시키는 능력을 가진 효소를 암호화하는 외인성 유전자를 포함하는 이스트 세포가 아니다. 바람직하게, 상기 숙주 세포는 피루베이트 포메이트 리아제를 암호화하는 뉴클레오타이드 서열을 포함하는 이스트 세포가 아니다.
본 발명의 다른 구현으로, 상기 숙주 세포는 특이적 포메이트 디하이드로게나아제 활성이, a) 아세트알데히드 디하이드로게나아제 활성을 갖는 효소를 암호화하며, 아세트산을 에탄올로 전화하는 능력을 세포에 부여하는 외인성 유전자(의 도입); b) NAD+-결합 글리세롤 디하이드로게나아제 활성을 갖는 효소를 암호화하는 박테리아 유전자; 및 c) 본 명세서에 상기한 다른 어느 유전적 변형물로 구성되는 그룹으로부터 선택된 유전적 변형을 제외하고 유전적으로 동일한 숙주 세포의 스트레인에서 특이적 포메이트 디하이드로게나아제 활성의 적어도 81, 85, 90, 95 또는 100%인 숙주 세포이다. 따라서, 본 발명의 바람직한 숙주 세포는 세포에서 특이적 NAD+-의존적 포메이트 디하이드로게나아제 활성을 감소시키는 유전적 변형을 포함하는 이스트 세포가 아니다.
다른 바람직한 구현으로, 본 발명의 숙주 세포는 a) 자일로즈를 자일룰로즈로 이소머화하는 능력; 및 b) L-아라비노즈를 D-자일룰로즈 5-포스페이트로 전환하는 능력 중 적어도 하나를 갖는다. a)에 대해, 세포는 바람직하게 기능적 외인성 자일로즈 이소머라아제 유전자를 가지며, 이 유전자는 세포에 자일로즈를 자일룰로즈로 이소머화하는 능력을 부여한다. b)에 대해, 세포는 바람직하게 L-아라비노즈 이소머라아제, L-리불로키나아제 및 L-리불로즈-5-포스페이트 4-에피머라아제를 암호화하는 기능적 외인성 유전자를 가지며, 이 유전자는 L-아라비노즈를 D-자일룰로즈 5-포스페이트로 전환시키는 이소머화 능력을 세포에 부여한다.
자일로즈를 자일룰로즈로 이소머화하는 능력을 가진 균류 숙주 세포는 예를 들어, WO 03/0624430 및 WO 06/009434에 기재되어 있는 바와 같다. 자일로즈를 자일룰로즈로 이소머화하는 능력은 바람직하게 자일로즈 이소머라아제를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산 구조물을 이용한 형질전환에 의해 세포에 부여된다. 따라서, 바람직하게 상기 세포는 자일로즈를 자일룰로즈로 직접 이소머화하는 능력을 획득한다. 이에 따라, 보다 바람직하게 상기 세포는 자일로즈의 자일룰로즈의 직접적인 이소머화 (및 자일로즈의 추가 대사)를 통해 태양 에너지 및/또는 탄소 공급원으로서 자일로즈에서 호기적으로 그리고/또는 혐기적으로 성장하는 능력을 획득한다. 여기서 자일로즈의 자일룰로즈로의 직접적인 이소머화는, 각각 자일로즈 환원효소 및 자일리톨 디하이드로게나아제에 의해 촉매되는 자일리톨 중간물을 통해 자일로즈의 자일룰로즈의 2단계 전환과 상반적으로, 자일로즈 이소머라아제에 의해 촉매되는 단일 반응으로 일어나는 것으로 이해된다.
본 발명의 세포에 자일로즈를 자일룰로즈로 직접 이소머화하는 능력을 부여하는데 성공적으로 사용될 수 있는 여러 자일로즈 이소머라아제 (및 이들의 아미노산 및 암호 뉴클레오타이드 서열)는 당해 기술분야에 기술되어 있다. 이들은 Piromyces sp. 및 Neocallimastix, Caecomyces, Piromyces 또는 Ruminomyces(WO 03/0624430), Cyllamyces aberensis(US 20060234364), Orpinomyces(Madhavan et al., 2008, DOI 10.1007/s00253-008-1794-6)과에 속하는 다른 혐기성 균류의 자일로즈 이소머라아제, 예를 들어, B. thetaiotaomicron (WO 06/009434), B. fragilis, 및 B. uniformis (WO 09/109633)를 포함하는 박테리아속 Bacteroides의 자일로즈 이소머라아제, 혐기성 박테리아 Clostridium phytofermentans (Brat et al., 2009, Appl. Environ. Microbiol. 75: 2304-2311)의 자일로즈 이소머라아제, 및 Clostridium difficile, Ciona intestinales 및 Fusobacterium mortiferum의 자일로즈 이소머라아제를 포함한다.
예를 들어, Wissenlink 등(2007, AEM Accepts, published online ahead of print on 1 June 2007; Appl. Environ. Microbiol. doi:10.1128/AEM.00177-07) 및 EP 1 499 708에 기재된 바와 같은, L-아라비노즈를 D-자일룰로즈 5-포스페이트로 전환하는 능력을 가진 균류 숙주 세포가 사용된다. L-아라비노즈를 D-자일룰로즈 5-포스페이트로 전환하는 능력은 바람직하게 a) 아라비노즈 이소머라아제; b) 리불로인산화 효소, 바람직하게 L-리불로인산화 효소 자일로즈 이소머라아제; 및 c) 리불로즈-5-P-4-에피머라아제, 바람직하게 L-리불로즈-5-P-4-에피머라아제를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산 구조물(들)을 이용한 형질전환에 의해 세포에 부여된다. 바람직하게, 본 발명의 세포에서, L-아라비노즈를 D-자일룰로즈 5-포스페이트로 전환시키는 능력은, 1) 아라비노즈의 리불로즈로의 이소머화; 2) 리불로즈의 리불로즈 5-포스페이트로의 인산화 및 3) 리불로즈 5-포스페이트의 D-자일로즈 5-포스페이트로의 에피머화를 통한 L-아라비노즈의 D-자일로즈 5-포스페이트로의 전환 능력이다. 아라비노즈 이소머라아제, 리불로인산환 효소 및 리불로즈-5-P-4-에피머라아제를 암호화하는 적절한 뉴클레오타이드 서열은 Bacillus subtilis, Escherichia coli(참조 예 EP 1 499 708), Lactobacilli, 예, Lactobacillus plantarum(참조 예 Wisselink et al. supra), 또는Clavibacter, Arthrobacter 및 Gramella의 종으로부터 획득될 수 있으며, 이중에서 바람직하게는Clavibacter michiganensis , Arthrobacter aurescens and Gramella forsetii(참조 WO2009/011591)이다.
본 발명의 형질전환된 숙주 세포는 또한 바람직하게, 자일로즈로부터 이소머화되는 자일룰로즈가 피루베이트로 대사될 수 있도록 자일룰로즈 키나아제 활성을 포함한다. 바람직하게, 상기 세포는 내인성 자일룰로즈 키나아제 활성을 함유한다. 보다 바람직하게, 본 발명의 세포는 특이적 자일룰로즈 키나아제 활성을 증가시키는 유전적 변형을 포함한다. 바람직하게, 유전적 변형은 예를 들어, 자일룰로즈 키나아제를 암호화하는 뉴클레오타이드 서열의 과발현에 의해 자일룰로즈 키나아제의 과발현을 일으킨다. 자일룰로즈 키나아제를 암호화하는 유전자는 세포에 대해 내인성이거나 세포에 이종성인 자일룰로즈 키나아제일 수 있다. 본 발명의 세포에서 자일룰로즈 키나아제의 과발현에 사용될 수 있는 뉴클레오타이드 서열은 예를 들어, Deng 및 Ho(1990, Appl. Biochem. Biotechnol. 24-25: 193-199)에 의해 기재된 S. cerevisiae (XKS1 )의 자일룰로즈 키나아제 유전자이다. 다른 바람직한 자일룰로즈 키나아제는 Piromyces (xylB; 참조 WO 03/0624430)의 자일로즈 키나아제와 관련된 자일로즈 키나아제이다. 이 Piromyces 자일룰로즈 키나아제는 실제로, 이스트 키나아제와 같은 공지된 모든 진핵 키나아제에 비해 원핵 키나아제와 보다 관련된다. 진핵 자일룰로즈 키나아제는 비-특이적 당 키나아제로 나타내며, 이는 자일룰로즈를 포함하는 광범위한 기질 범위를 갖는다. 이와 대조적으로, Piromyces 키나아제가 가장 근접하게 관련된 원핵 자일룰로즈 키나아제는 자일룰로즈에 보다 특이적인, 즉 보다 좁은 기질 범위를 갖는 키나아제인 것으로 나타났다. 본 발명의 세포에서, 과발현되는 자일로즈 키나아제는, 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인에 비해 적어도 팩터 1.1, 1.2, 1.5, 2, 5, 10 또는 20으로 과발현된다. 이러한 수준의 과발현은 안정한 상태 수준의 효소의 활성, 안정한 상태 수준의 효소의 단백질뿐만 아니라, 안정한 상태 수준의 효소를 암호하는 전사체에 적용될 수 있는 것으로 이해된다.
본 발명의 세포는 또한 바람직하게 WO06/009434에 기재된 바와 같은 펜토즈 포스페이트 경로의 플럭스를 증가시키는 유전적 변형을 포함한다. 특히, 유전적 변형은 비-산화부 펜토즈 포스페이트 경로의 증가된 플럭스를 일으킨다. 펜토즈 포스페이트 경로의 비-산화부의 증가된 플럭스를 일으키는 유전적 변형은 본 명세서에서 증가된 플럭스를 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인에서의 플럭스에 비해 적어도 팩터 1.1, 1.2, 1.5, 2, 5, 10 또는 20으로 플럭스를 증가시키는 변형을 의미하는 것으로 이해된다. 펜토즈 포스페이트 경로의 비-산화부의 플럭스는 WO 06/009434에 기재된 바와 같이 측정될 수 있다.
펜토즈 포스페이트 경로의 플럭스를 증가시키는 유전적 변형은 다양한 방법으로 본 발명의 세포에 도입될 수 있다. 이는 예를 들어, 보다 높은 안정한 상태 수준 활성 수준의 자일룰로즈 키나아제 및/또는 비-산화부 펜토즈 포스페이트 경로의 하나 이상의 효소 및/또는 감소된 안정한 상태 수준의 비특이적 알도즈 환원효소 활성을 달성하는 것을 포함한다. 이러한 안정한 상태 활성 수준의 변화는 (자연적이거나 또는, 화학 또는 방사선에 의해 유도되는) 돌연변이의 선별에 의해 그리고/또는 예를 들어, 각각 상기 효소를 암호화하는 유전자 또는 이러한 유전자를 조절하는 인자의 과발현 또는 불활성화에 의한 것과 같은 재조합 DNA 기술에 의해 이루어질 수 있다.
본 발명의 바람직한 세포에서, 유전적 변형은 (비-산화부) 펜토즈 포스페이트 경로의 적어도 하나의 효소의 과발현을 포함한다. 바람직하게, 상기 효소는 리불로즈-5-포스페이트 이소머라아제, 리불로즈-5-포스페이트 3-에피머라아제, 트랜스케톨라아제 및 트랜스알돌라아제를 암호화하는 효소로 구성되는 그룹으로부터 선택된다. 상기 (비-산화부) 펜토즈 포스페이트 경로의 다양한 조합의 효소가 과발현될 수 있다. 예를 들어, 과발현되는 효소는 적어도 리불로즈-5-포스페이트 이소머라아제 및 리불로즈-5-포스페이트 3-에피머라아제 효소이거나; 또는 적어도 리불로즈-5-포스페이트 이소머라아제 및 트랜스케톨라아제 효소이거나; 또는 적어도 리불로즈-5-포스페이트 3-에피머라아제 및 트랜스케톨라아제 효소이거나; 또는 적어도 리불로즈-5-포스페이트 3-에피머라아제 및 트랜스알돌라아제 효소이거나; 또는 적어도 트랜스케톨라아제 및 트랜스알돌라아제 효소이거나; 또는 적어도 리불로즈-5-포스페이트 3-에피머라아제, 트랜스케톨라아제 및 트랜스알돌라아제 효소이거나; 또는 적어도 리불로즈-5-포스페이트 이소머라아제, 트랜스케톨라아제 및 트랜스알돌라아제 효소이거나; 또는 적어도 리불로즈-5-포스페이트 이소머라아제, 리불로즈-5-포스페이트 3-에피머라아제 및 트랜스알돌라아제 효소이거나; 또는 적어도 리불로즈-5-포스페이트 이소머라아제, 리불로즈-5-포스페이트 3-에피머라아제 및 트랜스케톨라아제 효소일 수 있다. 본 발명의 일 구현으로, 각각의 효소 리불로즈-5-포스페이트 이소머라아제, 리불로즈-5-포스페이트 3-에피머라아제, 트랜스케톨라아제 및 트랜스알돌라아제가 본 발명의 세포에서 과발현된다. 유전적 변형이 적어도 효소 트랜스알돌라아제의 과발현을 포함하는 세포가 바람직하다. 숙주 세포가 이미 자일로스에서 혐기적 성장이 가능한 것과 같이, 유전적 변형이 적어도 트랜스케톨라아제 및 트랜스알돌라아제 효소 모두의 과발현을 포함하는 것이 보다 바람직하다. 실제로, 4가지 모든 효소, 즉, 리불로즈-5-포스페이트 이소머라아제, 리불로즈-5-포스페이트 3-에피머라아제, 트랜스케톨라아제 및 트랜스알돌라아제를 과발현하는 세포와 같이, 일부 조건하에서, 트랜스케톨라아제 및 트랜스알돌라아제만을 과발현하는 세포가 이미 자일로즈에서 동일한 혐기적 성장 속도를 갖는 것을 발견하였다. 더욱이, 리불로즈-5-포스페이트 이소머라아제 및 리불로즈-5-포스페이트 3-에피머라아제 효소 모두를 과발현하는 본 발명의 세포는 이러한 효소들 중 하나만의 과발현이 대사 불균형을 생성함에 따라, 상기 이소머라아제 또는 상기 3-에피머라아제만을 과발현하는 세포에 비해 바람직하다.
본 발명의 세포에서 효소의 과발현을 위해 당해 기술분야에 이용가능한 다양한 수단들이 있다. 구체적으로, 효소는 예를 들어, 세포의 게놈내의 유전자의 부가적인 카피를 통합함으로써, 에피좀 다중카피 발현벡터로부터 유전자를 발현시킴으로써 또는 유전자의 다중카피를 포함하는 에피좀 발현벡터를 도입함으로써 세포에서 효소를 암호화하는 유전자의 카피 수를 증가시켜 과발현될 수 있다. 효소의 과발현에 사용되는 암호 서열은 바람직하게 본 발명의 숙주 세포와 동종성이다. 그러나, 본 발명의 숙주 세포에 이종성인 암호 서열이 마찬가지로 적용될 수 있다.
변형적으로, 본 발명의 세포에서 효소의 과발현은, 과발현되는 효소를 암호화하는 서열에 고유적이지 않은 프로모터를 이용하여 달성될 수 있다. 즉, 작동가능하게 연결되는 암호 서열에 이종성인 프로모터를 이용할 수 있다. 상기 프로모터는 바람직하게 이에 작동가능하게 연결되는 코딩 서열에 이종성임에도 불구하고, 상기 프로모터는 동종성, 즉, 본 발명의 세포에 내인성인 것이 또한 바람직하다. 바람직하게, 이종성 프로모터는 바람직하게는, 자일로즈 또는 자일로즈 및 글루코즈가 탄소 공급원으로, 보다 바람직하게는, 주요 탄소 공급원으로서(즉, 이용가능한 탄소 공급원의 50% 이상이 자일로즈 또는 자일로즈 및 글루코즈로 구성됨), 가장 바람직하게는 탄소 공급원 단독으로서 이용가능한 조건하에서, 코딩 서열에 고유적인 프로모터인 것보다 보다 높은 안정 상태 수준의 코딩 서열을 포함하는 전사체를 생성할 수 있다(또는 시간 단위당 보다 많은 전사체 분자, 즉, mRNA 분자를 생성할 수 있다).
본 발명의 추가의 바람직한 세포는 세포에서 비특이적 알도즈 환원효소 활성을 감소시키는 유전적 변형을 포함한다. 바람직하게, 비특이적 알도즈 환원효소 활성은, 비특이적 알도즈 환원효소를 암호화하는 유전자의 발현을 감소시키거나 불활성화하는 하나 이상의 유전적 변형에 의해 숙주 세포에서 감소된다. 바람직하게, 유전적 변형은 세포의 게놈에서 자일로즈, 자일룰로즈 및 아라비노즈를 포함하는 알도펜토즈를 환원시킬 수 있는 비특이적 알도즈 환원효소를 암호화하는 유전자의 각 내인성 카피의 발현을 감소시키거나 불활성화한다. 주어진 세포는 디-, 폴리- 또는 이수성의 결과로서 비특이적 알도즈 환원효소를 암호화하는 다중 카피를 포함할 수 있으며, 그리고/또는 세포는 아미노산 서열이 다르며 다른 유전자에 의해 각각 암호화된 알도즈 환원효소 활성을 갖는 여러 다른 (이소)효소를 함유할 수 있다. 또한, 이러한 예에서, 바람직하게 비특이적 알도즈 환원효소를 암호화하는 각 유전자의 발현은 감소되거나 불활성화된다. 바람직하게, 상기 유전자는 상기 유전자의 적어도 일부의 결실에 의해 또는 상기 유전자의 붕괴에 의해 불활성화되며, 이러한 정황에서 용어 유전자는 또한 암호 서열의 상향 또는 하향-흐름의 어느 논코딩 서열을 포함하며, 이의 (부분) 결실 또는 불활성화는 숙주 세포에서 비특이적 알도즈 환원효소 활성의 발현 감소를 일으킨다. 본 발명의 세포에서 활성이 환원되는 알도즈 환원효소를 암호화하는 뉴클레오타이드 서열 및 이러한 알도즈 환원효소의 아미노산 서열은 WO 06/009434에 기재되어 있으며, 예를 들어, S. cerevisiae GRE3 유전자(Traff et al., 2001, Appl. Environm. Microbiol. 67: 5668-5674)의 (비특이적) 알도즈 환원효소 및 다른 종에서 이의 상동 유전자를 포함한다.
본 발명에 따른 다른 바람직한 형질전환 숙주 세포는 (a) 자일로즈 및/또는 아라비노즈의 세포로의 증가된 수송; (b) 이화대사 억제에 대한 감소된 민감성; (c) 에탄올, 삼투성 또는 유기산에 대한 증가된 내성; 및 (d) 부산물의 감소된 생성으로 구성되는 그룹으로부터 선택되는 하나 이상의 특성을 형성하는 추가의 유전적 변형을 포함할 수 있다. 부산물은 원하는 발효 산물 이외의 탄소-함유 분자를 의미하는 것으로 이해되며, 예를 들어, 자일리톨, 아라비니톨, 글리세롤 및/또는 아세트산을 포함한다. 본 명세서에 기재된 어느 유전적 변형은 통상적인 돌연변이 발생에 의해 그리고 원하는 돌연변이에 대한 스크리닝 및/또는 선별에 의해 도입되거나, 또는 단순히 원하는 특성을 갖는 자연적 돌연변이에 대한 스크리닝 및/또는 선별에 의해 도입될 수 있다. 변형적으로, 유전적 변형은 내인성 유전자의 과발현 및/또는 내인성 유전자의 불활성화로 구성될 수 있다. 아라비노즈 및/또는 자일로즈의 세포내로의 증가된 수송을 위해 과발현이 원하여지는 유전자는 바람직하게 헥소스 또는 펜토즈 트랜스포터를 암호화하는 유전자로부터 선택된다. S. cerevisiae 및 다른 이스트에서, 이러한 유전자는 HXT1 , HXT2 , HXT4 , HXT5 , HXT7 및 GAL2를 포함하며, 이중에서 HXT1 , HXT5 및 GAL2가 가장 바람직하다(Sedlack 및 Ho, Yeast 2004; 21: 671-684). 이스트에서 발현을 위해 바람직한 다른 트랜스포터는 P. stipitis SUT1 유전자(Katahira et al., 2008, Enzyme Microb. Technol. 43: 115-119)에 의해 암호화된 글루코즈 트랜스포터이다. 마찬가지로, 다른 종에서의 이러한 트랜스포터 유전자의 상동 유전자가 과발현될 수 있다. 본 발명의 세포에서 과발현될 수 있는 다른 유전자는 당분해 효소 및 알코올 디하이드로게나아제와 같은 에탄올생성 효소를 암호화하는 유전자를 포함한다. 불활성화를 위한 바람직한 내인성 유전자는 예를 들어, S. cerevisiae HXK2 유전자(참조 Diderich et al., 2001, Appl. Environ. Microbiol. 67: 1587-1593); S. cerevisiae MIG1 또는 MIG2 유전자; S. cerevisiae 글리세롤-포스페이트 디하이드로게나아제 1 및/또는 2 유전자와 같은 글리세롤 대사에 연루된 효소를 암호하는 유전자와 같은 헥소스 키나아제 유전자; 또는 다른 종에서 이러한 유전자의 (하이브리드) 상동 유전자를 포함한다. 자일로즈 발효를 위한 숙주 세포의 다른 바람직한 추가 변형은 van Maris 등(2006, Antonie van Leeuwenhoek 90:391-418), WO2006/009434, WO2005/023998, WO2005/111214, 및 WO2005/091733에 기재되어 있다. 본 명세서에 기재된 바와 같은 본 발명의 세포들의 어느 유전적 변형은 가능한 한 바람직하게 자가 클로닝 유전 변형에 의해 도입되거나 변형된다.
본 발명에 따른 바람직한 숙주 세포는 탄소/에너지 공급원으로서 자일로즈 및 아라미노즈 중 적어도 하나에서, 바람직하게 탄소/에너지 공급원 단독으로서, 그리고 바람직하게 혐기 조건하에서, 즉, 혐기 발효 공정에 대해 하기 정의된 바와 같은 조건하에서 성장하는 능력을 갖는다. 바람직하게, 탄소/에너지 공급원으로서 자일로스에서 성장시, 숙주 세포는 자일리톨을 본질적으로 생성하지 않는다. 예를 들어, 생성되는 자일리톨은 검출 제한 이하이거나 몰 기준으로 소비된 탄소의 5, 2, 1, 0.5 또는 0.3%미만이다. 바람직하게, 탄소/에너지 공급원으로서 아라비노즈에서 성장시, 세포는 본질적으로 아라비니톨을 생성하지 않으며, 예를 들어, 생성되는 아라비니톨은 검출 제한 이하이거나 물 기준으로 소비된 탄소의 5, 2, 1, 0.5 또는 0.3%미만이다.
본 발명의 바람직한 숙주 세포는 a) 헥소스 및 펜토즈 중 적어도 하나; b) 아세트산; 및 c) 글리세롤의 조합에서 혐기 조건하에서 적어도 0.01, 0.02, 0.05, 0.1, 0.2, 0.25 또는 0.3 h- 1 의 속도, 또는 보다 바람직하게 혐기 조건하에서 적어도 0.005, 0.01, 0.02, 0.05, 0.08, 0.1, 0.12, 0.15 또는 0.2 h- 1 의 속도로 성장하는 능력을 갖는다. 따라서, 바람직하게 숙주 세포는 탄소/에너지 공급원 단독으로서 자일로즈 및 아라비노즈 중 적어도 하나에서, 혐기 조건하에서 적어도 0.01, 0.02, 0.05, 0.1, 0.2, 0.25 또는 0.3 h- 1 의 속도, 또는 보다 바람직하게 혐기 조건하에서 적어도 0.005, 0.01, 0.02, 0.05, 0.08, 0.1, 0.12, 0.15 또는 0.2 h- 1 의 속도로 성장하는 능력을 갖는다. 보다 바람직하게, 숙주 세포는 탄소/에너지 공급원으로서 헥소스(예, 글루코즈)와 자일로즈 및 아라비노즈 중 적어도 하나의 혼합물(1:1 중량비로)에서, 혐기 조건하에서 적어도 0.01, 0.02, 0.05, 0.1, 0.2, 0.25 또는 0.3 h- 1 의 속도, 또는 보다 바람직하게 혐기 조건하에서 적어도 0.005, 0.01, 0.02, 0.05, 0.08, 0.1, 0.12, 0.15 또는 0.2 h- 1 의 속도로 성장하는 능력을 갖는다.
일 견지로, 본 발명은 에탄올, 락틱산, 3-히드록시-프로피온산, 아크릴산, 1,3-프로판디올, 부탄올 및 이소프레노이드-유도 산물로 구성되는 그룹으로부터 선택된 발효 산물의 제조를 위해 사용되는 본 발명에 따른 이스트 세포의 용도에 관한 것이다.
다른 견지로, 본 발명은 에탄올, 락틱산, 3-히드록시-프로피온산, 아크릴산, 1,3-프로판디올, 부탄올(1-부탄올, 2-부탄올, 이소부탄올) 및 이소프레노이드-유도 산물로 구성되는 그룹으로부터 선택된 발효 산물을 제조하는 방법에 관한 것이다. 상기 방법은 바람직하게, a) 배지를 이스트 세포로 발효시켜, 이에 의해 배지는 a) 헥소스 및 펜토즈 중 적어도 하나의 공급원; b) 아세트산 공급원; 및 c) 글리세롤의 공급원을 함유하거나 이와 함께 공급되고, 이에 따라 이스트 세포는 아세트산, 글리세롤, 및 헥소스와 펜토즈 중 적어도 하나를 에탄올로 발효시키는 단계를 포함한다. 이스트 세포는 바람직하게 상기 정의된 바와 같은 (숙주) 세포이다. 상기 방법은 바람직하게 발효 산물이 회수되는 추가 단계를 포함한다. 상기 방법은 배치 공정, 유가식 공정 또는 연속 공정일 수 있으며, 이들은 당해 기술분야에 잘 알려져 있다. 본 발명의 방법에서, 글리세롤의 공급원은 글루코즈보다 더 환원된 상태를 갖는 어느 탄소 공급원일 수 있다. 글루코즈보다 더 환원된 상태를 갖는 탄소 공급원은 (함유된 화합물의) C-몰당 평균 환원 상태가 글루코즈의 C-몰당 환원 상태보다 더 큰 탄소 공급원으로 이해된다. 글루코즈보다 더 환원된 상태를 갖는 탄소 공급원의 예는 프로판올 및 부탄올과 같은 알칸올; 1,3-프로판-디올, 부탄디올, 글리세롤, 만니톨 및 자일리톨과 같은 폴리올을 포함한다.
바람직한 방법으로, 헥소스의 공급원은 글루코즈를 포함하거나 이로 구성된다. 바람직하게, 상기 공급원 펜토즈는 자일로즈 및 아라비노즈 중 적어도 하나를 포함하거나 이로 구성된다. 바람직하게, 본 발명의 세포에 의해 발효되는 배지는 글루코즈, 자일로즈 및/또는 아라비노즈와 같은 헥소스 및 펜토스 중 적어도 하나를 포함하는 가수분해된 바이오매스(의 분획)를 포함하거나 이와 함께 공급된다. 헥소스 및 펜토즈를 포함하는 가수분해된 바이오매스(의 분획)는 일반적으로 또한 아세트산 (또는 이의 염)을 포함할 것이다. 본 발명의 방법에서 발효될 가수분해되는 바이오매스의 예는 예를 들어, 가수분해된 목질 섬유 바이오매스이다. 본 명세서에서 목질 섬유 바이오매스는 셀룰로즈, 헤미셀룰로즈 및 리그닌을 포함하여 구성되는 식물 바이오매스로 이해된다. 탄수화물 폴리머(셀룰로즈 및 헤미셀룰로즈)가 리그닌에 단단히 바인딩된다. 본 발명에 사용되는 가수분해될 목질 섬유 바이오매스의 예는 (옥수수 대 및 사탕수수 찌꺼기를 포함하는) 농업 잔류물, (제재소 및 제지 공장 폐기물을 포함하는) 목재 잔류물 및 (공공) 종이 폐기물을 포함한다. 목질 섬유와 같은 바이오매스의 가수분해를 위한 방법은 당해 기술분야에 알려져 있으며, 예를 들어, 황산과 같은 산 및 셀룰라아제 및 헤미셀룰라아제와 같은 효소를 포함한다.
본 발명의 방법에서, 자일로즈, 글루코즈 및 아라비노즈의 공급원은 그 자체(즉, 단량체 당질로서) 자일로즈, 글루코즈 및 아라비노즈이거나, 또는 이들은 목질 섬유, 아라비난, 자일란, 셀룰로즈, 전분 등과 같이 자일로즈, 글루코즈 및/또는 아라비노즈 유닛을 포함하는 어느 탄수화물 올리고- 또는 폴리머의 형태일 수 있다. 이러한 탄수화물로부터 자일로즈, 글루코즈 및/또는 아라비노즈 유닛의 방출을 위해 적절한 탄수화물 분해효소(아라비나아제, 자일라나아제, 글루카나아제, 아밀라아제, 셀룰라아제, 글루카나아제 등과 같은)가 발효 배지에 첨가되거나, 또는 변형 숙주 세포에 의해 생성될 수 있다. 후자의 경우에, 변형된 숙주 세포는 이러한 탄수화물 분해효소를 생성하고 분비하도록 유전적으로 합성될 수 있다. 글루코즈의 올리고- 또는 중합 공급원의 부가적인 이점은, 예를 들어, 발효 중에 바람직하게 탄수화물 분해효소의 속도-제한 량을 이용하여, 발효 중에 저(보다 낮은) 농도의 유리 글루코즈를 유지하는 것이 가능한 것이다. 이는, 그 다음 자일로즈 및 아라비노즈와 같은 비-글루코즈 당질의 대사 및 수송에 필요한 시스템의 억압을 억제할 것이다. 바람직한 방법으로, 변형된 숙주 세포는 글루코즈 및 자일로즈와 아라비노즈 중 적어도 하나 모두를 발효시키며, 바람직하게 동시에, 이중영양적 성장을 억제하는 글루코즈 억압에 덜 민감한 변형된 숙주 세포가 사용된다. 탄소 공급원으로서 자일로즈 및 아라비노즈 (및 글루코즈) 중 적어도 하나의 공급원에 부가적으로, 발효 배지는 또한 변형된 숙주 세포의 성장에 필요한 적절한 성분을 포함할 것이다. 이스트와 같은 진핵 미생물의 성장을 위한 발효 배지의 조성물은 당해 기술분야에 잘 알려져 있다.
본 발명의 방법에서, 배지는 바람직하게 글리세롤의 공급원을 더 포함하며 그리고/또는 글리세롤의 공급원과 함께 공급된다. 본 발명의 방법에 사용되는 글리세롤은 유리하게 식물 오일 또는 동물 지방 및 알코올을 이용한 트랜스에스테르화 반응으로부터 바이오디젤 생성시 부산물로서 생성되는 글리세롤일 수 있다.
발효 공정은 호기성 또는 혐기성 발효 공정일 수 있다. 혐기성 발효 공정은 본 명세서에서 산소의 부재하에 운전되거나 실질적으로 산소가 소비되지 않는, 바람직하게 5, 2.5 또는 1mmol/L/h 미만, 보다 바람직하게 0mmol/L/h이 소비되며(즉, 산소 소비가 검출불가한), 그리고 유기 분자가 전자 도너 및 전자 어셉터 모두로 제공되는 발효 공정으로 정의된다. 산소의 부재하에, 당분해 및 바이오매스 형성시 생성되는 NADH는 산화성 인산화에 의해 산화될 수 없다. 이 문제를 해소하기 위해, 다수의 미생물들은 전자 및 수소 어셉터로서 피루베이트 또는 이의 유도체들 중 하나를 사용하여 NAD+를 재생한다. 따라서, 바람직한 혐기 발효 공정에서, 피루베이트는 전자 (및 수소 어셉터)로 사용되며, 에탄올과 같은 발효 산물뿐만 아니라 락틱산, 3-히드록시-프로피온산, 아크릴산, 1,3-프로판-디올, 부탄올(1-부탄올, 2-부탄올, 이소부탄올) 이소프레노이드-유래 산물과 같은 비-에탄올 발효 산물로 환원된다. 본 발명의 혐기 공정은, 혐기 공정이 에어레이션을 위한 장치 및 에너지를 필요로 하지 않고, 또한 형기 공정은 호기 공정보다 더 높은 산물 수율을 생성하기 때문에, 호기 공정에 비해 바람직하다.
변형적으로, 본 발명의 발효 공정은 호기 산소-제한 조건하에서 운전될 수 있다. 바람직하게, 산소-제한 조건하에서 호기 공정에서, 산소 소비 속도는 적어도 5.5, 보다 바람직하게 적어도 6, 그리고 보다 바람직하게 적어도 7mmol/L/h이다. 본 발명의 바람직한 호기 산소-제한 발효 공정에서, 본 발명의 이스트 세포는 탄소 공급원의 발효 산물로의 전환 중에 소비되는 탄소 공급원과 관련된 C-몰 기준으로 30, 20, 18, 15, 12, 10, 8 또는 5% 미만의 산소량을 소비한다. C-몰 기준(Cos)으로 이용되는 기질에 걸쳐 소비되는 산소의 전환 계수는 본 명세서에서 소비된 C-몰 탄소 공급원당 사용된 몰 O2를 의미하는 것으로 이해된다. 따라서, 본 발명의 방법은 엄격한 혐기 조건(즉, Cos = 0.0)하에서 수행될 수 있으며, 또는 본 발명의 방법은 호기 조건하에서, 바람직하게 Cos가 바람직하게 0.3, 0.2, 0.18, 0.15, 0.12, 0.1, 0.08 또는 0.05 미만인 산소-제한된 조건하에서 수행될 수 있다.
발효 공정은 바람직하게 본 발명의 변형된 세포에 대해 최적인 온도에서 운전된다. 따라서, 대부분의 이스트 세포에 있어서, 발효 공정은 42℃미만, 바람직하게 38℃미만인 온도에서 수행된다. 이스트 세포에 있어서, 발효 공정은 바람직하게 35, 33, 30 또는 20℃이하인 온도 및 20, 22 또는 25℃이상인 온도에서 수행된다.
본 발명에 따른 바람직한 발효 공정은 에탄올 생산을 위한 공정이며, 이에 따라 상기 공정은 이스트 세포로 배지를 발효하는 단계를 포함하며, 따라서 상기 배지는 a) 헥소스 및 펜토스 중 적어도 하나의 공급원; b) 아세트산의 공급원; 및 c) 글리세롤의 공급원을 함유하거나 이와 함께 공급되며, 이에 따라 상기 이스트 세포는 아세트산, 글리세롤, 및 헥소스와 펜토즈 중 적어도 하나를 에탄올로 발효시키며, 그리고 선택적으로, b) 에탄올의 회수 단계를 포함한다. 발효 배지는 또한 상기한 바와 같이 수행될 수 있다. 상기 공정에서, 용량적 에탄올 생산성은 바람직하게 적어도 0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 5.0 또는 10.0g 에탄올/l/h이다. 상기 공정에서 자일로즈 및/또는 글루코즈 및/또는 아라비노즈 및/또는 아세테이트 및/또는 글리세롤에 대한 에탄올 수율은 바람직하게 적어도 50, 60, 70, 80, 90, 95 또는 98%이다. 본 명세서에서 에탄올 수율은 이론적 최대 수율의 퍼센트로서 정의되며, 여기서 자일로즈, 글루코즈 및 아라비노즈에 대해 0.51g. 에탄올/g. 자일로즈, 글루코즈 또는 아라비노즈이다. 글리세롤에 대해, 이론적 최대 수율은 0.50g. 에탄올/g. 글리세롤이며, 아세트산에 대해 이론적 최대 수율은 0.77g. 에탄올/g. 아세트산이다.
본 명세서 및 청구범위에서, 동사 "포함하다" 및 이의 동사 활용어는 상기 문자에 후속되는 아이템이 포함되나, 별도 언급이 없는 아이템이 배제되지 않는 것을 의미하는 비-제한적 인식으로 사용된다. 또한, 부정관사 "하나의(a 또는 an)"가 언급된 경우에, 문맥상 분명히 하나가 존재하고 엘리먼트들 중 단지 하나만이 존재하는 것이 요구되는 것을 제외하고, 하나 이상의 엘리먼트가 존재하는 가능성을 배제하지 않는다. 따라서, 부정관사 "하나의(a 또는 an)"는 보통 "적어도 하나(at least one)"을 의미한다.
본 명세서에 인용된 모든 특허 및 문헌들은 이의 전체가 본 명세서에 참고문헌으로 편입된다.
하기 실시예는 단지 예시 목적으로 제공되며, 본 발명의 범위를 어느 방식으로 한정하려는 것은 아니다.
실시예
1. 효소 활성
어세이
활성 어세이를 위한 세포 추출물을 기하급수적으로 성장하는 호기성 또는 혐기성 배치 배양으로부터 준비하고, Abbot 등(2009, Appl. Environ. Microbiol. 75: 2320-2325)에 의해 기재된 바와 같이 단백질 함량에 대해 분석하였다.
NAD+-의존적 아세트알데히드 디하이드로게나아제(EC 1.2.1.10) 활성은 340nm에서 NADH의 산화를 모니터링하여 30℃에서 측정하였다. 반응 혼합물(총 부피 1ml)은 50mM 포타슘 포스페이트 버퍼(pH 7.5), 0.15mM NADH 및 세포 추출물을 함유하였다. 반응은 0.5mM 아세틸-조효소 A의 첨가에 의해 시작되었다.
글리세롤 3-포스페이트 디하이드로게나아제(EC 1.1.1.8) 활성 측정을 위해, 세포 추출물은 포스페이트 버퍼를 트리에탄올아민 버퍼(10mM, pH 5)로 대체한 것을 제외하고 상기한 바와 같이 준비하였다. 글리세롤-3-포스페이트 디하이드로게나아제 활성은 이전에 기재된 바와 같이(Blomberg and Adler, 1989, J. Bacteriol. 171: 1087-1092.9) 30℃에서 세포 추출물에서 평가하였다. 반응 속도는 첨가된 세포 추출물의 양에 비례하였다.
아세틸-CoA 합성효소(EC 6.2.1.1) 활성은 Webster의 방법(Webster, 1969, Methods Enzymol. 13: 375-381)의 변형인 Frenkel 및 Kitchens에 의해 기재된 바와 같이(1977, J. Biol. Chem. 252: 504-507) 측정하였다. 측정된 NADH 형성은, 생성된 아세틸-CoA가 시트레이트 합성효소 및 말산염 디하이드로게나아제 반응과 결합될 경우에 분광 분석으로 측정하였다. 어세이 시스템은 100 mM Tris-Cl(pH 7.6), 10mM MgCl2, 6mM ATP, 5mM 말산염, 1mM NAD+, 0.1mM NADH, 2.5 mM 디티오트레이톨 또는 2-머캅토에탄올, 0.2mM 조효소 A, 25㎍ 시트레이트 합성효소(80 units/mg), 20㎍ 말산염 디하이드로게나아제(1000 units/mg), 및 10mM 아세테이트를 함유하였으며, 반응을 측정하고, 반응 속도를 340nm에서 측정하고, NADH(6.22 x 106 cm2/mol)의 흡광 계수로부터 산출하였다.
글리세롤 디하이드로게나아제 및 디히드록시아세톤 키나아제의 활성은 본질적으로 이전에 기재된 바와 같이(Gonzalez et al., 2008, Metab. Eng. 10, 234-245) 세포 추출물에서 30℃에서 측정하였다. 글리세롤 디하이드로게나아제 및 디히드록시아세톤 키나아제의 효소 활성은 세포 단백질의 기질의 μ몰/min/mg으로 나타내었다.
2. 스트레인 구성
모든 변형은 자일로즈 및 아라비노즈 발효 스트레인 RN1008 his-로 시작하였다. RN1008 his-는 본 명세서에서 RN1041이라고도 하며, 하기 유전자형을 갖는 CEN.PK-계 아라비노즈 및 자일로즈 발효 스트레인이다:
Mat a, ura3-52, leu2-112, his3::loxP, gre3::loxP, loxP-Ptpi::TAL1, loxP-Ptpi::RKI1, loxP-Ptpi-TKL1, loxP-Ptpi-RPE1, delta:: -LEU2, delta:: Padh1XKS1Tcyc1-URA3-Ptpi-xylA-Tcyc1, delta:: LEU2-AAAaraABD.
Mat a = mating type a
ura3-52, leu2-112, his3::loxP는 유전자 ura3, leu2 및 his3에서 돌연변이이며, ura3는 xylA-XKS 과발현 구조물에 의해 보완되며, leu2는 AraABD 과발현에 구조물에 의해 보완된다. his3는 부가적인 플라스미드의 선별을 위해 사용될 수 있으며, RN1041은 성장을 위해 배지에 히스티딘을 필요로 한다.
gre3::loxP = 자일로즈 환원효소를 암호화하는 gre3 유전자의 결실, loxP 부위는 마커 제거 후 남는다.
loxP-Ptpi ....= 헤트(het) 펜토즈 포스페이트 경로의 과발현, 구성 프로모터의 상향흐름의 loxP 부위는 마커 제거 후에 남는다.
delta:: = Ty1 레트로트랜스포손의 긴말단 반복순서에서 재조합 후의 구조물의 통합
AAAaraABD = 코돈 최적화된 아트로박터 아우레센스(arthrobacter aurescens) araA, araB 및 araD 유전자(WO2009/011591 참조)
GPD1
및
GPD2
를 위한 결실 구조물
RN1041에서 GPD1의 결실은 RN1197 스트레인을 생성한다. RN1041에서 GPD2의 결실은 RN1198 스트레인을 생성한다. 이 스트레인에서, 후속적으로 gpd1이 결실되어 RN1199 스트레인을 생성한다. 이러한 스트레인에서, 플라스미드들은 ACS 유전자(RN1200 내지 RN1207, 표 4) 및 표 4에 나타낸 바와 같은 추가 유전자들의 과발현을 위해 도입되었다.
gpd1
::
hphMX
프라이머 gpd1uf, gpd1ur, gpd1df 및 gpd1dr은 이의 불활성화를 위해 GPD1 유전자의 상향 및 하향흐름의 게놈 서열 프래그먼트의 증폭을 위해 사용된다. 상향- 및 하향흐름 모두의 GPD1 프래그먼트들을 토포 블런트(topo blunt) 벡터(InVitrogen)에 클로닝되어 각각, pGPD1up 및 pGPD1down을 생성하였다.
gpd1uf: AAGCTTGGTACCCGCCTTGCTTCTCTCCCC (SEQ ID NO: 41)
gpd1ur: TCTAGACCAGCATTCAAGTGGCCGGA (SEQ ID NO: 42)
gpd1df: CGTACGAGTTGTTGAATGGCCAATCCGCT (SEQ ID NO: 43)
gpd1dr: CCATGGTACCGAGTGGTGTTGTAACCACCCT (SEQ ID NO: 44)
gpd1cf: ACCAATACGTAAACGGGGCG (SEQ ID NO: 45)
gpd1cr: AATACACCCATACATACGGACGC (SEQ ID NO: 46)
플라스미드 pRN593(SEQ ID NO: 40)은 pGPD1up으로부터 HindIII 및 XbaI으로 절제된 프래그먼트를 SpeI 및 BsrGI으로 절제된 hphMX 프래그먼트(플라스미드 콜렉션 C5YeastCompany)와 pGPD1down으로부터 BsiWI 및 NcoI으로 절제된 프래그먼트를 HindIII 및 NcoI 절제된 topo T/A 벡터(Invitrogen)에 라이게이션하여 구성되었다. 플라스미드 pRN593은 KpnI으로 절제되어 게놈 카피를 방해하는 결실 프래그먼트를 획득하였다(SEQ ID NO: 17). 선형 프래그먼트의 혼합물은 이스트의 형질전환에 사용되었다. 형질전환체는 하이드로마이신 내성에 대해 선별되었다. 올바른 인테그레이션은 GPD1 오픈 리딩 프래임의 결실을 일으킨다. 인테그레이션은 gpd1cf 및 gpd1cr 프라이머를 이용하여 PCR로 확인된다.
gpd2
::
natMX
GPD2uf, GPD2ur, GPD2df 및 GPD2dr 프라이머가 이의 활성화를 위해 GPD2 유전자의 상향흐름 및 하향흐름의 게놈 서열 프래그먼트의 증폭을 위해 사용된다. (GPD2 서열로부터 유래된) 3'-말단에서 AflII 사이트 및 (결실 구조물의 분리를 위한) 5'-말단에 Bg/II 사이트를 갖는 407bp 상향흐름 PCR 프래그먼트를 GPD2uf, GPD2ur을 이용하여 증폭하고, pCR2.1(topo T/A, Invitrogen)에 클로닝하였다.
GPD2uf: GGTACCAGATCTTTTGCGGCGAGGTGCCG (SEQ ID NO: 32)
GPD2ur: TCTAGACTTAAGGAATGTGTATCTTGTTAATCTTCTGACAGC (SEQ ID NO: 33)
5'-말단에 XhoI 사이트 및 3'-말단에 BglII 사이트를 가진 417bp 하향흐름 PCR 프래그먼트를 GPD2df 및 GPD2dr을 이용하여 증폭하였다.
GPD2df: CTCGAGATAGTCTACAACAACGTCCGCA (SEQ ID NO: 34)
GPD2dr: CCATGGAGATCTGCAGTGAAAAAGCTCGAAGAAACAGCT (SEQ ID NO: 35)
최종 구성을 위해, 상향흐름 프래그먼트를 함유하는 플라스미드를 AflII 및 Kpn으로 절제하고, 하향흐름 프래그먼트를 XhoI en NcoI으로 절제하고, natMX 마커(플라스미드 콜렉션 Royal Nedalco)를 AflII en XhoI으로 절제하고, 그 프래그먼트를 라이게이션하여 플라스미드 pRN594(SEQ ID NO: 36)을 생성하였다. pRN594는 이스트 형성 전에 BglII로 절제하였다. 형질전환체는 너스오트리신(nourseotricin) 내성에 대해 선별하였다. 올바른 인테그레이션은 PCR에 의해 확인된다.
사카로미세스
세레비지아에
(
Saccharomyces
cerevisiae
)
ACS1
및
ACS2
유전자의 과발현을 위한
클로닝
방법
ACS1 오픈 리딩 프래임은 acs1f 및 acs1r 프라이머를 이용하여 PCR 증폭하였다.
acs1f : TTAAGCTTAAAATGTCGCCCTCTGCCGT (SEQ ID NO: 47)
acs1r: AAGCGCGCTACAACTTGACCGAATCAATTAGATGTCTAACAATGCCAGGG (SEQ ID NO: 48)
이 PCR 프래그먼트를 제한효소 HindIII 및 BssHIII으로 절제하고, SalI 및 HindIII 절제된 TEF1 프로모터 프래그먼트(콜렉션 C5YeastCompany), 및 BssHII 및 BsiWI 절제된 ADH1 종결 프래그먼트(콜렉션 C5YeastCompany)에 라이게이션하였다. 이 복합 프래그먼트를 프로모터 및 종결 특이 프라이머로 PCR하고, topo Blunt 벡터(InVitrogen)로 클로닝하여 pACS1을 제공하였다.
ACS2 오픈 리딩 프래임은 acs2f 및 acs2r로 PCR 증폭되었다.
acs2f: AACTGCAGAAAATGACAATCAAGGAACATAAAGTAGTTTATGAAGCTCA (SEQ ID NO: 49)
acs2r: ACGTCGACTATTTCTTTTTTTGAGAGAAAAATTGGTTCTCTACAGCAGA (SEQ ID NO: 50)
이 PCR 프래그먼트는 제한효소 PstI 및 SalI으로 절제되고, SpeI 및 PstI 절제된 PGK1 프로모터 그래그먼트(콜렉션 C5YeastCompany) 및 XhoI 및 BsiWI 절제된 PGI1 종결 프래그먼트(콜렉션 C5YeastCompany)에 라이게이션되었다. 이 복합 프래그먼트는 프로모터 및 종결 특이 프라이머로 PCR하고, topo Blunt 벡터(InVitrogen)로 클로닝하여 pACS2을 제공하였다.
ACS1 과발현 구조물은 제한효소 SalI 및 BsiWI으로 pACS1으로부터 절제되고, ACS2 과발현 구조물은 제한효소 SpeI 및 BsiWI으로 pACS2로부터 절제되고, KanMX 마커는 BspE1 및 XbaI으로 절제되었다(플라스미드 콜렉션 C5YeastCompany). 이러한 프래그먼트들은 BspE1 및 XhoI으로 절제된 플라스미드 pRS306 + 2mu ORI(플라스미드 콜렉션 C5Yeast company)에 라이게이션되어 최종 플라스미드 pRN753(SEQ ID NO: 51)을 제공하였다. 이 플라스미드는 표 4에 나타낸 이스트 스트레인들을 형질전환하는데 사용되고, 형질전환체들은 G418 내성에 대해 선별되었다. 과발현은 qPCR에 의해 확인되었다. ACS1 및 ACS2의 과발현에 사용될 수 있는 변형적인 플라스미드는 pRN500(SEQ ID NO: 20)이다.
E.
coli
,
adhE
.
E.
histolytica
ADH2
또는
E.
coli
mphF
의 발현
PGK1 프로모터(SpeI-Pst1) 및 ADH1 종결 서열(AflII-NotI)은 코돈 최적화된 합성 프래그먼트에 부가되고, SpeI 및 NotI으로 절제된 2μ ori를 갖는 pRS303으로 클로닝되었으며, 발현 구조물은 이 벡터에 클로닝되었다. 발현은 qPCR에 의해 확인되었다. E. coli mphF(SEQ ID NO: 2), E. coli adhE(SEQ ID NO: 4) 및 E. histolytica ADH2(SEQ ID NO: 6)에 대해 코돈 최적화된 서열은 서열 목록에 나타낸 바와 같다.
E. coli mphF 유전자의 발현을 위해, 이스트 PGK1 프로모터 프래그먼트(SpeI - PstI) 및 ADH1 종결 프래그먼트(AflII - NotI)(모두 Nedalco 플라스미드 콜렉션으로부터 구입)를 E. coli mphF(SEQ ID NO: 2)를 암호화하는 코돈-최적화된 합성 프래그먼트에 라이게이션하였다. 2μ ori를 가진 pRS 303(= pRN347, Royal Nedalco 플라스미드 콜렉션)을 SpeI 및 NotI으로 절제하고, mhpF 발현 구조물을 이 벡터에 클로닝하여 pRN558(SEQ ID NO: 29)를 생성하였다.
E. coli adhE 유전자의 발현을 위해, E. coli adhE(SEQ ID NO: 4)를 암호화하는 코돈 최적화된 합성 프래그먼트를 XbaI 및 AflII로 절제하고, (pRN558내의 E.coli mhpF 유전자를 대체하는) XbaI 및 AflII로 절제된 pRN558내로 라이게이션하여 pRN595(SEQ ID NO: 30)을 생성하였다.
Entamoebe histolytica adh2의 발현을 위해, E. histolytica adh2(SEQ ID NO: 6)을 암호화하는 코돈 최적화된 합성 프래그먼트를 XbaI 및 AflII로 절제하고, (pRN558내의 E. coli mhpF 유전자를 대체하는) XbaI 및 AflII로 절제된 pRN558내로 라이게이션하여 pRN596(SEQ ID NO: 31)을 생성하였다.
pRN595는 pRN957 및 pRN977(하기 참조)의 추가 구성을 위해 사용하였다. pRN558 및 pRN596은 동일한 방식으로 사용될 수 있어, 이에 따라 각각, E. coli adhE의 발현을 E. coli mhpF 또는 E. histolytica adh2로 대체할 수 있다.
E.
coli
gldA
의 발현
E. coli gldA의 이스트에서 발현을 위한 구조물은 (제한효소 SpeI 및 PstI으로 절제된) 이스트 ACT1 프로모터 프래그먼트, (PstI en BssHII으로 절제된) E. coli gldA를 암호화하는 합성 ORF(SEQ ID NO: 21) 및 (BssHII 및 BsiWI으로 절제된) 이스트 CYC1 종결 프래그먼트를 함께 pCRII 블런트(Invitrogen)내로 라이게이션하여 pRNgldA(SEQ ID NO: 28)을 생성하였다.
DAK1
과발현
PCR은 ATG의 XbaI 사이트 5' 및 TAA의 SalI 사이트 3'을 도입하는 프라이머로 S. cerevisiae의 게놈 DNA에서 수행하여 SEQ ID NO: 22의 프래그먼트를 생성하였다. S. cerevisiae의 TPI1 프로모터를 포함하는 DNA 프래그먼트는 DAK ORF의 상향흐름에 라이게이션되고, S. cerevisiae의 PGI1 종결 프래그먼트를 포함하는 DNA 프래그먼트는 DAK1 ORF의 하향흐름에 라이게이션되어 pRNDAK(SEQ ID No: 38)을 생성하였다.
C.
freundii
dhaK
의 발현
Citrobacter freundii dhaK의 이스트에서의 발현을 위한 구조물은 (제한효소 XhoI 및 XbaI으로 절제된) 이스트 TPI1 프로모터 프래그먼트, (XbaI 및 SalI으로 절제된) C. freundii dhaK를 암호화하는 합성 ORF(SEQ ID NO: 26) 및 (XhoI 및 BsiWI으로 절제된) 이스트 PGI1 종결 프래그먼트를 함께 pCRII 블런트(Invitrogen)내로 라이게이션하여 pRNdhaK(SEQ ID NO: 27)을 생성하였다.
GUP1
과발현
PCR은 ATG의 HindIII 사이트 5' 및 TAA의 BamHI 사이트 3'을 도입하는 프라이머로 S. cerevisiae의 게놈 DNA에서 수행하여 SEQ ID NO: 23의 프래그먼트를 생성하였다. S. cerevisiae의 TDH3 프로모터를 포함하는 DNA 프래그먼트는 GUP1 ORF의 상향흐름에 라이게이션되고, S. cerevisiae의 CYC1 종결 프래그먼트를 포함하는 DNA 프래그먼트는 GUP1 ORF의 하향흐름에 라이게이션되었다.
FPS1
과발현
PCR은 ATG의 NsiI 사이트 5' 및 TAA의 BamHI 사이트 3'을 도입하는 프라이머로 S. cerevisiae의 게놈 DNA에서 수행하여 SEQ ID NO: 24의 프래그먼트를 생성하였다. S. cerevisiae의 ADH1(미디움) 프로모터를 포함하는 DNA 프래그먼트는 FSP1 ORF의 상향흐름에 라이게이션되고, S. cerevisiae의 CYC1 종결 프래그먼트를 포함하는 DNA 프래그먼트는 FSP1 ORF의 하향흐름에 라이게이션되었다.
pRN347
및 이스트 스트레인
RN1151
의 구성
pRN347은 (상보성을 위한 HIS3 유전자를 갖는) pRS303에서 2μ 오리진의 복사체(pYES2로부터 PCR-증폭된)를 클로닝하여 구성되었다. RN1041은 pRN347로 형질전환되어 RN1151 스트레인을 생성하였다.
E.
coli
gldA
및
C.
freundii
dhaK
를 발현하거나
DAK1
을 과발현하는 스트레인
pRN957의 구성을 위해, E. coli gldA 발현 구조물이 SpeI 및 BsiWI 제한효소로 pRNgldA 플라스미드로부터 절제되었다. C. freundii dhaK 발현 구조물은 BsiWI 및 XhoI 제한효소로 pRNdhaK로부터 절제되었다. 이러한 프래그먼트는 SpeI 및 SalI 제한효소로 절제된 pRN595 플라스미드로 라이게이션되어 pRN957(SEQ ID NO: 37)을 생성하였다.
pRN977의 구성을 위해, E. coli gldA 발현 구조물이 SpeI 및 BsiWI 제한효소로 pRNgldA 플라스미드로부터 절제되었다. DAK1 발현 구조물은 BsiWI 및 XhoI 제한효소로 pRNDAK로부터 절제되었다. 이러한 프래그먼트는 SpeI 및 SalI 제한효소로 절제된 pRN595 플라스미드로 라이게이션되어 pRN977(SEQ ID NO: 39)을 생성하였다.
pRN957 및 pRN977은 RN1041, RN1197, RN1198 및 RN1199를 형질전환하여 표 4에 나타낸 바와 같은 이스트 스트레인을 생성하는데 사용되었다.
3. 글리세롤 및/또는 아세트산의 존재 및 부재하에서 제조된 스트레인들을 이용한 멸균 이스트 추출물 펩톤 배지에서 무산소 발효
수반되는 아세트산의 환원 및 글리세롤의 산화의 원리의 증명은 1% 이스트 추출물 및 1% 펩톤을 함유하는 배지를 이용하여 획득되었다. 실험은 D = 0.05h-1에서 캐모스태트 배양(1리터 워킹 용량)으로 수행되었으며, pH는 KOH 또는 H2SO4의 자동 첨가에 의해 5.5로 유지하였다. 글루코즈(50g/l) 및 자일로즈(50g/l)를 이스트 추출물 펩톤 배지에 탄소 및 에너지 공급원으로 첨가하였다. 원리의 입증을 보여주는 이러한 실험을 위해, 아라비노즈가 포함되지 않았다. 적절한 경우에, 아세트산이 4g/l로 그리고 글리세롤이 10g/l로 이스트 추출물 펩톤 배지에 첨가하였다. 온도를 32℃로 유지하였다.
YP(이스트 추출물 1% w/v 및 펩톤 1% w/v) 배지에 각각의 당류 글루코즈 및 자일로즈(각각 1% w/v)에 부가적으로 이스트의 동결 글리세롤 스톡 배양물을 32℃ 및 pH 5.5에서 접종하여 스트레인의 예비배양물을 준비하였다. 쉐이크 플라스크에서 유산소 조건하에서 24h 배양 후, 이 배양물의 50ml를 상기 케모스태트 배양에 접종하는데 사용하였다.
안정한 상태의 발효시(5 용량 변화), 당(글루코즈 및 자일로즈) 소비, 아세트산의 소비 및 대사물(에탄올 및 글리세롤)의 분석을 위해 시료를 취하였다. 에탄올, 글리세롤 및 아세트산 농도는 HPLC 분석에 의해 모니터하였다. 당 소비를 측정하기 위해, 글루코즈 및 자일로즈를 HPAEC(Dionex) 분석에 의해 측정하였다.
RN1151 스트레인은 글리세롤의 존재 또는 부재하에서 4g/l 아세트산을 함유하는 배지에서 안정한 상태 환경에 이를 수 없었다. 아세트산이 배지에 첨가되지 않은 경우에, 안정한 상태에서 유기체는 모든 글루코즈 및 자일로즈를 소비하였다(1g/l 이하가 잔존함). 글리세롤이 소비되지 않았으나, 대신에 생성되었다.
RN1200 및 RN1201 스트레인은 아세트산 및 글리세롤이 첨가되거나 첨가되지 않은 배지에서 마찬가지로 시험하였다. 이러한 스트레인은 RN1151 스트레인과 분명하게 다르게 수행하였다. 글리세롤-함유 배지에서, 당류 글루코즈 및 자일로즈는 거의 완전히 소비되었다(1g/l 이하가 잔존함). 아세트산 수준은 0.5g/l로 감소하고, 발효 마지막에 글리세롤의 농도는 3가지 모든 경우에 3g/l이었다. RN1200 및 RN1201 스트레인에 의해 생성된 에탄올의 양은 다양한 실험에서 43-47g/l 범위이었다. 글리세롤을 함유하지 않았지만, 아세트산 4g/l를 함유하는 배지에서, 안정한 안정 상태가 획득되지 않았다. 이 스트레인은 이러한 조건하에서 성장할 수 없었다. 이러한 결과로부터, DAK1의 상향조절 또는 C. freundii dhaK의 발현과 함께 E. coli gldA 및 adhE 유전자의 발현은 스트레인의 성능에 깊은 영향을 나타내는 것으로 결론내렸다. 글리세롤의 존재하에서, 이들은 글리세롤 및 아세트산을 소비할 수 있다.
RN1202 내지 RN1207 스트레인은 GPD1 및/또는 GPD2 유전자가 결실된 것을 제외하고 RN1200 및 RN1201 스트레인과 유사하다. RN1200 및 RN1201 스트레인에 대한 경우에서와 같이 글리세롤이 배지에 첨가될 경우에, 아세트산 4g/l을 함유하는 배지에서, 당류 글루코즈 및 자일로즈는 거의 완전히 소비된다(1g/l 이하가 잔존함). 글리세롤이 첨가되지 않는 경우에, 안정한 상태가 획득되지 않는다.
4. 글리세롤의 존재 또는 부재하에서 목질 섬유
가수분해물을
포함하는 아세트산에서 제조된 스트레인들을 이용한 혐기성 발효
옥수수 섬유 가수분해물은 글루코즈(38g/l), 자일로즈(28g/l), 아라비노즈(12g/l) 및 아세트산(4g/l)을 함유한다. 이는 옥수수 섬유를 160℃ pH 3.0에서 20분간 처리한 다음, 셀룰라아제 및 헤미셀룰라아제의 효소적 가수분해에 의해 제조되었다. 아세트산을 이 가수분해물에 첨가하여 가수분해물에서 아세트산의 총 농도를 10g/l로 형성하였다. 아세트산이 풍부한 이러한 가수분해물의 pH는 KOH 첨가에 의해 pH = 4.5로 회복되었다. 이스트 추출물은 5g/l의 최종 농도에 이르도록 이 가수분해물에 첨가되었다. 모든 후속 실험에서, 이 농축된 가수분해물을 사용하였다. 발효 중에 pH는 KOH 또는 H2SO4의 자동 첨가에 의해 6.5로 유지되었다.
YP(이스트 추출물 1% w/v 및 펩톤 1% w/v) 배지에 각각의 당류 글루코즈, 자일로즈 및 아라비노즈(각각 1% w/v)에 부가적으로 이스트의 동결 글리세롤 스톡 배양물을 32℃ 및 pH 5.5에서 접종하여 스트레인의 예비배양물을 준비하였다. 쉐이크 플라스크에서 유산소 조건하에서 24h 배양 후, 이 배양물의 50ml를 발효조 배양에 접종하는데 사용하였다. 발효는 유가배양 발효 셋업을 수행하였다. (50g/l로 첨가된 글리세롤을 함유하거나 함유하지 않은) 가수분해물을 발효조에 펌핑하였다. 글리세롤이 첨가되지 않은 경우에, 40ml의 물을 첨가하였다. 처음 6시간 동안, 가수분해물에 대한 흐름 속도는 시간당 5ml의 속도로 설정되었다. 다음 6시간 동안, 흐름 속도는 시간당 10ml로 설정되었다. 후속적으로, 추가 43시간 동안, 흐름 속도는 시간당 20ml로 설정되었다. 발효의 마지막에 총 용량은 1000ml에 이르렀다. 이러한 혐기성 유가배양 발효는 100rpm에서 온화한 교반을 하면서 약 pH = 4.5에서 수행하였다. 발효중에 온도는 32℃로 설정하였다. 감염을 최소화하기 위해, 가수분해물은 발효전에 105℃에서 10분간 가열하고, 항생제 카나마이신을 50㎍/ml의 최종 농도로 첨가하였다.
55시간 후, 발효의 마지막에, 당(글루코즈, 자일로즈 및 아라비노즈) 소비, 아세트산의 소비 및 대사물(에탄올 및 글리세롤)의 분석을 위해 시료를 취하였다. 에탄올, 글리세롤 및 아세트산 농도는 시간 경과에 걸쳐 HPLC 분석에 의해 모니터하였다. 당 소비를 측정하기 위해, 글루코즈, 자일로즈 및 아라비노즈를 HPAEC(Dionex) 분석에 의해 측정하였다.
RN1151(= HIS3로 보완된 RN1041) 스트레인은 첨가되는 글리세롤의 존재 또는 부재하에서 가수분해물에 대해 시험되었다. 두 모든 경우에, 발효 운전의 마지막(55h)에 글루코즈의 농도는 35g/l이었으나, 자일로즈 및 아라비노즈는 각각, 28 및 12g/l의 이들의 초기 농도로 유지되었다. 생성된 에탄올의 양은 2g/l이었으며, 아세트산은 9.5g/l로 존재하였다. 글리세롤 소비는 글리세롤-함유 가수분해물에서 검출되지 않았다. 당류의 발효는 증가된 수준의 아세트산 때문에 유가 배양 운전 코스 중에 멈추었다. 초기에, 아세트산이 발효조에 존재하지 않았으나, 독성 수준의 아세트산을 함유한 가수분해물을 펌핑하는 동안 아세트산 농도는 신속히 독성 수준에 도달하였다.
RN1200 및 RN1201 스트레인은 글리세롤이 첨가되거나 첨가되지 않은 가수분해물에서 마찬가지로 시험하였다. 이러한 스트레인은 RN1151 스트레인과 분명하게 다르게 수행하였다. 글리세롤-함유 가수분해물에서, 당류 글루코즈, 자일로즈 및 아라비노즈는 완전히 소비되었다. 아세트산 수준은 2g/l로 감소하고, 발효 마지막에 글리세롤의 농도는 3가지 모든 경우에 29.5g/l이었다. RN1200 및 RN1201 스트레인에 의해 생성된 에탄올의 양은 각각, 51.7 및 52.2g/l이었다. 글리세롤을 함유하지 않은 가수분해물에서, 상당히 적은 당이 소비되었다. 자일로즈 및 아라비노즈 수준은 각각 28 및 12g/l에서 변하지 않았다. 글루코즈는 소비되었으나 단지 제한된 정도로만 소비되었다. 발효의 마지막에, 잔존 농도는 3가지 모든 경우에서 32g/l이었으며, 에탄올은 3g/l의 농도에 이르렀다. 아세트산의 농도는 발효의 마지막에 9.1g/l로 감소하였으며, 한편 일부 글리세롤이 생성되었다(0.5g/l 미만). 이러한 결과로부터, DAK1의 상향조절 또는 C. freundii dhaK의 발현과 함께 E. coli gldA 및 adhE 유전자의 발현은 스트레인의 성능에 깊은 영향을 나타내는 것으로 결론내렸다. 글리세롤의 존재하에서, 이들은 글리세롤 및 아세트산을 소비할 수 있으며, (RN1151 스트레인에 비해) 부가적인 에탄올을 생성할 수 있다. 글리세롤의 부재하에서, 상기 스트레인들은 일부 아세트산을 소비한다. 하지만, 발효 중에, 아세트산 수준은 독성 수준으로 증가한다.
RN1202 내지 RN1207 스트레인은 GPD1 및/또는 GPD2 유전자가 결실된 것을 제외하고 RN1200 및 RN1201 스트레인과 유사하다. RN1200 스트레인에 대한 경우에서와 같이 글리세롤 함유 가수분해물에서, 당류 글루코즈, 자일로즈 및 아라비노즈는 완전히 소비된다. 이러한 3가지 경우에서 발효의 마지막에 아세트산 수준은 약 2g/l로 감소하고, 글리세롤의 농도는 28g/l이었다. RN1202, RN1203, RN1204, RN1205, RN1206 및 RN1207 스트레인에 대해 생성된 에탄올의 양은 각각, 51.6, 52.9, 52.1, 52.5, 53.1 및 52.3 g/l이었다. 글리세롤을 함유하지 않은 가수분해물에서, 상당히 적은 당이 소비되었다. 자일로즈 및 아라비노즈 수준은 각각 28 및 12g/l에서 변하지 않았다. 글루코즈는 소비되었으나 단지 제한된 정도로만 소비되었다. 발효의 마지막에, 비-글리세롤 가수분해물에서 글루코즈에 대한 잔존 농도는 3가지 모든 경우에서 31g/l이었으며, 에탄올은 3g/l의 농도에 이르렀다. 아세트산의 농도는 발효의 마지막에 9.1g/l로 감소하였으며, 한편 일부 글리세롤이 생성되었다(0.5g/l 미만). 이러한 결과로부터, RN1202, RN1203, RN1204, RN1205, RN1206 및 RN1207에서 다른 변형과 함께 GPD1 및/또는 GPD2 유전자 결실은 원하는 반응을 수행할 수 있는 스트레인을 형성하는 것으로 결론내렸다.
실시예
5-8에 대한 재료 및 방법
일반 분자생물학 기술
달리 언급하지 않는 한, 사용된 방법들은 표준 생화학 기술이다. 적절한 일반적 방법론 교과서의 예는 Sambrook et al., Molecular Cloning, a Laboratory Manual (1989) 및 Ausubel et al., Current Protocols in Molecular Biology (1995), John Wiley & Sons, Inc.를 포함한다.
배지
실험에 사용된 배지는 실시예에 나타낸 바와 같이 당류가 보충된 YEP-배지(10g/l 이스트 추출물, 20g/l 펩톤) 또는 고형 YNB-배지(6.7g/l 이스트 니트로겐 베이스, 15g/l 아가)이었다. 고형 YEP 배지를 위해, 15g/l 아가가 멸균전에 액체 배지에 첨가되었다.
AFM 실험에서, 미네랄 배지가 사용되었다. 미네랄 배지의 조성은 Verduyn 등(Yeast (1992), Volume 8, 501-517)에 기재되어 있으며, 우레아 2.325g/l 및 실시예에 나타낸 바와 같이 당류가 보충되었다.
이스트 세포의 형질전환
이스트 형질전환은 Schiestl 및 Gietz(Current Genetics (1989), Volume 16, 339-346)에 의해 기재된 방법에 따라 수행하였다.
콜로니
PCR
게놈 DNA는 Looke 등(BioTechniques (2011), Volume 50, 325-328)에 의해 기재된 방법에 따라 PCR을 위한 단일 이스트 콜로니로부터 추출하였다.
AFM
공정
알코올 발효 모니터(AFM; Halotec, Veenendaal, the Netherlands)는 동시에 6가지 혐기성 발효에 대한 탄소 전환율 및 수율을 정확하게 비교할 수 있는 강건하고 사용자에게 친숙한 실험실 병렬 바이오리액터이다.
AFM 실험의 출발 배양물은 50mg의 이스트(건중량)를 함유하였다. 이를 측정하기 위해, 보정 곡선은 바이오매스 대 OD700의 RN1041 스트레인으로 형성되었다. 이 보정 곡선은 50mg의 이스트(건중량)에 대해 요구되는 세포 배양물의 용량을 측정하기 위해 본 실험에서 사용되었다.
AFM 실험의 출발 전에, 예비배양물을 실시예에 나타낸 바와 같이 성장시켰다. 각 스트레인에 대해, OD700을 측정하고, 50mg의 이스트(건중량)를 2.325g/l 우레아 및 실시예에 나타낸 바와 같은 당류가 보충된 400ml 미네랄 배지(Verduyn 등(Yeast (1992), Volume 8, 501-517)에 접종하였다.
글리세롤디하이드로게나아제
활성
어세이
글리세롤디하이드로게나아제 활성 어세이의 측정 방법은 Lin 및 Magasanik(1960) J Biol Chem.235:1820-1823으로부터 적용하였다.
| 1.0 M 카보네이트/비카보네이트 버퍼 pH 10 | 800㎕ |
| 1.0 M 암모늄설페이트 | 33㎕ |
| 0.1 M NAD+ | 33㎕ |
| 세포 프리 추출물 | 5㎕ |
세포 프리 추출물은 원심분리에 의해 세포들을 수거하여 준비하였다. 세포들을 대수증식기에서 수거하였다. 세포 펠렛을 1M 카보네이트/비카보네이트 버퍼(pH 10)으로 1회 세정하고, 유리 비드를 첨가하고, 세포가 붕괴될 때까지 1분간 간격으로 최대 속도로 보텍싱하여 세포 프리 추출물을 동시에 준비하였다. 후자는 현미경으로 체크하였다.
쉐이크
플라스크 실험
혐기성 쉐이크 플라스크 실험을 실시예에 나타낸 바와 같이 수행하였다. 전형적인 실험은 25ml의 배지를 함유하는 100ml Erlenmeyer 플라스크를 사용하였다. 혐기적 조건을 확실히 하기 위해, 플라스크를 워터락으로 봉하였다.
각 시점에 대해, 각각의 쉐이크 플라스크에 접종하였으며, 이에 따라 샘플링 중에 에어레이션을 생략하였다.
스트레인
실시예 5 내지 8에 기재된 실험에 사용된 모 스트레인은 RN1041이다.
RN1041은 WO 2012067510에 기재되어 있다. 이 스트레인은 하기 유전자형을 갖는다:
MAT a, ura3 -52, leu2 -112, his3::loxP, gre3::loxP, loxP-pTPI1::TAL1, loxP-pTPI1::RKI1, loxP-pTPI1-TKL1, loxP-pTPI1-RPE1, delta::pADH1-XKS1-tCYC1-LEU2, delta:: URA3-pTPI1-xylA-tCYC1
MAT a = 매이팅 타입 a
ura3 -52, leu -112, HIS3::loxP는 각각, URA3 , LEU2 및 HIS3 유전자에서 돌연변이이다. ura3 -52 돌연변이는 xylA 과발현 구조물상의 URA3 유전자에 의해 보완되며; leu2 -112 돌연변이는 XKS1 과발현 구조물상의 LEU2 유전자에 의해 보완된다. HIS3-유전자의 결실은 히스티딘 영양요구성을 일으킨다. 이러한 이유로, RN1041은 성장 배지에 히스티딘을 필요로 한다.
gre3::loxP는 알도즈 환원효소를 암호화하는 GRE3 유전자의 결실이다. loxP 사이트는 마커 제거 후에 게놈에 남는다.
loxP-pTPI1은 본 명세서에 기재된 실험에서, TPI1 유전자의 프로모터에 의해 고유 프로모터의 대체에 의해 비-산화 펜토즈 포스페이트 경로의 유전자의 과발현을 지정한다. 강하고 구성적인 TPI1 프로모터의 상향흐름의 loxP 사이트는 마커 제거 후에 게놈에 잔류한다(Kuyper et al, FEMS Yeast Research 5 (2005) 925-934).
델타:: Ty1 레트로트랜스포손의 긴말단 반복순서에서 재조합 후의 구조물의 염색체 통합을 의미한다.
실시예
5
스트레인의 구성
하기 스트레인들이 제조되었다.
| RN1041 | 모 스트레인(상기 참조) |
| RN1067 | RN1041 gpd1 :: hphMX |
| RN1068 | RN1041 gpd2 :: natMX |
| RN1069 | RN1041 gpd1 :: hphMX gpd2 :: natMX |
| RN1186 | RN1041 + pRN977 |
| RN1187 | RN1067 + pRN977 |
| RN1188 | RN1068 + pRN977 |
| RN1189 | RN1069 + pRN977 |
GPD1-유전자(gpd1) 및/또는 GPD2-유전자(gpd2)의 결실은 실시예 2에 기재된 바와 같이 수행하였다.
RN1041, RN1067, RN1068 및 RN1069 스트레인은 플라스미드 pRN977로 형질전환되었다. 이 플라스미드는 하기 특징을 함유한다: 형질전환체의 선별을 위한 HIS3-유전자, 2μ의 복제 오리진, E. coli에서 선별을 위한 암피실린 내성 마커, PGK1-프로모터 및 ADH1-종결자의 조절하에 있는 E. coli의 adhE-유전자, TPI1-프로모터 및 PGI1-종결자의 조절하에 있는 S. cerevisiae의 DAK1-유전자 및 ACT1-프로모터 및 CYC1-종결자의 조절하에 있는 E. coli gldA-유전자. 모든 프로모터 및 종결자는 S. cerevisiae로부터 얻어진다. pRN977의 서열은 SEQ ID NO: 39에 기재되어 있다.
RN1041, RN1067, RN1068 및 RN1069 스트레인의 형질전환 후, 단일 콜로니 분리물은 pRN977 플라스미드의 존재를 체크하기 위해 콜로니 PCR 분석된다. 각 형질전환의 대표적 콜로니는 다른 실험을 위해 선별된다. 이러한 선별된 스트레인은 RN1186, RN1187, RN1188 및 RN1189로 지정된다.
마찬가지로, 형질전환체들은 하기 설명에 따라 생성되었다:
| RN1190 | RN1041 + pRN957 |
| RN1191 | RN1067 + pRN957 |
| RN1192 | RN1068 + pRN957 |
| RN1193 | RN1069 + pRN957 |
pRN957 플라스미드는 pRN977과 유사하나, S. cerevisiae의 DAK1-유전자는 Citrobacter freundii의 dhaK-유전자로 대체되었다. 이 플라스미드 pRN957의 서열을 SEQ ID NO: 37에 기재하였다.
컨트롤 스트레인으로서, RN1041 스트레인은 pRN595 플라스미드(RN1041+pRN595)로 형질전환되었다. 이 플라스미드, pRN595는 pRN977과 유사하나, gldA 및 DAK1 유전자가 결여되어 있다. 플라스미드 pRN595의 서열을 SEQ ID NO: 30에 기재하였다.
실시예
6
쉐이크
플라스크 실험
제조된 스트레인들의 성능은 혐기성 쉐이크 플라스크 실험에서 시험하였다. 이를 위해, 세포들을 탄소 공급원으로서 글루코즈가 보충된 미네랄 배지(Verduyn)에서 예비 성장시켰다. 배양물을 280rpm, 30℃에서 회전 쉐이커에서 밤새 배양하였다.
혐기적 배양의 접종을 위해 세포들의 분액을 밤새 배양된 배양물로부터 취하였다. 세포들의 양은 혐기적 배양물이 600nm에서 약 0.1의 초기 광학 밀도를 갖도록 하였다.
미네랄 배지의 탄소 조성물: 2.5% 글루코즈, 2.5% 자일로즈, 1% 글리세롤 및 2g/l HAc. pH는 pH 4.5로 조절되었다. 쉐이크 플라스크는 혐기적 조건을 확실히 하기 위해 워터락으로 봉하였다. 각 시점에 대해, 각각의 플라스크에 접종되었다.
발효 94시간 후에, 순 글리세롤 증가 또는 감소, 및 HAc 소비의 결과를 하기 표에 나타내었다.
| 스트레인 | 순 글리세롤 증가(+) 또는 감소(-) (grams/liter) | HAc 소비 (grams/liter) |
에탄올 역가 (grams/liter) |
| RN1041 | + 1.47 | 0.24 | 23.28 |
| RN1186 | - 1.20 | 0.99 | 25.32 |
| RN1187 | - 1.52 | 0.99 | 23.76 |
| RN1188 | - 0.80 | 0.97 | 25.01 |
| RN1189 | - 0.86 | 0.89 | 24.85 |
| RN1190 | - 0.47 | 0.71 | 24.38 |
| RN1191 | - 0.80 | 0.93 | 24.77 |
| RN1192 | + 0.93 | 0.29 | 23.60 |
| RN1193 | - 0.84 | 0.92 | 24.93 |
표 8에서 RN1041로 나타낸 스트레인은 HIS3-유전자 및 2μ 복제 오리진을 함유하여 히스티딘 영양요구성을 보완하는 표준 클로닝 벡터인 플라스미드 pRS323으로 형질전환되었다.
결과는 다음과 같다:
- RN1041은 글리세롤을 생성하며, 이는 GPD1 - 및 GPD2 -유전자 모두가 활성적이며 gldA 및 DAK1은 과발현되지 않기 때문에 실행가능하다. adhE는 이 스트레인에서 발현되지 않기 때문에, HAc 소비는 낮다.
- RN1186 내지 RN1189는 글리세롤 및 HAc 소비를 나타내며, RN1041에 비해 증가된 에탄올 역가를 형성한다.
- 형질전환체 RN1190, RN1191 및 RN1193을 이용한 실험은 동일한 결과, 즉, 글리세롤 및 아세테이트의 소비를 나타내지만, 약간 보다 적은 정도로 나타내었다. 또한, 여기서 에탄올 역가는 RN1041에 비해 높다. 스트레인 RN1192의 결과는 이후에 특성화가 이 스트레인이 이의 플라스미드 pRN957을 상실한 것으로 나타남에 따라, 이는 인위구조(artefact)이다.
gldA 및 adhE의 과발현과 함께 동종성 또는 이종성 디하이드록시아세톤 키나아제의 과발현은 혐기성 조건하에서 아세테이트 및 글리세롤의 동시 소비를 일으킨다.
실시예
7
AFM
실험
실시예 6에 나타낸 실험은 약간 다른 셋업, 즉, 실험 중에 온-라인 이산화탄소 측정이 가능한 AFM(알코올 발효 모니터)에서 반복되었다.
시험된 스트레인은 RN1041, RN1041+pRN595, RN1186, RN1187, RN1188 및 RN1189이었다. RN1041 스트레인은 HIS3-유전자 및 2μ 복제 오리진을 함유하여 히스티딘 영양요구성을 보완하는 표준 클로닝 벡터인 플라스미드 pRS323으로 형질전환되었다.
상기 스트레인들은 탄소 공급원으로서 2% 글루코즈를 함유한 미네랄 배지에서 280rpm 및 30℃에서 예비-배양되었다.
세포들을 수거하고 AFM 실험을 상기한 바와 같이 시작하였다.
시료들을 일정 간격으로 취하고, 당류, 에탄올, 글리세롤 및 HAc를 HPLC에 의해 측정하였다.
결과를 하기 표에 나타내었다.
| 스트레인 | 순 글리세롤 증가(-) 또는 감소(+) (grams/liter) | HAc 소비 (grams/liter) |
에탄올 생성 (grams/liter) |
| RN1041 | + 1.4 | 0.1 | 24.0 |
| RN1041+pRN595 | + 1.1 | 0.4 | 24.1 |
| RN1186 | - 0.3 | 0.7 | 25.5 |
| RN1187 | - 1.2 | 1.0 | 25.5 |
| RN1188 | - 0.3 | 0.7 | 25.2 |
| RN1189 | - 1.1 | 1.0 | 25.6 |
시간에 따른 글리세롤 및 HAc 수준의 평가를 도 1 및 2에 나타내었다.
RN1041 및 RN1041+pRN595 스트레인은 순 글리세롤 생성을 나타내었다. RN1186 및 RN1188 스트레인은 초기에 글리세롤 생성을 나타내었으나, 약 24-32시간 후에, 글리세롤 소비가 시작되었으며, 마지막에 순 글리세롤 소비가 관찰될 때까지 계속되었다.
RN1187 및 RN1189 스트레인은 RN1186 및 RN1188에서 나타난 바와 같이 초기 글리세롤 생성을 나타내지 않았다. 24시간 후, 글리세롤 소비가 시작되었다. 글리세롤 소비는 RN1186 및 RN1188에 비해 이러한 스트레인에서 현저히 더 높았다. 이러한 결과는 GPD1-유전자의 결실이 GPD2-유전자의 결실보다 더 높은 글리세롤 소비를 형성함을 보여준다.
RN1041+pRN595 스트레인은 레퍼런스 스트레인 RN1041보다 더 높은 HAc 소비를 보여주었다. RN1186 및 RN1188은 RN1041+pRN595보다 더 높은 HAc 소비를 나타내었다. 이러한 결과는 글리세롤 소비가 HAc 소비를 증가시켰음을 나타낸다. 이러한 효과는 RN1187 및 RN1189에서 더 강하였다.
실시예
8
글리세롤
디하이드로게나아제
활성
어세이
RN1041 및 RN1190의 세포 프리 추출물(CFE)을 상기한 바와 같이 준비하였다. Lin 및 Magasanik(1960) J Biol Chem.235:1820-1823의 프로토콜로부터 채용된 글리세롤 디하이드로게나아제 활성 어세이를 수행하였다. 그 결과를 하기 표에 나타내었다.
| 시료 | 보조인자 | A340/min에서 증가 |
| RN1041 5 ㎕ CFE | NAD+ | 0.00 |
| N1190 5 ㎕ CFE | NAD+ | 0.02 |
| RN1041 20 ㎕ CFE | NAD+ | 0.00 |
| RN1190 20 ㎕ CFE | NAD+ | 0.09 |
| RN1041 5 ㎕ CFE | NADP+ | 0.00 |
| RN1190 5 ㎕ CFE | NADP+ | 0.00 |
| RN1041 20 ㎕ CFE | NADP+ | 0.00 |
| RN1190 20 ㎕ CFE | NADP+ | 0.00 |
표 10에 RN1041로 나타낸 스트레인은 HIS3-유전자 및 2μ 복제 오리진을 함유하여 히스티딘 영양요구성을 보완하는 표준 클로닝 벡터인 pRS323 플라스미드로 형질전환되었다.
이러한 결과는 a) RN1190에서 발현되는 E. coli gldA가 NAD+-의존적이며, 그리고 b) CFE의 양 증가는 NAD+의 전환율의 비례하는 증가를 형성하였으며, 이에 따라 글리세롤의 디히드록시아세톤으로의 전환율이 비례하는 증가를 형성하였다.
SEQUENCE LISTING
<110> DSM IP Assets B.V.
<120> Microbial strains engineered to produce ethanol from
carbohydrates, acetic acid and glycerol
<130> P6038681PCT
<150> EP 11191333
<151> 2011-11-30
<150> US 61/564,932
<151> 2011-11-30
<160> 51
<170> PatentIn version 3.3
<210> 1
<211> 316
<212> PRT
<213> Escherichia coli
<400> 1
Met Ser Lys Arg Lys Val Ala Ile Ile Gly Ser Gly Asn Ile Gly Thr
1 5 10 15
Asp Leu Met Ile Lys Ile Leu Arg His Gly Gln His Leu Glu Met Ala
20 25 30
Val Met Val Gly Ile Asp Pro Gln Ser Asp Gly Leu Ala Arg Ala Arg
35 40 45
Arg Met Gly Val Ala Thr Thr His Glu Gly Val Ile Gly Leu Met Asn
50 55 60
Met Pro Glu Phe Ala Asp Ile Asp Ile Val Phe Asp Ala Thr Ser Ala
65 70 75 80
Gly Ala His Val Lys Asn Asp Ala Ala Leu Arg Glu Ala Lys Pro Asp
85 90 95
Ile Arg Leu Ile Asp Leu Thr Pro Ala Ala Ile Gly Pro Tyr Cys Val
100 105 110
Pro Val Val Asn Leu Glu Ala Asn Val Asp Gln Leu Asn Val Asn Met
115 120 125
Val Thr Cys Gly Gly Gln Ala Thr Ile Pro Met Val Ala Ala Val Ser
130 135 140
Arg Val Ala Arg Val His Tyr Ala Glu Ile Ile Ala Ser Ile Ala Ser
145 150 155 160
Lys Ser Ala Gly Pro Gly Thr Arg Ala Asn Ile Asp Glu Phe Thr Glu
165 170 175
Thr Thr Ser Arg Ala Ile Glu Val Val Gly Gly Ala Ala Lys Gly Lys
180 185 190
Ala Ile Ile Val Leu Asn Pro Ala Glu Pro Pro Leu Met Met Arg Asp
195 200 205
Thr Val Tyr Val Leu Ser Asp Glu Ala Ser Gln Asp Asp Ile Glu Ala
210 215 220
Ser Ile Asn Glu Met Ala Glu Ala Val Gln Ala Tyr Val Pro Gly Tyr
225 230 235 240
Arg Leu Lys Gln Arg Val Gln Phe Glu Val Ile Pro Gln Asp Lys Pro
245 250 255
Val Asn Leu Pro Gly Val Gly Gln Phe Ser Gly Leu Lys Thr Ala Val
260 265 270
Trp Leu Glu Val Glu Gly Ala Ala His Tyr Leu Pro Ala Tyr Ala Gly
275 280 285
Asn Leu Asp Ile Met Thr Ser Ser Ala Leu Ala Thr Ala Glu Lys Met
290 295 300
Ala Gln Ser Leu Ala Arg Lys Ala Gly Glu Ala Ala
305 310 315
<210> 2
<211> 968
<212> DNA
<213> Artificial
<220>
<223> mhpF codon optimised
<400> 2
ctgcagtcta gatgtctaag agaaaggttg ctatcatcgg ttctggtaac atcggtactg 60
acttgatgat caagatccta agacacggtc aacacttgga aatggctgtt atggttggta 120
tcgacccaca atctgacggt ttggctagag ctagaagaat gggtgttgct accacccacg 180
aaggtgttat cggtttgatg aacatgccag aattcgctga catcgacatc gttttcgacg 240
ctacctctgc tggtgctcac gttaagaacg acgctgcttt gagagaagct aagccagaca 300
tcagattgat cgacttgacc ccagctgcta tcggtccata ctgtgttcca gttgttaact 360
tggaagctaa cgttgaccaa ttaaacgtta acatggttac ctgtggtggt caagctacca 420
tcccaatggt tgctgctgtt tcaagagttg ctagagttca ctacgctgaa atcatcgctt 480
ctatcgcttc taagtctgct ggtccaggta ccagagctaa catcgacgaa ttcaccgaaa 540
ccacctctag ggctatcgaa gttgttggtg gtgctgctaa gggtaaggct atcatcgttt 600
tgaacccagc tgaaccacca ttgatgatga gagacaccgt ttacgttttg tctgacgaag 660
catctcaaga cgacatcgaa gcttcaatca acgaaatggc tgaagctgtt caagcatacg 720
ttccaggtta cagattgaag caaagagttc aattcgaagt tatcccacaa gacaagccag 780
ttaacttgcc aggtgttggt caattctctg gtttgaagac cgctgtttgg ttggaagttg 840
aaggtgctgc tcactacttg ccagcttacg ctggtaactt ggacattatg acctcttctg 900
ctttggctac cgctgaaaag atggctcaat ctttggctag aaaggctggt gaagctgctt 960
aagcgcgc 968
<210> 3
<211> 891
<212> PRT
<213> Escherichia coli
<400> 3
Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val
1 5 10 15
Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp
20 25 30
Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro
35 40 45
Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp
50 55 60
Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr
65 70 75 80
Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly
85 90 95
Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro
100 105 110
Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu
115 120 125
Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp
130 135 140
Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala
145 150 155 160
Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu
165 170 175
Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala
180 185 190
Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro
195 200 205
Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr
210 215 220
Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe
225 230 235 240
Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp
245 250 255
Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr
260 265 270
Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys
275 280 285
Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile
290 295 300
Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile
305 310 315 320
Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys
325 330 335
Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala
340 345 350
Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr
355 360 365
Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr
370 375 380
Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala
385 390 395 400
Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser
405 410 415
Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn
420 425 430
Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala
435 440 445
Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg
450 455 460
Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys
465 470 475 480
Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala
485 490 495
Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val
500 505 510
Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly
515 520 525
Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly
530 535 540
Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu
545 550 555 560
His Pro Glu Thr His Phe Glu Glu Leu Ala Leu Arg Phe Met Asp Ile
565 570 575
Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met
580 585 590
Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe
595 600 605
Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp
610 615 620
Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met
625 630 635 640
Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr
645 650 655
His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp
660 665 670
Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala
675 680 685
Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His
690 695 700
Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly
705 710 715 720
Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro
725 730 735
His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn
740 745 750
Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg
755 760 765
Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu
770 775 780
Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala
785 790 795 800
Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg
805 810 815
Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu
820 825 830
Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr
835 840 845
Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly
850 855 860
Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro
865 870 875 880
Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala
885 890
<210> 4
<211> 2690
<212> DNA
<213> Artificial
<220>
<223> synthetic codon optimimised adhE
<400> 4
tctagaaaat ggctgttacc aacgttgctg aattgaacgc tttggttgaa agggttaaga 60
aggctcaaag agaatacgct tctttcaccc aagaacaagt tgacaagatc ttcagagctg 120
ctgctttggc tgctgctgac gctagaatcc cattggctaa gatggctgtt gctgaatctg 180
gtatgggtat cgttgaagac aaggttatca agaaccactt cgcttctgaa tacatctaca 240
acgcttacaa ggacgaaaag acctgtggtg ttttgtcaga agacgacacc ttcggtacca 300
tcaccatcgc tgaaccaatc ggtatcatct gtggtatcgt tccaaccacc aacccaacct 360
ctaccgctat cttcaagtct ttgatctctt tgaagaccag aaacgctatc atcttctctc 420
cacacccaag agctaaagac gctaccaaca aggctgctga catcgttttg caagctgcta 480
tcgctgctgg tgctccaaag gacttgatcg gttggatcga ccaaccatct gttgaattgt 540
ctaacgcttt gatgcaccac ccagacatca acttgatctt ggctaccggt ggtccaggta 600
tggttaaggc tgcttactct tctggtaagc cagctatcgg tgttggtgct ggtaacaccc 660
cagttgttat cgacgaaacc gctgacatca agagagctgt tgcttctgtt ttgatgtcta 720
agaccttcga caacggtgtt atctgtgctt ctgaacaatc tgttgttgtt gttgactctg 780
tttacgacgc tgttagagaa agattcgcta cccacggtgg ttacttgttg caaggtaagg 840
aattgaaggc tgttcaagac gttatcttga agaacggtgc tttgaacgct gctatcgttg 900
gtcaaccagc ttacaagatc gctgaattag ctggtttctc tgttccagaa aacaccaaga 960
tcttgatcgg tgaagttacc gttgttgacg aatctgaacc attcgctcac gaaaagttgt 1020
ctccaacctt ggctatgtac agagctaagg acttcgaaga cgctgttgaa aaagctgaaa 1080
agttggttgc tatgggtggt attggtcaca cctcttgttt gtacaccgac caagacaacc 1140
aaccagctag agtttcttac ttcggtcaaa agatgaagac cgctagaatc ttgatcaaca 1200
ccccagcttc tcaaggtggt atcggtgact tgtacaactt caagttggct ccatctttga 1260
ccttgggttg tggttcttgg ggtggtaact ctatctctga aaacgttggt ccaaagcact 1320
tgatcaacaa gaagaccgtt gctaagagag ctgaaaacat gttgtggcac aagttgccaa 1380
aatctatcta cttcagaaga ggttctttgc caatcgcttt ggacgaagtt atcaccgacg 1440
gtcacaagag agctttgatc gttaccgaca gattcttgtt caacaacggt tacgctgacc 1500
aaatcacctc tgttttgaag gctgctggtg ttgaaaccga agttttcttc gaagttgaag 1560
ctgacccaac cttgtctatc gttagaaagg gtgctgaatt ggctaactct ttcaagccag 1620
acgttatcat cgctttgggt ggtggttctc caatggacgc tgctaagatc atgtgggtta 1680
tgtacgaaca cccagaaacc cacttcgaag aattggcttt gagattcatg gacatcagaa 1740
agagaatcta caagttccca aagatgggtg ttaaggctaa gatgatcgct gttaccacca 1800
cctctggtac cggttctgaa gttaccccat tcgctgttgt taccgacgac gctaccggtc 1860
aaaagtaccc attggctgac tacgctttga ccccagacat ggctatcgtt gacgctaact 1920
tggttatgga catgccaaag tctttgtgtg ctttcggtgg tttggacgct gttacccacg 1980
ctatggaagc ttacgtttct gttttggctt ctgaattctc tgacggtcaa gctttgcaag 2040
ctttgaagtt gttgaaggaa tacttgccag cttcttacca cgaaggttct aagaacccag 2100
ttgctagaga aagagttcac tctgctgcta ccatcgctgg tatcgctttc gctaacgctt 2160
tcttgggtgt ttgtcactct atggctcaca agttgggttc tcaattccac atcccacacg 2220
gtttggctaa cgctttgttg atctgtaacg ttatcagata caacgctaac gacaacccaa 2280
ccaagcaaac cgctttctct caatacgaca gaccacaagc tagaagaaga tacgctgaaa 2340
tcgctgacca cttgggtttg tctgctccag gtgacagaac cgctgcaaag atcgaaaagt 2400
tgttggcttg gttggaaacc ttgaaggctg aattgggtat cccaaagtct atcagagaag 2460
ctggtgttca agaagctgac ttcttggcta acgttgacaa gttgtctgaa gacgctttcg 2520
acgaccaatg taccggtgct aacccaagat acccattgat ctctgaattg aagcaaatct 2580
tgttggacac ctactacggt agagactacg ttgaaggtga aaccgctgct aagaaggaag 2640
ctgctccagc taaggctgaa aagaaggcta agaagtctgc ttagcttaag 2690
<210> 5
<211> 870
<212> PRT
<213> Entamoeba histolytica
<400> 5
Met Ser Thr Gln Gln Thr Met Thr Val Asp Glu His Ile Asn Gln Leu
1 5 10 15
Val Arg Lys Ala Gln Val Ala Leu Lys Glu Tyr Leu Lys Pro Glu Tyr
20 25 30
Thr Gln Glu Lys Ile Asp Tyr Ile Val Lys Lys Ala Ser Val Ala Ala
35 40 45
Leu Asp Gln His Cys Ala Leu Ala Ala Ala Ala Val Glu Glu Thr Gly
50 55 60
Arg Gly Ile Phe Glu Asp Lys Ala Thr Lys Asn Ile Phe Ala Cys Glu
65 70 75 80
His Val Thr His Glu Met Arg His Ala Lys Thr Val Gly Ile Ile Asn
85 90 95
Val Asp Pro Leu Tyr Gly Ile Thr Glu Ile Ala Glu Pro Val Gly Val
100 105 110
Val Cys Gly Val Thr Pro Val Thr Asn Pro Thr Ser Thr Ala Ile Phe
115 120 125
Lys Ser Leu Ile Ser Ile Lys Thr Arg Asn Pro Ile Val Phe Ser Phe
130 135 140
His Pro Ser Ala Leu Lys Cys Ser Ile Met Ala Ala Lys Ile Val Arg
145 150 155 160
Asp Ala Ala Ile Ala Ala Gly Ala Pro Glu Asn Cys Ile Gln Trp Ile
165 170 175
Glu Phe Gly Gly Ile Glu Ala Ser Asn Lys Leu Met Asn His Pro Gly
180 185 190
Val Ala Thr Ile Leu Ala Thr Gly Gly Asn Ala Met Val Lys Ala Ala
195 200 205
Tyr Ser Ser Gly Lys Pro Ala Leu Gly Val Gly Ala Gly Asn Val Pro
210 215 220
Thr Tyr Ile Glu Lys Thr Cys Asn Ile Lys Gln Ala Ala Asn Asp Val
225 230 235 240
Val Met Ser Lys Ser Phe Asp Asn Gly Met Ile Cys Ala Ser Glu Gln
245 250 255
Ala Ala Ile Ile Asp Lys Glu Ile Tyr Asp Gln Val Val Glu Glu Met
260 265 270
Lys Thr Leu Gly Ala Tyr Phe Ile Asn Glu Glu Glu Lys Ala Lys Leu
275 280 285
Glu Lys Phe Met Phe Gly Val Asn Ala Tyr Ser Ala Asp Val Asn Asn
290 295 300
Ala Arg Leu Asn Pro Lys Cys Pro Gly Met Ser Pro Gln Trp Phe Ala
305 310 315 320
Glu Gln Val Gly Ile Lys Val Pro Glu Asp Cys Asn Ile Ile Cys Ala
325 330 335
Val Cys Lys Glu Val Gly Pro Asn Glu Pro Leu Thr Arg Glu Lys Leu
340 345 350
Ser Pro Val Leu Ala Ile Leu Lys Ala Glu Asn Thr Gln Asp Gly Ile
355 360 365
Asp Lys Ala Glu Ala Met Val Glu Phe Asn Gly Arg Gly His Ser Ala
370 375 380
Ala Ile His Ser Asn Asp Lys Ala Val Val Glu Lys Tyr Ala Leu Thr
385 390 395 400
Met Lys Ala Cys Arg Ile Leu His Asn Thr Pro Ser Ser Gln Gly Gly
405 410 415
Ile Gly Ser Ile Tyr Asn Tyr Ile Trp Pro Ser Phe Thr Leu Gly Cys
420 425 430
Gly Ser Tyr Gly Gly Asn Ser Val Ser Ala Asn Val Thr Tyr His Asn
435 440 445
Leu Leu Asn Ile Lys Arg Leu Ala Asp Arg Arg Asn Asn Leu Gln Trp
450 455 460
Phe Arg Val Pro Pro Lys Ile Phe Phe Glu Pro His Ser Ile Arg Tyr
465 470 475 480
Leu Ala Glu Leu Lys Glu Leu Ser Lys Ile Phe Ile Val Ser Asp Arg
485 490 495
Met Met Tyr Lys Leu Gly Tyr Val Asp Arg Val Met Asp Val Leu Lys
500 505 510
Arg Arg Ser Asn Glu Val Glu Ile Glu Ile Phe Ile Asp Val Glu Pro
515 520 525
Asp Pro Ser Ile Gln Thr Val Gln Lys Gly Leu Ala Val Met Asn Thr
530 535 540
Phe Gly Pro Asp Asn Ile Ile Ala Ile Gly Gly Gly Ser Ala Met Asp
545 550 555 560
Ala Ala Lys Ile Met Trp Leu Leu Tyr Glu His Pro Glu Ala Asp Phe
565 570 575
Phe Ala Met Lys Gln Lys Phe Ile Asp Leu Arg Lys Arg Ala Phe Lys
580 585 590
Phe Pro Thr Met Gly Lys Lys Ala Arg Leu Ile Cys Ile Pro Thr Thr
595 600 605
Ser Gly Thr Gly Ser Glu Val Thr Pro Phe Ala Val Ile Ser Asp His
610 615 620
Glu Thr Gly Lys Lys Tyr Pro Leu Ala Asp Tyr Ser Leu Thr Pro Ser
625 630 635 640
Val Ala Ile Val Asp Pro Met Phe Thr Met Ser Leu Pro Lys Arg Ala
645 650 655
Ile Ala Asp Thr Gly Leu Asp Val Leu Val His Ala Thr Glu Ala Tyr
660 665 670
Val Ser Val Met Ala Asn Glu Tyr Thr Asp Gly Leu Ala Arg Glu Ala
675 680 685
Val Lys Leu Val Phe Glu Asn Leu Leu Lys Ser Tyr Asn Gly Asp Leu
690 695 700
Glu Ala Arg Glu Lys Met His Asn Ala Ala Thr Ile Ala Gly Met Ala
705 710 715 720
Phe Ala Ser Ala Phe Leu Gly Met Asp His Ser Met Ala His Lys Val
725 730 735
Gly Ala Ala Phe His Leu Pro His Gly Arg Cys Val Ala Val Leu Leu
740 745 750
Pro His Val Ile Arg Tyr Asn Gly Gln Lys Pro Arg Lys Leu Ala Met
755 760 765
Trp Pro Lys Tyr Asn Phe Tyr Lys Ala Asp Gln Arg Tyr Met Glu Leu
770 775 780
Ala Gln Met Val Gly Leu Lys Cys Asn Thr Pro Ala Glu Gly Val Glu
785 790 795 800
Ala Phe Ala Lys Ala Cys Glu Glu Leu Met Lys Ala Thr Glu Thr Ile
805 810 815
Thr Gly Phe Lys Lys Ala Asn Ile Asp Glu Ala Ala Trp Met Ser Lys
820 825 830
Val Pro Glu Met Ala Leu Leu Ala Phe Glu Asp Gln Cys Ser Pro Ala
835 840 845
Asn Pro Arg Val Pro Met Val Lys Asp Met Glu Lys Ile Leu Lys Ala
850 855 860
Ala Tyr Tyr Pro Ile Ala
865 870
<210> 6
<211> 2627
<212> DNA
<213> Artificial
<220>
<223> synthetic codon optimised ADH2
<400> 6
tctagaaaat gtctacccaa caaaccatga ccgttgacga acacatcaac caattagtta 60
gaaaggctca agttgctttg aaggaatact tgaagccaga atacacccaa gaaaagatcg 120
actacatcgt taagaaggct tctgttgctg ctttggacca acactgtgct ttggctgctg 180
ctgctgttga agaaaccggt agaggtatct tcgaagacaa ggctaccaag aacatcttcg 240
cttgtgaaca cgttacccac gaaatgagac acgctaagac cgttggtatc atcaacgttg 300
acccattgta cggtatcacc gaaatcgctg aaccagttgg tgttgtttgt ggtgttaccc 360
cagttaccaa cccaacctct accgctatct tcaagtcttt gatctctatc aagaccagaa 420
acccaatcgt tttctctttc cacccatctg ctttgaagtg ttctattatg gctgctaaaa 480
tcgttagaga cgctgctatc gctgctggtg ctccagaaaa ctgtatccaa tggatcgaat 540
tcggtggtat cgaagcttct aacaagttga tgaaccaccc aggtgttgct actatcttgg 600
ctaccggtgg taacgctatg gttaaggctg catactcttc tggtaagcca gctttgggtg 660
ttggtgctgg taacgttcca acctacatcg aaaagacctg taacatcaag caagctgcta 720
acgacgttgt tatgtctaag tctttcgaca acggtatgat ctgtgcttct gaacaagctg 780
ctatcatcga caaggaaatc tacgaccaag ttgttgaaga aatgaagacc ttgggtgctt 840
acttcatcaa cgaagaagaa aaggctaagt tggaaaagtt catgttcggt gttaacgctt 900
actctgctga cgttaacaac gctagattga acccaaagtg tccaggtatg tctccacaat 960
ggttcgctga acaagttggt atcaaggtac cagaagactg taacatcatc tgtgctgttt 1020
gtaaggaagt tggtccaaac gaaccattga ccagagaaaa gttgtctcca gttttggcta 1080
tcttgaaagc tgaaaacacc caagacggta tcgacaaggc tgaagctatg gttgaattta 1140
acggtagagg tcactctgct gctatccact ctaacgacaa ggctgttgtt gaaaagtacg 1200
ctttgaccat gaaggcttgt agaatcttgc acaacacccc atcttctcaa ggtggtatcg 1260
gttctatcta caactacatc tggccatctt tcaccttggg ttgtggttct tacggtggta 1320
actctgtttc tgctaacgtt acctaccaca acttgttgaa catcaagaga ttggctgaca 1380
gaagaaacaa cttgcaatgg ttcagagttc caccaaagat cttcttcgaa ccacactcta 1440
tcagatactt ggctgaattg aaggaattgt ctaagatctt catcgtttct gacagaatga 1500
tgtacaagtt gggttacgtt gacagagtta tggacgtttt gaagagaaga tctaacgaag 1560
ttgaaatcga aatcttcatc gacgttgaac cagacccatc tatccaaacc gttcaaaagg 1620
gtttggctgt tatgaacacc ttcggtccag acaacatcat cgctatcggt ggtggttctg 1680
ctatggacgc tgctaagatc atgtggttgt tgtacgaaca cccagaagct gacttcttcg 1740
ctatgaagca aaagttcatc gacttgagaa agagagcttt caagttccca accatgggta 1800
agaaggctag attgatctgt atcccaacca cctctggtac cggttctgaa gttaccccat 1860
tcgctgttat ctctgaccac gaaaccggta agaagtaccc attggctgac tactctttga 1920
ccccatctgt tgctatcgtt gacccaatgt tcaccatgtc tttgccaaag agagctatcg 1980
ctgacaccgg tttggacgtt ttggttcacg ctaccgaagc ttacgtttct gttatggcta 2040
acgaatacac cgacggtttg gctagagaag ctgttaagtt ggtttttgaa aacttgttga 2100
agtcttacaa cggtgacttg gaagctagag aaaagatgca caacgctgct accatcgctg 2160
gtatggcttt cgcttctgct ttcttgggta tggaccactc tatggctcac aaggttggtg 2220
ctgctttcca cttgccacac ggtagatgtg ttgctgtttt gttgccacac gttatcagat 2280
acaacggtca aaagccaaga aagttggcta tgtggccaaa gtacaacttc tacaaggctg 2340
accaaagata catggaattg gctcaaatgg ttggtttgaa gtgtaacacc ccagctgaag 2400
gtgttgaagc tttcgctaag gcttgtgaag aattgatgaa ggctaccgaa accatcaccg 2460
gtttcaagaa ggctaacatc gacgaagctg cttggatgtc taaggttcca gaaatggctt 2520
tgttggcttt cgaagaccaa tgttctccag ctaacccaag agttccaatg gttaaggaca 2580
tggaaaagat cttgaaggct gcttactacc caatcgctta gcttaag 2627
<210> 7
<211> 367
<212> PRT
<213> Escherichia coli
<400> 7
Met Asp Arg Ile Ile Gln Ser Pro Gly Lys Tyr Ile Gln Gly Ala Asp
1 5 10 15
Val Ile Asn Arg Leu Gly Glu Tyr Leu Lys Pro Leu Ala Glu Arg Trp
20 25 30
Leu Val Val Gly Asp Lys Phe Val Leu Gly Phe Ala Gln Ser Thr Val
35 40 45
Glu Lys Ser Phe Lys Asp Ala Gly Leu Val Val Glu Ile Ala Pro Phe
50 55 60
Gly Gly Glu Cys Ser Gln Asn Glu Ile Asp Arg Leu Arg Gly Ile Ala
65 70 75 80
Glu Thr Ala Gln Cys Gly Ala Ile Leu Gly Ile Gly Gly Gly Lys Thr
85 90 95
Leu Asp Thr Ala Lys Ala Leu Ala His Phe Met Gly Val Pro Val Ala
100 105 110
Ile Ala Pro Thr Ile Ala Ser Thr Asp Ala Pro Cys Ser Ala Leu Ser
115 120 125
Val Ile Tyr Thr Asp Glu Gly Glu Phe Asp Arg Tyr Leu Leu Leu Pro
130 135 140
Asn Asn Pro Asn Met Val Ile Val Asp Thr Lys Ile Val Ala Gly Ala
145 150 155 160
Pro Ala Arg Leu Leu Ala Ala Gly Ile Gly Asp Ala Leu Ala Thr Trp
165 170 175
Phe Glu Ala Arg Ala Cys Ser Arg Ser Gly Ala Thr Thr Met Ala Gly
180 185 190
Gly Lys Cys Thr Gln Ala Ala Leu Ala Leu Ala Glu Leu Cys Tyr Asn
195 200 205
Thr Leu Leu Glu Glu Gly Glu Lys Ala Met Leu Ala Ala Glu Gln His
210 215 220
Val Val Thr Pro Ala Leu Glu Arg Val Ile Glu Ala Asn Thr Tyr Leu
225 230 235 240
Ser Gly Val Gly Phe Glu Ser Gly Gly Leu Ala Ala Ala His Ala Val
245 250 255
His Asn Gly Leu Thr Ala Ile Pro Asp Ala His His Tyr Tyr His Gly
260 265 270
Glu Lys Val Ala Phe Gly Thr Leu Thr Gln Leu Val Leu Glu Asn Ala
275 280 285
Pro Val Glu Glu Ile Glu Thr Val Ala Ala Leu Ser His Ala Val Gly
290 295 300
Leu Pro Ile Thr Leu Ala Gln Leu Asp Ile Lys Glu Asp Val Pro Ala
305 310 315 320
Lys Met Arg Ile Val Ala Glu Ala Ala Cys Ala Glu Gly Glu Thr Ile
325 330 335
His Asn Met Pro Gly Gly Ala Thr Pro Asp Gln Val Tyr Ala Ala Leu
340 345 350
Leu Val Ala Asp Gln Tyr Gly Gln Arg Phe Leu Gln Glu Trp Glu
355 360 365
<210> 8
<211> 584
<212> PRT
<213> Saccharomyces cerevisiae
<400> 8
Met Ser Ala Lys Ser Phe Glu Val Thr Asp Pro Val Asn Ser Ser Leu
1 5 10 15
Lys Gly Phe Ala Leu Ala Asn Pro Ser Ile Thr Leu Val Pro Glu Glu
20 25 30
Lys Ile Leu Phe Arg Lys Thr Asp Ser Asp Lys Ile Ala Leu Ile Ser
35 40 45
Gly Gly Gly Ser Gly His Glu Pro Thr His Ala Gly Phe Ile Gly Lys
50 55 60
Gly Met Leu Ser Gly Ala Val Val Gly Glu Ile Phe Ala Ser Pro Ser
65 70 75 80
Thr Lys Gln Ile Leu Asn Ala Ile Arg Leu Val Asn Glu Asn Ala Ser
85 90 95
Gly Val Leu Leu Ile Val Lys Asn Tyr Thr Gly Asp Val Leu His Phe
100 105 110
Gly Leu Ser Ala Glu Arg Ala Arg Ala Leu Gly Ile Asn Cys Arg Val
115 120 125
Ala Val Ile Gly Asp Asp Val Ala Val Gly Arg Glu Lys Gly Gly Met
130 135 140
Val Gly Arg Arg Ala Leu Ala Gly Thr Val Leu Val His Lys Ile Val
145 150 155 160
Gly Ala Phe Ala Glu Glu Tyr Ser Ser Lys Tyr Gly Leu Asp Gly Thr
165 170 175
Ala Lys Val Ala Lys Ile Ile Asn Asp Asn Leu Val Thr Ile Gly Ser
180 185 190
Ser Leu Asp His Cys Lys Val Pro Gly Arg Lys Phe Glu Ser Glu Leu
195 200 205
Asn Glu Lys Gln Met Glu Leu Gly Met Gly Ile His Asn Glu Pro Gly
210 215 220
Val Lys Val Leu Asp Pro Ile Pro Ser Thr Glu Asp Leu Ile Ser Lys
225 230 235 240
Tyr Met Leu Pro Lys Leu Leu Asp Pro Asn Asp Lys Asp Arg Ala Phe
245 250 255
Val Lys Phe Asp Glu Asp Asp Glu Val Val Leu Leu Val Asn Asn Leu
260 265 270
Gly Gly Val Ser Asn Phe Val Ile Ser Ser Ile Thr Ser Lys Thr Thr
275 280 285
Asp Phe Leu Lys Glu Asn Tyr Asn Ile Thr Pro Val Gln Thr Ile Ala
290 295 300
Gly Thr Leu Met Thr Ser Phe Asn Gly Asn Gly Phe Ser Ile Thr Leu
305 310 315 320
Leu Asn Ala Thr Lys Ala Thr Lys Ala Leu Gln Ser Asp Phe Glu Glu
325 330 335
Ile Lys Ser Val Leu Asp Leu Leu Asn Ala Phe Thr Asn Ala Pro Gly
340 345 350
Trp Pro Ile Ala Asp Phe Glu Lys Thr Ser Ala Pro Ser Val Asn Asp
355 360 365
Asp Leu Leu His Asn Glu Val Thr Ala Lys Ala Val Gly Thr Tyr Asp
370 375 380
Phe Asp Lys Phe Ala Glu Trp Met Lys Ser Gly Ala Glu Gln Val Ile
385 390 395 400
Lys Ser Glu Pro His Ile Thr Glu Leu Asp Asn Gln Val Gly Asp Gly
405 410 415
Asp Cys Gly Tyr Thr Leu Val Ala Gly Val Lys Gly Ile Thr Glu Asn
420 425 430
Leu Asp Lys Leu Ser Lys Asp Ser Leu Ser Gln Ala Val Ala Gln Ile
435 440 445
Ser Asp Phe Ile Glu Gly Ser Met Gly Gly Thr Ser Gly Gly Leu Tyr
450 455 460
Ser Ile Leu Leu Ser Gly Phe Ser His Gly Leu Ile Gln Val Cys Lys
465 470 475 480
Ser Lys Asp Glu Pro Val Thr Lys Glu Ile Val Ala Lys Ser Leu Gly
485 490 495
Ile Ala Leu Asp Thr Leu Tyr Lys Tyr Thr Lys Ala Arg Lys Gly Ser
500 505 510
Ser Thr Met Ile Asp Ala Leu Glu Pro Phe Val Lys Glu Phe Thr Ala
515 520 525
Ser Lys Asp Phe Asn Lys Ala Val Lys Ala Ala Glu Glu Gly Ala Lys
530 535 540
Ser Thr Ala Thr Phe Glu Ala Lys Phe Gly Arg Ala Ser Tyr Val Gly
545 550 555 560
Asp Ser Ser Gln Val Glu Asp Pro Gly Ala Val Gly Leu Cys Glu Phe
565 570 575
Leu Lys Gly Val Gln Ser Ala Leu
580
<210> 9
<211> 591
<212> PRT
<213> Saccharomyces cerevisiae
<400> 9
Met Ser His Lys Gln Phe Lys Ser Asp Gly Asn Ile Val Thr Pro Tyr
1 5 10 15
Leu Leu Gly Leu Ala Arg Ser Asn Pro Gly Leu Thr Val Ile Lys His
20 25 30
Asp Arg Val Val Phe Arg Thr Ala Ser Ala Pro Asn Ser Gly Asn Pro
35 40 45
Pro Lys Val Ser Leu Val Ser Gly Gly Gly Ser Gly His Glu Pro Thr
50 55 60
His Ala Gly Phe Val Gly Glu Gly Ala Leu Asp Ala Ile Ala Ala Gly
65 70 75 80
Ala Ile Phe Ala Ser Pro Ser Thr Lys Gln Ile Tyr Ser Ala Ile Lys
85 90 95
Ala Val Glu Ser Pro Lys Gly Thr Leu Ile Ile Val Lys Asn Tyr Thr
100 105 110
Gly Asp Ile Ile His Phe Gly Leu Ala Ala Glu Arg Ala Lys Ala Ala
115 120 125
Gly Met Lys Val Glu Leu Val Ala Val Gly Asp Asp Val Ser Val Gly
130 135 140
Lys Lys Lys Gly Ser Leu Val Gly Arg Arg Gly Leu Gly Ala Thr Val
145 150 155 160
Leu Val His Lys Ile Ala Gly Ala Ala Ala Ser His Gly Leu Glu Leu
165 170 175
Ala Glu Val Ala Glu Val Ala Gln Ser Val Val Asp Asn Ser Val Thr
180 185 190
Ile Ala Ala Ser Leu Asp His Cys Thr Val Pro Gly His Lys Pro Glu
195 200 205
Ala Ile Leu Gly Glu Asn Glu Tyr Glu Ile Gly Met Gly Ile His Asn
210 215 220
Glu Ser Gly Thr Tyr Lys Ser Ser Pro Leu Pro Ser Ile Ser Glu Leu
225 230 235 240
Val Ser Gln Met Leu Pro Leu Leu Leu Asp Glu Asp Glu Asp Arg Ser
245 250 255
Tyr Val Lys Phe Glu Pro Lys Glu Asp Val Val Leu Met Val Asn Asn
260 265 270
Met Gly Gly Met Ser Asn Leu Glu Leu Gly Tyr Ala Ala Glu Val Ile
275 280 285
Ser Glu Gln Leu Ile Asp Lys Tyr Gln Ile Val Pro Lys Arg Thr Ile
290 295 300
Thr Gly Ala Phe Ile Thr Ala Leu Asn Gly Pro Gly Phe Gly Ile Thr
305 310 315 320
Leu Met Asn Ala Ser Lys Ala Gly Gly Asp Ile Leu Lys Tyr Phe Asp
325 330 335
Tyr Pro Thr Thr Ala Ser Gly Trp Asn Gln Met Tyr His Ser Ala Lys
340 345 350
Asp Trp Glu Val Leu Ala Lys Gly Gln Val Pro Thr Ala Pro Ser Leu
355 360 365
Lys Thr Leu Arg Asn Glu Lys Gly Ser Gly Val Lys Ala Asp Tyr Asp
370 375 380
Thr Phe Ala Lys Ile Leu Leu Ala Gly Ile Ala Lys Ile Asn Glu Val
385 390 395 400
Glu Pro Lys Val Thr Trp Tyr Asp Thr Ile Ala Gly Asp Gly Asp Cys
405 410 415
Gly Thr Thr Leu Val Ser Gly Gly Glu Ala Leu Glu Glu Ala Ile Lys
420 425 430
Asn His Thr Leu Arg Leu Glu Asp Ala Ala Leu Gly Ile Glu Asp Ile
435 440 445
Ala Tyr Met Val Glu Asp Ser Met Gly Gly Thr Ser Gly Gly Leu Tyr
450 455 460
Ser Ile Tyr Leu Ser Ala Leu Ala Gln Gly Val Arg Asp Ser Gly Asp
465 470 475 480
Lys Glu Leu Thr Ala Glu Thr Phe Lys Lys Ala Ser Asn Val Ala Leu
485 490 495
Asp Ala Leu Tyr Lys Tyr Thr Arg Ala Arg Pro Gly Tyr Arg Thr Leu
500 505 510
Ile Asp Ala Leu Gln Pro Phe Val Glu Ala Leu Lys Ala Gly Lys Gly
515 520 525
Pro Arg Ala Ala Ala Gln Ala Ala Tyr Asp Gly Ala Glu Lys Thr Arg
530 535 540
Lys Met Asp Ala Leu Val Gly Arg Ala Ser Tyr Val Ala Lys Glu Glu
545 550 555 560
Leu Arg Lys Leu Asp Ser Glu Gly Gly Leu Pro Asp Pro Gly Ala Val
565 570 575
Gly Leu Ala Ala Leu Leu Asp Gly Phe Val Thr Ala Ala Gly Tyr
580 585 590
<210> 10
<211> 560
<212> PRT
<213> Saccharomyces cerevisiae
<400> 10
Met Ser Leu Ile Ser Ile Leu Ser Pro Leu Ile Thr Ser Glu Gly Leu
1 5 10 15
Asp Ser Arg Ile Lys Pro Ser Pro Lys Lys Asp Ala Ser Thr Thr Thr
20 25 30
Lys Pro Ser Leu Trp Lys Thr Thr Glu Phe Lys Phe Tyr Tyr Ile Ala
35 40 45
Phe Leu Val Val Val Pro Leu Met Phe Tyr Ala Gly Leu Gln Ala Ser
50 55 60
Ser Pro Glu Asn Pro Asn Tyr Ala Arg Tyr Glu Arg Leu Leu Ser Gln
65 70 75 80
Gly Trp Leu Phe Gly Arg Lys Val Asp Asn Ser Asp Ser Gln Tyr Arg
85 90 95
Phe Phe Arg Asp Asn Phe Ala Leu Leu Ser Val Leu Met Leu Val His
100 105 110
Thr Ser Ile Lys Arg Ile Val Leu Tyr Ser Thr Asn Ile Thr Lys Leu
115 120 125
Arg Phe Asp Leu Ile Phe Gly Leu Ile Phe Leu Val Ala Ala His Gly
130 135 140
Val Asn Ser Ile Arg Ile Leu Ala His Met Leu Ile Leu Tyr Ala Ile
145 150 155 160
Ala His Val Leu Lys Asn Phe Arg Arg Ile Ala Thr Ile Ser Ile Trp
165 170 175
Ile Tyr Gly Ile Ser Thr Leu Phe Ile Asn Asp Asn Phe Arg Ala Tyr
180 185 190
Pro Phe Gly Asn Ile Cys Ser Phe Leu Ser Pro Leu Asp His Trp Tyr
195 200 205
Arg Gly Ile Ile Pro Arg Trp Asp Val Phe Phe Asn Phe Thr Leu Leu
210 215 220
Arg Val Leu Ser Tyr Asn Leu Asp Phe Leu Glu Arg Trp Glu Asn Leu
225 230 235 240
Gln Lys Lys Lys Ser Pro Ser Tyr Glu Ser Lys Glu Ala Lys Ser Ala
245 250 255
Ile Leu Leu Asn Glu Arg Ala Arg Leu Thr Ala Ala His Pro Ile Gln
260 265 270
Asp Tyr Ser Leu Met Asn Tyr Ile Ala Tyr Val Thr Tyr Thr Pro Leu
275 280 285
Phe Ile Ala Gly Pro Ile Ile Thr Phe Asn Asp Tyr Val Tyr Gln Ser
290 295 300
Lys His Thr Leu Pro Ser Ile Asn Phe Lys Phe Ile Phe Tyr Tyr Ala
305 310 315 320
Val Arg Phe Val Ile Ala Leu Leu Ser Met Glu Phe Ile Leu His Phe
325 330 335
Leu His Val Val Ala Ile Ser Lys Thr Lys Ala Trp Glu Asn Asp Thr
340 345 350
Pro Phe Gln Ile Ser Met Ile Gly Leu Phe Asn Leu Asn Ile Ile Trp
355 360 365
Leu Lys Leu Leu Ile Pro Trp Arg Leu Phe Arg Leu Trp Ala Leu Leu
370 375 380
Asp Gly Ile Asp Thr Pro Glu Asn Met Ile Arg Cys Val Asp Asn Asn
385 390 395 400
Tyr Ser Ser Leu Ala Phe Trp Arg Ala Trp His Arg Ser Tyr Asn Lys
405 410 415
Trp Val Val Arg Tyr Ile Tyr Ile Pro Leu Gly Gly Ser Lys Asn Arg
420 425 430
Val Leu Thr Ser Leu Ala Val Phe Ser Phe Val Ala Ile Trp His Asp
435 440 445
Ile Glu Leu Lys Leu Leu Leu Trp Gly Trp Leu Ile Val Leu Phe Leu
450 455 460
Leu Pro Glu Ile Phe Ala Thr Gln Ile Phe Ser His Tyr Thr Asp Ala
465 470 475 480
Val Trp Tyr Arg His Val Cys Ala Val Gly Ala Val Phe Asn Ile Trp
485 490 495
Val Met Met Ile Ala Asn Leu Phe Gly Phe Cys Leu Gly Ser Asp Gly
500 505 510
Thr Lys Lys Leu Leu Ser Asp Met Phe Cys Thr Val Ser Gly Phe Lys
515 520 525
Phe Val Ile Leu Ala Ser Val Ser Leu Phe Ile Ala Val Gln Ile Met
530 535 540
Phe Glu Ile Arg Glu Glu Glu Lys Arg His Gly Ile Tyr Leu Lys Cys
545 550 555 560
<210> 11
<211> 609
<212> PRT
<213> Saccharomyces cerevisiae
<400> 11
Met Ser Met Leu Arg Ile Trp Ser Cys Ile Val His Phe Phe Ser Val
1 5 10 15
Gln Ala Leu Asp Ser Arg Ile Lys Pro Asp Ile Glu Phe Lys Arg Arg
20 25 30
Gln Arg Ile Phe Ile Asn Ser Ser Lys Glu Glu Asn Gly Ser Ser Ser
35 40 45
Ser Ala Val Thr Val Thr Arg Asn Pro Val Leu Ser Ser Asn Ser Pro
50 55 60
Ser Pro Pro Leu Trp Asn Thr Trp Glu Phe Arg Leu Tyr Tyr Leu Ala
65 70 75 80
Phe Thr Val Val Val Pro Phe Met Ile Lys Ala Ala Leu Ala Thr Ser
85 90 95
Ser Glu Ser Asn Pro Asn Tyr Tyr Lys Phe Ser Gly Leu Leu Ala His
100 105 110
Gly Trp Ile Leu Gly Arg Lys Val Asp Asn Ser Asp Pro Gln Tyr Arg
115 120 125
Phe Phe Arg Ser Asn Phe Phe Leu Leu Ala Ile Leu Ile Leu Leu Gln
130 135 140
Ile Ile Leu Lys Lys Val Phe Val Lys Phe Ser Lys Ile Pro Lys Thr
145 150 155 160
Lys Phe Asp Phe Ala Cys Gly Leu Val Phe Val Cys Phe Met Tyr Gly
165 170 175
Ile Asn Ser Val Lys Leu Phe Thr His Ala Phe Ile Phe Phe Thr Leu
180 185 190
Ala His Ser Leu Lys Arg Lys Arg Leu Ile Ala Ala Phe Ala Ile Trp
195 200 205
Ser Tyr Gly Ile Phe Thr Leu Phe Ile Asn Gln Lys Met Lys Asn Leu
210 215 220
Pro Phe Asn Asn Ile Ala Ile Ile Leu Ser Pro Met Asp Gln Trp Tyr
225 230 235 240
Lys Gly Ile Val Pro Arg Trp Asp Phe Phe Phe Asn Phe Thr Leu Leu
245 250 255
Arg Leu Leu Ser Tyr Ser Met Asp Phe Leu Glu Arg Trp His Glu Gln
260 265 270
Leu Ser Arg Gln Pro Ser Ile Asp Tyr Asp Asp Arg Arg Pro Glu Phe
275 280 285
Arg Lys Ser Leu Ser Gly Ser Thr Leu Gln Thr Ile Tyr Glu Ser Gly
290 295 300
Lys Asn Val Leu Glu Glu Lys Glu Arg Leu Val Ala Glu His His Ile
305 310 315 320
Gln Asp Tyr Asn Phe Ile Asn Phe Ile Ala Tyr Ile Thr Tyr Ala Pro
325 330 335
Leu Phe Leu Val Gly Pro Ile Ile Thr Phe Asn Asp Tyr Leu Tyr Gln
340 345 350
Ser Glu Asn Lys Leu Pro Ser Leu Thr Lys Lys Asn Ile Gly Phe Tyr
355 360 365
Ala Leu Lys Val Phe Ser Ser Leu Leu Leu Met Glu Ile Ile Leu His
370 375 380
Tyr Ile Tyr Val Gly Ala Ile Ala Arg Thr Lys Ala Trp Asn Asn Asp
385 390 395 400
Thr Pro Leu Gln Gln Ala Met Ile Ala Leu Phe Asn Leu Asn Ile Met
405 410 415
Tyr Leu Lys Leu Leu Ile Pro Trp Arg Leu Phe Arg Leu Trp Ala Met
420 425 430
Val Asp Gly Ile Asp Ala Pro Glu Asn Met Leu Arg Cys Val Asp Asn
435 440 445
Asn Tyr Ser Thr Val Gly Phe Trp Arg Ala Trp His Thr Ser Phe Asn
450 455 460
Lys Trp Val Ile Arg Tyr Ile Tyr Val Pro Phe Gly Gly Ser Asn Asn
465 470 475 480
Lys Ile Leu Thr Ser Phe Ala Val Phe Ser Phe Val Ala Ile Trp His
485 490 495
Asp Ile Gln Leu Arg Val Leu Phe Trp Gly Trp Leu Thr Val Leu Leu
500 505 510
Leu Leu Gly Glu Thr Tyr Ile Thr Asn Cys Phe Ser Arg Tyr Arg Phe
515 520 525
Arg Ser Trp Tyr Arg Phe Val Cys Gly Ile Gly Ala Ala Ile Asn Ile
530 535 540
Cys Met Met Met Ile Ile Asn Val Tyr Gly Phe Cys Leu Gly Ala Glu
545 550 555 560
Gly Thr Lys Leu Leu Leu Lys Gly Ile Phe Asn Asn Ser His Ser Pro
565 570 575
Glu Phe Leu Thr Ala Val Met Val Ser Leu Phe Ile Ala Val Gln Val
580 585 590
Met Phe Glu Ile Arg Glu Glu Glu Lys Arg His Gly Ile Asn Leu Lys
595 600 605
Cys
<210> 12
<211> 669
<212> PRT
<213> Saccharomyces cerevisiae
<400> 12
Met Ser Asn Pro Gln Lys Ala Leu Asn Asp Phe Leu Ser Ser Glu Ser
1 5 10 15
Val His Thr His Asp Ser Ser Arg Lys Gln Ser Asn Lys Gln Ser Ser
20 25 30
Asp Glu Gly Arg Ser Ser Ser Gln Pro Ser His His His Ser Gly Gly
35 40 45
Thr Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Ser Asn Asn
50 55 60
Asn Asn Asn Gly Asn Asp Gly Gly Asn Asp Asp Asp Tyr Asp Tyr Glu
65 70 75 80
Met Gln Asp Tyr Arg Pro Ser Pro Gln Ser Ala Arg Pro Thr Pro Thr
85 90 95
Tyr Val Pro Gln Tyr Ser Val Glu Ser Gly Thr Ala Phe Pro Ile Gln
100 105 110
Glu Val Ile Pro Ser Ala Tyr Ile Asn Thr Gln Asp Ile Asn His Lys
115 120 125
Asp Asn Gly Pro Pro Ser Ala Ser Ser Asn Arg Ala Phe Arg Pro Arg
130 135 140
Gly Gln Thr Thr Val Ser Ala Asn Val Leu Asn Ile Glu Asp Phe Tyr
145 150 155 160
Lys Asn Ala Asp Asp Ala His Thr Ile Pro Glu Ser His Leu Ser Arg
165 170 175
Arg Arg Ser Arg Ser Arg Ala Thr Ser Asn Ala Gly His Ser Ala Asn
180 185 190
Thr Gly Ala Thr Asn Gly Arg Thr Thr Gly Ala Gln Thr Asn Met Glu
195 200 205
Ser Asn Glu Ser Pro Arg Asn Val Pro Ile Met Val Lys Pro Lys Thr
210 215 220
Leu Tyr Gln Asn Pro Gln Thr Pro Thr Val Leu Pro Ser Thr Tyr His
225 230 235 240
Pro Ile Asn Lys Trp Ser Ser Val Lys Asn Thr Tyr Leu Lys Glu Phe
245 250 255
Leu Ala Glu Phe Met Gly Thr Met Val Met Ile Ile Phe Gly Ser Ala
260 265 270
Val Val Cys Gln Val Asn Val Ala Gly Lys Ile Gln Gln Asp Asn Phe
275 280 285
Asn Val Ala Leu Asp Asn Leu Asn Val Thr Gly Ser Ser Ala Glu Thr
290 295 300
Ile Asp Ala Met Lys Ser Leu Thr Ser Leu Val Ser Ser Val Ala Gly
305 310 315 320
Gly Thr Phe Asp Asp Val Ala Leu Gly Trp Ala Ala Ala Val Val Met
325 330 335
Gly Tyr Phe Cys Ala Gly Gly Ser Ala Ile Ser Gly Ala His Leu Asn
340 345 350
Pro Ser Ile Thr Leu Ala Asn Leu Val Tyr Arg Gly Phe Pro Leu Lys
355 360 365
Lys Val Pro Tyr Tyr Phe Ala Gly Gln Leu Ile Gly Ala Phe Thr Gly
370 375 380
Ala Leu Ile Leu Phe Ile Trp Tyr Lys Arg Val Leu Gln Glu Ala Tyr
385 390 395 400
Ser Asp Trp Trp Met Asn Glu Ser Val Ala Gly Met Phe Cys Val Phe
405 410 415
Pro Lys Pro Tyr Leu Ser Ser Gly Arg Gln Phe Phe Ser Glu Phe Leu
420 425 430
Cys Gly Ala Met Leu Gln Ala Gly Thr Phe Ala Leu Thr Asp Pro Tyr
435 440 445
Thr Cys Leu Ser Ser Asp Val Phe Pro Leu Met Met Phe Ile Leu Ile
450 455 460
Phe Ile Ile Asn Ala Ser Met Ala Tyr Gln Thr Gly Thr Ala Met Asn
465 470 475 480
Leu Ala Arg Asp Leu Gly Pro Arg Leu Ala Leu Tyr Ala Val Gly Phe
485 490 495
Asp His Lys Met Leu Trp Val His His His His Phe Phe Trp Val Pro
500 505 510
Met Val Gly Pro Phe Ile Gly Ala Leu Met Gly Gly Leu Val Tyr Asp
515 520 525
Val Cys Ile Tyr Gln Gly His Glu Ser Pro Val Asn Trp Ser Leu Pro
530 535 540
Val Tyr Lys Glu Met Ile Met Arg Ala Trp Phe Arg Arg Pro Gly Trp
545 550 555 560
Lys Lys Arg Asn Arg Ala Arg Arg Thr Ser Asp Leu Ser Asp Phe Ser
565 570 575
Tyr Asn Asn Asp Asp Asp Glu Glu Phe Gly Glu Arg Met Ala Leu Gln
580 585 590
Lys Thr Lys Thr Lys Ser Ser Ile Ser Asp Asn Glu Asn Glu Ala Gly
595 600 605
Glu Lys Lys Val Gln Phe Lys Ser Val Gln Arg Gly Lys Arg Thr Phe
610 615 620
Gly Gly Ile Pro Thr Ile Leu Glu Glu Glu Asp Ser Ile Glu Thr Ala
625 630 635 640
Ser Leu Gly Ala Thr Thr Thr Asp Ser Ile Gly Leu Ser Asp Thr Ser
645 650 655
Ser Glu Asp Ser His Tyr Gly Asn Ala Lys Lys Val Thr
660 665
<210> 13
<211> 713
<212> PRT
<213> Saccharomyces cerevisiae
<400> 13
Met Ser Pro Ser Ala Val Gln Ser Ser Lys Leu Glu Glu Gln Ser Ser
1 5 10 15
Glu Ile Asp Lys Leu Lys Ala Lys Met Ser Gln Ser Ala Ala Thr Ala
20 25 30
Gln Gln Lys Lys Glu His Glu Tyr Glu His Leu Thr Ser Val Lys Ile
35 40 45
Val Pro Gln Arg Pro Ile Ser Asp Arg Leu Gln Pro Ala Ile Ala Thr
50 55 60
His Tyr Ser Pro His Leu Asp Gly Leu Gln Asp Tyr Gln Arg Leu His
65 70 75 80
Lys Glu Ser Ile Glu Asp Pro Ala Lys Phe Phe Gly Ser Lys Ala Thr
85 90 95
Gln Phe Leu Asn Trp Ser Lys Pro Phe Asp Lys Val Phe Ile Pro Asp
100 105 110
Pro Lys Thr Gly Arg Pro Ser Phe Gln Asn Asn Ala Trp Phe Leu Asn
115 120 125
Gly Gln Leu Asn Ala Cys Tyr Asn Cys Val Asp Arg His Ala Leu Lys
130 135 140
Thr Pro Asn Lys Lys Ala Ile Ile Phe Glu Gly Asp Glu Pro Gly Gln
145 150 155 160
Gly Tyr Ser Ile Thr Tyr Lys Glu Leu Leu Glu Glu Val Cys Gln Val
165 170 175
Ala Gln Val Leu Thr Tyr Ser Met Gly Val Arg Lys Gly Asp Thr Val
180 185 190
Ala Val Tyr Met Pro Met Val Pro Glu Ala Ile Ile Thr Leu Leu Ala
195 200 205
Ile Ser Arg Ile Gly Ala Ile His Ser Val Val Phe Ala Gly Phe Ser
210 215 220
Ser Asn Ser Leu Arg Asp Arg Ile Asn Asp Gly Asp Ser Lys Val Val
225 230 235 240
Ile Thr Thr Asp Glu Ser Asn Arg Gly Gly Lys Val Ile Glu Thr Lys
245 250 255
Arg Ile Val Asp Asp Ala Leu Arg Glu Thr Pro Gly Val Arg His Val
260 265 270
Leu Val Tyr Arg Lys Thr Asn Asn Pro Ser Val Ala Phe His Ala Pro
275 280 285
Arg Asp Leu Asp Trp Ala Thr Glu Lys Lys Lys Tyr Lys Thr Tyr Tyr
290 295 300
Pro Cys Thr Pro Val Asp Ser Glu Asp Pro Leu Phe Leu Leu Tyr Thr
305 310 315 320
Ser Gly Ser Thr Gly Ala Pro Lys Gly Val Gln His Ser Thr Ala Gly
325 330 335
Tyr Leu Leu Gly Ala Leu Leu Thr Met Arg Tyr Thr Phe Asp Thr His
340 345 350
Gln Glu Asp Val Phe Phe Thr Ala Gly Asp Ile Gly Trp Ile Thr Gly
355 360 365
His Thr Tyr Val Val Tyr Gly Pro Leu Leu Tyr Gly Cys Ala Thr Leu
370 375 380
Val Phe Glu Gly Thr Pro Ala Tyr Pro Asn Tyr Ser Arg Tyr Trp Asp
385 390 395 400
Ile Ile Asp Glu His Lys Val Thr Gln Phe Tyr Val Ala Pro Thr Ala
405 410 415
Leu Arg Leu Leu Lys Arg Ala Gly Asp Ser Tyr Ile Glu Asn His Ser
420 425 430
Leu Lys Ser Leu Arg Cys Leu Gly Ser Val Gly Glu Pro Ile Ala Ala
435 440 445
Glu Val Trp Glu Trp Tyr Ser Glu Lys Ile Gly Lys Asn Glu Ile Pro
450 455 460
Ile Val Asp Thr Tyr Trp Gln Thr Glu Ser Gly Ser His Leu Val Thr
465 470 475 480
Pro Leu Ala Gly Gly Val Thr Pro Met Lys Pro Gly Ser Ala Ser Phe
485 490 495
Pro Phe Phe Gly Ile Asp Ala Val Val Leu Asp Pro Asn Thr Gly Glu
500 505 510
Glu Leu Asn Thr Ser His Ala Glu Gly Val Leu Ala Val Lys Ala Ala
515 520 525
Trp Pro Ser Phe Ala Arg Thr Ile Trp Lys Asn His Asp Arg Tyr Leu
530 535 540
Asp Thr Tyr Leu Asn Pro Tyr Pro Gly Tyr Tyr Phe Thr Gly Asp Gly
545 550 555 560
Ala Ala Lys Asp Lys Asp Gly Tyr Ile Trp Ile Leu Gly Arg Val Asp
565 570 575
Asp Val Val Asn Val Ser Gly His Arg Leu Ser Thr Ala Glu Ile Glu
580 585 590
Ala Ala Ile Ile Glu Asp Pro Ile Val Ala Glu Cys Ala Val Val Gly
595 600 605
Phe Asn Asp Asp Leu Thr Gly Gln Ala Val Ala Ala Phe Val Val Leu
610 615 620
Lys Asn Lys Ser Ser Trp Ser Thr Ala Thr Asp Asp Glu Leu Gln Asp
625 630 635 640
Ile Lys Lys His Leu Val Phe Thr Val Arg Lys Asp Ile Gly Pro Phe
645 650 655
Ala Ala Pro Lys Leu Ile Ile Leu Val Asp Asp Leu Pro Lys Thr Arg
660 665 670
Ser Gly Lys Ile Met Arg Arg Ile Leu Arg Lys Ile Leu Ala Gly Glu
675 680 685
Ser Asp Gln Leu Gly Asp Val Ser Thr Leu Ser Asn Pro Gly Ile Val
690 695 700
Arg His Leu Ile Asp Ser Val Lys Leu
705 710
<210> 14
<211> 683
<212> PRT
<213> Saccharomyces cerevisiae
<400> 14
Met Thr Ile Lys Glu His Lys Val Val Tyr Glu Ala His Asn Val Lys
1 5 10 15
Ala Leu Lys Ala Pro Gln His Phe Tyr Asn Ser Gln Pro Gly Lys Gly
20 25 30
Tyr Val Thr Asp Met Gln His Tyr Gln Glu Met Tyr Gln Gln Ser Ile
35 40 45
Asn Glu Pro Glu Lys Phe Phe Asp Lys Met Ala Lys Glu Tyr Leu His
50 55 60
Trp Asp Ala Pro Tyr Thr Lys Val Gln Ser Gly Ser Leu Asn Asn Gly
65 70 75 80
Asp Val Ala Trp Phe Leu Asn Gly Lys Leu Asn Ala Ser Tyr Asn Cys
85 90 95
Val Asp Arg His Ala Phe Ala Asn Pro Asp Lys Pro Ala Leu Ile Tyr
100 105 110
Glu Ala Asp Asp Glu Ser Asp Asn Lys Ile Ile Thr Phe Gly Glu Leu
115 120 125
Leu Arg Lys Val Ser Gln Ile Ala Gly Val Leu Lys Ser Trp Gly Val
130 135 140
Lys Lys Gly Asp Thr Val Ala Ile Tyr Leu Pro Met Ile Pro Glu Ala
145 150 155 160
Val Ile Ala Met Leu Ala Val Ala Arg Ile Gly Ala Ile His Ser Val
165 170 175
Val Phe Ala Gly Phe Ser Ala Gly Ser Leu Lys Asp Arg Val Val Asp
180 185 190
Ala Asn Ser Lys Val Val Ile Thr Cys Asp Glu Gly Lys Arg Gly Gly
195 200 205
Lys Thr Ile Asn Thr Lys Lys Ile Val Asp Glu Gly Leu Asn Gly Val
210 215 220
Asp Leu Val Ser Arg Ile Leu Val Phe Gln Arg Thr Gly Thr Glu Gly
225 230 235 240
Ile Pro Met Lys Ala Gly Arg Asp Tyr Trp Trp His Glu Glu Ala Ala
245 250 255
Lys Gln Arg Thr Tyr Leu Pro Pro Val Ser Cys Asp Ala Glu Asp Pro
260 265 270
Leu Phe Leu Leu Tyr Thr Ser Gly Ser Thr Gly Ser Pro Lys Gly Val
275 280 285
Val His Thr Thr Gly Gly Tyr Leu Leu Gly Ala Ala Leu Thr Thr Arg
290 295 300
Tyr Val Phe Asp Ile His Pro Glu Asp Val Leu Phe Thr Ala Gly Asp
305 310 315 320
Val Gly Trp Ile Thr Gly His Thr Tyr Ala Leu Tyr Gly Pro Leu Thr
325 330 335
Leu Gly Thr Ala Ser Ile Ile Phe Glu Ser Thr Pro Ala Tyr Pro Asp
340 345 350
Tyr Gly Arg Tyr Trp Arg Ile Ile Gln Arg His Lys Ala Thr His Phe
355 360 365
Tyr Val Ala Pro Thr Ala Leu Arg Leu Ile Lys Arg Val Gly Glu Ala
370 375 380
Glu Ile Ala Lys Tyr Asp Thr Ser Ser Leu Arg Val Leu Gly Ser Val
385 390 395 400
Gly Glu Pro Ile Ser Pro Asp Leu Trp Glu Trp Tyr His Glu Lys Val
405 410 415
Gly Asn Lys Asn Cys Val Ile Cys Asp Thr Met Trp Gln Thr Glu Ser
420 425 430
Gly Ser His Leu Ile Ala Pro Leu Ala Gly Ala Val Pro Thr Lys Pro
435 440 445
Gly Ser Ala Thr Val Pro Phe Phe Gly Ile Asn Ala Cys Ile Ile Asp
450 455 460
Pro Val Thr Gly Val Glu Leu Glu Gly Asn Asp Val Glu Gly Val Leu
465 470 475 480
Ala Val Lys Ser Pro Trp Pro Ser Met Ala Arg Ser Val Trp Asn His
485 490 495
His Asp Arg Tyr Met Asp Thr Tyr Leu Lys Pro Tyr Pro Gly His Tyr
500 505 510
Phe Thr Gly Asp Gly Ala Gly Arg Asp His Asp Gly Tyr Tyr Trp Ile
515 520 525
Arg Gly Arg Val Asp Asp Val Val Asn Val Ser Gly His Arg Leu Ser
530 535 540
Thr Ser Glu Ile Glu Ala Ser Ile Ser Asn His Glu Asn Val Ser Glu
545 550 555 560
Ala Ala Val Val Gly Ile Pro Asp Glu Leu Thr Gly Gln Thr Val Val
565 570 575
Ala Tyr Val Ser Leu Lys Asp Gly Tyr Leu Gln Asn Asn Ala Thr Glu
580 585 590
Gly Asp Ala Glu His Ile Thr Pro Asp Asn Leu Arg Arg Glu Leu Ile
595 600 605
Leu Gln Val Arg Gly Glu Ile Gly Pro Phe Ala Ser Pro Lys Thr Ile
610 615 620
Ile Leu Val Arg Asp Leu Pro Arg Thr Arg Ser Gly Lys Ile Met Arg
625 630 635 640
Arg Val Leu Arg Lys Val Ala Ser Asn Glu Ala Glu Gln Leu Gly Asp
645 650 655
Leu Thr Thr Leu Ala Asn Pro Glu Val Val Pro Ala Ile Ile Ser Ala
660 665 670
Val Glu Asn Gln Phe Phe Ser Gln Lys Lys Lys
675 680
<210> 15
<211> 384
<212> PRT
<213> Saccharomyces cerevisiae
<400> 15
Met Thr Ala His Thr Asn Ile Lys Gln His Lys His Cys His Glu Asp
1 5 10 15
His Pro Ile Arg Arg Ser Asp Ser Ala Val Ser Ile Val His Leu Lys
20 25 30
Arg Ala Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr
35 40 45
Thr Ile Ala Lys Val Ile Ala Glu Asn Thr Glu Leu His Ser His Ile
50 55 60
Phe Glu Pro Glu Val Arg Met Trp Val Phe Asp Glu Lys Ile Gly Asp
65 70 75 80
Glu Asn Leu Thr Asp Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr
85 90 95
Leu Pro Asn Ile Asp Leu Pro His Asn Leu Val Ala Asp Pro Asp Leu
100 105 110
Leu His Ser Ile Lys Gly Ala Asp Ile Leu Val Phe Asn Ile Pro His
115 120 125
Gln Phe Leu Pro Asn Ile Val Lys Gln Leu Gln Gly His Val Ala Pro
130 135 140
His Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Leu Gly Ser Lys
145 150 155 160
Gly Val Gln Leu Leu Ser Ser Tyr Val Thr Asp Glu Leu Gly Ile Gln
165 170 175
Cys Gly Ala Leu Ser Gly Ala Asn Leu Ala Pro Glu Val Ala Lys Glu
180 185 190
His Trp Ser Glu Thr Thr Val Ala Tyr Gln Leu Pro Lys Asp Tyr Gln
195 200 205
Gly Asp Gly Lys Asp Val Asp His Lys Ile Leu Lys Leu Leu Phe His
210 215 220
Arg Pro Tyr Phe His Val Asn Val Ile Asp Asp Val Ala Gly Ile Ser
225 230 235 240
Ile Ala Gly Ala Leu Lys Asn Val Val Ala Leu Ala Cys Gly Phe Val
245 250 255
Glu Gly Met Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Leu
260 265 270
Gly Leu Gly Glu Ile Ile Lys Phe Gly Arg Met Phe Phe Pro Glu Ser
275 280 285
Lys Val Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile
290 295 300
Thr Thr Cys Ser Gly Gly Arg Asn Val Lys Val Ala Thr Tyr Met Ala
305 310 315 320
Lys Thr Gly Lys Ser Ala Leu Glu Ala Glu Lys Glu Leu Leu Asn Gly
325 330 335
Gln Ser Ala Gln Gly Ile Ile Thr Cys Arg Glu Val His Glu Trp Leu
340 345 350
Gln Thr Cys Glu Leu Thr Gln Glu Phe Pro Ile Ile Arg Gly Ser Leu
355 360 365
Pro Asp Ser Leu Gln Gln Arg Pro His Gly Arg Pro Thr Gly Asp Asp
370 375 380
<210> 16
<211> 391
<212> PRT
<213> Saccharomyces cerevisiae
<400> 16
Met Ser Ala Ala Ala Asp Arg Leu Asn Leu Thr Ser Gly His Leu Asn
1 5 10 15
Ala Gly Arg Lys Arg Ser Ser Ser Ser Val Ser Leu Lys Ala Ala Glu
20 25 30
Lys Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr Thr
35 40 45
Ile Ala Lys Val Val Ala Glu Asn Cys Lys Gly Tyr Pro Glu Val Phe
50 55 60
Ala Pro Ile Val Gln Met Trp Val Phe Glu Glu Glu Ile Asn Gly Glu
65 70 75 80
Lys Leu Thr Glu Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr Leu
85 90 95
Pro Gly Ile Thr Leu Pro Asp Asn Leu Val Ala Asn Pro Asp Leu Ile
100 105 110
Asp Ser Val Lys Asp Val Asp Ile Ile Val Phe Asn Ile Pro His Gln
115 120 125
Phe Leu Pro Arg Ile Cys Ser Gln Leu Lys Gly His Val Asp Ser His
130 135 140
Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Val Gly Ala Lys Gly
145 150 155 160
Val Gln Leu Leu Ser Ser Tyr Ile Thr Glu Glu Leu Gly Ile Gln Cys
165 170 175
Gly Ala Leu Ser Gly Ala Asn Ile Ala Thr Glu Val Ala Gln Glu His
180 185 190
Trp Ser Glu Thr Thr Val Ala Tyr His Ile Pro Lys Asp Phe Arg Gly
195 200 205
Glu Gly Lys Asp Val Asp His Lys Val Leu Lys Ala Leu Phe His Arg
210 215 220
Pro Tyr Phe His Val Ser Val Ile Glu Asp Val Ala Gly Ile Ser Ile
225 230 235 240
Cys Gly Ala Leu Lys Asn Val Val Ala Leu Gly Cys Gly Phe Val Glu
245 250 255
Gly Leu Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Val Gly
260 265 270
Leu Gly Glu Ile Ile Arg Phe Gly Gln Met Phe Phe Pro Glu Ser Arg
275 280 285
Glu Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile Thr
290 295 300
Thr Cys Ala Gly Gly Arg Asn Val Lys Val Ala Arg Leu Met Ala Thr
305 310 315 320
Ser Gly Lys Asp Ala Trp Glu Cys Glu Lys Glu Leu Leu Asn Gly Gln
325 330 335
Ser Ala Gln Gly Leu Ile Thr Cys Lys Glu Val His Glu Trp Leu Glu
340 345 350
Thr Cys Gly Ser Val Glu Asp Phe Pro Leu Phe Glu Ala Val Tyr Gln
355 360 365
Ile Val Tyr Asn Asn Tyr Pro Met Lys Asn Leu Pro Asp Met Ile Glu
370 375 380
Glu Leu Asp Leu His Glu Asp
385 390
<210> 17
<211> 2573
<212> DNA
<213> Artificial
<220>
<223> GDP1 disruption
<400> 17
ggtacccccg ccttgcttct ctccccttcc ttttcttttt ccagttttcc ctattttgtc 60
cctttttccg cacaacaagt atcagaatgg gttcatcaaa tctatccaac ctaattcgca 120
cgtagactgg cttggtattg gcagtttcgt agttatatat atactaccat gagtgaaact 180
gttacgttac cttaaattct ttctcccttt aattttcttt tatcttactc tcctacataa 240
gacatcaaga aacaattgta tattgtacac cccccccctc cacaaacaca aatattgata 300
atataaagat gtctgctgct gctgatagat taaacttaac ttccggccac ttgaatctag 360
atgcatgctc gagcggccgc cagtgtgatg gatatctgca gaattcgccc ttttgggccc 420
tgtacaccta ggatccgtcg acactggatg gcggcgttag tatcgaatcg acagcagtat 480
agcgaccagc attcacatac gattgacgca tgatattact ttctgcgcac ttaacttcgc 540
atctgggcag atgatgtcga ggcgaaaaaa aatataaatc acgctaacat ttgattaaaa 600
tagaacaact acaatataaa aaaactatac aaatgacaag ttcttgaaaa caagaatctt 660
tttattgtca gtactgatta ttcctttgcc ctcggacgag tgctggggcg tcggtttcca 720
ctatcggcga gtacttctac acagccatcg gtccagacgg ccgcgcttct gcgggcgatt 780
tgtgtacgcc cgacagtccc ggctccggat cggacgattg cgtcgcatcg accctgcgcc 840
caagctgcat catcgaaatt gccgtcaacc aagctctgat agagttggtc aagaccaatg 900
cggagcatat acgcccggag ccgcggcgat cctgcaagct ccggatgcct ccgctcgaag 960
tagcgcgtct gctgctccat acaagccaac cacggcctcc agaagaagat gttggcgacc 1020
tcgtattggg aatccccgaa catcgcctcg ctccagtcaa tgaccgctgt tatgcggcca 1080
ttgtccgtca ggacattgtt ggagccgaaa tccgcgtgca cgaggtgccg gacttcgggg 1140
cagtcctcgg cccaaagcat cagctcatcg agagcctgcg cgacggacgc actgacggtg 1200
tcgtccatca cagtttgcca gtgatacaca tggggatcag caatcgcgca tatgaaatca 1260
cgccatgtag tgtattgacc gattccttgc ggtccgaatg ggccgaaccc gctcgtctgg 1320
ctaagatcgg ccgcagcgat cgcatccatg gcctccgcga ccggctgcag aacagcgggc 1380
agttcggttt caggcaggtc ttgcaacgtg acaccctgtg cacggcggga gatgcaatag 1440
gtcaggctct cgctgaattc cccaatgtca agcacttccg gaatcgggag cgcggccgat 1500
gcaaagtgcc gataaacata acgatctttg tagaaaccat cggcgcagct atttacccgc 1560
aggacatatc cacgccctcc tacatcgaag ctgaaagcac gagattcttc gccctccgag 1620
agctgcatca ggtcggagac gctgtcgaac ttttcgatca gaaacttctc gacagacgtc 1680
gcggtgagtt caggcttttt acccatggtt gtttatgttc ggatgtgatg tgagaactgt 1740
atcctagcaa gattttaaaa ggaagtatat gaaagaagaa cctcagtggc aaatcctaac 1800
cttttatatt tctctacagg ggcgcggcgt ggggacaatt cacgcgtctg tgaggggagc 1860
gtttccctgc tcgcaggtct gcagcgagga gccgtaattt ttgcttcgcg ccgtgcggcc 1920
atcaaaatgt atggatgcaa atgattatac atggggatgt atgggctaaa tgtacgggcg 1980
acagtcacat catgcccctg agctgcgcac gtcaagactg tcaaggaggg tattctgggc 2040
ctccatgtcg ctggccgggt gacccggcgg ggacgaggcc ttaagttcga acgtacggag 2100
ttgttgaatg gccaatccgc tcaaggttta attacctgca aagaagttca cgaatggttg 2160
gaaacatgtg gctctgtcga agacttccca ttatttgaag ccgtatacca aatcgtttac 2220
aacaactacc caatgaagaa cctgccggac atgattgaag aattagatct acatgaagat 2280
tagatttatt ggagaaagat aacatatcat actttccccc acttttttcg aggctcttct 2340
atatcatatt cataaattag cattatgtca tttctcataa ctactttatc acgttagaaa 2400
ttacttatta ttattaaatt aatacaaaat ttagtaacca aataaatata aataaatatg 2460
tatatttaaa ttttaaaaaa aaaatcctat agagcaaaag gattttccat tataatatta 2520
gctgtacacc tcttccgcat tttttgaggg tggttacaac accactcggt acc 2573
<210> 18
<211> 2058
<212> DNA
<213> Artificial
<220>
<223> GPD2 disruption
<400> 18
agatcttttg cggcgaggtg ccgatgggtt gctgagggga agagtgttta gcttacggac 60
ctattgccat tgttattccg attaatctat tgttcagcag ctcttctcta ccctgtcatt 120
ctagtatttt tttttttttt ttttggtttt actttttttt cttcttgcct ttttttcttg 180
ttactttttt tctagttttt tttccttcca ctaagctttt tccttgattt atccttgggt 240
tcttctttct actcctttag attttttttt tatatattaa tttttaagtt tatgtatttt 300
ggtagattca attctctttc cctttccttt tccttcgctc cccttcctta tcaatgcttg 360
ctgtcagaag attaacaaga tacacattcc ttaaggcctc gtccccgccg ggtcacccgg 420
ccagcgacat ggaggcccag aataccctcc ttgacagtct tgacgtgcgc agctcagggg 480
catgatgtga ctgtcgcccg tacatttagc ccatacatcc ccatgtataa tcatttgcat 540
ccatacattt tgatggccgc acggcgcgaa gcaaaaatta cggctcctcg ctgcagacct 600
gcgagcaggg aaacgctccc ctcacagacg cgttgaattg tccccacgcc gcgcccctgt 660
agagaaatat aaaaggttag gatttgccac tgaggttctt ctttcatata cttcctttta 720
aaatcttgct aggatacagt tctcacatca catccgaaca taaacaacca tgtaaaatga 780
ccactcttga cgacacggct taccggtacc gcaccagtgt cccgggggac gccgaggcca 840
tcgaggcact ggatgggtcc ttcaccaccg acaccgtctt ccgcgtcacc gccaccgggg 900
acggcttcac cctgcgggag gtgccggtgg acccgcccct gaccaaggtg ttccccgacg 960
acgaatcgga cgacgaatcg gacgccgggg aggacggcga cccggactcc cggacgttcg 1020
tcgcgtacgg ggacgacggc gacctggcgg gcttcgtggt cgtctcgtac tccggctgga 1080
accgccggct gaccgtcgag gacatcgagg tcgccccgga gcaccggggg cacggggtcg 1140
ggcgcgcgtt gatggggctc gcgacggagt tcgcccgcga gcggggcgcc gggcacctct 1200
ggctggaggt caccaacgtc aacgcaccgg cgatccacgc gtaccggcgg atggggttca 1260
ccctctgcgg cctggacacc gccctgtacg acggcaccgc ctcggacggc gagcaggcgc 1320
tctacatgag catgccctgc ccctagtact gacaataaaa agattcttgt tttcaagaac 1380
ttgtcatttg tatagttttt ttatattgta gttgttctat tttaatcaaa tgttagcgtg 1440
atttatattt tttttcgcct cgacatcatc tgcccagatg cgaagttaag tgcgcagaaa 1500
gtaatatcat gcgtcaatcg tatgtgaatg ctggtcgcta tactgctgtc gattcgatac 1560
taacgccgcc atccagtgtc gacggatcct aggtgtacag ggcccaaaag ggcgaattct 1620
gcagatatcc atcacactgg cggccgctcg aggatagtct acaacaacgt ccgcatggaa 1680
gacctaccgg agatgattga agagctagac atcgatgacg aatagacact ctcccccccc 1740
ctccccctct gatctttcct gttgcctctt tttcccccaa ccaatttatc attatacaca 1800
agttctacaa ctactactag taacattact acagttatta taattttcta ttctcttttt 1860
ctttaagaat ctatcattaa cgttaatttc tatatataca taactaccat tatacacgct 1920
attatcgttt acatatcaca tcaccgttaa tgaaagatac gacaccctgt acactaacac 1980
aattaaataa tcgccataac cttttctgtt atctatagcc cttaaagctg tttcttcgag 2040
ctttttcact gcagatct 2058
<210> 19
<211> 816
<212> DNA
<213> Saccharomyces cerevisiae
<400> 19
ccatatgatc atgtgtcgtc gcacacatat atatatgcct gtatgtgtca gcactaaagt 60
tgcctggcca tccacgctat atatacacgc ctggcggatc tgctcgagga ttgcctacgc 120
gtgggcttga tccaccaacc aacgctcgcc aaatgaactg gcgctttggt cttctgccat 180
cgtccgtaaa ccccggccaa agagaccgga aagatcggtg aaaacatctt gatcttgctc 240
ccgggaattt tagattcagg taggaaattg attacatcaa tactgttacc ctgaatcata 300
ttcgacgatg tcgtctcaca cggaaatata attcatttct tggttttcca aaaaaatttt 360
catttttttt cacttttttg tttcgtcctc cttttttttt tttttttttt attttttttc 420
ctgtgttcac cttttttttt ttcagttgac atctttctgc attcttttct gtgttttttt 480
tttttttttt cgtttttcca ttgttcgttc gttgcctgtt ttttcgccct attgttctcg 540
agcctaaaaa ttttttcctt tcctgctttc ctttcttcgt tcaaagtttc ctattccatt 600
gttctctttg gtaaactcat tgttgtcgga actcagatat attcaggtca atttactgta 660
cttcaattga cttttttctt gaaatttcaa cttgcctttt caacttgttc ttctttttta 720
atcttattct acactttagt tcccttacct tgttcctaat tattgtctag caaaaagaaa 780
acatacacct atttcattca cacactgcag aaaatg 816
<210> 20
<211> 12350
<212> DNA
<213> Artificial
<220>
<223> pRN500
<400> 20
tcgatgataa gctgtcaaag atgagaatta attccacgga ctatagacta tactagatac 60
tccgtctact gtacgataca cttccgctca ggtccttgtc ctttaacgag gccttaccac 120
tcttttgtta ctctattgat ccagctcagc aaaggcagtg tgatctaaga ttctatcttc 180
gcgatgtagt aaaactagct agaccgagaa agagactaga aatgcaaaag gcacttctac 240
aatggctgcc atcattatta tccgatgtga cgctgcagct tctcaatgat attcgaatac 300
gctttgagga gatacagcct aatatccgac aaactgtttt acagatttac gatcgtactt 360
gttacccatc attgaatttt gaacatccga acctgggagt tttccctgaa acagatagta 420
tatttgaacc tgtataataa tatatagtct agcgctttac ggaagacaat gtatgtattt 480
cggttcctgg agaaactatt gcatctattg cataggtaat cttgcacgtc gcatccccgg 540
ttcattttct gcgtttccat cttgcacttc aatagcatat ctttgttaac gaagcatctg 600
tgcttcattt tgtagaacaa aaatgcaacg cgagagcgct aatttttcaa acaaagaatc 660
tgagctgcat ttttacagaa cagaaatgca acgcgaaagc gctattttac caacgaagaa 720
tctgtgcttc atttttgtaa aacaaaaatg caacgcgacg agagcgctaa tttttcaaac 780
aaagaatctg agctgcattt ttacagaaca gaaatgcaac gcgagagcgc tattttacca 840
acaaagaatc tatacttctt ttttgttcta caaaaatgca tcccgagagc gctatttttc 900
taacaaagca tcttagatta ctttttttct cctttgtgcg ctctataatg cagtctcttg 960
ataacttttt gcactgtagg tccgttaagg ttagaagaag gctactttgg tgtctatttt 1020
ctcttccata aaaaaagcct gactccactt cccgcgttta ctgattacta gcgaagctgc 1080
gggtgcattt tttcaagata aaggcatccc cgattatatt ctataccgat gtggattgcg 1140
catactttgt gaacagaaag tgatagcgtt gatgattctt cattggtcag aaaattatga 1200
acggtttctt ctattttgtc tctatatact acgtatagga aatgtttaca ttttcgtatt 1260
gttttcgatt cactctatga atagttctta ctacaatttt tttgtctaaa gagtaatact 1320
agagataaac ataaaaaatg tagaggtcga gtttagatgc aagttcaagg agcgaaaggt 1380
ggatgggtag gttatatagg gatatagcac agagatatat agcaaagaga tacttttgag 1440
caatgtttgt ggaagcggta ttcgcaatgc cggctttccc cgtcaagctc taaatcgggg 1500
gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta 1560
gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt 1620
ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat 1680
ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 1740
tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt ttacaatttc 1800
ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcag ggtaataact 1860
gatataatta aattgaagct ctaatttgtg agtttagtat acatgcattt acttataata 1920
cagtttttta gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt 1980
aacgttcacc ctctacctta gcatcccttc cctttgcaaa tagtcctctt ccaacaataa 2040
taatgtcaga tcctgtagag accacatcat ccacggttct atactgttga cccaatgcgt 2100
ctcccttgtc atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc 2160
ttccacccat gtctctttga gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa 2220
tgtcaacagt acccttagta tattctccag tagataggga gcccttgcat gacaattctg 2280
ctaacatcaa aaggcctcta ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc 2340
taacaatacc tgggcccacc acaccgtgtg cattcgtaat gtctgcccat tctgctattc 2400
tgtatacacc cgcagagtac tgcaatttga ctgtattacc aatgtcagca aattttctgt 2460
cttcgaagag taaaaaattg tacttggcgg ataatgcctt tagcggctta actgtgccct 2520
ccatggaaaa atcagtcaag atatccacat gtgtttttag taaacaaatt ttgggaccta 2580
atgcttcaac taactccagt aattccttgg tggtacgaac atccaatgaa gcacacaagt 2640
ttgtttgctt ttcgtgcatg atattaaata gcttggcagc aacaggacta ggatgagtag 2700
cagcacgttc cttatatgta gctttcgaca tgatttatct tcgtttcctg caggtttttg 2760
ttctgtgcag ttgggttaag aatactgggc aatttcatgt ttcttcaaca ctacatatgc 2820
gtatatatac caatctaagt ctgtgctcct tccttcgttc ttccttctgt tcggagatta 2880
ccgaatcaaa aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg 2940
aattgaattg aaaagcgtgg tgcactctca gtacaatctg ctctgatgcc gcatagttaa 3000
gccagccccg acacccgcca acacccgctg acgcgccctg acgggcttgt ctgctcccgg 3060
catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac 3120
cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat acgcctattt ttataggtta 3180
atgtcatgat aataatggtt tcttagacgt caggtggcac ttttcgggga aatgtgcgcg 3240
gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 3300
aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc 3360
gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa 3420
cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac 3480
tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga 3540
tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag 3600
agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca 3660
cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca 3720
tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa 3780
ccgctttttt tcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc 3840
tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa 3900
cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag 3960
actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct 4020
ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac 4080
tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggc agtcaggcaa 4140
ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt 4200
aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat 4260
ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg 4320
agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc 4380
ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 4440
tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag 4500
cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact 4560
ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg 4620
gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc 4680
ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg 4740
aactgagata cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg 4800
cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag 4860
gggggaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc 4920
gatttttgtg atgctcgtca ggggggccga gcctatggaa aaacgccagc aacgcggcct 4980
ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc 5040
ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc 5100
gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgccca atacgcaaac 5160
cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg gcacgacagg tttcccgact 5220
ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta cctcactcat taggcacccc 5280
aggctttaca ctttatgctt ccggctccta tgttgtgtgg aattgtgagc ggataacaat 5340
ttcacacagg aaacagctat gaccatgatt acgccaagct cggaattaac cctcactaaa 5400
gggaacaaaa gctgggtacc gggccccccc tcgaccggtc ccacacacca tagcttcaaa 5460
atgtttctac tcctttttta ctcttccaga ttttctcgga ctccgcgcat cgccgtacca 5520
cttcaaaaca cccaagcaca gcatactaaa tttcccctct ttcttcctct agggtgtcgt 5580
taattacccg tactaaaggt ttggaaaaga aaaaagagac cgcctcgttt ctttttcttc 5640
gtcgaaaaag gcaataaaaa tttttatcac gtttcttttt cttgaaaatt tttttttttg 5700
atttttttct ctttcgatga cctcccattg atatttaagt taataaacgg tcttcaattt 5760
ctcaagtttc agtttcattt ttcttgttct attacaactt tttttacttc ttgctcatta 5820
gaaagaaagc atagcaatct aatctaagct gcagaagctt aaaatgtcgc cctctgccgt 5880
acaatcatca aaactagaag aacagtcaag tgaaattgac aagttgaaag caaaaatgtc 5940
ccagtctgcc gccactgcgc agcagaagaa ggaacatgag tatgaacatt tgacttcggt 6000
caagatcgtg ccacaacggc ccatctcaga tagactgcag cccgcaattg ctacccacta 6060
ttctccacac ttggacgggt tgcaggacta tcagcgcttg cacaaggagt ctattgaaga 6120
ccctgctaag ttcttcggtt ctaaagctac ccaattttta aactggtcta agccattcga 6180
taaggtgttc atcccagacc ctaaaacggg caggccctcc ttccagaaca atgcatggtt 6240
cctcaacggc caattaaacg cctgttacaa ctgtgttgac agacatgcct tgaagactcc 6300
taacaagaaa gccattattt tcgaaggtga cgagcctggc caaggctatt ccattaccta 6360
caaggaacta cttgaagaag tttgtcaagt ggcacaagtg ctgacttact ctatgggcgt 6420
tcgcaagggc gatactgttg ccgtgtacat gcctatggtc ccagaagcaa tcataacctt 6480
gttggccatt tcccgtatcg gtgccattca ctccgtagtc tttgccgggt tttcttccaa 6540
ctccttgaga gatcgtatca acgatgggga ctctaaagtt gtcatcacta cagatgaatc 6600
caacagaggt ggtaaagtca ttgagactaa aagaattgtt gatgacgcgc taagagagac 6660
cccaggcgtg agacacgtct tggtttatag aaagaccaac aatccatctg ttgctttcca 6720
tgcccccaga gatttggatt gggcaacaga aaagaagaaa tacaagacct actatccatg 6780
cacacccgtt gattctgagg atccattatt cttgttgtat acgtctggtt ctactggtgc 6840
ccccaagggt gttcaacatt ctaccgcagg ttacttgctg ggagctttgt tgaccatgcg 6900
ctacactttt gacactcacc aagaagacgt tttcttcaca gctggagaca ttggctggat 6960
tacaggccac acttatgtgg tttatggtcc cttactatat ggttgtgcca ctttggtctt 7020
tgaagggact cctgcgtacc caaattactc ccgttattgg gatattattg atgaacacaa 7080
agtcacccaa ttttatgttg cgccaactgc tttgcgtttg ttgaaaagag ctggtgattc 7140
ctacatcgaa aatcattcct taaaatcttt gcgttgcttg ggttcggtcg gtgagccaat 7200
tgctgctgaa gtttgggagt ggtactctga aaaaataggt aaaaatgaaa tccccattgt 7260
agacacctac tggcaaacag aatctggttc gcatctggtc accccgctgg ctggtggtgt 7320
tacaccaatg aaaccgggtt ctgcctcatt ccccttcttc ggtattgatg cagttgttct 7380
tgaccctaac actggtgaag aacttaacac cagccacgca gagggtgtcc ttgccgtcaa 7440
agctgcatgg ccatcatttg caagaactat ttggaaaaat catgataggt atctagacac 7500
ttatttgaac ccttaccctg gctactattt cactggtgat ggtgctgcaa aggataagga 7560
tggttatatc tggattttgg gtcgtgtaga cgatgtggtg aacgtctctg gtcaccgtct 7620
gtctaccgct gaaattgagg ctgctattat cgaagatcca attgtggccg agtgtgctgt 7680
tgtcggattc aacgatgact tgactggtca agcagttgct gcatttgtgg tgttgaaaaa 7740
caaatctagt tggtccaccg caacagatga tgaattacaa gatatcaaga agcatttggt 7800
ctttactgtt agaaaagaca tcgggccatt tgccgcacca aaattgatca ttttagtgga 7860
tgacttgccc aagacaagat ccggcaaaat tatgagacgt attttaagaa aaatcctagc 7920
aggagaaagt gaccaactag gcgacgtttc tacattgtca aaccctggca ttgttagaca 7980
tctaattgat tcggtcaagt tgtaacttaa gcgcgcgaat ttcttatgat ttatgatttt 8040
tattattaaa taagttataa aaaaaataag tgtatacaaa ttttaaagtg actcttaggt 8100
tttaaaacga aaattcttat tcttgagtaa ctctttcctg taggtcaggt tgctttctca 8160
ggtatagcat gaggtcgctc ttattgacca cacctctacc ggcatgccga gcaaatgcct 8220
gcaaatcgct ccccatttca cccaattgta gatatgctaa ctccagcaat gagttgatga 8280
atctcggtgt gtattttatg tcctcagagg acaacacctg ttgtaatcgt tcttccacac 8340
gtacgtttta aacagttgat gagaaccttt ttcgcaagtt caaggtgctc taatttttaa 8400
aatttttact tttcgcgaca caataaagtc ttcacgacgc taaactatta gtgcacataa 8460
tgtagttact tggacgctgt tcaataatgt ataaaattta tttcctttgc attacgtaca 8520
ttatataacc aaatcttaaa aatatagaaa tatgatatgt gtataataat ataagcaaaa 8580
tttacgtatc tttgcttata atatagcttt aatgttcttt aggtatatat ttaagagcga 8640
tttgtctcga cttatttctt tttttgagag aaaaattggt tctctacagc agaaatgatg 8700
gcaggtacaa cttctgggtt ggccaaagta gttaggtcac ctagctgttc ggcttcgtta 8760
gaagcaacct ttcttagaac tcttctcata atctttcctg accttgttct tggtagatct 8820
ctaactagaa taatggtttt tggtgaggcg aaaggaccaa tctcacccct aacttgtaag 8880
atcaattctc tacgtaaatt atctggtgtg atgtgttctg catcaccttc agtagcgttg 8940
ttttgtagat aaccatcttt tagggaaaca tatgcaacga cggtttgacc ggtcaattca 9000
tctggaatac cgacaacagc agcttccgag acgttttcgt gatttgagat agatgcttca 9060
atttctgatg tggataatct atgaccggaa acatttacaa cgtcgtcaac tctacccctg 9120
atccagtagt aaccatcatg atctctacca gcaccatcac ctgtgaaata gtgaccagga 9180
taaggtttca agtaagtatc catgtaacgg tcgtggtggt tccaaacaga tctagccatt 9240
gatggccatg gtgatttaac ggcaaggaca ccttcgacat cattaccttc taattccaca 9300
cctgtaacag ggtcaatgat acaagcgtta ataccaaaga atggcacggt agcagaacca 9360
ggttttgttg ggacagcacc tgccaaagga gcaattaaat gagaaccaga ctctgtttgc 9420
cacatagtgt cacaaatgac acagtttttg ttacccactt tttcatgata ccattcccat 9480
aagtctggag agattggttc accgacggaa cccaagacac gtaatgagga agtgtcatat 9540
ttggcaattt cggcttcacc tacacgtttg attaatctta aagcagttgg agccacatag 9600
aaatgggtag ccttgtgacg ttggataatt ctccaatatc taccataatc tgggtaggca 9660
ggagtggatt cgaaaattat tgaggcggta cccaaggtta atggaccata tagagcatag 9720
gtgtgacccg tgatccagcc gacgtcaccg gcagtgaaga gaacatcttc tgggtgaata 9780
tcaaaaacgt atctagttgt taaagcggca cctaataaat aaccacctgt agtgtgaacg 9840
acaccctttg gagaaccagt ggaaccggaa gtgtataata aaaatagagg atcttcagcg 9900
tcacatgaaa caggaggtag gtaagttctc tgcttagcgg cctcctcatg ccaccagtaa 9960
tctctaccgg ccttcattgg aataccttca gtaccagttc tttggaaaac caagatacgg 10020
gaaaccaaat cgactccgtt caaaccttcg tcaacaattt ttttagtgtt gatggtctta 10080
ccacctcttt taccttcatc acaagtgatg accactttag aattagcgtc aacgacacga 10140
tctttcaacg aaccagcgga gaacccagca aagacaacag agtgaatagc accaatacga 10200
gccacagcca acatagcaat gaccgcttct ggaatcattg gcaaatagat agccactgtg 10260
tcacctttct taacgcccca gctttttaag acaccagcga tttgggaaac ttttctgagt 10320
aattcaccaa atgtgatgat tttgttgtcg gattcgtcat cagcttcata gatcaaagct 10380
ggcttgtcgg gattagcaaa ggcatgtctg tcaacacaat tgtatgatgc attcaattta 10440
ccgttcaaaa accatgcaac atcaccattg ttcaatgaac cagattgaac tttggtgtat 10500
ggagcatccc aatgcaagta ttccttagcc atcttatcaa agaatttttc tggctcattg 10560
atagattgtt gatacatttc ttgataatgt tgcatatcag taacgtaacc cttgccgggt 10620
tggctgttgt aaaaatgttg aggagcctta agagccttta cgttgtgagc ttcataaact 10680
actttatgtt ccttgattgt cattttctgc agtctagata tatttgttgt aaaaagtaga 10740
taattacttc cttgatgatc tgtaaaaaag agaaaaagaa agcatctaag aacttgaaaa 10800
actacgaatt agaaaagacc aaatatgtat ttcttgcatt gaccaattta tgcaagttta 10860
tatatatgta aatgtaagtt tcacgaggtt ctactaaact aaaccacccc cttggttaga 10920
agaaaagagt gtgtgagaac aggctgttgt tgtcacacga ttcggacaat tctgtttgaa 10980
agagagagag taacagtacg atcgaacgaa ctttgctctg gagatcacag tgggcatcat 11040
agcatgtggt actaaaccct ttcccgccat tccagaacct tcgattgctt gttacaaaac 11100
ctgtgagccg tcgctaggac cttgttgtgt gacgaaattg gaagctgcaa tcaataggaa 11160
gacaggaagt cgagcgtgtc tgggtttttt cagttttgtt ctttttgcaa acaaatcacg 11220
agcgacggta atttctttct cgataagagg ccacgtgctt tatgagggta acatcaattc 11280
aagaaggagg gaaacacttc ctttttctgg ccctgataat agtatgaggg tgaagccaaa 11340
ataaaggatt cgcgcccaaa tcggcatctt taaatgcagg tatgcgatag ttcctcactc 11400
tttccttact cacgagtaat tcttgcaaat gcctattatg cagatgttat aatatctgtg 11460
cgtcttgagt tgaagagctc gagactagat gcatgctcga gcggccgcca gtgtgatgga 11520
tatctgcaga attcgccctt ttgggccctg tacacctagg atccgtcgac actggatggc 11580
ggcgttagta tcgaatcgac agcagtatag cgaccagcat tcacatacga ttgacgcatg 11640
atattacttt ctgcgcactt aacttcgcat ctgggcagat gatgtcgagg cgaaaaaaaa 11700
tataaatcac gctaacattt gattaaaata gaacaactac aatataaaaa aactatacaa 11760
atgacaagtt cttgaaaaca agaatctttt tattgtcagt actgattaga aaaactcatc 11820
gagcatcaaa tgaaactgca atttattcat atcaggatta tcaataccat atttttgaaa 11880
aagccgtttc tgtaatgaag gagaaaactc accgaggcag ttccatagga tggcaagatc 11940
ctggtatcgg tctgcgattc cgactcgtcc aacatcaata caacctatta atttcccctc 12000
gtcaaaaata aggttatcaa gtgagaaatc accatgagtg acgactgaat ccggtgagaa 12060
tggcaaaagc ttatgcattt ctttccagac ttgttcaaca ggccagccat tacgctcgtc 12120
atcaaaatca ctcgcatcaa ccaaaccgtt attcattcgt gattgcgcct gagcgagacg 12180
aaatacgcga tcgctgttaa aaggacaatt acaaacagga atcgaatgca accggcgcag 12240
gaacactgcc agcgcatcaa caatattttc acctgaatca ggatattctt ctaatacctg 12300
gaatgctgtt ttgccgggga tcgcagtggt gagtaaccat gcatcatcag 12350
<210> 21
<211> 1120
<212> DNA
<213> Artificial
<220>
<223> nucleotide seqeunce encoding E.coli gldA codon-optimised for
yeast
<400> 21
ctgcagaaaa tggacagaat catccaatct ccaggtaagt acatccaagg tgctgacgtt 60
atcaacagat tgggtgaata cttgaagcca ttggctgaaa gatggttggt tgttggtgac 120
aagttcgttt tgggtttcgc tcaatctacc gttgaaaagt ctttcaagga cgctggtttg 180
gttgttgaaa tcgctccatt cggtggtgaa tgttctcaaa acgaaatcga cagattgaga 240
ggtatcgctg aaaccgctca atgtggtgct atcttgggta tcggtggtgg taagaccttg 300
gacaccgcta aggctttggc tcacttcatg ggtgttccag ttgctatcgc tccaaccatc 360
gcttctaccg acgctccatg ttctgctttg tctgttatct acaccgacga aggtgaattc 420
gacagatact tgttgttgcc aaacaaccca aacatggtta tcgttgacac caagatcgtt 480
gctggtgctc cagctagatt gttggcagct ggtatcggtg acgctttggc tacctggttc 540
gaagctagag cttgttctag atctggtgct accaccatgg ctggtggtaa gtgtacccaa 600
gctgctttgg ctttggctga attgtgttac aacaccttgt tggaagaagg tgaaaaggct 660
atgttggctg ctgaacaaca cgttgttacc ccagctttgg aaagagttat cgaagctaac 720
acctacttgt ctggtgttgg tttcgaatct ggtggtttgg ctgctgctca cgctgttcac 780
aacggtttga ccgctatccc agacgctcac cactactacc acggtgaaaa ggttgctttc 840
ggtaccttga cccaattggt tttggaaaac gctccagttg aagaaatcga aaccgttgct 900
gctttgtctc acgctgttgg tttgccaatc accttggctc aattggacat caaggaagac 960
gttccagcta agatgagaat cgttgctgaa gctgcttgtg ctgaaggtga aaccatccac 1020
aacatgccag gtggtgctac cccagaccaa gtttacgctg ctttgttggt tgctgaccaa 1080
tacggtcaaa gattcctaca agaatgggaa taaggcgcgc 1120
<210> 22
<211> 1450
<212> DNA
<213> Artificial
<220>
<223> DAK1 PCR fragment
<400> 22
tctagaaaat gtccgctaaa tcgtttgaag tcacagatcc agtcaattca agtctcaaag 60
ggtttgccct tgctaacccc tccattacgc tggtccctga agaaaaaatt ctcttcagaa 120
agaccgattc cgacaagatc gcattaattt ctggtggtgg tagtggacat gaacctacac 180
acgccggttt cattggtaag ggtatgttga gtggcgccgt ggttggcgaa atttttgcat 240
ccccttcaac aaaacagatt ttaaatgcaa tccgtttagt caatgaaaat gcgtctggcg 300
ttttattgat tgtgaagaac tacacaggtg atgttttgca ttttggtctg tccgctgaga 360
gagcaagagc cttgggtatt aactgccgcg ttgctgtcat aggtgatgat gttgcagttg 420
gcagagaaaa gggtggtatg gttggtagaa gagcattggc aggtaccgtt ttggttcata 480
agattgtagg tgccttcgca gaagaatatt ctagtaagta tggcttagac ggtacagcta 540
aagtggctaa aattatcaac gacaatttgg tgaccattgg atcttcttta gaccattgta 600
aagttcctgg caggaaattc gaaagtgaat taaacgaaaa acaaatggaa ttgggtatgg 660
gtattcataa cgaacctggt gtgaaagttt tagaccctat tccttctacc gaagacttga 720
tctccaagta tatgctacca aaactattgg atccaaacga taaggataga gcttttgtaa 780
agtttgatga agatgatgaa gttgtcttgt tagttaacaa tctcggcggt gtttctaatt 840
ttgttattag ttctatcact tccaaaacta cggatttctt aaaggaaaat tacaacataa 900
ccccggttca aacaattgct ggcacattga tgacctcctt caatggtaat gggttcagta 960
tcacattact aaacgccact aaggctacaa aggctttgca atctgatttt gaggagatca 1020
aatcagtact agacttgttg aacgcattta cgaacgcacc gggctggcca attgcagatt 1080
ttgaaaagac ttctgcccca tctgttaacg atgacttgtt acataatgaa gtaacagcaa 1140
aggccgtcgg tacctatgac tttgacaagt ttgctgagtg gatgaagagt ggtgctgaac 1200
aagttatcaa gagcgaaccg cacattacgg aactagacaa tcaagttggt gatggtgatt 1260
gtggttacac tttagtggca ggagttaaag gcatcaccga aaaccttgac aagctgtcga 1320
aggactcatt atctcaggcg gttgcccaaa tttcagattt cattgaaggc tcaatgggag 1380
gtacttctgg tggtttatat tctattcttt tgtcgggttt ttcacacgga ttaattcagg 1440
tttgtaaatc 1450
<210> 23
<211> 1698
<212> DNA
<213> Artificial
<220>
<223> GUP1 PCR fragment
<400> 23
gaattcaaaa tgtcgctgat cagcatcctg tctcccctaa ttacttccga gggcttagat 60
tcaagaatca aaccttcacc aaaaaaggat gcctctacta ccactaagcc atcactatgg 120
aaaactactg agttcaaatt ctactacatt gcatttctgg tcgtggttcc cttgatgttc 180
tatgctgggt tacaagctag ttcgcccgaa aatccaaact atgcaagata cgaacgtctc 240
ctatctcaag gttggttatt tggcagaaaa gtagacaata gtgattctca atataggttt 300
ttcagggaca attttgcgct attgtcagtt ttaatgctag tccacacttc tataaaacgc 360
attgtacttt attcaacaaa tatcactaaa ttgaggtttg atctgatatt tggtttgatc 420
tttttagtgg ccgctcatgg tgtcaattcg ataagaattt tagcccatat gctaatttta 480
tatgccatcg cccatgtact aaagaacttt agaagaatag ccaccatcag catttggatt 540
tatggtattt ctacgctttt tattaacgac aacttcagag catatccatt tggtaatatt 600
tgctcttttt taagcccatt ggaccattgg tatagaggta tcattccaag atgggatgtc 660
tttttcaatt ttactctttt gagagtctta agttacaact tggacttctt agagaggtgg 720
gagaatttac aaaagaagaa aagtccatcc tatgaatcaa aagaagctaa atcagccatt 780
ttgctcaatg aacgtgctag attaactgct gcacacccca tacaggacta cagcttaatg 840
aattatattg catatgttac ttacacgcca cttttcattg ccggccccat tataacattc 900
aatgattatg tttaccaatc gaaacatacc ttgccatcaa taaatttcaa attcattttt 960
tactatgcgg tgagattcgt tattgctctc ttatctatgg agttcatttt acactttctc 1020
cacgttgtgg caatctcaaa aaccaaagcg tgggaaaatg acacaccttt ccagatttcc 1080
atgattggct tatttaattt gaatattatt tggctaaaac tactgattcc gtggaggctg 1140
tttaggctgt gggctttgct agacggaatc gatacacctg aaaatatgat caggtgtgtt 1200
gataacaatt acagttcact agcattctgg agagcttggc atagaagcta caataagtgg 1260
gttgtccgtt acatatatat tcctctaggt ggttcaaaaa atagagtttt gacatcacta 1320
gcagtctttt ccttcgtagc tatatggcat gacatcgaac taaagttatt attatggggt 1380
tggctaatag ttttgttcct cttaccagaa atttttgcta cccaaatttt ctctcattat 1440
accgacgcag tctggtacag acacgtttgc gctgtcggtg ctgttttcaa catatgggtt 1500
atgatgatcg ctaatctttt tggattctgc ttgggctctg acggtactaa aaaattacta 1560
agcgatatgt tctgtaccgt atctggtttc aaatttgtaa ttttggcaag cgttagttta 1620
ttcatcgcag tacaaataat gtttgaaatc agagaagaag aaaagaggca cggaatttac 1680
ctaaaatgct gaggatcc 1698
<210> 24
<211> 3037
<212> DNA
<213> Artificial
<220>
<223> FPS1 PCR fragment
<400> 24
aagagctccg gactagtcgt acgaattcta tccttttgtt gtttccgggt gtacaatatg 60
gacttcctct tttctggcaa ccaaacccat acatcgggat tcctataata ccttcgttgg 120
tctccctaac atgtaggtgg cggaggggag atatacaata gaacagatac cagacaagac 180
ataatgggct aaacaagact acaccaatta cactgcctca ttgatggtgg tacataacga 240
actaatactg tagccctaga cttgatagcc atcatcatat cgaagtttca ctaccctttt 300
tccatttgcc atctattgaa gtaataatag gcgcatgcaa cttcttttct ttttttttct 360
tttctctctc ccccgttgtt gtctcaccat atccgcaatg acaaaaaaat gatggaagac 420
actaaaggaa aaaattaacg acaaagacag caccaacaga tgtcgttgtt ccagagctga 480
tgaggggtat ctcgaagcac acgaaacttt ttccttcctt cattcacgca cactactctc 540
taatgagcaa cggtatacgg ccttccttcc agttacttga atttgaaata aaaaaagttt 600
gctgtcttgc tatcaagtat aaatagacct gcaattatta atcttttgtt tcctcgtcat 660
tgttctcgtt ccctttcttc cttgtttctt tttctgcaca atatttcaag ctataccaag 720
catacaatca actccagctg cattaaaatg agtaatcctc aaaaagctct aaacgacttt 780
ctgtccagtg aatctgttca tacacatgat agttctagga aacaatctaa taagcagtca 840
tccgacgaag gacgctcttc atcacaacct tcacatcatc actctggtgg tactaacaac 900
aataataaca ataataataa taataataac agtaacaaca acaacaacgg caacgatggg 960
ggaaatgatg acgactatga ttatgaaatg caagattata gaccttctcc gcaaagtgcg 1020
cggcctactc ccacgtatgt tccacaatat tctgtagaaa gtgggactgc tttcccgatt 1080
caagaggtta ttcctagcgc atacattaac acacaagata taaaccataa agataacggt 1140
ccgccgagtg caagcagtaa tagagcattc aggcctagag ggcagaccac agtgtcggcc 1200
aacgtgctta acattgaaga tttttacaaa aatgcagacg atgcgcatac catcccggag 1260
tcacatttat cgagaaggag aagtaggtcg agggctacga gtaatgctgg gcacagtgcc 1320
aatacaggcg ccacgaatgg caggactact ggtgcccaaa ctaatatgga aagcaatgaa 1380
tcaccacgta acgtccccat tatggtgaag ccaaagacat tataccagaa ccctcaaaca 1440
cctacagtct tgccctccac ataccatcca attaataaat ggtcttccgt caaaaacact 1500
tatttgaagg aatttttagc cgagtttatg ggaacaatgg ttatgattat tttcggtagt 1560
gctgttgttt gtcaggtcaa tgttgctggg aaaatacagc aggacaattt caacgtggct 1620
ttggataacc ttaacgttac cgggtcttct gcagaaacga tagacgctat gaagagttta 1680
acatccttgg tttcatccgt tgcgggcggt acctttgatg atgtggcatt gggctgggct 1740
gctgccgtgg tgatgggcta tttctgcgct ggtggtagtg ccatctcagg tgctcatttg 1800
aatccgtcta ttacattagc caatttggtg tatagaggtt ttcccctgaa gaaagttcct 1860
tattactttg ctggacaatt gatcggtgcc ttcacaggcg ctttgatctt gtttatttgg 1920
tacaaaaggg tgttacaaga ggcatatagc gattggtgga tgaatgaaag tgttgcggga 1980
atgttttgcg tttttccaaa gccttatcta agttcaggac ggcaattttt ttccgaattt 2040
ttatgtggag ctatgttaca agcaggaaca tttgcgctga ccgatcctta tacgtgtttg 2100
tcctctgatg ttttcccatt gatgatgttt attttgattt tcattatcaa tgcttccatg 2160
gcttatcaga caggtacagc aatgaatttg gctcgtgatc tgggcccacg tcttgcacta 2220
tatgcagttg gatttgatca taaaatgctt tgggtgcatc atcatcattt cttttgggtt 2280
cccatggtag gcccatttat tggtgcgtta atgggggggt tggtttacga tgtctgtatt 2340
tatcagggtc atgaatctcc agtcaactgg tctttaccag tttataagga aatgattatg 2400
agagcctggt ttagaaggcc tggttggaag aagagaaata gagcaagaag aacatcggac 2460
ctgagtgact tctcatacaa taacgatgat gatgaggaat ttggagaaag aatggctctt 2520
caaaagacaa agaccaagtc atctatttca gacaacgaaa atgaagcagg agaaaagaaa 2580
gtgcaattta aatctgttca gcgcggcaaa agaacgtttg gtggtatacc aacaattctt 2640
gaagaagaag attccattga aactgcttcg ctaggtgcga cgacgactga ttctattggg 2700
ttatccgaca catcatcaga agattcgcat tatggtaatg ctaagaaggt aacatgagga 2760
tccccttttc ctttgtcgat atcatgtaat tagttatgtc acgcttacat tcacgccctc 2820
ctcccacatc cgctctaacc gaaaaggaag gagttagaca acctgaagtc taggtcccta 2880
tttatttttt ttaatagtta tgttagtatt aagaacgtta tttatatttc aaatttttct 2940
tttttttctg tacaaacgcg tgtacgcatg taacattata ctgaaaacct tgcttgagaa 3000
ggttttggga cgctcgaagg cttcctaggc tcgagtt 3037
<210> 25
<211> 552
<212> PRT
<213> Citrobacter freundii
<400> 25
Met Ser Gln Phe Phe Phe Asn Gln Arg Thr His Leu Val Ser Asp Val
1 5 10 15
Ile Asp Gly Thr Ile Ile Ala Ser Pro Trp Asn Asn Leu Ala Arg Leu
20 25 30
Glu Ser Asp Pro Ala Ile Arg Ile Val Val Arg Arg Asp Leu Asn Lys
35 40 45
Asn Asn Val Ala Val Ile Ser Gly Gly Gly Ser Gly His Glu Pro Ala
50 55 60
His Val Gly Phe Ile Gly Lys Gly Met Leu Thr Ala Ala Val Cys Gly
65 70 75 80
Asp Val Phe Ala Ser Pro Ser Val Asp Ala Val Leu Thr Ala Ile Gln
85 90 95
Ala Val Thr Gly Glu Ala Gly Cys Leu Leu Ile Val Lys Asn Tyr Thr
100 105 110
Gly Asp Arg Leu Asn Phe Gly Leu Ala Ala Glu Lys Ala Arg Arg Leu
115 120 125
Gly Tyr Asn Val Glu Met Leu Ile Val Gly Asp Asp Ile Ser Leu Pro
130 135 140
Asp Asn Lys His Pro Arg Gly Ile Ala Gly Thr Ile Leu Val His Lys
145 150 155 160
Ile Ala Gly Tyr Phe Ala Glu Arg Gly Tyr Asn Leu Ala Thr Val Leu
165 170 175
Arg Glu Ala Gln Tyr Ala Ala Asn Asn Thr Phe Ser Leu Gly Val Ala
180 185 190
Leu Ser Ser Cys His Leu Pro Gln Glu Ala Asp Ala Ala Pro Arg His
195 200 205
His Pro Gly His Ala Glu Leu Gly Met Gly Ile His Gly Glu Pro Gly
210 215 220
Ala Ser Val Ile Asp Thr Gln Asn Ser Ala Gln Val Val Asn Leu Met
225 230 235 240
Val Asp Lys Leu Met Ala Ala Leu Pro Glu Thr Gly Arg Leu Ala Val
245 250 255
Met Ile Asn Asn Leu Gly Gly Val Ser Val Ala Glu Met Ala Ile Ile
260 265 270
Thr Arg Glu Leu Ala Ser Ser Pro Leu His Pro Arg Ile Asp Trp Leu
275 280 285
Ile Gly Pro Ala Ser Leu Val Thr Ala Leu Asp Met Lys Ser Phe Ser
290 295 300
Leu Thr Ala Ile Val Leu Glu Glu Ser Ile Glu Lys Ala Leu Leu Thr
305 310 315 320
Glu Val Glu Thr Ser Asn Trp Pro Thr Pro Val Pro Pro Arg Glu Ile
325 330 335
Ser Cys Val Pro Ser Ser Gln Arg Ser Ala Arg Val Glu Phe Gln Pro
340 345 350
Ser Ala Asn Ala Met Val Ala Gly Ile Val Glu Leu Val Thr Thr Thr
355 360 365
Leu Ser Asp Leu Glu Thr His Leu Asn Ala Leu Asp Ala Lys Val Gly
370 375 380
Asp Gly Asp Thr Gly Ser Thr Phe Ala Ala Gly Ala Arg Glu Ile Ala
385 390 395 400
Ser Leu Leu His Arg Gln Gln Leu Pro Leu Asp Asn Leu Ala Thr Leu
405 410 415
Phe Ala Leu Ile Gly Glu Arg Leu Thr Val Val Met Gly Gly Ser Ser
420 425 430
Gly Val Leu Met Ser Ile Phe Phe Thr Ala Ala Gly Gln Lys Leu Glu
435 440 445
Gln Gly Ala Ser Val Ala Glu Ser Leu Asn Thr Gly Leu Ala Gln Met
450 455 460
Lys Phe Tyr Gly Gly Ala Asp Glu Gly Asp Arg Thr Met Ile Asp Ala
465 470 475 480
Leu Gln Pro Ala Leu Thr Ser Leu Leu Thr Gln Pro Gln Asn Leu Gln
485 490 495
Ala Ala Phe Asp Ala Ala Gln Ala Gly Ala Glu Arg Thr Cys Leu Ser
500 505 510
Ser Lys Ala Asn Ala Gly Arg Ala Ser Tyr Leu Ser Ser Glu Ser Leu
515 520 525
Leu Gly Asn Met Asp Pro Gly Ala His Ala Val Ala Met Val Phe Lys
530 535 540
Ala Leu Ala Glu Ser Glu Leu Gly
545 550
<210> 26
<211> 1678
<212> DNA
<213> Artificial
<220>
<223> nucleotide sequence encoding the C. freundii dhaK codon-optimised
for yeast
<400> 26
tctagaaaaa tgtctcaatt cttcttcaac cagagaaccc acttggtttc tgacgttatc 60
gacggtgcta tcatcgcttc accatggaac aatttggcta gattggaatc tgacccagct 120
atcagaatcg ttgttagaag agacttgaac aagaacaacg ttgctgttat ctctggtggt 180
ggttctggtc acgaaccagc tcacgttggt ttcatcggta agggtatgtt gaccgctgct 240
gtttgtggtg acgttttcgc ttctccatct gttgacgctg ttttgactgc tatccaagct 300
gttaccggtg aagctggttg tttgttgatc gttaagaact acaccggtga cagattgaac 360
ttcggtttgg ctgctgaaaa ggctagaaga ttgggttaca acgttgaaat gttgatcgtt 420
ggtgacgaca tctctttgcc agacaacaag cacccaagag gtatcgctgg taccatcttg 480
gttcacaaga tcgctggtta cttcgctgaa agaggttaca acttagctac cgttttgaga 540
gaagctcaat acgctgcttc taacaccttc tctttgggtg ttgctttgtc ttcttgtcac 600
ttgccacaag aaaccgacgc tgctccaaga caccacccag gtcacgctga attgggtatg 660
ggtatccacg gtgaaccagg tgcttctgtt atcgacaccc aaaactctgc tcaagttgtt 720
aacttgatgg ttgacaagtt gttggctgct ttgccagaaa ccggtagatt ggctgttatg 780
atcaacaact tgggtggtgt ttctgttgct gaaatggcta tcatcaccag agaattggct 840
tcttctccat tgcactcaag aatcgactgg ttgatcggtc cagcttcttt ggtaaccgct 900
ttggacatga agggtttctc tttgaccgct atcgttttgg aagaatctat cgaaaaggct 960
ttgttgaccg aagttgaaac ctctaactgg ccaaccccag ttccaccaag agaaatcacc 1020
tgtgttgttt cttctcacgc ttctgctaga gttgaattcc aaccatctgc taacgctttg 1080
gttgctggta tcgttgaatt ggttaccgct accttgtctg acttggaaac ccacttgaac 1140
gctttggacg ctaaggttgg tgacggtgac accggttcta ccttcgctgc tgctgctaga 1200
gaaatcgctt ctttgttgca cagacaacaa ttgccattga acaacttggc taccttgttc 1260
gctttgatcg gtgaaagatt gaccgttgtt atgggtggtt cttctggtgt tttgatgtct 1320
atcttcttca ccgctgctgg tcaaaagttg gaacaaggtg ctaacgttgt tgaagctttg 1380
aacaccggtt tggctcaaat gaagttctac ggtggtgctg acgaaggtga cagaaccatg 1440
atcgacgctt tgcaaccagc tttgacctct ttgttggctc aaccaaagaa cttgcaagct 1500
gctttcgacg ctgctcaagc tggtgctgaa agaacctgtt tgtcttctaa ggctaacgct 1560
ggtagagctt cttacttgtc ttctgaatct ttgttgggta acatggaccc aggtgctcaa 1620
agattggcta tggttttcaa ggctttggct gaatctgaat tgggttaata aggtcgac 1678
<210> 27
<211> 2951
<212> DNA
<213> Artificial
<220>
<223> pRNdhaK
<400> 27
ggatccacta gtaacggccg ccagtgtgct ggaattcgcc cttctcgagc ttaagacgcg 60
tttcttcttc agattccctc atggagaaag tgcggcagat gtatatgaca gagtcgccag 120
tttccaagag actttattca ggcacttcca tgataggcaa gagagaagac ccagagatgt 180
tgttgtccta gttacacatg gtatttattc cagagtattc ctgatgaaat ggtttagatg 240
gacatacgaa gagtttgaat cgtttaccaa tgttcctaac gggagcgtaa tggtgatgga 300
actggacgaa tccatcaata gatacgtcct gaggaccgtg ctacccaaat ggactgattg 360
tgagggagac ctaactacat agtgtttaaa gattacggat atttaactta cttagaataa 420
tgccattttt ttgagttata ataatcctac gttagtgtga gcgggattta aactgtgagg 480
accttaatac attcagacac ttctgcggta tcaccctact tattcccttc gagattatat 540
ctaggaaccc atcaggttgg tggaagatta cccgttctaa gacttttcag cttcctctat 600
tgatgttaca cctggacacc ccttttctgg catccagttt ttaatcttca gtggcatgtg 660
agattctccg aaattaatta aagcaatcac acaattctct cggataccac ctcggttgaa 720
actgacaggt ggtttgttac gcatgctaat gcaaaggagc ctatatacct ttggctcggc 780
tgctgtaaca gggaatataa agggcagcat aatttaggag tttagtgaac ttgcaacatt 840
tactattttc ccttcttacg taaatatttt tctttttaat tctaaatcaa tctttttcaa 900
ttttttgttt gtattctttt cttgcttaaa tctataacta caaaaaacac atacataaat 960
ctagaaaaat gtctcaattc ttcttcaacc agagaaccca cttggtttct gacgttatcg 1020
acggtgctat catcgcttca ccatggaaca atttggctag attggaatct gacccagcta 1080
tcagaatcgt tgttagaaga gacttgaaca agaacaacgt tgctgttatc tctggtggtg 1140
gttctggtca cgaaccagct cacgttggtt tcatcggtaa gggtatgttg accgctgctg 1200
tttgtggtga cgttttcgct tctccatctg ttgacgctgt tttgactgct atccaagctg 1260
ttaccggtga agctggttgt ttgttgatcg ttaagaacta caccggtgac agattgaact 1320
tcggtttggc tgctgaaaag gctagaagat tgggttacaa cgttgaaatg ttgatcgttg 1380
gtgacgacat ctctttgcca gacaacaagc acccaagagg tatcgctggt accatcttgg 1440
ttcacaagat cgctggttac ttcgctgaaa gaggttacaa cttagctacc gttttgagag 1500
aagctcaata cgctgcttct aacaccttct ctttgggtgt tgctttgtct tcttgtcact 1560
tgccacaaga aaccgacgct gctccaagac accacccagg tcacgctgaa ttgggtatgg 1620
gtatccacgg tgaaccaggt gcttctgtta tcgacaccca aaactctgct caagttgtta 1680
acttgatggt tgacaagttg ttggctgctt tgccagaaac cggtagattg gctgttatga 1740
tcaacaactt gggtggtgtt tctgttgctg aaatggctat catcaccaga gaattggctt 1800
cttctccatt gcactcaaga atcgactggt tgatcggtcc agcttctttg gtaaccgctt 1860
tggacatgaa gggtttctct ttgaccgcta tcgttttgga agaatctatc gaaaaggctt 1920
tgttgaccga agttgaaacc tctaactggc caaccccagt tccaccaaga gaaatcacct 1980
gtgttgtttc ttctcacgct tctgctagag ttgaattcca accatctgct aacgctttgg 2040
ttgctggtat cgttgaattg gttaccgcta ccttgtctga cttggaaacc cacttgaacg 2100
ctttggacgc taaggttggt gacggtgaca ccggttctac cttcgctgct gctgctagag 2160
aaatcgcttc tttgttgcac agacaacaat tgccattgaa caacttggct accttgttcg 2220
ctttgatcgg tgaaagattg accgttgtta tgggtggttc ttctggtgtt ttgatgtcta 2280
tcttcttcac cgctgctggt caaaagttgg aacaaggtgc taacgttgtt gaagctttga 2340
acaccggttt ggctcaaatg aagttctacg gtggtgctga cgaaggtgac agaaccatga 2400
tcgacgcttt gcaaccagct ttgacctctt tgttggctca accaaagaac ttgcaagctg 2460
ctttcgacgc tgctcaagct ggtgctgaaa gaacctgttt gtcttctaag gctaacgctg 2520
gtagagcttc ttacttgtct tctgaatctt tgttgggtaa catggaccca ggtgctcaaa 2580
gattggctat ggttttcaag gctttggctg aatctgaatt gggttaataa ggtcgagaca 2640
aatcgctctt aaatatatac ctaaagaaca ttaaagctat attataagca aagatacgta 2700
aattttgctt atattattat acacatatca tatttctata tttttaagat ttggttatat 2760
aatgtacgta atgcaaagga aataaatttt atacattatt gaacagcgtc caagtaacta 2820
cattatgtgc actaatagtt tagcgtcgtg aagactttat tgtgtcgcga aaagtaaaaa 2880
ttttaaaaat tagagcacct tgaacttgcg aaaaaggttc tcatcaactg tttaaaacgt 2940
acgaagctta a 2951
<210> 28
<211> 1949
<212> DNA
<213> Artificial
<220>
<223> pRNgldA
<400> 28
actagtaaat gtgtggggaa gcgggtaagc tgccacagca attaatgcac aacatttaac 60
ctacattctt ccttatcgga tcctcaaaac ccttaaaaac atatgcctca ccctaacata 120
ttttccaatt aaccctcaat atttctctgt cacccggcct ctattttcca ttttcttctt 180
tacccgccac gcgttttttt ctttcaaatt tttttcttcc ttcttctttt tcttccacgt 240
cctcttgcat aaataaataa accgttttga aaccaaactc gcctctctct ctcctttttg 300
aaatattttt gggtttgttt gatcctttcc ttcccaatct ctcttgttta atatatattc 360
atttatatca cgctctcttt ttatcttcct ttttttcctc tctcttgtat tcttccttcc 420
cctttctact caaaccaaga agaaaaagaa aaggtcaatc tttgttaaag aataggatct 480
tctactacat cagcttttag atttttcacg cttactgctt ttttcttccc aagatcgaaa 540
atttactgaa ttaactgcag aaaatggaca gaatcatcca atctccaggt aagtacatcc 600
aaggtgctga cgttatcaac agattgggtg aatacttgaa gccattggct gaaagatggt 660
tggttgttgg tgacaagttc gttttgggtt tcgctcaatc taccgttgaa aagtctttca 720
aggacgctgg tttggttgtt gaaatcgctc cattcggtgg tgaatgttct caaaacgaaa 780
tcgacagatt gagaggtatc gctgaaaccg ctcaatgtgg tgctatcttg ggtatcggtg 840
gtggtaagac cttggacacc gctaaggctt tggctcactt catgggtgtt ccagttgcta 900
tcgctccaac catcgcttct accgacgctc catgttctgc tttgtctgtt atctacaccg 960
acgaaggtga attcgacaga tacttgttgt tgccaaacaa cccaaacatg gttatcgttg 1020
acaccaagat cgttgctggt gctccagcta gattgttggc agctggtatc ggtgacgctt 1080
tggctacctg gttcgaagct agagcttgtt ctagatctgg tgctaccacc atggctggtg 1140
gtaagtgtac ccaagctgct ttggctttgg ctgaattgtg ttacaacacc ttgttggaag 1200
aaggtgaaaa ggctatgttg gctgctgaac aacacgttgt taccccagct ttggaaagag 1260
ttatcgaagc taacacctac ttgtctggtg ttggtttcga atctggtggt ttggctgctg 1320
ctcacgctgt tcacaacggt ttgaccgcta tcccagacgc tcaccactac taccacggtg 1380
aaaaggttgc tttcggtacc ttgacccaat tggttttgga aaacgctcca gttgaagaaa 1440
tcgaaaccgt tgctgctttg tctcacgctg ttggtttgcc aatcaccttg gctcaattgg 1500
acatcaagga agacgttcca gctaagatga gaatcgttgc tgaagctgct tgtgctgaag 1560
gtgaaaccat ccacaacatg ccaggtggtg ctaccccaga ccaagtttac gctgctttgt 1620
tggttgctga ccaatacggt caaagattcc tacaagaatg ggaataaggc gcgccccttt 1680
tcctttgtcg atatcatgta attagttatg tcacgcttac attcacgccc tcctcccaca 1740
tccgctctaa ccgaaaagga aggagttaga caacctgaag tctaggtccc tatttatttt 1800
ttttaatagt tatgttagta ttaagaacgt tatttatatt tcaaattttt cttttttttc 1860
tgtacaaacg cgtgtacgca tgtaacatta tactgaaaac cttgcttgag aaggttttgg 1920
gacgctcgaa ggcttcctag gcgtacgtt 1949
<210> 29
<211> 7690
<212> DNA
<213> Artificial
<220>
<223> pRN558
<400> 29
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accataattc cgttttaaga gcttggtgag cgctaggagt cactgccagg tatcgtttga 240
acacggcatt agtcagggaa gtcataacac agtcctttcc cgcaattttc tttttctatt 300
actcttggcc tcctctagta cactctatat ttttttatgc ctcggtaatg attttcattt 360
ttttttttcc acctagcgga tgactctttt tttttcttag cgattggcat tatcacataa 420
tgaattatac attatataaa gtaatgtgat ttcttcgaag aatatactaa aaaatgagca 480
ggcaagataa acgaaggcaa agatgacaga gcagaaagcc ctagtaaagc gtattacaaa 540
tgaaaccaag attcagattg cgatctcttt aaagggtggt cccctagcga tagagcactc 600
gatcttccca gaaaaagagg cagaagcagt agcagaacag gccacacaat cgcaagtgat 660
taacgtccac acaggtatag ggtttctgga ccatatgata catgctctgg ccaagcattc 720
cggctggtcg ctaatcgttg agtgcattgg tgacttacac atagacgacc atcacaccac 780
tgaagactgc gggattgctc tcggtcaagc ttttaaagag gccctactgg cgcgtggagt 840
aaaaaggttt ggatcaggat ttgcgccttt ggatgaggca ctttccagag cggtggtaga 900
tctttcgaac aggccgtacg cagttgtcga acttggtttg caaagggaga aagtaggaga 960
tctctcttgc gagatgatcc cgcattttct tgaaagcttt gcagaggcta gcagaattac 1020
cctccacgtt gattgtctgc gaggcaagaa tgatcatcac cgtagtgaga gtgcgttcaa 1080
ggctcttgcg gttgccataa gagaagccac ctcgcccaat ggtaccaacg atgttccctc 1140
caccaaaggt gttcttatgt agtgacaccg attatttaaa gctgcagcat acgatatata 1200
tacatgtgta tatatgtata cctatgaatg tcagtaagta tgtatacgaa cagtatgata 1260
ctgaagatga caaggtaatg catcattcta tacgtgtcat tctgaacgag gcgcgctttc 1320
cttttttctt tttgcttttt cttttttttt ctcttgaact cgacggatca tatgcggtgt 1380
gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggaaattgta aacgttaata 1440
ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg 1500
aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc 1560
cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa 1620
ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt 1680
cgaggtgccg taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac 1740
ggggaaagcc ggcattgcga ataccgcttc cacaaacatt gctcaaaagt atctctttgc 1800
tatatatctc tgtgctatat ccctatataa cctacccatc cacctttcgc tccttgaact 1860
tgcatctaaa ctcgacctct acatttttta tgtttatctc tagtattact ctttagacaa 1920
aaaaattgta gtaagaacta ttcatagagt gaatcgaaaa caatacgaaa atgtaaacat 1980
ttcctatacg tagtatatag agacaaaata gaagaaaccg ttcataattt tctgaccaat 2040
gaagaatcat caacgctatc actttctgtt cacaaagtat gcgcaatcca catcggtata 2100
gaatataatc ggggatgcct ttatcttgaa aaaatgcacc cgcagcttcg ctagtaatca 2160
gtaaacgcgg gaagtggagt caggcttttt ttatggaaga gaaaatagac accaaagtag 2220
ccttcttcta accttaacgg acctacagtg caaaaagtta tcaagagact gcattataga 2280
gcgcacaaag gagaaaaaaa gtaatctaag atgctttgtt agaaaaatag cgctctcggg 2340
atgcattttt gtagaacaaa aaagaagtat agattctttg ttggtaaaat agcgctctcg 2400
cgttgcattt ctgttctgta aaaatgcagc tcagattctt tgtttgaaaa attagcgctc 2460
tcgtcgcgtt gcatttttgt tttacaaaaa tgaagcacag attcttcgtt ggtaaaatag 2520
cgctttcgcg ttgcatttct gttctgtaaa aatgcagctc agattctttg tttgaaaaat 2580
tagcgctctc gcgttgcatt tttgttctac aaaatgaagc acagatgctt cgttaacaaa 2640
gatatgctat tgaagtgcaa gatggaaacg cagaaaatga accggggatg cgacgtgcaa 2700
gattacctat gcaatagatg caatagtttc tccaggaacc gaaatacata cattgtcttc 2760
cgtaaagcgc tagactatat attattatac aggttcaaat atactatctg tttcagggaa 2820
aactcccagg ttcggatgtt caaaattcaa tgatgggtaa caagtacgat cgtaaatctg 2880
taaaacagtt tgtcggatat taggctgtat ctcctcaaag cgtattcgaa tatcattgag 2940
aagctgcagc gtcacatcgg ataataatga tggcagccat tgtagaagtg ccttttgcat 3000
ttctagtctc tttctcggtc tagctagttt tactacatcg cgaagataga atcttagatc 3060
acactgcctt tgctgagctg gatcaataga gtaacaaaag agtggtaagg cctcgttaaa 3120
ggacaaggac ctgagcggaa gtgtatcgta cagtagacgg agtatctagt atagtctata 3180
gtccgtggaa ttaattctca tctttgacag cttatcatcg ataatccgga gctagcatgc 3240
ggccgccagt gtgatggata tctgcagaat tcgccctttt aagcttcgta cgtgtggaag 3300
aacgattaca acaggtgttg tcctctgagg acataaaata cacaccgaga ttcatcaact 3360
cattgctgga gttagcatat ctacaattgg gtgaaatggg gagcgatttg caggcatttg 3420
ctcggcatgc cggtagaggt gtggtcaata agagcgacct catgctatac ctgagaaagc 3480
aacctgacct acaggaaaga gttactcaag aataagaatt ttcgttttaa aacctaagag 3540
tcactttaaa atttgtatac acttattttt tttataactt atttaataat aaaaatcata 3600
aatcataaga aattcgcgcg cttaagcagc ttcaccagcc tttctagcca aagattgagc 3660
catcttttca gcggtagcca aagcagaaga ggtcataatg tccaagttac cagcgtaagc 3720
tggcaagtag tgagcagcac cttcaacttc caaccaaaca gcggtcttca aaccagagaa 3780
ttgaccaaca cctggcaagt taactggctt gtcttgtggg ataacttcga attgaactct 3840
ttgcttcaat ctgtaacctg gaacgtatgc ttgaacagct tcagccattt cgttgattga 3900
agcttcgatg tcgtcttgag atgcttcgtc agacaaaacg taaacggtgt ctctcatcat 3960
caatggtggt tcagctgggt tcaaaacgat gatagcctta cccttagcag caccaccaac 4020
aacttcgata gccctagagg tggtttcggt gaattcgtcg atgttagctc tggtacctgg 4080
accagcagac ttagaagcga tagaagcgat gatttcagcg tagtgaactc tagcaactct 4140
tgaaacagca gcaaccattg ggatggtagc ttgaccacca caggtaacca tgttaacgtt 4200
taattggtca acgttagctt ccaagttaac aactggaaca cagtatggac cgatagcagc 4260
tggggtcaag tcgatcaatc tgatgtctgg cttagcttct ctcaaagcag cgtcgttctt 4320
aacgtgagca ccagcagagg tagcgtcgaa aacgatgtcg atgtcagcga attctggcat 4380
gttcatcaaa ccgataacac cttcgtgggt ggtagcaaca cccattcttc tagctctagc 4440
caaaccgtca gattgtgggt cgataccaac cataacagcc atttccaagt gttgaccgtg 4500
tcttaggatc ttgatcatca agtcagtacc gatgttacca gaaccgatga tagcaacctt 4560
tctcttagac atctgcagtc tagatatatt tgttgtaaaa agtagataat tacttccttg 4620
atgatctgta aaaaagagaa aaagaaagca tctaagaact tgaaaaacta cgaattagaa 4680
aagaccaaat atgtatttct tgcattgacc aatttatgca agtttatata tatgtaaatg 4740
taagtttcac gaggttctac taaactaaac cacccccttg gttagaagaa aagagtgtgt 4800
gagaacaggc tgttgttgtc acacgattcg gacaattctg tttgaaagag agagagtaac 4860
agtacgatcg aacgaacttt gctctggaga tcacagtggg catcatagca tgtggtacta 4920
aaccctttcc cgccattcca gaaccttcga ttgcttgtta caaaacctgt gagccgtcgc 4980
taggaccttg ttgtgtgacg aaattggaag ctgcaatcaa taggaagaca ggaagtcgag 5040
cgtgtctggg ttttttcagt tttgttcttt ttgcaaacaa atcacgagcg acggtaattt 5100
ctttctcgat aagaggccac gtgctttatg agggtaacat caattcaaga aggagggaaa 5160
cacttccttt ttctggccct gataatagta tgagggtgaa gccaaaataa aggattcgcg 5220
cccaaatcgg catctttaaa tgcaggtatg cgatagttcc tcactctttc cttactcacg 5280
agtaattctt gcaaatgcct attatgcaga tgttataata tctgtgcgtc ttgagttgaa 5340
gagctcgaga ctagtggatc ccccgggctg caggaattcg atatcaagct tatcgatacc 5400
gtcgacctcg agggggggcc cggtacccag cttttgttcc ctttagtgag ggttaattcc 5460
gagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 5520
tccacacaac ataggagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 5580
gtaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 5640
ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 5700
ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 5760
agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 5820
catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 5880
tttccatagg ctcggccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 5940
gcgaaacccg acaggactat aaagatacca ggcgttcccc cctggaagct ccctcgtgcg 6000
ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 6060
cgtggcgctt tctcaatgct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 6120
caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 6180
ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 6240
taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 6300
taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac 6360
cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 6420
tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 6480
gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 6540
catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 6600
atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga 6660
ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac tgcccgtcgt 6720
gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg 6780
agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga 6840
gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga 6900
agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg 6960
catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc 7020
aaggcgagtt acatgatccc ccatgttgtg aaaaaaagcg gttagctcct tcggtcctcc 7080
gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca 7140
taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac 7200
caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg 7260
ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc 7320
ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg 7380
tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac 7440
aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat 7500
actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata 7560
catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa 7620
agtgccacct gacgtcttat tatcatgaca ttaacctata aaaataggcg tatcacgagg 7680
ccctttcgtc 7690
<210> 30
<211> 9416
<212> DNA
<213> Artificial
<220>
<223> pRN595
<400> 30
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataagacgtc 60
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 120
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 180
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 240
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 300
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 360
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 420
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 480
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 540
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 600
gacaacgatc ggaggaccga aggagctaac cgcttttttt cacaacatgg gggatcatgt 660
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 720
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 780
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 840
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 900
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 960
agttatctac acgacgggca gtcaggcaac tatggatgaa cgaaatagac agatcgctga 1020
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 1080
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 1140
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 1200
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 1260
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 1320
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta 1380
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 1440
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 1500
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 1560
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agcattgaga 1620
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 1680
aacaggagag cgcacgaggg agcttccagg ggggaacgcc tggtatcttt atagtcctgt 1740
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggccgag 1800
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 1860
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 1920
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 1980
ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 2040
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 2100
tgtgagttac ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcctat 2160
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2220
cgccaagctc ggaattaacc ctcactaaag ggaacaaaag ctgggtaccg ggccccccct 2280
cgaggtcgac ggtatcgata agcttgatat cgaattcctg cagcccgggg gatccactag 2340
tctcgagctc ttcaactcaa gacgcacaga tattataaca tctgcataat aggcatttgc 2400
aagaattact cgtgagtaag gaaagagtga ggaactatcg catacctgca tttaaagatg 2460
ccgatttggg cgcgaatcct ttattttggc ttcaccctca tactattatc agggccagaa 2520
aaaggaagtg tttccctcct tcttgaattg atgttaccct cataaagcac gtggcctctt 2580
atcgagaaag aaattaccgt cgctcgtgat ttgtttgcaa aaagaacaaa actgaaaaaa 2640
cccagacacg ctcgacttcc tgtcttccta ttgattgcag cttccaattt cgtcacacaa 2700
caaggtccta gcgacggctc acaggttttg taacaagcaa tcgaaggttc tggaatggcg 2760
ggaaagggtt tagtaccaca tgctatgatg cccactgtga tctccagagc aaagttcgtt 2820
cgatcgtact gttactctct ctctttcaaa cagaattgtc cgaatcgtgt gacaacaaca 2880
gcctgttctc acacactctt ttcttctaac caagggggtg gtttagttta gtagaacctc 2940
gtgaaactta catttacata tatataaact tgcataaatt ggtcaatgca agaaatacat 3000
atttggtctt ttctaattcg tagtttttca agttcttaga tgctttcttt ttctcttttt 3060
tacagatcat caaggaagta attatctact ttttacaaca aatatatcta gaaaatggct 3120
gttaccaacg ttgctgaatt gaacgctttg gttgaaaggg ttaagaaggc tcaaagagaa 3180
tacgcttctt tcacccaaga acaagttgac aagatcttca gagctgctgc tttggctgct 3240
gctgacgcta gaatcccatt ggctaagatg gctgttgctg aatctggtat gggtatcgtt 3300
gaagacaagg ttatcaagaa ccacttcgct tctgaataca tctacaacgc ttacaaggac 3360
gaaaagacct gtggtgtttt gtcagaagac gacaccttcg gtaccatcac catcgctgaa 3420
ccaatcggta tcatctgtgg tatcgttcca accaccaacc caacctctac cgctatcttc 3480
aagtctttga tctctttgaa gaccagaaac gctatcatct tctctccaca cccaagagct 3540
aaagacgcta ccaacaaggc tgctgacatc gttttgcaag ctgctatcgc tgctggtgct 3600
ccaaaggact tgatcggttg gatcgaccaa ccatctgttg aattgtctaa cgctttgatg 3660
caccacccag acatcaactt gatcttggct accggtggtc caggtatggt taaggctgct 3720
tactcttctg gtaagccagc tatcggtgtt ggtgctggta acaccccagt tgttatcgac 3780
gaaaccgctg acatcaagag agctgttgct tctgttttga tgtctaagac cttcgacaac 3840
ggtgttatct gtgcttctga acaatctgtt gttgttgttg actctgttta cgacgctgtt 3900
agagaaagat tcgctaccca cggtggttac ttgttgcaag gtaaggaatt gaaggctgtt 3960
caagacgtta tcttgaagaa cggtgctttg aacgctgcta tcgttggtca accagcttac 4020
aagatcgctg aattagctgg tttctctgtt ccagaaaaca ccaagatctt gatcggtgaa 4080
gttaccgttg ttgacgaatc tgaaccattc gctcacgaaa agttgtctcc aaccttggct 4140
atgtacagag ctaaggactt cgaagacgct gttgaaaaag ctgaaaagtt ggttgctatg 4200
ggtggtattg gtcacacctc ttgtttgtac accgaccaag acaaccaacc agctagagtt 4260
tcttacttcg gtcaaaagat gaagaccgct agaatcttga tcaacacccc agcttctcaa 4320
ggtggtatcg gtgacttgta caacttcaag ttggctccat ctttgacctt gggttgtggt 4380
tcttggggtg gtaactctat ctctgaaaac gttggtccaa agcacttgat caacaagaag 4440
accgttgcta agagagctga aaacatgttg tggcacaagt tgccaaaatc tatctacttc 4500
agaagaggtt ctttgccaat cgctttggac gaagttatca ccgacggtca caagagagct 4560
ttgatcgtta ccgacagatt cttgttcaac aacggttacg ctgaccaaat cacctctgtt 4620
ttgaaggctg ctggtgttga aaccgaagtt ttcttcgaag ttgaagctga cccaaccttg 4680
tctatcgtta gaaagggtgc tgaattggct aactctttca agccagacgt tatcatcgct 4740
ttgggtggtg gttctccaat ggacgctgct aagatcatgt gggttatgta cgaacaccca 4800
gaaacccact tcgaagaatt ggctttgaga ttcatggaca tcagaaagag aatctacaag 4860
ttcccaaaga tgggtgttaa ggctaagatg atcgctgtta ccaccacctc tggtaccggt 4920
tctgaagtta ccccattcgc tgttgttacc gacgacgcta ccggtcaaaa gtacccattg 4980
gctgactacg ctttgacccc agacatggct atcgttgacg ctaacttggt tatggacatg 5040
ccaaagtctt tgtgtgcttt cggtggtttg gacgctgtta cccacgctat ggaagcttac 5100
gtttctgttt tggcttctga attctctgac ggtcaagctt tgcaagcttt gaagttgttg 5160
aaggaatact tgccagcttc ttaccacgaa ggttctaaga acccagttgc tagagaaaga 5220
gttcactctg ctgctaccat cgctggtatc gctttcgcta acgctttctt gggtgtttgt 5280
cactctatgg ctcacaagtt gggttctcaa ttccacatcc cacacggttt ggctaacgct 5340
ttgttgatct gtaacgttat cagatacaac gctaacgaca acccaaccaa gcaaaccgct 5400
ttctctcaat acgacagacc acaagctaga agaagatacg ctgaaatcgc tgaccacttg 5460
ggtttgtctg ctccaggtga cagaaccgct gcaaagatcg aaaagttgtt ggcttggttg 5520
gaaaccttga aggctgaatt gggtatccca aagtctatca gagaagctgg tgttcaagaa 5580
gctgacttct tggctaacgt tgacaagttg tctgaagacg ctttcgacga ccaatgtacc 5640
ggtgctaacc caagataccc attgatctct gaattgaagc aaatcttgtt ggacacctac 5700
tacggtagag actacgttga aggtgaaacc gctgctaaga aggaagctgc tccagctaag 5760
gctgaaaaga aggctaagaa gtctgcttag cttaagcgcg cgaatttctt atgatttatg 5820
atttttatta ttaaataagt tataaaaaaa ataagtgtat acaaatttta aagtgactct 5880
taggttttaa aacgaaaatt cttattcttg agtaactctt tcctgtaggt caggttgctt 5940
tctcaggtat agcatgaggt cgctcttatt gaccacacct ctaccggcat gccgagcaaa 6000
tgcctgcaaa tcgctcccca tttcacccaa ttgtagatat gctaactcca gcaatgagtt 6060
gatgaatctc ggtgtgtatt ttatgtcctc agaggacaac acctgttgta atcgttcttc 6120
cacacgtacg aagcttaaaa gggcgaattc tgcagatatc catcacactg gcggccgcat 6180
gctagctccg gattatcgat gataagctgt caaagatgag aattaattcc acggactata 6240
gactatacta gatactccgt ctactgtacg atacacttcc gctcaggtcc ttgtccttta 6300
acgaggcctt accactcttt tgttactcta ttgatccagc tcagcaaagg cagtgtgatc 6360
taagattcta tcttcgcgat gtagtaaaac tagctagacc gagaaagaga ctagaaatgc 6420
aaaaggcact tctacaatgg ctgccatcat tattatccga tgtgacgctg cagcttctca 6480
atgatattcg aatacgcttt gaggagatac agcctaatat ccgacaaact gttttacaga 6540
tttacgatcg tacttgttac ccatcattga attttgaaca tccgaacctg ggagttttcc 6600
ctgaaacaga tagtatattt gaacctgtat aataatatat agtctagcgc tttacggaag 6660
acaatgtatg tatttcggtt cctggagaaa ctattgcatc tattgcatag gtaatcttgc 6720
acgtcgcatc cccggttcat tttctgcgtt tccatcttgc acttcaatag catatctttg 6780
ttaacgaagc atctgtgctt cattttgtag aacaaaaatg caacgcgaga gcgctaattt 6840
ttcaaacaaa gaatctgagc tgcattttta cagaacagaa atgcaacgcg aaagcgctat 6900
tttaccaacg aagaatctgt gcttcatttt tgtaaaacaa aaatgcaacg cgacgagagc 6960
gctaattttt caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgag 7020
agcgctattt taccaacaaa gaatctatac ttcttttttg ttctacaaaa atgcatcccg 7080
agagcgctat ttttctaaca aagcatctta gattactttt tttctccttt gtgcgctcta 7140
taatgcagtc tcttgataac tttttgcact gtaggtccgt taaggttaga agaaggctac 7200
tttggtgtct attttctctt ccataaaaaa agcctgactc cacttcccgc gtttactgat 7260
tactagcgaa gctgcgggtg cattttttca agataaaggc atccccgatt atattctata 7320
ccgatgtgga ttgcgcatac tttgtgaaca gaaagtgata gcgttgatga ttcttcattg 7380
gtcagaaaat tatgaacggt ttcttctatt ttgtctctat atactacgta taggaaatgt 7440
ttacattttc gtattgtttt cgattcactc tatgaatagt tcttactaca atttttttgt 7500
ctaaagagta atactagaga taaacataaa aaatgtagag gtcgagttta gatgcaagtt 7560
caaggagcga aaggtggatg ggtaggttat atagggatat agcacagaga tatatagcaa 7620
agagatactt ttgagcaatg tttgtggaag cggtattcgc aatgccggct ttccccgtca 7680
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 7740
caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 7800
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 7860
aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 7920
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 7980
aacgtttaca atttcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac 8040
cgcatatgat ccgtcgagtt caagagaaaa aaaaagaaaa agcaaaaaga aaaaaggaaa 8100
gcgcgcctcg ttcagaatga cacgtataga atgatgcatt accttgtcat cttcagtatc 8160
atactgttcg tatacatact tactgacatt cataggtata catatataca catgtatata 8220
tatcgtatgc tgcagcttta aataatcggt gtcactacat aagaacacct ttggtggagg 8280
gaacatcgtt ggtaccattg ggcgaggtgg cttctcttat ggcaaccgca agagccttga 8340
acgcactctc actacggtga tgatcattct tgcctcgcag acaatcaacg tggagggtaa 8400
ttctgctagc ctctgcaaag ctttcaagaa aatgcgggat catctcgcaa gagagatctc 8460
ctactttctc cctttgcaaa ccaagttcga caactgcgta cggcctgttc gaaagatcta 8520
ccaccgctct ggaaagtgcc tcatccaaag gcgcaaatcc tgatccaaac ctttttactc 8580
cacgcgccag tagggcctct ttaaaagctt gaccgagagc aatcccgcag tcttcagtgg 8640
tgtgatggtc gtctatgtgt aagtcaccaa tgcactcaac gattagcgac cagccggaat 8700
gcttggccag agcatgtatc atatggtcca gaaaccctat acctgtgtgg acgttaatca 8760
cttgcgattg tgtggcctgt tctgctactg cttctgcctc tttttctggg aagatcgagt 8820
gctctatcgc taggggacca ccctttaaag agatcgcaat ctgaatcttg gtttcatttg 8880
taatacgctt tactagggct ttctgctctg tcatctttgc cttcgtttat cttgcctgct 8940
cattttttag tatattcttc gaagaaatca cattacttta tataatgtat aattcattat 9000
gtgataatgc caatcgctaa gaaaaaaaaa gagtcatccg ctaggtggaa aaaaaaaaat 9060
gaaaatcatt accgaggcat aaaaaaatat agagtgtact agaggaggcc aagagtaata 9120
gaaaaagaaa attgcgggaa aggactgtgt tatgacttcc ctgactaatg ccgtgttcaa 9180
acgatacctg gcagtgactc ctagcgctca ccaagctctt aaaacggaat tatggtgcac 9240
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 9300
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 9360
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcga 9416
<210> 31
<211> 9352
<212> DNA
<213> Artificial
<220>
<223> pRN596
<400> 31
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataagacgtc 60
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 120
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 180
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 240
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 300
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 360
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 420
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 480
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 540
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 600
gacaacgatc ggaggaccga aggagctaac cgcttttttt cacaacatgg gggatcatgt 660
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 720
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 780
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 840
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 900
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 960
agttatctac acgacgggca gtcaggcaac tatggatgaa cgaaatagac agatcgctga 1020
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 1080
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 1140
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 1200
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 1260
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 1320
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta 1380
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 1440
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 1500
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 1560
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agcattgaga 1620
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 1680
aacaggagag cgcacgaggg agcttccagg ggggaacgcc tggtatcttt atagtcctgt 1740
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggccgag 1800
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 1860
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 1920
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 1980
ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 2040
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 2100
tgtgagttac ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcctat 2160
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2220
cgccaagctc ggaattaacc ctcactaaag ggaacaaaag ctgggtaccg ggccccccct 2280
cgaggtcgac ggtatcgata agcttgatat cgaattcctg cagcccgggg gatccactag 2340
tctcgagctc ttcaactcaa gacgcacaga tattataaca tctgcataat aggcatttgc 2400
aagaattact cgtgagtaag gaaagagtga ggaactatcg catacctgca tttaaagatg 2460
ccgatttggg cgcgaatcct ttattttggc ttcaccctca tactattatc agggccagaa 2520
aaaggaagtg tttccctcct tcttgaattg atgttaccct cataaagcac gtggcctctt 2580
atcgagaaag aaattaccgt cgctcgtgat ttgtttgcaa aaagaacaaa actgaaaaaa 2640
cccagacacg ctcgacttcc tgtcttccta ttgattgcag cttccaattt cgtcacacaa 2700
caaggtccta gcgacggctc acaggttttg taacaagcaa tcgaaggttc tggaatggcg 2760
ggaaagggtt tagtaccaca tgctatgatg cccactgtga tctccagagc aaagttcgtt 2820
cgatcgtact gttactctct ctctttcaaa cagaattgtc cgaatcgtgt gacaacaaca 2880
gcctgttctc acacactctt ttcttctaac caagggggtg gtttagttta gtagaacctc 2940
gtgaaactta catttacata tatataaact tgcataaatt ggtcaatgca agaaatacat 3000
atttggtctt ttctaattcg tagtttttca agttcttaga tgctttcttt ttctcttttt 3060
tacagatcat caaggaagta attatctact ttttacaaca aatatatcta gaaaatgtct 3120
acccaacaaa ccatgaccgt tgacgaacac atcaaccaat tagttagaaa ggctcaagtt 3180
gctttgaagg aatacttgaa gccagaatac acccaagaaa agatcgacta catcgttaag 3240
aaggcttctg ttgctgcttt ggaccaacac tgtgctttgg ctgctgctgc tgttgaagaa 3300
accggtagag gtatcttcga agacaaggct accaagaaca tcttcgcttg tgaacacgtt 3360
acccacgaaa tgagacacgc taagaccgtt ggtatcatca acgttgaccc attgtacggt 3420
atcaccgaaa tcgctgaacc agttggtgtt gtttgtggtg ttaccccagt taccaaccca 3480
acctctaccg ctatcttcaa gtctttgatc tctatcaaga ccagaaaccc aatcgttttc 3540
tctttccacc catctgcttt gaagtgttct attatggctg ctaaaatcgt tagagacgct 3600
gctatcgctg ctggtgctcc agaaaactgt atccaatgga tcgaattcgg tggtatcgaa 3660
gcttctaaca agttgatgaa ccacccaggt gttgctacta tcttggctac cggtggtaac 3720
gctatggtta aggctgcata ctcttctggt aagccagctt tgggtgttgg tgctggtaac 3780
gttccaacct acatcgaaaa gacctgtaac atcaagcaag ctgctaacga cgttgttatg 3840
tctaagtctt tcgacaacgg tatgatctgt gcttctgaac aagctgctat catcgacaag 3900
gaaatctacg accaagttgt tgaagaaatg aagaccttgg gtgcttactt catcaacgaa 3960
gaagaaaagg ctaagttgga aaagttcatg ttcggtgtta acgcttactc tgctgacgtt 4020
aacaacgcta gattgaaccc aaagtgtcca ggtatgtctc cacaatggtt cgctgaacaa 4080
gttggtatca aggtaccaga agactgtaac atcatctgtg ctgtttgtaa ggaagttggt 4140
ccaaacgaac cattgaccag agaaaagttg tctccagttt tggctatctt gaaagctgaa 4200
aacacccaag acggtatcga caaggctgaa gctatggttg aatttaacgg tagaggtcac 4260
tctgctgcta tccactctaa cgacaaggct gttgttgaaa agtacgcttt gaccatgaag 4320
gcttgtagaa tcttgcacaa caccccatct tctcaaggtg gtatcggttc tatctacaac 4380
tacatctggc catctttcac cttgggttgt ggttcttacg gtggtaactc tgtttctgct 4440
aacgttacct accacaactt gttgaacatc aagagattgg ctgacagaag aaacaacttg 4500
caatggttca gagttccacc aaagatcttc ttcgaaccac actctatcag atacttggct 4560
gaattgaagg aattgtctaa gatcttcatc gtttctgaca gaatgatgta caagttgggt 4620
tacgttgaca gagttatgga cgttttgaag agaagatcta acgaagttga aatcgaaatc 4680
ttcatcgacg ttgaaccaga cccatctatc caaaccgttc aaaagggttt ggctgttatg 4740
aacaccttcg gtccagacaa catcatcgct atcggtggtg gttctgctat ggacgctgct 4800
aagatcatgt ggttgttgta cgaacaccca gaagctgact tcttcgctat gaagcaaaag 4860
ttcatcgact tgagaaagag agctttcaag ttcccaacca tgggtaagaa ggctagattg 4920
atctgtatcc caaccacctc tggtaccggt tctgaagtta ccccattcgc tgttatctct 4980
gaccacgaaa ccggtaagaa gtacccattg gctgactact ctttgacccc atctgttgct 5040
atcgttgacc caatgttcac catgtctttg ccaaagagag ctatcgctga caccggtttg 5100
gacgttttgg ttcacgctac cgaagcttac gtttctgtta tggctaacga atacaccgac 5160
ggtttggcta gagaagctgt taagttggtt tttgaaaact tgttgaagtc ttacaacggt 5220
gacttggaag ctagagaaaa gatgcacaac gctgctacca tcgctggtat ggctttcgct 5280
tctgctttct tgggtatgga ccactctatg gctcacaagg ttggtgctgc tttccacttg 5340
ccacacggta gatgtgttgc tgttttgttg ccacacgtta tcagatacaa cggtcaaaag 5400
ccaagaaagt tggctatgtg gccaaagtac aacttctaca aggctgacca aagatacatg 5460
gaattggctc aaatggttgg tttgaagtgt aacaccccag ctgaaggtgt tgaagctttc 5520
gctaaggctt gtgaagaatt gatgaaggct accgaaacca tcaccggttt caagaaggct 5580
aacatcgacg aagctgcttg gatgtctaag gttccagaaa tggctttgtt ggctttcgaa 5640
gaccaatgtt ctccagctaa cccaagagtt ccaatggtta aggacatgga aaagatcttg 5700
aaggctgctt actacccaat cgcttagctt aagcgcgcga atttcttatg atttatgatt 5760
tttattatta aataagttat aaaaaaaata agtgtataca aattttaaag tgactcttag 5820
gttttaaaac gaaaattctt attcttgagt aactctttcc tgtaggtcag gttgctttct 5880
caggtatagc atgaggtcgc tcttattgac cacacctcta ccggcatgcc gagcaaatgc 5940
ctgcaaatcg ctccccattt cacccaattg tagatatgct aactccagca atgagttgat 6000
gaatctcggt gtgtatttta tgtcctcaga ggacaacacc tgttgtaatc gttcttccac 6060
acgtacgaag ctaaaagggc gaattctgca gatatccatc acactggcgg ccgcatgcta 6120
gctccggatt atcgatgata agctgtcaaa gatgagaatt aattccacgg actatagact 6180
atactagata ctccgtctac tgtacgatac acttccgctc aggtccttgt cctttaacga 6240
ggccttacca ctcttttgtt actctattga tccagctcag caaaggcagt gtgatctaag 6300
attctatctt cgcgatgtag taaaactagc tagaccgaga aagagactag aaatgcaaaa 6360
ggcacttcta caatggctgc catcattatt atccgatgtg acgctgcagc ttctcaatga 6420
tattcgaata cgctttgagg agatacagcc taatatccga caaactgttt tacagattta 6480
cgatcgtact tgttacccat cattgaattt tgaacatccg aacctgggag ttttccctga 6540
aacagatagt atatttgaac ctgtataata atatatagtc tagcgcttta cggaagacaa 6600
tgtatgtatt tcggttcctg gagaaactat tgcatctatt gcataggtaa tcttgcacgt 6660
cgcatccccg gttcattttc tgcgtttcca tcttgcactt caatagcata tctttgttaa 6720
cgaagcatct gtgcttcatt ttgtagaaca aaaatgcaac gcgagagcgc taatttttca 6780
aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgaaag cgctatttta 6840
ccaacgaaga atctgtgctt catttttgta aaacaaaaat gcaacgcgac gagagcgcta 6900
atttttcaaa caaagaatct gagctgcatt tttacagaac agaaatgcaa cgcgagagcg 6960
ctattttacc aacaaagaat ctatacttct tttttgttct acaaaaatgc atcccgagag 7020
cgctattttt ctaacaaagc atcttagatt actttttttc tcctttgtgc gctctataat 7080
gcagtctctt gataactttt tgcactgtag gtccgttaag gttagaagaa ggctactttg 7140
gtgtctattt tctcttccat aaaaaaagcc tgactccact tcccgcgttt actgattact 7200
agcgaagctg cgggtgcatt ttttcaagat aaaggcatcc ccgattatat tctataccga 7260
tgtggattgc gcatactttg tgaacagaaa gtgatagcgt tgatgattct tcattggtca 7320
gaaaattatg aacggtttct tctattttgt ctctatatac tacgtatagg aaatgtttac 7380
attttcgtat tgttttcgat tcactctatg aatagttctt actacaattt ttttgtctaa 7440
agagtaatac tagagataaa cataaaaaat gtagaggtcg agtttagatg caagttcaag 7500
gagcgaaagg tggatgggta ggttatatag ggatatagca cagagatata tagcaaagag 7560
atacttttga gcaatgtttg tggaagcggt attcgcaatg ccggctttcc ccgtcaagct 7620
ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 7680
aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 7740
cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 7800
ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat 7860
tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg 7920
tttacaattt cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca 7980
tatgatccgt cgagttcaag agaaaaaaaa agaaaaagca aaaagaaaaa aggaaagcgc 8040
gcctcgttca gaatgacacg tatagaatga tgcattacct tgtcatcttc agtatcatac 8100
tgttcgtata catacttact gacattcata ggtatacata tatacacatg tatatatatc 8160
gtatgctgca gctttaaata atcggtgtca ctacataaga acacctttgg tggagggaac 8220
atcgttggta ccattgggcg aggtggcttc tcttatggca accgcaagag ccttgaacgc 8280
actctcacta cggtgatgat cattcttgcc tcgcagacaa tcaacgtgga gggtaattct 8340
gctagcctct gcaaagcttt caagaaaatg cgggatcatc tcgcaagaga gatctcctac 8400
tttctccctt tgcaaaccaa gttcgacaac tgcgtacggc ctgttcgaaa gatctaccac 8460
cgctctggaa agtgcctcat ccaaaggcgc aaatcctgat ccaaaccttt ttactccacg 8520
cgccagtagg gcctctttaa aagcttgacc gagagcaatc ccgcagtctt cagtggtgtg 8580
atggtcgtct atgtgtaagt caccaatgca ctcaacgatt agcgaccagc cggaatgctt 8640
ggccagagca tgtatcatat ggtccagaaa ccctatacct gtgtggacgt taatcacttg 8700
cgattgtgtg gcctgttctg ctactgcttc tgcctctttt tctgggaaga tcgagtgctc 8760
tatcgctagg ggaccaccct ttaaagagat cgcaatctga atcttggttt catttgtaat 8820
acgctttact agggctttct gctctgtcat ctttgccttc gtttatcttg cctgctcatt 8880
ttttagtata ttcttcgaag aaatcacatt actttatata atgtataatt cattatgtga 8940
taatgccaat cgctaagaaa aaaaaagagt catccgctag gtggaaaaaa aaaaatgaaa 9000
atcattaccg aggcataaaa aaatatagag tgtactagag gaggccaaga gtaatagaaa 9060
aagaaaattg cgggaaagga ctgtgttatg acttccctga ctaatgccgt gttcaaacga 9120
tacctggcag tgactcctag cgctcaccaa gctcttaaaa cggaattatg gtgcactctc 9180
agtacaatct gctctgatgc cgcatagtta agccagcccc gacacccgcc aacacccgct 9240
gacgcgccct gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc 9300
tccgggagct gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc ga 9352
<210> 32
<211> 29
<212> DNA
<213> Artificial
<220>
<223> Primer GPD2uf
<400> 32
ggtaccagat cttttgcggc gaggtgccg 29
<210> 33
<211> 42
<212> DNA
<213> Artificial
<220>
<223> Primer GPD2ur
<400> 33
tctagactta aggaatgtgt atcttgttaa tcttctgaca gc 42
<210> 34
<211> 28
<212> DNA
<213> Artificial
<220>
<223> Primer GPD2df
<400> 34
ctcgagatag tctacaacaa cgtccgca 28
<210> 35
<211> 39
<212> DNA
<213> Artificial
<220>
<223> Primer GPD2dr
<400> 35
ccatggagat ctgcagtgaa aaagctcgaa gaaacagct 39
<210> 36
<211> 4397
<212> DNA
<213> Artificial
<220>
<223> pRN594
<400> 36
gacgacggcg acctggcggg cttcgtggtc gtctcgtact ccggctggaa ccgccggctg 60
accgtcgagg acatcgaggt cgccccggag caccgggggc acggggtcgg gcgcgcgttg 120
atggggctcg cgacggagtt cgcccgcgag cggggcgccg ggcacctctg gctggaggtc 180
accaacgtca acgcaccggc gatccacgcg taccggcgga tggggttcac cctctgcggc 240
ctggacaccg ccctgtacga cggcaccgcc tcggacggcg agcaggcgct ctacatgagc 300
atgccctgcc cctagtactg acaataaaaa gattcttgtt ttcaagaact tgtcatttgt 360
atagtttttt tatattgtag ttgttctatt ttaatcaaat gttagcgtga tttatatttt 420
ttttcgcctc gacatcatct gcccagatgc gaagttaagt gcgcagaaag taatatcatg 480
cgtcaatcgt atgtgaatgc tggtcgctat actgctgtcg attcgatact aacgccgcca 540
tccagtgtcg acggatccta ggtgtacagg gcccaaaagg gcgaattctg cagatatcca 600
tcacactggc ggccgctcga gatagtctac aacaacgtcc gcatggaaga cctaccggag 660
atgattgaag agctagacat cgatgacgaa tagacactct ccccccccct ccccctctga 720
tctttcctgt tgcctctttt tcccccaacc aatttatcat tatacacaag ttctacaact 780
actactagta acattactac agttattata attttctatt ctctttttct ttaagaatct 840
atcattaacg ttaatttcta tatatacata actaccatta tacacgctat tatcgtttac 900
atatcacatc accgttaatg aaagatacga caccctgtac actaacacaa ttaaataatc 960
gccataacct tttctgttat ctatagccct taaagctgtt tcttcgagct ttttcactgc 1020
agatctccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg 1080
attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag cgttggctac 1140
ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg tgctttacgg 1200
tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg agttcttctg 1260
aattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 1320
gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 1380
gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 1440
cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 1500
tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac 1560
tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 1620
atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 1680
ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 1740
gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 1800
gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 1860
gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 1920
gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 1980
gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 2040
cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 2100
atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 2160
tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 2220
ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 2280
gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 2340
tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 2400
ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgttctt 2460
ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 2520
gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 2580
ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 2640
tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 2700
ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 2760
agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 2820
agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 2880
gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 2940
tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 3000
accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 3060
gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg 3120
attcattaat gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac 3180
gcaattaatg tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg 3240
gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac 3300
catgattacg ccaagctatt taggtgacac tatagaatac tcaagctatg catcaagctt 3360
ggtaccagat cttttgcggc gaggtgccga tgggttgctg aggggaagag tgtttagctt 3420
acggacctat tgccattgtt attccgatta atctattgtt cagcagctct tctctaccct 3480
gtcattctag tatttttttt tttttttttt ggttttactt ttttttcttc ttgccttttt 3540
ttcttgttac tttttttcta gttttttttc cttccactaa gctttttcct tgatttatcc 3600
ttgggttctt ctttctactc ctttagattt tttttttata tattaatttt taagtttatg 3660
tattttggta gattcaattc tctttccctt tccttttcct tcgctcccct tccttatcaa 3720
tgcttgctgt cagaagatta acaagataca cattccttaa ggcctcgtcc ccgccgggtc 3780
acccggccag cgacatggag gcccagaata ccctccttga cagtcttgac gtgcgcagct 3840
caggggcatg atgtgactgt cgcccgtaca tttagcccat acatccccat gtataatcat 3900
ttgcatccat acattttgat ggccgcacgg cgcgaagcaa aaattacggc tcctcgctgc 3960
agacctgcga gcagggaaac gctcccctca cagacgcgtt gaattgtccc cacgccgcgc 4020
ccctgtagag aaatataaaa ggttaggatt tgccactgag gttcttcttt catatacttc 4080
cttttaaaat cttgctagga tacagttctc acatcacatc cgaacataaa caaccatgta 4140
aaatgaccac tcttgacgac acggcttacc ggtaccgcac cagtgtcccg ggggacgccg 4200
aggccatcga ggcactggat gggtccttca ccaccgacac cgtcttccgc gtcaccgcca 4260
ccggggacgg cttcaccctg cgggaggtgc cggtggaccc gcccctgacc aaggtgttcc 4320
ccgacgacga atcggacgac gaatcggacg ccggggagga cggcgacccg gactcccgga 4380
cgttcgtcgc gtacggg 4397
<210> 37
<211> 14200
<212> DNA
<213> Artificial
<220>
<223> pRN957
<400> 37
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataagacgtc 60
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 120
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 180
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 240
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 300
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 360
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 420
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 480
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 540
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 600
gacaacgatc ggaggaccga aggagctaac cgcttttttt cacaacatgg gggatcatgt 660
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 720
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 780
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 840
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 900
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 960
agttatctac acgacgggca gtcaggcaac tatggatgaa cgaaatagac agatcgctga 1020
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 1080
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 1140
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 1200
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 1260
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 1320
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta 1380
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 1440
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 1500
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 1560
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agcattgaga 1620
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 1680
aacaggagag cgcacgaggg agcttccagg ggggaacgcc tggtatcttt atagtcctgt 1740
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggccgag 1800
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 1860
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 1920
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 1980
ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 2040
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 2100
tgtgagttac ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcctat 2160
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2220
cgccaagctc ggaattaacc ctcactaaag ggaacaaaag ctgggtaccg ggccccccct 2280
cgaggtcgag cttaagacgc gtttcttctt cagattccct catggagaaa gtgcggcaga 2340
tgtatatgac agagtcgcca gtttccaaga gactttattc aggcacttcc atgataggca 2400
agagagaaga cccagagatg ttgttgtcct agttacacat ggtatttatt ccagagtatt 2460
cctgatgaaa tggtttagat ggacatacga agagtttgaa tcgtttacca atgttcctaa 2520
cgggagcgta atggtgatgg aactggacga atccatcaat agatacgtcc tgaggaccgt 2580
gctacccaaa tggactgatt gtgagggaga cctaactaca tagtgtttaa agattacgga 2640
tatttaactt acttagaata atgccatttt tttgagttat aataatccta cgttagtgtg 2700
agcgggattt aaactgtgag gaccttaata cattcagaca cttctgcggt atcaccctac 2760
ttattccctt cgagattata tctaggaacc catcaggttg gtggaagatt acccgttcta 2820
agacttttca gcttcctcta ttgatgttac acctggacac cccttttctg gcatccagtt 2880
tttaatcttc agtggcatgt gagattctcc gaaattaatt aaagcaatca cacaattctc 2940
tcggatacca cctcggttga aactgacagg tggtttgtta cgcatgctaa tgcaaaggag 3000
cctatatacc tttggctcgg ctgctgtaac agggaatata aagggcagca taatttagga 3060
gtttagtgaa cttgcaacat ttactatttt cccttcttac gtaaatattt ttctttttaa 3120
ttctaaatca atctttttca attttttgtt tgtattcttt tcttgcttaa atctataact 3180
acaaaaaaca catacataaa tctagaaaaa tgtctcaatt cttcttcaac cagagaaccc 3240
acttggtttc tgacgttatc gacggtgcta tcatcgcttc accatggaac aatttggcta 3300
gattggaatc tgacccagct atcagaatcg ttgttagaag agacttgaac aagaacaacg 3360
ttgctgttat ctctggtggt ggttctggtc acgaaccagc tcacgttggt ttcatcggta 3420
agggtatgtt gaccgctgct gtttgtggtg acgttttcgc ttctccatct gttgacgctg 3480
ttttgactgc tatccaagct gttaccggtg aagctggttg tttgttgatc gttaagaact 3540
acaccggtga cagattgaac ttcggtttgg ctgctgaaaa ggctagaaga ttgggttaca 3600
acgttgaaat gttgatcgtt ggtgacgaca tctctttgcc agacaacaag cacccaagag 3660
gtatcgctgg taccatcttg gttcacaaga tcgctggtta cttcgctgaa agaggttaca 3720
acttagctac cgttttgaga gaagctcaat acgctgcttc taacaccttc tctttgggtg 3780
ttgctttgtc ttcttgtcac ttgccacaag aaaccgacgc tgctccaaga caccacccag 3840
gtcacgctga attgggtatg ggtatccacg gtgaaccagg tgcttctgtt atcgacaccc 3900
aaaactctgc tcaagttgtt aacttgatgg ttgacaagtt gttggctgct ttgccagaaa 3960
ccggtagatt ggctgttatg atcaacaact tgggtggtgt ttctgttgct gaaatggcta 4020
tcatcaccag agaattggct tcttctccat tgcactcaag aatcgactgg ttgatcggtc 4080
cagcttcttt ggtaaccgct ttggacatga agggtttctc tttgaccgct atcgttttgg 4140
aagaatctat cgaaaaggct ttgttgaccg aagttgaaac ctctaactgg ccaaccccag 4200
ttccaccaag agaaatcacc tgtgttgttt cttctcacgc ttctgctaga gttgaattcc 4260
aaccatctgc taacgctttg gttgctggta tcgttgaatt ggttaccgct accttgtctg 4320
acttggaaac ccacttgaac gctttggacg ctaaggttgg tgacggtgac accggttcta 4380
ccttcgctgc tgctgctaga gaaatcgctt ctttgttgca cagacaacaa ttgccattga 4440
acaacttggc taccttgttc gctttgatcg gtgaaagatt gaccgttgtt atgggtggtt 4500
cttctggtgt tttgatgtct atcttcttca ccgctgctgg tcaaaagttg gaacaaggtg 4560
ctaacgttgt tgaagctttg aacaccggtt tggctcaaat gaagttctac ggtggtgctg 4620
acgaaggtga cagaaccatg atcgacgctt tgcaaccagc tttgacctct ttgttggctc 4680
aaccaaagaa cttgcaagct gctttcgacg ctgctcaagc tggtgctgaa agaacctgtt 4740
tgtcttctaa ggctaacgct ggtagagctt cttacttgtc ttctgaatct ttgttgggta 4800
acatggaccc aggtgctcaa agattggcta tggttttcaa ggctttggct gaatctgaat 4860
tgggttaata aggtcgagac aaatcgctct taaatatata cctaaagaac attaaagcta 4920
tattataagc aaagatacgt aaattttgct tatattatta tacacatatc atatttctat 4980
atttttaaga tttggttata taatgtacgt aatgcaaagg aaataaattt tatacattat 5040
tgaacagcgt ccaagtaact acattatgtg cactaatagt ttagcgtcgt gaagacttta 5100
ttgtgtcgcg aaaagtaaaa attttaaaaa ttagagcacc ttgaacttgc gaaaaaggtt 5160
ctcatcaact gtttaaaacg tacgcctagg aagccttcga gcgtcccaaa accttctcaa 5220
gcaaggtttt cagtataatg ttacatgcgt acacgcgttt gtacagaaaa aaaagaaaaa 5280
tttgaaatat aaataacgtt cttaatacta acataactat taaaaaaaat aaatagggac 5340
ctagacttca ggttgtctaa ctccttcctt ttcggttaga gcggatgtgg gaggagggcg 5400
tgaatgtaag cgtgacataa ctaattacat gatatcgaca aaggaaaagg ggcgcgcctt 5460
attcccattc ttgtaggaat ctttgaccgt attggtcagc aaccaacaaa gcagcgtaaa 5520
cttggtctgg ggtagcacca cctggcatgt tgtggatggt ttcaccttca gcacaagcag 5580
cttcagcaac gattctcatc ttagctggaa cgtcttcctt gatgtccaat tgagccaagg 5640
tgattggcaa accaacagcg tgagacaaag cagcaacggt ttcgatttct tcaactggag 5700
cgttttccaa aaccaattgg gtcaaggtac cgaaagcaac cttttcaccg tggtagtagt 5760
ggtgagcgtc tgggatagcg gtcaaaccgt tgtgaacagc gtgagcagca gccaaaccac 5820
cagattcgaa accaacacca gacaagtagg tgttagcttc gataactctt tccaaagctg 5880
gggtaacaac gtgttgttca gcagccaaca tagccttttc accttcttcc aacaaggtgt 5940
tgtaacacaa ttcagccaaa gccaaagcag cttgggtaca cttaccacca gccatggtgg 6000
tagcaccaga tctagaacaa gctctagctt cgaaccaggt agccaaagcg tcaccgatac 6060
cagctgccaa caatctagct ggagcaccag caacgatctt ggtgtcaacg ataaccatgt 6120
ttgggttgtt tggcaacaac aagtatctgt cgaattcacc ttcgtcggtg tagataacag 6180
acaaagcaga acatggagcg tcggtagaag cgatggttgg agcgatagca actggaacac 6240
ccatgaagtg agccaaagcc ttagcggtgt ccaaggtctt accaccaccg atacccaaga 6300
tagcaccaca ttgagcggtt tcagcgatac ctctcaatct gtcgatttcg ttttgagaac 6360
attcaccacc gaatggagcg atttcaacaa ccaaaccagc gtccttgaaa gacttttcaa 6420
cggtagattg agcgaaaccc aaaacgaact tgtcaccaac aaccaaccat ctttcagcca 6480
atggcttcaa gtattcaccc aatctgttga taacgtcagc accttggatg tacttacctg 6540
gagattggat gattctgtcc attttctgca gttaattcag taaattttcg atcttgggaa 6600
gaaaaaagca gtaagcgtga aaaatctaaa agctgatgta gtagaagatc ctattcttta 6660
acaaagattg accttttctt tttcttcttg gtttgagtag aaaggggaag gaagaataca 6720
agagagagga aaaaaaggaa gataaaaaga gagcgtgata taaatgaata tatattaaac 6780
aagagagatt gggaaggaaa ggatcaaaca aacccaaaaa tatttcaaaa aggagagaga 6840
gaggcgagtt tggtttcaaa acggtttatt tatttatgca agaggacgtg gaagaaaaag 6900
aagaaggaag aaaaaaattt gaaagaaaaa aacgcgtggc gggtaaagaa gaaaatggaa 6960
aatagaggcc gggtgacaga gaaatattga gggttaattg gaaaatatgt tagggtgagg 7020
catatgtttt taagggtttt gaggatccga taaggaagaa tgtaggttaa atgttgtgca 7080
ttaattgctg tggcagctta cccgcttccc cacacattta ctagtctcga gctcttcaac 7140
tcaagacgca cagatattat aacatctgca taataggcat ttgcaagaat tactcgtgag 7200
taaggaaaga gtgaggaact atcgcatacc tgcatttaaa gatgccgatt tgggcgcgaa 7260
tcctttattt tggcttcacc ctcatactat tatcagggcc agaaaaagga agtgtttccc 7320
tccttcttga attgatgtta ccctcataaa gcacgtggcc tcttatcgag aaagaaatta 7380
ccgtcgctcg tgatttgttt gcaaaaagaa caaaactgaa aaaacccaga cacgctcgac 7440
ttcctgtctt cctattgatt gcagcttcca atttcgtcac acaacaaggt cctagcgacg 7500
gctcacaggt tttgtaacaa gcaatcgaag gttctggaat ggcgggaaag ggtttagtac 7560
cacatgctat gatgcccact gtgatctcca gagcaaagtt cgttcgatcg tactgttact 7620
ctctctcttt caaacagaat tgtccgaatc gtgtgacaac aacagcctgt tctcacacac 7680
tcttttcttc taaccaaggg ggtggtttag tttagtagaa cctcgtgaaa cttacattta 7740
catatatata aacttgcata aattggtcaa tgcaagaaat acatatttgg tcttttctaa 7800
ttcgtagttt ttcaagttct tagatgcttt ctttttctct tttttacaga tcatcaagga 7860
agtaattatc tactttttac aacaaatata tctagaaaat ggctgttacc aacgttgctg 7920
aattgaacgc tttggttgaa agggttaaga aggctcaaag agaatacgct tctttcaccc 7980
aagaacaagt tgacaagatc ttcagagctg ctgctttggc tgctgctgac gctagaatcc 8040
cattggctaa gatggctgtt gctgaatctg gtatgggtat cgttgaagac aaggttatca 8100
agaaccactt cgcttctgaa tacatctaca acgcttacaa ggacgaaaag acctgtggtg 8160
ttttgtcaga agacgacacc ttcggtacca tcaccatcgc tgaaccaatc ggtatcatct 8220
gtggtatcgt tccaaccacc aacccaacct ctaccgctat cttcaagtct ttgatctctt 8280
tgaagaccag aaacgctatc atcttctctc cacacccaag agctaaagac gctaccaaca 8340
aggctgctga catcgttttg caagctgcta tcgctgctgg tgctccaaag gacttgatcg 8400
gttggatcga ccaaccatct gttgaattgt ctaacgcttt gatgcaccac ccagacatca 8460
acttgatctt ggctaccggt ggtccaggta tggttaaggc tgcttactct tctggtaagc 8520
cagctatcgg tgttggtgct ggtaacaccc cagttgttat cgacgaaacc gctgacatca 8580
agagagctgt tgcttctgtt ttgatgtcta agaccttcga caacggtgtt atctgtgctt 8640
ctgaacaatc tgttgttgtt gttgactctg tttacgacgc tgttagagaa agattcgcta 8700
cccacggtgg ttacttgttg caaggtaagg aattgaaggc tgttcaagac gttatcttga 8760
agaacggtgc tttgaacgct gctatcgttg gtcaaccagc ttacaagatc gctgaattag 8820
ctggtttctc tgttccagaa aacaccaaga tcttgatcgg tgaagttacc gttgttgacg 8880
aatctgaacc attcgctcac gaaaagttgt ctccaacctt ggctatgtac agagctaagg 8940
acttcgaaga cgctgttgaa aaagctgaaa agttggttgc tatgggtggt attggtcaca 9000
cctcttgttt gtacaccgac caagacaacc aaccagctag agtttcttac ttcggtcaaa 9060
agatgaagac cgctagaatc ttgatcaaca ccccagcttc tcaaggtggt atcggtgact 9120
tgtacaactt caagttggct ccatctttga ccttgggttg tggttcttgg ggtggtaact 9180
ctatctctga aaacgttggt ccaaagcact tgatcaacaa gaagaccgtt gctaagagag 9240
ctgaaaacat gttgtggcac aagttgccaa aatctatcta cttcagaaga ggttctttgc 9300
caatcgcttt ggacgaagtt atcaccgacg gtcacaagag agctttgatc gttaccgaca 9360
gattcttgtt caacaacggt tacgctgacc aaatcacctc tgttttgaag gctgctggtg 9420
ttgaaaccga agttttcttc gaagttgaag ctgacccaac cttgtctatc gttagaaagg 9480
gtgctgaatt ggctaactct ttcaagccag acgttatcat cgctttgggt ggtggttctc 9540
caatggacgc tgctaagatc atgtgggtta tgtacgaaca cccagaaacc cacttcgaag 9600
aattggcttt gagattcatg gacatcagaa agagaatcta caagttccca aagatgggtg 9660
ttaaggctaa gatgatcgct gttaccacca cctctggtac cggttctgaa gttaccccat 9720
tcgctgttgt taccgacgac gctaccggtc aaaagtaccc attggctgac tacgctttga 9780
ccccagacat ggctatcgtt gacgctaact tggttatgga catgccaaag tctttgtgtg 9840
ctttcggtgg tttggacgct gttacccacg ctatggaagc ttacgtttct gttttggctt 9900
ctgaattctc tgacggtcaa gctttgcaag ctttgaagtt gttgaaggaa tacttgccag 9960
cttcttacca cgaaggttct aagaacccag ttgctagaga aagagttcac tctgctgcta 10020
ccatcgctgg tatcgctttc gctaacgctt tcttgggtgt ttgtcactct atggctcaca 10080
agttgggttc tcaattccac atcccacacg gtttggctaa cgctttgttg atctgtaacg 10140
ttatcagata caacgctaac gacaacccaa ccaagcaaac cgctttctct caatacgaca 10200
gaccacaagc tagaagaaga tacgctgaaa tcgctgacca cttgggtttg tctgctccag 10260
gtgacagaac cgctgcaaag atcgaaaagt tgttggcttg gttggaaacc ttgaaggctg 10320
aattgggtat cccaaagtct atcagagaag ctggtgttca agaagctgac ttcttggcta 10380
acgttgacaa gttgtctgaa gacgctttcg acgaccaatg taccggtgct aacccaagat 10440
acccattgat ctctgaattg aagcaaatct tgttggacac ctactacggt agagactacg 10500
ttgaaggtga aaccgctgct aagaaggaag ctgctccagc taaggctgaa aagaaggcta 10560
agaagtctgc ttagcttaag cgcgcgaatt tcttatgatt tatgattttt attattaaat 10620
aagttataaa aaaaataagt gtatacaaat tttaaagtga ctcttaggtt ttaaaacgaa 10680
aattcttatt cttgagtaac tctttcctgt aggtcaggtt gctttctcag gtatagcatg 10740
aggtcgctct tattgaccac acctctaccg gcatgccgag caaatgcctg caaatcgctc 10800
cccatttcac ccaattgtag atatgctaac tccagcaatg agttgatgaa tctcggtgtg 10860
tattttatgt cctcagagga caacacctgt tgtaatcgtt cttccacacg tacgaagctt 10920
aaaagggcga attctgcaga tatccatcac actggcggcc gcatgctagc tccggattat 10980
cgatgataag ctgtcaaaga tgagaattaa ttccacggac tatagactat actagatact 11040
ccgtctactg tacgatacac ttccgctcag gtccttgtcc tttaacgagg ccttaccact 11100
cttttgttac tctattgatc cagctcagca aaggcagtgt gatctaagat tctatcttcg 11160
cgatgtagta aaactagcta gaccgagaaa gagactagaa atgcaaaagg cacttctaca 11220
atggctgcca tcattattat ccgatgtgac gctgcagctt ctcaatgata ttcgaatacg 11280
ctttgaggag atacagccta atatccgaca aactgtttta cagatttacg atcgtacttg 11340
ttacccatca ttgaattttg aacatccgaa cctgggagtt ttccctgaaa cagatagtat 11400
atttgaacct gtataataat atatagtcta gcgctttacg gaagacaatg tatgtatttc 11460
ggttcctgga gaaactattg catctattgc ataggtaatc ttgcacgtcg catccccggt 11520
tcattttctg cgtttccatc ttgcacttca atagcatatc tttgttaacg aagcatctgt 11580
gcttcatttt gtagaacaaa aatgcaacgc gagagcgcta atttttcaaa caaagaatct 11640
gagctgcatt tttacagaac agaaatgcaa cgcgaaagcg ctattttacc aacgaagaat 11700
ctgtgcttca tttttgtaaa acaaaaatgc aacgcgacga gagcgctaat ttttcaaaca 11760
aagaatctga gctgcatttt tacagaacag aaatgcaacg cgagagcgct attttaccaa 11820
caaagaatct atacttcttt tttgttctac aaaaatgcat cccgagagcg ctatttttct 11880
aacaaagcat cttagattac tttttttctc ctttgtgcgc tctataatgc agtctcttga 11940
taactttttg cactgtaggt ccgttaaggt tagaagaagg ctactttggt gtctattttc 12000
tcttccataa aaaaagcctg actccacttc ccgcgtttac tgattactag cgaagctgcg 12060
ggtgcatttt ttcaagataa aggcatcccc gattatattc tataccgatg tggattgcgc 12120
atactttgtg aacagaaagt gatagcgttg atgattcttc attggtcaga aaattatgaa 12180
cggtttcttc tattttgtct ctatatacta cgtataggaa atgtttacat tttcgtattg 12240
ttttcgattc actctatgaa tagttcttac tacaattttt ttgtctaaag agtaatacta 12300
gagataaaca taaaaaatgt agaggtcgag tttagatgca agttcaagga gcgaaaggtg 12360
gatgggtagg ttatataggg atatagcaca gagatatata gcaaagagat acttttgagc 12420
aatgtttgtg gaagcggtat tcgcaatgcc ggctttcccc gtcaagctct aaatcggggg 12480
ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag 12540
ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg 12600
gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc 12660
tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat 12720
gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt tacaatttcc 12780
tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcata tgatccgtcg 12840
agttcaagag aaaaaaaaag aaaaagcaaa aagaaaaaag gaaagcgcgc ctcgttcaga 12900
atgacacgta tagaatgatg cattaccttg tcatcttcag tatcatactg ttcgtataca 12960
tacttactga cattcatagg tatacatata tacacatgta tatatatcgt atgctgcagc 13020
tttaaataat cggtgtcact acataagaac acctttggtg gagggaacat cgttggtacc 13080
attgggcgag gtggcttctc ttatggcaac cgcaagagcc ttgaacgcac tctcactacg 13140
gtgatgatca ttcttgcctc gcagacaatc aacgtggagg gtaattctgc tagcctctgc 13200
aaagctttca agaaaatgcg ggatcatctc gcaagagaga tctcctactt tctccctttg 13260
caaaccaagt tcgacaactg cgtacggcct gttcgaaaga tctaccaccg ctctggaaag 13320
tgcctcatcc aaaggcgcaa atcctgatcc aaaccttttt actccacgcg ccagtagggc 13380
ctctttaaaa gcttgaccga gagcaatccc gcagtcttca gtggtgtgat ggtcgtctat 13440
gtgtaagtca ccaatgcact caacgattag cgaccagccg gaatgcttgg ccagagcatg 13500
tatcatatgg tccagaaacc ctatacctgt gtggacgtta atcacttgcg attgtgtggc 13560
ctgttctgct actgcttctg cctctttttc tgggaagatc gagtgctcta tcgctagggg 13620
accacccttt aaagagatcg caatctgaat cttggtttca tttgtaatac gctttactag 13680
ggctttctgc tctgtcatct ttgccttcgt ttatcttgcc tgctcatttt ttagtatatt 13740
cttcgaagaa atcacattac tttatataat gtataattca ttatgtgata atgccaatcg 13800
ctaagaaaaa aaaagagtca tccgctaggt ggaaaaaaaa aaatgaaaat cattaccgag 13860
gcataaaaaa atatagagtg tactagagga ggccaagagt aatagaaaaa gaaaattgcg 13920
ggaaaggact gtgttatgac ttccctgact aatgccgtgt tcaaacgata cctggcagtg 13980
actcctagcg ctcaccaagc tcttaaaacg gaattatggt gcactctcag tacaatctgc 14040
tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga 14100
cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc 14160
atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 14200
<210> 38
<211> 3042
<212> DNA
<213> Artificial
<220>
<223> pRNDAK
<400> 38
ggatccacta gtaacggccg ccagtgtgct ggaattcgcc cttctcgagc ttaagacgcg 60
tttcttcttc agattccctc atggagaaag tgcggcagat gtatatgaca gagtcgccag 120
tttccaagag actttattca ggcacttcca tgataggcaa gagagaagac ccagagatgt 180
tgttgtccta gttacacatg gtatttattc cagagtattc ctgatgaaat ggtttagatg 240
gacatacgaa gagtttgaat cgtttaccaa tgttcctaac gggagcgtaa tggtgatgga 300
actggacgaa tccatcaata gatacgtcct gaggaccgtg ctacccaaat ggactgattg 360
tgagggagac ctaactacat agtgtttaaa gattacggat atttaactta cttagaataa 420
tgccattttt ttgagttata ataatcctac gttagtgtga gcgggattta aactgtgagg 480
accttaatac attcagacac ttctgcggta tcaccctact tattcccttc gagattatat 540
ctaggaaccc atcaggttgg tggaagatta cccgttctaa gacttttcag cttcctctat 600
tgatgttaca cctggacacc ccttttctgg catccagttt ttaatcttca gtggcatgtg 660
agattctccg aaattaatta aagcaatcac acaattctct cggataccac ctcggttgaa 720
actgacaggt ggtttgttac gcatgctaat gcaaaggagc ctatatacct ttggctcggc 780
tgctgtaaca gggaatataa agggcagcat aatttaggag tttagtgaac ttgcaacatt 840
tactattttc ccttcttacg taaatatttt tctttttaat tctaaatcaa tctttttcaa 900
ttttttgttt gtattctttt cttgcttaaa tctataacta caaaaaacac atacataaat 960
ctagaaaatg tccgctaaat cgtttgaagt cacagatcca gtcaattcaa gtctcaaagg 1020
gtttgccctt gctaacccct ccattacgct ggtccctgaa gaaaaaattc tcttcagaaa 1080
gaccgattcc gacaagatcg cattaatttc tggtggtggt agtggacatg aacctacaca 1140
cgccggtttc attggtaagg gtatgttgag tggcgccgtg gttggcgaaa tttttgcatc 1200
cccttcaaca aaacagattt taaatgcaat ccgtttagtc aatgaaaatg cgtctggcgt 1260
tttattgatt gtgaagaact acacaggtga tgttttgcat tttggtctgt ccgctgagag 1320
agcaagagcc ttgggtatta actgccgcgt tgctgtcata ggtgatgatg ttgcagttgg 1380
cagagaaaag ggtggtatgg ttggtagaag agcattggca ggtaccgttt tggttcataa 1440
gattgtaggt gccttcgcag aagaatattc tagtaagtat ggcttagacg gtacagctaa 1500
agtggctaaa attatcaacg acaatttggt gaccattgga tcttctttag accattgtaa 1560
agttcctggc aggaaattcg aaagtgaatt aaacgaaaaa caaatggaat tgggtatggg 1620
tattcataac gaacctggtg tgaaagtttt agaccctatt ccttctaccg aagacttgat 1680
ctccaagtat atgctaccaa aactattgga tccaaacgat aaggatagag cttttgtaaa 1740
gtttgatgaa gatgatgaag ttgtcttgtt agttaacaat ctcggcggtg tttctaattt 1800
tgttattagt tctatcactt ccaaaactac ggatttctta aaggaaaatt acaacataac 1860
cccggttcaa acaattgctg gcacattgat gacctccttc aatggtaatg ggttcagtat 1920
cacattacta aacgccacta aggctacaaa ggctttgcaa tctgattttg aggagatcaa 1980
atcagtacta gacttgttga acgcatttac gaacgcaccg ggctggccaa ttgcagattt 2040
tgaaaagact tctgccccat ctgttaacga tgacttgtta cataatgaag taacagcaaa 2100
ggccgtcggt acctatgact ttgacaagtt tgctgagtgg atgaagagtg gtgctgaaca 2160
agttatcaag agcgaaccgc acattacgga actagacaat caagttggtg atggtgattg 2220
tggttacact ttagtggcag gagttaaagg catcaccgaa aaccttgaca agctgtcgaa 2280
ggactcatta tctcaggcgg ttgcccaaat ttcagatttc attgaaggct caatgggagg 2340
tacttctggt ggtttatatt ctattctttt gtcgggtttt tcacacggat taattcaggt 2400
ttgtaaatca aaggatgaac ccgtcactaa ggaaattgtg gctaagtcac tcggaattgc 2460
attggatact ttatacaaat atacaaaggc aaggaaggga tcatccacca tgattgatgc 2520
tttagaacca ttcgttaaag aatttactgc atctaaggat ttcaataagg cggtaaaagc 2580
tgcagaggaa ggtgctaaat ccactgctac attcgaggcc aaatttggca gagcttcgta 2640
tgtcggcgat tcatctcaag tagaagatcc tggtgcagta ggcctatgtg agtttttgaa 2700
gggggttcaa agcgccttgt aagtcgagac aaatcgctct taaatatata cctaaagaac 2760
attaaagcta tattataagc aaagatacgt aaattttgct tatattatta tacacatatc 2820
atatttctat atttttaaga tttggttata taatgtacgt aatgcaaagg aaataaattt 2880
tatacattat tgaacagcgt ccaagtaact acattatgtg cactaatagt ttagcgtcgt 2940
gaagacttta ttgtgtcgcg aaaagtaaaa attttaaaaa ttagagcacc ttgaacttgc 3000
gaaaaaggtt ctcatcaact gtttaaaacg tacgaagctt aa 3042
<210> 39
<211> 14291
<212> DNA
<213> Artificial
<220>
<223> pRN977
<400> 39
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataagacgtc 60
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 120
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 180
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 240
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 300
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 360
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 420
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 480
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 540
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 600
gacaacgatc ggaggaccga aggagctaac cgcttttttt cacaacatgg gggatcatgt 660
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 720
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 780
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 840
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 900
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 960
agttatctac acgacgggca gtcaggcaac tatggatgaa cgaaatagac agatcgctga 1020
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 1080
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 1140
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 1200
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 1260
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 1320
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta 1380
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 1440
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 1500
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 1560
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agcattgaga 1620
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 1680
aacaggagag cgcacgaggg agcttccagg ggggaacgcc tggtatcttt atagtcctgt 1740
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggccgag 1800
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 1860
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 1920
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 1980
ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 2040
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 2100
tgtgagttac ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcctat 2160
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2220
cgccaagctc ggaattaacc ctcactaaag ggaacaaaag ctgggtaccg ggccccccct 2280
cgaggtcgag cttaagacgc gtttcttctt cagattccct catggagaaa gtgcggcaga 2340
tgtatatgac agagtcgcca gtttccaaga gactttattc aggcacttcc atgataggca 2400
agagagaaga cccagagatg ttgttgtcct agttacacat ggtatttatt ccagagtatt 2460
cctgatgaaa tggtttagat ggacatacga agagtttgaa tcgtttacca atgttcctaa 2520
cgggagcgta atggtgatgg aactggacga atccatcaat agatacgtcc tgaggaccgt 2580
gctacccaaa tggactgatt gtgagggaga cctaactaca tagtgtttaa agattacgga 2640
tatttaactt acttagaata atgccatttt tttgagttat aataatccta cgttagtgtg 2700
agcgggattt aaactgtgag gaccttaata cattcagaca cttctgcggt atcaccctac 2760
ttattccctt cgagattata tctaggaacc catcaggttg gtggaagatt acccgttcta 2820
agacttttca gcttcctcta ttgatgttac acctggacac cccttttctg gcatccagtt 2880
tttaatcttc agtggcatgt gagattctcc gaaattaatt aaagcaatca cacaattctc 2940
tcggatacca cctcggttga aactgacagg tggtttgtta cgcatgctaa tgcaaaggag 3000
cctatatacc tttggctcgg ctgctgtaac agggaatata aagggcagca taatttagga 3060
gtttagtgaa cttgcaacat ttactatttt cccttcttac gtaaatattt ttctttttaa 3120
ttctaaatca atctttttca attttttgtt tgtattcttt tcttgcttaa atctataact 3180
acaaaaaaca catacataaa tctagaaaat gtccgctaaa tcgtttgaag tcacagatcc 3240
agtcaattca agtctcaaag ggtttgccct tgctaacccc tccattacgc tggtccctga 3300
agaaaaaatt ctcttcagaa agaccgattc cgacaagatc gcattaattt ctggtggtgg 3360
tagtggacat gaacctacac acgccggttt cattggtaag ggtatgttga gtggcgccgt 3420
ggttggcgaa atttttgcat ccccttcaac aaaacagatt ttaaatgcaa tccgtttagt 3480
caatgaaaat gcgtctggcg ttttattgat tgtgaagaac tacacaggtg atgttttgca 3540
ttttggtctg tccgctgaga gagcaagagc cttgggtatt aactgccgcg ttgctgtcat 3600
aggtgatgat gttgcagttg gcagagaaaa gggtggtatg gttggtagaa gagcattggc 3660
aggtaccgtt ttggttcata agattgtagg tgccttcgca gaagaatatt ctagtaagta 3720
tggcttagac ggtacagcta aagtggctaa aattatcaac gacaatttgg tgaccattgg 3780
atcttcttta gaccattgta aagttcctgg caggaaattc gaaagtgaat taaacgaaaa 3840
acaaatggaa ttgggtatgg gtattcataa cgaacctggt gtgaaagttt tagaccctat 3900
tccttctacc gaagacttga tctccaagta tatgctacca aaactattgg atccaaacga 3960
taaggataga gcttttgtaa agtttgatga agatgatgaa gttgtcttgt tagttaacaa 4020
tctcggcggt gtttctaatt ttgttattag ttctatcact tccaaaacta cggatttctt 4080
aaaggaaaat tacaacataa ccccggttca aacaattgct ggcacattga tgacctcctt 4140
caatggtaat gggttcagta tcacattact aaacgccact aaggctacaa aggctttgca 4200
atctgatttt gaggagatca aatcagtact agacttgttg aacgcattta cgaacgcacc 4260
gggctggcca attgcagatt ttgaaaagac ttctgcccca tctgttaacg atgacttgtt 4320
acataatgaa gtaacagcaa aggccgtcgg tacctatgac tttgacaagt ttgctgagtg 4380
gatgaagagt ggtgctgaac aagttatcaa gagcgaaccg cacattacgg aactagacaa 4440
tcaagttggt gatggtgatt gtggttacac tttagtggca ggagttaaag gcatcaccga 4500
aaaccttgac aagctgtcga aggactcatt atctcaggcg gttgcccaaa tttcagattt 4560
cattgaaggc tcaatgggag gtacttctgg tggtttatat tctattcttt tgtcgggttt 4620
ttcacacgga ttaattcagg tttgtaaatc aaaggatgaa cccgtcacta aggaaattgt 4680
ggctaagtca ctcggaattg cattggatac tttatacaaa tatacaaagg caaggaaggg 4740
atcatccacc atgattgatg ctttagaacc attcgttaaa gaatttactg catctaagga 4800
tttcaataag gcggtaaaag ctgcagagga aggtgctaaa tccactgcta cattcgaggc 4860
caaatttggc agagcttcgt atgtcggcga ttcatctcaa gtagaagatc ctggtgcagt 4920
aggcctatgt gagtttttga agggggttca aagcgccttg taagtcgaga caaatcgctc 4980
ttaaatatat acctaaagaa cattaaagct atattataag caaagatacg taaattttgc 5040
ttatattatt atacacatat catatttcta tatttttaag atttggttat ataatgtacg 5100
taatgcaaag gaaataaatt ttatacatta ttgaacagcg tccaagtaac tacattatgt 5160
gcactaatag tttagcgtcg tgaagacttt attgtgtcgc gaaaagtaaa aattttaaaa 5220
attagagcac cttgaacttg cgaaaaaggt tctcatcaac tgtttaaaac gtacgcctag 5280
gaagccttcg agcgtcccaa aaccttctca agcaaggttt tcagtataat gttacatgcg 5340
tacacgcgtt tgtacagaaa aaaaagaaaa atttgaaata taaataacgt tcttaatact 5400
aacataacta ttaaaaaaaa taaataggga cctagacttc aggttgtcta actccttcct 5460
tttcggttag agcggatgtg ggaggagggc gtgaatgtaa gcgtgacata actaattaca 5520
tgatatcgac aaaggaaaag gggcgcgcct tattcccatt cttgtaggaa tctttgaccg 5580
tattggtcag caaccaacaa agcagcgtaa acttggtctg gggtagcacc acctggcatg 5640
ttgtggatgg tttcaccttc agcacaagca gcttcagcaa cgattctcat cttagctgga 5700
acgtcttcct tgatgtccaa ttgagccaag gtgattggca aaccaacagc gtgagacaaa 5760
gcagcaacgg tttcgatttc ttcaactgga gcgttttcca aaaccaattg ggtcaaggta 5820
ccgaaagcaa ccttttcacc gtggtagtag tggtgagcgt ctgggatagc ggtcaaaccg 5880
ttgtgaacag cgtgagcagc agccaaacca ccagattcga aaccaacacc agacaagtag 5940
gtgttagctt cgataactct ttccaaagct ggggtaacaa cgtgttgttc agcagccaac 6000
atagcctttt caccttcttc caacaaggtg ttgtaacaca attcagccaa agccaaagca 6060
gcttgggtac acttaccacc agccatggtg gtagcaccag atctagaaca agctctagct 6120
tcgaaccagg tagccaaagc gtcaccgata ccagctgcca acaatctagc tggagcacca 6180
gcaacgatct tggtgtcaac gataaccatg tttgggttgt ttggcaacaa caagtatctg 6240
tcgaattcac cttcgtcggt gtagataaca gacaaagcag aacatggagc gtcggtagaa 6300
gcgatggttg gagcgatagc aactggaaca cccatgaagt gagccaaagc cttagcggtg 6360
tccaaggtct taccaccacc gatacccaag atagcaccac attgagcggt ttcagcgata 6420
cctctcaatc tgtcgatttc gttttgagaa cattcaccac cgaatggagc gatttcaaca 6480
accaaaccag cgtccttgaa agacttttca acggtagatt gagcgaaacc caaaacgaac 6540
ttgtcaccaa caaccaacca tctttcagcc aatggcttca agtattcacc caatctgttg 6600
ataacgtcag caccttggat gtacttacct ggagattgga tgattctgtc cattttctgc 6660
agttaattca gtaaattttc gatcttggga agaaaaaagc agtaagcgtg aaaaatctaa 6720
aagctgatgt agtagaagat cctattcttt aacaaagatt gaccttttct ttttcttctt 6780
ggtttgagta gaaaggggaa ggaagaatac aagagagagg aaaaaaagga agataaaaag 6840
agagcgtgat ataaatgaat atatattaaa caagagagat tgggaaggaa aggatcaaac 6900
aaacccaaaa atatttcaaa aaggagagag agaggcgagt ttggtttcaa aacggtttat 6960
ttatttatgc aagaggacgt ggaagaaaaa gaagaaggaa gaaaaaaatt tgaaagaaaa 7020
aaacgcgtgg cgggtaaaga agaaaatgga aaatagaggc cgggtgacag agaaatattg 7080
agggttaatt ggaaaatatg ttagggtgag gcatatgttt ttaagggttt tgaggatccg 7140
ataaggaaga atgtaggtta aatgttgtgc attaattgct gtggcagctt acccgcttcc 7200
ccacacattt actagtctcg agctcttcaa ctcaagacgc acagatatta taacatctgc 7260
ataataggca tttgcaagaa ttactcgtga gtaaggaaag agtgaggaac tatcgcatac 7320
ctgcatttaa agatgccgat ttgggcgcga atcctttatt ttggcttcac cctcatacta 7380
ttatcagggc cagaaaaagg aagtgtttcc ctccttcttg aattgatgtt accctcataa 7440
agcacgtggc ctcttatcga gaaagaaatt accgtcgctc gtgatttgtt tgcaaaaaga 7500
acaaaactga aaaaacccag acacgctcga cttcctgtct tcctattgat tgcagcttcc 7560
aatttcgtca cacaacaagg tcctagcgac ggctcacagg ttttgtaaca agcaatcgaa 7620
ggttctggaa tggcgggaaa gggtttagta ccacatgcta tgatgcccac tgtgatctcc 7680
agagcaaagt tcgttcgatc gtactgttac tctctctctt tcaaacagaa ttgtccgaat 7740
cgtgtgacaa caacagcctg ttctcacaca ctcttttctt ctaaccaagg gggtggttta 7800
gtttagtaga acctcgtgaa acttacattt acatatatat aaacttgcat aaattggtca 7860
atgcaagaaa tacatatttg gtcttttcta attcgtagtt tttcaagttc ttagatgctt 7920
tctttttctc ttttttacag atcatcaagg aagtaattat ctacttttta caacaaatat 7980
atctagaaaa tggctgttac caacgttgct gaattgaacg ctttggttga aagggttaag 8040
aaggctcaaa gagaatacgc ttctttcacc caagaacaag ttgacaagat cttcagagct 8100
gctgctttgg ctgctgctga cgctagaatc ccattggcta agatggctgt tgctgaatct 8160
ggtatgggta tcgttgaaga caaggttatc aagaaccact tcgcttctga atacatctac 8220
aacgcttaca aggacgaaaa gacctgtggt gttttgtcag aagacgacac cttcggtacc 8280
atcaccatcg ctgaaccaat cggtatcatc tgtggtatcg ttccaaccac caacccaacc 8340
tctaccgcta tcttcaagtc tttgatctct ttgaagacca gaaacgctat catcttctct 8400
ccacacccaa gagctaaaga cgctaccaac aaggctgctg acatcgtttt gcaagctgct 8460
atcgctgctg gtgctccaaa ggacttgatc ggttggatcg accaaccatc tgttgaattg 8520
tctaacgctt tgatgcacca cccagacatc aacttgatct tggctaccgg tggtccaggt 8580
atggttaagg ctgcttactc ttctggtaag ccagctatcg gtgttggtgc tggtaacacc 8640
ccagttgtta tcgacgaaac cgctgacatc aagagagctg ttgcttctgt tttgatgtct 8700
aagaccttcg acaacggtgt tatctgtgct tctgaacaat ctgttgttgt tgttgactct 8760
gtttacgacg ctgttagaga aagattcgct acccacggtg gttacttgtt gcaaggtaag 8820
gaattgaagg ctgttcaaga cgttatcttg aagaacggtg ctttgaacgc tgctatcgtt 8880
ggtcaaccag cttacaagat cgctgaatta gctggtttct ctgttccaga aaacaccaag 8940
atcttgatcg gtgaagttac cgttgttgac gaatctgaac cattcgctca cgaaaagttg 9000
tctccaacct tggctatgta cagagctaag gacttcgaag acgctgttga aaaagctgaa 9060
aagttggttg ctatgggtgg tattggtcac acctcttgtt tgtacaccga ccaagacaac 9120
caaccagcta gagtttctta cttcggtcaa aagatgaaga ccgctagaat cttgatcaac 9180
accccagctt ctcaaggtgg tatcggtgac ttgtacaact tcaagttggc tccatctttg 9240
accttgggtt gtggttcttg gggtggtaac tctatctctg aaaacgttgg tccaaagcac 9300
ttgatcaaca agaagaccgt tgctaagaga gctgaaaaca tgttgtggca caagttgcca 9360
aaatctatct acttcagaag aggttctttg ccaatcgctt tggacgaagt tatcaccgac 9420
ggtcacaaga gagctttgat cgttaccgac agattcttgt tcaacaacgg ttacgctgac 9480
caaatcacct ctgttttgaa ggctgctggt gttgaaaccg aagttttctt cgaagttgaa 9540
gctgacccaa ccttgtctat cgttagaaag ggtgctgaat tggctaactc tttcaagcca 9600
gacgttatca tcgctttggg tggtggttct ccaatggacg ctgctaagat catgtgggtt 9660
atgtacgaac acccagaaac ccacttcgaa gaattggctt tgagattcat ggacatcaga 9720
aagagaatct acaagttccc aaagatgggt gttaaggcta agatgatcgc tgttaccacc 9780
acctctggta ccggttctga agttacccca ttcgctgttg ttaccgacga cgctaccggt 9840
caaaagtacc cattggctga ctacgctttg accccagaca tggctatcgt tgacgctaac 9900
ttggttatgg acatgccaaa gtctttgtgt gctttcggtg gtttggacgc tgttacccac 9960
gctatggaag cttacgtttc tgttttggct tctgaattct ctgacggtca agctttgcaa 10020
gctttgaagt tgttgaagga atacttgcca gcttcttacc acgaaggttc taagaaccca 10080
gttgctagag aaagagttca ctctgctgct accatcgctg gtatcgcttt cgctaacgct 10140
ttcttgggtg tttgtcactc tatggctcac aagttgggtt ctcaattcca catcccacac 10200
ggtttggcta acgctttgtt gatctgtaac gttatcagat acaacgctaa cgacaaccca 10260
accaagcaaa ccgctttctc tcaatacgac agaccacaag ctagaagaag atacgctgaa 10320
atcgctgacc acttgggttt gtctgctcca ggtgacagaa ccgctgcaaa gatcgaaaag 10380
ttgttggctt ggttggaaac cttgaaggct gaattgggta tcccaaagtc tatcagagaa 10440
gctggtgttc aagaagctga cttcttggct aacgttgaca agttgtctga agacgctttc 10500
gacgaccaat gtaccggtgc taacccaaga tacccattga tctctgaatt gaagcaaatc 10560
ttgttggaca cctactacgg tagagactac gttgaaggtg aaaccgctgc taagaaggaa 10620
gctgctccag ctaaggctga aaagaaggct aagaagtctg cttagcttaa gcgcgcgaat 10680
ttcttatgat ttatgatttt tattattaaa taagttataa aaaaaataag tgtatacaaa 10740
ttttaaagtg actcttaggt tttaaaacga aaattcttat tcttgagtaa ctctttcctg 10800
taggtcaggt tgctttctca ggtatagcat gaggtcgctc ttattgacca cacctctacc 10860
ggcatgccga gcaaatgcct gcaaatcgct ccccatttca cccaattgta gatatgctaa 10920
ctccagcaat gagttgatga atctcggtgt gtattttatg tcctcagagg acaacacctg 10980
ttgtaatcgt tcttccacac gtacgaagct taaaagggcg aattctgcag atatccatca 11040
cactggcggc cgcatgctag ctccggatta tcgatgataa gctgtcaaag atgagaatta 11100
attccacgga ctatagacta tactagatac tccgtctact gtacgataca cttccgctca 11160
ggtccttgtc ctttaacgag gccttaccac tcttttgtta ctctattgat ccagctcagc 11220
aaaggcagtg tgatctaaga ttctatcttc gcgatgtagt aaaactagct agaccgagaa 11280
agagactaga aatgcaaaag gcacttctac aatggctgcc atcattatta tccgatgtga 11340
cgctgcagct tctcaatgat attcgaatac gctttgagga gatacagcct aatatccgac 11400
aaactgtttt acagatttac gatcgtactt gttacccatc attgaatttt gaacatccga 11460
acctgggagt tttccctgaa acagatagta tatttgaacc tgtataataa tatatagtct 11520
agcgctttac ggaagacaat gtatgtattt cggttcctgg agaaactatt gcatctattg 11580
cataggtaat cttgcacgtc gcatccccgg ttcattttct gcgtttccat cttgcacttc 11640
aatagcatat ctttgttaac gaagcatctg tgcttcattt tgtagaacaa aaatgcaacg 11700
cgagagcgct aatttttcaa acaaagaatc tgagctgcat ttttacagaa cagaaatgca 11760
acgcgaaagc gctattttac caacgaagaa tctgtgcttc atttttgtaa aacaaaaatg 11820
caacgcgacg agagcgctaa tttttcaaac aaagaatctg agctgcattt ttacagaaca 11880
gaaatgcaac gcgagagcgc tattttacca acaaagaatc tatacttctt ttttgttcta 11940
caaaaatgca tcccgagagc gctatttttc taacaaagca tcttagatta ctttttttct 12000
cctttgtgcg ctctataatg cagtctcttg ataacttttt gcactgtagg tccgttaagg 12060
ttagaagaag gctactttgg tgtctatttt ctcttccata aaaaaagcct gactccactt 12120
cccgcgttta ctgattacta gcgaagctgc gggtgcattt tttcaagata aaggcatccc 12180
cgattatatt ctataccgat gtggattgcg catactttgt gaacagaaag tgatagcgtt 12240
gatgattctt cattggtcag aaaattatga acggtttctt ctattttgtc tctatatact 12300
acgtatagga aatgtttaca ttttcgtatt gttttcgatt cactctatga atagttctta 12360
ctacaatttt tttgtctaaa gagtaatact agagataaac ataaaaaatg tagaggtcga 12420
gtttagatgc aagttcaagg agcgaaaggt ggatgggtag gttatatagg gatatagcac 12480
agagatatat agcaaagaga tacttttgag caatgtttgt ggaagcggta ttcgcaatgc 12540
cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 12600
acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 12660
ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 12720
gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 12780
tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 12840
ttttaacaaa atattaacgt ttacaatttc ctgatgcggt attttctcct tacgcatctg 12900
tgcggtattt cacaccgcat atgatccgtc gagttcaaga gaaaaaaaaa gaaaaagcaa 12960
aaagaaaaaa ggaaagcgcg cctcgttcag aatgacacgt atagaatgat gcattacctt 13020
gtcatcttca gtatcatact gttcgtatac atacttactg acattcatag gtatacatat 13080
atacacatgt atatatatcg tatgctgcag ctttaaataa tcggtgtcac tacataagaa 13140
cacctttggt ggagggaaca tcgttggtac cattgggcga ggtggcttct cttatggcaa 13200
ccgcaagagc cttgaacgca ctctcactac ggtgatgatc attcttgcct cgcagacaat 13260
caacgtggag ggtaattctg ctagcctctg caaagctttc aagaaaatgc gggatcatct 13320
cgcaagagag atctcctact ttctcccttt gcaaaccaag ttcgacaact gcgtacggcc 13380
tgttcgaaag atctaccacc gctctggaaa gtgcctcatc caaaggcgca aatcctgatc 13440
caaacctttt tactccacgc gccagtaggg cctctttaaa agcttgaccg agagcaatcc 13500
cgcagtcttc agtggtgtga tggtcgtcta tgtgtaagtc accaatgcac tcaacgatta 13560
gcgaccagcc ggaatgcttg gccagagcat gtatcatatg gtccagaaac cctatacctg 13620
tgtggacgtt aatcacttgc gattgtgtgg cctgttctgc tactgcttct gcctcttttt 13680
ctgggaagat cgagtgctct atcgctaggg gaccaccctt taaagagatc gcaatctgaa 13740
tcttggtttc atttgtaata cgctttacta gggctttctg ctctgtcatc tttgccttcg 13800
tttatcttgc ctgctcattt tttagtatat tcttcgaaga aatcacatta ctttatataa 13860
tgtataattc attatgtgat aatgccaatc gctaagaaaa aaaaagagtc atccgctagg 13920
tggaaaaaaa aaaatgaaaa tcattaccga ggcataaaaa aatatagagt gtactagagg 13980
aggccaagag taatagaaaa agaaaattgc gggaaaggac tgtgttatga cttccctgac 14040
taatgccgtg ttcaaacgat acctggcagt gactcctagc gctcaccaag ctcttaaaac 14100
ggaattatgg tgcactctca gtacaatctg ctctgatgcc gcatagttaa gccagccccg 14160
acacccgcca acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta 14220
cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc 14280
gaaacgcgcg a 14291
<210> 40
<211> 4891
<212> DNA
<213> Artificial
<220>
<223> pRN593
<400> 40
gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 60
tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 120
ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 180
taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 240
gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 300
gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 360
ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 420
aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 480
gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 540
cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 600
actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 660
caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 720
gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 780
ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 840
caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 900
tactcatact cttccttttt caattcagaa gaactcgtca agaaggcgat agaaggcgat 960
gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc 1020
gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac 1080
acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg 1140
caagcaggca tcgccatggt accgagtggt gttgtaacca ccctcaaaaa atgcggaaga 1200
ggtgtacagc taatattata atggaaaatc cttttgctct ataggatttt ttttttaaaa 1260
tttaaatata catatttatt tatatttatt tggttactaa attttgtatt aatttaataa 1320
taataagtaa tttctaacgt gataaagtag ttatgagaaa tgacataatg ctaatttatg 1380
aatatgatat agaagagcct cgaaaaaagt gggggaaagt atgatatgtt atctttctcc 1440
aataaatcta atcttcatgt agatctaatt cttcaatcat gtccggcagg ttcttcattg 1500
ggtagttgtt gtaaacgatt tggtatacgg cttcaaataa tgggaagtct tcgacagagc 1560
cacatgtttc caaccattcg tgaacttctt tgcaggtaat taaaccttga gcggattggc 1620
cattcaacaa ctcgtacacc taggatccgt cgacactgga tggcggcgtt agtatcgaat 1680
cgacagcagt atagcgacca gcattcacat acgattgacg catgatatta ctttctgcgc 1740
acttaacttc gcatctgggc agatgatgtc gaggcgaaaa aaaatataaa tcacgctaac 1800
atttgattaa aatagaacaa ctacaatata aaaaaactat acaaatgaca agttcttgaa 1860
aacaagaatc tttttattgt cagtactgat tattcctttg ccctcggacg agtgctgggg 1920
cgtcggtttc cactatcggc gagtacttct acacagccat cggtccagac ggccgcgctt 1980
ctgcgggcga tttgtgtacg cccgacagtc ccggctccgg atcggacgat tgcgtcgcat 2040
cgaccctgcg cccaagctgc atcatcgaaa ttgccgtcaa ccaagctctg atagagttgg 2100
tcaagaccaa tgcggagcat atacgcccgg agccgcggcg atcctgcaag ctccggatgc 2160
ctccgctcga agtagcgcgt ctgctgctcc atacaagcca accacggcct ccagaagaag 2220
atgttggcga cctcgtattg ggaatccccg aacatcgcct cgctccagtc aatgaccgct 2280
gttatgcggc cattgtccgt caggacattg ttggagccga aatccgcgtg cacgaggtgc 2340
cggacttcgg ggcagtcctc ggcccaaagc atcagctcat cgagagcctg cgcgacggac 2400
gcactgacgg tgtcgtccat cacagtttgc cagtgataca catggggatc agcaatcgcg 2460
catatgaaat cacgccatgt agtgtattga ccgattcctt gcggtccgaa tgggccgaac 2520
ccgctcgtct ggctaagatc ggccgcagcg atcgcatcca tggcctccgc gaccggctgc 2580
agaacagcgg gcagttcggt ttcaggcagg tcttgcaacg tgacaccctg tgcacggcgg 2640
gagatgcaat aggtcaggct ctcgctgaat tccccaatgt caagcacttc cggaatcggg 2700
agcgcggccg atgcaaagtg ccgataaaca taacgatctt tgtagaaacc atcggcgcag 2760
ctatttaccc gcaggacata tccacgccct cctacatcga agctgaaagc acgagattct 2820
tcgccctccg agagctgcat caggtcggag acgctgtcga acttttcgat cagaaacttc 2880
tcgacagacg tcgcggtgag ttcaggcttt ttacccatgg ttgtttatgt tcggatgtga 2940
tgtgagaact gtatcctagc aagattttaa aaggaagtat atgaaagaag aacctcagtg 3000
gcaaatccta accttttata tttctctaca ggggcgcggc gtggggacaa ttcacgcgtc 3060
tgtgagggga gcgtttccct gctcgcaggt ctgcagcgag gagccgtaat ttttgcttcg 3120
cgccgtgcgg ccatcaaaat gtatggatgc aaatgattat acatggggat gtatgggcta 3180
aatgtacggg cgacagtcac atcatgcccc tgagctgcgc acgtcaagac tgtcaaggag 3240
ggtattctgg gcctccatgt cgctggccgg gtgacccggc ggggacgagg ccttaagttc 3300
gaacgtacga gctccggatt aagggcgaat tccagcacac tggcggccgt tactagacca 3360
gcattcaagt ggccggaagt taagtttaat ctatcagcag cagcagacat ctttatatta 3420
tcaatatttg tgtttgtgga gggggggggt gtacaatata caattgtttc ttgatgtctt 3480
atgtaggaga gtaagataaa agaaaattaa agggagaaag aatttaaggt aacgtaacag 3540
tttcactcat ggtagtatat atataactac gaaactgcca ataccaagcc agtctacgtg 3600
cgaattaggt tggatagatt tgatgaaccc attctgatac ttgttgtgcg gaaaaaggga 3660
caaaataggg aaaactggaa aaagaaaagg aaggggagag aagcaaggcg ggtaccaagc 3720
ttgatgcata gcttgagtat tctatagtgt cacctaaata gcttggcgta atcatggtca 3780
tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 3840
agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg 3900
cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc 3960
caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 4020
tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 4080
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 4140
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 4200
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 4260
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 4320
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 4380
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 4440
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 4500
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 4560
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga 4620
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 4680
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 4740
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 4800
gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 4860
ttcacctaga tccttttaaa ttaaaaatga a 4891
<210> 41
<211> 30
<212> DNA
<213> Artificial
<220>
<223> Primer gpd1uf
<400> 41
aagcttggta cccgccttgc ttctctcccc 30
<210> 42
<211> 26
<212> DNA
<213> Artificial
<220>
<223> Primer gpd1ur
<400> 42
tctagaccag cattcaagtg gccgga 26
<210> 43
<211> 29
<212> DNA
<213> Artificial
<220>
<223> Primer gpd1df
<400> 43
cgtacgagtt gttgaatggc caatccgct 29
<210> 44
<211> 31
<212> DNA
<213> Artificial
<220>
<223> Primer gpd1dr
<400> 44
ccatggtacc gagtggtgtt gtaaccaccc t 31
<210> 45
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Primer gpd1cf
<400> 45
accaatacgt aaacggggcg 20
<210> 46
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Primer gpd1cr
<400> 46
aatacaccca tacatacgga cgc 23
<210> 47
<211> 28
<212> DNA
<213> Artificial
<220>
<223> Primer acs1f
<400> 47
ttaagcttaa aatgtcgccc tctgccgt 28
<210> 48
<211> 50
<212> DNA
<213> Artificial
<220>
<223> Primer acs1r
<400> 48
aagcgcgcta caacttgacc gaatcaatta gatgtctaac aatgccaggg 50
<210> 49
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Primer acs2f
<400> 49
aactgcagaa aatgacaatc aaggaacata aagtagttta tgaagctca 49
<210> 50
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Primer acs2r
<400> 50
acgtcgacta tttctttttt tgagagaaaa attggttctc tacagcaga 49
<210> 51
<211> 13018
<212> DNA
<213> Artificial
<220>
<223> pRN753
<400> 51
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 240
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 300
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 360
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 420
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 480
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 540
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 600
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttt cacaacatgg 660
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 720
acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 780
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 840
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 900
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 960
cccgtatcgt agttatctac acgacgggca gtcaggcaac tatggatgaa cgaaatagac 1020
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 1200
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1260
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1320
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 1380
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1440
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1500
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1560
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1620
agcattgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1680
gcagggtcgg aacaggagag cgcacgaggg agcttccagg ggggaacgcc tggtatcttt 1740
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1800
gggggccgag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1860
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1920
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1980
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 2040
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 2100
acgcaattaa tgtgagttac ctcactcatt aggcacccca ggctttacac tttatgcttc 2160
cggctcctat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 2220
accatgatta cgccaagctc ggaattaacc ctcactaaag ggaacaaaag ctgggtaccg 2280
ggccccccct cgaccggtcc cacacaccat agcttcaaaa tgtttctact ccttttttac 2340
tcttccagat tttctcggac tccgcgcatc gccgtaccac ttcaaaacac ccaagcacag 2400
catactaaat ttcccctctt tcttcctcta gggtgtcgtt aattacccgt actaaaggtt 2460
tggaaaagaa aaaagagacc gcctcgtttc tttttcttcg tcgaaaaagg caataaaaat 2520
ttttatcacg tttctttttc ttgaaaattt ttttttttga tttttttctc tttcgatgac 2580
ctcccattga tatttaagtt aataaacggt cttcaatttc tcaagtttca gtttcatttt 2640
tcttgttcta ttacaacttt ttttacttct tgctcattag aaagaaagca tagcaatcta 2700
atctaagctg cagaagctta aaatgtcgcc ctctgccgta caatcatcaa aactagaaga 2760
acagtcaagt gaaattgaca agttgaaagc aaaaatgtcc cagtctgccg ccactgcgca 2820
gcagaagaag gaacatgagt atgaacattt gacttcggtc aagatcgtgc cacaacggcc 2880
catctcagat agactgcagc ccgcaattgc tacccactat tctccacact tggacgggtt 2940
gcaggactat cagcgcttgc acaaggagtc tattgaagac cctgctaagt tcttcggttc 3000
taaagctacc caatttttaa actggtctaa gccattcgat aaggtgttca tcccagaccc 3060
taaaacgggc aggccctcct tccagaacaa tgcatggttc ctcaacggcc aattaaacgc 3120
ctgttacaac tgtgttgaca gacatgcctt gaagactcct aacaagaaag ccattatttt 3180
cgaaggtgac gagcctggcc aaggctattc cattacctac aaggaactac ttgaagaagt 3240
ttgtcaagtg gcacaagtgc tgacttactc tatgggcgtt cgcaagggcg atactgttgc 3300
cgtgtacatg cctatggtcc cagaagcaat cataaccttg ttggccattt cccgtatcgg 3360
tgccattcac tccgtagtct ttgccgggtt ttcttccaac tccttgagag atcgtatcaa 3420
cgatggggac tctaaagttg tcatcactac agatgaatcc aacagaggtg gtaaagtcat 3480
tgagactaaa agaattgttg atgacgcgct aagagagacc ccaggcgtga gacacgtctt 3540
ggtttataga aagaccaaca atccatctgt tgctttccat gcccccagag atttggattg 3600
ggcaacagaa aagaagaaat acaagaccta ctatccatgc acacccgttg attctgagga 3660
tccattattc ttgttgtata cgtctggttc tactggtgcc cccaagggtg ttcaacattc 3720
taccgcaggt tacttgctgg gagctttgtt gaccatgcgc tacacttttg acactcacca 3780
agaagacgtt ttcttcacag ctggagacat tggctggatt acaggccaca cttatgtggt 3840
ttatggtccc ttactatatg gttgtgccac tttggtcttt gaagggactc ctgcgtaccc 3900
aaattactcc cgttattggg atattattga tgaacacaaa gtcacccaat tttatgttgc 3960
gccaactgct ttgcgtttgt tgaaaagagc tggtgattcc tacatcgaaa atcattcctt 4020
aaaatctttg cgttgcttgg gttcggtcgg tgagccaatt gctgctgaag tttgggagtg 4080
gtactctgaa aaaataggta aaaatgaaat ccccattgta gacacctact ggcaaacaga 4140
atctggttcg catctggtca ccccgctggc tggtggtgtt acaccaatga aaccgggttc 4200
tgcctcattc cccttcttcg gtattgatgc agttgttctt gaccctaaca ctggtgaaga 4260
acttaacacc agccacgcag agggtgtcct tgccgtcaaa gctgcatggc catcatttgc 4320
aagaactatt tggaaaaatc atgataggta tctagacact tatttgaacc cttaccctgg 4380
ctactatttc actggtgatg gtgctgcaaa ggataaggat ggttatatct ggattttggg 4440
tcgtgtagac gatgtggtga acgtctctgg tcaccgtctg tctaccgctg aaattgaggc 4500
tgctattatc gaagatccaa ttgtggccga gtgtgctgtt gtcggattca acgatgactt 4560
gactggtcaa gcagttgctg catttgtggt gttgaaaaac aaatctagtt ggtccaccgc 4620
aacagatgat gaattacaag atatcaagaa gcatttggtc tttactgtta gaaaagacat 4680
cgggccattt gccgcaccaa aattgatcat tttagtggat gacttgccca agacaagatc 4740
cggcaaaatt atgagacgta ttttaagaaa aatcctagca ggagaaagtg accaactagg 4800
cgacgtttct acattgtcaa accctggcat tgttagacat ctaattgatt cggtcaagtt 4860
gtaacttaag cgcgcgaatt tcttatgatt tatgattttt attattaaat aagttataaa 4920
aaaaataagt gtatacaaat tttaaagtga ctcttaggtt ttaaaacgaa aattcttatt 4980
cttgagtaac tctttcctgt aggtcaggtt gctttctcag gtatagcatg aggtcgctct 5040
tattgaccac acctctaccg gcatgccgag caaatgcctg caaatcgctc cccatttcac 5100
ccaattgtag atatgctaac tccagcaatg agttgatgaa tctcggtgtg tattttatgt 5160
cctcagagga caacacctgt tgtaatcgtt cttccacacg tacgttttaa acagttgatg 5220
agaacctttt tcgcaagttc aaggtgctct aatttttaaa atttttactt ttcgcgacac 5280
aataaagtct tcacgacgct aaactattag tgcacataat gtagttactt ggacgctgtt 5340
caataatgta taaaatttat ttcctttgca ttacgtacat tatataacca aatcttaaaa 5400
atatagaaat atgatatgtg tataataata taagcaaaat ttacgtatct ttgcttataa 5460
tatagcttta atgttcttta ggtatatatt taagagcgat ttgtctcgac tatttctttt 5520
tttgagagaa aaattggttc tctacagcag aaatgatggc aggtacaact tctgggttgg 5580
ccaaagtagt taggtcacct agctgttcgg cttcgttaga agcaaccttt cttagaactc 5640
ttctcataat ctttcctgac cttgttcttg gtagatctct aactagaata atggtttttg 5700
gtgaggcgaa aggaccaatc tcacccctaa cttgtaagat caattctcta cgtaaattat 5760
ctggtgtgat gtgttctgca tcaccttcag tagcgttgtt ttgtagataa ccatctttta 5820
gggaaacata tgcaacgacg gtttgaccgg tcaattcatc tggaataccg acaacagcag 5880
cttccgagac gttttcgtga tttgagatag atgcttcaat ttctgatgtg gataatctat 5940
gaccggaaac atttacaacg tcgtcaactc tacccctgat ccagtagtaa ccatcatgat 6000
ctctaccagc accatcacct gtgaaatagt gaccaggata aggtttcaag taagtatcca 6060
tgtaacggtc gtggtggttc caaacagatc tagccattga tggccatggt gatttaacgg 6120
caaggacacc ttcgacatca ttaccttcta attccacacc tgtaacaggg tcaatgatac 6180
aagcgttaat accaaagaat ggcacggtag cagaaccagg ttttgttggg acagcacctg 6240
ccaaaggagc aattaaatga gaaccagact ctgtttgcca catagtgtca caaatgacac 6300
agtttttgtt acccactttt tcatgatacc attcccataa gtctggagag attggttcac 6360
cgacggaacc caagacacgt aatgaggaag tgtcatattt ggcaatttcg gcttcaccta 6420
cacgtttgat taatcttaaa gcagttggag ccacatagaa atgggtagcc ttgtgacgtt 6480
ggataattct ccaatatcta ccataatctg ggtaggcagg agtggattcg aaaattattg 6540
aggcggtacc caaggttaat ggaccatata gagcataggt gtgacccgtg atccagccga 6600
cgtcaccggc agtgaagaga acatcttctg ggtgaatatc aaaaacgtat ctagttgtta 6660
aagcggcacc taataaataa ccacctgtag tgtgaacgac accctttgga gaaccagtgg 6720
aaccggaagt gtataataaa aatagaggat cttcagcgtc acatgaaaca ggaggtaggt 6780
aagttctctg cttagcggcc tcctcatgcc accagtaatc tctaccggcc ttcattggaa 6840
taccttcagt accagttctt tggaaaacca agatacggga aaccaaatcg actccgttca 6900
aaccttcgtc aacaattttt ttagtgttga tggtcttacc acctctttta ccttcatcac 6960
aagtgatgac cactttagaa ttagcgtcaa cgacacgatc tttcaacgaa ccagcggaga 7020
acccagcaaa gacaacagag tgaatagcac caatacgagc cacagccaac atagcaatga 7080
ccgcttctgg aatcattggc aaatagatag ccactgtgtc acctttctta acgccccagc 7140
tttttaagac accagcgatt tgggaaactt ttctgagtaa ttcaccaaat gtgatgattt 7200
tgttgtcgga ttcgtcatca gcttcataga tcaaagctgg cttgtcggga ttagcaaagg 7260
catgtctgtc aacacaattg tatgatgcat tcaatttacc gttcaaaaac catgcaacat 7320
caccattgtt caatgaacca gattgaactt tggtgtatgg agcatcccaa tgcaagtatt 7380
ccttagccat cttatcaaag aatttttctg gctcattgat agattgttga tacatttctt 7440
gataatgttg catatcagta acgtaaccct tgccgggttg gctgttgtaa aaatgttgag 7500
gagccttaag agcctttacg ttgtgagctt cataaactac tttatgttcc ttgattgtca 7560
ttttctgcag tctagatata tttgttgtaa aaagtagata attacttcct tgatgatctg 7620
taaaaaagag aaaaagaaag catctaagaa cttgaaaaac tacgaattag aaaagaccaa 7680
atatgtattt cttgcattga ccaatttatg caagtttata tatatgtaaa tgtaagtttc 7740
acgaggttct actaaactaa accaccccct tggttagaag aaaagagtgt gtgagaacag 7800
gctgttgttg tcacacgatt cggacaattc tgtttgaaag agagagagta acagtacgat 7860
cgaacgaact ttgctctgga gatcacagtg ggcatcatag catgtggtac taaacccttt 7920
cccgccattc cagaaccttc gattgcttgt tacaaaacct gtgagccgtc gctaggacct 7980
tgttgtgtga cgaaattgga agctgcaatc aataggaaga caggaagtcg agcgtgtctg 8040
ggttttttca gttttgttct ttttgcaaac aaatcacgag cgacggtaat ttctttctcg 8100
ataagaggcc acgtgcttta tgagggtaac atcaattcaa gaaggaggga aacacttcct 8160
ttttctggcc ctgataatag tatgagggtg aagccaaaat aaaggattcg cgcccaaatc 8220
ggcatcttta aatgcaggta tgcgatagtt cctcactctt tccttactca cgagtaattc 8280
ttgcaaatgc ctattatgca gatgttataa tatctgtgcg tcttgagttg aagagctcga 8340
gactagatgc atgctcgagc ggccgccagt gtgatggata tctgcagaat tcgccctttt 8400
gggccctgta cacctaggat ccgtcgacac tggatggcgg cgttagtatc gaatcgacag 8460
cagtatagcg accagcattc acatacgatt gacgcatgat attactttct gcgcacttaa 8520
cttcgcatct gggcagatga tgtcgaggcg aaaaaaaata taaatcacgc taacatttga 8580
ttaaaataga acaactacaa tataaaaaaa ctatacaaat gacaagttct tgaaaacaag 8640
aatcttttta ttgtcagtac tgattagaaa aactcatcga gcatcaaatg aaactgcaat 8700
ttattcatat caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga 8760
gaaaactcac cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg 8820
actcgtccaa catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt 8880
gagaaatcac catgagtgac gactgaatcc ggtgagaatg gcaaaagctt atgcatttct 8940
ttccagactt gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc 9000
aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa 9060
ggacaattac aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca 9120
atattttcac ctgaatcagg atattcttct aatacctgga atgctgtttt gccggggatc 9180
gcagtggtga gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga 9240
ggcataaatt ccgtcagcca gtttagtctg accatctcat ctgtaacatc attggcaacg 9300
ctacctttgc catgtttcag aaacaactct ggcgcatcgg gcttcccata caatcgatag 9360
attgtcgcac ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca 9420
tccatgttgg aatttaatcg cggcctcgaa acgtgagtct tttccttacc catggttgtt 9480
tatgttcgga tgtgatgtga gaactgtatc ctagcaagat tttaaaagga agtatatgaa 9540
agaagaacct cagtggcaaa tcctaacctt ttatatttct ctacaggggc gcggcgtggg 9600
gacaattcaa cgcgtctgtg aggggagcgt ttccctgctc gcaggtctgc agcgaggagc 9660
cgtaattttt gcttcgcgcc gtgcggccat caaaatgtat ggatgcaaat gattatacat 9720
ggggatgtat gggctaaatg tacgggcgac agtcacatca tgcccctgag ctgcgcacgt 9780
caagactgtc aaggagggta ttctgggcct ccatgtcgct ggccgggtga cccggcgggg 9840
acgaggcctt aagttcgaac gtacgagctc cggattatcg atgataagct gtcaaagatg 9900
agaattaatt ccacggacta tagactatac tagatactcc gtctactgta cgatacactt 9960
ccgctcaggt ccttgtcctt taacgaggcc ttaccactct tttgttactc tattgatcca 10020
gctcagcaaa ggcagtgtga tctaagattc tatcttcgcg atgtagtaaa actagctaga 10080
ccgagaaaga gactagaaat gcaaaaggca cttctacaat ggctgccatc attattatcc 10140
gatgtgacgc tgcagcttct caatgatatt cgaatacgct ttgaggagat acagcctaat 10200
atccgacaaa ctgttttaca gatttacgat cgtacttgtt acccatcatt gaattttgaa 10260
catccgaacc tgggagtttt ccctgaaaca gatagtatat ttgaacctgt ataataatat 10320
atagtctagc gctttacgga agacaatgta tgtatttcgg ttcctggaga aactattgca 10380
tctattgcat aggtaatctt gcacgtcgca tccccggttc attttctgcg tttccatctt 10440
gcacttcaat agcatatctt tgttaacgaa gcatctgtgc ttcattttgt agaacaaaaa 10500
tgcaacgcga gagcgctaat ttttcaaaca aagaatctga gctgcatttt tacagaacag 10560
aaatgcaacg cgaaagcgct attttaccaa cgaagaatct gtgcttcatt tttgtaaaac 10620
aaaaatgcaa cgcgacgaga gcgctaattt ttcaaacaaa gaatctgagc tgcattttta 10680
cagaacagaa atgcaacgcg agagcgctat tttaccaaca aagaatctat acttcttttt 10740
tgttctacaa aaatgcatcc cgagagcgct atttttctaa caaagcatct tagattactt 10800
tttttctcct ttgtgcgctc tataatgcag tctcttgata actttttgca ctgtaggtcc 10860
gttaaggtta gaagaaggct actttggtgt ctattttctc ttccataaaa aaagcctgac 10920
tccacttccc gcgtttactg attactagcg aagctgcggg tgcatttttt caagataaag 10980
gcatccccga ttatattcta taccgatgtg gattgcgcat actttgtgaa cagaaagtga 11040
tagcgttgat gattcttcat tggtcagaaa attatgaacg gtttcttcta ttttgtctct 11100
atatactacg tataggaaat gtttacattt tcgtattgtt ttcgattcac tctatgaata 11160
gttcttacta caattttttt gtctaaagag taatactaga gataaacata aaaaatgtag 11220
aggtcgagtt tagatgcaag ttcaaggagc gaaaggtgga tgggtaggtt atatagggat 11280
atagcacaga gatatatagc aaagagatac ttttgagcaa tgtttgtgga agcggtattc 11340
gcaatgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 11400
gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 11460
catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 11520
gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 11580
aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 11640
acgcgaattt taacaaaata ttaacgttta caatttcctg atgcggtatt ttctccttac 11700
gcatctgtgc ggtatttcac accgcagggt aataactgat ataattaaat tgaagctcta 11760
atttgtgagt ttagtataca tgcatttact tataatacag ttttttagtt ttgctggccg 11820
catcttctca aatatgcttc ccagcctgct tttctgtaac gttcaccctc taccttagca 11880
tcccttccct ttgcaaatag tcctcttcca acaataataa tgtcagatcc tgtagagacc 11940
acatcatcca cggttctata ctgttgaccc aatgcgtctc ccttgtcatc taaacccaca 12000
ccgggtgtca taatcaacca atcgtaacct tcatctcttc cacccatgtc tctttgagca 12060
ataaagccga taacaaaatc tttgtcgctc ttcgcaatgt caacagtacc cttagtatat 12120
tctccagtag atagggagcc cttgcatgac aattctgcta acatcaaaag gcctctaggt 12180
tcctttgtta cttcttctgc cgcctgcttc aaaccgctaa caatacctgg gcccaccaca 12240
ccgtgtgcat tcgtaatgtc tgcccattct gctattctgt atacacccgc agagtactgc 12300
aatttgactg tattaccaat gtcagcaaat tttctgtctt cgaagagtaa aaaattgtac 12360
ttggcggata atgcctttag cggcttaact gtgccctcca tggaaaaatc agtcaagata 12420
tccacatgtg tttttagtaa acaaattttg ggacctaatg cttcaactaa ctccagtaat 12480
tccttggtgg tacgaacatc caatgaagca cacaagtttg tttgcttttc gtgcatgata 12540
ttaaatagct tggcagcaac aggactagga tgagtagcag cacgttcctt atatgtagct 12600
ttcgacatga tttatcttcg tttcctgcag gtttttgttc tgtgcagttg ggttaagaat 12660
actgggcaat ttcatgtttc ttcaacacta catatgcgta tatataccaa tctaagtctg 12720
tgctccttcc ttcgttcttc cttctgttcg gagattaccg aatcaaaaaa atttcaaaga 12780
aaccgaaatc aaaaaaaaga ataaaaaaaa aatgatgaat tgaattgaaa agcgtggtgc 12840
actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca 12900
cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 12960
accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcga 13018
Claims (15)
- 이스트 세포로 배지를 발효하는 단계를 포함하는 에탄올 생성 방법으로서,
상기 배지는
a) 헥소스 및 펜토즈 중 적어도 하나의 공급원;
b) 아세트산의 공급원; 및
c) 글리세롤의 공급원
을 함유하거나 또는 이와 함께 공급되며
이에 따라 이스트 세포는 아세트산, 글리세롤 및 헥소스와 펜토즈 중 적어도 하나를 에탄올로 발효시키며, 그리고 선택적으로, 에탄올의 회수를 포함하며, 이에 따라 이스트 세포는 아세트알데히드 디하이드로게나아제 활성을 갖는 효소를 암호화하는 외인성 유전자를 포함하며, 상기 외인성 유전자는 아세트산을 에탄올로 전환하는 능력을 세포에 부여하고, 이에 따라 이스트 세포는 NAD+-결합된 글리세롤 디하이드로게나아제 활성을 갖는 효소를 암호화하는 박테리아 유전자를 포함하는,
에탄올 생성 방법.
- 제1항에 있어서,
아세트알데히드 디하이드로게나아제 활성을 갖는 효소를 암호화하는 외인성 유전자는
i) SEQ ID NO: 1과 적어도 64% 아미노산 서열 동일성,
ii) SEQ ID NO: 3과 적어도 76% 아미노산 서열 동일성 및
iii) SEQ ID NO: 5와 적어도 61% 아미노산 서열 동일성
중 적어도 하나를 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함하며,
여기서 NAD+-결합된 글리세롤 디하이드로게나아제 활성을 갖는 효소를 암호화하는 박테리아 유전자는 SEQ ID NO: 7과 적어도 45% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함하는, 에탄올 생성 방법.
- 제1항 또는 제2항에 있어서,
상기 이스트 세포는 상기 이스트 세포에서 NAD+-의존적 글리세롤 3-포스페이트 디하이드로게나아제의 특이적 활성을 감소시키는 유전적 변형을 포함하는, 에탄올 생성 방법.
- 제3항에 있어서,
상기 이스트 세포에서 NAD+-의존적 글리세롤 3-포스페이트 디하이드로게나아제의 특이적 활성을 감소시키는 유전적 변형은 SEQ ID NO: 16에 대해 적어도 70% 서열 동일성을 갖는 아미노산 서열을 갖는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 외인성 유전자의 발현을 감소시키거나 불활성화하는 유전적 변형인, 에탄올 생성 방법.
- 제1항 또는 제2항에 있어서,
상기 이스트 세포는 디히드록시아세톤 키나아제의 특이적 활성을 증가시키는 유전적 변형을 포함하며, 여기서 상기 유전적 변형은 디히드록시아세톤 키나아제를 암호화하는 뉴클레오타이드 서열의 과발현이며, 그리고 여기서, 바람직하게, 디히드록시아세톤 키나아제를 암호화하는 뉴클레오타이드 서열은 SEQ ID NO: 8, 9 및 25 중 적어도 하나와 적어도 50% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함하는, 에탄올 생성 방법.
- 제2항 내지 제5항 중 어느 한 항에 있어서,
상기 세포는
i) 특이적 아세틸-CoA 합성효소 활성, 그리고 여기서 바람직하게, 유전적 변형은 아세틸-CoA 합성효소를 암호화하는 뉴클레오타이드 서열의 발현인, 특이적 아세틸-CoA 합성효소 활성; 및
ii) 글리세롤의 상기 세포내로의 수송
중 적어도 하나를 증가시키는 유전적 변형을 더 포함하는, 에탄올 생성 방법.
- 제6항에 있어서,
아세틸-CoA 합성효소를 암호화하는 뉴클레오타이드 서열은 에스. 세레비지아에(S. cerevisiae) ACS1 유전자에 의해 암호화되는 아세틸-CoA 합성효소보다 더 높은 최대 속도로 아세틸-CoA 합성효소를 암호화하거나, 또는 여기서 아세틸-CoA 합성효소를 암호화하는 뉴클레오타이드 서열은 에스. 세레비지아에(S. cerevisiae) ACS2 유전자에 의해 암호화되는 아세틸-CoA 합성효소보다 더 높은 아세테이트에 대한 친화도로 아세틸-CoA 합성효소를 암호화하며, 그리고 여기서 상기 세포내로 글리세롤의 수송을 증가시키는 유전적 변형은 글리세롤 흡수 단백질 및 글리세롤 채널 중 적어도 하나를 암호화하는 뉴클레오타이드 서열의 과발현이며, 여기서, 바람직하게, 글리세롤 흡수 단백질을 암호화하는 뉴클레오타이드 서열은 SEQ ID NO: 10 및 11 중 적어도 하나와 적어도 50% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함하며, 그리고 여기서, 바람직하게 글리세롤 채널을 암호화하는 뉴클레오타이드 서열은 SEQ ID NO: 12의 아미노산 250 내지 530 사이의 아미노산 서열과 적어도 30% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함하는, 에탄올 생성 방법.
- 제6항 또는 제7항에 있어서,
상기 유전적 변형은 혐기적 조건하에서 특이적 아세틸-CoA 합성효소 활성을 증가시키는, 에탄올 생성 방법.
- 제2항 내지 제8항 중 어느 한 항에 있어서,
상기 이스트 세포는
i) 기능적 외인성 자일로즈 이소머라아제 유전자로서, 여기서 이 유전자는 자일로즈를 자일룰로즈로 이소머화하는 능력을 세포에 부여하는, 기능적 외인성 자일로즈 이소머라아제 유전자; 및
ii) L-아라비노즈 이소머라아제, L-리불로키나아제 및 L-리불로즈-5-포스페이트 4-에피머라아제를 암호화하는 기능적 외인성 유전자로서, 여기서 이 유전자는 L-아라비노즈를 D-자일룰로즈 5-포스페이트로 전환하는 능력을 세포에 함께 부여하는 L-아라비노즈 이소머라아제, L-리불로키나아제 및 L-리불로즈-5-포스페이트 4-에피머라아제를 암호화하는 기능적 외인성 유전자
를 포함하며, 그리고 여기서, 바람직하게 이스트 세포는
a) 증가된 자일룰로즈 키나아제 특이적 활성;
b) 증가된 펜토즈 포스페이트 경로의 플럭스;
c) 감소된 비특이적 알도즈 환원효소 특이적 활성;
d) 자일로즈 및 아라비노즈 중 적어도 하나의 숙주 세포내로의 증가된 수송;
e) 이화대사 억제에 대한 감소된 민감성;
f) 에탄올, 삼투성 또는 유기산에 대한 증가된 내성; 및
g) 감소된 부산물 생성
으로 구성되는 그룹으로부터 선택되는 특성을 일으키는 적어도 하나의 유전적 변형을 더 포함하는, 에탄올 생성 방법.
- 제1항 내지 제9항 중 어느 한 항에 있어서,
상기 이스트 세포는 사카로미세스(Saccharomyces ), 클루이베로미세스(Kluyveromyces ), 칸디다(Candida ), 피치아(Pichia ), 쉬조사카로미세스(Schizosaccharomyces ), 한세눌라(Hansenula ), 클로엑케라(Kloeckera ), 슈반니오미세스(Schwanniomyces ), 및 야로위아(Yarrowia)로 구성되는 그룹으로부터 선택되는 속에 속하는, 에탄올 생성 방법.
- 제10항에 있어서,
상기 이스트 세포는 에스.세레비지아제(S. cerevisiae ), 에스. 엑시구스(S. exiguus), 에스. 바야너스(S. bayanus ), 케이. 락티스(K. lactis ), 케이. 마르시아너스(K. marxianus ) 및 쉬조사카로미세스 폼브(Schizosaccharomyces pombe)로 구성되는 그룹으로부터 선택되는 종에 속하는, 에탄올 생성 방법.
- 제1항 내지 제11항 중 어느 한 항에 있어서,
상기 배지는 목질 섬유 가수분해물을 함유하거나 또는 이와 함께 공급되는, 에탄올 생성 방법.
- 제1항 내지 제12항 중 어느 한 항에 있어서,
상기 이스트 세포는 혐기적 조건하에서 발효되는, 에탄올 생성 방법.
- a) 아세트알데히드 디하이드로게나아제 활성을 갖는 효소를 암호하는 외인성 유전자로서, 이 유전자는 아세트산을 에탄올로 전환하는 능력을 세포에 부여하는, 아세트알데히드 디하이드로게나아제 활성을 갖는 효소를 암호하하는 외인성 유전자; 및
b) NAD+-결합된 글리세롤 디하이드로게나아제 활성을 갖는 효소를 암호화하는 박테리아 유전자
를 포함하는 이스트 세포로서,
이에 따라 상기 이스트 세포는 상기 이스트 세포에서 특이적 NAD+-의존적 포메이트 디하이드로게나아제 활성을 감소시키는 유전적 변형을 포함하는 이스트 세포가 아닌, 이스트 세포.
- 제14항에 있어서,
상기 이스트 세포는 또한 제2항 내지 제11항 중 어느 한 항에 정의된 것과 같은, 이스트 세포.
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201161564932P | 2011-11-30 | 2011-11-30 | |
| EP11191333.1 | 2011-11-30 | ||
| EP11191333 | 2011-11-30 | ||
| US61/564,932 | 2011-11-30 | ||
| PCT/NL2012/050841 WO2013081456A2 (en) | 2011-11-30 | 2012-11-26 | Yeast strains engineered to produce ethanol from acetic acid and glycerol |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR20140099251A true KR20140099251A (ko) | 2014-08-11 |
Family
ID=48536211
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020147014591A Withdrawn KR20140099251A (ko) | 2011-11-30 | 2012-11-26 | 아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인 |
Country Status (15)
| Country | Link |
|---|---|
| US (2) | US9988649B2 (ko) |
| EP (2) | EP2785849B1 (ko) |
| JP (1) | JP2015504309A (ko) |
| KR (1) | KR20140099251A (ko) |
| CN (2) | CN107189954A (ko) |
| AU (1) | AU2012346662B2 (ko) |
| BR (1) | BR112014012963B8 (ko) |
| CA (1) | CA2857247C (ko) |
| DK (1) | DK2785849T3 (ko) |
| EA (1) | EA201491056A8 (ko) |
| ES (1) | ES2648865T3 (ko) |
| MX (1) | MX2014006446A (ko) |
| MY (1) | MY169074A (ko) |
| PL (1) | PL2785849T3 (ko) |
| WO (1) | WO2013081456A2 (ko) |
Families Citing this family (54)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20140099251A (ko) * | 2011-11-30 | 2014-08-11 | 디에스엠 아이피 어셋츠 비.브이. | 아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인 |
| EP3498829A1 (en) * | 2012-11-09 | 2019-06-19 | Lallemand Hungary Liquidity Management LLC | Method for acetate consumption during ethanolic fermentation of cellulosic feedstocks |
| AR097479A1 (es) * | 2013-08-29 | 2016-03-16 | Dsm Ip Assets Bv | Células convertidoras de glicerol y ácido acético con un transporte de glicerol mejorado |
| AR097480A1 (es) * | 2013-08-29 | 2016-03-16 | Dsm Ip Assets Bv | Células de levadura convertidoras de glicerol y ácido acético con una conversión de ácido acético mejorada |
| EP3122876B1 (en) | 2014-03-28 | 2020-11-25 | Danisco US Inc. | Altered host cell pathway for improved ethanol production |
| WO2015160257A1 (en) | 2014-04-18 | 2015-10-22 | Moralco B.V. | Use of acetaldehyde in the fermentative production of ethanol |
| DE112015003261B4 (de) * | 2014-07-14 | 2025-04-10 | Constructor University Bremen Ggmbh | Gentechnisch veränderte Hefe mit verbessertem Glycerol-Katabolismus |
| CN104293687B (zh) * | 2014-09-06 | 2017-01-18 | 浙江大学 | 一种提高酿酒酵母菌株乙酸耐受性的方法 |
| US10883122B2 (en) | 2014-12-19 | 2021-01-05 | Dsm Ip Assets B.V. | Fermentation process for improved glycerol and acetic acid conversion |
| KR101601589B1 (ko) | 2015-01-09 | 2016-03-08 | 현대자동차주식회사 | 도장설비의 악취 제거를 위한 미생물제, 및 이를 이용한 악취 제거 방법 |
| WO2016137976A1 (en) | 2015-02-23 | 2016-09-01 | Biocheminsights, Inc. | Electrochemical bioreactor module and engineered metabolic pathways for 1- butanol production with high carbon efficiency |
| CN107636144B (zh) | 2015-05-22 | 2021-02-19 | 帝斯曼知识产权资产管理有限公司 | 消耗乙酸盐/酯的酵母细胞 |
| EP3322796A4 (en) | 2015-07-13 | 2019-03-27 | Mara Renewables Corporation | IMPROVEMENT OF MICROGENONAL FLUID CHANGES OF XYLOSE |
| WO2017216136A1 (en) * | 2016-06-14 | 2017-12-21 | Dsm Ip Assets B.V. | Recombinant yeast cell |
| WO2018114762A1 (en) | 2016-12-23 | 2018-06-28 | Dsm Ip Assets B.V. | Improved glycerol free ethanol production |
| US20210147885A1 (en) * | 2017-04-17 | 2021-05-20 | Danisco Us Inc | Selected acetyl-coa synthase enzymes for reduction of acetate production in yeast |
| CA3064053A1 (en) * | 2017-06-06 | 2018-12-13 | Zymergen Inc. | Prioritization of genetic modifications to increase throughput of phenotypic optimization |
| CN109251938B (zh) * | 2017-07-13 | 2022-08-23 | 华东理工大学 | 一种共发酵葡萄糖和木糖生产l-乳酸的乳酸片球菌构建方法 |
| JP6879111B2 (ja) * | 2017-08-02 | 2021-06-02 | トヨタ自動車株式会社 | 組換え酵母及びこれを用いたエタノールの製造方法 |
| WO2019058260A1 (en) * | 2017-09-19 | 2019-03-28 | Lallemand Hungary Liquidity Management Llc | TOLERANCE TO ACETATE TOXICITY IN RECOMBINANT MICROBIAL HOST CELLS |
| EP3688176A1 (en) * | 2017-09-26 | 2020-08-05 | DSM IP Assets B.V. | Improved process for ethanol production |
| US11414683B2 (en) * | 2017-09-26 | 2022-08-16 | Dsm Ip Assets B.V. | Acetic acid consuming strain |
| WO2019063542A1 (en) * | 2017-09-29 | 2019-04-04 | Dsm Ip Assets B.V. | IMPROVED ETHANOL PRODUCTION WITHOUT GLYCEROL |
| EP3688170A1 (en) * | 2017-09-29 | 2020-08-05 | DSM IP Assets B.V. | Improved glycerol free ethanol production |
| WO2019100054A1 (en) * | 2017-11-20 | 2019-05-23 | University Of Florida Research Foundation | Dihydroxyacetone metabolizing microorganisms and methods of using them |
| CN112105726A (zh) * | 2018-03-06 | 2020-12-18 | 丹尼斯科美国公司 | 使用gcy1和dak1来增加酵母的乙醇生产的组合物和方法 |
| EP3797159A1 (en) * | 2018-05-22 | 2021-03-31 | DSM IP Assets B.V. | Modified sterol acyltransferases |
| HUE068875T2 (hu) * | 2018-05-30 | 2025-01-28 | Danisco Us Inc | A GIS1 transzkripciós aktivátor/represszor fokozott expressziója élesztõben megemelkedett etanolelõállításhoz |
| FR3081881B1 (fr) * | 2018-06-04 | 2024-05-24 | Ifp Energies Now | Outil genetique optimise pour modifier les bacteries du genre clostridium |
| JP7078900B2 (ja) * | 2018-10-05 | 2022-06-01 | トヨタ自動車株式会社 | 形質転換酵母及びこれを用いたエタノールの製造方法 |
| EP3636661A1 (en) * | 2018-10-12 | 2020-04-15 | Bioc3 | Phosphate translocator |
| CN109593662B (zh) * | 2018-12-11 | 2021-12-03 | 大连理工大学 | 一种乙酸和木糖共利用的马克斯克鲁维酵母菌株及筛选方法 |
| BR112021026542A2 (pt) * | 2019-06-28 | 2022-05-17 | Danisco Us Inc | Células de levedura modificadas que superexpressam as proteínas endógenas selecionadas |
| BR112022000394A2 (pt) * | 2019-07-19 | 2022-03-03 | Inbiose Nv | Produção de fucosilactose em células hospedeiras |
| MX2022004990A (es) * | 2019-10-28 | 2022-05-13 | Chrysea Ltd | Levaduras que producen analogos de poliamina. |
| US20220380813A1 (en) * | 2019-11-08 | 2022-12-01 | Dsm Ip Assets B.V. | Process for producing ethanol |
| CN113215005B (zh) * | 2020-01-21 | 2026-03-06 | 康码(上海)生物科技有限公司 | 一种体外无细胞蛋白合成体系(d2p体系)、其试剂盒及其应用 |
| CN111394380A (zh) * | 2020-03-11 | 2020-07-10 | 大连理工大学 | 一种利用甲酸脱氢酶提高纤维素水解液中甲酸和乙酸抗性的方法 |
| US20230374443A1 (en) * | 2020-10-05 | 2023-11-23 | Dsm Ip Assets B.V. | Saccharomyces yeast cell and fermentation process using such |
| CN112725496B (zh) * | 2021-01-12 | 2024-02-27 | 江南大学 | 一种快速鉴定及定量样本中粟酒裂殖酵母的方法 |
| WO2023285297A1 (en) | 2021-07-12 | 2023-01-19 | Dsm Ip Assets B.V. | Recombinant yeast cell |
| US20250283121A1 (en) * | 2021-07-12 | 2025-09-11 | Danisco Us Inc. | Recombinant yeast cell |
| MX2024000509A (es) | 2021-07-12 | 2024-03-15 | Danisco Us Inc | Celula de levadura recombinante. |
| EP4370688A1 (en) | 2021-07-12 | 2024-05-22 | Danisco Us Inc | Recombinant yeast cell |
| US20250320529A1 (en) * | 2021-07-12 | 2025-10-16 | Danisco Us Inc. | Recombinant yeast cell |
| CN117940570A (zh) | 2021-07-12 | 2024-04-26 | 丹尼斯科美国公司 | 重组酵母细胞 |
| CN113528366B (zh) * | 2021-07-15 | 2023-12-08 | 洛阳华荣生物技术有限公司 | 一种产beta-丙氨酸酵母菌及其构建方法 |
| CN115851850B (zh) * | 2021-09-23 | 2025-11-28 | 中国科学院天津工业生物技术研究所 | 利用二氧化碳制备淀粉的方法、重组微生物和构建重组微生物的方法 |
| US20250163361A1 (en) | 2021-11-04 | 2025-05-22 | Danisco Us Inc. | Recombinant yeast cell |
| CN114317327B (zh) * | 2021-12-06 | 2024-01-30 | 宁波希诺亚海洋生物科技有限公司 | 一种可表达乳糖酶的弧菌属菌株 |
| CN114410562B (zh) * | 2022-02-08 | 2023-05-30 | 安徽工程大学 | 一种克雷伯氏菌工程菌及其在生产乙醇中的应用 |
| CN116064266B (zh) * | 2022-11-01 | 2024-06-14 | 四川大学 | 盐胁迫抗性增强的重组酿酒酵母菌及其构建方法与应用 |
| CN116355773A (zh) * | 2022-11-02 | 2023-06-30 | 杭州欧合生物科技有限公司 | 产琥珀酸的酿酒酵母基因工程菌及其构建方法和应用 |
| CN116333165A (zh) * | 2023-01-30 | 2023-06-27 | 广州市乾相生物科技有限公司 | Fdh-gdh融合蛋白、编码基因及fdh-gdh共进化体系和共进化方法 |
Family Cites Families (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2679920A1 (fr) | 1991-08-02 | 1993-02-05 | Rhone Poulenc Rorer Sa | Levures recombinantes hautement stables pour la production de proteines recombinantes, leur preparation et leur utilisation. |
| EP1453913A4 (en) | 2001-11-08 | 2006-04-05 | Antex Pharma Inc | SUBSTITUTED ALKANES COMPOUNDS AND USES THEREOF |
| AT413282B (de) | 2002-02-01 | 2006-01-15 | Sandoz Ag | Kristalline salze der 7-(((5-amino-1,2,4-thiadiazol-3-yl) (fluoromethoxy-imino)acetyl)amino)-3- ((imino-1-piperazinylmethyl) |
| US7253001B2 (en) * | 2002-03-19 | 2007-08-07 | Forskarpatent I Syd Ab | Metabolic engineering for improved xylose utilisation of Saccharomyces cerevisiae |
| SE0202090D0 (sv) | 2002-05-08 | 2002-07-04 | Forskarpatent I Syd Ab | A modifierd yeast consuming L-arabinose |
| JP4711955B2 (ja) | 2003-05-02 | 2011-06-29 | ネイチャーワークス・エル・エル・シー | 遺伝子組換え酵母及び遺伝子組換え酵母を用いた発酵方法 |
| SE0302421D0 (sv) | 2003-09-11 | 2003-09-11 | Forskarpatent I Syd Ab | Construction of new xylose utilizing Saccharomyces cerevisiae strain |
| SE0400815D0 (sv) | 2004-03-26 | 2004-03-26 | Forskarpatent I Syd Ab | Traits in recombinant xylose-growing saccharomyces cerevisiae strains using genome-wide transcription analysis |
| SE0401303D0 (sv) | 2004-05-19 | 2004-05-19 | Forskarpatent I Syd Ab | Ethanol productivities of microbial strains in fermentation of dilute-acid hydrolyzates depend on their furan reduction capacities |
| DK1781772T3 (en) | 2004-07-16 | 2017-01-09 | Dsm Ip Assets Bv | Metabolic MODIFICATION of xylose-fermenting eukaryotic cells |
| EP2171038A2 (en) | 2007-07-19 | 2010-04-07 | Royal Nedalco B.V. | Novel arabinose-fermenting eukaryotic cells |
| JP5625199B2 (ja) | 2008-03-07 | 2014-11-19 | ディーエスエム アイピー アセッツ ビー.ブイ. | ペントース糖発酵細胞 |
| WO2010019882A1 (en) * | 2008-08-15 | 2010-02-18 | Edeniq, Inc. | Genetically-engineered yeast and methods of making and using |
| EP2277989A1 (en) * | 2009-07-24 | 2011-01-26 | Technische Universiteit Delft | Fermentative glycerol-free ethanol production |
| US9605269B2 (en) | 2010-05-05 | 2017-03-28 | Lallemand Hungary Liquidity Management Llc | Detoxification of biomass derived acetate via metabolic conversion to ethanol, acetone, isopropanol, or ethyl acetate |
| WO2011149353A1 (en) * | 2010-05-27 | 2011-12-01 | C5 Yeast Company B.V. | Yeast strains engineered to produce ethanol from acetic acid and glycerol |
| EP2576762A4 (en) * | 2010-06-03 | 2013-12-04 | Mascoma Corp | YEAST FOR THE EXPRESSION OF SACCHAROLYTIC ENZYMES FOR CONSOLIDATED BIOVERIC PROCESSING USING STARCH AND CELLULOSE |
| CA2834053C (en) * | 2010-11-18 | 2019-03-26 | Dsm Ip Assets B.V. | Yeast strains engineered to produce ethanol from glycerol |
| KR20140099251A (ko) * | 2011-11-30 | 2014-08-11 | 디에스엠 아이피 어셋츠 비.브이. | 아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인 |
-
2012
- 2012-11-26 KR KR1020147014591A patent/KR20140099251A/ko not_active Withdrawn
- 2012-11-26 BR BR112014012963A patent/BR112014012963B8/pt active IP Right Grant
- 2012-11-26 EA EA201491056A patent/EA201491056A8/ru unknown
- 2012-11-26 MX MX2014006446A patent/MX2014006446A/es unknown
- 2012-11-26 US US14/361,782 patent/US9988649B2/en active Active
- 2012-11-26 CN CN201710453018.0A patent/CN107189954A/zh not_active Withdrawn
- 2012-11-26 AU AU2012346662A patent/AU2012346662B2/en active Active
- 2012-11-26 MY MYPI2014001528A patent/MY169074A/en unknown
- 2012-11-26 EP EP12798012.6A patent/EP2785849B1/en active Active
- 2012-11-26 JP JP2014544697A patent/JP2015504309A/ja active Pending
- 2012-11-26 DK DK12798012.6T patent/DK2785849T3/en active
- 2012-11-26 WO PCT/NL2012/050841 patent/WO2013081456A2/en not_active Ceased
- 2012-11-26 CN CN201280059218.3A patent/CN104126011B/zh active Active
- 2012-11-26 PL PL12798012T patent/PL2785849T3/pl unknown
- 2012-11-26 CA CA2857247A patent/CA2857247C/en active Active
- 2012-11-26 ES ES12798012.6T patent/ES2648865T3/es active Active
- 2012-11-26 EP EP17180637.5A patent/EP3321368A3/en active Pending
-
2018
- 2018-05-03 US US15/970,018 patent/US10941421B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| EP3321368A3 (en) | 2018-05-23 |
| BR112014012963B8 (pt) | 2022-04-26 |
| US20180251798A1 (en) | 2018-09-06 |
| EP2785849A2 (en) | 2014-10-08 |
| BR112014012963A2 (pt) | 2020-10-20 |
| CA2857247C (en) | 2019-07-23 |
| CN107189954A (zh) | 2017-09-22 |
| AU2012346662A1 (en) | 2014-06-05 |
| EA201491056A8 (ru) | 2015-02-27 |
| CN104126011A (zh) | 2014-10-29 |
| WO2013081456A3 (en) | 2013-08-15 |
| EP3321368A2 (en) | 2018-05-16 |
| DK2785849T3 (en) | 2018-01-08 |
| MY169074A (en) | 2019-02-13 |
| CN104126011B (zh) | 2017-07-11 |
| JP2015504309A (ja) | 2015-02-12 |
| PL2785849T3 (pl) | 2018-02-28 |
| US20150176032A1 (en) | 2015-06-25 |
| US9988649B2 (en) | 2018-06-05 |
| ES2648865T3 (es) | 2018-01-08 |
| AU2012346662B2 (en) | 2016-07-28 |
| CA2857247A1 (en) | 2013-06-06 |
| US10941421B2 (en) | 2021-03-09 |
| WO2013081456A2 (en) | 2013-06-06 |
| EA201491056A1 (ru) | 2014-09-30 |
| EP2785849B1 (en) | 2017-09-27 |
| BR112014012963B1 (pt) | 2022-03-03 |
| MX2014006446A (es) | 2014-09-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DK2785849T3 (en) | Yeast strains modified to produce ethanol from acetic acid and glycerol | |
| AU2016358063B2 (en) | Functional expression of monooxygenases and methods of use | |
| DK2663645T3 (da) | Gærstammer, der er modificeret til produktion af ethanol fra glycerol | |
| CN101939434B (zh) | 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因 | |
| KR101659101B1 (ko) | 박테리아 [2Fe-2S] 다이하이드록시산 탈수효소의 동정 및 용도 | |
| AU2017220789B2 (en) | Compositions and Methods for Modifying Genomes | |
| DK2576605T3 (en) | PREPARATION OF METABOLITES | |
| KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
| DK2855662T3 (en) | RECOMBINANT MICROORGANISMS AND APPLICATIONS THEREOF | |
| CN101365788B (zh) | Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
| KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
| KR101982360B1 (ko) | 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도 | |
| CN101939433B (zh) | 酵母中生产乙酰-CoA的酶 | |
| CN110467679B (zh) | 一种融合蛋白、碱基编辑工具和方法及其应用 | |
| KR20120136349A (ko) | 고가의 화학적 생성물의 미생물 생산, 및 관련 조성물, 방법 및 시스템 | |
| CN116083398B (zh) | 分离的Cas13蛋白及其应用 | |
| KR20140015136A (ko) | 3-히드록시프로피온산 및 다른 생성물의 제조 방법 | |
| KR20140113997A (ko) | 부탄올 생성을 위한 유전자 스위치 | |
| KR20140099224A (ko) | 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법 | |
| KR20130117753A (ko) | 포스포케톨라아제를 포함하는 재조합 숙주 세포 | |
| KR20120099509A (ko) | 재조합 숙주 세포에서 육탄당 키나아제의 발현 | |
| BRPI0806354A2 (pt) | plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados | |
| KR20150014953A (ko) | 케톨-산 리덕토아이소머라아제 효소 및 사용 방법 | |
| KR20120115349A (ko) | 저급 알킬 알코올의 발효 생성에 유용한 알코올 탈수소효소(adh) | |
| KR20100118973A (ko) | 이소프렌을 생성하기 위한 조성물 및 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0105 | International application |
Patent event date: 20140529 Patent event code: PA01051R01D Comment text: International Patent Application |
|
| PG1501 | Laying open of application | ||
| PC1203 | Withdrawal of no request for examination | ||
| WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |
