KR20140099251A - 아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인 - Google Patents

아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인 Download PDF

Info

Publication number
KR20140099251A
KR20140099251A KR1020147014591A KR20147014591A KR20140099251A KR 20140099251 A KR20140099251 A KR 20140099251A KR 1020147014591 A KR1020147014591 A KR 1020147014591A KR 20147014591 A KR20147014591 A KR 20147014591A KR 20140099251 A KR20140099251 A KR 20140099251A
Authority
KR
South Korea
Prior art keywords
ala
leu
gly
val
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
KR1020147014591A
Other languages
English (en)
Inventor
요하네스 아드리아누스 마리아 드 봉
알로이시우스 빌헬무스 루돌푸스 후베르투스 토이니센
폴 클라센
바우터 빌렘 안토니우스 하트만
쉬마이라 반 보이세곰
Original Assignee
디에스엠 아이피 어셋츠 비.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 디에스엠 아이피 어셋츠 비.브이. filed Critical 디에스엠 아이피 어셋츠 비.브이.
Publication of KR20140099251A publication Critical patent/KR20140099251A/ko
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/22Processes using, or culture media containing, cellulose or hydrolysates thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0008Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/08Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/08Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
    • C12P7/10Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01006Glycerol dehydrogenase (1.1.1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • C12Y102/01Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
    • C12Y102/0101Acetaldehyde dehydrogenase (acetylating) (1.2.1.10)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • C12Y102/01Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Molecular Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 헥소스, 펜토즈 및 아세트산을 포함하는 목질 섬유 가수분해물로부터 에탄올을 생성하는 방법에 관한 것으로, 이에 따라 아세트알데히드 디하이드로게나아제를 암호화하는 외인성 유전자 및 NAD+-결합된 글리세롤 디하이드로게나아제 활성을 갖는 효소를 암호화하는 박테리아 유전자를 포함하는 유전적으로 변형된 이스트 세포가 사용된다. 상기 방법은 또한, 글리세롤이 배지에 존재하거나 또는 이와 함께 공급되며, 이에 따라 변형된 이스트 세포는 헥소스, 펜토즈, 아세트산 및 글리세롤을 에탄올로 발효하는 것을 특징으로 한다. 본 발명은 또한 이러한 방법에 사용되는 이스트 세포에 관한 것이다. 상기 이스트 세포는 유리하게 하나 이상의 디히드록시아세톤 키나아제 활성 및 글리세롤을 세포내로 수송하는 능력을 증가시키는 변형과 같이 글리세롤 이용을 향상시키는 유전적 변형을 포함한다. 상기 이스트 세포는 또한 바람직하게 L-아라비노즈를 D-자일룰로즈 5-포스페이트로 전환하는 능력을 세포에 부여하는 기능적 외인성 자일로즈 이소머라아제 유전자 및/또는 기능적 외인성 유전자를 포함하며, 그리고 이들은 아세틸-CoA 합성효소 활성을 증가시키는 유전적 변형을 포함할 수 있다.

Description

아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인{YEAST STRAINS ENGINEERED TO PRODUCE ETHANOL FROM ACETIC ACID AND GLYCEROL}
본 발명은 이스트와 같은 미생물에서의 대사 공학(metabolic engineering)에 관한 것이다. 구체적으로, 본 발명은 아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인에 관한 것이다. 아세트산 및 글리세롤에 부가적으로, 이스트 스트레인은 또한 에탄올의 생성을 위한 헥소스 및 펜토스를 소비할 수 있다. 본 발명은 또한 본 발명의 합성 스트레인이 아세트산 및 글리세롤로부터 에탄올을 생성하는 방법에 관한 것이다.
2세대 바이오에탄올은, 에탄올로의 발효를 위해 예를 들어 헥소스 및 펜토스와 같이 유리 단량체 당질로 가수분해되는 식물 바이오매스의 목질 섬유 분획으로부터 생성된다. 목질 섬유 가수분해물은 고량의 아세트산을 함유하며, 이는 이스트와 같은 에탄올 생성에 사용되는 미생물의 발효 능력의 강한 억제제이다.
Sonderegger 등(2004, Appl. Environ. Microbiol. 70: 2892-2897)은 자일로스-발효 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 스트레인에서 포스포트랜스아세틸라아제 및 아세트알데히드 디하이드로게나아제의 이종성 발현에 대해 개시하였다. 이에 따라, Sonderegger 등은 고유의 포스포케톨라아제와 함께, 상기 스트레인에서 자일로스 활용에 사용되는 자일로스 환원효소 및 자일로스 디하이드로게나아제의 이종성 발현에 의해 생성된 NADH의 순 재산화(net reoxidation)를 할 수 있는 기능성 포스포케톨라아제 경로를 생성하였다.
Guadalupe 등(2009, Appl. Environ. Microbiol. doi:10.1128/AEM.01772-09)은 부산물 글리세롤의 생성이 내생성 NAD-의존적 글리세롤 3-포스페이트 디하이드로게나아제 유전자(GPD1GPD2)의 붕괴에 의해 제거되는 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 스트레인을 개시하였다. 아세틸레이팅 NAD-의존적 아세트알데히드 디하이드로게나아제를 암호화하는 이. 콜라이(E. coli) mhpF 유전자의 발현은 아세트산을 함유하는 배지로 보충함으로써 혐기적으로 성장하는 GPD-붕괴된 스트레인의 능력을 회복시켰다.
Yu 등(2010, Bioresour. Technol. 101(11):4157-61. Epub 2010 Feb 9)은 글리세롤 디하이드로게나아제(GCY), 디하이드록시아세톤 키나아제(DAK) 및 글리세롤 흡수 단백질(GUP1)의 동시 과발현에 의해 글리세롤로부터 향상된 에탄올 생성을 위해 대사적으로 합성된 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 스트레인을 개시하였다.
Lee 및 Dasilva(2006, Metab Eng. 8(1):58-65)는 그 중에서도 에스케리챠 콜라이(Escherichia coli) mgs 및 gldA 유전자의 발현을 도입하여 글리세롤로부터 1,2-프로판디올을 생성하도록 합성된 이스트 사카로미세스 세레비지아에(Saccharomyces cerevisiae)를 개시하였다.
본 발명의 목적은 아세트산 및 글리세롤 (및 헥소스 및 펜토스)로부터 에탄올을 생성할 수 있는 이스트뿐만 아니라, 이러한 스트레인이 에탄올 및/또는 다른 발효 산물의 생성을 위해 사용되는 공정을 제공하는 것이다.
정의
본 명세서에서 서열 동일성은 서열을 비교함으로써 측정되는 둘 이상의 아미노산(폴리펩타이드 또는 단백질) 서열 또는 둘 이상의 핵산(폴리뉴틀레오타이드) 서열 사이의 관계로서 정의된다. 당해 기술분야에서, "동일성(identity)"은 또한 아미노산 또는 핵산 서열 사이의 서열 관련 정도를 의미하며, 경우에 따라 이러한 서열들의 스트링들 사이를 매칭함으로써 측정된다. 두 아미노산 서열 사이의 "유사성(similarity)"은 한 폴리펩타이드의 아미노산 서열 및 이의 보존 아미노산 치환체를 제2 폴리펩타이드의 서열과 비교함으로써 측정된다. "동일성" 및 "유사성"은 공지된 방법에 의해 쉽게 산출될 수 있다. 용어 "서열 동일성" 또는 "서열 유사성"은 최적으로 정렬된 경우에, 바람직하게 (비교시 적어도 가장 짧은 서열의) 전체 길이에 걸쳐 그리고 디폴트 파라미터를 이용하는 프로그램 ClustalW(1.83), GAP 또는 BESTFIT에 의한 것과 같이 매치의 수를 최대화하고 갭의 수를 최소화하는 것으로 정렬된 경우에, 두 (폴리)펩타이드 또는 두 뉴클레오타이드 서열이, 적어도 본 명세서에 정의된 바와 같은 서열 동일성의 특정 퍼센트를 공유함을 의미한다. GAP은 이들의 전체 길이에 걸쳐 두 서열을 정렬하기 위해 Needleman and Wunsch 글로벌 정렬 알고리즘을 사용하여 매치의 수를 최대화하고 갭의 수를 최소화한다. 일반적으로, GAP 디폴트 파라미터는 갭 생성 패널티 = 50(뉴클레오타이드)/8(단백질) 및 갭 확장 패널티 = 3(뉴클레오타이드)/2(단백질)로 사용된다. 뉴클레오타이드에 대해, 사용되는 디폴트 스코어링 매트릭스는 nwsgapdna이며, 단백질에 대한 디폴트 스코어링 매트릭스는 Blosum62(Heinkoff & Heinkoff, 1992, PNAS 89, 915-919)이다. 본 발명의 단백질 서열을 정렬하기에 바람직한 다중 정렬 프로그램은 블로섬 매트릭스 및 디폴트 세팅(갭 오프닝 패널티: 10; 갭 확장 패널티: 0.05)을 이용하는 ClustalW(1.83)이다. RNA 서열이 DNA 서열과 본질적으로 유사하거나 특정 정도의 서열 동일성을 갖는 것으로 언급되는 경우에, DNA 서열에서 티민(T)은 RNA 서열에서 우라실(U)과 동등한 것으로 간주된다. 서열 정렬 및 퍼센트 서열 동일성에 대한 스코어는 GCG 위스콘신 패키지 버전 10.3(Accelrys Inc., 9685 Scranton Road, San Diego, CA 92121-3752 USA) 또는 오픈 소스 소프트웨어 윈도우용 엠보스(현재 버전 2.7.1-07)와 같은 컴퓨터 프로그램을 이용하여 검출될 수 있다.
동일성을 검출하는 바람직한 방법은 시험되는 서열들 간의 가장 많은 매치를 제공하도록 디자인된다. 동일성 및 유사성을 검출하는 방법은 공개적으로 이용가능한 컴퓨터 프로그램으로 편성된다. 두 서열 간에 동일성 및 유사성을 검출하는 바람직한 컴퓨터 프로그램 방법은 예를 들어 GCG 프로그램 패키지(Devereux, J., et al., Nucleic Acids Research 12 (1):387 (1984)), BestFit, BLASTP, BLASTN, 및 FASTA(Altschul, S. F. et al., J. Mol. Biol. 215:403-410 (1990))을 포함한다. BLAST X 프로그램은 NCBI 및 다른 공급원(BLAST Manual, Altschul, S., et al., NCBI NLM NIH Bethesda, MD 20894; Altschul, S., et al., J. Mol. Biol. 215:403-410 (1990))으로부터 공개적으로 이용가능하다. 잘 알려진 스미스 워터맨 알고리즘이 또한 동일성을 검출하는데 사용될 수 있다.
폴리펩타이드 서열 비교를 위한 바람직한 파라미터는 다음을 포함한다: 알고리즘: Needleman 및 Wunsch, J. Mol. Biol. 48:443-453 (1970); 비교 매트릭스: BLOSSUM62(Hentikoff 및 Hentikoff, Proc. Natl. Acad. Sci. USA. 89:10915-10919 (1992)); 갭 패널티: 12; 및 갭 길이 패널티: 4. 이러한 파라미터와 함께 유용한 프로그램은 "오갭(Ogap)" 프로그램(Genetics Computer Group, Madison, WI)으로서 공개적으로 이용가능하다. 상기 언급된 파라미터는 (엔드 갭을 위한 패널티가 없이) 아미노산 비교를 위한 디폴트 파라미터이다.
핵산 비교를 위한 바람직한 파라미터는 다음을 포함한다: 알고리즘: Needleman 및 Wunsch, J. Mol. Biol. 48:443-453 (1970); 비교 매트릭스: 매치=+10, 미스매치=0; 갭 패널티: 50; 및 갭 길이 패널티: 3. 갭(Gap) 프로그램(Genetics Computer Group, Madison, WI)으로서 공개적으로 이용가능하다. 상기 언급된 파라미터는 핵산 비교를 위한 디폴트 파라미터이다.
선택적으로, 아미노산 유사성 정도 검출시, 통상의 기술자는 또한 통상의 기술자에게 알 수 있는 바와 같이 소위 "보존적(conservative)" 아미노산 치환을 고려할 수 있다. 보존적 아미노산 치환은 유사한 측쇄를 갖는 잔기들의 호환성을 칭한다. 예를 들어, 지방족 측쇄를 갖는 아미노산 그룹은 글리신, 알라닌, 발린, 루신 및 이소루신이며; 지방족-히드록실 측쇄를 갖는 아미노산 그룹은 세린 및 트레오닌이며; 아미드-함유 측쇄를 갖는 아미노산 그룹은 아스파라긴 및 글루타민이며; 방향족 측쇄를 갖는 아미노산 그룹은 페닐알라닌, 티로신 및 트립토판이며; 염기성 측쇄를 갖는 아미노산 그룹은 리신, 아르기닌 및 히스티딘이며; 그리고 황-함유 측쇄를 갖는 아미노산 그룹은 시스테인 및 메티오닌이다. 바람직한 보존적 아미노산 치환기는 발린-루신-이소루신, 페닐알라닌-티로신, 리신-아르기닌, 알라닌-발린 및 아스파라긴-글루타민이다. 본 명세서에 개시된 아미노산 서열의 치환 변이체는 개시된 서열내의 적어도 하나의 잔기가 제거되고 그 자리에 다른 잔기가 삽입된 것들이다. 바람직하게, 아미노산 변화는 보존적이다. 자연적으로 발생하는 각각의 아미노산에 대한 바람직한 보존적 치환은 다음과 같다: Ala 대 ser; Arg 대 lys; Asn 대 gln 또는 his; Asp 대 glu; Cys 대 ser 대 ala; Gln 대 asn; Glu 대 asp; Gly 대 pro; His 대 asn 또는 gln; Ile 대 leu 또는 val; Leu 대 ile 또는 val; Lys 대 arg; gln 또는 glu; Met 대 leu 또는 ile; Phe 대 met, leu 또는 tyr; Ser 대 thr; Thr 대 ser; Trp 대 tyr; Tyr 대 trp 또는 phe; 및, Val 대 ile 또는 leu.
또한, 본 발명의 뉴클레오타이드 서열은 각각, 중간의 또는 바람직하게 엄격한 하이브리드화 조건하에서 본 명세서에 개시된 특정 뉴클레오타이드 서열의 일부와 하이브리드되는 이들의 능력에 의해 정의될 수 있다. 본 명세서에서 엄격한 하이브리드화 조건은 적어도 약 25, 바람직하게 약 50 뉴클레오타이드, 75 또는 100 및 가장 바람직하게 약 200 이상의 뉴클레오타이드가 약 1M 염, 바람직하게 6 x SSC를 포함하는 용액에서 또는 이에 상당하는 이온 강도를 갖는 용액에서 약 60℃의 온도에서 하이브리드화되고, 약 0.1M 염 이하, 바람직하게 0.2 x SSC를 포함하는 용액에서 또는 이에 상당하는 이온 강도를 갖는 다른 용액에서 65℃에서 세정하는 조건으로 정의된다. 바람직하게, 하이브리드화는 밤새, 즉, 적어도 10시간 동안 수행되며, 그리고 바람직하게 세정은 적어도 세정 용액을 2회 교체해 주면서 적어도 1시간 동안 수행된다. 이러한 조건은 보통 약 90% 이상의 서열 동일성을 갖는 서열의 특이적 하이브리드화를 가능케 할 것이다.
중간 조건은 적어도 50 뉴클레오타이드, 바람직하게 약 200 이상의 뉴클레오타이드의 핵산 서열이 약 1M 염, 바람직하게 6 x SSC를 포함하는 용액에서 또는 이에 상당하는 이온 강도를 갖는 어느 다른 용액에서 약 45℃의 온도에서 하이브리드화되고, 약 1M 염 이하, 바람직하게 6 x SSC를 포함하는 용액에서 또는 이에 상당하는 이온 강도를 갖는 다른 용액에서 실온에서 세정하는 조건으로 정의된다. 바람직하게, 하이브리드화는 밤새, 즉, 적어도 10시간 동안 수행되며, 그리고 바람직하게 세정은 적어도 세정 용액을 2회 교체해 주면서 적어도 1시간 동안 수행된다. 이러한 조건은 최대 50%의 서열 동일성을 갖는 서열의 특이적 하이브리드화를 가능케 할 것이다. 당해 기술분야의 통상의 기술자는 50%와 90% 사이의 동일성 범위의 서열을 특이적으로 식별하기 위한 이러한 하이브리드화 조건을 조절할 수 있을 것이다.
"핵산 구조물(nucleic acid construct)" 또는 "핵산 벡터(nucleic acid vector)"는 본 명세서에서 재조합 DNA 기술의 사용으로부터 형성되는 인공 합성 핵산 분자를 의미하는 것으로 이해된다. 용어 "핵산 구조물"은 따라서 자연적으로 발생하는 핵산 분자를 포함하지 않으나, 그럼에도 불구하고 핵산 구조물은 자연적으로 발생하는 핵산 분자(의 일부)를 포함할 수 있다. 용어 "발현 벡터(expression vector)" 또는 "발현 구조물(expression construct)"은 이러한 서열과 호환적인 숙주 세포 또는 숙주 유기체에서 유전자의 발현에 영향을 줄 수 있는 뉴클레오타이드 서열을 칭한다. 이러한 발현 벡터는 전형적으로 적어도 적절한 전사 조절 서열 및 선택적으로, 3' 전사 종료 신호를 포함한다. 또한 발현 인핸서 엘리멘트와 같은 발현에 영향을 주는데 필요하거나 도움이 되는 부가적인 인자들이 존재할 수 있다. 발현 벡터는 적절한 숙주 세포에 도입되며, 숙주 세포의 시험관내 세포 배양시 암호 서열의 발현에 영향을 줄 수 있다. 발현 벡터는 본 발명의 숙주 세포 또는 유기체에서 복제에 적절할 것이다.
본 명세서에 사용된, 용어 "프로모터" 또는 "전사 조절 서열"은 하나 이상의 암호서열의 전사를 조절하는 기능을 하며, 암호 서열의 전사 개시 부위의 전사 방향에 대하여 상향 흐름에 위치하며, 그리고 DNA-의존적 RNA 폴리머라아제에 대한 바인딩 사이트, 전사 제한부위, 및 이에 한정하는 것은 아니나, 전사 인자 바인딩 부위, 리프레서 및 액티베이터 단백질 바인딩 부위, 및 프로모터로부터 전사의 양을 직접 또는 간접적으로 조절하는 것으로 당해 기술분야의 통상의 기술자에게 알려진 어느 다른 뉴클레오타이드 서열울 포함하는 어느 다른 DNA 서열의 존재에 의해 구조적으로 식별되는 핵산 프래그먼트를 칭한다. "구성적인(constitutive)" 프로모터는 대부분의 생리학적 및 발달 조건하에서 대부분의 조직에서 활성적인 프로모터이다. "유도성(inducible)" 프로모터는 예를 들어, 화학 인듀서의 적용에 의해 생리학적으로 또는 발달학적으로 조절된 프로모터이다.
용어 "선별가능한 마커"는 당해 기술분야의 숙련자에게 익숙한 용어이며, 본 명세서에서 발현시 선별가능한 마커를 함유하는 세포 또는 세포들을 선별하는데 사용될 수 있는 어느 유전학적 엔티티를 나타내는데 사용된다. 용어 "리포터"는 마커와 호환적으로 사용될 수 있으나, 주로 녹색 형광 단백질(GFP)과 같은 가시적 마커를 칭하는데 사용된다. 선별가능한 마커는 우성적이거나 열성적이거나 또는 양방향성일 수 있다.
본 명세서에 사용된 용어 "작동가능하게 연결된(operably linked)"이란 기능적 관계에서 폴리뉴클레오타이드 엘리먼트의 결합을 칭한다. 핵산이 다른 핵산 서열과 기능적 관계로 놓여질 경우에 핵산이 "작동가능하게 연결된"다. 예를 들어, 전사 조절 서열은 암호 서열의 전사에 영향을 줄 경우에 암호 서열에 작동가능하게 연결된다. 작동가능하게 연결된이란 연결되는 DNA 서열이 전형적으로 인접되어 있으며, 두 단백질 암호부위를 연결하는 것이 필요한 경우에 인접되어 있으며 리딩 프래임내에 존재하는 것을 의미한다.
용어 "단백질" 또는 "폴리펩타이드"는 특정 활성 모드, 크기, 3-차원 구조 또는 오리진에 대한 레퍼런스가 없는 경우에 호환적으로 사용되며 아미노산의 사슬로 구성되는 분자를 칭한다.
"균류(fungi)"(단수 fungus)는 본 명세서에서 이들의 음식을 외부로 소화하고, 영양 분자를 이들의 세포내로 흡수하는 종속 영양 진행 미생물로서 이해된다. 균류는 진핵 유기체의 별도 계이며, 이스트, 곰팡이 및 버섯을 포함한다. 본 명세서에 사용된 용어, 균류(fungi, fungus) 및 균류의는 따라서 이스트뿐만 아니라 필라멘트성 균류를 포함한다.
용어 "유전자"는 세포에서 RNA 분자(예, mRNA)로 전사되는 부위(전사 부위)를 포함하며, 적절한 조절 부위(예, 프로모터)에 작동가능하게 연결된 DNA 프래그먼트를 의미한다. 유전자는 보통 프로모터 5' 리더 서열, 암호 부위 및 폴리아데닐화 부위를 포함하는 3' 비번역 서열(3'말단)과 같은 여러 작동가능하게 연결된 프래그먼트를 포함할 것이다. "유전자의 발현"은 적절한 조절 부위, 특히 프로모터에 작동가능하게 연결된 DNA 부위가 생물학적으로 활성적인, 즉, 생물학적으로 활성적인 단백질 또는 펩타이드로 번역될 수 있는 RNA로 전사되는 프로세스를 칭한다.
주어진 (재조합) 핵산 또는 폴리펩타이드 분자 및 주어진 숙주 유기체 또는 숙주 세포 사이의 관계를 나타내는데 사용될 경우에 용어 "동종성(homologous)"은 사실상 핵산 또는 폴리펩타이드 분자가 동일한 종, 바람직하게 동일한 변종 또는 스트레인의 숙주 세포 또는 유기체에 의해 생성되는 것을 의미하는 것으로 이해된다. 숙주 세포에 동종성인 경우에, 폴리펩타이드를 암호화하는 핵산 서열은 전형적으로(하지만 필수적은 것은 아님) 다른 (이종성) 프로모터 서열과 작동가능하게 연결되며, 그리고 적용가능할 경우에 이의 천연 환경에 비해 다른 (이종성) 분비 신호 서열 및/또는 종결 서열에 작동가능하게 연결된다. 조절 서열, 신호 서열, 종결 서열 등은 또한 숙주 세포에 동종성일 수 있는 것으로 이해된다. 이러한 정황에서, 단지 "동종성" 서열 엘리먼트의 사용은 "자가-복제된(self-cloned)" 유전적으로 변형된 유기체(GMO's)의 구조가 가능하다(여기서 자가 복제는 유럽 지령 98/81/EC 부록 II에 정의된 바와 같음). 두 핵산 서열의 관련성을 나타내는데 사용될 경우에, 용어 "동종성"은 단일-가닥 핵산 서열이 완전히 단일-가닥 핵산 서열과 하이브리드될 수 있음을 의미한다. 하이브리드화 정도는 서열간의 동일성의 양 및 이후에 언급되는 온도 및 염 농도와 같은 하이브리드화 조건을 포함하는 다수의 인자들에 따라 달라질 수 있다.
핵산(DNA 또는 RNA) 또는 단백질과 관련하여 사용되는 용어 "이종성(heterologous)" 및 "외인성(exogenous)"은 그 안에 존재하는 유기체, 세포, 게놈 또는 DNA 또는 RNA 서열의 일부로서 자연적으로 발생하지 않거나, 또는 자연적으로 발견되는 것과 다른 세포에서 또는 그 게놈 또는 DNA 또는 RNA 서열 는 핵산 또는 단백질내의 위치 또는 위치들에서 발견되는 핵산 또는 단백질을 칭한다. 이종성 및 외인성 핵산 또는 단백질은 그 내부로 도입되는 세포에 대해 내인성은 아니나, 다른 세포로부터 획득되며, 또는 합성적으로 또는 재조합적으로 생성된다. 일반적으로, 필수적인 것은 아니나, 이러한 핵산은 단백질, 즉, DNA가 전사되거나 발현되는 세포에 의해 정상적으로 생성되지 않는 외인성 단백질을 암호화한다. 마찬가지로, 외인성 RNA는 외인성 RNA가 존재하는 세포에서 정상적으로 발현되지 않는 단백질을 암호화한다. 이종성/외인성 핵산 및 단백질은 또한 외부 핵산 또는 단백질로 칭하여질 수 있다. 당해 기술분야의 통상의 기술자가 그 내부에서 발현되는 세포에 대하여 외부로서 인지하는 어느 핵산 또는 단백질은 본 명세서에 이종성 또는 외인성 핵산 또는 단백질로 포함된다. 용어 이종성 및 외인성은 또한 핵산 또는 아미노산 서열의 비-자연적 조합, 즉, 적어도 두개의 복합 서열이 서로에 대해 외래인 조합에 대해 적용된다.
효소의 "특이적 활성(specific activity)"은 본 명세서에서 총 숙주 세포 단백질의 양 당 특정 효소의 활성량을 의미하는 것으로 이해되며, 보통 총 숙주 세포 단백질 mg 당 효소 활성의 유닛으로 표현된다. 본 발명의 정황에서, 특정 효소의 특이적 활성은 (다른 동일한) 와일드 타입 숙주 세포에서 그 효소의 특이적 활성에 비해 증가 또는 감소될 수 있다.
"혐기적 조건(anaerobic conditions)" 또는 혐기적 발효 공정은 본 명세서에서 산소의 부재하에서 또는 실질적으로 산소가 소비되지 않는, 바람직하게 5, 2.5 또는 1mmol/L/h 이하, 또는 바람직하게 0 mmol/L/h가 소비되며(즉, 산소 소비가 검출불가한), 유기 분자가 전자 도너 및 전자 어셉터 모두로 제공되는 조건 또는 발효 공정 작업으로 정의된다.
도 1. 시간 경과(hours)에 따른 순 글리세롤 수준(g/l)(즉, 생산 - 소비)의 평가를 S. cerevisiae 스트레인 RN1041, RN1041+pRN595, RN1186, RN1187, RN1188 및 RN1189에 대해 나타내었다.
도 2. 시간 경과(hours)에 따른 순 아세트산 수준(g/l)(즉, 생산 - 소비)의 평가를 S. cerevisiae 스트레인 RN1041, RN1041+pRN595, RN1186, RN1187, RN1188 및 RN1189에 대해 나타내었다.
이스트에서 외인성 아세트알데히드 디하이드로게나아제의 발현은 이스트가 목질섬유 가수분해물에 고량 존재할 수 있는 아세트산을 에탄올로 전환하도록 해준다. 아세트산의 에탄올로의 NADH 의존적 환원은 에스. 세레비지아에(S. cerevisiae)의 혐기적 글루코즈-성장 배양에서 레독스 싱크(redox sink)로서 글리세롤 형성에 대한 대체물로서 제시되어, 이에 따라 산업적 에탄올 제조 중에 글리세롤 생성(부산물로서)의 제거에 대한 화학량론적 베이시스를 제공하며, 결과적으로 보다 높은 에탄올 수율을 제공한다(Guadalupe et al. 상기 참조). 그러나, 이러한 반응의 화학량론은 아세트산의 에탄올로의 한 분자의 환원은 2개의 글리세롤 분자를 필요로 하나 이러한 2개의 글리세롤 분자는 생성되지 않는다. 그러나, 본 발명자들은 산업적 목질섬유 가수분해물에 전형적으로 존재하는 아세트산의 양이 실제로 에탄올로 환원되는데 필요한 NADH의 양이 혐기적 조건하에서 성장되는 이스트에서 글리세롤 생성을 억제하는에 이용가능한 NADH의 양을 초과하는 것을 발견하였다. 본 발명자들은 이제 상당히 보다 많은 양의 아세트산이 글리세롤 생성 억제에 의한 것 보다는, 이스트에 의해 글리세롤의 동시적 소비에 의해 에탄올로 환원될 수 있음을 예기치 않게 발견하였다.
다량의 글리세롤이 식물성 오일 또는 동물 지방 및 알코올을 이용하여 트랜스에스테르화 반응으로부터 바이오디젤 생성시 부산물로서 생성된다. 크루드 글리세롤의 이용가능성은 따라서 전 세계적인 바이오디젤 생성의 성장 결과로 내년에 증가할 것으로 예상된다. 결론적으로, 다량의 글리세롤이 저가로 이용될 것이다. 본 발명은 예를 들어, 바이오디젤 생성으로부터 부산물로서 얻어지는 글리세롤을 바이오연료로 사용될 수 있는 에탄올로 전환시킴으로써 가치화하는 수단 및 방법을 제공한다. 동시에, 본 발명은 목질섬유 가수분해물에 존재하는 고량의 아세트산 및 이러한 가수분해물로부터 에탄올을 생성하는 이스트의 발효 성능을 저해하는 고량의 아세트산의 문제를 해소한다. 본 발명의 추가적인 이점은 본 발명의 이스트 세포에서 온전한 고-삼투성 글리세롤 반응 경로를 떠남으로써((모든) 글리세롤포스페이트 디하이드로게나아제가 Guadalupe 등(상기 참조)에 의해 기재된 바와 같이 불활성화되는 스트레인과 반대됨), 산업적 발효 조건하에서 발생할 수 있는 삼투성 스트레스를 더욱 잘 다스릴 수 있는 보다 강건한 이스트 스트레인이 획득되는 것이다.
제1견지로, 본 발명은 아세틸CoA를 아세트알데히드로 환원시키는 능력을 갖는 효소를 암호화하는 외인성 유전자를 포함하며, 상기 유전자는 아세트산을 에탄올로 전환시키는 능력을 세포에 부여하는 균류 숙주 세포에 관한 것이다. 아세틸CoA를 아세트알데히드로 환원시키는 능력을 가진 효소는 본 명세서에서 반응을 촉매하는 효소(ACDH; EC 1.2.1.10)로 이해된다.
아세트알데히드 + NAD+ + 조효소 A ↔ 아세틸-조효소 A + NADH + H+
따라서, 상기 효소는 아세틸CoA를 아세트알데히드로 전환(및 그 역도 같음)을 촉매하며, (아세틸레이팅 NDA-의존적) 아세트알데히드 디하이드로게나아제 또는 아세틸-CoA 환원효소로 칭하여진다. 상기 효소는 아세트알데히드의 에탄올로의 전환(및 그 역도 같은; 하기 참조)을 더욱 촉매하는 이중 기능성 효소일 수 있다. 편의상, 본 명세서에서 적어도 아세틸CoA를 아세트알데히드 또는 에탄올로 환원하는 능력을 가진 효소를 "아세트알데히드 디하이드로게나아제"라 칭한다. 또한, 균류 숙주 세포가 내인성 아세틸-CoA 합성효소 및 알코올 디하이드로게나아제 활성을 가지며, 아세트알데히드 디하이드로게나아제 활성과 함께 제공되는 세포가 아세트산의 에탄올로의 완전한 전환을 가능케 하는 것으로 이해된다.
외인성 유전자는 예를 들어, 이. 콜라이(E. coli) mhpF 유전자에 의해 암호화되는 아세트알데히드 디하이드로게나아제와 같은 아세트알데히드 디하이드로게나아제 활성만을 갖는 단일 기능 효소(즉, 아세틸CoA를 아세트알데히드로 환원하는 능력만을 갖는 효소)를 암호할 수 있다. 아세트알데히드 디하이드로게나아제 활성을 갖는 효소를 암호화하는 적절한 외인성 유전자는 SEQ ID NO: 1과 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 아세트알데히드 디하이드로게나아제 활성을 갖는 단일 기능 효소를 포함하는 원핵 생물의 적절한 예는 표 1에 제공된다. 이러한 단일 기능 효소의 아미노산 서열은 공개 데이터 베이스에서 이용가능하며, 이에 상응하는 단일 기능 효소를 암호화하는 코돈-최적화된 뉴클레오타이드 서열(참조 예, SEQ ID NO: 2)을 디자인하는데 통상의 기술자에 의해 사용될 수 있다.
이. 콜라이 ( E. coli ) mhpF 와 관련된 아세트알데히드 디하이드로게나아제 활성을 갖는 효소
유기체 아미노산 동일성 (%)
Escherichia coli str. K12 substr. MG1655 100%
Shigella sonnei 100%
Escherichia coli IAI39 99%
Citrobacter youngae ATCC 29220 93%
Citrobacter sp. 30_2 92%
Klebsiella pneumoniae 342) 87%
Klebsiella variicola 87%
Pseudomonas putida 81%
Ralstonia eutropha JMP134 82%
Burkholderia sp. H160 81%
Azotobacter vinelandii DJ 79%
Ralstonia metallidurans CH34 70%
Xanthobacter autotrophicus Py2 67%
Burkholderia cenocepacia J2315 68%
Frankia sp. EAN1pec 67%
Polaromonas sp. JS666 68%
Burkholderia phytofirmans PsJN 70%
Rhodococcus opacus B4 64%
바람직하게, 숙주 세포는 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 활성을 갖는 이중 기능성 효소를 암호화하며, 세포에 아세트산을 에탄올로 전환하는 능력을 부여하는 외인성 유전자를 포함한다. 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 각각의 활성에 대한 개별 효소에 비해, 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 활성을 갖는 이중 기능성 효소를 이용하는 이점은, 경로에서 연속적 반응을 촉매하는 효소들 사이에 중간물의 직접적인 채널링이 효율적이고, 독점적이고, 보호되는 수단의 대사물 운반을 제공할 수 있는 것이다. 이에 따라 기질 채널링은 중간물의 수송 시간을 감소시키고, 확산에 의한 중간물의 손실을 억제하고, 용매로부터 불안정한 중간물을 보호하고, 중간물의 경합 대사 경로로의 입장을 미연에 방지한다. 따라서, 이중 기능성 효소는 개별 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 효소에 비해 아세트산의 에탄올로의 보다 효율적인 전환을 가능케 한다. 이중 기능성 효소의 다른 이점은, 이는 또한 예를 들어, 혐기적 조건 및/또는 이화 대사 억제와 같은 사용되는 조건하에서 알코올 디하이드로게나아제 활성이 거의 없거나 전혀 없이 숙주 세포에서 사용될 수 있는 것이다.
아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 활성을 갖는 이중 기능성 효소는 원핵 생물 및 프로토조아 기술분야에 알려져 있으며, 예를 들어, 에스케리차 콜라이(Escherichia coli) adhE 및 엔타모에바 히스톨리티카(Entamoeba histolytica) ADH2 유전자에 의해 암호화되는 이중 기능성 효소를 포함한다(참조 Bruchaus and Tannich, 1994, J. Biochem. 303: 743-748; Burdette and Zeikus, 1994, J. Biochem. 302: 163-170; Koo et al., 2005, Biotechnol. Lett. 27: 505-510; Yong et al., 1996, Proc Natl Acad Sci USA, 93: 6464-6469). 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 활성을 갖는 이중 기능성 효소는 약 900 아미노산으로 구성되는 보다 큰 단백질이며, 이들은 아세트알데히드 디하이드로게나아제(ACDH; EC 1.2.1.10) 및 알코올 디하이드로게나아제 활성(ADH; EC 1.1.1.1) 모두를 나타내는 이중 기능성이다. E. coli adhE과 Entamoeba histolytica ADH2는 45% 아미노산 동일성을 나타낸다. 따라서, 본 발명의 일 구현으로, 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 활성을 갖는 이중 기능성 효소을 암호화하는 적절한 외인성 유전자는 SEQ ID NO: 3 중 적어도 하나의 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 활성을 갖는 이중 기능성 효소를 포함하는 원핵 생물의 적절한 예는 표 2 및 3에 제공된다. 이러한 이중 기능성 효소의 아미노산 서열은 이에 상응하는 이중 기능성 효소를 암호화하는 코돈-최적화된 뉴클레오타이드 서열(참조 예, SEQ ID NO: 4 또는 6)을 디자인하기 위해 공개된 데이타 베이스에서 이용가능하며, 통상의 기술자에 의해 사용될 수 있다.
E. coli adhE 와 관련된 아세트알데히드 디하이드로게나아제 및 알코올 디하 이드로게나아제 활성을 갖는 이중 기능성 효소
유기체 아미노산 동일성 (%)
Escherichia coli O157:H7 str. Sakai 100%
Shigella sonnei 100%
Shigella dysenteriae 1012 99%
Klebsiella pneumoniae 342 97%
Enterobacter sp. 638 94%
Yersinia pestis biovar Microtus str. 91001 90%
Serratia proteamaculans 568 90%
Pectobacterium carotovorum WPP14 90%
Sodalis glossinidius str. 'morsitans' 87%
Erwinia tasmaniensis Et1/99 86%
Aeromonas hydrophila ATCC 7966 81%
Vibrio vulnificus YJ016] 76%
Entamoeba histolytica ADH2 와 관련된 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 활성을 갖는 이중 기능성 효소
유기체 아미노산 동일성 (%)
Entamoeba histolytica HM-1:IMSS 99%
Entamoeba dispar SAW760 98%
Mollicutes bacterium D7 65%
Fusobacterium mortiferum ATCC 9817 64%
Actinobacillus succinogenes 130Z 63%
Pasteurella multocida Pm70 62%
Mannheimia succiniciproducens MBEL55E 61%
Streptococcus sp. 2_1_36FAA] 61%
아세트알데히드 디하이드로게나아제 활성을 갖는 효소에 있어서, 아세트알데히드 디하이드로게나아제 및 알코올 디하이드로게나아제 활성을 갖는 이중 기능성 효소를 암호화하는 외인성 유전자는 바람직하게 본 발명의 숙주 세포내로 발현 구조물의 트랜스포메이션시 효소의 발현을 확실히 하도록 적절한 발현 조절 부위/서열에 작동가능하게 연결된 효소를 암호화하는 뉴클레오타이드 서열을 포함하는 발현 구조물이다. 따라서, 유전자 또는 발현 구조물은 암호 서열에 작동가능하게 연결된 숙주 세포에 기능적인 프로모터를 적어도 포함할 것이다. 유전자 또는 구조물은 암호 부위의 상향흐름의 5' 리더 서열 및 암호화 서열의 하향흐름의 폴리아데닐화 부위 및 전사 종결 부위를 포함하는 3'-비번역 서열(3'말단)을 더 포함할 수 있다.
일 견지로 본 발명은 본 발명의 이스트 세포를 제조 및 구축하는 방법에 관한 것이다. 이러한 목적으로, 표준 유전학 및 분자생물학 기술이 사용되며, 이는 일반적으로 당해 기술분야에 알려져 있으며, 예를 들어, Sambrook and Russell (2001, "Molecular cloning: a laboratory manual" (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press) and Ausubel et al. (1987, eds., "Current protocols in molecular biology", Green Publishing and Wiley Interscience, New York)에 기술되어 있다. 또한, 돌연변이된 숙주 이스트 스트레인의 구축은 결과적으로 형성된 디플로이드의 유전학적 크로스, 포자형성, 원하는 영양요구성 마커를 함유하는 하플로이드 스포어의 테트라드 절개 및 적절한 선별 배지에서 이러한 하플로이드 숙주 이스트의 콜로니 정제에 의해 수행된다. 이러한 모든 방법들은 당해 기술분야에 알려진 표준 이스트 유전학 방법이다. 참조 예, Sherman et al., Methods Yeast Genetics, Cold Spring Harbor Laboratory, NY (1978) and Guthrie et al. (Eds.) Guide To Yeast Genetics and Molecular Biology Vol. 194, Academic Press, San Diego (1991).
아세트알데히드 디하이드로게나아제 및 선택적으로 알코올 디하이드로게나아제 활성을 갖는 효소 (뿐만 아니라 하기 본 발명의 다른 효소)를 암호화하는 뉴클레오타이드 서열의 발현을 위한 적절한 프로모터는 바람직하게, 이화 생성물(글루코즈) 억제에 민감하지 않으며, 혐기적 조건하에서 활성적이며 그리고/또는 바람직하게 유도를 위해 자일로즈 또는 아라비노즈를 필요로 하지 않는 프로모터들을 포함한다. 이러한 특성을 갖는 프로모터는 광범위하게 이용가능하며, 통상의 기술자에 의해 알려져 있다. 이러한 프로모터의 적절한 예는 이스트의 프로모터들인, 포스포프룰토키나아제(PPK), 트리오즈 포스페이트 이소머라아제(TPI), 글리세르알데히드-3-포스페이트 디하이드로게나아제(GDP , TDH3 또는 GAPDH), 피루베이트 키나아제(PYK), 포스포글리세레이트 키나아제(PGK), 글루코즈-6-포스페이트 이소머라아제 프로모터(PG11)와 같은 당분해 유전자의 프로모터를 포함한다. 이스트의 이러한 프로모터들에 대한 보다 상세한 사항은 (WO 93/03159)에서 찾아볼 수 있다. 다른 유용한 프로모터는 리보좀 단백질 암호 유전자 프로모터(TEF1), 락타아제 유전자 프로모터(LAC4), 알코올 디하이드로게나아제 프로모터(ADH1, ADH4 등), 에놀라아제 프로모터(ENO) 및 헥소즈(글루코즈) 트랜스포터 프로모터(HXT7)이다. 변형적으로, 아세트알데히드 디하이드로게나아제 및 선택적으로 알코올 디하이드로게나아제 활성을 갖는 효소를 암호화하는 뉴클레오타이드 서열은 S. cerevisiae ANB1 프로모터(SEQ ID NO: 19)와 같은 무산소 프로모터를 이용하여 혐기적 조건하에서 과발현된다. 모두 구성적이며 유도적인 다른 프로모터들 및 인핸서 또는 상향흐름 활성화 서열은 당해 기술분야의 통상의 기술자에게 알려져 있다. 바람직하게, 상기 정의된 뉴클레오타이드 서열에 작동가능하게 연결된 프로모터는 숙주 세포에 동종성이다. 적절한 종결 서열은 예를 들어 시토크롬 c1(CYC1) 유전자 또는 알코올 디하이드로게나아제 유전자(예, ADH1)로부터 획득가능하다.
아세트알데히드 디하이드로게나아제 및 선택적으로 알코올 디하이드로게나아제 활성을 갖는 효소가 본 발명의 형질전환된 숙주 세포에서 충분한 수준으로 그리고 활성적인 형태로 발현되는 가능성을 증가시키기 위해, 이러한 효소를 암호화하는 뉴클레오타이드 서열뿐만 아니라, 본 발명의 다른 효소(하기 참조)는 바람직하게 문제의 숙주 세포의 효소에 대해 이들의 코돈 사용을 최적화하도록 개작된다. 숙주 세포의 코돈 사용에 대한 효소를 암호화하는 뉴클레오타이드 서열의 적용성은 코돈 적응 지수(CAI)로 표현될 수 있다. 코돈 적응 지수는 본 명세서에서 특정 숙주 세포 또는 유기체에서 고 발현되는 유전자의 코돈 사용에 대한 유전자의 코돈 사용의 상대적 적응성의 측정으로 정의된다. 각 코돈의 상대적 적응성(w)은 각 코돈의 동일한 아미노산에 대한 가장 풍부한 코돈의 적응성에 대한 사용의 비율이다. CAI 지수는 이러한 상대적인 적응성 값의 기하학적 평균으로 정의된다. 비슷하지 않은 코돈 및 종결 코돈(유전학적 암호에 따라 달라짐)은 배제된다. CAI 값은 0 내지 1이며, 보다 높은 값은 보다 높은 비율의 가장 풍부한 코돈을 나타낸다(Sharp and Li , 1987, Nucleic Acids Research 15: 1281-1295; also see: Jansen et al., 2003, Nucleic Acids Res. 31(8):2242-51). 적응된 뉴클레오타이드 서열은 바람직하게 적어도 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8 또는 0.9의 CAI를 갖는다. 가장 바람직하게 예를 들어, S. cerevisiae 세포와 같은 문제의 균류 숙주 세포에서 발현을 위하 코돈 최적화된 서열이다.
상기 뉴클레오타이드 서열은, 바람직하게 형질전환된 숙주 세포에서 활성 형태로 발현되는 아세트알데히드 디하이드로게나아제 및 선택적으로 알코올 디하이드로게나아제 활성을 갖는 효소를 암호화한다. 따라서, 숙주 세포에서 상기 뉴클레오타이드 서열의 발현은 본 명세서에 실시예에 기재된 바와 같이 30℃에서 형질전환된 숙주 세포의 세포 추출물에서 아세틸-CoA 의존적 NADH 환원비로 측정시 적어도 0.005, 0.010, 0.020, 0.050 또는 0.10μmol min-1 (mg protein)-1의 특정 활성을 갖는 아세트알데히드 디하이드로게나아제를 생성한다.
아세트알데히드 디하이드로게나아제 및 선택적으로 알코올 디하이드로게나아제 활성을 갖는 효소를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산 구조물로 형질전환되는 숙주 세포는 바람직하게 이스트 숙주 세포이다. 바람직하게, 상기 숙주 세포는 배양된 세포이다. 본 발명의 숙주 세포는 바람직하게 펜토즈(자일로즈 및 바람직하게 또한 아라미노즈)를 세포내로 능동적 또는 수동적으로 수송할 수 있는 숙주이다. 상기 숙주 세포는 바람직하게 활성 당분해를 함유한다. 상기 숙주 세포는 또한 바람직하게, 자일로즈로부터 이소머화된 자일룰로즈가 피루베이트로 대사될 수 있도록, 내인성 펜토즈 포스페이트 경로를 함유하며, 내인성 자일룰로즈 키나아제 활성을 함유할 수 있다. 상기 숙주는 또한 바람직하게 에탄올, 락틱산, 3-히드록시-프로피온산, 아크릴산, 1,3-프로판-디올, 부탄올(1-부탄올, 2-부탄올, 이소부탄올) 및 이소프레노이드-유래 산물과 같은 원하는 발효 산물로의 (바람직하게 피루베이트를 통해) 펜토즈의 전환을 위한 효소 함유한다. 특히 바람직한 숙주 세포는 자연적으로 알코올 발효가능한, 바람직하게는 혐기적 알코올 발효가능한 이스트 세포이다. 이스트 숙주 세포는 또한 바람직하게 에탄올에 대해 높은 내성, 저 pH에 높은 내성(즉, pH 5, 4 또는 3이하에서 성장이 가능함)을 가지며, 프루프랄 및 히드록시-메틸프루프랄과 같은 락틱산, 아세트산 또는 포름산 및 당 분해물과 같은 유기산에 대해 높은 내성을 가지며, 그리고 상승된 온도에 대해 높은 내성을 갖는다. 상기 숙주 세포의 이러한 어느 특성 또는 활성은 숙주 세포에 자연적으로 존재하거나 또는 유전적 변형에 의해 도입되거나 변형될 수 있으며, 바람직하게는 자가 클로닝에 의해 또는 하기 본 발명의 방법에 의해 도입되거나 변형될 수 있다. 적절한 세포는 배양된 세포, 예를 들어 수중 또는 고상 발효에서와 같은 발효 공정에서 배양될 수 있는 세포이다. 특히 적절한 세포는 예를 들어, 균류와 같은 진핵 미생물이나, 본 발명에 사용되기에 가장 적절한 것은 이스트이다.
본 명세서에서 이스트는 진행 미생물로서 정의되며, 주로 단세포 형태로 성장하는 모든 하위 분류의 진균류종을 포함한다(Yeasts: characteristics and identification, J.A. Barnett, R.W. Payne, D. Yarrow, 2000, 3rd ed., Cambridge University Press, Cambridge UK; and, The yeasts, a taxonomic study, C.P. Kurtzman and J.W. Fell (eds) 1998, 4th ed., Elsevier Science Publ. B.V., Amsterdam, The Netherlands). 이스트는 단세포 엽상체의 출아에 의해 성장하거나 유기체의 분열에 의해 성장할 수 있다. 본 발명에 사용하기에 바람직한 이스트 세포는 속 Saccharomyces, Kluyveromyces, Candida, Pichia , Schizosaccharomyces, Hansenula, Kloeckera, Schwanniomyces, 및 Yarrowia 에 속한다. 바람직하게 상기 이스트는 혐기적 발효가 가능하며, 보다 바람직하게 혐기적 알코올 발효가 가능하다. 수년간, 당료 작물로부터 바이오-에탄올의 생성을 위한 다양한 미생물의 도입에 대한 제안이 이루어져 왔다. 그러나, 실제로, 모든 주요 바이오-에탄올 생성 공정은 에탄올 생산자로서 속 Saccharomyces의 이스트를 계속 사용하였다. 이는 산업적 공정을 위한 Saccharomyces의 많은 매력적 특징들, 즉, 높은 산-, 에탄올- 및 삼투압-내성, 혐기적 성장의 능력 및 물론 이의 높은 알코올 발효 성능에 기인한다. 숙주 세포로서 바람직한 이스트종은 S. cerevisiae, S. exiguus, S. bayanus, K. lactis , K. marxianus Schizosaccharomyces pombe를 포함한다.
다른 구현으로, 본 발명의 숙주 세포는 세포안에 NAD+-결합된 글리세롤 디하이드로게나아제 활성을 도입하는 유전적 변형을 더 포함한다. 내인성 이스트 GCY1 유전자에 의해 암호화되는 글리세롤 디하이드로게나아제는 NAD+(EC 1.1.1.6)과 상반적으로 보조인자 NADP+(EC 1.1.1.72)에 특이적인 것으로 나타났다. S. cerevisiae와 같은 이스트는 NAD+-의존적 글리세롤 디하이드로게나아제 활성이 결여된 것으로 나타났다(EC 1.1.1.6) (참조 예. KEGG pathway 00561). NAD--결합된 글리세롤 디하이드로게나아제는 본 명세서에서 화학 반응을 촉매하는 효소로 이해된다(EC 1.1.1.6).
글리세롤 + NAD+ ↔ 글리세론 + NADH + H+
일반적으로 사용되는 다른 명칭은 글리세린 디하이드로게나아제 및 글리세롤:NAD+ 2-옥시도리덕타아제를 포함한다.
바람직하게, 숙주 세포에 NAD+-결합 글리세롤 디하이드로게나아제 활성을 도입하는 유전학적 변형은 숙주 세포에 이종성인 NAD+-결합 글리세롤 디하이드로게나아제의 발현이다. 보다 바람직하게, 본 발명의 세포에서 이종성 글리세롤 디하이드로게나아제의 발현을 위한 뉴클레오타이드 서열은 보조인자로서 NAD+를 사용하는 박테리아 글리세롤 디하이드로게나아제를 암호화하는 서열이다. 본 발명의 숙주 세포에서 발현을 위한 박테리아 NAD+-결합 글리세롤 디하이드로게나아제의 적절한 예는 예를 들어, Truniger 및 Boos(1994, J Bacteriol. 176(6):1796-1800)에 기재된 E. coligldA 유전자이며, 이스트에서 이의 발현은 이미 보고된바 있다(Lee 및 Dasilva, 2006, Metab Eng. 8(1):58-65). 바람직하게, 이종성 글리세롤 디하이드로게나아제를 암호화하는 뉴클레오타이드 서열은 SEQ ID NO: 7과 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열 또는 SEQ ID NO: 7과 비교하여 하나 또는 여러 개의 치환, 삽입 및/또는 결실을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 바람직한 구현으로, 상기 이종성 글리세롤 디하이드로게나아제를 암호화하는 코돈-최적화된(상기 참조) 뉴클레오타이드 서열은, 예를 들어, SEQ ID NO: 7의 글리세롤 디하이드로게나아제의 아미노산 서열을 암호화하는 코돈-최적화된 뉴클레오타이드 서열과 같이 과발현된다. 이러한 코돈-최적화된 뉴클레오타이드 서열은 SEQ ID NO: 21(위치 10 - 1113; CAI = 0.976)에 제공된다.
상기 글리세롤 디하이드로게나아제를 암호화하는 뉴클레오타이드 서열의 과발현을 위해, (발현될) 상기 뉴클레오타이드 서열은 본 발명의 숙주 세포내로 발현 구조물의 형질전환시 글리세롤 디하이드로게나아제 효소의 과발현을 확실히 하도록 적절한 발현 조절 부위/서열에 작동가능하게 연결되는 발현 구조물에 넣어진다(상기 참조). 글리세롤 디하이드로게나아제 활성을 갖는 효소를 암호화하는 뉴클레오타이드 서열의 (과)발현을 위해 적절한 프로모터는, 바람직하게 이화대사(글루코즈) 억제에 민감하지 않으며, 혐기적 조건하에서 활성적이며 그리고/또는 바람직하게 유도를 위해 자일로즈 또는 아라비노즈를 필요로 하지 않는 프로모터들을 포함한다.
이러한 프로모터들의 예는 상기 주어진다. 숙주 세포에서 뉴클레오타이드 서열의 발현은 본 실시예에 기재된 바와 같이 30℃에서 형질전환된 숙주 세포의 세포 추출물에서 측정시 적어도 0.2, 0.5, 1.0, 2.0, or 5.0 U min-1 (mg protein)-1의 특이적 NAD+-결합 글리세롤 디하이드로게나아제 활성을 생성한다.
다른 구현으로, 본 발명의 숙주 세포는 또한 세포에서 히히드록시아세톤 키나아제의 특이적 활성을 증가시키는 유전적 변형을 포함한다. 내인성 DAK1 디히드록시아세톤 키나아제가 이미 S. cerevisiae에서 고 수준으로 발현되는 것으로 전사체 데이터는 보여주었다. 본 발명의 세포에서 디히드록시아세톤 키나아제 활성의 추가 증가는 따라서 엄격히 필요하지 않을 수 있다. 그러나, 바람직한 구현으로, 최적 전환율을 위해, 따라서 본 발명의 숙주 세포는 세포내에 디히드록시아세톤 키나아제의 특이적 활성을 증가시키는 유전적 변형을 포함한다. 디히드록시아세톤 키나아제는 본 명세서에서 화학반응(EC 2.7.1.29)을 촉매하는 효소로 이해된다:
ATP + 글리세론 ↔ ADP + 글리세론 포스페이트
일반적으로 사용되는 다른 명칭은 글리세론 키나아제, ATP:글리세론 포스포트랜스퍼라아제 및 (포스포릴화) 아세톨 키나아제를 포함한다. 글리세론 및 디히드록시아세톤은 동일한 분자인 것으로 이해된다. 바람직하게, 유전적 변형은 예를 들어, 디히드록시아세톤 키나아제를 암호화하는 뉴클레오타이드 서열의 과발현에 의해 디히드록시아세톤 키나아제의 과발현을 일으킨다. 디히드록시아세톤 키나아제를 암호화하는 뉴클레오타이드 서열은 세포에 내인성이거나 또는 세포에 이종성인 디히드록시아세톤 키나아제일 수 있다. 본 발명의 세포에서 디히드록시아세톤 키나아제의 과발현에 사용될 수 있는 뉴클레오타이드 서열은 예를 들어, Molin et al(2003, J. Biol. Chem. 278:1415-1423)에 의해 기재된 S. cerevisiae의 디히드록시아세톤 키나아제 유전자(DAK1) 및 (DAK2)이다. 바람직하게, 디히드록시아세톤 키나아제를 암호화하는 뉴클레오타이드 서열은 SEQ ID NOs: 8 및 9 중 적어도 하나와 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다. 바람직한 구현으로, 디히드록사아세톤 키나아제를 암호화하는 코돈-최적화된(상기 참조) 뉴클레오타이드 서열은, 예를 들어, SEQ ID NO: 8의 디히드록시아세톤 키나아제를 암호화하는 코돈 최적화된 뉴클레오타이드 서열 또는 SEQ ID NO: 9의 디히드록시아세톤 키나아제를 암호화하는 코돈 최적화된 뉴클레오타이드 서열과 같이 과발현된다. 디히드록시아세톤 키나아제의 과발현을 위한 바람직한 뉴클레오타이드 서열은 디히드록시아세톤 키타아제를 암호화하는 뉴클레오타이드 서열이며, SEQ ID NOs: 8(S. cerevisiae(DAK1)) 또는 SEQ ID NO: 8과 비교하여 하나 또는 여러 개의 치환, 삽입 및/또는 결실을 갖는 것 중 적어도 하나와 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다.
본 발명의 세포에서 이종성 디히드록시아세톤 키나아제의 과발현에 사용될 수 있는 뉴클레오타이드 서열은 예를 들어, Daniel 등(1995, J. Bacteriol. 177:4392-4401)에 의해 기재된 Citobacter freundiidhaK 유전자와 같은 박테리아 디히드록시아세톤 키나아제를 암호화하는 서열이다. 바람직하게, 이종성 디히드록시아세톤 키나아제를 암호화하는 뉴클레오타이드 서열은 SEQ ID NO: 25와 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열 또는 SEQ ID NO: 25와 비교하여 하나 또는 여러 개의 치환, 삽입 및/또는 결실을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 바람직한 구현으로, 이종성 디히드록시아세톤 키나아제를 암호화하는 코돈-최적화된(상기 참조) 뉴클레오타이드 서열은, 예를 들어 SEQ ID NO: 25의 디히드록시아세톤 키나아제의 아미노산 서열을 암호화하는 코돈 최적화된 뉴클레오타이드 서열과 같이 과발현된다. 이러한 코돈-최적화된 뉴클레오타이드 서열은 예를 들어, SEQ ID NO: 26(위치 10 - 1668)에 제공된다.
디히드록시아세톤 키나아제를 암호화하는 뉴클레오타이드 서열의 과발현을 위해, (과발현되는) 뉴클레오타이드 서열은 바람직하게 본 발명의 숙주 세포내로 발현 구조물의 형질전환시 디히드록시아세톤 키나아제 효소의 과발현을 확실히 하도록 적절한 발현 조절 부위/서열에 작동가능하게 연결된 발현 구조물에 넣어진다(상기 참조). 디히드록시아세톤 키나아제 활성을 갖는 효소를 암호화하는 뉴클레오타이드 서열의 (과)발현을 위해 적절한 프로모터는, 바람직하게 이화대사(글루코즈) 억제에 민감하지 않으며, 혐기적 조건하에서 활성적이며 그리고/또는 바람직하게 유도를 위해 자일로즈 또는 아라비노즈를 필요로 하지 않는 프로모터들을 포함한다. 이러한 프로모터들의 예는 상기에 주어진다. 본 발명의 세포에서, 과발현되는 디히드록시아세톤 키나아제는 바람직하게 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인과 비교하여 적어도 팩터 1.1, 1.2, 1.5, 2, 5, 10 또는 20이 과발현된다. 바람직하게, 상기 디히드록시아세톤 키나아제는 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인과 비교하여 적어도 팩터 1.1, 1.2, 1.5, 2, 5, 10 또는 20이 혐기적 조건하에서 과발현된다. 이러한 수준의 과발현은 세포에서 안정한 상태 수준의 효소의 활성(세포에서 특이적 활성), 안정한 상태 수준의 효소의 단백질뿐만 아니라, 안정한 상태 수준의 효소를 암호하는 전사체에 적용될 수 있는 것으로 이해된다. 숙주 세포에서 뉴클레오타이드 서열의 과발현은 본 명세서에서 실시예에 기재된 바와 같이 30℃에서 형질전환된 숙주 세포의 세포 추출물에서 검출시, 적어도 0.002, 0.005, 0.01, 0.02 또는 0.05 U min-1(mg protein)-1의 특이적 디히드록시아세톤 키나아제 활성을 생성한다.
다른 구현으로, 본 발명의 숙주 세포는 또한 글리세롤의 세포내로의 수송을 증가시키는 유전적 변형을 포함한다. 바람직하게, 글리세롤의 세포내로의 수송을 증가시키는 유전적 변형은 바람직하게 글리세롤 흡수 단백질 및 글리세롤 채널 중 적어도 하나를 암호화하는 뉴클레오타이드 서열의 관발현을 일으키는 유전적 변형이다.
글리세롤 흡수 단백질은 본 명세서에서, 예를 들어, GUP1 및 GUP2 유전자에 의해 암호화되는 S. cerevisiae 글리세롤 흡수 단백질을 포함하는 멤브레인 바운드 O-아실트랜스퍼라아제(MBOAT) 수퍼패밀리에 포함되는 것들에 속하는 멀티멤브레인-스패닝 단백질로 이해된다. 바람직하게, 상기 유전적 변형은 예를 들어, 글리세롤 흡수 단백질을 암호화하는 뉴클레오타이드 서열의 과발현에 의해 글리세롤 흡수 단백질의 과발현을 일으킨다. 글리세롤 흡수 단백질을 암호화하는 뉴클레오타이드 서열은 상기 세포에 내인성이거나 또는 상기 세포에 이종성인 글리세롤 흡수 단백질일 수 있다. 본 발명의 세포에서 글리세롤 흡수 단백질의 과발현에 사용될 수 있는 뉴클레오타이드 서열은 예를 들어, Neves 등(2004, FEMS Yeast Res. 5:51-62)에 의해 기재된 바와 같은, 예를 들어, S. cerevisiae (GUP1) 및 (GUP2)의 글리세롤 흡수 단백질 유전자 및 이의 상동 유전자이다. 바람직하게, 상기 글리세롤 흡수 단백질을 암호화하는 뉴클레오타이드 서열은 SEQ ID NO's: 10(Gup1p) 및 11(Gup2p) 중 적어도 하나와 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 바람직한 구현으로, 글리세롤 흡수 단백질을 암호화하는 코돈-최적화된(상기 참조) 뉴클레오타이드 서열은, 예를 들어, SEQ ID NO: 10의 글리세롤 흡수 단백질을 암호화하는 코돈 최적화된 뉴클레오타이드 서열 또는 SEQ ID NO: 11의 글리세롤 흡수 단백질을 암호화하는 코돈 회적화된 뉴클레오타이드 서열과 같이 과발현된다. 글리세롤 수송에 대한 GUP1의 영향의 정확한 특성이 아직 불투명함에도 불구하고, Yu 등(2010, 상기 참조)은 S. cerevisiae에서 GUP1의 과발현이 글리세롤 성장 세포에서 에탄올 생성을 향상시키는 것으로 나타났다. 글리세롤 흡수 단백질의 과발현에 대한 바람직한 뉴클레오타이드 서열은 따라서 Neves 등(2004, 상기 참조)에 의해 기술된 바와 같은 상보성에 의해 S. cerevisiae gup1 Δ 돌연변이의 염 스트레스-관련 표현형을 구조할 수 있는 글리세롤 흡수 단백질을 암호화하는 뉴클레오타이드 서열이다. 이러한 S. cerevisiae GUP1의 상보성 상동 유전자는 SEQ ID NO: 10의 아미노산 서열과 적어도 60, 68, 72, 75, 80, 85, 90, 95, 98, 99% 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함하며, Saccharomyces, Zygosaccharomyces, Kluyveromyces, Candida, Pichia, Hansenula, Kloeckera, Schwanniomyces, 및 Yarrowia의 속에 속하는 이스트종으로부터 획득될 수 있다.
본 명세서에서 글리세롤 채널은 Reizer 등(1993, CRC Crit. Rev. Biochem. Mol. Biol., 28: 235-257)에 의해 리뷰된 MIP과의 채널 단백질의 멤버로서 이해되며, 이 채널 단백질은 6 멤브래인-스패닝 도메인으로 구성되는 250-280 아미노산 트랜스멤브레인 도메인을 포함하며, S. cerevisiae FPS1 아쿠아글리세로포린, SEQ ID NO: 12의 아미노산 250 및 530 사이의 아미노산 서열과 적어도 30, 35, 40, 45, 50, 60, 70, 80, 90, 95, 98 또는 99% 아미노산 동일성, 또는 적어도 55, 60, 65, 70, 80, 90, 95, 98 또는 99% 아미노산 동일성을 갖는다. 본 발명의 세포에서 글리세롤 채널의 과발현에 사용될 수 있는 뉴클레오타이드 서열은 예를 들어, S. cerevisiae의 이스트 아쿠아글리세로포린 FPS1 유전자(Van Aelst et al., 1991, EMBO J. 10:2095-2104) 및 예를 들어, Neves 등(2004, 상기 참조)에 의해 기재된 바와 같은 Kluyveromyces lactis, Kluyveromyces marxianusZygosaccharomyces rouxii 를 포함하는 다른 이스트들의 이의 상동 유전자를 암호화하는 뉴클레오타이드 서열을 포함한다. 그러나, 예를 들어, Luyten 등(1995, EMBO J. 14:1360-1371)이 S. cerevisiae FPS1 아쿠아글리세로포린의 아미노산 250 내지 530 사이의 아미노산 서열과 단지 30% 서열 동일성을 갖는 E. coli 글리세롤 패실리태이터가 S. cerevisiae fps1 Δ 돌연변이에서 상보적인 글리세롤 흡수를 할 수 있다는 것을 보여준 바와 같이, 박테리아 또는 식물 글리세롤 채널의 사용이 배제되지 않는다. 글리세롤 채널을 암호화하는 뉴클레오타이드 서열은 세포에 내인성이거나 또는 세포에 외인성인 글리세롤 채널일 수 있다. 바람직한 구현으로, SEQ ID NO: 12의 아쿠아글리세로포린을 암호화하는 코돈 최적화된 뉴클레오타이드 서열과 같이 글리세롤 채널을 암호화하는 코돈-최적화된(상기 참조) 뉴클레오타이드 서열은 과발현된다.
글리세롤 흡수 단백질 및/또는 글리세롤 채널 단백질을 암호화하는 뉴클레오타이드 서열의 과발현을 위해, (과발현되는) 뉴클레오타이드 서열은 바람직하게 본 발명의 숙주 세포내로 발현 구조물의 형질전환시 글리세롤 흡수 단백질 및/또는 글리세롤 채널 단백질의 과발현을 확실히 하도록 적절한 발현 조절 부위/서열에 작동가능하게 연결된 발현 구조물에 넣어진다(상기 참조). 글리세롤 흡수 단백질 및/또는 글리세롤 채널 단백질을 암호화하는 뉴클레오타이드 서열의 (과)발현을 위해 적절한 프로모터는, 바람직하게 이화대사(글루코즈) 억제에 민감하지 않으며, 혐기적 조건하에서 활성적이며 그리고/또는 바람직하게 유도를 위해 자일로즈 또는 아라비노즈를 필요로 하지 않는 프로모터들을 포함한다. 이러한 프로모터들의 예는 상기에 주어진다. 본 발명의 세포에서, 과발현되는 글리세롤 흡수 단백질 및/또는 글리세롤 채널 단백질은 바람직하게 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인과 비교하여 적어도 팩터 1.1, 1.2, 1.5, 2, 5, 10 또는 20이 과발현된다. 바람직하게, 상기 글리세롤 흡수 단백질 및/또는 글리세롤 채널 단백질은 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인과 비교하여 적어도 팩터 1.1, 1.2, 1.5, 2, 5, 10 또는 20이 혐기적 조건하에서 과발현된다. 이러한 수준의 과발현은 세포에서 안정한 상태 수준의 효소의 활성(세포에서 특이적 활성), 안정한 상태 수준의 효소의 단백질뿐만 아니라, 안정한 상태 수준의 효소를 암호하는 전사체에 적용될 수 있는 것으로 이해된다.
본 발명의 숙주 세포의 바람직한 구현으로, 상기 정의된 글리세롤 채널 단백질의 발현은 감소되거나 불활성화된다. 글리세롤 채널 단백질의 발현을 감소시키거나 불활성화시키는 유전적 변형은 세포 외로 글리세롤의 수송을 감소 또는 억제하는데 유용할 수 있다. 바람직하게, 글리세롤 채널 단백질의 발현의 감소 또는 불활성화는 상기 정의한 바와 같이 글리세롤 흡수 단백질을 암호화하는 뉴클레오타이드 서열의 과발현과 조합된다.
다른 구현으로, 본 발명의 숙주 세포는 또한 세포에서, 특이적 아세틸-CoA 합성 효소 활성을 증가시키는, 바람직하게 이러한 활성이 이러한 조건하에서 속도-제한되는 혐기적 조건하에서, 특이적 아세틸-CoA 합성 효소 활성을 증가시키는 유전적 변형을 포함한다. 아세틸-CoA 합성효소 또는 아세테이트-CoA 리가아제(EC 6.2.1.1)는 본 명세서에서 아세테이트와 조효소 A(CoA) 사이의 새로운 화학 결합의 형성을 촉매하는 효소로 이해된다. 바람직하게, 유전적 변형은 예를 들어, 아세틸-CoA 합성효소를 암호화하는 뉴클레오타이드 서열의 과발현에 의해 아세틸-CoA 합성효소의 과발현을 일으킨다. 아세틸-CoA 합성효소를 암호화하는 뉴클레오타이드 서열은 세포에 내인성이거나 또는 세포에 이종성인 아세틸-CoA 합성효소일 수 있다. 본 발명의 세포에서 아세틸-CoA 합성효소의 과발현에 사용될 수 있는 뉴클레오타이드 서열은 예를 들어, Jong-Gubbels 등(1998, FEMS Microbiol Lett. 165: 15-20)에 의해 기술된 바와 같이, S. cerevisiae (ACS1ACS2)의 아세틸-CoA 합성효소 유전자이다. 바람직하게, 아세틸-CoA 합성효소를 암호화하는 뉴클레오타이드 서열은 SEQ ID NOs: 13 및 14 중 적어도 하나와 적어도 45, 50, 60, 65, 70, 75, 80, 85, 90, 95, 98, 99% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다.
일 구현으로, 과발현되는 뉴클레오타이드 서열은 아세테이트에 대해 고 친화도로 아세틸-CoA 합성효소를 암호화한다. 아세테이트에 대해 고 친화도를 갖는 아세틸-CoA 합성효소의 사용은, 예를 들어 배지 L당 2g 이하의 아세트산과 같이 배지내에 상대적으로 저 농도의 아세트산이 존재하는 조건하에서 행하는 것이 바람직하다. 아세테이트에 대해 고 친화도를 갖는 아세틸-CoA 합성효소는 S. cerevisiae ACS2에 의해 암호화되는 아세틸-CoA 합성효소보다 더 높은 아세테이트 친화도를 갖는 아세틸-CoA 합성효소로 정의된다. 바람직하게, 아세테이트에 대해 고 친화도를 갖는 아세틸-CoA 합성효소는 S. cerevisiae ACS1 유전자에 의해 암호화되는 아세틸-CoA 합성효소와 같이 10, 5, 2, 1, 0.5, 0.2 또는 0.1 mM 이하의 아세테이트에 대한 Km을 갖는다. 보다 바람직하게 SEQ ID NO: 13의 아미노산 서열을 암호화하는 코돈-최적화된(상기 참조) 뉴클레오타이드 서열이 과발현된다.
다른 구현으로, 과발현되는 뉴클레오타이드 서열은 높은 최대 속도(Vmax)로 아세틸-CoA 합성효소를 암호화한다. 높은 최대 속도로 아세틸-CoA 합성효소의 사용은, 예를 들어, 배지 L당 적어도 2, 3, 4 또는 5g 아세트산과 같이 배지내에 상대적으로 높은 농도의 아세트산이 존재하는 조건하에서 수행되는 것이 바람직하다. 높은 최대 속도를 갖는 아세틸-CoA 합성효소는 본 명세서에서 S. cerevisiae ACS1에 의해 암호화되는 아세틸-CoA 합성효소보다 더 높은 최대 속도를 갖는 아세틸-CoA 합성효소로 정의된다. 바람직하게, 높은 최대 속도를 갖는 아세틸-CoA 합성효소는 S. cerevisiae ACS2 유전자 의해 암호화되는 아세틸-CoA 합성효소이다. 보다 바람직하게, SEQ ID NO: 14의 아미노산 서열을 암호화하는 코돈-최적화된(상기 참조) 뉴클레오타이드 서열이 과발현된다.
(과발현되는) 아세틸-CoA 합성효소를 암호화하는 뉴클레오타이드 서열의 과발현을 위해, (과발현되는) 뉴클레오타이드 서열은 바람직하게 본 발명의 숙주 세포내로 발현 구조물의 형질전환시 아세틸-CoA 합성효소의 과발현을 확실히 하도록 적절한 발현 조절 부위/서열에 작동가능하게 연결된 발현 구조물에 넣어진다(상기 참조). 아세틸-CoA 합성효소 활성을 갖는 상기 효소를 암호화하는 뉴클레오타이드 서열의 (과)발현을 위해 적절한 프로모터는, 바람직하게 이화대사(글루코즈) 억제에 민감하지 않으며, 혐기적 조건하에서 활성적이며 그리고/또는 바람직하게 유도를 위해 자일로즈 또는 아라비노즈를 필요로 하지 않는 프로모터들을 포함한다. 이러한 프로모터들의 예는 상기에 주어진다. 본 발명의 세포에서, 과발현되는 아세틸-CoA 합성효소는 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인과 비교하여 적어도 팩터 1.1, 1.2, 1.5, 2, 5, 10 또는 20이 과발현된다. 바람직하게, 상기 아세틸-CoA 합성효소는 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인과 비교하여 적어도 팩터 2, 5, 10, 20, 50 또는 100이 혐기적 조건하에서 과발현된다. 이러한 수준의 과발현은 세포에서 안정한 상태 수준의 효소의 활성(세포에서 특이적 활성), 안정한 상태 수준의 효소의 단백질뿐만 아니라, 안정한 상태 수준의 효소를 암호하는 전사체에 적용될 수 있는 것으로 이해된다.
다른 구현으로, 본 발명의 숙주 세포는 또한 세포에서 특이적 NAD+-의존적 글리세롤 3-포스페이트 디하이드로게나아제 활성을 감소시키는 유전적 변형을 포함한다. 글리세롤 3-포스페이트 디하이드로게나아제 또는 글리세롤포스페이트 디하이드로게나아제(EC 1.1.1.8)는 NADH를 NAD+로 산화시키며 sn-글리세롤 3-포스페이트에 대한 디하이드로게나아제 포스페이트의 환원을 촉매한다. 본 발명의 세포에서, 특이적 글리세롤포스페이트 디하이드로게나아제 활성은 바람직하게 과발현을 일으키는, 바람직하게 혐기적 조건하에서 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인에 비해 바람직하게 적어도 팩터 0.8, 0.5, 0.3, 0.1, 0.05 또는 0.01 감소된다.
바람직하게, 글리세롤포스페이트 디하이드로게나아제 활성은 숙주 세포에서 글리세롤포스페이트 디하이드로게나아제를 암호화하는 유전자의 발현을 감소시키거나 불활성화시키는 하나 이상의 유전적 변형에 의해 감소된다. 바람직하게, 유전적 변형은 세포 게놈에서 특이적 글리세롤포스페이트 디하이드로게나아제를 암호화하는 유전자의 각 내인성 카피의 발현을 감소시키거나 불활성화시킨다. 주어진 세포는 디-, 폴리- 또는 이수성의 결과로서 하나 및 이와 동일한 아미노산 서열을 갖는 특이적 글리세롤포스페이트 디하이드로게나아제를 암호화하는 유전자의 다중 카피를 포함할 수 있다. 이러한 예에서, 바람직하게 글리세롤포스페이트 디하이드로게나아제를 암호화하는 특이적 유전자의 각 카피의 발현은 감소되거나 불활성화된다. 변형적으로, 세포는 아미노산 서열이 다르며 다른 유전자에 의해 각각 암호화된 글리세롤포스페이트 디하이드로게나아제 활성을 갖는 여러 다른 (이소)효소를 함유할 수 있다. 이러한 예에서, 본 발명의 일부 구현으로, 상기 이소효소의 한 특정 타입은 감소되거나 불활성화되고 다른 타입은 영향을 받지 않는 것이 바람직하다(하기 참조). 바람직하게, 상기 유전자는 상기 유전자의 적어도 일부의 결실에 의해 또는 상기 유전자의 붕괴에 의해 불활성화되며, 이러한 정황에서 용어 유전자는 또한 암호 서열의 상향 또는 하향-흐름의 어느 논코딩 서열을 포함하며, 이의 (부분) 결실 또는 불활성화는 숙주 세포에서 글리세롤포스페이트 디하이드로게나아제 활성의 발현 감소를 일으킨다.
본 발명의 세포에서 이의 활성이 감소되거나 불활성화되는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 바람직한 유전자는 SEQ ID NO: 15의 아미노산 서열을 암호화하는 Eriksson 등(1995, Mol. Microbiol. 17: 95-107)에 의해 기재된 바와 같은 S. cerevisiae GPD2 유전자 및 다른 종에서 이의 상동 유전자이다. 따라서, 본 발명의 세포에서 이의 활성이 감소되거나 불활성화되는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 유전자는 SEQ ID NO: 15와 적어도 70, 75, 80, 85, 90, 95, 98 또는 99% 서열 동일성을 갖는 아미노산 서열을 갖는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 유전자이다.
본 발명의 바람직한 구현으로, 본 발명의 숙주 세포는 기능성 고-삼투성 글리세롤 반응 경로를 포함한다. 따라서, 바람직하게 SEQ ID NO: 15와 적어도 70% 서열 동일성을 갖는 아미노산 서열을 갖는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 유전자(들)의 활성만이 감소되거나 불활성화되며, 한편 SEQ ID NO: 16과 적어도 70, 75, 80, 85, 90, 95, 98 또는 99% 서열 동일성을 갖는 아미노산 서열을 갖는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 적어도 하나의 내인성 유전자는 기능적이다. SEQ ID NO: 16은 Albertyn 등(1994, Mol. Cell. Biol. 14: 4135-4144)에 의해 기재된 바와 같은 S. cerevisiae GPD1 유전자에 의해 암호화되는 아미노산 서열을 나타내며, 이는 S. cerevisiae GPD2 글리세롤포스페이트 디하이드로게나아제와 69% 아미노산 동일성을 갖는다. S. cerevisiae GPD1 유전자는 S. cerevisiae의 스트레스-유도 글리세롤포스페이트 디하이드로게나아제이며, 이는 산업적 발효 조건하에서 일어날 수 있는 삼투압 스트레스하에서 성장에 중요하다. 이의 발현은 특히 고-삼투성 글리세롤 반응 경로에 의해 조절된다. 따라서, 본 발명의 숙주 세포는 SEQ ID NO: 16과 적어도 70, 75, 80, 85, 90, 95, 98 또는 99% 서열 동일성을 갖는 아미노산 서열을 갖는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 내인성 유전자의 적어도 하나의 기능적 카피를 갖는 것이 유리하다.
상기에도 불구하고, 본 발명자들은 S. cerevisiae GPD1 글리세롤포스페이트 디하이드로게나아제의 불활성화가, S. cerevisiae GPD2 글리세롤포스페이트 디하이드로게나아제의 불활성화에 비해, 글리세롤 생성의 감소 및 글리세롤 및 아세테이트 소비의 증가에 보다 유리한 효과를 갖는다는 것을 이제 예기치않게 발견하였다. 따라서, 보다 바람직한 구현으로, 본 발명의 숙주 세포는 SEQ ID NO: 16(GDP1)에 대해 적어도 70, 75, 80, 85, 90, 95, 98 또는 99% 서열 동일성을 갖는 아미노산 서열을 갖는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 유전자(들)의 발현을 감소시키거나 불활성화시키는 유전적 변형을 포함한다.
다른 구현으로, 글리세롤포스페이트 디하이드로게나아제를 암호화하는 숙주 세포에서 모든 유전자의 활성이 감소되거나 불활성화된다. 이러한 세포에서, 바람직하게 SEQ ID NO: 15 또는 16에 대해 적어도 70, 75, 80, 85, 90, 95, 98 또는 99% 서열 동일성을 갖는 아미노산 서열을 갖는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 내인성 유전자의 모든 카피는 발현이 불활성화되거나 적어도 감소된다.
본 발명의 다른 구현으로, 상기 숙주 세포는 피부베이트 및 조효소-A를 포메이트 및 아세틸-CoA로 전환시키는 능력을 가진 효소를 암호화하는 외인성 유전자를 포함하는 이스트 세포가 아니다. 바람직하게, 상기 숙주 세포는 피루베이트 포메이트 리아제를 암호화하는 뉴클레오타이드 서열을 포함하는 이스트 세포가 아니다.
본 발명의 다른 구현으로, 상기 숙주 세포는 특이적 포메이트 디하이드로게나아제 활성이, a) 아세트알데히드 디하이드로게나아제 활성을 갖는 효소를 암호화하며, 아세트산을 에탄올로 전화하는 능력을 세포에 부여하는 외인성 유전자(의 도입); b) NAD+-결합 글리세롤 디하이드로게나아제 활성을 갖는 효소를 암호화하는 박테리아 유전자; 및 c) 본 명세서에 상기한 다른 어느 유전적 변형물로 구성되는 그룹으로부터 선택된 유전적 변형을 제외하고 유전적으로 동일한 숙주 세포의 스트레인에서 특이적 포메이트 디하이드로게나아제 활성의 적어도 81, 85, 90, 95 또는 100%인 숙주 세포이다. 따라서, 본 발명의 바람직한 숙주 세포는 세포에서 특이적 NAD+-의존적 포메이트 디하이드로게나아제 활성을 감소시키는 유전적 변형을 포함하는 이스트 세포가 아니다.
다른 바람직한 구현으로, 본 발명의 숙주 세포는 a) 자일로즈를 자일룰로즈로 이소머화하는 능력; 및 b) L-아라비노즈를 D-자일룰로즈 5-포스페이트로 전환하는 능력 중 적어도 하나를 갖는다. a)에 대해, 세포는 바람직하게 기능적 외인성 자일로즈 이소머라아제 유전자를 가지며, 이 유전자는 세포에 자일로즈를 자일룰로즈로 이소머화하는 능력을 부여한다. b)에 대해, 세포는 바람직하게 L-아라비노즈 이소머라아제, L-리불로키나아제 및 L-리불로즈-5-포스페이트 4-에피머라아제를 암호화하는 기능적 외인성 유전자를 가지며, 이 유전자는 L-아라비노즈를 D-자일룰로즈 5-포스페이트로 전환시키는 이소머화 능력을 세포에 부여한다.
자일로즈를 자일룰로즈로 이소머화하는 능력을 가진 균류 숙주 세포는 예를 들어, WO 03/0624430 및 WO 06/009434에 기재되어 있는 바와 같다. 자일로즈를 자일룰로즈로 이소머화하는 능력은 바람직하게 자일로즈 이소머라아제를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산 구조물을 이용한 형질전환에 의해 세포에 부여된다. 따라서, 바람직하게 상기 세포는 자일로즈를 자일룰로즈로 직접 이소머화하는 능력을 획득한다. 이에 따라, 보다 바람직하게 상기 세포는 자일로즈의 자일룰로즈의 직접적인 이소머화 (및 자일로즈의 추가 대사)를 통해 태양 에너지 및/또는 탄소 공급원으로서 자일로즈에서 호기적으로 그리고/또는 혐기적으로 성장하는 능력을 획득한다. 여기서 자일로즈의 자일룰로즈로의 직접적인 이소머화는, 각각 자일로즈 환원효소 및 자일리톨 디하이드로게나아제에 의해 촉매되는 자일리톨 중간물을 통해 자일로즈의 자일룰로즈의 2단계 전환과 상반적으로, 자일로즈 이소머라아제에 의해 촉매되는 단일 반응으로 일어나는 것으로 이해된다.
본 발명의 세포에 자일로즈를 자일룰로즈로 직접 이소머화하는 능력을 부여하는데 성공적으로 사용될 수 있는 여러 자일로즈 이소머라아제 (및 이들의 아미노산 및 암호 뉴클레오타이드 서열)는 당해 기술분야에 기술되어 있다. 이들은 Piromyces sp. 및 Neocallimastix, Caecomyces, Piromyces 또는 Ruminomyces(WO 03/0624430), Cyllamyces aberensis(US 20060234364), Orpinomyces(Madhavan et al., 2008, DOI 10.1007/s00253-008-1794-6)과에 속하는 다른 혐기성 균류의 자일로즈 이소머라아제, 예를 들어, B. thetaiotaomicron (WO 06/009434), B. fragilis, 및 B. uniformis (WO 09/109633)를 포함하는 박테리아속 Bacteroides의 자일로즈 이소머라아제, 혐기성 박테리아 Clostridium phytofermentans (Brat et al., 2009, Appl. Environ. Microbiol. 75: 2304-2311)의 자일로즈 이소머라아제, 및 Clostridium difficile, Ciona intestinales Fusobacterium mortiferum의 자일로즈 이소머라아제를 포함한다.
예를 들어, Wissenlink 등(2007, AEM Accepts, published online ahead of print on 1 June 2007; Appl. Environ. Microbiol. doi:10.1128/AEM.00177-07) 및 EP 1 499 708에 기재된 바와 같은, L-아라비노즈를 D-자일룰로즈 5-포스페이트로 전환하는 능력을 가진 균류 숙주 세포가 사용된다. L-아라비노즈를 D-자일룰로즈 5-포스페이트로 전환하는 능력은 바람직하게 a) 아라비노즈 이소머라아제; b) 리불로인산화 효소, 바람직하게 L-리불로인산화 효소 자일로즈 이소머라아제; 및 c) 리불로즈-5-P-4-에피머라아제, 바람직하게 L-리불로즈-5-P-4-에피머라아제를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산 구조물(들)을 이용한 형질전환에 의해 세포에 부여된다. 바람직하게, 본 발명의 세포에서, L-아라비노즈를 D-자일룰로즈 5-포스페이트로 전환시키는 능력은, 1) 아라비노즈의 리불로즈로의 이소머화; 2) 리불로즈의 리불로즈 5-포스페이트로의 인산화 및 3) 리불로즈 5-포스페이트의 D-자일로즈 5-포스페이트로의 에피머화를 통한 L-아라비노즈의 D-자일로즈 5-포스페이트로의 전환 능력이다. 아라비노즈 이소머라아제, 리불로인산환 효소 및 리불로즈-5-P-4-에피머라아제를 암호화하는 적절한 뉴클레오타이드 서열은 Bacillus subtilis, Escherichia coli(참조 예 EP 1 499 708), Lactobacilli, 예, Lactobacillus plantarum(참조 예 Wisselink et al. supra), 또는Clavibacter, Arthrobacter Gramella의 종으로부터 획득될 수 있으며, 이중에서 바람직하게는Clavibacter michiganensis , Arthrobacter aurescens and Gramella forsetii(참조 WO2009/011591)이다.
본 발명의 형질전환된 숙주 세포는 또한 바람직하게, 자일로즈로부터 이소머화되는 자일룰로즈가 피루베이트로 대사될 수 있도록 자일룰로즈 키나아제 활성을 포함한다. 바람직하게, 상기 세포는 내인성 자일룰로즈 키나아제 활성을 함유한다. 보다 바람직하게, 본 발명의 세포는 특이적 자일룰로즈 키나아제 활성을 증가시키는 유전적 변형을 포함한다. 바람직하게, 유전적 변형은 예를 들어, 자일룰로즈 키나아제를 암호화하는 뉴클레오타이드 서열의 과발현에 의해 자일룰로즈 키나아제의 과발현을 일으킨다. 자일룰로즈 키나아제를 암호화하는 유전자는 세포에 대해 내인성이거나 세포에 이종성인 자일룰로즈 키나아제일 수 있다. 본 발명의 세포에서 자일룰로즈 키나아제의 과발현에 사용될 수 있는 뉴클레오타이드 서열은 예를 들어, Deng 및 Ho(1990, Appl. Biochem. Biotechnol. 24-25: 193-199)에 의해 기재된 S. cerevisiae (XKS1 )의 자일룰로즈 키나아제 유전자이다. 다른 바람직한 자일룰로즈 키나아제는 Piromyces (xylB; 참조 WO 03/0624430)의 자일로즈 키나아제와 관련된 자일로즈 키나아제이다. 이 Piromyces 자일룰로즈 키나아제는 실제로, 이스트 키나아제와 같은 공지된 모든 진핵 키나아제에 비해 원핵 키나아제와 보다 관련된다. 진핵 자일룰로즈 키나아제는 비-특이적 당 키나아제로 나타내며, 이는 자일룰로즈를 포함하는 광범위한 기질 범위를 갖는다. 이와 대조적으로, Piromyces 키나아제가 가장 근접하게 관련된 원핵 자일룰로즈 키나아제는 자일룰로즈에 보다 특이적인, 즉 보다 좁은 기질 범위를 갖는 키나아제인 것으로 나타났다. 본 발명의 세포에서, 과발현되는 자일로즈 키나아제는, 과발현을 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인에 비해 적어도 팩터 1.1, 1.2, 1.5, 2, 5, 10 또는 20으로 과발현된다. 이러한 수준의 과발현은 안정한 상태 수준의 효소의 활성, 안정한 상태 수준의 효소의 단백질뿐만 아니라, 안정한 상태 수준의 효소를 암호하는 전사체에 적용될 수 있는 것으로 이해된다.
본 발명의 세포는 또한 바람직하게 WO06/009434에 기재된 바와 같은 펜토즈 포스페이트 경로의 플럭스를 증가시키는 유전적 변형을 포함한다. 특히, 유전적 변형은 비-산화부 펜토즈 포스페이트 경로의 증가된 플럭스를 일으킨다. 펜토즈 포스페이트 경로의 비-산화부의 증가된 플럭스를 일으키는 유전적 변형은 본 명세서에서 증가된 플럭스를 일으키는 유전적 변형을 제외하고 유전적으로 동일한 스트레인에서의 플럭스에 비해 적어도 팩터 1.1, 1.2, 1.5, 2, 5, 10 또는 20으로 플럭스를 증가시키는 변형을 의미하는 것으로 이해된다. 펜토즈 포스페이트 경로의 비-산화부의 플럭스는 WO 06/009434에 기재된 바와 같이 측정될 수 있다.
펜토즈 포스페이트 경로의 플럭스를 증가시키는 유전적 변형은 다양한 방법으로 본 발명의 세포에 도입될 수 있다. 이는 예를 들어, 보다 높은 안정한 상태 수준 활성 수준의 자일룰로즈 키나아제 및/또는 비-산화부 펜토즈 포스페이트 경로의 하나 이상의 효소 및/또는 감소된 안정한 상태 수준의 비특이적 알도즈 환원효소 활성을 달성하는 것을 포함한다. 이러한 안정한 상태 활성 수준의 변화는 (자연적이거나 또는, 화학 또는 방사선에 의해 유도되는) 돌연변이의 선별에 의해 그리고/또는 예를 들어, 각각 상기 효소를 암호화하는 유전자 또는 이러한 유전자를 조절하는 인자의 과발현 또는 불활성화에 의한 것과 같은 재조합 DNA 기술에 의해 이루어질 수 있다.
본 발명의 바람직한 세포에서, 유전적 변형은 (비-산화부) 펜토즈 포스페이트 경로의 적어도 하나의 효소의 과발현을 포함한다. 바람직하게, 상기 효소는 리불로즈-5-포스페이트 이소머라아제, 리불로즈-5-포스페이트 3-에피머라아제, 트랜스케톨라아제 및 트랜스알돌라아제를 암호화하는 효소로 구성되는 그룹으로부터 선택된다. 상기 (비-산화부) 펜토즈 포스페이트 경로의 다양한 조합의 효소가 과발현될 수 있다. 예를 들어, 과발현되는 효소는 적어도 리불로즈-5-포스페이트 이소머라아제 및 리불로즈-5-포스페이트 3-에피머라아제 효소이거나; 또는 적어도 리불로즈-5-포스페이트 이소머라아제 및 트랜스케톨라아제 효소이거나; 또는 적어도 리불로즈-5-포스페이트 3-에피머라아제 및 트랜스케톨라아제 효소이거나; 또는 적어도 리불로즈-5-포스페이트 3-에피머라아제 및 트랜스알돌라아제 효소이거나; 또는 적어도 트랜스케톨라아제 및 트랜스알돌라아제 효소이거나; 또는 적어도 리불로즈-5-포스페이트 3-에피머라아제, 트랜스케톨라아제 및 트랜스알돌라아제 효소이거나; 또는 적어도 리불로즈-5-포스페이트 이소머라아제, 트랜스케톨라아제 및 트랜스알돌라아제 효소이거나; 또는 적어도 리불로즈-5-포스페이트 이소머라아제, 리불로즈-5-포스페이트 3-에피머라아제 및 트랜스알돌라아제 효소이거나; 또는 적어도 리불로즈-5-포스페이트 이소머라아제, 리불로즈-5-포스페이트 3-에피머라아제 및 트랜스케톨라아제 효소일 수 있다. 본 발명의 일 구현으로, 각각의 효소 리불로즈-5-포스페이트 이소머라아제, 리불로즈-5-포스페이트 3-에피머라아제, 트랜스케톨라아제 및 트랜스알돌라아제가 본 발명의 세포에서 과발현된다. 유전적 변형이 적어도 효소 트랜스알돌라아제의 과발현을 포함하는 세포가 바람직하다. 숙주 세포가 이미 자일로스에서 혐기적 성장이 가능한 것과 같이, 유전적 변형이 적어도 트랜스케톨라아제 및 트랜스알돌라아제 효소 모두의 과발현을 포함하는 것이 보다 바람직하다. 실제로, 4가지 모든 효소, 즉, 리불로즈-5-포스페이트 이소머라아제, 리불로즈-5-포스페이트 3-에피머라아제, 트랜스케톨라아제 및 트랜스알돌라아제를 과발현하는 세포와 같이, 일부 조건하에서, 트랜스케톨라아제 및 트랜스알돌라아제만을 과발현하는 세포가 이미 자일로즈에서 동일한 혐기적 성장 속도를 갖는 것을 발견하였다. 더욱이, 리불로즈-5-포스페이트 이소머라아제 및 리불로즈-5-포스페이트 3-에피머라아제 효소 모두를 과발현하는 본 발명의 세포는 이러한 효소들 중 하나만의 과발현이 대사 불균형을 생성함에 따라, 상기 이소머라아제 또는 상기 3-에피머라아제만을 과발현하는 세포에 비해 바람직하다.
본 발명의 세포에서 효소의 과발현을 위해 당해 기술분야에 이용가능한 다양한 수단들이 있다. 구체적으로, 효소는 예를 들어, 세포의 게놈내의 유전자의 부가적인 카피를 통합함으로써, 에피좀 다중카피 발현벡터로부터 유전자를 발현시킴으로써 또는 유전자의 다중카피를 포함하는 에피좀 발현벡터를 도입함으로써 세포에서 효소를 암호화하는 유전자의 카피 수를 증가시켜 과발현될 수 있다. 효소의 과발현에 사용되는 암호 서열은 바람직하게 본 발명의 숙주 세포와 동종성이다. 그러나, 본 발명의 숙주 세포에 이종성인 암호 서열이 마찬가지로 적용될 수 있다.
변형적으로, 본 발명의 세포에서 효소의 과발현은, 과발현되는 효소를 암호화하는 서열에 고유적이지 않은 프로모터를 이용하여 달성될 수 있다. 즉, 작동가능하게 연결되는 암호 서열에 이종성인 프로모터를 이용할 수 있다. 상기 프로모터는 바람직하게 이에 작동가능하게 연결되는 코딩 서열에 이종성임에도 불구하고, 상기 프로모터는 동종성, 즉, 본 발명의 세포에 내인성인 것이 또한 바람직하다. 바람직하게, 이종성 프로모터는 바람직하게는, 자일로즈 또는 자일로즈 및 글루코즈가 탄소 공급원으로, 보다 바람직하게는, 주요 탄소 공급원으로서(즉, 이용가능한 탄소 공급원의 50% 이상이 자일로즈 또는 자일로즈 및 글루코즈로 구성됨), 가장 바람직하게는 탄소 공급원 단독으로서 이용가능한 조건하에서, 코딩 서열에 고유적인 프로모터인 것보다 보다 높은 안정 상태 수준의 코딩 서열을 포함하는 전사체를 생성할 수 있다(또는 시간 단위당 보다 많은 전사체 분자, 즉, mRNA 분자를 생성할 수 있다).
본 발명의 추가의 바람직한 세포는 세포에서 비특이적 알도즈 환원효소 활성을 감소시키는 유전적 변형을 포함한다. 바람직하게, 비특이적 알도즈 환원효소 활성은, 비특이적 알도즈 환원효소를 암호화하는 유전자의 발현을 감소시키거나 불활성화하는 하나 이상의 유전적 변형에 의해 숙주 세포에서 감소된다. 바람직하게, 유전적 변형은 세포의 게놈에서 자일로즈, 자일룰로즈 및 아라비노즈를 포함하는 알도펜토즈를 환원시킬 수 있는 비특이적 알도즈 환원효소를 암호화하는 유전자의 각 내인성 카피의 발현을 감소시키거나 불활성화한다. 주어진 세포는 디-, 폴리- 또는 이수성의 결과로서 비특이적 알도즈 환원효소를 암호화하는 다중 카피를 포함할 수 있으며, 그리고/또는 세포는 아미노산 서열이 다르며 다른 유전자에 의해 각각 암호화된 알도즈 환원효소 활성을 갖는 여러 다른 (이소)효소를 함유할 수 있다. 또한, 이러한 예에서, 바람직하게 비특이적 알도즈 환원효소를 암호화하는 각 유전자의 발현은 감소되거나 불활성화된다. 바람직하게, 상기 유전자는 상기 유전자의 적어도 일부의 결실에 의해 또는 상기 유전자의 붕괴에 의해 불활성화되며, 이러한 정황에서 용어 유전자는 또한 암호 서열의 상향 또는 하향-흐름의 어느 논코딩 서열을 포함하며, 이의 (부분) 결실 또는 불활성화는 숙주 세포에서 비특이적 알도즈 환원효소 활성의 발현 감소를 일으킨다. 본 발명의 세포에서 활성이 환원되는 알도즈 환원효소를 암호화하는 뉴클레오타이드 서열 및 이러한 알도즈 환원효소의 아미노산 서열은 WO 06/009434에 기재되어 있으며, 예를 들어, S. cerevisiae GRE3 유전자(Traff et al., 2001, Appl. Environm. Microbiol. 67: 5668-5674)의 (비특이적) 알도즈 환원효소 및 다른 종에서 이의 상동 유전자를 포함한다.
본 발명에 따른 다른 바람직한 형질전환 숙주 세포는 (a) 자일로즈 및/또는 아라비노즈의 세포로의 증가된 수송; (b) 이화대사 억제에 대한 감소된 민감성; (c) 에탄올, 삼투성 또는 유기산에 대한 증가된 내성; 및 (d) 부산물의 감소된 생성으로 구성되는 그룹으로부터 선택되는 하나 이상의 특성을 형성하는 추가의 유전적 변형을 포함할 수 있다. 부산물은 원하는 발효 산물 이외의 탄소-함유 분자를 의미하는 것으로 이해되며, 예를 들어, 자일리톨, 아라비니톨, 글리세롤 및/또는 아세트산을 포함한다. 본 명세서에 기재된 어느 유전적 변형은 통상적인 돌연변이 발생에 의해 그리고 원하는 돌연변이에 대한 스크리닝 및/또는 선별에 의해 도입되거나, 또는 단순히 원하는 특성을 갖는 자연적 돌연변이에 대한 스크리닝 및/또는 선별에 의해 도입될 수 있다. 변형적으로, 유전적 변형은 내인성 유전자의 과발현 및/또는 내인성 유전자의 불활성화로 구성될 수 있다. 아라비노즈 및/또는 자일로즈의 세포내로의 증가된 수송을 위해 과발현이 원하여지는 유전자는 바람직하게 헥소스 또는 펜토즈 트랜스포터를 암호화하는 유전자로부터 선택된다. S. cerevisiae 및 다른 이스트에서, 이러한 유전자는 HXT1 , HXT2 , HXT4 , HXT5 , HXT7GAL2를 포함하며, 이중에서 HXT1 , HXT5 GAL2가 가장 바람직하다(Sedlack 및 Ho, Yeast 2004; 21: 671-684). 이스트에서 발현을 위해 바람직한 다른 트랜스포터는 P. stipitis SUT1 유전자(Katahira et al., 2008, Enzyme Microb. Technol. 43: 115-119)에 의해 암호화된 글루코즈 트랜스포터이다. 마찬가지로, 다른 종에서의 이러한 트랜스포터 유전자의 상동 유전자가 과발현될 수 있다. 본 발명의 세포에서 과발현될 수 있는 다른 유전자는 당분해 효소 및 알코올 디하이드로게나아제와 같은 에탄올생성 효소를 암호화하는 유전자를 포함한다. 불활성화를 위한 바람직한 내인성 유전자는 예를 들어, S. cerevisiae HXK2 유전자(참조 Diderich et al., 2001, Appl. Environ. Microbiol. 67: 1587-1593); S. cerevisiae MIG1 또는 MIG2 유전자; S. cerevisiae 글리세롤-포스페이트 디하이드로게나아제 1 및/또는 2 유전자와 같은 글리세롤 대사에 연루된 효소를 암호하는 유전자와 같은 헥소스 키나아제 유전자; 또는 다른 종에서 이러한 유전자의 (하이브리드) 상동 유전자를 포함한다. 자일로즈 발효를 위한 숙주 세포의 다른 바람직한 추가 변형은 van Maris 등(2006, Antonie van Leeuwenhoek 90:391-418), WO2006/009434, WO2005/023998, WO2005/111214, 및 WO2005/091733에 기재되어 있다. 본 명세서에 기재된 바와 같은 본 발명의 세포들의 어느 유전적 변형은 가능한 한 바람직하게 자가 클로닝 유전 변형에 의해 도입되거나 변형된다.
본 발명에 따른 바람직한 숙주 세포는 탄소/에너지 공급원으로서 자일로즈 및 아라미노즈 중 적어도 하나에서, 바람직하게 탄소/에너지 공급원 단독으로서, 그리고 바람직하게 혐기 조건하에서, 즉, 혐기 발효 공정에 대해 하기 정의된 바와 같은 조건하에서 성장하는 능력을 갖는다. 바람직하게, 탄소/에너지 공급원으로서 자일로스에서 성장시, 숙주 세포는 자일리톨을 본질적으로 생성하지 않는다. 예를 들어, 생성되는 자일리톨은 검출 제한 이하이거나 몰 기준으로 소비된 탄소의 5, 2, 1, 0.5 또는 0.3%미만이다. 바람직하게, 탄소/에너지 공급원으로서 아라비노즈에서 성장시, 세포는 본질적으로 아라비니톨을 생성하지 않으며, 예를 들어, 생성되는 아라비니톨은 검출 제한 이하이거나 물 기준으로 소비된 탄소의 5, 2, 1, 0.5 또는 0.3%미만이다.
본 발명의 바람직한 숙주 세포는 a) 헥소스 및 펜토즈 중 적어도 하나; b) 아세트산; 및 c) 글리세롤의 조합에서 혐기 조건하에서 적어도 0.01, 0.02, 0.05, 0.1, 0.2, 0.25 또는 0.3 h- 1 의 속도, 또는 보다 바람직하게 혐기 조건하에서 적어도 0.005, 0.01, 0.02, 0.05, 0.08, 0.1, 0.12, 0.15 또는 0.2 h- 1 의 속도로 성장하는 능력을 갖는다. 따라서, 바람직하게 숙주 세포는 탄소/에너지 공급원 단독으로서 자일로즈 및 아라비노즈 중 적어도 하나에서, 혐기 조건하에서 적어도 0.01, 0.02, 0.05, 0.1, 0.2, 0.25 또는 0.3 h- 1 의 속도, 또는 보다 바람직하게 혐기 조건하에서 적어도 0.005, 0.01, 0.02, 0.05, 0.08, 0.1, 0.12, 0.15 또는 0.2 h- 1 의 속도로 성장하는 능력을 갖는다. 보다 바람직하게, 숙주 세포는 탄소/에너지 공급원으로서 헥소스(예, 글루코즈)와 자일로즈 및 아라비노즈 중 적어도 하나의 혼합물(1:1 중량비로)에서, 혐기 조건하에서 적어도 0.01, 0.02, 0.05, 0.1, 0.2, 0.25 또는 0.3 h- 1 의 속도, 또는 보다 바람직하게 혐기 조건하에서 적어도 0.005, 0.01, 0.02, 0.05, 0.08, 0.1, 0.12, 0.15 또는 0.2 h- 1 의 속도로 성장하는 능력을 갖는다.
일 견지로, 본 발명은 에탄올, 락틱산, 3-히드록시-프로피온산, 아크릴산, 1,3-프로판디올, 부탄올 및 이소프레노이드-유도 산물로 구성되는 그룹으로부터 선택된 발효 산물의 제조를 위해 사용되는 본 발명에 따른 이스트 세포의 용도에 관한 것이다.
다른 견지로, 본 발명은 에탄올, 락틱산, 3-히드록시-프로피온산, 아크릴산, 1,3-프로판디올, 부탄올(1-부탄올, 2-부탄올, 이소부탄올) 및 이소프레노이드-유도 산물로 구성되는 그룹으로부터 선택된 발효 산물을 제조하는 방법에 관한 것이다. 상기 방법은 바람직하게, a) 배지를 이스트 세포로 발효시켜, 이에 의해 배지는 a) 헥소스 및 펜토즈 중 적어도 하나의 공급원; b) 아세트산 공급원; 및 c) 글리세롤의 공급원을 함유하거나 이와 함께 공급되고, 이에 따라 이스트 세포는 아세트산, 글리세롤, 및 헥소스와 펜토즈 중 적어도 하나를 에탄올로 발효시키는 단계를 포함한다. 이스트 세포는 바람직하게 상기 정의된 바와 같은 (숙주) 세포이다. 상기 방법은 바람직하게 발효 산물이 회수되는 추가 단계를 포함한다. 상기 방법은 배치 공정, 유가식 공정 또는 연속 공정일 수 있으며, 이들은 당해 기술분야에 잘 알려져 있다. 본 발명의 방법에서, 글리세롤의 공급원은 글루코즈보다 더 환원된 상태를 갖는 어느 탄소 공급원일 수 있다. 글루코즈보다 더 환원된 상태를 갖는 탄소 공급원은 (함유된 화합물의) C-몰당 평균 환원 상태가 글루코즈의 C-몰당 환원 상태보다 더 큰 탄소 공급원으로 이해된다. 글루코즈보다 더 환원된 상태를 갖는 탄소 공급원의 예는 프로판올 및 부탄올과 같은 알칸올; 1,3-프로판-디올, 부탄디올, 글리세롤, 만니톨 및 자일리톨과 같은 폴리올을 포함한다.
바람직한 방법으로, 헥소스의 공급원은 글루코즈를 포함하거나 이로 구성된다. 바람직하게, 상기 공급원 펜토즈는 자일로즈 및 아라비노즈 중 적어도 하나를 포함하거나 이로 구성된다. 바람직하게, 본 발명의 세포에 의해 발효되는 배지는 글루코즈, 자일로즈 및/또는 아라비노즈와 같은 헥소스 및 펜토스 중 적어도 하나를 포함하는 가수분해된 바이오매스(의 분획)를 포함하거나 이와 함께 공급된다. 헥소스 및 펜토즈를 포함하는 가수분해된 바이오매스(의 분획)는 일반적으로 또한 아세트산 (또는 이의 염)을 포함할 것이다. 본 발명의 방법에서 발효될 가수분해되는 바이오매스의 예는 예를 들어, 가수분해된 목질 섬유 바이오매스이다. 본 명세서에서 목질 섬유 바이오매스는 셀룰로즈, 헤미셀룰로즈 및 리그닌을 포함하여 구성되는 식물 바이오매스로 이해된다. 탄수화물 폴리머(셀룰로즈 및 헤미셀룰로즈)가 리그닌에 단단히 바인딩된다. 본 발명에 사용되는 가수분해될 목질 섬유 바이오매스의 예는 (옥수수 대 및 사탕수수 찌꺼기를 포함하는) 농업 잔류물, (제재소 및 제지 공장 폐기물을 포함하는) 목재 잔류물 및 (공공) 종이 폐기물을 포함한다. 목질 섬유와 같은 바이오매스의 가수분해를 위한 방법은 당해 기술분야에 알려져 있으며, 예를 들어, 황산과 같은 산 및 셀룰라아제 및 헤미셀룰라아제와 같은 효소를 포함한다.
본 발명의 방법에서, 자일로즈, 글루코즈 및 아라비노즈의 공급원은 그 자체(즉, 단량체 당질로서) 자일로즈, 글루코즈 및 아라비노즈이거나, 또는 이들은 목질 섬유, 아라비난, 자일란, 셀룰로즈, 전분 등과 같이 자일로즈, 글루코즈 및/또는 아라비노즈 유닛을 포함하는 어느 탄수화물 올리고- 또는 폴리머의 형태일 수 있다. 이러한 탄수화물로부터 자일로즈, 글루코즈 및/또는 아라비노즈 유닛의 방출을 위해 적절한 탄수화물 분해효소(아라비나아제, 자일라나아제, 글루카나아제, 아밀라아제, 셀룰라아제, 글루카나아제 등과 같은)가 발효 배지에 첨가되거나, 또는 변형 숙주 세포에 의해 생성될 수 있다. 후자의 경우에, 변형된 숙주 세포는 이러한 탄수화물 분해효소를 생성하고 분비하도록 유전적으로 합성될 수 있다. 글루코즈의 올리고- 또는 중합 공급원의 부가적인 이점은, 예를 들어, 발효 중에 바람직하게 탄수화물 분해효소의 속도-제한 량을 이용하여, 발효 중에 저(보다 낮은) 농도의 유리 글루코즈를 유지하는 것이 가능한 것이다. 이는, 그 다음 자일로즈 및 아라비노즈와 같은 비-글루코즈 당질의 대사 및 수송에 필요한 시스템의 억압을 억제할 것이다. 바람직한 방법으로, 변형된 숙주 세포는 글루코즈 및 자일로즈와 아라비노즈 중 적어도 하나 모두를 발효시키며, 바람직하게 동시에, 이중영양적 성장을 억제하는 글루코즈 억압에 덜 민감한 변형된 숙주 세포가 사용된다. 탄소 공급원으로서 자일로즈 및 아라비노즈 (및 글루코즈) 중 적어도 하나의 공급원에 부가적으로, 발효 배지는 또한 변형된 숙주 세포의 성장에 필요한 적절한 성분을 포함할 것이다. 이스트와 같은 진핵 미생물의 성장을 위한 발효 배지의 조성물은 당해 기술분야에 잘 알려져 있다.
본 발명의 방법에서, 배지는 바람직하게 글리세롤의 공급원을 더 포함하며 그리고/또는 글리세롤의 공급원과 함께 공급된다. 본 발명의 방법에 사용되는 글리세롤은 유리하게 식물 오일 또는 동물 지방 및 알코올을 이용한 트랜스에스테르화 반응으로부터 바이오디젤 생성시 부산물로서 생성되는 글리세롤일 수 있다.
발효 공정은 호기성 또는 혐기성 발효 공정일 수 있다. 혐기성 발효 공정은 본 명세서에서 산소의 부재하에 운전되거나 실질적으로 산소가 소비되지 않는, 바람직하게 5, 2.5 또는 1mmol/L/h 미만, 보다 바람직하게 0mmol/L/h이 소비되며(즉, 산소 소비가 검출불가한), 그리고 유기 분자가 전자 도너 및 전자 어셉터 모두로 제공되는 발효 공정으로 정의된다. 산소의 부재하에, 당분해 및 바이오매스 형성시 생성되는 NADH는 산화성 인산화에 의해 산화될 수 없다. 이 문제를 해소하기 위해, 다수의 미생물들은 전자 및 수소 어셉터로서 피루베이트 또는 이의 유도체들 중 하나를 사용하여 NAD+를 재생한다. 따라서, 바람직한 혐기 발효 공정에서, 피루베이트는 전자 (및 수소 어셉터)로 사용되며, 에탄올과 같은 발효 산물뿐만 아니라 락틱산, 3-히드록시-프로피온산, 아크릴산, 1,3-프로판-디올, 부탄올(1-부탄올, 2-부탄올, 이소부탄올) 이소프레노이드-유래 산물과 같은 비-에탄올 발효 산물로 환원된다. 본 발명의 혐기 공정은, 혐기 공정이 에어레이션을 위한 장치 및 에너지를 필요로 하지 않고, 또한 형기 공정은 호기 공정보다 더 높은 산물 수율을 생성하기 때문에, 호기 공정에 비해 바람직하다.
변형적으로, 본 발명의 발효 공정은 호기 산소-제한 조건하에서 운전될 수 있다. 바람직하게, 산소-제한 조건하에서 호기 공정에서, 산소 소비 속도는 적어도 5.5, 보다 바람직하게 적어도 6, 그리고 보다 바람직하게 적어도 7mmol/L/h이다. 본 발명의 바람직한 호기 산소-제한 발효 공정에서, 본 발명의 이스트 세포는 탄소 공급원의 발효 산물로의 전환 중에 소비되는 탄소 공급원과 관련된 C-몰 기준으로 30, 20, 18, 15, 12, 10, 8 또는 5% 미만의 산소량을 소비한다. C-몰 기준(Cos)으로 이용되는 기질에 걸쳐 소비되는 산소의 전환 계수는 본 명세서에서 소비된 C-몰 탄소 공급원당 사용된 몰 O2를 의미하는 것으로 이해된다. 따라서, 본 발명의 방법은 엄격한 혐기 조건(즉, Cos = 0.0)하에서 수행될 수 있으며, 또는 본 발명의 방법은 호기 조건하에서, 바람직하게 Cos가 바람직하게 0.3, 0.2, 0.18, 0.15, 0.12, 0.1, 0.08 또는 0.05 미만인 산소-제한된 조건하에서 수행될 수 있다.
발효 공정은 바람직하게 본 발명의 변형된 세포에 대해 최적인 온도에서 운전된다. 따라서, 대부분의 이스트 세포에 있어서, 발효 공정은 42℃미만, 바람직하게 38℃미만인 온도에서 수행된다. 이스트 세포에 있어서, 발효 공정은 바람직하게 35, 33, 30 또는 20℃이하인 온도 및 20, 22 또는 25℃이상인 온도에서 수행된다.
본 발명에 따른 바람직한 발효 공정은 에탄올 생산을 위한 공정이며, 이에 따라 상기 공정은 이스트 세포로 배지를 발효하는 단계를 포함하며, 따라서 상기 배지는 a) 헥소스 및 펜토스 중 적어도 하나의 공급원; b) 아세트산의 공급원; 및 c) 글리세롤의 공급원을 함유하거나 이와 함께 공급되며, 이에 따라 상기 이스트 세포는 아세트산, 글리세롤, 및 헥소스와 펜토즈 중 적어도 하나를 에탄올로 발효시키며, 그리고 선택적으로, b) 에탄올의 회수 단계를 포함한다. 발효 배지는 또한 상기한 바와 같이 수행될 수 있다. 상기 공정에서, 용량적 에탄올 생산성은 바람직하게 적어도 0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 5.0 또는 10.0g 에탄올/l/h이다. 상기 공정에서 자일로즈 및/또는 글루코즈 및/또는 아라비노즈 및/또는 아세테이트 및/또는 글리세롤에 대한 에탄올 수율은 바람직하게 적어도 50, 60, 70, 80, 90, 95 또는 98%이다. 본 명세서에서 에탄올 수율은 이론적 최대 수율의 퍼센트로서 정의되며, 여기서 자일로즈, 글루코즈 및 아라비노즈에 대해 0.51g. 에탄올/g. 자일로즈, 글루코즈 또는 아라비노즈이다. 글리세롤에 대해, 이론적 최대 수율은 0.50g. 에탄올/g. 글리세롤이며, 아세트산에 대해 이론적 최대 수율은 0.77g. 에탄올/g. 아세트산이다.
본 명세서 및 청구범위에서, 동사 "포함하다" 및 이의 동사 활용어는 상기 문자에 후속되는 아이템이 포함되나, 별도 언급이 없는 아이템이 배제되지 않는 것을 의미하는 비-제한적 인식으로 사용된다. 또한, 부정관사 "하나의(a 또는 an)"가 언급된 경우에, 문맥상 분명히 하나가 존재하고 엘리먼트들 중 단지 하나만이 존재하는 것이 요구되는 것을 제외하고, 하나 이상의 엘리먼트가 존재하는 가능성을 배제하지 않는다. 따라서, 부정관사 "하나의(a 또는 an)"는 보통 "적어도 하나(at least one)"을 의미한다.
본 명세서에 인용된 모든 특허 및 문헌들은 이의 전체가 본 명세서에 참고문헌으로 편입된다.
하기 실시예는 단지 예시 목적으로 제공되며, 본 발명의 범위를 어느 방식으로 한정하려는 것은 아니다.
실시예
1. 효소 활성 어세이
활성 어세이를 위한 세포 추출물을 기하급수적으로 성장하는 호기성 또는 혐기성 배치 배양으로부터 준비하고, Abbot 등(2009, Appl. Environ. Microbiol. 75: 2320-2325)에 의해 기재된 바와 같이 단백질 함량에 대해 분석하였다.
NAD+-의존적 아세트알데히드 디하이드로게나아제(EC 1.2.1.10) 활성은 340nm에서 NADH의 산화를 모니터링하여 30℃에서 측정하였다. 반응 혼합물(총 부피 1ml)은 50mM 포타슘 포스페이트 버퍼(pH 7.5), 0.15mM NADH 및 세포 추출물을 함유하였다. 반응은 0.5mM 아세틸-조효소 A의 첨가에 의해 시작되었다.
글리세롤 3-포스페이트 디하이드로게나아제(EC 1.1.1.8) 활성 측정을 위해, 세포 추출물은 포스페이트 버퍼를 트리에탄올아민 버퍼(10mM, pH 5)로 대체한 것을 제외하고 상기한 바와 같이 준비하였다. 글리세롤-3-포스페이트 디하이드로게나아제 활성은 이전에 기재된 바와 같이(Blomberg and Adler, 1989, J. Bacteriol. 171: 1087-1092.9) 30℃에서 세포 추출물에서 평가하였다. 반응 속도는 첨가된 세포 추출물의 양에 비례하였다.
아세틸-CoA 합성효소(EC 6.2.1.1) 활성은 Webster의 방법(Webster, 1969, Methods Enzymol. 13: 375-381)의 변형인 Frenkel 및 Kitchens에 의해 기재된 바와 같이(1977, J. Biol. Chem. 252: 504-507) 측정하였다. 측정된 NADH 형성은, 생성된 아세틸-CoA가 시트레이트 합성효소 및 말산염 디하이드로게나아제 반응과 결합될 경우에 분광 분석으로 측정하였다. 어세이 시스템은 100 mM Tris-Cl(pH 7.6), 10mM MgCl2, 6mM ATP, 5mM 말산염, 1mM NAD+, 0.1mM NADH, 2.5 mM 디티오트레이톨 또는 2-머캅토에탄올, 0.2mM 조효소 A, 25㎍ 시트레이트 합성효소(80 units/mg), 20㎍ 말산염 디하이드로게나아제(1000 units/mg), 및 10mM 아세테이트를 함유하였으며, 반응을 측정하고, 반응 속도를 340nm에서 측정하고, NADH(6.22 x 106 cm2/mol)의 흡광 계수로부터 산출하였다.
글리세롤 디하이드로게나아제 및 디히드록시아세톤 키나아제의 활성은 본질적으로 이전에 기재된 바와 같이(Gonzalez et al., 2008, Metab. Eng. 10, 234-245) 세포 추출물에서 30℃에서 측정하였다. 글리세롤 디하이드로게나아제 및 디히드록시아세톤 키나아제의 효소 활성은 세포 단백질의 기질의 μ몰/min/mg으로 나타내었다.
2. 스트레인 구성
모든 변형은 자일로즈 및 아라비노즈 발효 스트레인 RN1008 his-로 시작하였다. RN1008 his-는 본 명세서에서 RN1041이라고도 하며, 하기 유전자형을 갖는 CEN.PK-계 아라비노즈 및 자일로즈 발효 스트레인이다:
Mat a, ura3-52, leu2-112, his3::loxP, gre3::loxP, loxP-Ptpi::TAL1, loxP-Ptpi::RKI1, loxP-Ptpi-TKL1, loxP-Ptpi-RPE1, delta:: -LEU2, delta:: Padh1XKS1Tcyc1-URA3-Ptpi-xylA-Tcyc1, delta:: LEU2-AAAaraABD. 
Mat a = mating type a
ura3-52, leu2-112, his3::loxP는 유전자 ura3, leu2 및 his3에서 돌연변이이며, ura3는 xylA-XKS 과발현 구조물에 의해 보완되며, leu2는 AraABD 과발현에 구조물에 의해 보완된다. his3는 부가적인 플라스미드의 선별을 위해 사용될 수 있으며, RN1041은 성장을 위해 배지에 히스티딘을 필요로 한다.
gre3::loxP = 자일로즈 환원효소를 암호화하는 gre3 유전자의 결실, loxP 부위는 마커 제거 후 남는다.
loxP-Ptpi ....= 헤트(het) 펜토즈 포스페이트 경로의 과발현, 구성 프로모터의 상향흐름의 loxP 부위는 마커 제거 후에 남는다.
delta:: = Ty1 레트로트랜스포손의 긴말단 반복순서에서 재조합 후의 구조물의 통합
AAAaraABD = 코돈 최적화된 아트로박터 아우레센스(arthrobacter aurescens) araA, araB 및 araD 유전자(WO2009/011591 참조)
GPD1 GPD2 를 위한 결실 구조물
RN1041에서 GPD1의 결실은 RN1197 스트레인을 생성한다. RN1041에서 GPD2의 결실은 RN1198 스트레인을 생성한다. 이 스트레인에서, 후속적으로 gpd1이 결실되어 RN1199 스트레인을 생성한다. 이러한 스트레인에서, 플라스미드들은 ACS 유전자(RN1200 내지 RN1207, 표 4) 및 표 4에 나타낸 바와 같은 추가 유전자들의 과발현을 위해 도입되었다.   
gpd1 :: hphMX
프라이머 gpd1uf, gpd1ur, gpd1df 및 gpd1dr은 이의 불활성화를 위해 GPD1 유전자의 상향 및 하향흐름의 게놈 서열 프래그먼트의 증폭을 위해 사용된다. 상향- 및 하향흐름 모두의 GPD1 프래그먼트들을 토포 블런트(topo blunt) 벡터(InVitrogen)에 클로닝되어 각각, pGPD1up 및 pGPD1down을 생성하였다.
gpd1uf: AAGCTTGGTACCCGCCTTGCTTCTCTCCCC (SEQ ID NO: 41)
gpd1ur: TCTAGACCAGCATTCAAGTGGCCGGA (SEQ ID NO: 42)
gpd1df: CGTACGAGTTGTTGAATGGCCAATCCGCT (SEQ ID NO: 43)
gpd1dr: CCATGGTACCGAGTGGTGTTGTAACCACCCT (SEQ ID NO: 44)
gpd1cf: ACCAATACGTAAACGGGGCG (SEQ ID NO: 45)
gpd1cr: AATACACCCATACATACGGACGC (SEQ ID NO: 46)
플라스미드 pRN593(SEQ ID NO: 40)은 pGPD1up으로부터 HindIII 및 XbaI으로 절제된 프래그먼트를 SpeI 및 BsrGI으로 절제된 hphMX 프래그먼트(플라스미드 콜렉션 C5YeastCompany)와 pGPD1down으로부터 BsiWI 및 NcoI으로 절제된 프래그먼트를 HindIII 및 NcoI 절제된 topo T/A 벡터(Invitrogen)에 라이게이션하여 구성되었다. 플라스미드 pRN593은 KpnI으로 절제되어 게놈 카피를 방해하는 결실 프래그먼트를 획득하였다(SEQ ID NO: 17). 선형 프래그먼트의 혼합물은 이스트의 형질전환에 사용되었다. 형질전환체는 하이드로마이신 내성에 대해 선별되었다. 올바른 인테그레이션은 GPD1 오픈 리딩 프래임의 결실을 일으킨다. 인테그레이션은 gpd1cf 및 gpd1cr 프라이머를 이용하여 PCR로 확인된다.
gpd2 :: natMX
GPD2uf, GPD2ur, GPD2df 및 GPD2dr 프라이머가 이의 활성화를 위해 GPD2 유전자의 상향흐름 및 하향흐름의 게놈 서열 프래그먼트의 증폭을 위해 사용된다. (GPD2 서열로부터 유래된) 3'-말단에서 AflII 사이트 및 (결실 구조물의 분리를 위한) 5'-말단에 Bg/II 사이트를 갖는 407bp 상향흐름 PCR 프래그먼트를 GPD2uf, GPD2ur을 이용하여 증폭하고, pCR2.1(topo T/A, Invitrogen)에 클로닝하였다.
GPD2uf: GGTACCAGATCTTTTGCGGCGAGGTGCCG (SEQ ID NO: 32)
GPD2ur: TCTAGACTTAAGGAATGTGTATCTTGTTAATCTTCTGACAGC (SEQ ID NO: 33)
5'-말단에 XhoI 사이트 및 3'-말단에 BglII 사이트를 가진 417bp 하향흐름 PCR 프래그먼트를 GPD2df 및 GPD2dr을 이용하여 증폭하였다.
GPD2df: CTCGAGATAGTCTACAACAACGTCCGCA (SEQ ID NO: 34)
GPD2dr: CCATGGAGATCTGCAGTGAAAAAGCTCGAAGAAACAGCT (SEQ ID NO: 35)
최종 구성을 위해, 상향흐름 프래그먼트를 함유하는 플라스미드를 AflII 및 Kpn으로 절제하고, 하향흐름 프래그먼트를 XhoI en NcoI으로 절제하고, natMX 마커(플라스미드 콜렉션 Royal Nedalco)를 AflII en XhoI으로 절제하고, 그 프래그먼트를 라이게이션하여 플라스미드 pRN594(SEQ ID NO: 36)을 생성하였다. pRN594는 이스트 형성 전에 BglII로 절제하였다. 형질전환체는 너스오트리신(nourseotricin) 내성에 대해 선별하였다. 올바른 인테그레이션은 PCR에 의해 확인된다.
사카로미세스 세레비지아에 ( Saccharomyces cerevisiae ) ACS1 ACS2 유전자의 과발현을 위한 클로닝 방법
ACS1 오픈 리딩 프래임은 acs1f 및 acs1r 프라이머를 이용하여 PCR 증폭하였다.
acs1f : TTAAGCTTAAAATGTCGCCCTCTGCCGT (SEQ ID NO: 47)
acs1r: AAGCGCGCTACAACTTGACCGAATCAATTAGATGTCTAACAATGCCAGGG (SEQ ID NO: 48)
이 PCR 프래그먼트를 제한효소 HindIII 및 BssHIII으로 절제하고, SalI 및 HindIII 절제된 TEF1 프로모터 프래그먼트(콜렉션 C5YeastCompany), 및 BssHII 및 BsiWI 절제된 ADH1 종결 프래그먼트(콜렉션 C5YeastCompany)에 라이게이션하였다. 이 복합 프래그먼트를 프로모터 및 종결 특이 프라이머로 PCR하고, topo Blunt 벡터(InVitrogen)로 클로닝하여 pACS1을 제공하였다.
ACS2 오픈 리딩 프래임은 acs2f 및 acs2r로 PCR 증폭되었다.
acs2f: AACTGCAGAAAATGACAATCAAGGAACATAAAGTAGTTTATGAAGCTCA (SEQ ID NO: 49)
acs2r: ACGTCGACTATTTCTTTTTTTGAGAGAAAAATTGGTTCTCTACAGCAGA (SEQ ID NO: 50)
이 PCR 프래그먼트는 제한효소 PstI 및 SalI으로 절제되고, SpeI 및 PstI 절제된 PGK1 프로모터 그래그먼트(콜렉션 C5YeastCompany) 및 XhoI 및 BsiWI 절제된 PGI1 종결 프래그먼트(콜렉션 C5YeastCompany)에 라이게이션되었다. 이 복합 프래그먼트는 프로모터 및 종결 특이 프라이머로 PCR하고, topo Blunt 벡터(InVitrogen)로 클로닝하여 pACS2을 제공하였다.
ACS1 과발현 구조물은 제한효소 SalI 및 BsiWI으로 pACS1으로부터 절제되고, ACS2 과발현 구조물은 제한효소 SpeI 및 BsiWI으로 pACS2로부터 절제되고, KanMX 마커는 BspE1 및 XbaI으로 절제되었다(플라스미드 콜렉션 C5YeastCompany). 이러한 프래그먼트들은 BspE1 및 XhoI으로 절제된 플라스미드 pRS306 + 2mu ORI(플라스미드 콜렉션 C5Yeast company)에 라이게이션되어 최종 플라스미드 pRN753(SEQ ID NO: 51)을 제공하였다. 이 플라스미드는 표 4에 나타낸 이스트 스트레인들을 형질전환하는데 사용되고, 형질전환체들은 G418 내성에 대해 선별되었다. 과발현은 qPCR에 의해 확인되었다. ACS1 및 ACS2의 과발현에 사용될 수 있는 변형적인 플라스미드는 pRN500(SEQ ID NO: 20)이다.
E. coli , adhE . E. histolytica ADH2 또는 E. coli mphF 의 발현
PGK1 프로모터(SpeI-Pst1) 및 ADH1 종결 서열(AflII-NotI)은 코돈 최적화된 합성 프래그먼트에 부가되고, SpeI 및 NotI으로 절제된 2μ ori를 갖는 pRS303으로 클로닝되었으며, 발현 구조물은 이 벡터에 클로닝되었다. 발현은 qPCR에 의해 확인되었다. E. coli mphF(SEQ ID NO: 2), E. coli adhE(SEQ ID NO: 4) 및 E. histolytica ADH2(SEQ ID NO: 6)에 대해 코돈 최적화된 서열은 서열 목록에 나타낸 바와 같다.
E. coli mphF 유전자의 발현을 위해, 이스트 PGK1 프로모터 프래그먼트(SpeI - PstI) 및 ADH1 종결 프래그먼트(AflII - NotI)(모두 Nedalco 플라스미드 콜렉션으로부터 구입)를 E. coli mphF(SEQ ID NO: 2)를 암호화하는 코돈-최적화된 합성 프래그먼트에 라이게이션하였다. 2μ ori를 가진 pRS 303(= pRN347, Royal Nedalco 플라스미드 콜렉션)을 SpeI 및 NotI으로 절제하고, mhpF 발현 구조물을 이 벡터에 클로닝하여 pRN558(SEQ ID NO: 29)를 생성하였다.
E. coli adhE 유전자의 발현을 위해, E. coli adhE(SEQ ID NO: 4)를 암호화하는 코돈 최적화된 합성 프래그먼트를 XbaI 및 AflII로 절제하고, (pRN558내의 E.coli mhpF 유전자를 대체하는) XbaI 및 AflII로 절제된 pRN558내로 라이게이션하여 pRN595(SEQ ID NO: 30)을 생성하였다.
Entamoebe histolytica adh2의 발현을 위해, E. histolytica adh2(SEQ ID NO: 6)을 암호화하는 코돈 최적화된 합성 프래그먼트를 XbaI 및 AflII로 절제하고, (pRN558내의 E. coli mhpF 유전자를 대체하는) XbaI 및 AflII로 절제된 pRN558내로 라이게이션하여 pRN596(SEQ ID NO: 31)을 생성하였다.
pRN595는 pRN957 및 pRN977(하기 참조)의 추가 구성을 위해 사용하였다. pRN558 및 pRN596은 동일한 방식으로 사용될 수 있어, 이에 따라 각각, E. coli adhE의 발현을 E. coli mhpF 또는 E. histolytica adh2로 대체할 수 있다.
E. coli gldA 의 발현
E. coli gldA의 이스트에서 발현을 위한 구조물은 (제한효소 SpeIPstI으로 절제된) 이스트 ACT1 프로모터 프래그먼트, (PstI en BssHII으로 절제된) E. coli gldA를 암호화하는 합성 ORF(SEQ ID NO: 21) 및 (BssHII BsiWI으로 절제된) 이스트 CYC1 종결 프래그먼트를 함께 pCRII 블런트(Invitrogen)내로 라이게이션하여 pRNgldA(SEQ ID NO: 28)을 생성하였다.
DAK1 과발현
PCR은 ATG의 XbaI 사이트 5' 및 TAA의 SalI 사이트 3'을 도입하는 프라이머로 S. cerevisiae의 게놈 DNA에서 수행하여 SEQ ID NO: 22의 프래그먼트를 생성하였다. S. cerevisiae의 TPI1 프로모터를 포함하는 DNA 프래그먼트는 DAK ORF의 상향흐름에 라이게이션되고, S. cerevisiae의 PGI1 종결 프래그먼트를 포함하는 DNA 프래그먼트는 DAK1 ORF의 하향흐름에 라이게이션되어 pRNDAK(SEQ ID No: 38)을 생성하였다.
C. freundii dhaK 의 발현
Citrobacter freundii dhaK의 이스트에서의 발현을 위한 구조물은 (제한효소 XhoI 및 XbaI으로 절제된) 이스트 TPI1 프로모터 프래그먼트, (XbaI 및 SalI으로 절제된) C. freundii dhaK를 암호화하는 합성 ORF(SEQ ID NO: 26) 및 (XhoI 및 BsiWI으로 절제된) 이스트 PGI1 종결 프래그먼트를 함께 pCRII 블런트(Invitrogen)내로 라이게이션하여 pRNdhaK(SEQ ID NO: 27)을 생성하였다.
GUP1 과발현
PCR은 ATG의 HindIII 사이트 5' 및 TAA의 BamHI 사이트 3'을 도입하는 프라이머로 S. cerevisiae의 게놈 DNA에서 수행하여 SEQ ID NO: 23의 프래그먼트를 생성하였다. S. cerevisiae의 TDH3 프로모터를 포함하는 DNA 프래그먼트는 GUP1 ORF의 상향흐름에 라이게이션되고, S. cerevisiae의 CYC1 종결 프래그먼트를 포함하는 DNA 프래그먼트는 GUP1 ORF의 하향흐름에 라이게이션되었다.
FPS1 과발현
PCR은 ATG의 NsiI 사이트 5' 및 TAA의 BamHI 사이트 3'을 도입하는 프라이머로 S. cerevisiae의 게놈 DNA에서 수행하여 SEQ ID NO: 24의 프래그먼트를 생성하였다. S. cerevisiae의 ADH1(미디움) 프로모터를 포함하는 DNA 프래그먼트는 FSP1 ORF의 상향흐름에 라이게이션되고, S. cerevisiae의 CYC1 종결 프래그먼트를 포함하는 DNA 프래그먼트는 FSP1 ORF의 하향흐름에 라이게이션되었다.
pRN347 및 이스트 스트레인 RN1151 의 구성
pRN347은 (상보성을 위한 HIS3 유전자를 갖는) pRS303에서 2μ 오리진의 복사체(pYES2로부터 PCR-증폭된)를 클로닝하여 구성되었다. RN1041은 pRN347로 형질전환되어 RN1151 스트레인을 생성하였다.
E. coli gldA C. freundii dhaK 를 발현하거나 DAK1 을 과발현하는 스트레인
pRN957의 구성을 위해, E. coli gldA 발현 구조물이 SpeI 및 BsiWI 제한효소로 pRNgldA 플라스미드로부터 절제되었다. C. freundii dhaK 발현 구조물은 BsiWI 및 XhoI 제한효소로 pRNdhaK로부터 절제되었다. 이러한 프래그먼트는 SpeI 및 SalI 제한효소로 절제된 pRN595 플라스미드로 라이게이션되어 pRN957(SEQ ID NO: 37)을 생성하였다.
pRN977의 구성을 위해, E. coli gldA 발현 구조물이 SpeI 및 BsiWI 제한효소로 pRNgldA 플라스미드로부터 절제되었다. DAK1 발현 구조물은 BsiWI 및 XhoI 제한효소로 pRNDAK로부터 절제되었다. 이러한 프래그먼트는 SpeI 및 SalI 제한효소로 절제된 pRN595 플라스미드로 라이게이션되어 pRN977(SEQ ID NO: 39)을 생성하였다.
pRN957 및 pRN977은 RN1041, RN1197, RN1198 및 RN1199를 형질전환하여 표 4에 나타낸 바와 같은 이스트 스트레인을 생성하는데 사용되었다.
Figure pct00001
3. 글리세롤 및/또는 아세트산의 존재 및 부재하에서 제조된 스트레인들을 이용한 멸균 이스트 추출물 펩톤 배지에서 무산소 발효
수반되는 아세트산의 환원 및 글리세롤의 산화의 원리의 증명은 1% 이스트 추출물 및 1% 펩톤을 함유하는 배지를 이용하여 획득되었다. 실험은 D = 0.05h-1에서 캐모스태트 배양(1리터 워킹 용량)으로 수행되었으며, pH는 KOH 또는 H2SO4의 자동 첨가에 의해 5.5로 유지하였다. 글루코즈(50g/l) 및 자일로즈(50g/l)를 이스트 추출물 펩톤 배지에 탄소 및 에너지 공급원으로 첨가하였다. 원리의 입증을 보여주는 이러한 실험을 위해, 아라비노즈가 포함되지 않았다. 적절한 경우에, 아세트산이 4g/l로 그리고 글리세롤이 10g/l로 이스트 추출물 펩톤 배지에 첨가하였다. 온도를 32℃로 유지하였다.
YP(이스트 추출물 1% w/v 및 펩톤 1% w/v) 배지에 각각의 당류 글루코즈 및 자일로즈(각각 1% w/v)에 부가적으로 이스트의 동결 글리세롤 스톡 배양물을 32℃ 및 pH 5.5에서 접종하여 스트레인의 예비배양물을 준비하였다. 쉐이크 플라스크에서 유산소 조건하에서 24h 배양 후, 이 배양물의 50ml를 상기 케모스태트 배양에 접종하는데 사용하였다.
안정한 상태의 발효시(5 용량 변화), 당(글루코즈 및 자일로즈) 소비, 아세트산의 소비 및 대사물(에탄올 및 글리세롤)의 분석을 위해 시료를 취하였다. 에탄올, 글리세롤 및 아세트산 농도는 HPLC 분석에 의해 모니터하였다. 당 소비를 측정하기 위해, 글루코즈 및 자일로즈를 HPAEC(Dionex) 분석에 의해 측정하였다.
RN1151 스트레인은 글리세롤의 존재 또는 부재하에서 4g/l 아세트산을 함유하는 배지에서 안정한 상태 환경에 이를 수 없었다. 아세트산이 배지에 첨가되지 않은 경우에, 안정한 상태에서 유기체는 모든 글루코즈 및 자일로즈를 소비하였다(1g/l 이하가 잔존함). 글리세롤이 소비되지 않았으나, 대신에 생성되었다.
RN1200 및 RN1201 스트레인은 아세트산 및 글리세롤이 첨가되거나 첨가되지 않은 배지에서 마찬가지로 시험하였다. 이러한 스트레인은 RN1151 스트레인과 분명하게 다르게 수행하였다. 글리세롤-함유 배지에서, 당류 글루코즈 및 자일로즈는 거의 완전히 소비되었다(1g/l 이하가 잔존함). 아세트산 수준은 0.5g/l로 감소하고, 발효 마지막에 글리세롤의 농도는 3가지 모든 경우에 3g/l이었다. RN1200 및 RN1201 스트레인에 의해 생성된 에탄올의 양은 다양한 실험에서 43-47g/l 범위이었다. 글리세롤을 함유하지 않았지만, 아세트산 4g/l를 함유하는 배지에서, 안정한 안정 상태가 획득되지 않았다. 이 스트레인은 이러한 조건하에서 성장할 수 없었다. 이러한 결과로부터, DAK1의 상향조절 또는 C. freundii dhaK의 발현과 함께 E. coli gldA 및 adhE 유전자의 발현은 스트레인의 성능에 깊은 영향을 나타내는 것으로 결론내렸다. 글리세롤의 존재하에서, 이들은 글리세롤 및 아세트산을 소비할 수 있다.
RN1202 내지 RN1207 스트레인은 GPD1 및/또는 GPD2 유전자가 결실된 것을 제외하고 RN1200 및 RN1201 스트레인과 유사하다. RN1200 및 RN1201 스트레인에 대한 경우에서와 같이 글리세롤이 배지에 첨가될 경우에, 아세트산 4g/l을 함유하는 배지에서, 당류 글루코즈 및 자일로즈는 거의 완전히 소비된다(1g/l 이하가 잔존함). 글리세롤이 첨가되지 않는 경우에, 안정한 상태가 획득되지 않는다.
4. 글리세롤의 존재 또는 부재하에서 목질 섬유 가수분해물을 포함하는 아세트산에서 제조된 스트레인들을 이용한 혐기성 발효
옥수수 섬유 가수분해물은 글루코즈(38g/l), 자일로즈(28g/l), 아라비노즈(12g/l) 및 아세트산(4g/l)을 함유한다. 이는 옥수수 섬유를 160℃ pH 3.0에서 20분간 처리한 다음, 셀룰라아제 및 헤미셀룰라아제의 효소적 가수분해에 의해 제조되었다. 아세트산을 이 가수분해물에 첨가하여 가수분해물에서 아세트산의 총 농도를 10g/l로 형성하였다. 아세트산이 풍부한 이러한 가수분해물의 pH는 KOH 첨가에 의해 pH = 4.5로 회복되었다. 이스트 추출물은 5g/l의 최종 농도에 이르도록 이 가수분해물에 첨가되었다. 모든 후속 실험에서, 이 농축된 가수분해물을 사용하였다. 발효 중에 pH는 KOH 또는 H2SO4의 자동 첨가에 의해 6.5로 유지되었다.
YP(이스트 추출물 1% w/v 및 펩톤 1% w/v) 배지에 각각의 당류 글루코즈, 자일로즈 및 아라비노즈(각각 1% w/v)에 부가적으로 이스트의 동결 글리세롤 스톡 배양물을 32℃ 및 pH 5.5에서 접종하여 스트레인의 예비배양물을 준비하였다. 쉐이크 플라스크에서 유산소 조건하에서 24h 배양 후, 이 배양물의 50ml를 발효조 배양에 접종하는데 사용하였다. 발효는 유가배양 발효 셋업을 수행하였다. (50g/l로 첨가된 글리세롤을 함유하거나 함유하지 않은) 가수분해물을 발효조에 펌핑하였다. 글리세롤이 첨가되지 않은 경우에, 40ml의 물을 첨가하였다. 처음 6시간 동안, 가수분해물에 대한 흐름 속도는 시간당 5ml의 속도로 설정되었다. 다음 6시간 동안, 흐름 속도는 시간당 10ml로 설정되었다. 후속적으로, 추가 43시간 동안, 흐름 속도는 시간당 20ml로 설정되었다. 발효의 마지막에 총 용량은 1000ml에 이르렀다. 이러한 혐기성 유가배양 발효는 100rpm에서 온화한 교반을 하면서 약 pH = 4.5에서 수행하였다. 발효중에 온도는 32℃로 설정하였다. 감염을 최소화하기 위해, 가수분해물은 발효전에 105℃에서 10분간 가열하고, 항생제 카나마이신을 50㎍/ml의 최종 농도로 첨가하였다.
55시간 후, 발효의 마지막에, 당(글루코즈, 자일로즈 및 아라비노즈) 소비, 아세트산의 소비 및 대사물(에탄올 및 글리세롤)의 분석을 위해 시료를 취하였다. 에탄올, 글리세롤 및 아세트산 농도는 시간 경과에 걸쳐 HPLC 분석에 의해 모니터하였다. 당 소비를 측정하기 위해, 글루코즈, 자일로즈 및 아라비노즈를 HPAEC(Dionex) 분석에 의해 측정하였다.
RN1151(= HIS3로 보완된 RN1041) 스트레인은 첨가되는 글리세롤의 존재 또는 부재하에서 가수분해물에 대해 시험되었다. 두 모든 경우에, 발효 운전의 마지막(55h)에 글루코즈의 농도는 35g/l이었으나, 자일로즈 및 아라비노즈는 각각, 28 및 12g/l의 이들의 초기 농도로 유지되었다. 생성된 에탄올의 양은 2g/l이었으며, 아세트산은 9.5g/l로 존재하였다. 글리세롤 소비는 글리세롤-함유 가수분해물에서 검출되지 않았다. 당류의 발효는 증가된 수준의 아세트산 때문에 유가 배양 운전 코스 중에 멈추었다. 초기에, 아세트산이 발효조에 존재하지 않았으나, 독성 수준의 아세트산을 함유한 가수분해물을 펌핑하는 동안 아세트산 농도는 신속히 독성 수준에 도달하였다.
RN1200 및 RN1201 스트레인은 글리세롤이 첨가되거나 첨가되지 않은 가수분해물에서 마찬가지로 시험하였다. 이러한 스트레인은 RN1151 스트레인과 분명하게 다르게 수행하였다. 글리세롤-함유 가수분해물에서, 당류 글루코즈, 자일로즈 및 아라비노즈는 완전히 소비되었다. 아세트산 수준은 2g/l로 감소하고, 발효 마지막에 글리세롤의 농도는 3가지 모든 경우에 29.5g/l이었다. RN1200 및 RN1201 스트레인에 의해 생성된 에탄올의 양은 각각, 51.7 및 52.2g/l이었다. 글리세롤을 함유하지 않은 가수분해물에서, 상당히 적은 당이 소비되었다. 자일로즈 및 아라비노즈 수준은 각각 28 및 12g/l에서 변하지 않았다. 글루코즈는 소비되었으나 단지 제한된 정도로만 소비되었다. 발효의 마지막에, 잔존 농도는 3가지 모든 경우에서 32g/l이었으며, 에탄올은 3g/l의 농도에 이르렀다. 아세트산의 농도는 발효의 마지막에 9.1g/l로 감소하였으며, 한편 일부 글리세롤이 생성되었다(0.5g/l 미만). 이러한 결과로부터, DAK1의 상향조절 또는 C. freundii dhaK의 발현과 함께 E. coli gldA 및 adhE 유전자의 발현은 스트레인의 성능에 깊은 영향을 나타내는 것으로 결론내렸다. 글리세롤의 존재하에서, 이들은 글리세롤 및 아세트산을 소비할 수 있으며, (RN1151 스트레인에 비해) 부가적인 에탄올을 생성할 수 있다. 글리세롤의 부재하에서, 상기 스트레인들은 일부 아세트산을 소비한다. 하지만, 발효 중에, 아세트산 수준은 독성 수준으로 증가한다.
RN1202 내지 RN1207 스트레인은 GPD1 및/또는 GPD2 유전자가 결실된 것을 제외하고 RN1200 및 RN1201 스트레인과 유사하다. RN1200 스트레인에 대한 경우에서와 같이 글리세롤 함유 가수분해물에서, 당류 글루코즈, 자일로즈 및 아라비노즈는 완전히 소비된다. 이러한 3가지 경우에서 발효의 마지막에 아세트산 수준은 약 2g/l로 감소하고, 글리세롤의 농도는 28g/l이었다. RN1202, RN1203, RN1204, RN1205, RN1206 및 RN1207 스트레인에 대해 생성된 에탄올의 양은 각각, 51.6, 52.9, 52.1, 52.5, 53.1 및 52.3 g/l이었다. 글리세롤을 함유하지 않은 가수분해물에서, 상당히 적은 당이 소비되었다. 자일로즈 및 아라비노즈 수준은 각각 28 및 12g/l에서 변하지 않았다. 글루코즈는 소비되었으나 단지 제한된 정도로만 소비되었다. 발효의 마지막에, 비-글리세롤 가수분해물에서 글루코즈에 대한 잔존 농도는 3가지 모든 경우에서 31g/l이었으며, 에탄올은 3g/l의 농도에 이르렀다. 아세트산의 농도는 발효의 마지막에 9.1g/l로 감소하였으며, 한편 일부 글리세롤이 생성되었다(0.5g/l 미만). 이러한 결과로부터, RN1202, RN1203, RN1204, RN1205, RN1206 및 RN1207에서 다른 변형과 함께 GPD1 및/또는 GPD2 유전자 결실은 원하는 반응을 수행할 수 있는 스트레인을 형성하는 것으로 결론내렸다.
실시예 5-8에 대한 재료 및 방법
일반 분자생물학 기술
달리 언급하지 않는 한, 사용된 방법들은 표준 생화학 기술이다. 적절한 일반적 방법론 교과서의 예는 Sambrook et al., Molecular Cloning, a Laboratory Manual (1989) 및 Ausubel et al., Current Protocols in Molecular Biology (1995), John Wiley & Sons, Inc.를 포함한다.
배지
실험에 사용된 배지는 실시예에 나타낸 바와 같이 당류가 보충된 YEP-배지(10g/l 이스트 추출물, 20g/l 펩톤) 또는 고형 YNB-배지(6.7g/l 이스트 니트로겐 베이스, 15g/l 아가)이었다. 고형 YEP 배지를 위해, 15g/l 아가가 멸균전에 액체 배지에 첨가되었다.
AFM 실험에서, 미네랄 배지가 사용되었다. 미네랄 배지의 조성은 Verduyn 등(Yeast (1992), Volume 8, 501-517)에 기재되어 있으며, 우레아 2.325g/l 및 실시예에 나타낸 바와 같이 당류가 보충되었다.
이스트 세포의 형질전환
이스트 형질전환은 Schiestl 및 Gietz(Current Genetics (1989), Volume 16, 339-346)에 의해 기재된 방법에 따라 수행하였다.
콜로니 PCR
게놈 DNA는 Looke 등(BioTechniques (2011), Volume 50, 325-328)에 의해 기재된 방법에 따라 PCR을 위한 단일 이스트 콜로니로부터 추출하였다.
AFM 공정
알코올 발효 모니터(AFM; Halotec, Veenendaal, the Netherlands)는 동시에 6가지 혐기성 발효에 대한 탄소 전환율 및 수율을 정확하게 비교할 수 있는 강건하고 사용자에게 친숙한 실험실 병렬 바이오리액터이다.
AFM 실험의 출발 배양물은 50mg의 이스트(건중량)를 함유하였다. 이를 측정하기 위해, 보정 곡선은 바이오매스 대 OD700의 RN1041 스트레인으로 형성되었다. 이 보정 곡선은 50mg의 이스트(건중량)에 대해 요구되는 세포 배양물의 용량을 측정하기 위해 본 실험에서 사용되었다.
AFM 실험의 출발 전에, 예비배양물을 실시예에 나타낸 바와 같이 성장시켰다. 각 스트레인에 대해, OD700을 측정하고, 50mg의 이스트(건중량)를 2.325g/l 우레아 및 실시예에 나타낸 바와 같은 당류가 보충된 400ml 미네랄 배지(Verduyn 등(Yeast (1992), Volume 8, 501-517)에 접종하였다.
글리세롤디하이드로게나아제 활성 어세이
글리세롤디하이드로게나아제 활성 어세이의 측정 방법은 Lin 및 Magasanik(1960) J Biol Chem.235:1820-1823으로부터 적용하였다.
어세이 조건
1.0 M 카보네이트/비카보네이트 버퍼 pH 10 800㎕
1.0 M 암모늄설페이트 33㎕
0.1 M NAD+ 33㎕
세포 프리 추출물 5㎕
세포 프리 추출물은 원심분리에 의해 세포들을 수거하여 준비하였다. 세포들을 대수증식기에서 수거하였다. 세포 펠렛을 1M 카보네이트/비카보네이트 버퍼(pH 10)으로 1회 세정하고, 유리 비드를 첨가하고, 세포가 붕괴될 때까지 1분간 간격으로 최대 속도로 보텍싱하여 세포 프리 추출물을 동시에 준비하였다. 후자는 현미경으로 체크하였다.
쉐이크 플라스크 실험
혐기성 쉐이크 플라스크 실험을 실시예에 나타낸 바와 같이 수행하였다. 전형적인 실험은 25ml의 배지를 함유하는 100ml Erlenmeyer 플라스크를 사용하였다. 혐기적 조건을 확실히 하기 위해, 플라스크를 워터락으로 봉하였다.
각 시점에 대해, 각각의 쉐이크 플라스크에 접종하였으며, 이에 따라 샘플링 중에 에어레이션을 생략하였다.
스트레인
실시예 5 내지 8에 기재된 실험에 사용된 모 스트레인은 RN1041이다.
RN1041은 WO 2012067510에 기재되어 있다. 이 스트레인은 하기 유전자형을 갖는다:
MAT a, ura3 -52, leu2 -112, his3::loxP, gre3::loxP, loxP-pTPI1::TAL1, loxP-pTPI1::RKI1, loxP-pTPI1-TKL1, loxP-pTPI1-RPE1, delta::pADH1-XKS1-tCYC1-LEU2, delta:: URA3-pTPI1-xylA-tCYC1
MAT a = 매이팅 타입 a
ura3 -52, leu -112, HIS3::loxP는 각각, URA3 , LEU2HIS3 유전자에서 돌연변이이다. ura3 -52 돌연변이는 xylA 과발현 구조물상의 URA3 유전자에 의해 보완되며; leu2 -112 돌연변이는 XKS1 과발현 구조물상의 LEU2 유전자에 의해 보완된다. HIS3-유전자의 결실은 히스티딘 영양요구성을 일으킨다. 이러한 이유로, RN1041은 성장 배지에 히스티딘을 필요로 한다.
gre3::loxP는 알도즈 환원효소를 암호화하는 GRE3 유전자의 결실이다. loxP 사이트는 마커 제거 후에 게놈에 남는다.
loxP-pTPI1은 본 명세서에 기재된 실험에서, TPI1 유전자의 프로모터에 의해 고유 프로모터의 대체에 의해 비-산화 펜토즈 포스페이트 경로의 유전자의 과발현을 지정한다. 강하고 구성적인 TPI1 프로모터의 상향흐름의 loxP 사이트는 마커 제거 후에 게놈에 잔류한다(Kuyper et al, FEMS Yeast Research 5 (2005) 925-934).
델타:: Ty1 레트로트랜스포손의 긴말단 반복순서에서 재조합 후의 구조물의 염색체 통합을 의미한다.
실시예 5
스트레인의 구성
하기 스트레인들이 제조되었다.
제조된 스트레인
RN1041 모 스트레인(상기 참조)
RN1067 RN1041 gpd1 :: hphMX
RN1068 RN1041 gpd2 :: natMX
RN1069 RN1041 gpd1 :: hphMX gpd2 :: natMX
RN1186 RN1041 + pRN977
RN1187 RN1067 + pRN977
RN1188 RN1068 + pRN977
RN1189 RN1069 + pRN977
GPD1-유전자(gpd1) 및/또는 GPD2-유전자(gpd2)의 결실은 실시예 2에 기재된 바와 같이 수행하였다.
RN1041, RN1067, RN1068 및 RN1069 스트레인은 플라스미드 pRN977로 형질전환되었다. 이 플라스미드는 하기 특징을 함유한다: 형질전환체의 선별을 위한 HIS3-유전자, 2μ의 복제 오리진, E. coli에서 선별을 위한 암피실린 내성 마커, PGK1-프로모터 및 ADH1-종결자의 조절하에 있는 E. coliadhE-유전자, TPI1-프로모터 및 PGI1-종결자의 조절하에 있는 S. cerevisiae의 DAK1-유전자 및 ACT1-프로모터 및 CYC1-종결자의 조절하에 있는 E. coli gldA-유전자. 모든 프로모터 및 종결자는 S. cerevisiae로부터 얻어진다. pRN977의 서열은 SEQ ID NO: 39에 기재되어 있다.
RN1041, RN1067, RN1068 및 RN1069 스트레인의 형질전환 후, 단일 콜로니 분리물은 pRN977 플라스미드의 존재를 체크하기 위해 콜로니 PCR 분석된다. 각 형질전환의 대표적 콜로니는 다른 실험을 위해 선별된다. 이러한 선별된 스트레인은 RN1186, RN1187, RN1188 및 RN1189로 지정된다.
마찬가지로, 형질전환체들은 하기 설명에 따라 생성되었다:
형질전환체
RN1190 RN1041 + pRN957
RN1191 RN1067 + pRN957
RN1192 RN1068 + pRN957
RN1193 RN1069 + pRN957
pRN957 플라스미드는 pRN977과 유사하나, S. cerevisiaeDAK1-유전자는 Citrobacter freundiidhaK-유전자로 대체되었다. 이 플라스미드 pRN957의 서열을 SEQ ID NO: 37에 기재하였다.
컨트롤 스트레인으로서, RN1041 스트레인은 pRN595 플라스미드(RN1041+pRN595)로 형질전환되었다. 이 플라스미드, pRN595는 pRN977과 유사하나, gldADAK1 유전자가 결여되어 있다. 플라스미드 pRN595의 서열을 SEQ ID NO: 30에 기재하였다.
실시예 6
쉐이크 플라스크 실험
제조된 스트레인들의 성능은 혐기성 쉐이크 플라스크 실험에서 시험하였다. 이를 위해, 세포들을 탄소 공급원으로서 글루코즈가 보충된 미네랄 배지(Verduyn)에서 예비 성장시켰다. 배양물을 280rpm, 30℃에서 회전 쉐이커에서 밤새 배양하였다.
혐기적 배양의 접종을 위해 세포들의 분액을 밤새 배양된 배양물로부터 취하였다. 세포들의 양은 혐기적 배양물이 600nm에서 약 0.1의 초기 광학 밀도를 갖도록 하였다.
미네랄 배지의 탄소 조성물: 2.5% 글루코즈, 2.5% 자일로즈, 1% 글리세롤 및 2g/l HAc. pH는 pH 4.5로 조절되었다. 쉐이크 플라스크는 혐기적 조건을 확실히 하기 위해 워터락으로 봉하였다. 각 시점에 대해, 각각의 플라스크에 접종되었다.
발효 94시간 후에, 순 글리세롤 증가 또는 감소, 및 HAc 소비의 결과를 하기 표에 나타내었다.
각 스트레인에서 글리세롤 및 HAc 소비, 및 에탄올 생성값
스트레인 순 글리세롤 증가(+) 또는 감소(-) (grams/liter) HAc 소비
(grams/liter)
에탄올 역가
(grams/liter)
RN1041 + 1.47 0.24 23.28
RN1186 - 1.20 0.99 25.32
RN1187 - 1.52 0.99 23.76
RN1188 - 0.80 0.97 25.01
RN1189 - 0.86 0.89 24.85
RN1190 - 0.47 0.71 24.38
RN1191 - 0.80 0.93 24.77
RN1192 + 0.93 0.29 23.60
RN1193 - 0.84 0.92 24.93
표 8에서 RN1041로 나타낸 스트레인은 HIS3-유전자 및 2μ 복제 오리진을 함유하여 히스티딘 영양요구성을 보완하는 표준 클로닝 벡터인 플라스미드 pRS323으로 형질전환되었다.
결과는 다음과 같다:
- RN1041은 글리세롤을 생성하며, 이는 GPD1 -GPD2 -유전자 모두가 활성적이며 gldADAK1은 과발현되지 않기 때문에 실행가능하다. adhE는 이 스트레인에서 발현되지 않기 때문에, HAc 소비는 낮다.
- RN1186 내지 RN1189는 글리세롤 및 HAc 소비를 나타내며, RN1041에 비해 증가된 에탄올 역가를 형성한다.
- 형질전환체 RN1190, RN1191 및 RN1193을 이용한 실험은 동일한 결과, 즉, 글리세롤 및 아세테이트의 소비를 나타내지만, 약간 보다 적은 정도로 나타내었다. 또한, 여기서 에탄올 역가는 RN1041에 비해 높다. 스트레인 RN1192의 결과는 이후에 특성화가 이 스트레인이 이의 플라스미드 pRN957을 상실한 것으로 나타남에 따라, 이는 인위구조(artefact)이다.
gldAadhE의 과발현과 함께 동종성 또는 이종성 디하이드록시아세톤 키나아제의 과발현은 혐기성 조건하에서 아세테이트 및 글리세롤의 동시 소비를 일으킨다.
실시예 7
AFM 실험
실시예 6에 나타낸 실험은 약간 다른 셋업, 즉, 실험 중에 온-라인 이산화탄소 측정이 가능한 AFM(알코올 발효 모니터)에서 반복되었다.
시험된 스트레인은 RN1041, RN1041+pRN595, RN1186, RN1187, RN1188 및 RN1189이었다. RN1041 스트레인은 HIS3-유전자 및 2μ 복제 오리진을 함유하여 히스티딘 영양요구성을 보완하는 표준 클로닝 벡터인 플라스미드 pRS323으로 형질전환되었다.
상기 스트레인들은 탄소 공급원으로서 2% 글루코즈를 함유한 미네랄 배지에서 280rpm 및 30℃에서 예비-배양되었다.
세포들을 수거하고 AFM 실험을 상기한 바와 같이 시작하였다.
시료들을 일정 간격으로 취하고, 당류, 에탄올, 글리세롤 및 HAc를 HPLC에 의해 측정하였다.
결과를 하기 표에 나타내었다.
시간 = 112hours에서 각 스트레인에 대한 글리세롤 및 HAc 소비 및 에탄올 생성값
스트레인 순 글리세롤 증가(-) 또는 감소(+) (grams/liter) HAc 소비
(grams/liter)
에탄올 생성
(grams/liter)
RN1041 + 1.4 0.1 24.0
RN1041+pRN595 + 1.1 0.4 24.1
RN1186 - 0.3 0.7 25.5
RN1187 - 1.2 1.0 25.5
RN1188 - 0.3 0.7 25.2
RN1189 - 1.1 1.0 25.6
시간에 따른 글리세롤 및 HAc 수준의 평가를 도 1 및 2에 나타내었다.
RN1041 및 RN1041+pRN595 스트레인은 순 글리세롤 생성을 나타내었다. RN1186 및 RN1188 스트레인은 초기에 글리세롤 생성을 나타내었으나, 약 24-32시간 후에, 글리세롤 소비가 시작되었으며, 마지막에 순 글리세롤 소비가 관찰될 때까지 계속되었다.
RN1187 및 RN1189 스트레인은 RN1186 및 RN1188에서 나타난 바와 같이 초기 글리세롤 생성을 나타내지 않았다. 24시간 후, 글리세롤 소비가 시작되었다. 글리세롤 소비는 RN1186 및 RN1188에 비해 이러한 스트레인에서 현저히 더 높았다. 이러한 결과는 GPD1-유전자의 결실이 GPD2-유전자의 결실보다 더 높은 글리세롤 소비를 형성함을 보여준다.
RN1041+pRN595 스트레인은 레퍼런스 스트레인 RN1041보다 더 높은 HAc 소비를 보여주었다. RN1186 및 RN1188은 RN1041+pRN595보다 더 높은 HAc 소비를 나타내었다. 이러한 결과는 글리세롤 소비가 HAc 소비를 증가시켰음을 나타낸다. 이러한 효과는 RN1187 및 RN1189에서 더 강하였다.
실시예 8
글리세롤 디하이드로게나아제 활성 어세이
RN1041 및 RN1190의 세포 프리 추출물(CFE)을 상기한 바와 같이 준비하였다. Lin 및 Magasanik(1960) J Biol Chem.235:1820-1823의 프로토콜로부터 채용된 글리세롤 디하이드로게나아제 활성 어세이를 수행하였다. 그 결과를 하기 표에 나타내었다.
글리세롤 디하이드로게나아제 어세이
시료 보조인자 A340/min에서 증가
RN1041 5 ㎕ CFE NAD+ 0.00
N1190 5 ㎕ CFE NAD+ 0.02
RN1041 20 ㎕ CFE NAD+ 0.00
RN1190 20 ㎕ CFE NAD+ 0.09
RN1041 5 ㎕ CFE NADP+ 0.00
RN1190 5 ㎕ CFE NADP+ 0.00
RN1041 20 ㎕ CFE NADP+ 0.00
RN1190 20 ㎕ CFE NADP+ 0.00
표 10에 RN1041로 나타낸 스트레인은 HIS3-유전자 및 2μ 복제 오리진을 함유하여 히스티딘 영양요구성을 보완하는 표준 클로닝 벡터인 pRS323 플라스미드로 형질전환되었다.
이러한 결과는 a) RN1190에서 발현되는 E. coli gldA가 NAD+-의존적이며, 그리고 b) CFE의 양 증가는 NAD+의 전환율의 비례하는 증가를 형성하였으며, 이에 따라 글리세롤의 디히드록시아세톤으로의 전환율이 비례하는 증가를 형성하였다.
SEQUENCE LISTING <110> DSM IP Assets B.V. <120> Microbial strains engineered to produce ethanol from carbohydrates, acetic acid and glycerol <130> P6038681PCT <150> EP 11191333 <151> 2011-11-30 <150> US 61/564,932 <151> 2011-11-30 <160> 51 <170> PatentIn version 3.3 <210> 1 <211> 316 <212> PRT <213> Escherichia coli <400> 1 Met Ser Lys Arg Lys Val Ala Ile Ile Gly Ser Gly Asn Ile Gly Thr 1 5 10 15 Asp Leu Met Ile Lys Ile Leu Arg His Gly Gln His Leu Glu Met Ala 20 25 30 Val Met Val Gly Ile Asp Pro Gln Ser Asp Gly Leu Ala Arg Ala Arg 35 40 45 Arg Met Gly Val Ala Thr Thr His Glu Gly Val Ile Gly Leu Met Asn 50 55 60 Met Pro Glu Phe Ala Asp Ile Asp Ile Val Phe Asp Ala Thr Ser Ala 65 70 75 80 Gly Ala His Val Lys Asn Asp Ala Ala Leu Arg Glu Ala Lys Pro Asp 85 90 95 Ile Arg Leu Ile Asp Leu Thr Pro Ala Ala Ile Gly Pro Tyr Cys Val 100 105 110 Pro Val Val Asn Leu Glu Ala Asn Val Asp Gln Leu Asn Val Asn Met 115 120 125 Val Thr Cys Gly Gly Gln Ala Thr Ile Pro Met Val Ala Ala Val Ser 130 135 140 Arg Val Ala Arg Val His Tyr Ala Glu Ile Ile Ala Ser Ile Ala Ser 145 150 155 160 Lys Ser Ala Gly Pro Gly Thr Arg Ala Asn Ile Asp Glu Phe Thr Glu 165 170 175 Thr Thr Ser Arg Ala Ile Glu Val Val Gly Gly Ala Ala Lys Gly Lys 180 185 190 Ala Ile Ile Val Leu Asn Pro Ala Glu Pro Pro Leu Met Met Arg Asp 195 200 205 Thr Val Tyr Val Leu Ser Asp Glu Ala Ser Gln Asp Asp Ile Glu Ala 210 215 220 Ser Ile Asn Glu Met Ala Glu Ala Val Gln Ala Tyr Val Pro Gly Tyr 225 230 235 240 Arg Leu Lys Gln Arg Val Gln Phe Glu Val Ile Pro Gln Asp Lys Pro 245 250 255 Val Asn Leu Pro Gly Val Gly Gln Phe Ser Gly Leu Lys Thr Ala Val 260 265 270 Trp Leu Glu Val Glu Gly Ala Ala His Tyr Leu Pro Ala Tyr Ala Gly 275 280 285 Asn Leu Asp Ile Met Thr Ser Ser Ala Leu Ala Thr Ala Glu Lys Met 290 295 300 Ala Gln Ser Leu Ala Arg Lys Ala Gly Glu Ala Ala 305 310 315 <210> 2 <211> 968 <212> DNA <213> Artificial <220> <223> mhpF codon optimised <400> 2 ctgcagtcta gatgtctaag agaaaggttg ctatcatcgg ttctggtaac atcggtactg 60 acttgatgat caagatccta agacacggtc aacacttgga aatggctgtt atggttggta 120 tcgacccaca atctgacggt ttggctagag ctagaagaat gggtgttgct accacccacg 180 aaggtgttat cggtttgatg aacatgccag aattcgctga catcgacatc gttttcgacg 240 ctacctctgc tggtgctcac gttaagaacg acgctgcttt gagagaagct aagccagaca 300 tcagattgat cgacttgacc ccagctgcta tcggtccata ctgtgttcca gttgttaact 360 tggaagctaa cgttgaccaa ttaaacgtta acatggttac ctgtggtggt caagctacca 420 tcccaatggt tgctgctgtt tcaagagttg ctagagttca ctacgctgaa atcatcgctt 480 ctatcgcttc taagtctgct ggtccaggta ccagagctaa catcgacgaa ttcaccgaaa 540 ccacctctag ggctatcgaa gttgttggtg gtgctgctaa gggtaaggct atcatcgttt 600 tgaacccagc tgaaccacca ttgatgatga gagacaccgt ttacgttttg tctgacgaag 660 catctcaaga cgacatcgaa gcttcaatca acgaaatggc tgaagctgtt caagcatacg 720 ttccaggtta cagattgaag caaagagttc aattcgaagt tatcccacaa gacaagccag 780 ttaacttgcc aggtgttggt caattctctg gtttgaagac cgctgtttgg ttggaagttg 840 aaggtgctgc tcactacttg ccagcttacg ctggtaactt ggacattatg acctcttctg 900 ctttggctac cgctgaaaag atggctcaat ctttggctag aaaggctggt gaagctgctt 960 aagcgcgc 968 <210> 3 <211> 891 <212> PRT <213> Escherichia coli <400> 3 Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val 1 5 10 15 Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp 20 25 30 Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro 35 40 45 Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp 50 55 60 Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr 65 70 75 80 Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly 85 90 95 Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro 100 105 110 Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu 115 120 125 Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp 130 135 140 Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala 145 150 155 160 Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu 165 170 175 Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala 180 185 190 Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro 195 200 205 Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr 210 215 220 Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe 225 230 235 240 Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp 245 250 255 Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr 260 265 270 Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys 275 280 285 Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile 290 295 300 Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile 305 310 315 320 Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys 325 330 335 Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala 340 345 350 Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr 355 360 365 Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr 370 375 380 Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala 385 390 395 400 Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser 405 410 415 Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn 420 425 430 Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala 435 440 445 Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg 450 455 460 Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys 465 470 475 480 Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala 485 490 495 Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val 500 505 510 Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly 515 520 525 Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly 530 535 540 Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu 545 550 555 560 His Pro Glu Thr His Phe Glu Glu Leu Ala Leu Arg Phe Met Asp Ile 565 570 575 Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met 580 585 590 Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe 595 600 605 Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp 610 615 620 Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met 625 630 635 640 Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr 645 650 655 His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp 660 665 670 Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala 675 680 685 Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His 690 695 700 Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly 705 710 715 720 Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro 725 730 735 His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn 740 745 750 Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg 755 760 765 Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu 770 775 780 Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala 785 790 795 800 Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg 805 810 815 Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu 820 825 830 Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr 835 840 845 Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly 850 855 860 Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro 865 870 875 880 Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala 885 890 <210> 4 <211> 2690 <212> DNA <213> Artificial <220> <223> synthetic codon optimimised adhE <400> 4 tctagaaaat ggctgttacc aacgttgctg aattgaacgc tttggttgaa agggttaaga 60 aggctcaaag agaatacgct tctttcaccc aagaacaagt tgacaagatc ttcagagctg 120 ctgctttggc tgctgctgac gctagaatcc cattggctaa gatggctgtt gctgaatctg 180 gtatgggtat cgttgaagac aaggttatca agaaccactt cgcttctgaa tacatctaca 240 acgcttacaa ggacgaaaag acctgtggtg ttttgtcaga agacgacacc ttcggtacca 300 tcaccatcgc tgaaccaatc ggtatcatct gtggtatcgt tccaaccacc aacccaacct 360 ctaccgctat cttcaagtct ttgatctctt tgaagaccag aaacgctatc atcttctctc 420 cacacccaag agctaaagac gctaccaaca aggctgctga catcgttttg caagctgcta 480 tcgctgctgg tgctccaaag gacttgatcg gttggatcga ccaaccatct gttgaattgt 540 ctaacgcttt gatgcaccac ccagacatca acttgatctt ggctaccggt ggtccaggta 600 tggttaaggc tgcttactct tctggtaagc cagctatcgg tgttggtgct ggtaacaccc 660 cagttgttat cgacgaaacc gctgacatca agagagctgt tgcttctgtt ttgatgtcta 720 agaccttcga caacggtgtt atctgtgctt ctgaacaatc tgttgttgtt gttgactctg 780 tttacgacgc tgttagagaa agattcgcta cccacggtgg ttacttgttg caaggtaagg 840 aattgaaggc tgttcaagac gttatcttga agaacggtgc tttgaacgct gctatcgttg 900 gtcaaccagc ttacaagatc gctgaattag ctggtttctc tgttccagaa aacaccaaga 960 tcttgatcgg tgaagttacc gttgttgacg aatctgaacc attcgctcac gaaaagttgt 1020 ctccaacctt ggctatgtac agagctaagg acttcgaaga cgctgttgaa aaagctgaaa 1080 agttggttgc tatgggtggt attggtcaca cctcttgttt gtacaccgac caagacaacc 1140 aaccagctag agtttcttac ttcggtcaaa agatgaagac cgctagaatc ttgatcaaca 1200 ccccagcttc tcaaggtggt atcggtgact tgtacaactt caagttggct ccatctttga 1260 ccttgggttg tggttcttgg ggtggtaact ctatctctga aaacgttggt ccaaagcact 1320 tgatcaacaa gaagaccgtt gctaagagag ctgaaaacat gttgtggcac aagttgccaa 1380 aatctatcta cttcagaaga ggttctttgc caatcgcttt ggacgaagtt atcaccgacg 1440 gtcacaagag agctttgatc gttaccgaca gattcttgtt caacaacggt tacgctgacc 1500 aaatcacctc tgttttgaag gctgctggtg ttgaaaccga agttttcttc gaagttgaag 1560 ctgacccaac cttgtctatc gttagaaagg gtgctgaatt ggctaactct ttcaagccag 1620 acgttatcat cgctttgggt ggtggttctc caatggacgc tgctaagatc atgtgggtta 1680 tgtacgaaca cccagaaacc cacttcgaag aattggcttt gagattcatg gacatcagaa 1740 agagaatcta caagttccca aagatgggtg ttaaggctaa gatgatcgct gttaccacca 1800 cctctggtac cggttctgaa gttaccccat tcgctgttgt taccgacgac gctaccggtc 1860 aaaagtaccc attggctgac tacgctttga ccccagacat ggctatcgtt gacgctaact 1920 tggttatgga catgccaaag tctttgtgtg ctttcggtgg tttggacgct gttacccacg 1980 ctatggaagc ttacgtttct gttttggctt ctgaattctc tgacggtcaa gctttgcaag 2040 ctttgaagtt gttgaaggaa tacttgccag cttcttacca cgaaggttct aagaacccag 2100 ttgctagaga aagagttcac tctgctgcta ccatcgctgg tatcgctttc gctaacgctt 2160 tcttgggtgt ttgtcactct atggctcaca agttgggttc tcaattccac atcccacacg 2220 gtttggctaa cgctttgttg atctgtaacg ttatcagata caacgctaac gacaacccaa 2280 ccaagcaaac cgctttctct caatacgaca gaccacaagc tagaagaaga tacgctgaaa 2340 tcgctgacca cttgggtttg tctgctccag gtgacagaac cgctgcaaag atcgaaaagt 2400 tgttggcttg gttggaaacc ttgaaggctg aattgggtat cccaaagtct atcagagaag 2460 ctggtgttca agaagctgac ttcttggcta acgttgacaa gttgtctgaa gacgctttcg 2520 acgaccaatg taccggtgct aacccaagat acccattgat ctctgaattg aagcaaatct 2580 tgttggacac ctactacggt agagactacg ttgaaggtga aaccgctgct aagaaggaag 2640 ctgctccagc taaggctgaa aagaaggcta agaagtctgc ttagcttaag 2690 <210> 5 <211> 870 <212> PRT <213> Entamoeba histolytica <400> 5 Met Ser Thr Gln Gln Thr Met Thr Val Asp Glu His Ile Asn Gln Leu 1 5 10 15 Val Arg Lys Ala Gln Val Ala Leu Lys Glu Tyr Leu Lys Pro Glu Tyr 20 25 30 Thr Gln Glu Lys Ile Asp Tyr Ile Val Lys Lys Ala Ser Val Ala Ala 35 40 45 Leu Asp Gln His Cys Ala Leu Ala Ala Ala Ala Val Glu Glu Thr Gly 50 55 60 Arg Gly Ile Phe Glu Asp Lys Ala Thr Lys Asn Ile Phe Ala Cys Glu 65 70 75 80 His Val Thr His Glu Met Arg His Ala Lys Thr Val Gly Ile Ile Asn 85 90 95 Val Asp Pro Leu Tyr Gly Ile Thr Glu Ile Ala Glu Pro Val Gly Val 100 105 110 Val Cys Gly Val Thr Pro Val Thr Asn Pro Thr Ser Thr Ala Ile Phe 115 120 125 Lys Ser Leu Ile Ser Ile Lys Thr Arg Asn Pro Ile Val Phe Ser Phe 130 135 140 His Pro Ser Ala Leu Lys Cys Ser Ile Met Ala Ala Lys Ile Val Arg 145 150 155 160 Asp Ala Ala Ile Ala Ala Gly Ala Pro Glu Asn Cys Ile Gln Trp Ile 165 170 175 Glu Phe Gly Gly Ile Glu Ala Ser Asn Lys Leu Met Asn His Pro Gly 180 185 190 Val Ala Thr Ile Leu Ala Thr Gly Gly Asn Ala Met Val Lys Ala Ala 195 200 205 Tyr Ser Ser Gly Lys Pro Ala Leu Gly Val Gly Ala Gly Asn Val Pro 210 215 220 Thr Tyr Ile Glu Lys Thr Cys Asn Ile Lys Gln Ala Ala Asn Asp Val 225 230 235 240 Val Met Ser Lys Ser Phe Asp Asn Gly Met Ile Cys Ala Ser Glu Gln 245 250 255 Ala Ala Ile Ile Asp Lys Glu Ile Tyr Asp Gln Val Val Glu Glu Met 260 265 270 Lys Thr Leu Gly Ala Tyr Phe Ile Asn Glu Glu Glu Lys Ala Lys Leu 275 280 285 Glu Lys Phe Met Phe Gly Val Asn Ala Tyr Ser Ala Asp Val Asn Asn 290 295 300 Ala Arg Leu Asn Pro Lys Cys Pro Gly Met Ser Pro Gln Trp Phe Ala 305 310 315 320 Glu Gln Val Gly Ile Lys Val Pro Glu Asp Cys Asn Ile Ile Cys Ala 325 330 335 Val Cys Lys Glu Val Gly Pro Asn Glu Pro Leu Thr Arg Glu Lys Leu 340 345 350 Ser Pro Val Leu Ala Ile Leu Lys Ala Glu Asn Thr Gln Asp Gly Ile 355 360 365 Asp Lys Ala Glu Ala Met Val Glu Phe Asn Gly Arg Gly His Ser Ala 370 375 380 Ala Ile His Ser Asn Asp Lys Ala Val Val Glu Lys Tyr Ala Leu Thr 385 390 395 400 Met Lys Ala Cys Arg Ile Leu His Asn Thr Pro Ser Ser Gln Gly Gly 405 410 415 Ile Gly Ser Ile Tyr Asn Tyr Ile Trp Pro Ser Phe Thr Leu Gly Cys 420 425 430 Gly Ser Tyr Gly Gly Asn Ser Val Ser Ala Asn Val Thr Tyr His Asn 435 440 445 Leu Leu Asn Ile Lys Arg Leu Ala Asp Arg Arg Asn Asn Leu Gln Trp 450 455 460 Phe Arg Val Pro Pro Lys Ile Phe Phe Glu Pro His Ser Ile Arg Tyr 465 470 475 480 Leu Ala Glu Leu Lys Glu Leu Ser Lys Ile Phe Ile Val Ser Asp Arg 485 490 495 Met Met Tyr Lys Leu Gly Tyr Val Asp Arg Val Met Asp Val Leu Lys 500 505 510 Arg Arg Ser Asn Glu Val Glu Ile Glu Ile Phe Ile Asp Val Glu Pro 515 520 525 Asp Pro Ser Ile Gln Thr Val Gln Lys Gly Leu Ala Val Met Asn Thr 530 535 540 Phe Gly Pro Asp Asn Ile Ile Ala Ile Gly Gly Gly Ser Ala Met Asp 545 550 555 560 Ala Ala Lys Ile Met Trp Leu Leu Tyr Glu His Pro Glu Ala Asp Phe 565 570 575 Phe Ala Met Lys Gln Lys Phe Ile Asp Leu Arg Lys Arg Ala Phe Lys 580 585 590 Phe Pro Thr Met Gly Lys Lys Ala Arg Leu Ile Cys Ile Pro Thr Thr 595 600 605 Ser Gly Thr Gly Ser Glu Val Thr Pro Phe Ala Val Ile Ser Asp His 610 615 620 Glu Thr Gly Lys Lys Tyr Pro Leu Ala Asp Tyr Ser Leu Thr Pro Ser 625 630 635 640 Val Ala Ile Val Asp Pro Met Phe Thr Met Ser Leu Pro Lys Arg Ala 645 650 655 Ile Ala Asp Thr Gly Leu Asp Val Leu Val His Ala Thr Glu Ala Tyr 660 665 670 Val Ser Val Met Ala Asn Glu Tyr Thr Asp Gly Leu Ala Arg Glu Ala 675 680 685 Val Lys Leu Val Phe Glu Asn Leu Leu Lys Ser Tyr Asn Gly Asp Leu 690 695 700 Glu Ala Arg Glu Lys Met His Asn Ala Ala Thr Ile Ala Gly Met Ala 705 710 715 720 Phe Ala Ser Ala Phe Leu Gly Met Asp His Ser Met Ala His Lys Val 725 730 735 Gly Ala Ala Phe His Leu Pro His Gly Arg Cys Val Ala Val Leu Leu 740 745 750 Pro His Val Ile Arg Tyr Asn Gly Gln Lys Pro Arg Lys Leu Ala Met 755 760 765 Trp Pro Lys Tyr Asn Phe Tyr Lys Ala Asp Gln Arg Tyr Met Glu Leu 770 775 780 Ala Gln Met Val Gly Leu Lys Cys Asn Thr Pro Ala Glu Gly Val Glu 785 790 795 800 Ala Phe Ala Lys Ala Cys Glu Glu Leu Met Lys Ala Thr Glu Thr Ile 805 810 815 Thr Gly Phe Lys Lys Ala Asn Ile Asp Glu Ala Ala Trp Met Ser Lys 820 825 830 Val Pro Glu Met Ala Leu Leu Ala Phe Glu Asp Gln Cys Ser Pro Ala 835 840 845 Asn Pro Arg Val Pro Met Val Lys Asp Met Glu Lys Ile Leu Lys Ala 850 855 860 Ala Tyr Tyr Pro Ile Ala 865 870 <210> 6 <211> 2627 <212> DNA <213> Artificial <220> <223> synthetic codon optimised ADH2 <400> 6 tctagaaaat gtctacccaa caaaccatga ccgttgacga acacatcaac caattagtta 60 gaaaggctca agttgctttg aaggaatact tgaagccaga atacacccaa gaaaagatcg 120 actacatcgt taagaaggct tctgttgctg ctttggacca acactgtgct ttggctgctg 180 ctgctgttga agaaaccggt agaggtatct tcgaagacaa ggctaccaag aacatcttcg 240 cttgtgaaca cgttacccac gaaatgagac acgctaagac cgttggtatc atcaacgttg 300 acccattgta cggtatcacc gaaatcgctg aaccagttgg tgttgtttgt ggtgttaccc 360 cagttaccaa cccaacctct accgctatct tcaagtcttt gatctctatc aagaccagaa 420 acccaatcgt tttctctttc cacccatctg ctttgaagtg ttctattatg gctgctaaaa 480 tcgttagaga cgctgctatc gctgctggtg ctccagaaaa ctgtatccaa tggatcgaat 540 tcggtggtat cgaagcttct aacaagttga tgaaccaccc aggtgttgct actatcttgg 600 ctaccggtgg taacgctatg gttaaggctg catactcttc tggtaagcca gctttgggtg 660 ttggtgctgg taacgttcca acctacatcg aaaagacctg taacatcaag caagctgcta 720 acgacgttgt tatgtctaag tctttcgaca acggtatgat ctgtgcttct gaacaagctg 780 ctatcatcga caaggaaatc tacgaccaag ttgttgaaga aatgaagacc ttgggtgctt 840 acttcatcaa cgaagaagaa aaggctaagt tggaaaagtt catgttcggt gttaacgctt 900 actctgctga cgttaacaac gctagattga acccaaagtg tccaggtatg tctccacaat 960 ggttcgctga acaagttggt atcaaggtac cagaagactg taacatcatc tgtgctgttt 1020 gtaaggaagt tggtccaaac gaaccattga ccagagaaaa gttgtctcca gttttggcta 1080 tcttgaaagc tgaaaacacc caagacggta tcgacaaggc tgaagctatg gttgaattta 1140 acggtagagg tcactctgct gctatccact ctaacgacaa ggctgttgtt gaaaagtacg 1200 ctttgaccat gaaggcttgt agaatcttgc acaacacccc atcttctcaa ggtggtatcg 1260 gttctatcta caactacatc tggccatctt tcaccttggg ttgtggttct tacggtggta 1320 actctgtttc tgctaacgtt acctaccaca acttgttgaa catcaagaga ttggctgaca 1380 gaagaaacaa cttgcaatgg ttcagagttc caccaaagat cttcttcgaa ccacactcta 1440 tcagatactt ggctgaattg aaggaattgt ctaagatctt catcgtttct gacagaatga 1500 tgtacaagtt gggttacgtt gacagagtta tggacgtttt gaagagaaga tctaacgaag 1560 ttgaaatcga aatcttcatc gacgttgaac cagacccatc tatccaaacc gttcaaaagg 1620 gtttggctgt tatgaacacc ttcggtccag acaacatcat cgctatcggt ggtggttctg 1680 ctatggacgc tgctaagatc atgtggttgt tgtacgaaca cccagaagct gacttcttcg 1740 ctatgaagca aaagttcatc gacttgagaa agagagcttt caagttccca accatgggta 1800 agaaggctag attgatctgt atcccaacca cctctggtac cggttctgaa gttaccccat 1860 tcgctgttat ctctgaccac gaaaccggta agaagtaccc attggctgac tactctttga 1920 ccccatctgt tgctatcgtt gacccaatgt tcaccatgtc tttgccaaag agagctatcg 1980 ctgacaccgg tttggacgtt ttggttcacg ctaccgaagc ttacgtttct gttatggcta 2040 acgaatacac cgacggtttg gctagagaag ctgttaagtt ggtttttgaa aacttgttga 2100 agtcttacaa cggtgacttg gaagctagag aaaagatgca caacgctgct accatcgctg 2160 gtatggcttt cgcttctgct ttcttgggta tggaccactc tatggctcac aaggttggtg 2220 ctgctttcca cttgccacac ggtagatgtg ttgctgtttt gttgccacac gttatcagat 2280 acaacggtca aaagccaaga aagttggcta tgtggccaaa gtacaacttc tacaaggctg 2340 accaaagata catggaattg gctcaaatgg ttggtttgaa gtgtaacacc ccagctgaag 2400 gtgttgaagc tttcgctaag gcttgtgaag aattgatgaa ggctaccgaa accatcaccg 2460 gtttcaagaa ggctaacatc gacgaagctg cttggatgtc taaggttcca gaaatggctt 2520 tgttggcttt cgaagaccaa tgttctccag ctaacccaag agttccaatg gttaaggaca 2580 tggaaaagat cttgaaggct gcttactacc caatcgctta gcttaag 2627 <210> 7 <211> 367 <212> PRT <213> Escherichia coli <400> 7 Met Asp Arg Ile Ile Gln Ser Pro Gly Lys Tyr Ile Gln Gly Ala Asp 1 5 10 15 Val Ile Asn Arg Leu Gly Glu Tyr Leu Lys Pro Leu Ala Glu Arg Trp 20 25 30 Leu Val Val Gly Asp Lys Phe Val Leu Gly Phe Ala Gln Ser Thr Val 35 40 45 Glu Lys Ser Phe Lys Asp Ala Gly Leu Val Val Glu Ile Ala Pro Phe 50 55 60 Gly Gly Glu Cys Ser Gln Asn Glu Ile Asp Arg Leu Arg Gly Ile Ala 65 70 75 80 Glu Thr Ala Gln Cys Gly Ala Ile Leu Gly Ile Gly Gly Gly Lys Thr 85 90 95 Leu Asp Thr Ala Lys Ala Leu Ala His Phe Met Gly Val Pro Val Ala 100 105 110 Ile Ala Pro Thr Ile Ala Ser Thr Asp Ala Pro Cys Ser Ala Leu Ser 115 120 125 Val Ile Tyr Thr Asp Glu Gly Glu Phe Asp Arg Tyr Leu Leu Leu Pro 130 135 140 Asn Asn Pro Asn Met Val Ile Val Asp Thr Lys Ile Val Ala Gly Ala 145 150 155 160 Pro Ala Arg Leu Leu Ala Ala Gly Ile Gly Asp Ala Leu Ala Thr Trp 165 170 175 Phe Glu Ala Arg Ala Cys Ser Arg Ser Gly Ala Thr Thr Met Ala Gly 180 185 190 Gly Lys Cys Thr Gln Ala Ala Leu Ala Leu Ala Glu Leu Cys Tyr Asn 195 200 205 Thr Leu Leu Glu Glu Gly Glu Lys Ala Met Leu Ala Ala Glu Gln His 210 215 220 Val Val Thr Pro Ala Leu Glu Arg Val Ile Glu Ala Asn Thr Tyr Leu 225 230 235 240 Ser Gly Val Gly Phe Glu Ser Gly Gly Leu Ala Ala Ala His Ala Val 245 250 255 His Asn Gly Leu Thr Ala Ile Pro Asp Ala His His Tyr Tyr His Gly 260 265 270 Glu Lys Val Ala Phe Gly Thr Leu Thr Gln Leu Val Leu Glu Asn Ala 275 280 285 Pro Val Glu Glu Ile Glu Thr Val Ala Ala Leu Ser His Ala Val Gly 290 295 300 Leu Pro Ile Thr Leu Ala Gln Leu Asp Ile Lys Glu Asp Val Pro Ala 305 310 315 320 Lys Met Arg Ile Val Ala Glu Ala Ala Cys Ala Glu Gly Glu Thr Ile 325 330 335 His Asn Met Pro Gly Gly Ala Thr Pro Asp Gln Val Tyr Ala Ala Leu 340 345 350 Leu Val Ala Asp Gln Tyr Gly Gln Arg Phe Leu Gln Glu Trp Glu 355 360 365 <210> 8 <211> 584 <212> PRT <213> Saccharomyces cerevisiae <400> 8 Met Ser Ala Lys Ser Phe Glu Val Thr Asp Pro Val Asn Ser Ser Leu 1 5 10 15 Lys Gly Phe Ala Leu Ala Asn Pro Ser Ile Thr Leu Val Pro Glu Glu 20 25 30 Lys Ile Leu Phe Arg Lys Thr Asp Ser Asp Lys Ile Ala Leu Ile Ser 35 40 45 Gly Gly Gly Ser Gly His Glu Pro Thr His Ala Gly Phe Ile Gly Lys 50 55 60 Gly Met Leu Ser Gly Ala Val Val Gly Glu Ile Phe Ala Ser Pro Ser 65 70 75 80 Thr Lys Gln Ile Leu Asn Ala Ile Arg Leu Val Asn Glu Asn Ala Ser 85 90 95 Gly Val Leu Leu Ile Val Lys Asn Tyr Thr Gly Asp Val Leu His Phe 100 105 110 Gly Leu Ser Ala Glu Arg Ala Arg Ala Leu Gly Ile Asn Cys Arg Val 115 120 125 Ala Val Ile Gly Asp Asp Val Ala Val Gly Arg Glu Lys Gly Gly Met 130 135 140 Val Gly Arg Arg Ala Leu Ala Gly Thr Val Leu Val His Lys Ile Val 145 150 155 160 Gly Ala Phe Ala Glu Glu Tyr Ser Ser Lys Tyr Gly Leu Asp Gly Thr 165 170 175 Ala Lys Val Ala Lys Ile Ile Asn Asp Asn Leu Val Thr Ile Gly Ser 180 185 190 Ser Leu Asp His Cys Lys Val Pro Gly Arg Lys Phe Glu Ser Glu Leu 195 200 205 Asn Glu Lys Gln Met Glu Leu Gly Met Gly Ile His Asn Glu Pro Gly 210 215 220 Val Lys Val Leu Asp Pro Ile Pro Ser Thr Glu Asp Leu Ile Ser Lys 225 230 235 240 Tyr Met Leu Pro Lys Leu Leu Asp Pro Asn Asp Lys Asp Arg Ala Phe 245 250 255 Val Lys Phe Asp Glu Asp Asp Glu Val Val Leu Leu Val Asn Asn Leu 260 265 270 Gly Gly Val Ser Asn Phe Val Ile Ser Ser Ile Thr Ser Lys Thr Thr 275 280 285 Asp Phe Leu Lys Glu Asn Tyr Asn Ile Thr Pro Val Gln Thr Ile Ala 290 295 300 Gly Thr Leu Met Thr Ser Phe Asn Gly Asn Gly Phe Ser Ile Thr Leu 305 310 315 320 Leu Asn Ala Thr Lys Ala Thr Lys Ala Leu Gln Ser Asp Phe Glu Glu 325 330 335 Ile Lys Ser Val Leu Asp Leu Leu Asn Ala Phe Thr Asn Ala Pro Gly 340 345 350 Trp Pro Ile Ala Asp Phe Glu Lys Thr Ser Ala Pro Ser Val Asn Asp 355 360 365 Asp Leu Leu His Asn Glu Val Thr Ala Lys Ala Val Gly Thr Tyr Asp 370 375 380 Phe Asp Lys Phe Ala Glu Trp Met Lys Ser Gly Ala Glu Gln Val Ile 385 390 395 400 Lys Ser Glu Pro His Ile Thr Glu Leu Asp Asn Gln Val Gly Asp Gly 405 410 415 Asp Cys Gly Tyr Thr Leu Val Ala Gly Val Lys Gly Ile Thr Glu Asn 420 425 430 Leu Asp Lys Leu Ser Lys Asp Ser Leu Ser Gln Ala Val Ala Gln Ile 435 440 445 Ser Asp Phe Ile Glu Gly Ser Met Gly Gly Thr Ser Gly Gly Leu Tyr 450 455 460 Ser Ile Leu Leu Ser Gly Phe Ser His Gly Leu Ile Gln Val Cys Lys 465 470 475 480 Ser Lys Asp Glu Pro Val Thr Lys Glu Ile Val Ala Lys Ser Leu Gly 485 490 495 Ile Ala Leu Asp Thr Leu Tyr Lys Tyr Thr Lys Ala Arg Lys Gly Ser 500 505 510 Ser Thr Met Ile Asp Ala Leu Glu Pro Phe Val Lys Glu Phe Thr Ala 515 520 525 Ser Lys Asp Phe Asn Lys Ala Val Lys Ala Ala Glu Glu Gly Ala Lys 530 535 540 Ser Thr Ala Thr Phe Glu Ala Lys Phe Gly Arg Ala Ser Tyr Val Gly 545 550 555 560 Asp Ser Ser Gln Val Glu Asp Pro Gly Ala Val Gly Leu Cys Glu Phe 565 570 575 Leu Lys Gly Val Gln Ser Ala Leu 580 <210> 9 <211> 591 <212> PRT <213> Saccharomyces cerevisiae <400> 9 Met Ser His Lys Gln Phe Lys Ser Asp Gly Asn Ile Val Thr Pro Tyr 1 5 10 15 Leu Leu Gly Leu Ala Arg Ser Asn Pro Gly Leu Thr Val Ile Lys His 20 25 30 Asp Arg Val Val Phe Arg Thr Ala Ser Ala Pro Asn Ser Gly Asn Pro 35 40 45 Pro Lys Val Ser Leu Val Ser Gly Gly Gly Ser Gly His Glu Pro Thr 50 55 60 His Ala Gly Phe Val Gly Glu Gly Ala Leu Asp Ala Ile Ala Ala Gly 65 70 75 80 Ala Ile Phe Ala Ser Pro Ser Thr Lys Gln Ile Tyr Ser Ala Ile Lys 85 90 95 Ala Val Glu Ser Pro Lys Gly Thr Leu Ile Ile Val Lys Asn Tyr Thr 100 105 110 Gly Asp Ile Ile His Phe Gly Leu Ala Ala Glu Arg Ala Lys Ala Ala 115 120 125 Gly Met Lys Val Glu Leu Val Ala Val Gly Asp Asp Val Ser Val Gly 130 135 140 Lys Lys Lys Gly Ser Leu Val Gly Arg Arg Gly Leu Gly Ala Thr Val 145 150 155 160 Leu Val His Lys Ile Ala Gly Ala Ala Ala Ser His Gly Leu Glu Leu 165 170 175 Ala Glu Val Ala Glu Val Ala Gln Ser Val Val Asp Asn Ser Val Thr 180 185 190 Ile Ala Ala Ser Leu Asp His Cys Thr Val Pro Gly His Lys Pro Glu 195 200 205 Ala Ile Leu Gly Glu Asn Glu Tyr Glu Ile Gly Met Gly Ile His Asn 210 215 220 Glu Ser Gly Thr Tyr Lys Ser Ser Pro Leu Pro Ser Ile Ser Glu Leu 225 230 235 240 Val Ser Gln Met Leu Pro Leu Leu Leu Asp Glu Asp Glu Asp Arg Ser 245 250 255 Tyr Val Lys Phe Glu Pro Lys Glu Asp Val Val Leu Met Val Asn Asn 260 265 270 Met Gly Gly Met Ser Asn Leu Glu Leu Gly Tyr Ala Ala Glu Val Ile 275 280 285 Ser Glu Gln Leu Ile Asp Lys Tyr Gln Ile Val Pro Lys Arg Thr Ile 290 295 300 Thr Gly Ala Phe Ile Thr Ala Leu Asn Gly Pro Gly Phe Gly Ile Thr 305 310 315 320 Leu Met Asn Ala Ser Lys Ala Gly Gly Asp Ile Leu Lys Tyr Phe Asp 325 330 335 Tyr Pro Thr Thr Ala Ser Gly Trp Asn Gln Met Tyr His Ser Ala Lys 340 345 350 Asp Trp Glu Val Leu Ala Lys Gly Gln Val Pro Thr Ala Pro Ser Leu 355 360 365 Lys Thr Leu Arg Asn Glu Lys Gly Ser Gly Val Lys Ala Asp Tyr Asp 370 375 380 Thr Phe Ala Lys Ile Leu Leu Ala Gly Ile Ala Lys Ile Asn Glu Val 385 390 395 400 Glu Pro Lys Val Thr Trp Tyr Asp Thr Ile Ala Gly Asp Gly Asp Cys 405 410 415 Gly Thr Thr Leu Val Ser Gly Gly Glu Ala Leu Glu Glu Ala Ile Lys 420 425 430 Asn His Thr Leu Arg Leu Glu Asp Ala Ala Leu Gly Ile Glu Asp Ile 435 440 445 Ala Tyr Met Val Glu Asp Ser Met Gly Gly Thr Ser Gly Gly Leu Tyr 450 455 460 Ser Ile Tyr Leu Ser Ala Leu Ala Gln Gly Val Arg Asp Ser Gly Asp 465 470 475 480 Lys Glu Leu Thr Ala Glu Thr Phe Lys Lys Ala Ser Asn Val Ala Leu 485 490 495 Asp Ala Leu Tyr Lys Tyr Thr Arg Ala Arg Pro Gly Tyr Arg Thr Leu 500 505 510 Ile Asp Ala Leu Gln Pro Phe Val Glu Ala Leu Lys Ala Gly Lys Gly 515 520 525 Pro Arg Ala Ala Ala Gln Ala Ala Tyr Asp Gly Ala Glu Lys Thr Arg 530 535 540 Lys Met Asp Ala Leu Val Gly Arg Ala Ser Tyr Val Ala Lys Glu Glu 545 550 555 560 Leu Arg Lys Leu Asp Ser Glu Gly Gly Leu Pro Asp Pro Gly Ala Val 565 570 575 Gly Leu Ala Ala Leu Leu Asp Gly Phe Val Thr Ala Ala Gly Tyr 580 585 590 <210> 10 <211> 560 <212> PRT <213> Saccharomyces cerevisiae <400> 10 Met Ser Leu Ile Ser Ile Leu Ser Pro Leu Ile Thr Ser Glu Gly Leu 1 5 10 15 Asp Ser Arg Ile Lys Pro Ser Pro Lys Lys Asp Ala Ser Thr Thr Thr 20 25 30 Lys Pro Ser Leu Trp Lys Thr Thr Glu Phe Lys Phe Tyr Tyr Ile Ala 35 40 45 Phe Leu Val Val Val Pro Leu Met Phe Tyr Ala Gly Leu Gln Ala Ser 50 55 60 Ser Pro Glu Asn Pro Asn Tyr Ala Arg Tyr Glu Arg Leu Leu Ser Gln 65 70 75 80 Gly Trp Leu Phe Gly Arg Lys Val Asp Asn Ser Asp Ser Gln Tyr Arg 85 90 95 Phe Phe Arg Asp Asn Phe Ala Leu Leu Ser Val Leu Met Leu Val His 100 105 110 Thr Ser Ile Lys Arg Ile Val Leu Tyr Ser Thr Asn Ile Thr Lys Leu 115 120 125 Arg Phe Asp Leu Ile Phe Gly Leu Ile Phe Leu Val Ala Ala His Gly 130 135 140 Val Asn Ser Ile Arg Ile Leu Ala His Met Leu Ile Leu Tyr Ala Ile 145 150 155 160 Ala His Val Leu Lys Asn Phe Arg Arg Ile Ala Thr Ile Ser Ile Trp 165 170 175 Ile Tyr Gly Ile Ser Thr Leu Phe Ile Asn Asp Asn Phe Arg Ala Tyr 180 185 190 Pro Phe Gly Asn Ile Cys Ser Phe Leu Ser Pro Leu Asp His Trp Tyr 195 200 205 Arg Gly Ile Ile Pro Arg Trp Asp Val Phe Phe Asn Phe Thr Leu Leu 210 215 220 Arg Val Leu Ser Tyr Asn Leu Asp Phe Leu Glu Arg Trp Glu Asn Leu 225 230 235 240 Gln Lys Lys Lys Ser Pro Ser Tyr Glu Ser Lys Glu Ala Lys Ser Ala 245 250 255 Ile Leu Leu Asn Glu Arg Ala Arg Leu Thr Ala Ala His Pro Ile Gln 260 265 270 Asp Tyr Ser Leu Met Asn Tyr Ile Ala Tyr Val Thr Tyr Thr Pro Leu 275 280 285 Phe Ile Ala Gly Pro Ile Ile Thr Phe Asn Asp Tyr Val Tyr Gln Ser 290 295 300 Lys His Thr Leu Pro Ser Ile Asn Phe Lys Phe Ile Phe Tyr Tyr Ala 305 310 315 320 Val Arg Phe Val Ile Ala Leu Leu Ser Met Glu Phe Ile Leu His Phe 325 330 335 Leu His Val Val Ala Ile Ser Lys Thr Lys Ala Trp Glu Asn Asp Thr 340 345 350 Pro Phe Gln Ile Ser Met Ile Gly Leu Phe Asn Leu Asn Ile Ile Trp 355 360 365 Leu Lys Leu Leu Ile Pro Trp Arg Leu Phe Arg Leu Trp Ala Leu Leu 370 375 380 Asp Gly Ile Asp Thr Pro Glu Asn Met Ile Arg Cys Val Asp Asn Asn 385 390 395 400 Tyr Ser Ser Leu Ala Phe Trp Arg Ala Trp His Arg Ser Tyr Asn Lys 405 410 415 Trp Val Val Arg Tyr Ile Tyr Ile Pro Leu Gly Gly Ser Lys Asn Arg 420 425 430 Val Leu Thr Ser Leu Ala Val Phe Ser Phe Val Ala Ile Trp His Asp 435 440 445 Ile Glu Leu Lys Leu Leu Leu Trp Gly Trp Leu Ile Val Leu Phe Leu 450 455 460 Leu Pro Glu Ile Phe Ala Thr Gln Ile Phe Ser His Tyr Thr Asp Ala 465 470 475 480 Val Trp Tyr Arg His Val Cys Ala Val Gly Ala Val Phe Asn Ile Trp 485 490 495 Val Met Met Ile Ala Asn Leu Phe Gly Phe Cys Leu Gly Ser Asp Gly 500 505 510 Thr Lys Lys Leu Leu Ser Asp Met Phe Cys Thr Val Ser Gly Phe Lys 515 520 525 Phe Val Ile Leu Ala Ser Val Ser Leu Phe Ile Ala Val Gln Ile Met 530 535 540 Phe Glu Ile Arg Glu Glu Glu Lys Arg His Gly Ile Tyr Leu Lys Cys 545 550 555 560 <210> 11 <211> 609 <212> PRT <213> Saccharomyces cerevisiae <400> 11 Met Ser Met Leu Arg Ile Trp Ser Cys Ile Val His Phe Phe Ser Val 1 5 10 15 Gln Ala Leu Asp Ser Arg Ile Lys Pro Asp Ile Glu Phe Lys Arg Arg 20 25 30 Gln Arg Ile Phe Ile Asn Ser Ser Lys Glu Glu Asn Gly Ser Ser Ser 35 40 45 Ser Ala Val Thr Val Thr Arg Asn Pro Val Leu Ser Ser Asn Ser Pro 50 55 60 Ser Pro Pro Leu Trp Asn Thr Trp Glu Phe Arg Leu Tyr Tyr Leu Ala 65 70 75 80 Phe Thr Val Val Val Pro Phe Met Ile Lys Ala Ala Leu Ala Thr Ser 85 90 95 Ser Glu Ser Asn Pro Asn Tyr Tyr Lys Phe Ser Gly Leu Leu Ala His 100 105 110 Gly Trp Ile Leu Gly Arg Lys Val Asp Asn Ser Asp Pro Gln Tyr Arg 115 120 125 Phe Phe Arg Ser Asn Phe Phe Leu Leu Ala Ile Leu Ile Leu Leu Gln 130 135 140 Ile Ile Leu Lys Lys Val Phe Val Lys Phe Ser Lys Ile Pro Lys Thr 145 150 155 160 Lys Phe Asp Phe Ala Cys Gly Leu Val Phe Val Cys Phe Met Tyr Gly 165 170 175 Ile Asn Ser Val Lys Leu Phe Thr His Ala Phe Ile Phe Phe Thr Leu 180 185 190 Ala His Ser Leu Lys Arg Lys Arg Leu Ile Ala Ala Phe Ala Ile Trp 195 200 205 Ser Tyr Gly Ile Phe Thr Leu Phe Ile Asn Gln Lys Met Lys Asn Leu 210 215 220 Pro Phe Asn Asn Ile Ala Ile Ile Leu Ser Pro Met Asp Gln Trp Tyr 225 230 235 240 Lys Gly Ile Val Pro Arg Trp Asp Phe Phe Phe Asn Phe Thr Leu Leu 245 250 255 Arg Leu Leu Ser Tyr Ser Met Asp Phe Leu Glu Arg Trp His Glu Gln 260 265 270 Leu Ser Arg Gln Pro Ser Ile Asp Tyr Asp Asp Arg Arg Pro Glu Phe 275 280 285 Arg Lys Ser Leu Ser Gly Ser Thr Leu Gln Thr Ile Tyr Glu Ser Gly 290 295 300 Lys Asn Val Leu Glu Glu Lys Glu Arg Leu Val Ala Glu His His Ile 305 310 315 320 Gln Asp Tyr Asn Phe Ile Asn Phe Ile Ala Tyr Ile Thr Tyr Ala Pro 325 330 335 Leu Phe Leu Val Gly Pro Ile Ile Thr Phe Asn Asp Tyr Leu Tyr Gln 340 345 350 Ser Glu Asn Lys Leu Pro Ser Leu Thr Lys Lys Asn Ile Gly Phe Tyr 355 360 365 Ala Leu Lys Val Phe Ser Ser Leu Leu Leu Met Glu Ile Ile Leu His 370 375 380 Tyr Ile Tyr Val Gly Ala Ile Ala Arg Thr Lys Ala Trp Asn Asn Asp 385 390 395 400 Thr Pro Leu Gln Gln Ala Met Ile Ala Leu Phe Asn Leu Asn Ile Met 405 410 415 Tyr Leu Lys Leu Leu Ile Pro Trp Arg Leu Phe Arg Leu Trp Ala Met 420 425 430 Val Asp Gly Ile Asp Ala Pro Glu Asn Met Leu Arg Cys Val Asp Asn 435 440 445 Asn Tyr Ser Thr Val Gly Phe Trp Arg Ala Trp His Thr Ser Phe Asn 450 455 460 Lys Trp Val Ile Arg Tyr Ile Tyr Val Pro Phe Gly Gly Ser Asn Asn 465 470 475 480 Lys Ile Leu Thr Ser Phe Ala Val Phe Ser Phe Val Ala Ile Trp His 485 490 495 Asp Ile Gln Leu Arg Val Leu Phe Trp Gly Trp Leu Thr Val Leu Leu 500 505 510 Leu Leu Gly Glu Thr Tyr Ile Thr Asn Cys Phe Ser Arg Tyr Arg Phe 515 520 525 Arg Ser Trp Tyr Arg Phe Val Cys Gly Ile Gly Ala Ala Ile Asn Ile 530 535 540 Cys Met Met Met Ile Ile Asn Val Tyr Gly Phe Cys Leu Gly Ala Glu 545 550 555 560 Gly Thr Lys Leu Leu Leu Lys Gly Ile Phe Asn Asn Ser His Ser Pro 565 570 575 Glu Phe Leu Thr Ala Val Met Val Ser Leu Phe Ile Ala Val Gln Val 580 585 590 Met Phe Glu Ile Arg Glu Glu Glu Lys Arg His Gly Ile Asn Leu Lys 595 600 605 Cys <210> 12 <211> 669 <212> PRT <213> Saccharomyces cerevisiae <400> 12 Met Ser Asn Pro Gln Lys Ala Leu Asn Asp Phe Leu Ser Ser Glu Ser 1 5 10 15 Val His Thr His Asp Ser Ser Arg Lys Gln Ser Asn Lys Gln Ser Ser 20 25 30 Asp Glu Gly Arg Ser Ser Ser Gln Pro Ser His His His Ser Gly Gly 35 40 45 Thr Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Ser Asn Asn 50 55 60 Asn Asn Asn Gly Asn Asp Gly Gly Asn Asp Asp Asp Tyr Asp Tyr Glu 65 70 75 80 Met Gln Asp Tyr Arg Pro Ser Pro Gln Ser Ala Arg Pro Thr Pro Thr 85 90 95 Tyr Val Pro Gln Tyr Ser Val Glu Ser Gly Thr Ala Phe Pro Ile Gln 100 105 110 Glu Val Ile Pro Ser Ala Tyr Ile Asn Thr Gln Asp Ile Asn His Lys 115 120 125 Asp Asn Gly Pro Pro Ser Ala Ser Ser Asn Arg Ala Phe Arg Pro Arg 130 135 140 Gly Gln Thr Thr Val Ser Ala Asn Val Leu Asn Ile Glu Asp Phe Tyr 145 150 155 160 Lys Asn Ala Asp Asp Ala His Thr Ile Pro Glu Ser His Leu Ser Arg 165 170 175 Arg Arg Ser Arg Ser Arg Ala Thr Ser Asn Ala Gly His Ser Ala Asn 180 185 190 Thr Gly Ala Thr Asn Gly Arg Thr Thr Gly Ala Gln Thr Asn Met Glu 195 200 205 Ser Asn Glu Ser Pro Arg Asn Val Pro Ile Met Val Lys Pro Lys Thr 210 215 220 Leu Tyr Gln Asn Pro Gln Thr Pro Thr Val Leu Pro Ser Thr Tyr His 225 230 235 240 Pro Ile Asn Lys Trp Ser Ser Val Lys Asn Thr Tyr Leu Lys Glu Phe 245 250 255 Leu Ala Glu Phe Met Gly Thr Met Val Met Ile Ile Phe Gly Ser Ala 260 265 270 Val Val Cys Gln Val Asn Val Ala Gly Lys Ile Gln Gln Asp Asn Phe 275 280 285 Asn Val Ala Leu Asp Asn Leu Asn Val Thr Gly Ser Ser Ala Glu Thr 290 295 300 Ile Asp Ala Met Lys Ser Leu Thr Ser Leu Val Ser Ser Val Ala Gly 305 310 315 320 Gly Thr Phe Asp Asp Val Ala Leu Gly Trp Ala Ala Ala Val Val Met 325 330 335 Gly Tyr Phe Cys Ala Gly Gly Ser Ala Ile Ser Gly Ala His Leu Asn 340 345 350 Pro Ser Ile Thr Leu Ala Asn Leu Val Tyr Arg Gly Phe Pro Leu Lys 355 360 365 Lys Val Pro Tyr Tyr Phe Ala Gly Gln Leu Ile Gly Ala Phe Thr Gly 370 375 380 Ala Leu Ile Leu Phe Ile Trp Tyr Lys Arg Val Leu Gln Glu Ala Tyr 385 390 395 400 Ser Asp Trp Trp Met Asn Glu Ser Val Ala Gly Met Phe Cys Val Phe 405 410 415 Pro Lys Pro Tyr Leu Ser Ser Gly Arg Gln Phe Phe Ser Glu Phe Leu 420 425 430 Cys Gly Ala Met Leu Gln Ala Gly Thr Phe Ala Leu Thr Asp Pro Tyr 435 440 445 Thr Cys Leu Ser Ser Asp Val Phe Pro Leu Met Met Phe Ile Leu Ile 450 455 460 Phe Ile Ile Asn Ala Ser Met Ala Tyr Gln Thr Gly Thr Ala Met Asn 465 470 475 480 Leu Ala Arg Asp Leu Gly Pro Arg Leu Ala Leu Tyr Ala Val Gly Phe 485 490 495 Asp His Lys Met Leu Trp Val His His His His Phe Phe Trp Val Pro 500 505 510 Met Val Gly Pro Phe Ile Gly Ala Leu Met Gly Gly Leu Val Tyr Asp 515 520 525 Val Cys Ile Tyr Gln Gly His Glu Ser Pro Val Asn Trp Ser Leu Pro 530 535 540 Val Tyr Lys Glu Met Ile Met Arg Ala Trp Phe Arg Arg Pro Gly Trp 545 550 555 560 Lys Lys Arg Asn Arg Ala Arg Arg Thr Ser Asp Leu Ser Asp Phe Ser 565 570 575 Tyr Asn Asn Asp Asp Asp Glu Glu Phe Gly Glu Arg Met Ala Leu Gln 580 585 590 Lys Thr Lys Thr Lys Ser Ser Ile Ser Asp Asn Glu Asn Glu Ala Gly 595 600 605 Glu Lys Lys Val Gln Phe Lys Ser Val Gln Arg Gly Lys Arg Thr Phe 610 615 620 Gly Gly Ile Pro Thr Ile Leu Glu Glu Glu Asp Ser Ile Glu Thr Ala 625 630 635 640 Ser Leu Gly Ala Thr Thr Thr Asp Ser Ile Gly Leu Ser Asp Thr Ser 645 650 655 Ser Glu Asp Ser His Tyr Gly Asn Ala Lys Lys Val Thr 660 665 <210> 13 <211> 713 <212> PRT <213> Saccharomyces cerevisiae <400> 13 Met Ser Pro Ser Ala Val Gln Ser Ser Lys Leu Glu Glu Gln Ser Ser 1 5 10 15 Glu Ile Asp Lys Leu Lys Ala Lys Met Ser Gln Ser Ala Ala Thr Ala 20 25 30 Gln Gln Lys Lys Glu His Glu Tyr Glu His Leu Thr Ser Val Lys Ile 35 40 45 Val Pro Gln Arg Pro Ile Ser Asp Arg Leu Gln Pro Ala Ile Ala Thr 50 55 60 His Tyr Ser Pro His Leu Asp Gly Leu Gln Asp Tyr Gln Arg Leu His 65 70 75 80 Lys Glu Ser Ile Glu Asp Pro Ala Lys Phe Phe Gly Ser Lys Ala Thr 85 90 95 Gln Phe Leu Asn Trp Ser Lys Pro Phe Asp Lys Val Phe Ile Pro Asp 100 105 110 Pro Lys Thr Gly Arg Pro Ser Phe Gln Asn Asn Ala Trp Phe Leu Asn 115 120 125 Gly Gln Leu Asn Ala Cys Tyr Asn Cys Val Asp Arg His Ala Leu Lys 130 135 140 Thr Pro Asn Lys Lys Ala Ile Ile Phe Glu Gly Asp Glu Pro Gly Gln 145 150 155 160 Gly Tyr Ser Ile Thr Tyr Lys Glu Leu Leu Glu Glu Val Cys Gln Val 165 170 175 Ala Gln Val Leu Thr Tyr Ser Met Gly Val Arg Lys Gly Asp Thr Val 180 185 190 Ala Val Tyr Met Pro Met Val Pro Glu Ala Ile Ile Thr Leu Leu Ala 195 200 205 Ile Ser Arg Ile Gly Ala Ile His Ser Val Val Phe Ala Gly Phe Ser 210 215 220 Ser Asn Ser Leu Arg Asp Arg Ile Asn Asp Gly Asp Ser Lys Val Val 225 230 235 240 Ile Thr Thr Asp Glu Ser Asn Arg Gly Gly Lys Val Ile Glu Thr Lys 245 250 255 Arg Ile Val Asp Asp Ala Leu Arg Glu Thr Pro Gly Val Arg His Val 260 265 270 Leu Val Tyr Arg Lys Thr Asn Asn Pro Ser Val Ala Phe His Ala Pro 275 280 285 Arg Asp Leu Asp Trp Ala Thr Glu Lys Lys Lys Tyr Lys Thr Tyr Tyr 290 295 300 Pro Cys Thr Pro Val Asp Ser Glu Asp Pro Leu Phe Leu Leu Tyr Thr 305 310 315 320 Ser Gly Ser Thr Gly Ala Pro Lys Gly Val Gln His Ser Thr Ala Gly 325 330 335 Tyr Leu Leu Gly Ala Leu Leu Thr Met Arg Tyr Thr Phe Asp Thr His 340 345 350 Gln Glu Asp Val Phe Phe Thr Ala Gly Asp Ile Gly Trp Ile Thr Gly 355 360 365 His Thr Tyr Val Val Tyr Gly Pro Leu Leu Tyr Gly Cys Ala Thr Leu 370 375 380 Val Phe Glu Gly Thr Pro Ala Tyr Pro Asn Tyr Ser Arg Tyr Trp Asp 385 390 395 400 Ile Ile Asp Glu His Lys Val Thr Gln Phe Tyr Val Ala Pro Thr Ala 405 410 415 Leu Arg Leu Leu Lys Arg Ala Gly Asp Ser Tyr Ile Glu Asn His Ser 420 425 430 Leu Lys Ser Leu Arg Cys Leu Gly Ser Val Gly Glu Pro Ile Ala Ala 435 440 445 Glu Val Trp Glu Trp Tyr Ser Glu Lys Ile Gly Lys Asn Glu Ile Pro 450 455 460 Ile Val Asp Thr Tyr Trp Gln Thr Glu Ser Gly Ser His Leu Val Thr 465 470 475 480 Pro Leu Ala Gly Gly Val Thr Pro Met Lys Pro Gly Ser Ala Ser Phe 485 490 495 Pro Phe Phe Gly Ile Asp Ala Val Val Leu Asp Pro Asn Thr Gly Glu 500 505 510 Glu Leu Asn Thr Ser His Ala Glu Gly Val Leu Ala Val Lys Ala Ala 515 520 525 Trp Pro Ser Phe Ala Arg Thr Ile Trp Lys Asn His Asp Arg Tyr Leu 530 535 540 Asp Thr Tyr Leu Asn Pro Tyr Pro Gly Tyr Tyr Phe Thr Gly Asp Gly 545 550 555 560 Ala Ala Lys Asp Lys Asp Gly Tyr Ile Trp Ile Leu Gly Arg Val Asp 565 570 575 Asp Val Val Asn Val Ser Gly His Arg Leu Ser Thr Ala Glu Ile Glu 580 585 590 Ala Ala Ile Ile Glu Asp Pro Ile Val Ala Glu Cys Ala Val Val Gly 595 600 605 Phe Asn Asp Asp Leu Thr Gly Gln Ala Val Ala Ala Phe Val Val Leu 610 615 620 Lys Asn Lys Ser Ser Trp Ser Thr Ala Thr Asp Asp Glu Leu Gln Asp 625 630 635 640 Ile Lys Lys His Leu Val Phe Thr Val Arg Lys Asp Ile Gly Pro Phe 645 650 655 Ala Ala Pro Lys Leu Ile Ile Leu Val Asp Asp Leu Pro Lys Thr Arg 660 665 670 Ser Gly Lys Ile Met Arg Arg Ile Leu Arg Lys Ile Leu Ala Gly Glu 675 680 685 Ser Asp Gln Leu Gly Asp Val Ser Thr Leu Ser Asn Pro Gly Ile Val 690 695 700 Arg His Leu Ile Asp Ser Val Lys Leu 705 710 <210> 14 <211> 683 <212> PRT <213> Saccharomyces cerevisiae <400> 14 Met Thr Ile Lys Glu His Lys Val Val Tyr Glu Ala His Asn Val Lys 1 5 10 15 Ala Leu Lys Ala Pro Gln His Phe Tyr Asn Ser Gln Pro Gly Lys Gly 20 25 30 Tyr Val Thr Asp Met Gln His Tyr Gln Glu Met Tyr Gln Gln Ser Ile 35 40 45 Asn Glu Pro Glu Lys Phe Phe Asp Lys Met Ala Lys Glu Tyr Leu His 50 55 60 Trp Asp Ala Pro Tyr Thr Lys Val Gln Ser Gly Ser Leu Asn Asn Gly 65 70 75 80 Asp Val Ala Trp Phe Leu Asn Gly Lys Leu Asn Ala Ser Tyr Asn Cys 85 90 95 Val Asp Arg His Ala Phe Ala Asn Pro Asp Lys Pro Ala Leu Ile Tyr 100 105 110 Glu Ala Asp Asp Glu Ser Asp Asn Lys Ile Ile Thr Phe Gly Glu Leu 115 120 125 Leu Arg Lys Val Ser Gln Ile Ala Gly Val Leu Lys Ser Trp Gly Val 130 135 140 Lys Lys Gly Asp Thr Val Ala Ile Tyr Leu Pro Met Ile Pro Glu Ala 145 150 155 160 Val Ile Ala Met Leu Ala Val Ala Arg Ile Gly Ala Ile His Ser Val 165 170 175 Val Phe Ala Gly Phe Ser Ala Gly Ser Leu Lys Asp Arg Val Val Asp 180 185 190 Ala Asn Ser Lys Val Val Ile Thr Cys Asp Glu Gly Lys Arg Gly Gly 195 200 205 Lys Thr Ile Asn Thr Lys Lys Ile Val Asp Glu Gly Leu Asn Gly Val 210 215 220 Asp Leu Val Ser Arg Ile Leu Val Phe Gln Arg Thr Gly Thr Glu Gly 225 230 235 240 Ile Pro Met Lys Ala Gly Arg Asp Tyr Trp Trp His Glu Glu Ala Ala 245 250 255 Lys Gln Arg Thr Tyr Leu Pro Pro Val Ser Cys Asp Ala Glu Asp Pro 260 265 270 Leu Phe Leu Leu Tyr Thr Ser Gly Ser Thr Gly Ser Pro Lys Gly Val 275 280 285 Val His Thr Thr Gly Gly Tyr Leu Leu Gly Ala Ala Leu Thr Thr Arg 290 295 300 Tyr Val Phe Asp Ile His Pro Glu Asp Val Leu Phe Thr Ala Gly Asp 305 310 315 320 Val Gly Trp Ile Thr Gly His Thr Tyr Ala Leu Tyr Gly Pro Leu Thr 325 330 335 Leu Gly Thr Ala Ser Ile Ile Phe Glu Ser Thr Pro Ala Tyr Pro Asp 340 345 350 Tyr Gly Arg Tyr Trp Arg Ile Ile Gln Arg His Lys Ala Thr His Phe 355 360 365 Tyr Val Ala Pro Thr Ala Leu Arg Leu Ile Lys Arg Val Gly Glu Ala 370 375 380 Glu Ile Ala Lys Tyr Asp Thr Ser Ser Leu Arg Val Leu Gly Ser Val 385 390 395 400 Gly Glu Pro Ile Ser Pro Asp Leu Trp Glu Trp Tyr His Glu Lys Val 405 410 415 Gly Asn Lys Asn Cys Val Ile Cys Asp Thr Met Trp Gln Thr Glu Ser 420 425 430 Gly Ser His Leu Ile Ala Pro Leu Ala Gly Ala Val Pro Thr Lys Pro 435 440 445 Gly Ser Ala Thr Val Pro Phe Phe Gly Ile Asn Ala Cys Ile Ile Asp 450 455 460 Pro Val Thr Gly Val Glu Leu Glu Gly Asn Asp Val Glu Gly Val Leu 465 470 475 480 Ala Val Lys Ser Pro Trp Pro Ser Met Ala Arg Ser Val Trp Asn His 485 490 495 His Asp Arg Tyr Met Asp Thr Tyr Leu Lys Pro Tyr Pro Gly His Tyr 500 505 510 Phe Thr Gly Asp Gly Ala Gly Arg Asp His Asp Gly Tyr Tyr Trp Ile 515 520 525 Arg Gly Arg Val Asp Asp Val Val Asn Val Ser Gly His Arg Leu Ser 530 535 540 Thr Ser Glu Ile Glu Ala Ser Ile Ser Asn His Glu Asn Val Ser Glu 545 550 555 560 Ala Ala Val Val Gly Ile Pro Asp Glu Leu Thr Gly Gln Thr Val Val 565 570 575 Ala Tyr Val Ser Leu Lys Asp Gly Tyr Leu Gln Asn Asn Ala Thr Glu 580 585 590 Gly Asp Ala Glu His Ile Thr Pro Asp Asn Leu Arg Arg Glu Leu Ile 595 600 605 Leu Gln Val Arg Gly Glu Ile Gly Pro Phe Ala Ser Pro Lys Thr Ile 610 615 620 Ile Leu Val Arg Asp Leu Pro Arg Thr Arg Ser Gly Lys Ile Met Arg 625 630 635 640 Arg Val Leu Arg Lys Val Ala Ser Asn Glu Ala Glu Gln Leu Gly Asp 645 650 655 Leu Thr Thr Leu Ala Asn Pro Glu Val Val Pro Ala Ile Ile Ser Ala 660 665 670 Val Glu Asn Gln Phe Phe Ser Gln Lys Lys Lys 675 680 <210> 15 <211> 384 <212> PRT <213> Saccharomyces cerevisiae <400> 15 Met Thr Ala His Thr Asn Ile Lys Gln His Lys His Cys His Glu Asp 1 5 10 15 His Pro Ile Arg Arg Ser Asp Ser Ala Val Ser Ile Val His Leu Lys 20 25 30 Arg Ala Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr 35 40 45 Thr Ile Ala Lys Val Ile Ala Glu Asn Thr Glu Leu His Ser His Ile 50 55 60 Phe Glu Pro Glu Val Arg Met Trp Val Phe Asp Glu Lys Ile Gly Asp 65 70 75 80 Glu Asn Leu Thr Asp Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr 85 90 95 Leu Pro Asn Ile Asp Leu Pro His Asn Leu Val Ala Asp Pro Asp Leu 100 105 110 Leu His Ser Ile Lys Gly Ala Asp Ile Leu Val Phe Asn Ile Pro His 115 120 125 Gln Phe Leu Pro Asn Ile Val Lys Gln Leu Gln Gly His Val Ala Pro 130 135 140 His Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Leu Gly Ser Lys 145 150 155 160 Gly Val Gln Leu Leu Ser Ser Tyr Val Thr Asp Glu Leu Gly Ile Gln 165 170 175 Cys Gly Ala Leu Ser Gly Ala Asn Leu Ala Pro Glu Val Ala Lys Glu 180 185 190 His Trp Ser Glu Thr Thr Val Ala Tyr Gln Leu Pro Lys Asp Tyr Gln 195 200 205 Gly Asp Gly Lys Asp Val Asp His Lys Ile Leu Lys Leu Leu Phe His 210 215 220 Arg Pro Tyr Phe His Val Asn Val Ile Asp Asp Val Ala Gly Ile Ser 225 230 235 240 Ile Ala Gly Ala Leu Lys Asn Val Val Ala Leu Ala Cys Gly Phe Val 245 250 255 Glu Gly Met Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Leu 260 265 270 Gly Leu Gly Glu Ile Ile Lys Phe Gly Arg Met Phe Phe Pro Glu Ser 275 280 285 Lys Val Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile 290 295 300 Thr Thr Cys Ser Gly Gly Arg Asn Val Lys Val Ala Thr Tyr Met Ala 305 310 315 320 Lys Thr Gly Lys Ser Ala Leu Glu Ala Glu Lys Glu Leu Leu Asn Gly 325 330 335 Gln Ser Ala Gln Gly Ile Ile Thr Cys Arg Glu Val His Glu Trp Leu 340 345 350 Gln Thr Cys Glu Leu Thr Gln Glu Phe Pro Ile Ile Arg Gly Ser Leu 355 360 365 Pro Asp Ser Leu Gln Gln Arg Pro His Gly Arg Pro Thr Gly Asp Asp 370 375 380 <210> 16 <211> 391 <212> PRT <213> Saccharomyces cerevisiae <400> 16 Met Ser Ala Ala Ala Asp Arg Leu Asn Leu Thr Ser Gly His Leu Asn 1 5 10 15 Ala Gly Arg Lys Arg Ser Ser Ser Ser Val Ser Leu Lys Ala Ala Glu 20 25 30 Lys Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr Thr 35 40 45 Ile Ala Lys Val Val Ala Glu Asn Cys Lys Gly Tyr Pro Glu Val Phe 50 55 60 Ala Pro Ile Val Gln Met Trp Val Phe Glu Glu Glu Ile Asn Gly Glu 65 70 75 80 Lys Leu Thr Glu Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr Leu 85 90 95 Pro Gly Ile Thr Leu Pro Asp Asn Leu Val Ala Asn Pro Asp Leu Ile 100 105 110 Asp Ser Val Lys Asp Val Asp Ile Ile Val Phe Asn Ile Pro His Gln 115 120 125 Phe Leu Pro Arg Ile Cys Ser Gln Leu Lys Gly His Val Asp Ser His 130 135 140 Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Val Gly Ala Lys Gly 145 150 155 160 Val Gln Leu Leu Ser Ser Tyr Ile Thr Glu Glu Leu Gly Ile Gln Cys 165 170 175 Gly Ala Leu Ser Gly Ala Asn Ile Ala Thr Glu Val Ala Gln Glu His 180 185 190 Trp Ser Glu Thr Thr Val Ala Tyr His Ile Pro Lys Asp Phe Arg Gly 195 200 205 Glu Gly Lys Asp Val Asp His Lys Val Leu Lys Ala Leu Phe His Arg 210 215 220 Pro Tyr Phe His Val Ser Val Ile Glu Asp Val Ala Gly Ile Ser Ile 225 230 235 240 Cys Gly Ala Leu Lys Asn Val Val Ala Leu Gly Cys Gly Phe Val Glu 245 250 255 Gly Leu Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Val Gly 260 265 270 Leu Gly Glu Ile Ile Arg Phe Gly Gln Met Phe Phe Pro Glu Ser Arg 275 280 285 Glu Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile Thr 290 295 300 Thr Cys Ala Gly Gly Arg Asn Val Lys Val Ala Arg Leu Met Ala Thr 305 310 315 320 Ser Gly Lys Asp Ala Trp Glu Cys Glu Lys Glu Leu Leu Asn Gly Gln 325 330 335 Ser Ala Gln Gly Leu Ile Thr Cys Lys Glu Val His Glu Trp Leu Glu 340 345 350 Thr Cys Gly Ser Val Glu Asp Phe Pro Leu Phe Glu Ala Val Tyr Gln 355 360 365 Ile Val Tyr Asn Asn Tyr Pro Met Lys Asn Leu Pro Asp Met Ile Glu 370 375 380 Glu Leu Asp Leu His Glu Asp 385 390 <210> 17 <211> 2573 <212> DNA <213> Artificial <220> <223> GDP1 disruption <400> 17 ggtacccccg ccttgcttct ctccccttcc ttttcttttt ccagttttcc ctattttgtc 60 cctttttccg cacaacaagt atcagaatgg gttcatcaaa tctatccaac ctaattcgca 120 cgtagactgg cttggtattg gcagtttcgt agttatatat atactaccat gagtgaaact 180 gttacgttac cttaaattct ttctcccttt aattttcttt tatcttactc tcctacataa 240 gacatcaaga aacaattgta tattgtacac cccccccctc cacaaacaca aatattgata 300 atataaagat gtctgctgct gctgatagat taaacttaac ttccggccac ttgaatctag 360 atgcatgctc gagcggccgc cagtgtgatg gatatctgca gaattcgccc ttttgggccc 420 tgtacaccta ggatccgtcg acactggatg gcggcgttag tatcgaatcg acagcagtat 480 agcgaccagc attcacatac gattgacgca tgatattact ttctgcgcac ttaacttcgc 540 atctgggcag atgatgtcga ggcgaaaaaa aatataaatc acgctaacat ttgattaaaa 600 tagaacaact acaatataaa aaaactatac aaatgacaag ttcttgaaaa caagaatctt 660 tttattgtca gtactgatta ttcctttgcc ctcggacgag tgctggggcg tcggtttcca 720 ctatcggcga gtacttctac acagccatcg gtccagacgg ccgcgcttct gcgggcgatt 780 tgtgtacgcc cgacagtccc ggctccggat cggacgattg cgtcgcatcg accctgcgcc 840 caagctgcat catcgaaatt gccgtcaacc aagctctgat agagttggtc aagaccaatg 900 cggagcatat acgcccggag ccgcggcgat cctgcaagct ccggatgcct ccgctcgaag 960 tagcgcgtct gctgctccat acaagccaac cacggcctcc agaagaagat gttggcgacc 1020 tcgtattggg aatccccgaa catcgcctcg ctccagtcaa tgaccgctgt tatgcggcca 1080 ttgtccgtca ggacattgtt ggagccgaaa tccgcgtgca cgaggtgccg gacttcgggg 1140 cagtcctcgg cccaaagcat cagctcatcg agagcctgcg cgacggacgc actgacggtg 1200 tcgtccatca cagtttgcca gtgatacaca tggggatcag caatcgcgca tatgaaatca 1260 cgccatgtag tgtattgacc gattccttgc ggtccgaatg ggccgaaccc gctcgtctgg 1320 ctaagatcgg ccgcagcgat cgcatccatg gcctccgcga ccggctgcag aacagcgggc 1380 agttcggttt caggcaggtc ttgcaacgtg acaccctgtg cacggcggga gatgcaatag 1440 gtcaggctct cgctgaattc cccaatgtca agcacttccg gaatcgggag cgcggccgat 1500 gcaaagtgcc gataaacata acgatctttg tagaaaccat cggcgcagct atttacccgc 1560 aggacatatc cacgccctcc tacatcgaag ctgaaagcac gagattcttc gccctccgag 1620 agctgcatca ggtcggagac gctgtcgaac ttttcgatca gaaacttctc gacagacgtc 1680 gcggtgagtt caggcttttt acccatggtt gtttatgttc ggatgtgatg tgagaactgt 1740 atcctagcaa gattttaaaa ggaagtatat gaaagaagaa cctcagtggc aaatcctaac 1800 cttttatatt tctctacagg ggcgcggcgt ggggacaatt cacgcgtctg tgaggggagc 1860 gtttccctgc tcgcaggtct gcagcgagga gccgtaattt ttgcttcgcg ccgtgcggcc 1920 atcaaaatgt atggatgcaa atgattatac atggggatgt atgggctaaa tgtacgggcg 1980 acagtcacat catgcccctg agctgcgcac gtcaagactg tcaaggaggg tattctgggc 2040 ctccatgtcg ctggccgggt gacccggcgg ggacgaggcc ttaagttcga acgtacggag 2100 ttgttgaatg gccaatccgc tcaaggttta attacctgca aagaagttca cgaatggttg 2160 gaaacatgtg gctctgtcga agacttccca ttatttgaag ccgtatacca aatcgtttac 2220 aacaactacc caatgaagaa cctgccggac atgattgaag aattagatct acatgaagat 2280 tagatttatt ggagaaagat aacatatcat actttccccc acttttttcg aggctcttct 2340 atatcatatt cataaattag cattatgtca tttctcataa ctactttatc acgttagaaa 2400 ttacttatta ttattaaatt aatacaaaat ttagtaacca aataaatata aataaatatg 2460 tatatttaaa ttttaaaaaa aaaatcctat agagcaaaag gattttccat tataatatta 2520 gctgtacacc tcttccgcat tttttgaggg tggttacaac accactcggt acc 2573 <210> 18 <211> 2058 <212> DNA <213> Artificial <220> <223> GPD2 disruption <400> 18 agatcttttg cggcgaggtg ccgatgggtt gctgagggga agagtgttta gcttacggac 60 ctattgccat tgttattccg attaatctat tgttcagcag ctcttctcta ccctgtcatt 120 ctagtatttt tttttttttt ttttggtttt actttttttt cttcttgcct ttttttcttg 180 ttactttttt tctagttttt tttccttcca ctaagctttt tccttgattt atccttgggt 240 tcttctttct actcctttag attttttttt tatatattaa tttttaagtt tatgtatttt 300 ggtagattca attctctttc cctttccttt tccttcgctc cccttcctta tcaatgcttg 360 ctgtcagaag attaacaaga tacacattcc ttaaggcctc gtccccgccg ggtcacccgg 420 ccagcgacat ggaggcccag aataccctcc ttgacagtct tgacgtgcgc agctcagggg 480 catgatgtga ctgtcgcccg tacatttagc ccatacatcc ccatgtataa tcatttgcat 540 ccatacattt tgatggccgc acggcgcgaa gcaaaaatta cggctcctcg ctgcagacct 600 gcgagcaggg aaacgctccc ctcacagacg cgttgaattg tccccacgcc gcgcccctgt 660 agagaaatat aaaaggttag gatttgccac tgaggttctt ctttcatata cttcctttta 720 aaatcttgct aggatacagt tctcacatca catccgaaca taaacaacca tgtaaaatga 780 ccactcttga cgacacggct taccggtacc gcaccagtgt cccgggggac gccgaggcca 840 tcgaggcact ggatgggtcc ttcaccaccg acaccgtctt ccgcgtcacc gccaccgggg 900 acggcttcac cctgcgggag gtgccggtgg acccgcccct gaccaaggtg ttccccgacg 960 acgaatcgga cgacgaatcg gacgccgggg aggacggcga cccggactcc cggacgttcg 1020 tcgcgtacgg ggacgacggc gacctggcgg gcttcgtggt cgtctcgtac tccggctgga 1080 accgccggct gaccgtcgag gacatcgagg tcgccccgga gcaccggggg cacggggtcg 1140 ggcgcgcgtt gatggggctc gcgacggagt tcgcccgcga gcggggcgcc gggcacctct 1200 ggctggaggt caccaacgtc aacgcaccgg cgatccacgc gtaccggcgg atggggttca 1260 ccctctgcgg cctggacacc gccctgtacg acggcaccgc ctcggacggc gagcaggcgc 1320 tctacatgag catgccctgc ccctagtact gacaataaaa agattcttgt tttcaagaac 1380 ttgtcatttg tatagttttt ttatattgta gttgttctat tttaatcaaa tgttagcgtg 1440 atttatattt tttttcgcct cgacatcatc tgcccagatg cgaagttaag tgcgcagaaa 1500 gtaatatcat gcgtcaatcg tatgtgaatg ctggtcgcta tactgctgtc gattcgatac 1560 taacgccgcc atccagtgtc gacggatcct aggtgtacag ggcccaaaag ggcgaattct 1620 gcagatatcc atcacactgg cggccgctcg aggatagtct acaacaacgt ccgcatggaa 1680 gacctaccgg agatgattga agagctagac atcgatgacg aatagacact ctcccccccc 1740 ctccccctct gatctttcct gttgcctctt tttcccccaa ccaatttatc attatacaca 1800 agttctacaa ctactactag taacattact acagttatta taattttcta ttctcttttt 1860 ctttaagaat ctatcattaa cgttaatttc tatatataca taactaccat tatacacgct 1920 attatcgttt acatatcaca tcaccgttaa tgaaagatac gacaccctgt acactaacac 1980 aattaaataa tcgccataac cttttctgtt atctatagcc cttaaagctg tttcttcgag 2040 ctttttcact gcagatct 2058 <210> 19 <211> 816 <212> DNA <213> Saccharomyces cerevisiae <400> 19 ccatatgatc atgtgtcgtc gcacacatat atatatgcct gtatgtgtca gcactaaagt 60 tgcctggcca tccacgctat atatacacgc ctggcggatc tgctcgagga ttgcctacgc 120 gtgggcttga tccaccaacc aacgctcgcc aaatgaactg gcgctttggt cttctgccat 180 cgtccgtaaa ccccggccaa agagaccgga aagatcggtg aaaacatctt gatcttgctc 240 ccgggaattt tagattcagg taggaaattg attacatcaa tactgttacc ctgaatcata 300 ttcgacgatg tcgtctcaca cggaaatata attcatttct tggttttcca aaaaaatttt 360 catttttttt cacttttttg tttcgtcctc cttttttttt tttttttttt attttttttc 420 ctgtgttcac cttttttttt ttcagttgac atctttctgc attcttttct gtgttttttt 480 tttttttttt cgtttttcca ttgttcgttc gttgcctgtt ttttcgccct attgttctcg 540 agcctaaaaa ttttttcctt tcctgctttc ctttcttcgt tcaaagtttc ctattccatt 600 gttctctttg gtaaactcat tgttgtcgga actcagatat attcaggtca atttactgta 660 cttcaattga cttttttctt gaaatttcaa cttgcctttt caacttgttc ttctttttta 720 atcttattct acactttagt tcccttacct tgttcctaat tattgtctag caaaaagaaa 780 acatacacct atttcattca cacactgcag aaaatg 816 <210> 20 <211> 12350 <212> DNA <213> Artificial <220> <223> pRN500 <400> 20 tcgatgataa gctgtcaaag atgagaatta attccacgga ctatagacta tactagatac 60 tccgtctact gtacgataca cttccgctca ggtccttgtc ctttaacgag gccttaccac 120 tcttttgtta ctctattgat ccagctcagc aaaggcagtg tgatctaaga ttctatcttc 180 gcgatgtagt aaaactagct agaccgagaa agagactaga aatgcaaaag gcacttctac 240 aatggctgcc atcattatta tccgatgtga cgctgcagct tctcaatgat attcgaatac 300 gctttgagga gatacagcct aatatccgac aaactgtttt acagatttac gatcgtactt 360 gttacccatc attgaatttt gaacatccga acctgggagt tttccctgaa acagatagta 420 tatttgaacc tgtataataa tatatagtct agcgctttac ggaagacaat gtatgtattt 480 cggttcctgg agaaactatt gcatctattg cataggtaat cttgcacgtc gcatccccgg 540 ttcattttct gcgtttccat cttgcacttc aatagcatat ctttgttaac gaagcatctg 600 tgcttcattt tgtagaacaa aaatgcaacg cgagagcgct aatttttcaa acaaagaatc 660 tgagctgcat ttttacagaa cagaaatgca acgcgaaagc gctattttac caacgaagaa 720 tctgtgcttc atttttgtaa aacaaaaatg caacgcgacg agagcgctaa tttttcaaac 780 aaagaatctg agctgcattt ttacagaaca gaaatgcaac gcgagagcgc tattttacca 840 acaaagaatc tatacttctt ttttgttcta caaaaatgca tcccgagagc gctatttttc 900 taacaaagca tcttagatta ctttttttct cctttgtgcg ctctataatg cagtctcttg 960 ataacttttt gcactgtagg tccgttaagg ttagaagaag gctactttgg tgtctatttt 1020 ctcttccata aaaaaagcct gactccactt cccgcgttta ctgattacta gcgaagctgc 1080 gggtgcattt tttcaagata aaggcatccc cgattatatt ctataccgat gtggattgcg 1140 catactttgt gaacagaaag tgatagcgtt gatgattctt cattggtcag aaaattatga 1200 acggtttctt ctattttgtc tctatatact acgtatagga aatgtttaca ttttcgtatt 1260 gttttcgatt cactctatga atagttctta ctacaatttt tttgtctaaa gagtaatact 1320 agagataaac ataaaaaatg tagaggtcga gtttagatgc aagttcaagg agcgaaaggt 1380 ggatgggtag gttatatagg gatatagcac agagatatat agcaaagaga tacttttgag 1440 caatgtttgt ggaagcggta ttcgcaatgc cggctttccc cgtcaagctc taaatcgggg 1500 gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta 1560 gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt 1620 ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat 1680 ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 1740 tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt ttacaatttc 1800 ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcag ggtaataact 1860 gatataatta aattgaagct ctaatttgtg agtttagtat acatgcattt acttataata 1920 cagtttttta gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt 1980 aacgttcacc ctctacctta gcatcccttc cctttgcaaa tagtcctctt ccaacaataa 2040 taatgtcaga tcctgtagag accacatcat ccacggttct atactgttga cccaatgcgt 2100 ctcccttgtc atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc 2160 ttccacccat gtctctttga gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa 2220 tgtcaacagt acccttagta tattctccag tagataggga gcccttgcat gacaattctg 2280 ctaacatcaa aaggcctcta ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc 2340 taacaatacc tgggcccacc acaccgtgtg cattcgtaat gtctgcccat tctgctattc 2400 tgtatacacc cgcagagtac tgcaatttga ctgtattacc aatgtcagca aattttctgt 2460 cttcgaagag taaaaaattg tacttggcgg ataatgcctt tagcggctta actgtgccct 2520 ccatggaaaa atcagtcaag atatccacat gtgtttttag taaacaaatt ttgggaccta 2580 atgcttcaac taactccagt aattccttgg tggtacgaac atccaatgaa gcacacaagt 2640 ttgtttgctt ttcgtgcatg atattaaata gcttggcagc aacaggacta ggatgagtag 2700 cagcacgttc cttatatgta gctttcgaca tgatttatct tcgtttcctg caggtttttg 2760 ttctgtgcag ttgggttaag aatactgggc aatttcatgt ttcttcaaca ctacatatgc 2820 gtatatatac caatctaagt ctgtgctcct tccttcgttc ttccttctgt tcggagatta 2880 ccgaatcaaa aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg 2940 aattgaattg aaaagcgtgg tgcactctca gtacaatctg ctctgatgcc gcatagttaa 3000 gccagccccg acacccgcca acacccgctg acgcgccctg acgggcttgt ctgctcccgg 3060 catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac 3120 cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat acgcctattt ttataggtta 3180 atgtcatgat aataatggtt tcttagacgt caggtggcac ttttcgggga aatgtgcgcg 3240 gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 3300 aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc 3360 gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa 3420 cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac 3480 tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga 3540 tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag 3600 agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca 3660 cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca 3720 tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa 3780 ccgctttttt tcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc 3840 tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa 3900 cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag 3960 actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct 4020 ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac 4080 tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggc agtcaggcaa 4140 ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt 4200 aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat 4260 ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg 4320 agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc 4380 ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 4440 tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag 4500 cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact 4560 ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg 4620 gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc 4680 ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg 4740 aactgagata cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg 4800 cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag 4860 gggggaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc 4920 gatttttgtg atgctcgtca ggggggccga gcctatggaa aaacgccagc aacgcggcct 4980 ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc 5040 ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc 5100 gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgccca atacgcaaac 5160 cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg gcacgacagg tttcccgact 5220 ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta cctcactcat taggcacccc 5280 aggctttaca ctttatgctt ccggctccta tgttgtgtgg aattgtgagc ggataacaat 5340 ttcacacagg aaacagctat gaccatgatt acgccaagct cggaattaac cctcactaaa 5400 gggaacaaaa gctgggtacc gggccccccc tcgaccggtc ccacacacca tagcttcaaa 5460 atgtttctac tcctttttta ctcttccaga ttttctcgga ctccgcgcat cgccgtacca 5520 cttcaaaaca cccaagcaca gcatactaaa tttcccctct ttcttcctct agggtgtcgt 5580 taattacccg tactaaaggt ttggaaaaga aaaaagagac cgcctcgttt ctttttcttc 5640 gtcgaaaaag gcaataaaaa tttttatcac gtttcttttt cttgaaaatt tttttttttg 5700 atttttttct ctttcgatga cctcccattg atatttaagt taataaacgg tcttcaattt 5760 ctcaagtttc agtttcattt ttcttgttct attacaactt tttttacttc ttgctcatta 5820 gaaagaaagc atagcaatct aatctaagct gcagaagctt aaaatgtcgc cctctgccgt 5880 acaatcatca aaactagaag aacagtcaag tgaaattgac aagttgaaag caaaaatgtc 5940 ccagtctgcc gccactgcgc agcagaagaa ggaacatgag tatgaacatt tgacttcggt 6000 caagatcgtg ccacaacggc ccatctcaga tagactgcag cccgcaattg ctacccacta 6060 ttctccacac ttggacgggt tgcaggacta tcagcgcttg cacaaggagt ctattgaaga 6120 ccctgctaag ttcttcggtt ctaaagctac ccaattttta aactggtcta agccattcga 6180 taaggtgttc atcccagacc ctaaaacggg caggccctcc ttccagaaca atgcatggtt 6240 cctcaacggc caattaaacg cctgttacaa ctgtgttgac agacatgcct tgaagactcc 6300 taacaagaaa gccattattt tcgaaggtga cgagcctggc caaggctatt ccattaccta 6360 caaggaacta cttgaagaag tttgtcaagt ggcacaagtg ctgacttact ctatgggcgt 6420 tcgcaagggc gatactgttg ccgtgtacat gcctatggtc ccagaagcaa tcataacctt 6480 gttggccatt tcccgtatcg gtgccattca ctccgtagtc tttgccgggt tttcttccaa 6540 ctccttgaga gatcgtatca acgatgggga ctctaaagtt gtcatcacta cagatgaatc 6600 caacagaggt ggtaaagtca ttgagactaa aagaattgtt gatgacgcgc taagagagac 6660 cccaggcgtg agacacgtct tggtttatag aaagaccaac aatccatctg ttgctttcca 6720 tgcccccaga gatttggatt gggcaacaga aaagaagaaa tacaagacct actatccatg 6780 cacacccgtt gattctgagg atccattatt cttgttgtat acgtctggtt ctactggtgc 6840 ccccaagggt gttcaacatt ctaccgcagg ttacttgctg ggagctttgt tgaccatgcg 6900 ctacactttt gacactcacc aagaagacgt tttcttcaca gctggagaca ttggctggat 6960 tacaggccac acttatgtgg tttatggtcc cttactatat ggttgtgcca ctttggtctt 7020 tgaagggact cctgcgtacc caaattactc ccgttattgg gatattattg atgaacacaa 7080 agtcacccaa ttttatgttg cgccaactgc tttgcgtttg ttgaaaagag ctggtgattc 7140 ctacatcgaa aatcattcct taaaatcttt gcgttgcttg ggttcggtcg gtgagccaat 7200 tgctgctgaa gtttgggagt ggtactctga aaaaataggt aaaaatgaaa tccccattgt 7260 agacacctac tggcaaacag aatctggttc gcatctggtc accccgctgg ctggtggtgt 7320 tacaccaatg aaaccgggtt ctgcctcatt ccccttcttc ggtattgatg cagttgttct 7380 tgaccctaac actggtgaag aacttaacac cagccacgca gagggtgtcc ttgccgtcaa 7440 agctgcatgg ccatcatttg caagaactat ttggaaaaat catgataggt atctagacac 7500 ttatttgaac ccttaccctg gctactattt cactggtgat ggtgctgcaa aggataagga 7560 tggttatatc tggattttgg gtcgtgtaga cgatgtggtg aacgtctctg gtcaccgtct 7620 gtctaccgct gaaattgagg ctgctattat cgaagatcca attgtggccg agtgtgctgt 7680 tgtcggattc aacgatgact tgactggtca agcagttgct gcatttgtgg tgttgaaaaa 7740 caaatctagt tggtccaccg caacagatga tgaattacaa gatatcaaga agcatttggt 7800 ctttactgtt agaaaagaca tcgggccatt tgccgcacca aaattgatca ttttagtgga 7860 tgacttgccc aagacaagat ccggcaaaat tatgagacgt attttaagaa aaatcctagc 7920 aggagaaagt gaccaactag gcgacgtttc tacattgtca aaccctggca ttgttagaca 7980 tctaattgat tcggtcaagt tgtaacttaa gcgcgcgaat ttcttatgat ttatgatttt 8040 tattattaaa taagttataa aaaaaataag tgtatacaaa ttttaaagtg actcttaggt 8100 tttaaaacga aaattcttat tcttgagtaa ctctttcctg taggtcaggt tgctttctca 8160 ggtatagcat gaggtcgctc ttattgacca cacctctacc ggcatgccga gcaaatgcct 8220 gcaaatcgct ccccatttca cccaattgta gatatgctaa ctccagcaat gagttgatga 8280 atctcggtgt gtattttatg tcctcagagg acaacacctg ttgtaatcgt tcttccacac 8340 gtacgtttta aacagttgat gagaaccttt ttcgcaagtt caaggtgctc taatttttaa 8400 aatttttact tttcgcgaca caataaagtc ttcacgacgc taaactatta gtgcacataa 8460 tgtagttact tggacgctgt tcaataatgt ataaaattta tttcctttgc attacgtaca 8520 ttatataacc aaatcttaaa aatatagaaa tatgatatgt gtataataat ataagcaaaa 8580 tttacgtatc tttgcttata atatagcttt aatgttcttt aggtatatat ttaagagcga 8640 tttgtctcga cttatttctt tttttgagag aaaaattggt tctctacagc agaaatgatg 8700 gcaggtacaa cttctgggtt ggccaaagta gttaggtcac ctagctgttc ggcttcgtta 8760 gaagcaacct ttcttagaac tcttctcata atctttcctg accttgttct tggtagatct 8820 ctaactagaa taatggtttt tggtgaggcg aaaggaccaa tctcacccct aacttgtaag 8880 atcaattctc tacgtaaatt atctggtgtg atgtgttctg catcaccttc agtagcgttg 8940 ttttgtagat aaccatcttt tagggaaaca tatgcaacga cggtttgacc ggtcaattca 9000 tctggaatac cgacaacagc agcttccgag acgttttcgt gatttgagat agatgcttca 9060 atttctgatg tggataatct atgaccggaa acatttacaa cgtcgtcaac tctacccctg 9120 atccagtagt aaccatcatg atctctacca gcaccatcac ctgtgaaata gtgaccagga 9180 taaggtttca agtaagtatc catgtaacgg tcgtggtggt tccaaacaga tctagccatt 9240 gatggccatg gtgatttaac ggcaaggaca ccttcgacat cattaccttc taattccaca 9300 cctgtaacag ggtcaatgat acaagcgtta ataccaaaga atggcacggt agcagaacca 9360 ggttttgttg ggacagcacc tgccaaagga gcaattaaat gagaaccaga ctctgtttgc 9420 cacatagtgt cacaaatgac acagtttttg ttacccactt tttcatgata ccattcccat 9480 aagtctggag agattggttc accgacggaa cccaagacac gtaatgagga agtgtcatat 9540 ttggcaattt cggcttcacc tacacgtttg attaatctta aagcagttgg agccacatag 9600 aaatgggtag ccttgtgacg ttggataatt ctccaatatc taccataatc tgggtaggca 9660 ggagtggatt cgaaaattat tgaggcggta cccaaggtta atggaccata tagagcatag 9720 gtgtgacccg tgatccagcc gacgtcaccg gcagtgaaga gaacatcttc tgggtgaata 9780 tcaaaaacgt atctagttgt taaagcggca cctaataaat aaccacctgt agtgtgaacg 9840 acaccctttg gagaaccagt ggaaccggaa gtgtataata aaaatagagg atcttcagcg 9900 tcacatgaaa caggaggtag gtaagttctc tgcttagcgg cctcctcatg ccaccagtaa 9960 tctctaccgg ccttcattgg aataccttca gtaccagttc tttggaaaac caagatacgg 10020 gaaaccaaat cgactccgtt caaaccttcg tcaacaattt ttttagtgtt gatggtctta 10080 ccacctcttt taccttcatc acaagtgatg accactttag aattagcgtc aacgacacga 10140 tctttcaacg aaccagcgga gaacccagca aagacaacag agtgaatagc accaatacga 10200 gccacagcca acatagcaat gaccgcttct ggaatcattg gcaaatagat agccactgtg 10260 tcacctttct taacgcccca gctttttaag acaccagcga tttgggaaac ttttctgagt 10320 aattcaccaa atgtgatgat tttgttgtcg gattcgtcat cagcttcata gatcaaagct 10380 ggcttgtcgg gattagcaaa ggcatgtctg tcaacacaat tgtatgatgc attcaattta 10440 ccgttcaaaa accatgcaac atcaccattg ttcaatgaac cagattgaac tttggtgtat 10500 ggagcatccc aatgcaagta ttccttagcc atcttatcaa agaatttttc tggctcattg 10560 atagattgtt gatacatttc ttgataatgt tgcatatcag taacgtaacc cttgccgggt 10620 tggctgttgt aaaaatgttg aggagcctta agagccttta cgttgtgagc ttcataaact 10680 actttatgtt ccttgattgt cattttctgc agtctagata tatttgttgt aaaaagtaga 10740 taattacttc cttgatgatc tgtaaaaaag agaaaaagaa agcatctaag aacttgaaaa 10800 actacgaatt agaaaagacc aaatatgtat ttcttgcatt gaccaattta tgcaagttta 10860 tatatatgta aatgtaagtt tcacgaggtt ctactaaact aaaccacccc cttggttaga 10920 agaaaagagt gtgtgagaac aggctgttgt tgtcacacga ttcggacaat tctgtttgaa 10980 agagagagag taacagtacg atcgaacgaa ctttgctctg gagatcacag tgggcatcat 11040 agcatgtggt actaaaccct ttcccgccat tccagaacct tcgattgctt gttacaaaac 11100 ctgtgagccg tcgctaggac cttgttgtgt gacgaaattg gaagctgcaa tcaataggaa 11160 gacaggaagt cgagcgtgtc tgggtttttt cagttttgtt ctttttgcaa acaaatcacg 11220 agcgacggta atttctttct cgataagagg ccacgtgctt tatgagggta acatcaattc 11280 aagaaggagg gaaacacttc ctttttctgg ccctgataat agtatgaggg tgaagccaaa 11340 ataaaggatt cgcgcccaaa tcggcatctt taaatgcagg tatgcgatag ttcctcactc 11400 tttccttact cacgagtaat tcttgcaaat gcctattatg cagatgttat aatatctgtg 11460 cgtcttgagt tgaagagctc gagactagat gcatgctcga gcggccgcca gtgtgatgga 11520 tatctgcaga attcgccctt ttgggccctg tacacctagg atccgtcgac actggatggc 11580 ggcgttagta tcgaatcgac agcagtatag cgaccagcat tcacatacga ttgacgcatg 11640 atattacttt ctgcgcactt aacttcgcat ctgggcagat gatgtcgagg cgaaaaaaaa 11700 tataaatcac gctaacattt gattaaaata gaacaactac aatataaaaa aactatacaa 11760 atgacaagtt cttgaaaaca agaatctttt tattgtcagt actgattaga aaaactcatc 11820 gagcatcaaa tgaaactgca atttattcat atcaggatta tcaataccat atttttgaaa 11880 aagccgtttc tgtaatgaag gagaaaactc accgaggcag ttccatagga tggcaagatc 11940 ctggtatcgg tctgcgattc cgactcgtcc aacatcaata caacctatta atttcccctc 12000 gtcaaaaata aggttatcaa gtgagaaatc accatgagtg acgactgaat ccggtgagaa 12060 tggcaaaagc ttatgcattt ctttccagac ttgttcaaca ggccagccat tacgctcgtc 12120 atcaaaatca ctcgcatcaa ccaaaccgtt attcattcgt gattgcgcct gagcgagacg 12180 aaatacgcga tcgctgttaa aaggacaatt acaaacagga atcgaatgca accggcgcag 12240 gaacactgcc agcgcatcaa caatattttc acctgaatca ggatattctt ctaatacctg 12300 gaatgctgtt ttgccgggga tcgcagtggt gagtaaccat gcatcatcag 12350 <210> 21 <211> 1120 <212> DNA <213> Artificial <220> <223> nucleotide seqeunce encoding E.coli gldA codon-optimised for yeast <400> 21 ctgcagaaaa tggacagaat catccaatct ccaggtaagt acatccaagg tgctgacgtt 60 atcaacagat tgggtgaata cttgaagcca ttggctgaaa gatggttggt tgttggtgac 120 aagttcgttt tgggtttcgc tcaatctacc gttgaaaagt ctttcaagga cgctggtttg 180 gttgttgaaa tcgctccatt cggtggtgaa tgttctcaaa acgaaatcga cagattgaga 240 ggtatcgctg aaaccgctca atgtggtgct atcttgggta tcggtggtgg taagaccttg 300 gacaccgcta aggctttggc tcacttcatg ggtgttccag ttgctatcgc tccaaccatc 360 gcttctaccg acgctccatg ttctgctttg tctgttatct acaccgacga aggtgaattc 420 gacagatact tgttgttgcc aaacaaccca aacatggtta tcgttgacac caagatcgtt 480 gctggtgctc cagctagatt gttggcagct ggtatcggtg acgctttggc tacctggttc 540 gaagctagag cttgttctag atctggtgct accaccatgg ctggtggtaa gtgtacccaa 600 gctgctttgg ctttggctga attgtgttac aacaccttgt tggaagaagg tgaaaaggct 660 atgttggctg ctgaacaaca cgttgttacc ccagctttgg aaagagttat cgaagctaac 720 acctacttgt ctggtgttgg tttcgaatct ggtggtttgg ctgctgctca cgctgttcac 780 aacggtttga ccgctatccc agacgctcac cactactacc acggtgaaaa ggttgctttc 840 ggtaccttga cccaattggt tttggaaaac gctccagttg aagaaatcga aaccgttgct 900 gctttgtctc acgctgttgg tttgccaatc accttggctc aattggacat caaggaagac 960 gttccagcta agatgagaat cgttgctgaa gctgcttgtg ctgaaggtga aaccatccac 1020 aacatgccag gtggtgctac cccagaccaa gtttacgctg ctttgttggt tgctgaccaa 1080 tacggtcaaa gattcctaca agaatgggaa taaggcgcgc 1120 <210> 22 <211> 1450 <212> DNA <213> Artificial <220> <223> DAK1 PCR fragment <400> 22 tctagaaaat gtccgctaaa tcgtttgaag tcacagatcc agtcaattca agtctcaaag 60 ggtttgccct tgctaacccc tccattacgc tggtccctga agaaaaaatt ctcttcagaa 120 agaccgattc cgacaagatc gcattaattt ctggtggtgg tagtggacat gaacctacac 180 acgccggttt cattggtaag ggtatgttga gtggcgccgt ggttggcgaa atttttgcat 240 ccccttcaac aaaacagatt ttaaatgcaa tccgtttagt caatgaaaat gcgtctggcg 300 ttttattgat tgtgaagaac tacacaggtg atgttttgca ttttggtctg tccgctgaga 360 gagcaagagc cttgggtatt aactgccgcg ttgctgtcat aggtgatgat gttgcagttg 420 gcagagaaaa gggtggtatg gttggtagaa gagcattggc aggtaccgtt ttggttcata 480 agattgtagg tgccttcgca gaagaatatt ctagtaagta tggcttagac ggtacagcta 540 aagtggctaa aattatcaac gacaatttgg tgaccattgg atcttcttta gaccattgta 600 aagttcctgg caggaaattc gaaagtgaat taaacgaaaa acaaatggaa ttgggtatgg 660 gtattcataa cgaacctggt gtgaaagttt tagaccctat tccttctacc gaagacttga 720 tctccaagta tatgctacca aaactattgg atccaaacga taaggataga gcttttgtaa 780 agtttgatga agatgatgaa gttgtcttgt tagttaacaa tctcggcggt gtttctaatt 840 ttgttattag ttctatcact tccaaaacta cggatttctt aaaggaaaat tacaacataa 900 ccccggttca aacaattgct ggcacattga tgacctcctt caatggtaat gggttcagta 960 tcacattact aaacgccact aaggctacaa aggctttgca atctgatttt gaggagatca 1020 aatcagtact agacttgttg aacgcattta cgaacgcacc gggctggcca attgcagatt 1080 ttgaaaagac ttctgcccca tctgttaacg atgacttgtt acataatgaa gtaacagcaa 1140 aggccgtcgg tacctatgac tttgacaagt ttgctgagtg gatgaagagt ggtgctgaac 1200 aagttatcaa gagcgaaccg cacattacgg aactagacaa tcaagttggt gatggtgatt 1260 gtggttacac tttagtggca ggagttaaag gcatcaccga aaaccttgac aagctgtcga 1320 aggactcatt atctcaggcg gttgcccaaa tttcagattt cattgaaggc tcaatgggag 1380 gtacttctgg tggtttatat tctattcttt tgtcgggttt ttcacacgga ttaattcagg 1440 tttgtaaatc 1450 <210> 23 <211> 1698 <212> DNA <213> Artificial <220> <223> GUP1 PCR fragment <400> 23 gaattcaaaa tgtcgctgat cagcatcctg tctcccctaa ttacttccga gggcttagat 60 tcaagaatca aaccttcacc aaaaaaggat gcctctacta ccactaagcc atcactatgg 120 aaaactactg agttcaaatt ctactacatt gcatttctgg tcgtggttcc cttgatgttc 180 tatgctgggt tacaagctag ttcgcccgaa aatccaaact atgcaagata cgaacgtctc 240 ctatctcaag gttggttatt tggcagaaaa gtagacaata gtgattctca atataggttt 300 ttcagggaca attttgcgct attgtcagtt ttaatgctag tccacacttc tataaaacgc 360 attgtacttt attcaacaaa tatcactaaa ttgaggtttg atctgatatt tggtttgatc 420 tttttagtgg ccgctcatgg tgtcaattcg ataagaattt tagcccatat gctaatttta 480 tatgccatcg cccatgtact aaagaacttt agaagaatag ccaccatcag catttggatt 540 tatggtattt ctacgctttt tattaacgac aacttcagag catatccatt tggtaatatt 600 tgctcttttt taagcccatt ggaccattgg tatagaggta tcattccaag atgggatgtc 660 tttttcaatt ttactctttt gagagtctta agttacaact tggacttctt agagaggtgg 720 gagaatttac aaaagaagaa aagtccatcc tatgaatcaa aagaagctaa atcagccatt 780 ttgctcaatg aacgtgctag attaactgct gcacacccca tacaggacta cagcttaatg 840 aattatattg catatgttac ttacacgcca cttttcattg ccggccccat tataacattc 900 aatgattatg tttaccaatc gaaacatacc ttgccatcaa taaatttcaa attcattttt 960 tactatgcgg tgagattcgt tattgctctc ttatctatgg agttcatttt acactttctc 1020 cacgttgtgg caatctcaaa aaccaaagcg tgggaaaatg acacaccttt ccagatttcc 1080 atgattggct tatttaattt gaatattatt tggctaaaac tactgattcc gtggaggctg 1140 tttaggctgt gggctttgct agacggaatc gatacacctg aaaatatgat caggtgtgtt 1200 gataacaatt acagttcact agcattctgg agagcttggc atagaagcta caataagtgg 1260 gttgtccgtt acatatatat tcctctaggt ggttcaaaaa atagagtttt gacatcacta 1320 gcagtctttt ccttcgtagc tatatggcat gacatcgaac taaagttatt attatggggt 1380 tggctaatag ttttgttcct cttaccagaa atttttgcta cccaaatttt ctctcattat 1440 accgacgcag tctggtacag acacgtttgc gctgtcggtg ctgttttcaa catatgggtt 1500 atgatgatcg ctaatctttt tggattctgc ttgggctctg acggtactaa aaaattacta 1560 agcgatatgt tctgtaccgt atctggtttc aaatttgtaa ttttggcaag cgttagttta 1620 ttcatcgcag tacaaataat gtttgaaatc agagaagaag aaaagaggca cggaatttac 1680 ctaaaatgct gaggatcc 1698 <210> 24 <211> 3037 <212> DNA <213> Artificial <220> <223> FPS1 PCR fragment <400> 24 aagagctccg gactagtcgt acgaattcta tccttttgtt gtttccgggt gtacaatatg 60 gacttcctct tttctggcaa ccaaacccat acatcgggat tcctataata ccttcgttgg 120 tctccctaac atgtaggtgg cggaggggag atatacaata gaacagatac cagacaagac 180 ataatgggct aaacaagact acaccaatta cactgcctca ttgatggtgg tacataacga 240 actaatactg tagccctaga cttgatagcc atcatcatat cgaagtttca ctaccctttt 300 tccatttgcc atctattgaa gtaataatag gcgcatgcaa cttcttttct ttttttttct 360 tttctctctc ccccgttgtt gtctcaccat atccgcaatg acaaaaaaat gatggaagac 420 actaaaggaa aaaattaacg acaaagacag caccaacaga tgtcgttgtt ccagagctga 480 tgaggggtat ctcgaagcac acgaaacttt ttccttcctt cattcacgca cactactctc 540 taatgagcaa cggtatacgg ccttccttcc agttacttga atttgaaata aaaaaagttt 600 gctgtcttgc tatcaagtat aaatagacct gcaattatta atcttttgtt tcctcgtcat 660 tgttctcgtt ccctttcttc cttgtttctt tttctgcaca atatttcaag ctataccaag 720 catacaatca actccagctg cattaaaatg agtaatcctc aaaaagctct aaacgacttt 780 ctgtccagtg aatctgttca tacacatgat agttctagga aacaatctaa taagcagtca 840 tccgacgaag gacgctcttc atcacaacct tcacatcatc actctggtgg tactaacaac 900 aataataaca ataataataa taataataac agtaacaaca acaacaacgg caacgatggg 960 ggaaatgatg acgactatga ttatgaaatg caagattata gaccttctcc gcaaagtgcg 1020 cggcctactc ccacgtatgt tccacaatat tctgtagaaa gtgggactgc tttcccgatt 1080 caagaggtta ttcctagcgc atacattaac acacaagata taaaccataa agataacggt 1140 ccgccgagtg caagcagtaa tagagcattc aggcctagag ggcagaccac agtgtcggcc 1200 aacgtgctta acattgaaga tttttacaaa aatgcagacg atgcgcatac catcccggag 1260 tcacatttat cgagaaggag aagtaggtcg agggctacga gtaatgctgg gcacagtgcc 1320 aatacaggcg ccacgaatgg caggactact ggtgcccaaa ctaatatgga aagcaatgaa 1380 tcaccacgta acgtccccat tatggtgaag ccaaagacat tataccagaa ccctcaaaca 1440 cctacagtct tgccctccac ataccatcca attaataaat ggtcttccgt caaaaacact 1500 tatttgaagg aatttttagc cgagtttatg ggaacaatgg ttatgattat tttcggtagt 1560 gctgttgttt gtcaggtcaa tgttgctggg aaaatacagc aggacaattt caacgtggct 1620 ttggataacc ttaacgttac cgggtcttct gcagaaacga tagacgctat gaagagttta 1680 acatccttgg tttcatccgt tgcgggcggt acctttgatg atgtggcatt gggctgggct 1740 gctgccgtgg tgatgggcta tttctgcgct ggtggtagtg ccatctcagg tgctcatttg 1800 aatccgtcta ttacattagc caatttggtg tatagaggtt ttcccctgaa gaaagttcct 1860 tattactttg ctggacaatt gatcggtgcc ttcacaggcg ctttgatctt gtttatttgg 1920 tacaaaaggg tgttacaaga ggcatatagc gattggtgga tgaatgaaag tgttgcggga 1980 atgttttgcg tttttccaaa gccttatcta agttcaggac ggcaattttt ttccgaattt 2040 ttatgtggag ctatgttaca agcaggaaca tttgcgctga ccgatcctta tacgtgtttg 2100 tcctctgatg ttttcccatt gatgatgttt attttgattt tcattatcaa tgcttccatg 2160 gcttatcaga caggtacagc aatgaatttg gctcgtgatc tgggcccacg tcttgcacta 2220 tatgcagttg gatttgatca taaaatgctt tgggtgcatc atcatcattt cttttgggtt 2280 cccatggtag gcccatttat tggtgcgtta atgggggggt tggtttacga tgtctgtatt 2340 tatcagggtc atgaatctcc agtcaactgg tctttaccag tttataagga aatgattatg 2400 agagcctggt ttagaaggcc tggttggaag aagagaaata gagcaagaag aacatcggac 2460 ctgagtgact tctcatacaa taacgatgat gatgaggaat ttggagaaag aatggctctt 2520 caaaagacaa agaccaagtc atctatttca gacaacgaaa atgaagcagg agaaaagaaa 2580 gtgcaattta aatctgttca gcgcggcaaa agaacgtttg gtggtatacc aacaattctt 2640 gaagaagaag attccattga aactgcttcg ctaggtgcga cgacgactga ttctattggg 2700 ttatccgaca catcatcaga agattcgcat tatggtaatg ctaagaaggt aacatgagga 2760 tccccttttc ctttgtcgat atcatgtaat tagttatgtc acgcttacat tcacgccctc 2820 ctcccacatc cgctctaacc gaaaaggaag gagttagaca acctgaagtc taggtcccta 2880 tttatttttt ttaatagtta tgttagtatt aagaacgtta tttatatttc aaatttttct 2940 tttttttctg tacaaacgcg tgtacgcatg taacattata ctgaaaacct tgcttgagaa 3000 ggttttggga cgctcgaagg cttcctaggc tcgagtt 3037 <210> 25 <211> 552 <212> PRT <213> Citrobacter freundii <400> 25 Met Ser Gln Phe Phe Phe Asn Gln Arg Thr His Leu Val Ser Asp Val 1 5 10 15 Ile Asp Gly Thr Ile Ile Ala Ser Pro Trp Asn Asn Leu Ala Arg Leu 20 25 30 Glu Ser Asp Pro Ala Ile Arg Ile Val Val Arg Arg Asp Leu Asn Lys 35 40 45 Asn Asn Val Ala Val Ile Ser Gly Gly Gly Ser Gly His Glu Pro Ala 50 55 60 His Val Gly Phe Ile Gly Lys Gly Met Leu Thr Ala Ala Val Cys Gly 65 70 75 80 Asp Val Phe Ala Ser Pro Ser Val Asp Ala Val Leu Thr Ala Ile Gln 85 90 95 Ala Val Thr Gly Glu Ala Gly Cys Leu Leu Ile Val Lys Asn Tyr Thr 100 105 110 Gly Asp Arg Leu Asn Phe Gly Leu Ala Ala Glu Lys Ala Arg Arg Leu 115 120 125 Gly Tyr Asn Val Glu Met Leu Ile Val Gly Asp Asp Ile Ser Leu Pro 130 135 140 Asp Asn Lys His Pro Arg Gly Ile Ala Gly Thr Ile Leu Val His Lys 145 150 155 160 Ile Ala Gly Tyr Phe Ala Glu Arg Gly Tyr Asn Leu Ala Thr Val Leu 165 170 175 Arg Glu Ala Gln Tyr Ala Ala Asn Asn Thr Phe Ser Leu Gly Val Ala 180 185 190 Leu Ser Ser Cys His Leu Pro Gln Glu Ala Asp Ala Ala Pro Arg His 195 200 205 His Pro Gly His Ala Glu Leu Gly Met Gly Ile His Gly Glu Pro Gly 210 215 220 Ala Ser Val Ile Asp Thr Gln Asn Ser Ala Gln Val Val Asn Leu Met 225 230 235 240 Val Asp Lys Leu Met Ala Ala Leu Pro Glu Thr Gly Arg Leu Ala Val 245 250 255 Met Ile Asn Asn Leu Gly Gly Val Ser Val Ala Glu Met Ala Ile Ile 260 265 270 Thr Arg Glu Leu Ala Ser Ser Pro Leu His Pro Arg Ile Asp Trp Leu 275 280 285 Ile Gly Pro Ala Ser Leu Val Thr Ala Leu Asp Met Lys Ser Phe Ser 290 295 300 Leu Thr Ala Ile Val Leu Glu Glu Ser Ile Glu Lys Ala Leu Leu Thr 305 310 315 320 Glu Val Glu Thr Ser Asn Trp Pro Thr Pro Val Pro Pro Arg Glu Ile 325 330 335 Ser Cys Val Pro Ser Ser Gln Arg Ser Ala Arg Val Glu Phe Gln Pro 340 345 350 Ser Ala Asn Ala Met Val Ala Gly Ile Val Glu Leu Val Thr Thr Thr 355 360 365 Leu Ser Asp Leu Glu Thr His Leu Asn Ala Leu Asp Ala Lys Val Gly 370 375 380 Asp Gly Asp Thr Gly Ser Thr Phe Ala Ala Gly Ala Arg Glu Ile Ala 385 390 395 400 Ser Leu Leu His Arg Gln Gln Leu Pro Leu Asp Asn Leu Ala Thr Leu 405 410 415 Phe Ala Leu Ile Gly Glu Arg Leu Thr Val Val Met Gly Gly Ser Ser 420 425 430 Gly Val Leu Met Ser Ile Phe Phe Thr Ala Ala Gly Gln Lys Leu Glu 435 440 445 Gln Gly Ala Ser Val Ala Glu Ser Leu Asn Thr Gly Leu Ala Gln Met 450 455 460 Lys Phe Tyr Gly Gly Ala Asp Glu Gly Asp Arg Thr Met Ile Asp Ala 465 470 475 480 Leu Gln Pro Ala Leu Thr Ser Leu Leu Thr Gln Pro Gln Asn Leu Gln 485 490 495 Ala Ala Phe Asp Ala Ala Gln Ala Gly Ala Glu Arg Thr Cys Leu Ser 500 505 510 Ser Lys Ala Asn Ala Gly Arg Ala Ser Tyr Leu Ser Ser Glu Ser Leu 515 520 525 Leu Gly Asn Met Asp Pro Gly Ala His Ala Val Ala Met Val Phe Lys 530 535 540 Ala Leu Ala Glu Ser Glu Leu Gly 545 550 <210> 26 <211> 1678 <212> DNA <213> Artificial <220> <223> nucleotide sequence encoding the C. freundii dhaK codon-optimised for yeast <400> 26 tctagaaaaa tgtctcaatt cttcttcaac cagagaaccc acttggtttc tgacgttatc 60 gacggtgcta tcatcgcttc accatggaac aatttggcta gattggaatc tgacccagct 120 atcagaatcg ttgttagaag agacttgaac aagaacaacg ttgctgttat ctctggtggt 180 ggttctggtc acgaaccagc tcacgttggt ttcatcggta agggtatgtt gaccgctgct 240 gtttgtggtg acgttttcgc ttctccatct gttgacgctg ttttgactgc tatccaagct 300 gttaccggtg aagctggttg tttgttgatc gttaagaact acaccggtga cagattgaac 360 ttcggtttgg ctgctgaaaa ggctagaaga ttgggttaca acgttgaaat gttgatcgtt 420 ggtgacgaca tctctttgcc agacaacaag cacccaagag gtatcgctgg taccatcttg 480 gttcacaaga tcgctggtta cttcgctgaa agaggttaca acttagctac cgttttgaga 540 gaagctcaat acgctgcttc taacaccttc tctttgggtg ttgctttgtc ttcttgtcac 600 ttgccacaag aaaccgacgc tgctccaaga caccacccag gtcacgctga attgggtatg 660 ggtatccacg gtgaaccagg tgcttctgtt atcgacaccc aaaactctgc tcaagttgtt 720 aacttgatgg ttgacaagtt gttggctgct ttgccagaaa ccggtagatt ggctgttatg 780 atcaacaact tgggtggtgt ttctgttgct gaaatggcta tcatcaccag agaattggct 840 tcttctccat tgcactcaag aatcgactgg ttgatcggtc cagcttcttt ggtaaccgct 900 ttggacatga agggtttctc tttgaccgct atcgttttgg aagaatctat cgaaaaggct 960 ttgttgaccg aagttgaaac ctctaactgg ccaaccccag ttccaccaag agaaatcacc 1020 tgtgttgttt cttctcacgc ttctgctaga gttgaattcc aaccatctgc taacgctttg 1080 gttgctggta tcgttgaatt ggttaccgct accttgtctg acttggaaac ccacttgaac 1140 gctttggacg ctaaggttgg tgacggtgac accggttcta ccttcgctgc tgctgctaga 1200 gaaatcgctt ctttgttgca cagacaacaa ttgccattga acaacttggc taccttgttc 1260 gctttgatcg gtgaaagatt gaccgttgtt atgggtggtt cttctggtgt tttgatgtct 1320 atcttcttca ccgctgctgg tcaaaagttg gaacaaggtg ctaacgttgt tgaagctttg 1380 aacaccggtt tggctcaaat gaagttctac ggtggtgctg acgaaggtga cagaaccatg 1440 atcgacgctt tgcaaccagc tttgacctct ttgttggctc aaccaaagaa cttgcaagct 1500 gctttcgacg ctgctcaagc tggtgctgaa agaacctgtt tgtcttctaa ggctaacgct 1560 ggtagagctt cttacttgtc ttctgaatct ttgttgggta acatggaccc aggtgctcaa 1620 agattggcta tggttttcaa ggctttggct gaatctgaat tgggttaata aggtcgac 1678 <210> 27 <211> 2951 <212> DNA <213> Artificial <220> <223> pRNdhaK <400> 27 ggatccacta gtaacggccg ccagtgtgct ggaattcgcc cttctcgagc ttaagacgcg 60 tttcttcttc agattccctc atggagaaag tgcggcagat gtatatgaca gagtcgccag 120 tttccaagag actttattca ggcacttcca tgataggcaa gagagaagac ccagagatgt 180 tgttgtccta gttacacatg gtatttattc cagagtattc ctgatgaaat ggtttagatg 240 gacatacgaa gagtttgaat cgtttaccaa tgttcctaac gggagcgtaa tggtgatgga 300 actggacgaa tccatcaata gatacgtcct gaggaccgtg ctacccaaat ggactgattg 360 tgagggagac ctaactacat agtgtttaaa gattacggat atttaactta cttagaataa 420 tgccattttt ttgagttata ataatcctac gttagtgtga gcgggattta aactgtgagg 480 accttaatac attcagacac ttctgcggta tcaccctact tattcccttc gagattatat 540 ctaggaaccc atcaggttgg tggaagatta cccgttctaa gacttttcag cttcctctat 600 tgatgttaca cctggacacc ccttttctgg catccagttt ttaatcttca gtggcatgtg 660 agattctccg aaattaatta aagcaatcac acaattctct cggataccac ctcggttgaa 720 actgacaggt ggtttgttac gcatgctaat gcaaaggagc ctatatacct ttggctcggc 780 tgctgtaaca gggaatataa agggcagcat aatttaggag tttagtgaac ttgcaacatt 840 tactattttc ccttcttacg taaatatttt tctttttaat tctaaatcaa tctttttcaa 900 ttttttgttt gtattctttt cttgcttaaa tctataacta caaaaaacac atacataaat 960 ctagaaaaat gtctcaattc ttcttcaacc agagaaccca cttggtttct gacgttatcg 1020 acggtgctat catcgcttca ccatggaaca atttggctag attggaatct gacccagcta 1080 tcagaatcgt tgttagaaga gacttgaaca agaacaacgt tgctgttatc tctggtggtg 1140 gttctggtca cgaaccagct cacgttggtt tcatcggtaa gggtatgttg accgctgctg 1200 tttgtggtga cgttttcgct tctccatctg ttgacgctgt tttgactgct atccaagctg 1260 ttaccggtga agctggttgt ttgttgatcg ttaagaacta caccggtgac agattgaact 1320 tcggtttggc tgctgaaaag gctagaagat tgggttacaa cgttgaaatg ttgatcgttg 1380 gtgacgacat ctctttgcca gacaacaagc acccaagagg tatcgctggt accatcttgg 1440 ttcacaagat cgctggttac ttcgctgaaa gaggttacaa cttagctacc gttttgagag 1500 aagctcaata cgctgcttct aacaccttct ctttgggtgt tgctttgtct tcttgtcact 1560 tgccacaaga aaccgacgct gctccaagac accacccagg tcacgctgaa ttgggtatgg 1620 gtatccacgg tgaaccaggt gcttctgtta tcgacaccca aaactctgct caagttgtta 1680 acttgatggt tgacaagttg ttggctgctt tgccagaaac cggtagattg gctgttatga 1740 tcaacaactt gggtggtgtt tctgttgctg aaatggctat catcaccaga gaattggctt 1800 cttctccatt gcactcaaga atcgactggt tgatcggtcc agcttctttg gtaaccgctt 1860 tggacatgaa gggtttctct ttgaccgcta tcgttttgga agaatctatc gaaaaggctt 1920 tgttgaccga agttgaaacc tctaactggc caaccccagt tccaccaaga gaaatcacct 1980 gtgttgtttc ttctcacgct tctgctagag ttgaattcca accatctgct aacgctttgg 2040 ttgctggtat cgttgaattg gttaccgcta ccttgtctga cttggaaacc cacttgaacg 2100 ctttggacgc taaggttggt gacggtgaca ccggttctac cttcgctgct gctgctagag 2160 aaatcgcttc tttgttgcac agacaacaat tgccattgaa caacttggct accttgttcg 2220 ctttgatcgg tgaaagattg accgttgtta tgggtggttc ttctggtgtt ttgatgtcta 2280 tcttcttcac cgctgctggt caaaagttgg aacaaggtgc taacgttgtt gaagctttga 2340 acaccggttt ggctcaaatg aagttctacg gtggtgctga cgaaggtgac agaaccatga 2400 tcgacgcttt gcaaccagct ttgacctctt tgttggctca accaaagaac ttgcaagctg 2460 ctttcgacgc tgctcaagct ggtgctgaaa gaacctgttt gtcttctaag gctaacgctg 2520 gtagagcttc ttacttgtct tctgaatctt tgttgggtaa catggaccca ggtgctcaaa 2580 gattggctat ggttttcaag gctttggctg aatctgaatt gggttaataa ggtcgagaca 2640 aatcgctctt aaatatatac ctaaagaaca ttaaagctat attataagca aagatacgta 2700 aattttgctt atattattat acacatatca tatttctata tttttaagat ttggttatat 2760 aatgtacgta atgcaaagga aataaatttt atacattatt gaacagcgtc caagtaacta 2820 cattatgtgc actaatagtt tagcgtcgtg aagactttat tgtgtcgcga aaagtaaaaa 2880 ttttaaaaat tagagcacct tgaacttgcg aaaaaggttc tcatcaactg tttaaaacgt 2940 acgaagctta a 2951 <210> 28 <211> 1949 <212> DNA <213> Artificial <220> <223> pRNgldA <400> 28 actagtaaat gtgtggggaa gcgggtaagc tgccacagca attaatgcac aacatttaac 60 ctacattctt ccttatcgga tcctcaaaac ccttaaaaac atatgcctca ccctaacata 120 ttttccaatt aaccctcaat atttctctgt cacccggcct ctattttcca ttttcttctt 180 tacccgccac gcgttttttt ctttcaaatt tttttcttcc ttcttctttt tcttccacgt 240 cctcttgcat aaataaataa accgttttga aaccaaactc gcctctctct ctcctttttg 300 aaatattttt gggtttgttt gatcctttcc ttcccaatct ctcttgttta atatatattc 360 atttatatca cgctctcttt ttatcttcct ttttttcctc tctcttgtat tcttccttcc 420 cctttctact caaaccaaga agaaaaagaa aaggtcaatc tttgttaaag aataggatct 480 tctactacat cagcttttag atttttcacg cttactgctt ttttcttccc aagatcgaaa 540 atttactgaa ttaactgcag aaaatggaca gaatcatcca atctccaggt aagtacatcc 600 aaggtgctga cgttatcaac agattgggtg aatacttgaa gccattggct gaaagatggt 660 tggttgttgg tgacaagttc gttttgggtt tcgctcaatc taccgttgaa aagtctttca 720 aggacgctgg tttggttgtt gaaatcgctc cattcggtgg tgaatgttct caaaacgaaa 780 tcgacagatt gagaggtatc gctgaaaccg ctcaatgtgg tgctatcttg ggtatcggtg 840 gtggtaagac cttggacacc gctaaggctt tggctcactt catgggtgtt ccagttgcta 900 tcgctccaac catcgcttct accgacgctc catgttctgc tttgtctgtt atctacaccg 960 acgaaggtga attcgacaga tacttgttgt tgccaaacaa cccaaacatg gttatcgttg 1020 acaccaagat cgttgctggt gctccagcta gattgttggc agctggtatc ggtgacgctt 1080 tggctacctg gttcgaagct agagcttgtt ctagatctgg tgctaccacc atggctggtg 1140 gtaagtgtac ccaagctgct ttggctttgg ctgaattgtg ttacaacacc ttgttggaag 1200 aaggtgaaaa ggctatgttg gctgctgaac aacacgttgt taccccagct ttggaaagag 1260 ttatcgaagc taacacctac ttgtctggtg ttggtttcga atctggtggt ttggctgctg 1320 ctcacgctgt tcacaacggt ttgaccgcta tcccagacgc tcaccactac taccacggtg 1380 aaaaggttgc tttcggtacc ttgacccaat tggttttgga aaacgctcca gttgaagaaa 1440 tcgaaaccgt tgctgctttg tctcacgctg ttggtttgcc aatcaccttg gctcaattgg 1500 acatcaagga agacgttcca gctaagatga gaatcgttgc tgaagctgct tgtgctgaag 1560 gtgaaaccat ccacaacatg ccaggtggtg ctaccccaga ccaagtttac gctgctttgt 1620 tggttgctga ccaatacggt caaagattcc tacaagaatg ggaataaggc gcgccccttt 1680 tcctttgtcg atatcatgta attagttatg tcacgcttac attcacgccc tcctcccaca 1740 tccgctctaa ccgaaaagga aggagttaga caacctgaag tctaggtccc tatttatttt 1800 ttttaatagt tatgttagta ttaagaacgt tatttatatt tcaaattttt cttttttttc 1860 tgtacaaacg cgtgtacgca tgtaacatta tactgaaaac cttgcttgag aaggttttgg 1920 gacgctcgaa ggcttcctag gcgtacgtt 1949 <210> 29 <211> 7690 <212> DNA <213> Artificial <220> <223> pRN558 <400> 29 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accataattc cgttttaaga gcttggtgag cgctaggagt cactgccagg tatcgtttga 240 acacggcatt agtcagggaa gtcataacac agtcctttcc cgcaattttc tttttctatt 300 actcttggcc tcctctagta cactctatat ttttttatgc ctcggtaatg attttcattt 360 ttttttttcc acctagcgga tgactctttt tttttcttag cgattggcat tatcacataa 420 tgaattatac attatataaa gtaatgtgat ttcttcgaag aatatactaa aaaatgagca 480 ggcaagataa acgaaggcaa agatgacaga gcagaaagcc ctagtaaagc gtattacaaa 540 tgaaaccaag attcagattg cgatctcttt aaagggtggt cccctagcga tagagcactc 600 gatcttccca gaaaaagagg cagaagcagt agcagaacag gccacacaat cgcaagtgat 660 taacgtccac acaggtatag ggtttctgga ccatatgata catgctctgg ccaagcattc 720 cggctggtcg ctaatcgttg agtgcattgg tgacttacac atagacgacc atcacaccac 780 tgaagactgc gggattgctc tcggtcaagc ttttaaagag gccctactgg cgcgtggagt 840 aaaaaggttt ggatcaggat ttgcgccttt ggatgaggca ctttccagag cggtggtaga 900 tctttcgaac aggccgtacg cagttgtcga acttggtttg caaagggaga aagtaggaga 960 tctctcttgc gagatgatcc cgcattttct tgaaagcttt gcagaggcta gcagaattac 1020 cctccacgtt gattgtctgc gaggcaagaa tgatcatcac cgtagtgaga gtgcgttcaa 1080 ggctcttgcg gttgccataa gagaagccac ctcgcccaat ggtaccaacg atgttccctc 1140 caccaaaggt gttcttatgt agtgacaccg attatttaaa gctgcagcat acgatatata 1200 tacatgtgta tatatgtata cctatgaatg tcagtaagta tgtatacgaa cagtatgata 1260 ctgaagatga caaggtaatg catcattcta tacgtgtcat tctgaacgag gcgcgctttc 1320 cttttttctt tttgcttttt cttttttttt ctcttgaact cgacggatca tatgcggtgt 1380 gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggaaattgta aacgttaata 1440 ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg 1500 aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc 1560 cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa 1620 ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt 1680 cgaggtgccg taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac 1740 ggggaaagcc ggcattgcga ataccgcttc cacaaacatt gctcaaaagt atctctttgc 1800 tatatatctc tgtgctatat ccctatataa cctacccatc cacctttcgc tccttgaact 1860 tgcatctaaa ctcgacctct acatttttta tgtttatctc tagtattact ctttagacaa 1920 aaaaattgta gtaagaacta ttcatagagt gaatcgaaaa caatacgaaa atgtaaacat 1980 ttcctatacg tagtatatag agacaaaata gaagaaaccg ttcataattt tctgaccaat 2040 gaagaatcat caacgctatc actttctgtt cacaaagtat gcgcaatcca catcggtata 2100 gaatataatc ggggatgcct ttatcttgaa aaaatgcacc cgcagcttcg ctagtaatca 2160 gtaaacgcgg gaagtggagt caggcttttt ttatggaaga gaaaatagac accaaagtag 2220 ccttcttcta accttaacgg acctacagtg caaaaagtta tcaagagact gcattataga 2280 gcgcacaaag gagaaaaaaa gtaatctaag atgctttgtt agaaaaatag cgctctcggg 2340 atgcattttt gtagaacaaa aaagaagtat agattctttg ttggtaaaat agcgctctcg 2400 cgttgcattt ctgttctgta aaaatgcagc tcagattctt tgtttgaaaa attagcgctc 2460 tcgtcgcgtt gcatttttgt tttacaaaaa tgaagcacag attcttcgtt ggtaaaatag 2520 cgctttcgcg ttgcatttct gttctgtaaa aatgcagctc agattctttg tttgaaaaat 2580 tagcgctctc gcgttgcatt tttgttctac aaaatgaagc acagatgctt cgttaacaaa 2640 gatatgctat tgaagtgcaa gatggaaacg cagaaaatga accggggatg cgacgtgcaa 2700 gattacctat gcaatagatg caatagtttc tccaggaacc gaaatacata cattgtcttc 2760 cgtaaagcgc tagactatat attattatac aggttcaaat atactatctg tttcagggaa 2820 aactcccagg ttcggatgtt caaaattcaa tgatgggtaa caagtacgat cgtaaatctg 2880 taaaacagtt tgtcggatat taggctgtat ctcctcaaag cgtattcgaa tatcattgag 2940 aagctgcagc gtcacatcgg ataataatga tggcagccat tgtagaagtg ccttttgcat 3000 ttctagtctc tttctcggtc tagctagttt tactacatcg cgaagataga atcttagatc 3060 acactgcctt tgctgagctg gatcaataga gtaacaaaag agtggtaagg cctcgttaaa 3120 ggacaaggac ctgagcggaa gtgtatcgta cagtagacgg agtatctagt atagtctata 3180 gtccgtggaa ttaattctca tctttgacag cttatcatcg ataatccgga gctagcatgc 3240 ggccgccagt gtgatggata tctgcagaat tcgccctttt aagcttcgta cgtgtggaag 3300 aacgattaca acaggtgttg tcctctgagg acataaaata cacaccgaga ttcatcaact 3360 cattgctgga gttagcatat ctacaattgg gtgaaatggg gagcgatttg caggcatttg 3420 ctcggcatgc cggtagaggt gtggtcaata agagcgacct catgctatac ctgagaaagc 3480 aacctgacct acaggaaaga gttactcaag aataagaatt ttcgttttaa aacctaagag 3540 tcactttaaa atttgtatac acttattttt tttataactt atttaataat aaaaatcata 3600 aatcataaga aattcgcgcg cttaagcagc ttcaccagcc tttctagcca aagattgagc 3660 catcttttca gcggtagcca aagcagaaga ggtcataatg tccaagttac cagcgtaagc 3720 tggcaagtag tgagcagcac cttcaacttc caaccaaaca gcggtcttca aaccagagaa 3780 ttgaccaaca cctggcaagt taactggctt gtcttgtggg ataacttcga attgaactct 3840 ttgcttcaat ctgtaacctg gaacgtatgc ttgaacagct tcagccattt cgttgattga 3900 agcttcgatg tcgtcttgag atgcttcgtc agacaaaacg taaacggtgt ctctcatcat 3960 caatggtggt tcagctgggt tcaaaacgat gatagcctta cccttagcag caccaccaac 4020 aacttcgata gccctagagg tggtttcggt gaattcgtcg atgttagctc tggtacctgg 4080 accagcagac ttagaagcga tagaagcgat gatttcagcg tagtgaactc tagcaactct 4140 tgaaacagca gcaaccattg ggatggtagc ttgaccacca caggtaacca tgttaacgtt 4200 taattggtca acgttagctt ccaagttaac aactggaaca cagtatggac cgatagcagc 4260 tggggtcaag tcgatcaatc tgatgtctgg cttagcttct ctcaaagcag cgtcgttctt 4320 aacgtgagca ccagcagagg tagcgtcgaa aacgatgtcg atgtcagcga attctggcat 4380 gttcatcaaa ccgataacac cttcgtgggt ggtagcaaca cccattcttc tagctctagc 4440 caaaccgtca gattgtgggt cgataccaac cataacagcc atttccaagt gttgaccgtg 4500 tcttaggatc ttgatcatca agtcagtacc gatgttacca gaaccgatga tagcaacctt 4560 tctcttagac atctgcagtc tagatatatt tgttgtaaaa agtagataat tacttccttg 4620 atgatctgta aaaaagagaa aaagaaagca tctaagaact tgaaaaacta cgaattagaa 4680 aagaccaaat atgtatttct tgcattgacc aatttatgca agtttatata tatgtaaatg 4740 taagtttcac gaggttctac taaactaaac cacccccttg gttagaagaa aagagtgtgt 4800 gagaacaggc tgttgttgtc acacgattcg gacaattctg tttgaaagag agagagtaac 4860 agtacgatcg aacgaacttt gctctggaga tcacagtggg catcatagca tgtggtacta 4920 aaccctttcc cgccattcca gaaccttcga ttgcttgtta caaaacctgt gagccgtcgc 4980 taggaccttg ttgtgtgacg aaattggaag ctgcaatcaa taggaagaca ggaagtcgag 5040 cgtgtctggg ttttttcagt tttgttcttt ttgcaaacaa atcacgagcg acggtaattt 5100 ctttctcgat aagaggccac gtgctttatg agggtaacat caattcaaga aggagggaaa 5160 cacttccttt ttctggccct gataatagta tgagggtgaa gccaaaataa aggattcgcg 5220 cccaaatcgg catctttaaa tgcaggtatg cgatagttcc tcactctttc cttactcacg 5280 agtaattctt gcaaatgcct attatgcaga tgttataata tctgtgcgtc ttgagttgaa 5340 gagctcgaga ctagtggatc ccccgggctg caggaattcg atatcaagct tatcgatacc 5400 gtcgacctcg agggggggcc cggtacccag cttttgttcc ctttagtgag ggttaattcc 5460 gagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 5520 tccacacaac ataggagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 5580 gtaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 5640 ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 5700 ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 5760 agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 5820 catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 5880 tttccatagg ctcggccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 5940 gcgaaacccg acaggactat aaagatacca ggcgttcccc cctggaagct ccctcgtgcg 6000 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 6060 cgtggcgctt tctcaatgct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 6120 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 6180 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 6240 taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 6300 taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac 6360 cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 6420 tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 6480 gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 6540 catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 6600 atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga 6660 ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac tgcccgtcgt 6720 gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg 6780 agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga 6840 gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga 6900 agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg 6960 catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc 7020 aaggcgagtt acatgatccc ccatgttgtg aaaaaaagcg gttagctcct tcggtcctcc 7080 gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca 7140 taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac 7200 caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg 7260 ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc 7320 ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg 7380 tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac 7440 aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat 7500 actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata 7560 catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa 7620 agtgccacct gacgtcttat tatcatgaca ttaacctata aaaataggcg tatcacgagg 7680 ccctttcgtc 7690 <210> 30 <211> 9416 <212> DNA <213> Artificial <220> <223> pRN595 <400> 30 gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataagacgtc 60 aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 120 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 180 aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 240 ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 300 gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 360 ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 420 ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 480 gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 540 aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 600 gacaacgatc ggaggaccga aggagctaac cgcttttttt cacaacatgg gggatcatgt 660 aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 720 caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 780 tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 840 acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 900 gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 960 agttatctac acgacgggca gtcaggcaac tatggatgaa cgaaatagac agatcgctga 1020 gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 1080 ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 1140 taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 1200 agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 1260 aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 1320 ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta 1380 gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 1440 aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 1500 aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 1560 gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agcattgaga 1620 aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 1680 aacaggagag cgcacgaggg agcttccagg ggggaacgcc tggtatcttt atagtcctgt 1740 cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggccgag 1800 cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 1860 tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 1920 tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 1980 ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 2040 atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 2100 tgtgagttac ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcctat 2160 gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2220 cgccaagctc ggaattaacc ctcactaaag ggaacaaaag ctgggtaccg ggccccccct 2280 cgaggtcgac ggtatcgata agcttgatat cgaattcctg cagcccgggg gatccactag 2340 tctcgagctc ttcaactcaa gacgcacaga tattataaca tctgcataat aggcatttgc 2400 aagaattact cgtgagtaag gaaagagtga ggaactatcg catacctgca tttaaagatg 2460 ccgatttggg cgcgaatcct ttattttggc ttcaccctca tactattatc agggccagaa 2520 aaaggaagtg tttccctcct tcttgaattg atgttaccct cataaagcac gtggcctctt 2580 atcgagaaag aaattaccgt cgctcgtgat ttgtttgcaa aaagaacaaa actgaaaaaa 2640 cccagacacg ctcgacttcc tgtcttccta ttgattgcag cttccaattt cgtcacacaa 2700 caaggtccta gcgacggctc acaggttttg taacaagcaa tcgaaggttc tggaatggcg 2760 ggaaagggtt tagtaccaca tgctatgatg cccactgtga tctccagagc aaagttcgtt 2820 cgatcgtact gttactctct ctctttcaaa cagaattgtc cgaatcgtgt gacaacaaca 2880 gcctgttctc acacactctt ttcttctaac caagggggtg gtttagttta gtagaacctc 2940 gtgaaactta catttacata tatataaact tgcataaatt ggtcaatgca agaaatacat 3000 atttggtctt ttctaattcg tagtttttca agttcttaga tgctttcttt ttctcttttt 3060 tacagatcat caaggaagta attatctact ttttacaaca aatatatcta gaaaatggct 3120 gttaccaacg ttgctgaatt gaacgctttg gttgaaaggg ttaagaaggc tcaaagagaa 3180 tacgcttctt tcacccaaga acaagttgac aagatcttca gagctgctgc tttggctgct 3240 gctgacgcta gaatcccatt ggctaagatg gctgttgctg aatctggtat gggtatcgtt 3300 gaagacaagg ttatcaagaa ccacttcgct tctgaataca tctacaacgc ttacaaggac 3360 gaaaagacct gtggtgtttt gtcagaagac gacaccttcg gtaccatcac catcgctgaa 3420 ccaatcggta tcatctgtgg tatcgttcca accaccaacc caacctctac cgctatcttc 3480 aagtctttga tctctttgaa gaccagaaac gctatcatct tctctccaca cccaagagct 3540 aaagacgcta ccaacaaggc tgctgacatc gttttgcaag ctgctatcgc tgctggtgct 3600 ccaaaggact tgatcggttg gatcgaccaa ccatctgttg aattgtctaa cgctttgatg 3660 caccacccag acatcaactt gatcttggct accggtggtc caggtatggt taaggctgct 3720 tactcttctg gtaagccagc tatcggtgtt ggtgctggta acaccccagt tgttatcgac 3780 gaaaccgctg acatcaagag agctgttgct tctgttttga tgtctaagac cttcgacaac 3840 ggtgttatct gtgcttctga acaatctgtt gttgttgttg actctgttta cgacgctgtt 3900 agagaaagat tcgctaccca cggtggttac ttgttgcaag gtaaggaatt gaaggctgtt 3960 caagacgtta tcttgaagaa cggtgctttg aacgctgcta tcgttggtca accagcttac 4020 aagatcgctg aattagctgg tttctctgtt ccagaaaaca ccaagatctt gatcggtgaa 4080 gttaccgttg ttgacgaatc tgaaccattc gctcacgaaa agttgtctcc aaccttggct 4140 atgtacagag ctaaggactt cgaagacgct gttgaaaaag ctgaaaagtt ggttgctatg 4200 ggtggtattg gtcacacctc ttgtttgtac accgaccaag acaaccaacc agctagagtt 4260 tcttacttcg gtcaaaagat gaagaccgct agaatcttga tcaacacccc agcttctcaa 4320 ggtggtatcg gtgacttgta caacttcaag ttggctccat ctttgacctt gggttgtggt 4380 tcttggggtg gtaactctat ctctgaaaac gttggtccaa agcacttgat caacaagaag 4440 accgttgcta agagagctga aaacatgttg tggcacaagt tgccaaaatc tatctacttc 4500 agaagaggtt ctttgccaat cgctttggac gaagttatca ccgacggtca caagagagct 4560 ttgatcgtta ccgacagatt cttgttcaac aacggttacg ctgaccaaat cacctctgtt 4620 ttgaaggctg ctggtgttga aaccgaagtt ttcttcgaag ttgaagctga cccaaccttg 4680 tctatcgtta gaaagggtgc tgaattggct aactctttca agccagacgt tatcatcgct 4740 ttgggtggtg gttctccaat ggacgctgct aagatcatgt gggttatgta cgaacaccca 4800 gaaacccact tcgaagaatt ggctttgaga ttcatggaca tcagaaagag aatctacaag 4860 ttcccaaaga tgggtgttaa ggctaagatg atcgctgtta ccaccacctc tggtaccggt 4920 tctgaagtta ccccattcgc tgttgttacc gacgacgcta ccggtcaaaa gtacccattg 4980 gctgactacg ctttgacccc agacatggct atcgttgacg ctaacttggt tatggacatg 5040 ccaaagtctt tgtgtgcttt cggtggtttg gacgctgtta cccacgctat ggaagcttac 5100 gtttctgttt tggcttctga attctctgac ggtcaagctt tgcaagcttt gaagttgttg 5160 aaggaatact tgccagcttc ttaccacgaa ggttctaaga acccagttgc tagagaaaga 5220 gttcactctg ctgctaccat cgctggtatc gctttcgcta acgctttctt gggtgtttgt 5280 cactctatgg ctcacaagtt gggttctcaa ttccacatcc cacacggttt ggctaacgct 5340 ttgttgatct gtaacgttat cagatacaac gctaacgaca acccaaccaa gcaaaccgct 5400 ttctctcaat acgacagacc acaagctaga agaagatacg ctgaaatcgc tgaccacttg 5460 ggtttgtctg ctccaggtga cagaaccgct gcaaagatcg aaaagttgtt ggcttggttg 5520 gaaaccttga aggctgaatt gggtatccca aagtctatca gagaagctgg tgttcaagaa 5580 gctgacttct tggctaacgt tgacaagttg tctgaagacg ctttcgacga ccaatgtacc 5640 ggtgctaacc caagataccc attgatctct gaattgaagc aaatcttgtt ggacacctac 5700 tacggtagag actacgttga aggtgaaacc gctgctaaga aggaagctgc tccagctaag 5760 gctgaaaaga aggctaagaa gtctgcttag cttaagcgcg cgaatttctt atgatttatg 5820 atttttatta ttaaataagt tataaaaaaa ataagtgtat acaaatttta aagtgactct 5880 taggttttaa aacgaaaatt cttattcttg agtaactctt tcctgtaggt caggttgctt 5940 tctcaggtat agcatgaggt cgctcttatt gaccacacct ctaccggcat gccgagcaaa 6000 tgcctgcaaa tcgctcccca tttcacccaa ttgtagatat gctaactcca gcaatgagtt 6060 gatgaatctc ggtgtgtatt ttatgtcctc agaggacaac acctgttgta atcgttcttc 6120 cacacgtacg aagcttaaaa gggcgaattc tgcagatatc catcacactg gcggccgcat 6180 gctagctccg gattatcgat gataagctgt caaagatgag aattaattcc acggactata 6240 gactatacta gatactccgt ctactgtacg atacacttcc gctcaggtcc ttgtccttta 6300 acgaggcctt accactcttt tgttactcta ttgatccagc tcagcaaagg cagtgtgatc 6360 taagattcta tcttcgcgat gtagtaaaac tagctagacc gagaaagaga ctagaaatgc 6420 aaaaggcact tctacaatgg ctgccatcat tattatccga tgtgacgctg cagcttctca 6480 atgatattcg aatacgcttt gaggagatac agcctaatat ccgacaaact gttttacaga 6540 tttacgatcg tacttgttac ccatcattga attttgaaca tccgaacctg ggagttttcc 6600 ctgaaacaga tagtatattt gaacctgtat aataatatat agtctagcgc tttacggaag 6660 acaatgtatg tatttcggtt cctggagaaa ctattgcatc tattgcatag gtaatcttgc 6720 acgtcgcatc cccggttcat tttctgcgtt tccatcttgc acttcaatag catatctttg 6780 ttaacgaagc atctgtgctt cattttgtag aacaaaaatg caacgcgaga gcgctaattt 6840 ttcaaacaaa gaatctgagc tgcattttta cagaacagaa atgcaacgcg aaagcgctat 6900 tttaccaacg aagaatctgt gcttcatttt tgtaaaacaa aaatgcaacg cgacgagagc 6960 gctaattttt caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgag 7020 agcgctattt taccaacaaa gaatctatac ttcttttttg ttctacaaaa atgcatcccg 7080 agagcgctat ttttctaaca aagcatctta gattactttt tttctccttt gtgcgctcta 7140 taatgcagtc tcttgataac tttttgcact gtaggtccgt taaggttaga agaaggctac 7200 tttggtgtct attttctctt ccataaaaaa agcctgactc cacttcccgc gtttactgat 7260 tactagcgaa gctgcgggtg cattttttca agataaaggc atccccgatt atattctata 7320 ccgatgtgga ttgcgcatac tttgtgaaca gaaagtgata gcgttgatga ttcttcattg 7380 gtcagaaaat tatgaacggt ttcttctatt ttgtctctat atactacgta taggaaatgt 7440 ttacattttc gtattgtttt cgattcactc tatgaatagt tcttactaca atttttttgt 7500 ctaaagagta atactagaga taaacataaa aaatgtagag gtcgagttta gatgcaagtt 7560 caaggagcga aaggtggatg ggtaggttat atagggatat agcacagaga tatatagcaa 7620 agagatactt ttgagcaatg tttgtggaag cggtattcgc aatgccggct ttccccgtca 7680 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 7740 caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 7800 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 7860 aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 7920 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 7980 aacgtttaca atttcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac 8040 cgcatatgat ccgtcgagtt caagagaaaa aaaaagaaaa agcaaaaaga aaaaaggaaa 8100 gcgcgcctcg ttcagaatga cacgtataga atgatgcatt accttgtcat cttcagtatc 8160 atactgttcg tatacatact tactgacatt cataggtata catatataca catgtatata 8220 tatcgtatgc tgcagcttta aataatcggt gtcactacat aagaacacct ttggtggagg 8280 gaacatcgtt ggtaccattg ggcgaggtgg cttctcttat ggcaaccgca agagccttga 8340 acgcactctc actacggtga tgatcattct tgcctcgcag acaatcaacg tggagggtaa 8400 ttctgctagc ctctgcaaag ctttcaagaa aatgcgggat catctcgcaa gagagatctc 8460 ctactttctc cctttgcaaa ccaagttcga caactgcgta cggcctgttc gaaagatcta 8520 ccaccgctct ggaaagtgcc tcatccaaag gcgcaaatcc tgatccaaac ctttttactc 8580 cacgcgccag tagggcctct ttaaaagctt gaccgagagc aatcccgcag tcttcagtgg 8640 tgtgatggtc gtctatgtgt aagtcaccaa tgcactcaac gattagcgac cagccggaat 8700 gcttggccag agcatgtatc atatggtcca gaaaccctat acctgtgtgg acgttaatca 8760 cttgcgattg tgtggcctgt tctgctactg cttctgcctc tttttctggg aagatcgagt 8820 gctctatcgc taggggacca ccctttaaag agatcgcaat ctgaatcttg gtttcatttg 8880 taatacgctt tactagggct ttctgctctg tcatctttgc cttcgtttat cttgcctgct 8940 cattttttag tatattcttc gaagaaatca cattacttta tataatgtat aattcattat 9000 gtgataatgc caatcgctaa gaaaaaaaaa gagtcatccg ctaggtggaa aaaaaaaaat 9060 gaaaatcatt accgaggcat aaaaaaatat agagtgtact agaggaggcc aagagtaata 9120 gaaaaagaaa attgcgggaa aggactgtgt tatgacttcc ctgactaatg ccgtgttcaa 9180 acgatacctg gcagtgactc ctagcgctca ccaagctctt aaaacggaat tatggtgcac 9240 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 9300 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 9360 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcga 9416 <210> 31 <211> 9352 <212> DNA <213> Artificial <220> <223> pRN596 <400> 31 gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataagacgtc 60 aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 120 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 180 aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 240 ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 300 gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 360 ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 420 ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 480 gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 540 aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 600 gacaacgatc ggaggaccga aggagctaac cgcttttttt cacaacatgg gggatcatgt 660 aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 720 caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 780 tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 840 acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 900 gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 960 agttatctac acgacgggca gtcaggcaac tatggatgaa cgaaatagac agatcgctga 1020 gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 1080 ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 1140 taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 1200 agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 1260 aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 1320 ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta 1380 gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 1440 aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 1500 aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 1560 gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agcattgaga 1620 aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 1680 aacaggagag cgcacgaggg agcttccagg ggggaacgcc tggtatcttt atagtcctgt 1740 cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggccgag 1800 cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 1860 tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 1920 tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 1980 ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 2040 atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 2100 tgtgagttac ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcctat 2160 gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2220 cgccaagctc ggaattaacc ctcactaaag ggaacaaaag ctgggtaccg ggccccccct 2280 cgaggtcgac ggtatcgata agcttgatat cgaattcctg cagcccgggg gatccactag 2340 tctcgagctc ttcaactcaa gacgcacaga tattataaca tctgcataat aggcatttgc 2400 aagaattact cgtgagtaag gaaagagtga ggaactatcg catacctgca tttaaagatg 2460 ccgatttggg cgcgaatcct ttattttggc ttcaccctca tactattatc agggccagaa 2520 aaaggaagtg tttccctcct tcttgaattg atgttaccct cataaagcac gtggcctctt 2580 atcgagaaag aaattaccgt cgctcgtgat ttgtttgcaa aaagaacaaa actgaaaaaa 2640 cccagacacg ctcgacttcc tgtcttccta ttgattgcag cttccaattt cgtcacacaa 2700 caaggtccta gcgacggctc acaggttttg taacaagcaa tcgaaggttc tggaatggcg 2760 ggaaagggtt tagtaccaca tgctatgatg cccactgtga tctccagagc aaagttcgtt 2820 cgatcgtact gttactctct ctctttcaaa cagaattgtc cgaatcgtgt gacaacaaca 2880 gcctgttctc acacactctt ttcttctaac caagggggtg gtttagttta gtagaacctc 2940 gtgaaactta catttacata tatataaact tgcataaatt ggtcaatgca agaaatacat 3000 atttggtctt ttctaattcg tagtttttca agttcttaga tgctttcttt ttctcttttt 3060 tacagatcat caaggaagta attatctact ttttacaaca aatatatcta gaaaatgtct 3120 acccaacaaa ccatgaccgt tgacgaacac atcaaccaat tagttagaaa ggctcaagtt 3180 gctttgaagg aatacttgaa gccagaatac acccaagaaa agatcgacta catcgttaag 3240 aaggcttctg ttgctgcttt ggaccaacac tgtgctttgg ctgctgctgc tgttgaagaa 3300 accggtagag gtatcttcga agacaaggct accaagaaca tcttcgcttg tgaacacgtt 3360 acccacgaaa tgagacacgc taagaccgtt ggtatcatca acgttgaccc attgtacggt 3420 atcaccgaaa tcgctgaacc agttggtgtt gtttgtggtg ttaccccagt taccaaccca 3480 acctctaccg ctatcttcaa gtctttgatc tctatcaaga ccagaaaccc aatcgttttc 3540 tctttccacc catctgcttt gaagtgttct attatggctg ctaaaatcgt tagagacgct 3600 gctatcgctg ctggtgctcc agaaaactgt atccaatgga tcgaattcgg tggtatcgaa 3660 gcttctaaca agttgatgaa ccacccaggt gttgctacta tcttggctac cggtggtaac 3720 gctatggtta aggctgcata ctcttctggt aagccagctt tgggtgttgg tgctggtaac 3780 gttccaacct acatcgaaaa gacctgtaac atcaagcaag ctgctaacga cgttgttatg 3840 tctaagtctt tcgacaacgg tatgatctgt gcttctgaac aagctgctat catcgacaag 3900 gaaatctacg accaagttgt tgaagaaatg aagaccttgg gtgcttactt catcaacgaa 3960 gaagaaaagg ctaagttgga aaagttcatg ttcggtgtta acgcttactc tgctgacgtt 4020 aacaacgcta gattgaaccc aaagtgtcca ggtatgtctc cacaatggtt cgctgaacaa 4080 gttggtatca aggtaccaga agactgtaac atcatctgtg ctgtttgtaa ggaagttggt 4140 ccaaacgaac cattgaccag agaaaagttg tctccagttt tggctatctt gaaagctgaa 4200 aacacccaag acggtatcga caaggctgaa gctatggttg aatttaacgg tagaggtcac 4260 tctgctgcta tccactctaa cgacaaggct gttgttgaaa agtacgcttt gaccatgaag 4320 gcttgtagaa tcttgcacaa caccccatct tctcaaggtg gtatcggttc tatctacaac 4380 tacatctggc catctttcac cttgggttgt ggttcttacg gtggtaactc tgtttctgct 4440 aacgttacct accacaactt gttgaacatc aagagattgg ctgacagaag aaacaacttg 4500 caatggttca gagttccacc aaagatcttc ttcgaaccac actctatcag atacttggct 4560 gaattgaagg aattgtctaa gatcttcatc gtttctgaca gaatgatgta caagttgggt 4620 tacgttgaca gagttatgga cgttttgaag agaagatcta acgaagttga aatcgaaatc 4680 ttcatcgacg ttgaaccaga cccatctatc caaaccgttc aaaagggttt ggctgttatg 4740 aacaccttcg gtccagacaa catcatcgct atcggtggtg gttctgctat ggacgctgct 4800 aagatcatgt ggttgttgta cgaacaccca gaagctgact tcttcgctat gaagcaaaag 4860 ttcatcgact tgagaaagag agctttcaag ttcccaacca tgggtaagaa ggctagattg 4920 atctgtatcc caaccacctc tggtaccggt tctgaagtta ccccattcgc tgttatctct 4980 gaccacgaaa ccggtaagaa gtacccattg gctgactact ctttgacccc atctgttgct 5040 atcgttgacc caatgttcac catgtctttg ccaaagagag ctatcgctga caccggtttg 5100 gacgttttgg ttcacgctac cgaagcttac gtttctgtta tggctaacga atacaccgac 5160 ggtttggcta gagaagctgt taagttggtt tttgaaaact tgttgaagtc ttacaacggt 5220 gacttggaag ctagagaaaa gatgcacaac gctgctacca tcgctggtat ggctttcgct 5280 tctgctttct tgggtatgga ccactctatg gctcacaagg ttggtgctgc tttccacttg 5340 ccacacggta gatgtgttgc tgttttgttg ccacacgtta tcagatacaa cggtcaaaag 5400 ccaagaaagt tggctatgtg gccaaagtac aacttctaca aggctgacca aagatacatg 5460 gaattggctc aaatggttgg tttgaagtgt aacaccccag ctgaaggtgt tgaagctttc 5520 gctaaggctt gtgaagaatt gatgaaggct accgaaacca tcaccggttt caagaaggct 5580 aacatcgacg aagctgcttg gatgtctaag gttccagaaa tggctttgtt ggctttcgaa 5640 gaccaatgtt ctccagctaa cccaagagtt ccaatggtta aggacatgga aaagatcttg 5700 aaggctgctt actacccaat cgcttagctt aagcgcgcga atttcttatg atttatgatt 5760 tttattatta aataagttat aaaaaaaata agtgtataca aattttaaag tgactcttag 5820 gttttaaaac gaaaattctt attcttgagt aactctttcc tgtaggtcag gttgctttct 5880 caggtatagc atgaggtcgc tcttattgac cacacctcta ccggcatgcc gagcaaatgc 5940 ctgcaaatcg ctccccattt cacccaattg tagatatgct aactccagca atgagttgat 6000 gaatctcggt gtgtatttta tgtcctcaga ggacaacacc tgttgtaatc gttcttccac 6060 acgtacgaag ctaaaagggc gaattctgca gatatccatc acactggcgg ccgcatgcta 6120 gctccggatt atcgatgata agctgtcaaa gatgagaatt aattccacgg actatagact 6180 atactagata ctccgtctac tgtacgatac acttccgctc aggtccttgt cctttaacga 6240 ggccttacca ctcttttgtt actctattga tccagctcag caaaggcagt gtgatctaag 6300 attctatctt cgcgatgtag taaaactagc tagaccgaga aagagactag aaatgcaaaa 6360 ggcacttcta caatggctgc catcattatt atccgatgtg acgctgcagc ttctcaatga 6420 tattcgaata cgctttgagg agatacagcc taatatccga caaactgttt tacagattta 6480 cgatcgtact tgttacccat cattgaattt tgaacatccg aacctgggag ttttccctga 6540 aacagatagt atatttgaac ctgtataata atatatagtc tagcgcttta cggaagacaa 6600 tgtatgtatt tcggttcctg gagaaactat tgcatctatt gcataggtaa tcttgcacgt 6660 cgcatccccg gttcattttc tgcgtttcca tcttgcactt caatagcata tctttgttaa 6720 cgaagcatct gtgcttcatt ttgtagaaca aaaatgcaac gcgagagcgc taatttttca 6780 aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgaaag cgctatttta 6840 ccaacgaaga atctgtgctt catttttgta aaacaaaaat gcaacgcgac gagagcgcta 6900 atttttcaaa caaagaatct gagctgcatt tttacagaac agaaatgcaa cgcgagagcg 6960 ctattttacc aacaaagaat ctatacttct tttttgttct acaaaaatgc atcccgagag 7020 cgctattttt ctaacaaagc atcttagatt actttttttc tcctttgtgc gctctataat 7080 gcagtctctt gataactttt tgcactgtag gtccgttaag gttagaagaa ggctactttg 7140 gtgtctattt tctcttccat aaaaaaagcc tgactccact tcccgcgttt actgattact 7200 agcgaagctg cgggtgcatt ttttcaagat aaaggcatcc ccgattatat tctataccga 7260 tgtggattgc gcatactttg tgaacagaaa gtgatagcgt tgatgattct tcattggtca 7320 gaaaattatg aacggtttct tctattttgt ctctatatac tacgtatagg aaatgtttac 7380 attttcgtat tgttttcgat tcactctatg aatagttctt actacaattt ttttgtctaa 7440 agagtaatac tagagataaa cataaaaaat gtagaggtcg agtttagatg caagttcaag 7500 gagcgaaagg tggatgggta ggttatatag ggatatagca cagagatata tagcaaagag 7560 atacttttga gcaatgtttg tggaagcggt attcgcaatg ccggctttcc ccgtcaagct 7620 ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 7680 aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 7740 cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 7800 ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat 7860 tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg 7920 tttacaattt cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca 7980 tatgatccgt cgagttcaag agaaaaaaaa agaaaaagca aaaagaaaaa aggaaagcgc 8040 gcctcgttca gaatgacacg tatagaatga tgcattacct tgtcatcttc agtatcatac 8100 tgttcgtata catacttact gacattcata ggtatacata tatacacatg tatatatatc 8160 gtatgctgca gctttaaata atcggtgtca ctacataaga acacctttgg tggagggaac 8220 atcgttggta ccattgggcg aggtggcttc tcttatggca accgcaagag ccttgaacgc 8280 actctcacta cggtgatgat cattcttgcc tcgcagacaa tcaacgtgga gggtaattct 8340 gctagcctct gcaaagcttt caagaaaatg cgggatcatc tcgcaagaga gatctcctac 8400 tttctccctt tgcaaaccaa gttcgacaac tgcgtacggc ctgttcgaaa gatctaccac 8460 cgctctggaa agtgcctcat ccaaaggcgc aaatcctgat ccaaaccttt ttactccacg 8520 cgccagtagg gcctctttaa aagcttgacc gagagcaatc ccgcagtctt cagtggtgtg 8580 atggtcgtct atgtgtaagt caccaatgca ctcaacgatt agcgaccagc cggaatgctt 8640 ggccagagca tgtatcatat ggtccagaaa ccctatacct gtgtggacgt taatcacttg 8700 cgattgtgtg gcctgttctg ctactgcttc tgcctctttt tctgggaaga tcgagtgctc 8760 tatcgctagg ggaccaccct ttaaagagat cgcaatctga atcttggttt catttgtaat 8820 acgctttact agggctttct gctctgtcat ctttgccttc gtttatcttg cctgctcatt 8880 ttttagtata ttcttcgaag aaatcacatt actttatata atgtataatt cattatgtga 8940 taatgccaat cgctaagaaa aaaaaagagt catccgctag gtggaaaaaa aaaaatgaaa 9000 atcattaccg aggcataaaa aaatatagag tgtactagag gaggccaaga gtaatagaaa 9060 aagaaaattg cgggaaagga ctgtgttatg acttccctga ctaatgccgt gttcaaacga 9120 tacctggcag tgactcctag cgctcaccaa gctcttaaaa cggaattatg gtgcactctc 9180 agtacaatct gctctgatgc cgcatagtta agccagcccc gacacccgcc aacacccgct 9240 gacgcgccct gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc 9300 tccgggagct gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc ga 9352 <210> 32 <211> 29 <212> DNA <213> Artificial <220> <223> Primer GPD2uf <400> 32 ggtaccagat cttttgcggc gaggtgccg 29 <210> 33 <211> 42 <212> DNA <213> Artificial <220> <223> Primer GPD2ur <400> 33 tctagactta aggaatgtgt atcttgttaa tcttctgaca gc 42 <210> 34 <211> 28 <212> DNA <213> Artificial <220> <223> Primer GPD2df <400> 34 ctcgagatag tctacaacaa cgtccgca 28 <210> 35 <211> 39 <212> DNA <213> Artificial <220> <223> Primer GPD2dr <400> 35 ccatggagat ctgcagtgaa aaagctcgaa gaaacagct 39 <210> 36 <211> 4397 <212> DNA <213> Artificial <220> <223> pRN594 <400> 36 gacgacggcg acctggcggg cttcgtggtc gtctcgtact ccggctggaa ccgccggctg 60 accgtcgagg acatcgaggt cgccccggag caccgggggc acggggtcgg gcgcgcgttg 120 atggggctcg cgacggagtt cgcccgcgag cggggcgccg ggcacctctg gctggaggtc 180 accaacgtca acgcaccggc gatccacgcg taccggcgga tggggttcac cctctgcggc 240 ctggacaccg ccctgtacga cggcaccgcc tcggacggcg agcaggcgct ctacatgagc 300 atgccctgcc cctagtactg acaataaaaa gattcttgtt ttcaagaact tgtcatttgt 360 atagtttttt tatattgtag ttgttctatt ttaatcaaat gttagcgtga tttatatttt 420 ttttcgcctc gacatcatct gcccagatgc gaagttaagt gcgcagaaag taatatcatg 480 cgtcaatcgt atgtgaatgc tggtcgctat actgctgtcg attcgatact aacgccgcca 540 tccagtgtcg acggatccta ggtgtacagg gcccaaaagg gcgaattctg cagatatcca 600 tcacactggc ggccgctcga gatagtctac aacaacgtcc gcatggaaga cctaccggag 660 atgattgaag agctagacat cgatgacgaa tagacactct ccccccccct ccccctctga 720 tctttcctgt tgcctctttt tcccccaacc aatttatcat tatacacaag ttctacaact 780 actactagta acattactac agttattata attttctatt ctctttttct ttaagaatct 840 atcattaacg ttaatttcta tatatacata actaccatta tacacgctat tatcgtttac 900 atatcacatc accgttaatg aaagatacga caccctgtac actaacacaa ttaaataatc 960 gccataacct tttctgttat ctatagccct taaagctgtt tcttcgagct ttttcactgc 1020 agatctccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg 1080 attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag cgttggctac 1140 ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg tgctttacgg 1200 tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg agttcttctg 1260 aattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 1320 gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 1380 gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 1440 cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 1500 tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac 1560 tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 1620 atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 1680 ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 1740 gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 1800 gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 1860 gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 1920 gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 1980 gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 2040 cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 2100 atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 2160 tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 2220 ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 2280 gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 2340 tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 2400 ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgttctt 2460 ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 2520 gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 2580 ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 2640 tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 2700 ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 2760 agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 2820 agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 2880 gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 2940 tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 3000 accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 3060 gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg 3120 attcattaat gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac 3180 gcaattaatg tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg 3240 gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac 3300 catgattacg ccaagctatt taggtgacac tatagaatac tcaagctatg catcaagctt 3360 ggtaccagat cttttgcggc gaggtgccga tgggttgctg aggggaagag tgtttagctt 3420 acggacctat tgccattgtt attccgatta atctattgtt cagcagctct tctctaccct 3480 gtcattctag tatttttttt tttttttttt ggttttactt ttttttcttc ttgccttttt 3540 ttcttgttac tttttttcta gttttttttc cttccactaa gctttttcct tgatttatcc 3600 ttgggttctt ctttctactc ctttagattt tttttttata tattaatttt taagtttatg 3660 tattttggta gattcaattc tctttccctt tccttttcct tcgctcccct tccttatcaa 3720 tgcttgctgt cagaagatta acaagataca cattccttaa ggcctcgtcc ccgccgggtc 3780 acccggccag cgacatggag gcccagaata ccctccttga cagtcttgac gtgcgcagct 3840 caggggcatg atgtgactgt cgcccgtaca tttagcccat acatccccat gtataatcat 3900 ttgcatccat acattttgat ggccgcacgg cgcgaagcaa aaattacggc tcctcgctgc 3960 agacctgcga gcagggaaac gctcccctca cagacgcgtt gaattgtccc cacgccgcgc 4020 ccctgtagag aaatataaaa ggttaggatt tgccactgag gttcttcttt catatacttc 4080 cttttaaaat cttgctagga tacagttctc acatcacatc cgaacataaa caaccatgta 4140 aaatgaccac tcttgacgac acggcttacc ggtaccgcac cagtgtcccg ggggacgccg 4200 aggccatcga ggcactggat gggtccttca ccaccgacac cgtcttccgc gtcaccgcca 4260 ccggggacgg cttcaccctg cgggaggtgc cggtggaccc gcccctgacc aaggtgttcc 4320 ccgacgacga atcggacgac gaatcggacg ccggggagga cggcgacccg gactcccgga 4380 cgttcgtcgc gtacggg 4397 <210> 37 <211> 14200 <212> DNA <213> Artificial <220> <223> pRN957 <400> 37 gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataagacgtc 60 aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 120 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 180 aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 240 ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 300 gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 360 ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 420 ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 480 gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 540 aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 600 gacaacgatc ggaggaccga aggagctaac cgcttttttt cacaacatgg gggatcatgt 660 aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 720 caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 780 tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 840 acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 900 gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 960 agttatctac acgacgggca gtcaggcaac tatggatgaa cgaaatagac agatcgctga 1020 gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 1080 ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 1140 taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 1200 agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 1260 aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 1320 ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta 1380 gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 1440 aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 1500 aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 1560 gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agcattgaga 1620 aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 1680 aacaggagag cgcacgaggg agcttccagg ggggaacgcc tggtatcttt atagtcctgt 1740 cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggccgag 1800 cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 1860 tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 1920 tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 1980 ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 2040 atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 2100 tgtgagttac ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcctat 2160 gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2220 cgccaagctc ggaattaacc ctcactaaag ggaacaaaag ctgggtaccg ggccccccct 2280 cgaggtcgag cttaagacgc gtttcttctt cagattccct catggagaaa gtgcggcaga 2340 tgtatatgac agagtcgcca gtttccaaga gactttattc aggcacttcc atgataggca 2400 agagagaaga cccagagatg ttgttgtcct agttacacat ggtatttatt ccagagtatt 2460 cctgatgaaa tggtttagat ggacatacga agagtttgaa tcgtttacca atgttcctaa 2520 cgggagcgta atggtgatgg aactggacga atccatcaat agatacgtcc tgaggaccgt 2580 gctacccaaa tggactgatt gtgagggaga cctaactaca tagtgtttaa agattacgga 2640 tatttaactt acttagaata atgccatttt tttgagttat aataatccta cgttagtgtg 2700 agcgggattt aaactgtgag gaccttaata cattcagaca cttctgcggt atcaccctac 2760 ttattccctt cgagattata tctaggaacc catcaggttg gtggaagatt acccgttcta 2820 agacttttca gcttcctcta ttgatgttac acctggacac cccttttctg gcatccagtt 2880 tttaatcttc agtggcatgt gagattctcc gaaattaatt aaagcaatca cacaattctc 2940 tcggatacca cctcggttga aactgacagg tggtttgtta cgcatgctaa tgcaaaggag 3000 cctatatacc tttggctcgg ctgctgtaac agggaatata aagggcagca taatttagga 3060 gtttagtgaa cttgcaacat ttactatttt cccttcttac gtaaatattt ttctttttaa 3120 ttctaaatca atctttttca attttttgtt tgtattcttt tcttgcttaa atctataact 3180 acaaaaaaca catacataaa tctagaaaaa tgtctcaatt cttcttcaac cagagaaccc 3240 acttggtttc tgacgttatc gacggtgcta tcatcgcttc accatggaac aatttggcta 3300 gattggaatc tgacccagct atcagaatcg ttgttagaag agacttgaac aagaacaacg 3360 ttgctgttat ctctggtggt ggttctggtc acgaaccagc tcacgttggt ttcatcggta 3420 agggtatgtt gaccgctgct gtttgtggtg acgttttcgc ttctccatct gttgacgctg 3480 ttttgactgc tatccaagct gttaccggtg aagctggttg tttgttgatc gttaagaact 3540 acaccggtga cagattgaac ttcggtttgg ctgctgaaaa ggctagaaga ttgggttaca 3600 acgttgaaat gttgatcgtt ggtgacgaca tctctttgcc agacaacaag cacccaagag 3660 gtatcgctgg taccatcttg gttcacaaga tcgctggtta cttcgctgaa agaggttaca 3720 acttagctac cgttttgaga gaagctcaat acgctgcttc taacaccttc tctttgggtg 3780 ttgctttgtc ttcttgtcac ttgccacaag aaaccgacgc tgctccaaga caccacccag 3840 gtcacgctga attgggtatg ggtatccacg gtgaaccagg tgcttctgtt atcgacaccc 3900 aaaactctgc tcaagttgtt aacttgatgg ttgacaagtt gttggctgct ttgccagaaa 3960 ccggtagatt ggctgttatg atcaacaact tgggtggtgt ttctgttgct gaaatggcta 4020 tcatcaccag agaattggct tcttctccat tgcactcaag aatcgactgg ttgatcggtc 4080 cagcttcttt ggtaaccgct ttggacatga agggtttctc tttgaccgct atcgttttgg 4140 aagaatctat cgaaaaggct ttgttgaccg aagttgaaac ctctaactgg ccaaccccag 4200 ttccaccaag agaaatcacc tgtgttgttt cttctcacgc ttctgctaga gttgaattcc 4260 aaccatctgc taacgctttg gttgctggta tcgttgaatt ggttaccgct accttgtctg 4320 acttggaaac ccacttgaac gctttggacg ctaaggttgg tgacggtgac accggttcta 4380 ccttcgctgc tgctgctaga gaaatcgctt ctttgttgca cagacaacaa ttgccattga 4440 acaacttggc taccttgttc gctttgatcg gtgaaagatt gaccgttgtt atgggtggtt 4500 cttctggtgt tttgatgtct atcttcttca ccgctgctgg tcaaaagttg gaacaaggtg 4560 ctaacgttgt tgaagctttg aacaccggtt tggctcaaat gaagttctac ggtggtgctg 4620 acgaaggtga cagaaccatg atcgacgctt tgcaaccagc tttgacctct ttgttggctc 4680 aaccaaagaa cttgcaagct gctttcgacg ctgctcaagc tggtgctgaa agaacctgtt 4740 tgtcttctaa ggctaacgct ggtagagctt cttacttgtc ttctgaatct ttgttgggta 4800 acatggaccc aggtgctcaa agattggcta tggttttcaa ggctttggct gaatctgaat 4860 tgggttaata aggtcgagac aaatcgctct taaatatata cctaaagaac attaaagcta 4920 tattataagc aaagatacgt aaattttgct tatattatta tacacatatc atatttctat 4980 atttttaaga tttggttata taatgtacgt aatgcaaagg aaataaattt tatacattat 5040 tgaacagcgt ccaagtaact acattatgtg cactaatagt ttagcgtcgt gaagacttta 5100 ttgtgtcgcg aaaagtaaaa attttaaaaa ttagagcacc ttgaacttgc gaaaaaggtt 5160 ctcatcaact gtttaaaacg tacgcctagg aagccttcga gcgtcccaaa accttctcaa 5220 gcaaggtttt cagtataatg ttacatgcgt acacgcgttt gtacagaaaa aaaagaaaaa 5280 tttgaaatat aaataacgtt cttaatacta acataactat taaaaaaaat aaatagggac 5340 ctagacttca ggttgtctaa ctccttcctt ttcggttaga gcggatgtgg gaggagggcg 5400 tgaatgtaag cgtgacataa ctaattacat gatatcgaca aaggaaaagg ggcgcgcctt 5460 attcccattc ttgtaggaat ctttgaccgt attggtcagc aaccaacaaa gcagcgtaaa 5520 cttggtctgg ggtagcacca cctggcatgt tgtggatggt ttcaccttca gcacaagcag 5580 cttcagcaac gattctcatc ttagctggaa cgtcttcctt gatgtccaat tgagccaagg 5640 tgattggcaa accaacagcg tgagacaaag cagcaacggt ttcgatttct tcaactggag 5700 cgttttccaa aaccaattgg gtcaaggtac cgaaagcaac cttttcaccg tggtagtagt 5760 ggtgagcgtc tgggatagcg gtcaaaccgt tgtgaacagc gtgagcagca gccaaaccac 5820 cagattcgaa accaacacca gacaagtagg tgttagcttc gataactctt tccaaagctg 5880 gggtaacaac gtgttgttca gcagccaaca tagccttttc accttcttcc aacaaggtgt 5940 tgtaacacaa ttcagccaaa gccaaagcag cttgggtaca cttaccacca gccatggtgg 6000 tagcaccaga tctagaacaa gctctagctt cgaaccaggt agccaaagcg tcaccgatac 6060 cagctgccaa caatctagct ggagcaccag caacgatctt ggtgtcaacg ataaccatgt 6120 ttgggttgtt tggcaacaac aagtatctgt cgaattcacc ttcgtcggtg tagataacag 6180 acaaagcaga acatggagcg tcggtagaag cgatggttgg agcgatagca actggaacac 6240 ccatgaagtg agccaaagcc ttagcggtgt ccaaggtctt accaccaccg atacccaaga 6300 tagcaccaca ttgagcggtt tcagcgatac ctctcaatct gtcgatttcg ttttgagaac 6360 attcaccacc gaatggagcg atttcaacaa ccaaaccagc gtccttgaaa gacttttcaa 6420 cggtagattg agcgaaaccc aaaacgaact tgtcaccaac aaccaaccat ctttcagcca 6480 atggcttcaa gtattcaccc aatctgttga taacgtcagc accttggatg tacttacctg 6540 gagattggat gattctgtcc attttctgca gttaattcag taaattttcg atcttgggaa 6600 gaaaaaagca gtaagcgtga aaaatctaaa agctgatgta gtagaagatc ctattcttta 6660 acaaagattg accttttctt tttcttcttg gtttgagtag aaaggggaag gaagaataca 6720 agagagagga aaaaaaggaa gataaaaaga gagcgtgata taaatgaata tatattaaac 6780 aagagagatt gggaaggaaa ggatcaaaca aacccaaaaa tatttcaaaa aggagagaga 6840 gaggcgagtt tggtttcaaa acggtttatt tatttatgca agaggacgtg gaagaaaaag 6900 aagaaggaag aaaaaaattt gaaagaaaaa aacgcgtggc gggtaaagaa gaaaatggaa 6960 aatagaggcc gggtgacaga gaaatattga gggttaattg gaaaatatgt tagggtgagg 7020 catatgtttt taagggtttt gaggatccga taaggaagaa tgtaggttaa atgttgtgca 7080 ttaattgctg tggcagctta cccgcttccc cacacattta ctagtctcga gctcttcaac 7140 tcaagacgca cagatattat aacatctgca taataggcat ttgcaagaat tactcgtgag 7200 taaggaaaga gtgaggaact atcgcatacc tgcatttaaa gatgccgatt tgggcgcgaa 7260 tcctttattt tggcttcacc ctcatactat tatcagggcc agaaaaagga agtgtttccc 7320 tccttcttga attgatgtta ccctcataaa gcacgtggcc tcttatcgag aaagaaatta 7380 ccgtcgctcg tgatttgttt gcaaaaagaa caaaactgaa aaaacccaga cacgctcgac 7440 ttcctgtctt cctattgatt gcagcttcca atttcgtcac acaacaaggt cctagcgacg 7500 gctcacaggt tttgtaacaa gcaatcgaag gttctggaat ggcgggaaag ggtttagtac 7560 cacatgctat gatgcccact gtgatctcca gagcaaagtt cgttcgatcg tactgttact 7620 ctctctcttt caaacagaat tgtccgaatc gtgtgacaac aacagcctgt tctcacacac 7680 tcttttcttc taaccaaggg ggtggtttag tttagtagaa cctcgtgaaa cttacattta 7740 catatatata aacttgcata aattggtcaa tgcaagaaat acatatttgg tcttttctaa 7800 ttcgtagttt ttcaagttct tagatgcttt ctttttctct tttttacaga tcatcaagga 7860 agtaattatc tactttttac aacaaatata tctagaaaat ggctgttacc aacgttgctg 7920 aattgaacgc tttggttgaa agggttaaga aggctcaaag agaatacgct tctttcaccc 7980 aagaacaagt tgacaagatc ttcagagctg ctgctttggc tgctgctgac gctagaatcc 8040 cattggctaa gatggctgtt gctgaatctg gtatgggtat cgttgaagac aaggttatca 8100 agaaccactt cgcttctgaa tacatctaca acgcttacaa ggacgaaaag acctgtggtg 8160 ttttgtcaga agacgacacc ttcggtacca tcaccatcgc tgaaccaatc ggtatcatct 8220 gtggtatcgt tccaaccacc aacccaacct ctaccgctat cttcaagtct ttgatctctt 8280 tgaagaccag aaacgctatc atcttctctc cacacccaag agctaaagac gctaccaaca 8340 aggctgctga catcgttttg caagctgcta tcgctgctgg tgctccaaag gacttgatcg 8400 gttggatcga ccaaccatct gttgaattgt ctaacgcttt gatgcaccac ccagacatca 8460 acttgatctt ggctaccggt ggtccaggta tggttaaggc tgcttactct tctggtaagc 8520 cagctatcgg tgttggtgct ggtaacaccc cagttgttat cgacgaaacc gctgacatca 8580 agagagctgt tgcttctgtt ttgatgtcta agaccttcga caacggtgtt atctgtgctt 8640 ctgaacaatc tgttgttgtt gttgactctg tttacgacgc tgttagagaa agattcgcta 8700 cccacggtgg ttacttgttg caaggtaagg aattgaaggc tgttcaagac gttatcttga 8760 agaacggtgc tttgaacgct gctatcgttg gtcaaccagc ttacaagatc gctgaattag 8820 ctggtttctc tgttccagaa aacaccaaga tcttgatcgg tgaagttacc gttgttgacg 8880 aatctgaacc attcgctcac gaaaagttgt ctccaacctt ggctatgtac agagctaagg 8940 acttcgaaga cgctgttgaa aaagctgaaa agttggttgc tatgggtggt attggtcaca 9000 cctcttgttt gtacaccgac caagacaacc aaccagctag agtttcttac ttcggtcaaa 9060 agatgaagac cgctagaatc ttgatcaaca ccccagcttc tcaaggtggt atcggtgact 9120 tgtacaactt caagttggct ccatctttga ccttgggttg tggttcttgg ggtggtaact 9180 ctatctctga aaacgttggt ccaaagcact tgatcaacaa gaagaccgtt gctaagagag 9240 ctgaaaacat gttgtggcac aagttgccaa aatctatcta cttcagaaga ggttctttgc 9300 caatcgcttt ggacgaagtt atcaccgacg gtcacaagag agctttgatc gttaccgaca 9360 gattcttgtt caacaacggt tacgctgacc aaatcacctc tgttttgaag gctgctggtg 9420 ttgaaaccga agttttcttc gaagttgaag ctgacccaac cttgtctatc gttagaaagg 9480 gtgctgaatt ggctaactct ttcaagccag acgttatcat cgctttgggt ggtggttctc 9540 caatggacgc tgctaagatc atgtgggtta tgtacgaaca cccagaaacc cacttcgaag 9600 aattggcttt gagattcatg gacatcagaa agagaatcta caagttccca aagatgggtg 9660 ttaaggctaa gatgatcgct gttaccacca cctctggtac cggttctgaa gttaccccat 9720 tcgctgttgt taccgacgac gctaccggtc aaaagtaccc attggctgac tacgctttga 9780 ccccagacat ggctatcgtt gacgctaact tggttatgga catgccaaag tctttgtgtg 9840 ctttcggtgg tttggacgct gttacccacg ctatggaagc ttacgtttct gttttggctt 9900 ctgaattctc tgacggtcaa gctttgcaag ctttgaagtt gttgaaggaa tacttgccag 9960 cttcttacca cgaaggttct aagaacccag ttgctagaga aagagttcac tctgctgcta 10020 ccatcgctgg tatcgctttc gctaacgctt tcttgggtgt ttgtcactct atggctcaca 10080 agttgggttc tcaattccac atcccacacg gtttggctaa cgctttgttg atctgtaacg 10140 ttatcagata caacgctaac gacaacccaa ccaagcaaac cgctttctct caatacgaca 10200 gaccacaagc tagaagaaga tacgctgaaa tcgctgacca cttgggtttg tctgctccag 10260 gtgacagaac cgctgcaaag atcgaaaagt tgttggcttg gttggaaacc ttgaaggctg 10320 aattgggtat cccaaagtct atcagagaag ctggtgttca agaagctgac ttcttggcta 10380 acgttgacaa gttgtctgaa gacgctttcg acgaccaatg taccggtgct aacccaagat 10440 acccattgat ctctgaattg aagcaaatct tgttggacac ctactacggt agagactacg 10500 ttgaaggtga aaccgctgct aagaaggaag ctgctccagc taaggctgaa aagaaggcta 10560 agaagtctgc ttagcttaag cgcgcgaatt tcttatgatt tatgattttt attattaaat 10620 aagttataaa aaaaataagt gtatacaaat tttaaagtga ctcttaggtt ttaaaacgaa 10680 aattcttatt cttgagtaac tctttcctgt aggtcaggtt gctttctcag gtatagcatg 10740 aggtcgctct tattgaccac acctctaccg gcatgccgag caaatgcctg caaatcgctc 10800 cccatttcac ccaattgtag atatgctaac tccagcaatg agttgatgaa tctcggtgtg 10860 tattttatgt cctcagagga caacacctgt tgtaatcgtt cttccacacg tacgaagctt 10920 aaaagggcga attctgcaga tatccatcac actggcggcc gcatgctagc tccggattat 10980 cgatgataag ctgtcaaaga tgagaattaa ttccacggac tatagactat actagatact 11040 ccgtctactg tacgatacac ttccgctcag gtccttgtcc tttaacgagg ccttaccact 11100 cttttgttac tctattgatc cagctcagca aaggcagtgt gatctaagat tctatcttcg 11160 cgatgtagta aaactagcta gaccgagaaa gagactagaa atgcaaaagg cacttctaca 11220 atggctgcca tcattattat ccgatgtgac gctgcagctt ctcaatgata ttcgaatacg 11280 ctttgaggag atacagccta atatccgaca aactgtttta cagatttacg atcgtacttg 11340 ttacccatca ttgaattttg aacatccgaa cctgggagtt ttccctgaaa cagatagtat 11400 atttgaacct gtataataat atatagtcta gcgctttacg gaagacaatg tatgtatttc 11460 ggttcctgga gaaactattg catctattgc ataggtaatc ttgcacgtcg catccccggt 11520 tcattttctg cgtttccatc ttgcacttca atagcatatc tttgttaacg aagcatctgt 11580 gcttcatttt gtagaacaaa aatgcaacgc gagagcgcta atttttcaaa caaagaatct 11640 gagctgcatt tttacagaac agaaatgcaa cgcgaaagcg ctattttacc aacgaagaat 11700 ctgtgcttca tttttgtaaa acaaaaatgc aacgcgacga gagcgctaat ttttcaaaca 11760 aagaatctga gctgcatttt tacagaacag aaatgcaacg cgagagcgct attttaccaa 11820 caaagaatct atacttcttt tttgttctac aaaaatgcat cccgagagcg ctatttttct 11880 aacaaagcat cttagattac tttttttctc ctttgtgcgc tctataatgc agtctcttga 11940 taactttttg cactgtaggt ccgttaaggt tagaagaagg ctactttggt gtctattttc 12000 tcttccataa aaaaagcctg actccacttc ccgcgtttac tgattactag cgaagctgcg 12060 ggtgcatttt ttcaagataa aggcatcccc gattatattc tataccgatg tggattgcgc 12120 atactttgtg aacagaaagt gatagcgttg atgattcttc attggtcaga aaattatgaa 12180 cggtttcttc tattttgtct ctatatacta cgtataggaa atgtttacat tttcgtattg 12240 ttttcgattc actctatgaa tagttcttac tacaattttt ttgtctaaag agtaatacta 12300 gagataaaca taaaaaatgt agaggtcgag tttagatgca agttcaagga gcgaaaggtg 12360 gatgggtagg ttatataggg atatagcaca gagatatata gcaaagagat acttttgagc 12420 aatgtttgtg gaagcggtat tcgcaatgcc ggctttcccc gtcaagctct aaatcggggg 12480 ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag 12540 ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg 12600 gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc 12660 tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat 12720 gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt tacaatttcc 12780 tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcata tgatccgtcg 12840 agttcaagag aaaaaaaaag aaaaagcaaa aagaaaaaag gaaagcgcgc ctcgttcaga 12900 atgacacgta tagaatgatg cattaccttg tcatcttcag tatcatactg ttcgtataca 12960 tacttactga cattcatagg tatacatata tacacatgta tatatatcgt atgctgcagc 13020 tttaaataat cggtgtcact acataagaac acctttggtg gagggaacat cgttggtacc 13080 attgggcgag gtggcttctc ttatggcaac cgcaagagcc ttgaacgcac tctcactacg 13140 gtgatgatca ttcttgcctc gcagacaatc aacgtggagg gtaattctgc tagcctctgc 13200 aaagctttca agaaaatgcg ggatcatctc gcaagagaga tctcctactt tctccctttg 13260 caaaccaagt tcgacaactg cgtacggcct gttcgaaaga tctaccaccg ctctggaaag 13320 tgcctcatcc aaaggcgcaa atcctgatcc aaaccttttt actccacgcg ccagtagggc 13380 ctctttaaaa gcttgaccga gagcaatccc gcagtcttca gtggtgtgat ggtcgtctat 13440 gtgtaagtca ccaatgcact caacgattag cgaccagccg gaatgcttgg ccagagcatg 13500 tatcatatgg tccagaaacc ctatacctgt gtggacgtta atcacttgcg attgtgtggc 13560 ctgttctgct actgcttctg cctctttttc tgggaagatc gagtgctcta tcgctagggg 13620 accacccttt aaagagatcg caatctgaat cttggtttca tttgtaatac gctttactag 13680 ggctttctgc tctgtcatct ttgccttcgt ttatcttgcc tgctcatttt ttagtatatt 13740 cttcgaagaa atcacattac tttatataat gtataattca ttatgtgata atgccaatcg 13800 ctaagaaaaa aaaagagtca tccgctaggt ggaaaaaaaa aaatgaaaat cattaccgag 13860 gcataaaaaa atatagagtg tactagagga ggccaagagt aatagaaaaa gaaaattgcg 13920 ggaaaggact gtgttatgac ttccctgact aatgccgtgt tcaaacgata cctggcagtg 13980 actcctagcg ctcaccaagc tcttaaaacg gaattatggt gcactctcag tacaatctgc 14040 tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga 14100 cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc 14160 atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 14200 <210> 38 <211> 3042 <212> DNA <213> Artificial <220> <223> pRNDAK <400> 38 ggatccacta gtaacggccg ccagtgtgct ggaattcgcc cttctcgagc ttaagacgcg 60 tttcttcttc agattccctc atggagaaag tgcggcagat gtatatgaca gagtcgccag 120 tttccaagag actttattca ggcacttcca tgataggcaa gagagaagac ccagagatgt 180 tgttgtccta gttacacatg gtatttattc cagagtattc ctgatgaaat ggtttagatg 240 gacatacgaa gagtttgaat cgtttaccaa tgttcctaac gggagcgtaa tggtgatgga 300 actggacgaa tccatcaata gatacgtcct gaggaccgtg ctacccaaat ggactgattg 360 tgagggagac ctaactacat agtgtttaaa gattacggat atttaactta cttagaataa 420 tgccattttt ttgagttata ataatcctac gttagtgtga gcgggattta aactgtgagg 480 accttaatac attcagacac ttctgcggta tcaccctact tattcccttc gagattatat 540 ctaggaaccc atcaggttgg tggaagatta cccgttctaa gacttttcag cttcctctat 600 tgatgttaca cctggacacc ccttttctgg catccagttt ttaatcttca gtggcatgtg 660 agattctccg aaattaatta aagcaatcac acaattctct cggataccac ctcggttgaa 720 actgacaggt ggtttgttac gcatgctaat gcaaaggagc ctatatacct ttggctcggc 780 tgctgtaaca gggaatataa agggcagcat aatttaggag tttagtgaac ttgcaacatt 840 tactattttc ccttcttacg taaatatttt tctttttaat tctaaatcaa tctttttcaa 900 ttttttgttt gtattctttt cttgcttaaa tctataacta caaaaaacac atacataaat 960 ctagaaaatg tccgctaaat cgtttgaagt cacagatcca gtcaattcaa gtctcaaagg 1020 gtttgccctt gctaacccct ccattacgct ggtccctgaa gaaaaaattc tcttcagaaa 1080 gaccgattcc gacaagatcg cattaatttc tggtggtggt agtggacatg aacctacaca 1140 cgccggtttc attggtaagg gtatgttgag tggcgccgtg gttggcgaaa tttttgcatc 1200 cccttcaaca aaacagattt taaatgcaat ccgtttagtc aatgaaaatg cgtctggcgt 1260 tttattgatt gtgaagaact acacaggtga tgttttgcat tttggtctgt ccgctgagag 1320 agcaagagcc ttgggtatta actgccgcgt tgctgtcata ggtgatgatg ttgcagttgg 1380 cagagaaaag ggtggtatgg ttggtagaag agcattggca ggtaccgttt tggttcataa 1440 gattgtaggt gccttcgcag aagaatattc tagtaagtat ggcttagacg gtacagctaa 1500 agtggctaaa attatcaacg acaatttggt gaccattgga tcttctttag accattgtaa 1560 agttcctggc aggaaattcg aaagtgaatt aaacgaaaaa caaatggaat tgggtatggg 1620 tattcataac gaacctggtg tgaaagtttt agaccctatt ccttctaccg aagacttgat 1680 ctccaagtat atgctaccaa aactattgga tccaaacgat aaggatagag cttttgtaaa 1740 gtttgatgaa gatgatgaag ttgtcttgtt agttaacaat ctcggcggtg tttctaattt 1800 tgttattagt tctatcactt ccaaaactac ggatttctta aaggaaaatt acaacataac 1860 cccggttcaa acaattgctg gcacattgat gacctccttc aatggtaatg ggttcagtat 1920 cacattacta aacgccacta aggctacaaa ggctttgcaa tctgattttg aggagatcaa 1980 atcagtacta gacttgttga acgcatttac gaacgcaccg ggctggccaa ttgcagattt 2040 tgaaaagact tctgccccat ctgttaacga tgacttgtta cataatgaag taacagcaaa 2100 ggccgtcggt acctatgact ttgacaagtt tgctgagtgg atgaagagtg gtgctgaaca 2160 agttatcaag agcgaaccgc acattacgga actagacaat caagttggtg atggtgattg 2220 tggttacact ttagtggcag gagttaaagg catcaccgaa aaccttgaca agctgtcgaa 2280 ggactcatta tctcaggcgg ttgcccaaat ttcagatttc attgaaggct caatgggagg 2340 tacttctggt ggtttatatt ctattctttt gtcgggtttt tcacacggat taattcaggt 2400 ttgtaaatca aaggatgaac ccgtcactaa ggaaattgtg gctaagtcac tcggaattgc 2460 attggatact ttatacaaat atacaaaggc aaggaaggga tcatccacca tgattgatgc 2520 tttagaacca ttcgttaaag aatttactgc atctaaggat ttcaataagg cggtaaaagc 2580 tgcagaggaa ggtgctaaat ccactgctac attcgaggcc aaatttggca gagcttcgta 2640 tgtcggcgat tcatctcaag tagaagatcc tggtgcagta ggcctatgtg agtttttgaa 2700 gggggttcaa agcgccttgt aagtcgagac aaatcgctct taaatatata cctaaagaac 2760 attaaagcta tattataagc aaagatacgt aaattttgct tatattatta tacacatatc 2820 atatttctat atttttaaga tttggttata taatgtacgt aatgcaaagg aaataaattt 2880 tatacattat tgaacagcgt ccaagtaact acattatgtg cactaatagt ttagcgtcgt 2940 gaagacttta ttgtgtcgcg aaaagtaaaa attttaaaaa ttagagcacc ttgaacttgc 3000 gaaaaaggtt ctcatcaact gtttaaaacg tacgaagctt aa 3042 <210> 39 <211> 14291 <212> DNA <213> Artificial <220> <223> pRN977 <400> 39 gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataagacgtc 60 aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 120 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 180 aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 240 ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 300 gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 360 ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 420 ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 480 gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 540 aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 600 gacaacgatc ggaggaccga aggagctaac cgcttttttt cacaacatgg gggatcatgt 660 aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 720 caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 780 tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 840 acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 900 gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 960 agttatctac acgacgggca gtcaggcaac tatggatgaa cgaaatagac agatcgctga 1020 gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 1080 ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 1140 taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 1200 agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 1260 aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 1320 ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta 1380 gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 1440 aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 1500 aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 1560 gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agcattgaga 1620 aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 1680 aacaggagag cgcacgaggg agcttccagg ggggaacgcc tggtatcttt atagtcctgt 1740 cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggccgag 1800 cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 1860 tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 1920 tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 1980 ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 2040 atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 2100 tgtgagttac ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcctat 2160 gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2220 cgccaagctc ggaattaacc ctcactaaag ggaacaaaag ctgggtaccg ggccccccct 2280 cgaggtcgag cttaagacgc gtttcttctt cagattccct catggagaaa gtgcggcaga 2340 tgtatatgac agagtcgcca gtttccaaga gactttattc aggcacttcc atgataggca 2400 agagagaaga cccagagatg ttgttgtcct agttacacat ggtatttatt ccagagtatt 2460 cctgatgaaa tggtttagat ggacatacga agagtttgaa tcgtttacca atgttcctaa 2520 cgggagcgta atggtgatgg aactggacga atccatcaat agatacgtcc tgaggaccgt 2580 gctacccaaa tggactgatt gtgagggaga cctaactaca tagtgtttaa agattacgga 2640 tatttaactt acttagaata atgccatttt tttgagttat aataatccta cgttagtgtg 2700 agcgggattt aaactgtgag gaccttaata cattcagaca cttctgcggt atcaccctac 2760 ttattccctt cgagattata tctaggaacc catcaggttg gtggaagatt acccgttcta 2820 agacttttca gcttcctcta ttgatgttac acctggacac cccttttctg gcatccagtt 2880 tttaatcttc agtggcatgt gagattctcc gaaattaatt aaagcaatca cacaattctc 2940 tcggatacca cctcggttga aactgacagg tggtttgtta cgcatgctaa tgcaaaggag 3000 cctatatacc tttggctcgg ctgctgtaac agggaatata aagggcagca taatttagga 3060 gtttagtgaa cttgcaacat ttactatttt cccttcttac gtaaatattt ttctttttaa 3120 ttctaaatca atctttttca attttttgtt tgtattcttt tcttgcttaa atctataact 3180 acaaaaaaca catacataaa tctagaaaat gtccgctaaa tcgtttgaag tcacagatcc 3240 agtcaattca agtctcaaag ggtttgccct tgctaacccc tccattacgc tggtccctga 3300 agaaaaaatt ctcttcagaa agaccgattc cgacaagatc gcattaattt ctggtggtgg 3360 tagtggacat gaacctacac acgccggttt cattggtaag ggtatgttga gtggcgccgt 3420 ggttggcgaa atttttgcat ccccttcaac aaaacagatt ttaaatgcaa tccgtttagt 3480 caatgaaaat gcgtctggcg ttttattgat tgtgaagaac tacacaggtg atgttttgca 3540 ttttggtctg tccgctgaga gagcaagagc cttgggtatt aactgccgcg ttgctgtcat 3600 aggtgatgat gttgcagttg gcagagaaaa gggtggtatg gttggtagaa gagcattggc 3660 aggtaccgtt ttggttcata agattgtagg tgccttcgca gaagaatatt ctagtaagta 3720 tggcttagac ggtacagcta aagtggctaa aattatcaac gacaatttgg tgaccattgg 3780 atcttcttta gaccattgta aagttcctgg caggaaattc gaaagtgaat taaacgaaaa 3840 acaaatggaa ttgggtatgg gtattcataa cgaacctggt gtgaaagttt tagaccctat 3900 tccttctacc gaagacttga tctccaagta tatgctacca aaactattgg atccaaacga 3960 taaggataga gcttttgtaa agtttgatga agatgatgaa gttgtcttgt tagttaacaa 4020 tctcggcggt gtttctaatt ttgttattag ttctatcact tccaaaacta cggatttctt 4080 aaaggaaaat tacaacataa ccccggttca aacaattgct ggcacattga tgacctcctt 4140 caatggtaat gggttcagta tcacattact aaacgccact aaggctacaa aggctttgca 4200 atctgatttt gaggagatca aatcagtact agacttgttg aacgcattta cgaacgcacc 4260 gggctggcca attgcagatt ttgaaaagac ttctgcccca tctgttaacg atgacttgtt 4320 acataatgaa gtaacagcaa aggccgtcgg tacctatgac tttgacaagt ttgctgagtg 4380 gatgaagagt ggtgctgaac aagttatcaa gagcgaaccg cacattacgg aactagacaa 4440 tcaagttggt gatggtgatt gtggttacac tttagtggca ggagttaaag gcatcaccga 4500 aaaccttgac aagctgtcga aggactcatt atctcaggcg gttgcccaaa tttcagattt 4560 cattgaaggc tcaatgggag gtacttctgg tggtttatat tctattcttt tgtcgggttt 4620 ttcacacgga ttaattcagg tttgtaaatc aaaggatgaa cccgtcacta aggaaattgt 4680 ggctaagtca ctcggaattg cattggatac tttatacaaa tatacaaagg caaggaaggg 4740 atcatccacc atgattgatg ctttagaacc attcgttaaa gaatttactg catctaagga 4800 tttcaataag gcggtaaaag ctgcagagga aggtgctaaa tccactgcta cattcgaggc 4860 caaatttggc agagcttcgt atgtcggcga ttcatctcaa gtagaagatc ctggtgcagt 4920 aggcctatgt gagtttttga agggggttca aagcgccttg taagtcgaga caaatcgctc 4980 ttaaatatat acctaaagaa cattaaagct atattataag caaagatacg taaattttgc 5040 ttatattatt atacacatat catatttcta tatttttaag atttggttat ataatgtacg 5100 taatgcaaag gaaataaatt ttatacatta ttgaacagcg tccaagtaac tacattatgt 5160 gcactaatag tttagcgtcg tgaagacttt attgtgtcgc gaaaagtaaa aattttaaaa 5220 attagagcac cttgaacttg cgaaaaaggt tctcatcaac tgtttaaaac gtacgcctag 5280 gaagccttcg agcgtcccaa aaccttctca agcaaggttt tcagtataat gttacatgcg 5340 tacacgcgtt tgtacagaaa aaaaagaaaa atttgaaata taaataacgt tcttaatact 5400 aacataacta ttaaaaaaaa taaataggga cctagacttc aggttgtcta actccttcct 5460 tttcggttag agcggatgtg ggaggagggc gtgaatgtaa gcgtgacata actaattaca 5520 tgatatcgac aaaggaaaag gggcgcgcct tattcccatt cttgtaggaa tctttgaccg 5580 tattggtcag caaccaacaa agcagcgtaa acttggtctg gggtagcacc acctggcatg 5640 ttgtggatgg tttcaccttc agcacaagca gcttcagcaa cgattctcat cttagctgga 5700 acgtcttcct tgatgtccaa ttgagccaag gtgattggca aaccaacagc gtgagacaaa 5760 gcagcaacgg tttcgatttc ttcaactgga gcgttttcca aaaccaattg ggtcaaggta 5820 ccgaaagcaa ccttttcacc gtggtagtag tggtgagcgt ctgggatagc ggtcaaaccg 5880 ttgtgaacag cgtgagcagc agccaaacca ccagattcga aaccaacacc agacaagtag 5940 gtgttagctt cgataactct ttccaaagct ggggtaacaa cgtgttgttc agcagccaac 6000 atagcctttt caccttcttc caacaaggtg ttgtaacaca attcagccaa agccaaagca 6060 gcttgggtac acttaccacc agccatggtg gtagcaccag atctagaaca agctctagct 6120 tcgaaccagg tagccaaagc gtcaccgata ccagctgcca acaatctagc tggagcacca 6180 gcaacgatct tggtgtcaac gataaccatg tttgggttgt ttggcaacaa caagtatctg 6240 tcgaattcac cttcgtcggt gtagataaca gacaaagcag aacatggagc gtcggtagaa 6300 gcgatggttg gagcgatagc aactggaaca cccatgaagt gagccaaagc cttagcggtg 6360 tccaaggtct taccaccacc gatacccaag atagcaccac attgagcggt ttcagcgata 6420 cctctcaatc tgtcgatttc gttttgagaa cattcaccac cgaatggagc gatttcaaca 6480 accaaaccag cgtccttgaa agacttttca acggtagatt gagcgaaacc caaaacgaac 6540 ttgtcaccaa caaccaacca tctttcagcc aatggcttca agtattcacc caatctgttg 6600 ataacgtcag caccttggat gtacttacct ggagattgga tgattctgtc cattttctgc 6660 agttaattca gtaaattttc gatcttggga agaaaaaagc agtaagcgtg aaaaatctaa 6720 aagctgatgt agtagaagat cctattcttt aacaaagatt gaccttttct ttttcttctt 6780 ggtttgagta gaaaggggaa ggaagaatac aagagagagg aaaaaaagga agataaaaag 6840 agagcgtgat ataaatgaat atatattaaa caagagagat tgggaaggaa aggatcaaac 6900 aaacccaaaa atatttcaaa aaggagagag agaggcgagt ttggtttcaa aacggtttat 6960 ttatttatgc aagaggacgt ggaagaaaaa gaagaaggaa gaaaaaaatt tgaaagaaaa 7020 aaacgcgtgg cgggtaaaga agaaaatgga aaatagaggc cgggtgacag agaaatattg 7080 agggttaatt ggaaaatatg ttagggtgag gcatatgttt ttaagggttt tgaggatccg 7140 ataaggaaga atgtaggtta aatgttgtgc attaattgct gtggcagctt acccgcttcc 7200 ccacacattt actagtctcg agctcttcaa ctcaagacgc acagatatta taacatctgc 7260 ataataggca tttgcaagaa ttactcgtga gtaaggaaag agtgaggaac tatcgcatac 7320 ctgcatttaa agatgccgat ttgggcgcga atcctttatt ttggcttcac cctcatacta 7380 ttatcagggc cagaaaaagg aagtgtttcc ctccttcttg aattgatgtt accctcataa 7440 agcacgtggc ctcttatcga gaaagaaatt accgtcgctc gtgatttgtt tgcaaaaaga 7500 acaaaactga aaaaacccag acacgctcga cttcctgtct tcctattgat tgcagcttcc 7560 aatttcgtca cacaacaagg tcctagcgac ggctcacagg ttttgtaaca agcaatcgaa 7620 ggttctggaa tggcgggaaa gggtttagta ccacatgcta tgatgcccac tgtgatctcc 7680 agagcaaagt tcgttcgatc gtactgttac tctctctctt tcaaacagaa ttgtccgaat 7740 cgtgtgacaa caacagcctg ttctcacaca ctcttttctt ctaaccaagg gggtggttta 7800 gtttagtaga acctcgtgaa acttacattt acatatatat aaacttgcat aaattggtca 7860 atgcaagaaa tacatatttg gtcttttcta attcgtagtt tttcaagttc ttagatgctt 7920 tctttttctc ttttttacag atcatcaagg aagtaattat ctacttttta caacaaatat 7980 atctagaaaa tggctgttac caacgttgct gaattgaacg ctttggttga aagggttaag 8040 aaggctcaaa gagaatacgc ttctttcacc caagaacaag ttgacaagat cttcagagct 8100 gctgctttgg ctgctgctga cgctagaatc ccattggcta agatggctgt tgctgaatct 8160 ggtatgggta tcgttgaaga caaggttatc aagaaccact tcgcttctga atacatctac 8220 aacgcttaca aggacgaaaa gacctgtggt gttttgtcag aagacgacac cttcggtacc 8280 atcaccatcg ctgaaccaat cggtatcatc tgtggtatcg ttccaaccac caacccaacc 8340 tctaccgcta tcttcaagtc tttgatctct ttgaagacca gaaacgctat catcttctct 8400 ccacacccaa gagctaaaga cgctaccaac aaggctgctg acatcgtttt gcaagctgct 8460 atcgctgctg gtgctccaaa ggacttgatc ggttggatcg accaaccatc tgttgaattg 8520 tctaacgctt tgatgcacca cccagacatc aacttgatct tggctaccgg tggtccaggt 8580 atggttaagg ctgcttactc ttctggtaag ccagctatcg gtgttggtgc tggtaacacc 8640 ccagttgtta tcgacgaaac cgctgacatc aagagagctg ttgcttctgt tttgatgtct 8700 aagaccttcg acaacggtgt tatctgtgct tctgaacaat ctgttgttgt tgttgactct 8760 gtttacgacg ctgttagaga aagattcgct acccacggtg gttacttgtt gcaaggtaag 8820 gaattgaagg ctgttcaaga cgttatcttg aagaacggtg ctttgaacgc tgctatcgtt 8880 ggtcaaccag cttacaagat cgctgaatta gctggtttct ctgttccaga aaacaccaag 8940 atcttgatcg gtgaagttac cgttgttgac gaatctgaac cattcgctca cgaaaagttg 9000 tctccaacct tggctatgta cagagctaag gacttcgaag acgctgttga aaaagctgaa 9060 aagttggttg ctatgggtgg tattggtcac acctcttgtt tgtacaccga ccaagacaac 9120 caaccagcta gagtttctta cttcggtcaa aagatgaaga ccgctagaat cttgatcaac 9180 accccagctt ctcaaggtgg tatcggtgac ttgtacaact tcaagttggc tccatctttg 9240 accttgggtt gtggttcttg gggtggtaac tctatctctg aaaacgttgg tccaaagcac 9300 ttgatcaaca agaagaccgt tgctaagaga gctgaaaaca tgttgtggca caagttgcca 9360 aaatctatct acttcagaag aggttctttg ccaatcgctt tggacgaagt tatcaccgac 9420 ggtcacaaga gagctttgat cgttaccgac agattcttgt tcaacaacgg ttacgctgac 9480 caaatcacct ctgttttgaa ggctgctggt gttgaaaccg aagttttctt cgaagttgaa 9540 gctgacccaa ccttgtctat cgttagaaag ggtgctgaat tggctaactc tttcaagcca 9600 gacgttatca tcgctttggg tggtggttct ccaatggacg ctgctaagat catgtgggtt 9660 atgtacgaac acccagaaac ccacttcgaa gaattggctt tgagattcat ggacatcaga 9720 aagagaatct acaagttccc aaagatgggt gttaaggcta agatgatcgc tgttaccacc 9780 acctctggta ccggttctga agttacccca ttcgctgttg ttaccgacga cgctaccggt 9840 caaaagtacc cattggctga ctacgctttg accccagaca tggctatcgt tgacgctaac 9900 ttggttatgg acatgccaaa gtctttgtgt gctttcggtg gtttggacgc tgttacccac 9960 gctatggaag cttacgtttc tgttttggct tctgaattct ctgacggtca agctttgcaa 10020 gctttgaagt tgttgaagga atacttgcca gcttcttacc acgaaggttc taagaaccca 10080 gttgctagag aaagagttca ctctgctgct accatcgctg gtatcgcttt cgctaacgct 10140 ttcttgggtg tttgtcactc tatggctcac aagttgggtt ctcaattcca catcccacac 10200 ggtttggcta acgctttgtt gatctgtaac gttatcagat acaacgctaa cgacaaccca 10260 accaagcaaa ccgctttctc tcaatacgac agaccacaag ctagaagaag atacgctgaa 10320 atcgctgacc acttgggttt gtctgctcca ggtgacagaa ccgctgcaaa gatcgaaaag 10380 ttgttggctt ggttggaaac cttgaaggct gaattgggta tcccaaagtc tatcagagaa 10440 gctggtgttc aagaagctga cttcttggct aacgttgaca agttgtctga agacgctttc 10500 gacgaccaat gtaccggtgc taacccaaga tacccattga tctctgaatt gaagcaaatc 10560 ttgttggaca cctactacgg tagagactac gttgaaggtg aaaccgctgc taagaaggaa 10620 gctgctccag ctaaggctga aaagaaggct aagaagtctg cttagcttaa gcgcgcgaat 10680 ttcttatgat ttatgatttt tattattaaa taagttataa aaaaaataag tgtatacaaa 10740 ttttaaagtg actcttaggt tttaaaacga aaattcttat tcttgagtaa ctctttcctg 10800 taggtcaggt tgctttctca ggtatagcat gaggtcgctc ttattgacca cacctctacc 10860 ggcatgccga gcaaatgcct gcaaatcgct ccccatttca cccaattgta gatatgctaa 10920 ctccagcaat gagttgatga atctcggtgt gtattttatg tcctcagagg acaacacctg 10980 ttgtaatcgt tcttccacac gtacgaagct taaaagggcg aattctgcag atatccatca 11040 cactggcggc cgcatgctag ctccggatta tcgatgataa gctgtcaaag atgagaatta 11100 attccacgga ctatagacta tactagatac tccgtctact gtacgataca cttccgctca 11160 ggtccttgtc ctttaacgag gccttaccac tcttttgtta ctctattgat ccagctcagc 11220 aaaggcagtg tgatctaaga ttctatcttc gcgatgtagt aaaactagct agaccgagaa 11280 agagactaga aatgcaaaag gcacttctac aatggctgcc atcattatta tccgatgtga 11340 cgctgcagct tctcaatgat attcgaatac gctttgagga gatacagcct aatatccgac 11400 aaactgtttt acagatttac gatcgtactt gttacccatc attgaatttt gaacatccga 11460 acctgggagt tttccctgaa acagatagta tatttgaacc tgtataataa tatatagtct 11520 agcgctttac ggaagacaat gtatgtattt cggttcctgg agaaactatt gcatctattg 11580 cataggtaat cttgcacgtc gcatccccgg ttcattttct gcgtttccat cttgcacttc 11640 aatagcatat ctttgttaac gaagcatctg tgcttcattt tgtagaacaa aaatgcaacg 11700 cgagagcgct aatttttcaa acaaagaatc tgagctgcat ttttacagaa cagaaatgca 11760 acgcgaaagc gctattttac caacgaagaa tctgtgcttc atttttgtaa aacaaaaatg 11820 caacgcgacg agagcgctaa tttttcaaac aaagaatctg agctgcattt ttacagaaca 11880 gaaatgcaac gcgagagcgc tattttacca acaaagaatc tatacttctt ttttgttcta 11940 caaaaatgca tcccgagagc gctatttttc taacaaagca tcttagatta ctttttttct 12000 cctttgtgcg ctctataatg cagtctcttg ataacttttt gcactgtagg tccgttaagg 12060 ttagaagaag gctactttgg tgtctatttt ctcttccata aaaaaagcct gactccactt 12120 cccgcgttta ctgattacta gcgaagctgc gggtgcattt tttcaagata aaggcatccc 12180 cgattatatt ctataccgat gtggattgcg catactttgt gaacagaaag tgatagcgtt 12240 gatgattctt cattggtcag aaaattatga acggtttctt ctattttgtc tctatatact 12300 acgtatagga aatgtttaca ttttcgtatt gttttcgatt cactctatga atagttctta 12360 ctacaatttt tttgtctaaa gagtaatact agagataaac ataaaaaatg tagaggtcga 12420 gtttagatgc aagttcaagg agcgaaaggt ggatgggtag gttatatagg gatatagcac 12480 agagatatat agcaaagaga tacttttgag caatgtttgt ggaagcggta ttcgcaatgc 12540 cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 12600 acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 12660 ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 12720 gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 12780 tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 12840 ttttaacaaa atattaacgt ttacaatttc ctgatgcggt attttctcct tacgcatctg 12900 tgcggtattt cacaccgcat atgatccgtc gagttcaaga gaaaaaaaaa gaaaaagcaa 12960 aaagaaaaaa ggaaagcgcg cctcgttcag aatgacacgt atagaatgat gcattacctt 13020 gtcatcttca gtatcatact gttcgtatac atacttactg acattcatag gtatacatat 13080 atacacatgt atatatatcg tatgctgcag ctttaaataa tcggtgtcac tacataagaa 13140 cacctttggt ggagggaaca tcgttggtac cattgggcga ggtggcttct cttatggcaa 13200 ccgcaagagc cttgaacgca ctctcactac ggtgatgatc attcttgcct cgcagacaat 13260 caacgtggag ggtaattctg ctagcctctg caaagctttc aagaaaatgc gggatcatct 13320 cgcaagagag atctcctact ttctcccttt gcaaaccaag ttcgacaact gcgtacggcc 13380 tgttcgaaag atctaccacc gctctggaaa gtgcctcatc caaaggcgca aatcctgatc 13440 caaacctttt tactccacgc gccagtaggg cctctttaaa agcttgaccg agagcaatcc 13500 cgcagtcttc agtggtgtga tggtcgtcta tgtgtaagtc accaatgcac tcaacgatta 13560 gcgaccagcc ggaatgcttg gccagagcat gtatcatatg gtccagaaac cctatacctg 13620 tgtggacgtt aatcacttgc gattgtgtgg cctgttctgc tactgcttct gcctcttttt 13680 ctgggaagat cgagtgctct atcgctaggg gaccaccctt taaagagatc gcaatctgaa 13740 tcttggtttc atttgtaata cgctttacta gggctttctg ctctgtcatc tttgccttcg 13800 tttatcttgc ctgctcattt tttagtatat tcttcgaaga aatcacatta ctttatataa 13860 tgtataattc attatgtgat aatgccaatc gctaagaaaa aaaaagagtc atccgctagg 13920 tggaaaaaaa aaaatgaaaa tcattaccga ggcataaaaa aatatagagt gtactagagg 13980 aggccaagag taatagaaaa agaaaattgc gggaaaggac tgtgttatga cttccctgac 14040 taatgccgtg ttcaaacgat acctggcagt gactcctagc gctcaccaag ctcttaaaac 14100 ggaattatgg tgcactctca gtacaatctg ctctgatgcc gcatagttaa gccagccccg 14160 acacccgcca acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta 14220 cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc 14280 gaaacgcgcg a 14291 <210> 40 <211> 4891 <212> DNA <213> Artificial <220> <223> pRN593 <400> 40 gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 60 tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 120 ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 180 taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 240 gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 300 gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 360 ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 420 aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 480 gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 540 cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 600 actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 660 caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 720 gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 780 ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 840 caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 900 tactcatact cttccttttt caattcagaa gaactcgtca agaaggcgat agaaggcgat 960 gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc 1020 gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac 1080 acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg 1140 caagcaggca tcgccatggt accgagtggt gttgtaacca ccctcaaaaa atgcggaaga 1200 ggtgtacagc taatattata atggaaaatc cttttgctct ataggatttt ttttttaaaa 1260 tttaaatata catatttatt tatatttatt tggttactaa attttgtatt aatttaataa 1320 taataagtaa tttctaacgt gataaagtag ttatgagaaa tgacataatg ctaatttatg 1380 aatatgatat agaagagcct cgaaaaaagt gggggaaagt atgatatgtt atctttctcc 1440 aataaatcta atcttcatgt agatctaatt cttcaatcat gtccggcagg ttcttcattg 1500 ggtagttgtt gtaaacgatt tggtatacgg cttcaaataa tgggaagtct tcgacagagc 1560 cacatgtttc caaccattcg tgaacttctt tgcaggtaat taaaccttga gcggattggc 1620 cattcaacaa ctcgtacacc taggatccgt cgacactgga tggcggcgtt agtatcgaat 1680 cgacagcagt atagcgacca gcattcacat acgattgacg catgatatta ctttctgcgc 1740 acttaacttc gcatctgggc agatgatgtc gaggcgaaaa aaaatataaa tcacgctaac 1800 atttgattaa aatagaacaa ctacaatata aaaaaactat acaaatgaca agttcttgaa 1860 aacaagaatc tttttattgt cagtactgat tattcctttg ccctcggacg agtgctgggg 1920 cgtcggtttc cactatcggc gagtacttct acacagccat cggtccagac ggccgcgctt 1980 ctgcgggcga tttgtgtacg cccgacagtc ccggctccgg atcggacgat tgcgtcgcat 2040 cgaccctgcg cccaagctgc atcatcgaaa ttgccgtcaa ccaagctctg atagagttgg 2100 tcaagaccaa tgcggagcat atacgcccgg agccgcggcg atcctgcaag ctccggatgc 2160 ctccgctcga agtagcgcgt ctgctgctcc atacaagcca accacggcct ccagaagaag 2220 atgttggcga cctcgtattg ggaatccccg aacatcgcct cgctccagtc aatgaccgct 2280 gttatgcggc cattgtccgt caggacattg ttggagccga aatccgcgtg cacgaggtgc 2340 cggacttcgg ggcagtcctc ggcccaaagc atcagctcat cgagagcctg cgcgacggac 2400 gcactgacgg tgtcgtccat cacagtttgc cagtgataca catggggatc agcaatcgcg 2460 catatgaaat cacgccatgt agtgtattga ccgattcctt gcggtccgaa tgggccgaac 2520 ccgctcgtct ggctaagatc ggccgcagcg atcgcatcca tggcctccgc gaccggctgc 2580 agaacagcgg gcagttcggt ttcaggcagg tcttgcaacg tgacaccctg tgcacggcgg 2640 gagatgcaat aggtcaggct ctcgctgaat tccccaatgt caagcacttc cggaatcggg 2700 agcgcggccg atgcaaagtg ccgataaaca taacgatctt tgtagaaacc atcggcgcag 2760 ctatttaccc gcaggacata tccacgccct cctacatcga agctgaaagc acgagattct 2820 tcgccctccg agagctgcat caggtcggag acgctgtcga acttttcgat cagaaacttc 2880 tcgacagacg tcgcggtgag ttcaggcttt ttacccatgg ttgtttatgt tcggatgtga 2940 tgtgagaact gtatcctagc aagattttaa aaggaagtat atgaaagaag aacctcagtg 3000 gcaaatccta accttttata tttctctaca ggggcgcggc gtggggacaa ttcacgcgtc 3060 tgtgagggga gcgtttccct gctcgcaggt ctgcagcgag gagccgtaat ttttgcttcg 3120 cgccgtgcgg ccatcaaaat gtatggatgc aaatgattat acatggggat gtatgggcta 3180 aatgtacggg cgacagtcac atcatgcccc tgagctgcgc acgtcaagac tgtcaaggag 3240 ggtattctgg gcctccatgt cgctggccgg gtgacccggc ggggacgagg ccttaagttc 3300 gaacgtacga gctccggatt aagggcgaat tccagcacac tggcggccgt tactagacca 3360 gcattcaagt ggccggaagt taagtttaat ctatcagcag cagcagacat ctttatatta 3420 tcaatatttg tgtttgtgga gggggggggt gtacaatata caattgtttc ttgatgtctt 3480 atgtaggaga gtaagataaa agaaaattaa agggagaaag aatttaaggt aacgtaacag 3540 tttcactcat ggtagtatat atataactac gaaactgcca ataccaagcc agtctacgtg 3600 cgaattaggt tggatagatt tgatgaaccc attctgatac ttgttgtgcg gaaaaaggga 3660 caaaataggg aaaactggaa aaagaaaagg aaggggagag aagcaaggcg ggtaccaagc 3720 ttgatgcata gcttgagtat tctatagtgt cacctaaata gcttggcgta atcatggtca 3780 tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 3840 agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg 3900 cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc 3960 caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 4020 tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 4080 cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 4140 aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 4200 gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 4260 agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 4320 cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 4380 cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 4440 ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 4500 gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 4560 tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga 4620 acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 4680 tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 4740 attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 4800 gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 4860 ttcacctaga tccttttaaa ttaaaaatga a 4891 <210> 41 <211> 30 <212> DNA <213> Artificial <220> <223> Primer gpd1uf <400> 41 aagcttggta cccgccttgc ttctctcccc 30 <210> 42 <211> 26 <212> DNA <213> Artificial <220> <223> Primer gpd1ur <400> 42 tctagaccag cattcaagtg gccgga 26 <210> 43 <211> 29 <212> DNA <213> Artificial <220> <223> Primer gpd1df <400> 43 cgtacgagtt gttgaatggc caatccgct 29 <210> 44 <211> 31 <212> DNA <213> Artificial <220> <223> Primer gpd1dr <400> 44 ccatggtacc gagtggtgtt gtaaccaccc t 31 <210> 45 <211> 20 <212> DNA <213> Artificial <220> <223> Primer gpd1cf <400> 45 accaatacgt aaacggggcg 20 <210> 46 <211> 23 <212> DNA <213> Artificial <220> <223> Primer gpd1cr <400> 46 aatacaccca tacatacgga cgc 23 <210> 47 <211> 28 <212> DNA <213> Artificial <220> <223> Primer acs1f <400> 47 ttaagcttaa aatgtcgccc tctgccgt 28 <210> 48 <211> 50 <212> DNA <213> Artificial <220> <223> Primer acs1r <400> 48 aagcgcgcta caacttgacc gaatcaatta gatgtctaac aatgccaggg 50 <210> 49 <211> 49 <212> DNA <213> Artificial <220> <223> Primer acs2f <400> 49 aactgcagaa aatgacaatc aaggaacata aagtagttta tgaagctca 49 <210> 50 <211> 49 <212> DNA <213> Artificial <220> <223> Primer acs2r <400> 50 acgtcgacta tttctttttt tgagagaaaa attggttctc tacagcaga 49 <210> 51 <211> 13018 <212> DNA <213> Artificial <220> <223> pRN753 <400> 51 gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60 cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120 tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180 aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 240 ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 300 ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 360 tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 420 tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 480 actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 540 gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 600 acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttt cacaacatgg 660 gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 720 acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 780 gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 840 ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 900 gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 960 cccgtatcgt agttatctac acgacgggca gtcaggcaac tatggatgaa cgaaatagac 1020 agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080 catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140 tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 1200 cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1260 gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1320 taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 1380 ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1440 tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1500 ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1560 cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1620 agcattgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1680 gcagggtcgg aacaggagag cgcacgaggg agcttccagg ggggaacgcc tggtatcttt 1740 atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1800 gggggccgag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1860 gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1920 ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1980 cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 2040 cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 2100 acgcaattaa tgtgagttac ctcactcatt aggcacccca ggctttacac tttatgcttc 2160 cggctcctat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 2220 accatgatta cgccaagctc ggaattaacc ctcactaaag ggaacaaaag ctgggtaccg 2280 ggccccccct cgaccggtcc cacacaccat agcttcaaaa tgtttctact ccttttttac 2340 tcttccagat tttctcggac tccgcgcatc gccgtaccac ttcaaaacac ccaagcacag 2400 catactaaat ttcccctctt tcttcctcta gggtgtcgtt aattacccgt actaaaggtt 2460 tggaaaagaa aaaagagacc gcctcgtttc tttttcttcg tcgaaaaagg caataaaaat 2520 ttttatcacg tttctttttc ttgaaaattt ttttttttga tttttttctc tttcgatgac 2580 ctcccattga tatttaagtt aataaacggt cttcaatttc tcaagtttca gtttcatttt 2640 tcttgttcta ttacaacttt ttttacttct tgctcattag aaagaaagca tagcaatcta 2700 atctaagctg cagaagctta aaatgtcgcc ctctgccgta caatcatcaa aactagaaga 2760 acagtcaagt gaaattgaca agttgaaagc aaaaatgtcc cagtctgccg ccactgcgca 2820 gcagaagaag gaacatgagt atgaacattt gacttcggtc aagatcgtgc cacaacggcc 2880 catctcagat agactgcagc ccgcaattgc tacccactat tctccacact tggacgggtt 2940 gcaggactat cagcgcttgc acaaggagtc tattgaagac cctgctaagt tcttcggttc 3000 taaagctacc caatttttaa actggtctaa gccattcgat aaggtgttca tcccagaccc 3060 taaaacgggc aggccctcct tccagaacaa tgcatggttc ctcaacggcc aattaaacgc 3120 ctgttacaac tgtgttgaca gacatgcctt gaagactcct aacaagaaag ccattatttt 3180 cgaaggtgac gagcctggcc aaggctattc cattacctac aaggaactac ttgaagaagt 3240 ttgtcaagtg gcacaagtgc tgacttactc tatgggcgtt cgcaagggcg atactgttgc 3300 cgtgtacatg cctatggtcc cagaagcaat cataaccttg ttggccattt cccgtatcgg 3360 tgccattcac tccgtagtct ttgccgggtt ttcttccaac tccttgagag atcgtatcaa 3420 cgatggggac tctaaagttg tcatcactac agatgaatcc aacagaggtg gtaaagtcat 3480 tgagactaaa agaattgttg atgacgcgct aagagagacc ccaggcgtga gacacgtctt 3540 ggtttataga aagaccaaca atccatctgt tgctttccat gcccccagag atttggattg 3600 ggcaacagaa aagaagaaat acaagaccta ctatccatgc acacccgttg attctgagga 3660 tccattattc ttgttgtata cgtctggttc tactggtgcc cccaagggtg ttcaacattc 3720 taccgcaggt tacttgctgg gagctttgtt gaccatgcgc tacacttttg acactcacca 3780 agaagacgtt ttcttcacag ctggagacat tggctggatt acaggccaca cttatgtggt 3840 ttatggtccc ttactatatg gttgtgccac tttggtcttt gaagggactc ctgcgtaccc 3900 aaattactcc cgttattggg atattattga tgaacacaaa gtcacccaat tttatgttgc 3960 gccaactgct ttgcgtttgt tgaaaagagc tggtgattcc tacatcgaaa atcattcctt 4020 aaaatctttg cgttgcttgg gttcggtcgg tgagccaatt gctgctgaag tttgggagtg 4080 gtactctgaa aaaataggta aaaatgaaat ccccattgta gacacctact ggcaaacaga 4140 atctggttcg catctggtca ccccgctggc tggtggtgtt acaccaatga aaccgggttc 4200 tgcctcattc cccttcttcg gtattgatgc agttgttctt gaccctaaca ctggtgaaga 4260 acttaacacc agccacgcag agggtgtcct tgccgtcaaa gctgcatggc catcatttgc 4320 aagaactatt tggaaaaatc atgataggta tctagacact tatttgaacc cttaccctgg 4380 ctactatttc actggtgatg gtgctgcaaa ggataaggat ggttatatct ggattttggg 4440 tcgtgtagac gatgtggtga acgtctctgg tcaccgtctg tctaccgctg aaattgaggc 4500 tgctattatc gaagatccaa ttgtggccga gtgtgctgtt gtcggattca acgatgactt 4560 gactggtcaa gcagttgctg catttgtggt gttgaaaaac aaatctagtt ggtccaccgc 4620 aacagatgat gaattacaag atatcaagaa gcatttggtc tttactgtta gaaaagacat 4680 cgggccattt gccgcaccaa aattgatcat tttagtggat gacttgccca agacaagatc 4740 cggcaaaatt atgagacgta ttttaagaaa aatcctagca ggagaaagtg accaactagg 4800 cgacgtttct acattgtcaa accctggcat tgttagacat ctaattgatt cggtcaagtt 4860 gtaacttaag cgcgcgaatt tcttatgatt tatgattttt attattaaat aagttataaa 4920 aaaaataagt gtatacaaat tttaaagtga ctcttaggtt ttaaaacgaa aattcttatt 4980 cttgagtaac tctttcctgt aggtcaggtt gctttctcag gtatagcatg aggtcgctct 5040 tattgaccac acctctaccg gcatgccgag caaatgcctg caaatcgctc cccatttcac 5100 ccaattgtag atatgctaac tccagcaatg agttgatgaa tctcggtgtg tattttatgt 5160 cctcagagga caacacctgt tgtaatcgtt cttccacacg tacgttttaa acagttgatg 5220 agaacctttt tcgcaagttc aaggtgctct aatttttaaa atttttactt ttcgcgacac 5280 aataaagtct tcacgacgct aaactattag tgcacataat gtagttactt ggacgctgtt 5340 caataatgta taaaatttat ttcctttgca ttacgtacat tatataacca aatcttaaaa 5400 atatagaaat atgatatgtg tataataata taagcaaaat ttacgtatct ttgcttataa 5460 tatagcttta atgttcttta ggtatatatt taagagcgat ttgtctcgac tatttctttt 5520 tttgagagaa aaattggttc tctacagcag aaatgatggc aggtacaact tctgggttgg 5580 ccaaagtagt taggtcacct agctgttcgg cttcgttaga agcaaccttt cttagaactc 5640 ttctcataat ctttcctgac cttgttcttg gtagatctct aactagaata atggtttttg 5700 gtgaggcgaa aggaccaatc tcacccctaa cttgtaagat caattctcta cgtaaattat 5760 ctggtgtgat gtgttctgca tcaccttcag tagcgttgtt ttgtagataa ccatctttta 5820 gggaaacata tgcaacgacg gtttgaccgg tcaattcatc tggaataccg acaacagcag 5880 cttccgagac gttttcgtga tttgagatag atgcttcaat ttctgatgtg gataatctat 5940 gaccggaaac atttacaacg tcgtcaactc tacccctgat ccagtagtaa ccatcatgat 6000 ctctaccagc accatcacct gtgaaatagt gaccaggata aggtttcaag taagtatcca 6060 tgtaacggtc gtggtggttc caaacagatc tagccattga tggccatggt gatttaacgg 6120 caaggacacc ttcgacatca ttaccttcta attccacacc tgtaacaggg tcaatgatac 6180 aagcgttaat accaaagaat ggcacggtag cagaaccagg ttttgttggg acagcacctg 6240 ccaaaggagc aattaaatga gaaccagact ctgtttgcca catagtgtca caaatgacac 6300 agtttttgtt acccactttt tcatgatacc attcccataa gtctggagag attggttcac 6360 cgacggaacc caagacacgt aatgaggaag tgtcatattt ggcaatttcg gcttcaccta 6420 cacgtttgat taatcttaaa gcagttggag ccacatagaa atgggtagcc ttgtgacgtt 6480 ggataattct ccaatatcta ccataatctg ggtaggcagg agtggattcg aaaattattg 6540 aggcggtacc caaggttaat ggaccatata gagcataggt gtgacccgtg atccagccga 6600 cgtcaccggc agtgaagaga acatcttctg ggtgaatatc aaaaacgtat ctagttgtta 6660 aagcggcacc taataaataa ccacctgtag tgtgaacgac accctttgga gaaccagtgg 6720 aaccggaagt gtataataaa aatagaggat cttcagcgtc acatgaaaca ggaggtaggt 6780 aagttctctg cttagcggcc tcctcatgcc accagtaatc tctaccggcc ttcattggaa 6840 taccttcagt accagttctt tggaaaacca agatacggga aaccaaatcg actccgttca 6900 aaccttcgtc aacaattttt ttagtgttga tggtcttacc acctctttta ccttcatcac 6960 aagtgatgac cactttagaa ttagcgtcaa cgacacgatc tttcaacgaa ccagcggaga 7020 acccagcaaa gacaacagag tgaatagcac caatacgagc cacagccaac atagcaatga 7080 ccgcttctgg aatcattggc aaatagatag ccactgtgtc acctttctta acgccccagc 7140 tttttaagac accagcgatt tgggaaactt ttctgagtaa ttcaccaaat gtgatgattt 7200 tgttgtcgga ttcgtcatca gcttcataga tcaaagctgg cttgtcggga ttagcaaagg 7260 catgtctgtc aacacaattg tatgatgcat tcaatttacc gttcaaaaac catgcaacat 7320 caccattgtt caatgaacca gattgaactt tggtgtatgg agcatcccaa tgcaagtatt 7380 ccttagccat cttatcaaag aatttttctg gctcattgat agattgttga tacatttctt 7440 gataatgttg catatcagta acgtaaccct tgccgggttg gctgttgtaa aaatgttgag 7500 gagccttaag agcctttacg ttgtgagctt cataaactac tttatgttcc ttgattgtca 7560 ttttctgcag tctagatata tttgttgtaa aaagtagata attacttcct tgatgatctg 7620 taaaaaagag aaaaagaaag catctaagaa cttgaaaaac tacgaattag aaaagaccaa 7680 atatgtattt cttgcattga ccaatttatg caagtttata tatatgtaaa tgtaagtttc 7740 acgaggttct actaaactaa accaccccct tggttagaag aaaagagtgt gtgagaacag 7800 gctgttgttg tcacacgatt cggacaattc tgtttgaaag agagagagta acagtacgat 7860 cgaacgaact ttgctctgga gatcacagtg ggcatcatag catgtggtac taaacccttt 7920 cccgccattc cagaaccttc gattgcttgt tacaaaacct gtgagccgtc gctaggacct 7980 tgttgtgtga cgaaattgga agctgcaatc aataggaaga caggaagtcg agcgtgtctg 8040 ggttttttca gttttgttct ttttgcaaac aaatcacgag cgacggtaat ttctttctcg 8100 ataagaggcc acgtgcttta tgagggtaac atcaattcaa gaaggaggga aacacttcct 8160 ttttctggcc ctgataatag tatgagggtg aagccaaaat aaaggattcg cgcccaaatc 8220 ggcatcttta aatgcaggta tgcgatagtt cctcactctt tccttactca cgagtaattc 8280 ttgcaaatgc ctattatgca gatgttataa tatctgtgcg tcttgagttg aagagctcga 8340 gactagatgc atgctcgagc ggccgccagt gtgatggata tctgcagaat tcgccctttt 8400 gggccctgta cacctaggat ccgtcgacac tggatggcgg cgttagtatc gaatcgacag 8460 cagtatagcg accagcattc acatacgatt gacgcatgat attactttct gcgcacttaa 8520 cttcgcatct gggcagatga tgtcgaggcg aaaaaaaata taaatcacgc taacatttga 8580 ttaaaataga acaactacaa tataaaaaaa ctatacaaat gacaagttct tgaaaacaag 8640 aatcttttta ttgtcagtac tgattagaaa aactcatcga gcatcaaatg aaactgcaat 8700 ttattcatat caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga 8760 gaaaactcac cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg 8820 actcgtccaa catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt 8880 gagaaatcac catgagtgac gactgaatcc ggtgagaatg gcaaaagctt atgcatttct 8940 ttccagactt gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc 9000 aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa 9060 ggacaattac aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca 9120 atattttcac ctgaatcagg atattcttct aatacctgga atgctgtttt gccggggatc 9180 gcagtggtga gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga 9240 ggcataaatt ccgtcagcca gtttagtctg accatctcat ctgtaacatc attggcaacg 9300 ctacctttgc catgtttcag aaacaactct ggcgcatcgg gcttcccata caatcgatag 9360 attgtcgcac ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca 9420 tccatgttgg aatttaatcg cggcctcgaa acgtgagtct tttccttacc catggttgtt 9480 tatgttcgga tgtgatgtga gaactgtatc ctagcaagat tttaaaagga agtatatgaa 9540 agaagaacct cagtggcaaa tcctaacctt ttatatttct ctacaggggc gcggcgtggg 9600 gacaattcaa cgcgtctgtg aggggagcgt ttccctgctc gcaggtctgc agcgaggagc 9660 cgtaattttt gcttcgcgcc gtgcggccat caaaatgtat ggatgcaaat gattatacat 9720 ggggatgtat gggctaaatg tacgggcgac agtcacatca tgcccctgag ctgcgcacgt 9780 caagactgtc aaggagggta ttctgggcct ccatgtcgct ggccgggtga cccggcgggg 9840 acgaggcctt aagttcgaac gtacgagctc cggattatcg atgataagct gtcaaagatg 9900 agaattaatt ccacggacta tagactatac tagatactcc gtctactgta cgatacactt 9960 ccgctcaggt ccttgtcctt taacgaggcc ttaccactct tttgttactc tattgatcca 10020 gctcagcaaa ggcagtgtga tctaagattc tatcttcgcg atgtagtaaa actagctaga 10080 ccgagaaaga gactagaaat gcaaaaggca cttctacaat ggctgccatc attattatcc 10140 gatgtgacgc tgcagcttct caatgatatt cgaatacgct ttgaggagat acagcctaat 10200 atccgacaaa ctgttttaca gatttacgat cgtacttgtt acccatcatt gaattttgaa 10260 catccgaacc tgggagtttt ccctgaaaca gatagtatat ttgaacctgt ataataatat 10320 atagtctagc gctttacgga agacaatgta tgtatttcgg ttcctggaga aactattgca 10380 tctattgcat aggtaatctt gcacgtcgca tccccggttc attttctgcg tttccatctt 10440 gcacttcaat agcatatctt tgttaacgaa gcatctgtgc ttcattttgt agaacaaaaa 10500 tgcaacgcga gagcgctaat ttttcaaaca aagaatctga gctgcatttt tacagaacag 10560 aaatgcaacg cgaaagcgct attttaccaa cgaagaatct gtgcttcatt tttgtaaaac 10620 aaaaatgcaa cgcgacgaga gcgctaattt ttcaaacaaa gaatctgagc tgcattttta 10680 cagaacagaa atgcaacgcg agagcgctat tttaccaaca aagaatctat acttcttttt 10740 tgttctacaa aaatgcatcc cgagagcgct atttttctaa caaagcatct tagattactt 10800 tttttctcct ttgtgcgctc tataatgcag tctcttgata actttttgca ctgtaggtcc 10860 gttaaggtta gaagaaggct actttggtgt ctattttctc ttccataaaa aaagcctgac 10920 tccacttccc gcgtttactg attactagcg aagctgcggg tgcatttttt caagataaag 10980 gcatccccga ttatattcta taccgatgtg gattgcgcat actttgtgaa cagaaagtga 11040 tagcgttgat gattcttcat tggtcagaaa attatgaacg gtttcttcta ttttgtctct 11100 atatactacg tataggaaat gtttacattt tcgtattgtt ttcgattcac tctatgaata 11160 gttcttacta caattttttt gtctaaagag taatactaga gataaacata aaaaatgtag 11220 aggtcgagtt tagatgcaag ttcaaggagc gaaaggtgga tgggtaggtt atatagggat 11280 atagcacaga gatatatagc aaagagatac ttttgagcaa tgtttgtgga agcggtattc 11340 gcaatgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 11400 gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 11460 catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 11520 gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 11580 aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 11640 acgcgaattt taacaaaata ttaacgttta caatttcctg atgcggtatt ttctccttac 11700 gcatctgtgc ggtatttcac accgcagggt aataactgat ataattaaat tgaagctcta 11760 atttgtgagt ttagtataca tgcatttact tataatacag ttttttagtt ttgctggccg 11820 catcttctca aatatgcttc ccagcctgct tttctgtaac gttcaccctc taccttagca 11880 tcccttccct ttgcaaatag tcctcttcca acaataataa tgtcagatcc tgtagagacc 11940 acatcatcca cggttctata ctgttgaccc aatgcgtctc ccttgtcatc taaacccaca 12000 ccgggtgtca taatcaacca atcgtaacct tcatctcttc cacccatgtc tctttgagca 12060 ataaagccga taacaaaatc tttgtcgctc ttcgcaatgt caacagtacc cttagtatat 12120 tctccagtag atagggagcc cttgcatgac aattctgcta acatcaaaag gcctctaggt 12180 tcctttgtta cttcttctgc cgcctgcttc aaaccgctaa caatacctgg gcccaccaca 12240 ccgtgtgcat tcgtaatgtc tgcccattct gctattctgt atacacccgc agagtactgc 12300 aatttgactg tattaccaat gtcagcaaat tttctgtctt cgaagagtaa aaaattgtac 12360 ttggcggata atgcctttag cggcttaact gtgccctcca tggaaaaatc agtcaagata 12420 tccacatgtg tttttagtaa acaaattttg ggacctaatg cttcaactaa ctccagtaat 12480 tccttggtgg tacgaacatc caatgaagca cacaagtttg tttgcttttc gtgcatgata 12540 ttaaatagct tggcagcaac aggactagga tgagtagcag cacgttcctt atatgtagct 12600 ttcgacatga tttatcttcg tttcctgcag gtttttgttc tgtgcagttg ggttaagaat 12660 actgggcaat ttcatgtttc ttcaacacta catatgcgta tatataccaa tctaagtctg 12720 tgctccttcc ttcgttcttc cttctgttcg gagattaccg aatcaaaaaa atttcaaaga 12780 aaccgaaatc aaaaaaaaga ataaaaaaaa aatgatgaat tgaattgaaa agcgtggtgc 12840 actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca 12900 cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 12960 accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcga 13018

Claims (15)

  1. 이스트 세포로 배지를 발효하는 단계를 포함하는 에탄올 생성 방법으로서,
    상기 배지는
    a) 헥소스 및 펜토즈 중 적어도 하나의 공급원;
    b) 아세트산의 공급원; 및
    c) 글리세롤의 공급원
    을 함유하거나 또는 이와 함께 공급되며
    이에 따라 이스트 세포는 아세트산, 글리세롤 및 헥소스와 펜토즈 중 적어도 하나를 에탄올로 발효시키며, 그리고 선택적으로, 에탄올의 회수를 포함하며, 이에 따라 이스트 세포는 아세트알데히드 디하이드로게나아제 활성을 갖는 효소를 암호화하는 외인성 유전자를 포함하며, 상기 외인성 유전자는 아세트산을 에탄올로 전환하는 능력을 세포에 부여하고, 이에 따라 이스트 세포는 NAD+-결합된 글리세롤 디하이드로게나아제 활성을 갖는 효소를 암호화하는 박테리아 유전자를 포함하는,
    에탄올 생성 방법.
  2. 제1항에 있어서,
    아세트알데히드 디하이드로게나아제 활성을 갖는 효소를 암호화하는 외인성 유전자는
    i) SEQ ID NO: 1과 적어도 64% 아미노산 서열 동일성,
    ii) SEQ ID NO: 3과 적어도 76% 아미노산 서열 동일성 및
    iii) SEQ ID NO: 5와 적어도 61% 아미노산 서열 동일성
    중 적어도 하나를 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함하며,
    여기서 NAD+-결합된 글리세롤 디하이드로게나아제 활성을 갖는 효소를 암호화하는 박테리아 유전자는 SEQ ID NO: 7과 적어도 45% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함하는, 에탄올 생성 방법.
  3. 제1항 또는 제2항에 있어서,
    상기 이스트 세포는 상기 이스트 세포에서 NAD+-의존적 글리세롤 3-포스페이트 디하이드로게나아제의 특이적 활성을 감소시키는 유전적 변형을 포함하는, 에탄올 생성 방법.
  4. 제3항에 있어서,
    상기 이스트 세포에서 NAD+-의존적 글리세롤 3-포스페이트 디하이드로게나아제의 특이적 활성을 감소시키는 유전적 변형은 SEQ ID NO: 16에 대해 적어도 70% 서열 동일성을 갖는 아미노산 서열을 갖는 글리세롤포스페이트 디하이드로게나아제를 암호화하는 외인성 유전자의 발현을 감소시키거나 불활성화하는 유전적 변형인, 에탄올 생성 방법.
  5. 제1항 또는 제2항에 있어서,
    상기 이스트 세포는 디히드록시아세톤 키나아제의 특이적 활성을 증가시키는 유전적 변형을 포함하며, 여기서 상기 유전적 변형은 디히드록시아세톤 키나아제를 암호화하는 뉴클레오타이드 서열의 과발현이며, 그리고 여기서, 바람직하게, 디히드록시아세톤 키나아제를 암호화하는 뉴클레오타이드 서열은 SEQ ID NO: 8, 9 및 25 중 적어도 하나와 적어도 50% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함하는, 에탄올 생성 방법.
  6. 제2항 내지 제5항 중 어느 한 항에 있어서,
    상기 세포는
    i) 특이적 아세틸-CoA 합성효소 활성, 그리고 여기서 바람직하게, 유전적 변형은 아세틸-CoA 합성효소를 암호화하는 뉴클레오타이드 서열의 발현인, 특이적 아세틸-CoA 합성효소 활성; 및
    ii) 글리세롤의 상기 세포내로의 수송
    중 적어도 하나를 증가시키는 유전적 변형을 더 포함하는, 에탄올 생성 방법.
  7. 제6항에 있어서,
    아세틸-CoA 합성효소를 암호화하는 뉴클레오타이드 서열은 에스. 세레비지아에(S. cerevisiae) ACS1 유전자에 의해 암호화되는 아세틸-CoA 합성효소보다 더 높은 최대 속도로 아세틸-CoA 합성효소를 암호화하거나, 또는 여기서 아세틸-CoA 합성효소를 암호화하는 뉴클레오타이드 서열은 에스. 세레비지아에(S. cerevisiae) ACS2 유전자에 의해 암호화되는 아세틸-CoA 합성효소보다 더 높은 아세테이트에 대한 친화도로 아세틸-CoA 합성효소를 암호화하며, 그리고 여기서 상기 세포내로 글리세롤의 수송을 증가시키는 유전적 변형은 글리세롤 흡수 단백질 및 글리세롤 채널 중 적어도 하나를 암호화하는 뉴클레오타이드 서열의 과발현이며, 여기서, 바람직하게, 글리세롤 흡수 단백질을 암호화하는 뉴클레오타이드 서열은 SEQ ID NO: 10 및 11 중 적어도 하나와 적어도 50% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함하며, 그리고 여기서, 바람직하게 글리세롤 채널을 암호화하는 뉴클레오타이드 서열은 SEQ ID NO: 12의 아미노산 250 내지 530 사이의 아미노산 서열과 적어도 30% 아미노산 서열 동일성을 갖는 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함하는, 에탄올 생성 방법.
  8. 제6항 또는 제7항에 있어서,
    상기 유전적 변형은 혐기적 조건하에서 특이적 아세틸-CoA 합성효소 활성을 증가시키는, 에탄올 생성 방법.
  9. 제2항 내지 제8항 중 어느 한 항에 있어서,
    상기 이스트 세포는
    i) 기능적 외인성 자일로즈 이소머라아제 유전자로서, 여기서 이 유전자는 자일로즈를 자일룰로즈로 이소머화하는 능력을 세포에 부여하는, 기능적 외인성 자일로즈 이소머라아제 유전자; 및
    ii) L-아라비노즈 이소머라아제, L-리불로키나아제 및 L-리불로즈-5-포스페이트 4-에피머라아제를 암호화하는 기능적 외인성 유전자로서, 여기서 이 유전자는 L-아라비노즈를 D-자일룰로즈 5-포스페이트로 전환하는 능력을 세포에 함께 부여하는 L-아라비노즈 이소머라아제, L-리불로키나아제 및 L-리불로즈-5-포스페이트 4-에피머라아제를 암호화하는 기능적 외인성 유전자
    를 포함하며, 그리고 여기서, 바람직하게 이스트 세포는
    a) 증가된 자일룰로즈 키나아제 특이적 활성;
    b) 증가된 펜토즈 포스페이트 경로의 플럭스;
    c) 감소된 비특이적 알도즈 환원효소 특이적 활성;
    d) 자일로즈 및 아라비노즈 중 적어도 하나의 숙주 세포내로의 증가된 수송;
    e) 이화대사 억제에 대한 감소된 민감성;
    f) 에탄올, 삼투성 또는 유기산에 대한 증가된 내성; 및
    g) 감소된 부산물 생성
    으로 구성되는 그룹으로부터 선택되는 특성을 일으키는 적어도 하나의 유전적 변형을 더 포함하는, 에탄올 생성 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서,
    상기 이스트 세포는 사카로미세스(Saccharomyces ), 클루이베로미세스(Kluyveromyces ), 칸디다(Candida ), 피치아(Pichia ), 쉬조사카로미세스(Schizosaccharomyces ), 한세눌라(Hansenula ), 클로엑케라(Kloeckera ), 슈반니오미세스(Schwanniomyces ), 및 야로위아(Yarrowia)로 구성되는 그룹으로부터 선택되는 속에 속하는, 에탄올 생성 방법.
  11. 제10항에 있어서,
    상기 이스트 세포는 에스.세레비지아제(S. cerevisiae ), 에스. 엑시구스(S. exiguus), 에스. 바야너스(S. bayanus ), 케이. 락티스(K. lactis ), 케이. 마르시아너스(K. marxianus ) 및 쉬조사카로미세스 폼브(Schizosaccharomyces pombe)로 구성되는 그룹으로부터 선택되는 종에 속하는, 에탄올 생성 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서,
    상기 배지는 목질 섬유 가수분해물을 함유하거나 또는 이와 함께 공급되는, 에탄올 생성 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서,
    상기 이스트 세포는 혐기적 조건하에서 발효되는, 에탄올 생성 방법.
  14. a) 아세트알데히드 디하이드로게나아제 활성을 갖는 효소를 암호하는 외인성 유전자로서, 이 유전자는 아세트산을 에탄올로 전환하는 능력을 세포에 부여하는, 아세트알데히드 디하이드로게나아제 활성을 갖는 효소를 암호하하는 외인성 유전자; 및
    b) NAD+-결합된 글리세롤 디하이드로게나아제 활성을 갖는 효소를 암호화하는 박테리아 유전자
    를 포함하는 이스트 세포로서,
    이에 따라 상기 이스트 세포는 상기 이스트 세포에서 특이적 NAD+-의존적 포메이트 디하이드로게나아제 활성을 감소시키는 유전적 변형을 포함하는 이스트 세포가 아닌, 이스트 세포.
  15. 제14항에 있어서,
    상기 이스트 세포는 또한 제2항 내지 제11항 중 어느 한 항에 정의된 것과 같은, 이스트 세포.
KR1020147014591A 2011-11-30 2012-11-26 아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인 Withdrawn KR20140099251A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161564932P 2011-11-30 2011-11-30
EP11191333.1 2011-11-30
EP11191333 2011-11-30
US61/564,932 2011-11-30
PCT/NL2012/050841 WO2013081456A2 (en) 2011-11-30 2012-11-26 Yeast strains engineered to produce ethanol from acetic acid and glycerol

Publications (1)

Publication Number Publication Date
KR20140099251A true KR20140099251A (ko) 2014-08-11

Family

ID=48536211

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147014591A Withdrawn KR20140099251A (ko) 2011-11-30 2012-11-26 아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인

Country Status (15)

Country Link
US (2) US9988649B2 (ko)
EP (2) EP2785849B1 (ko)
JP (1) JP2015504309A (ko)
KR (1) KR20140099251A (ko)
CN (2) CN107189954A (ko)
AU (1) AU2012346662B2 (ko)
BR (1) BR112014012963B8 (ko)
CA (1) CA2857247C (ko)
DK (1) DK2785849T3 (ko)
EA (1) EA201491056A8 (ko)
ES (1) ES2648865T3 (ko)
MX (1) MX2014006446A (ko)
MY (1) MY169074A (ko)
PL (1) PL2785849T3 (ko)
WO (1) WO2013081456A2 (ko)

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140099251A (ko) * 2011-11-30 2014-08-11 디에스엠 아이피 어셋츠 비.브이. 아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인
EP3498829A1 (en) * 2012-11-09 2019-06-19 Lallemand Hungary Liquidity Management LLC Method for acetate consumption during ethanolic fermentation of cellulosic feedstocks
AR097479A1 (es) * 2013-08-29 2016-03-16 Dsm Ip Assets Bv Células convertidoras de glicerol y ácido acético con un transporte de glicerol mejorado
AR097480A1 (es) * 2013-08-29 2016-03-16 Dsm Ip Assets Bv Células de levadura convertidoras de glicerol y ácido acético con una conversión de ácido acético mejorada
EP3122876B1 (en) 2014-03-28 2020-11-25 Danisco US Inc. Altered host cell pathway for improved ethanol production
WO2015160257A1 (en) 2014-04-18 2015-10-22 Moralco B.V. Use of acetaldehyde in the fermentative production of ethanol
DE112015003261B4 (de) * 2014-07-14 2025-04-10 Constructor University Bremen Ggmbh Gentechnisch veränderte Hefe mit verbessertem Glycerol-Katabolismus
CN104293687B (zh) * 2014-09-06 2017-01-18 浙江大学 一种提高酿酒酵母菌株乙酸耐受性的方法
US10883122B2 (en) 2014-12-19 2021-01-05 Dsm Ip Assets B.V. Fermentation process for improved glycerol and acetic acid conversion
KR101601589B1 (ko) 2015-01-09 2016-03-08 현대자동차주식회사 도장설비의 악취 제거를 위한 미생물제, 및 이를 이용한 악취 제거 방법
WO2016137976A1 (en) 2015-02-23 2016-09-01 Biocheminsights, Inc. Electrochemical bioreactor module and engineered metabolic pathways for 1- butanol production with high carbon efficiency
CN107636144B (zh) 2015-05-22 2021-02-19 帝斯曼知识产权资产管理有限公司 消耗乙酸盐/酯的酵母细胞
EP3322796A4 (en) 2015-07-13 2019-03-27 Mara Renewables Corporation IMPROVEMENT OF MICROGENONAL FLUID CHANGES OF XYLOSE
WO2017216136A1 (en) * 2016-06-14 2017-12-21 Dsm Ip Assets B.V. Recombinant yeast cell
WO2018114762A1 (en) 2016-12-23 2018-06-28 Dsm Ip Assets B.V. Improved glycerol free ethanol production
US20210147885A1 (en) * 2017-04-17 2021-05-20 Danisco Us Inc Selected acetyl-coa synthase enzymes for reduction of acetate production in yeast
CA3064053A1 (en) * 2017-06-06 2018-12-13 Zymergen Inc. Prioritization of genetic modifications to increase throughput of phenotypic optimization
CN109251938B (zh) * 2017-07-13 2022-08-23 华东理工大学 一种共发酵葡萄糖和木糖生产l-乳酸的乳酸片球菌构建方法
JP6879111B2 (ja) * 2017-08-02 2021-06-02 トヨタ自動車株式会社 組換え酵母及びこれを用いたエタノールの製造方法
WO2019058260A1 (en) * 2017-09-19 2019-03-28 Lallemand Hungary Liquidity Management Llc TOLERANCE TO ACETATE TOXICITY IN RECOMBINANT MICROBIAL HOST CELLS
EP3688176A1 (en) * 2017-09-26 2020-08-05 DSM IP Assets B.V. Improved process for ethanol production
US11414683B2 (en) * 2017-09-26 2022-08-16 Dsm Ip Assets B.V. Acetic acid consuming strain
WO2019063542A1 (en) * 2017-09-29 2019-04-04 Dsm Ip Assets B.V. IMPROVED ETHANOL PRODUCTION WITHOUT GLYCEROL
EP3688170A1 (en) * 2017-09-29 2020-08-05 DSM IP Assets B.V. Improved glycerol free ethanol production
WO2019100054A1 (en) * 2017-11-20 2019-05-23 University Of Florida Research Foundation Dihydroxyacetone metabolizing microorganisms and methods of using them
CN112105726A (zh) * 2018-03-06 2020-12-18 丹尼斯科美国公司 使用gcy1和dak1来增加酵母的乙醇生产的组合物和方法
EP3797159A1 (en) * 2018-05-22 2021-03-31 DSM IP Assets B.V. Modified sterol acyltransferases
HUE068875T2 (hu) * 2018-05-30 2025-01-28 Danisco Us Inc A GIS1 transzkripciós aktivátor/represszor fokozott expressziója élesztõben megemelkedett etanolelõállításhoz
FR3081881B1 (fr) * 2018-06-04 2024-05-24 Ifp Energies Now Outil genetique optimise pour modifier les bacteries du genre clostridium
JP7078900B2 (ja) * 2018-10-05 2022-06-01 トヨタ自動車株式会社 形質転換酵母及びこれを用いたエタノールの製造方法
EP3636661A1 (en) * 2018-10-12 2020-04-15 Bioc3 Phosphate translocator
CN109593662B (zh) * 2018-12-11 2021-12-03 大连理工大学 一种乙酸和木糖共利用的马克斯克鲁维酵母菌株及筛选方法
BR112021026542A2 (pt) * 2019-06-28 2022-05-17 Danisco Us Inc Células de levedura modificadas que superexpressam as proteínas endógenas selecionadas
BR112022000394A2 (pt) * 2019-07-19 2022-03-03 Inbiose Nv Produção de fucosilactose em células hospedeiras
MX2022004990A (es) * 2019-10-28 2022-05-13 Chrysea Ltd Levaduras que producen analogos de poliamina.
US20220380813A1 (en) * 2019-11-08 2022-12-01 Dsm Ip Assets B.V. Process for producing ethanol
CN113215005B (zh) * 2020-01-21 2026-03-06 康码(上海)生物科技有限公司 一种体外无细胞蛋白合成体系(d2p体系)、其试剂盒及其应用
CN111394380A (zh) * 2020-03-11 2020-07-10 大连理工大学 一种利用甲酸脱氢酶提高纤维素水解液中甲酸和乙酸抗性的方法
US20230374443A1 (en) * 2020-10-05 2023-11-23 Dsm Ip Assets B.V. Saccharomyces yeast cell and fermentation process using such
CN112725496B (zh) * 2021-01-12 2024-02-27 江南大学 一种快速鉴定及定量样本中粟酒裂殖酵母的方法
WO2023285297A1 (en) 2021-07-12 2023-01-19 Dsm Ip Assets B.V. Recombinant yeast cell
US20250283121A1 (en) * 2021-07-12 2025-09-11 Danisco Us Inc. Recombinant yeast cell
MX2024000509A (es) 2021-07-12 2024-03-15 Danisco Us Inc Celula de levadura recombinante.
EP4370688A1 (en) 2021-07-12 2024-05-22 Danisco Us Inc Recombinant yeast cell
US20250320529A1 (en) * 2021-07-12 2025-10-16 Danisco Us Inc. Recombinant yeast cell
CN117940570A (zh) 2021-07-12 2024-04-26 丹尼斯科美国公司 重组酵母细胞
CN113528366B (zh) * 2021-07-15 2023-12-08 洛阳华荣生物技术有限公司 一种产beta-丙氨酸酵母菌及其构建方法
CN115851850B (zh) * 2021-09-23 2025-11-28 中国科学院天津工业生物技术研究所 利用二氧化碳制备淀粉的方法、重组微生物和构建重组微生物的方法
US20250163361A1 (en) 2021-11-04 2025-05-22 Danisco Us Inc. Recombinant yeast cell
CN114317327B (zh) * 2021-12-06 2024-01-30 宁波希诺亚海洋生物科技有限公司 一种可表达乳糖酶的弧菌属菌株
CN114410562B (zh) * 2022-02-08 2023-05-30 安徽工程大学 一种克雷伯氏菌工程菌及其在生产乙醇中的应用
CN116064266B (zh) * 2022-11-01 2024-06-14 四川大学 盐胁迫抗性增强的重组酿酒酵母菌及其构建方法与应用
CN116355773A (zh) * 2022-11-02 2023-06-30 杭州欧合生物科技有限公司 产琥珀酸的酿酒酵母基因工程菌及其构建方法和应用
CN116333165A (zh) * 2023-01-30 2023-06-27 广州市乾相生物科技有限公司 Fdh-gdh融合蛋白、编码基因及fdh-gdh共进化体系和共进化方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2679920A1 (fr) 1991-08-02 1993-02-05 Rhone Poulenc Rorer Sa Levures recombinantes hautement stables pour la production de proteines recombinantes, leur preparation et leur utilisation.
EP1453913A4 (en) 2001-11-08 2006-04-05 Antex Pharma Inc SUBSTITUTED ALKANES COMPOUNDS AND USES THEREOF
AT413282B (de) 2002-02-01 2006-01-15 Sandoz Ag Kristalline salze der 7-(((5-amino-1,2,4-thiadiazol-3-yl) (fluoromethoxy-imino)acetyl)amino)-3- ((imino-1-piperazinylmethyl)
US7253001B2 (en) * 2002-03-19 2007-08-07 Forskarpatent I Syd Ab Metabolic engineering for improved xylose utilisation of Saccharomyces cerevisiae
SE0202090D0 (sv) 2002-05-08 2002-07-04 Forskarpatent I Syd Ab A modifierd yeast consuming L-arabinose
JP4711955B2 (ja) 2003-05-02 2011-06-29 ネイチャーワークス・エル・エル・シー 遺伝子組換え酵母及び遺伝子組換え酵母を用いた発酵方法
SE0302421D0 (sv) 2003-09-11 2003-09-11 Forskarpatent I Syd Ab Construction of new xylose utilizing Saccharomyces cerevisiae strain
SE0400815D0 (sv) 2004-03-26 2004-03-26 Forskarpatent I Syd Ab Traits in recombinant xylose-growing saccharomyces cerevisiae strains using genome-wide transcription analysis
SE0401303D0 (sv) 2004-05-19 2004-05-19 Forskarpatent I Syd Ab Ethanol productivities of microbial strains in fermentation of dilute-acid hydrolyzates depend on their furan reduction capacities
DK1781772T3 (en) 2004-07-16 2017-01-09 Dsm Ip Assets Bv Metabolic MODIFICATION of xylose-fermenting eukaryotic cells
EP2171038A2 (en) 2007-07-19 2010-04-07 Royal Nedalco B.V. Novel arabinose-fermenting eukaryotic cells
JP5625199B2 (ja) 2008-03-07 2014-11-19 ディーエスエム アイピー アセッツ ビー.ブイ. ペントース糖発酵細胞
WO2010019882A1 (en) * 2008-08-15 2010-02-18 Edeniq, Inc. Genetically-engineered yeast and methods of making and using
EP2277989A1 (en) * 2009-07-24 2011-01-26 Technische Universiteit Delft Fermentative glycerol-free ethanol production
US9605269B2 (en) 2010-05-05 2017-03-28 Lallemand Hungary Liquidity Management Llc Detoxification of biomass derived acetate via metabolic conversion to ethanol, acetone, isopropanol, or ethyl acetate
WO2011149353A1 (en) * 2010-05-27 2011-12-01 C5 Yeast Company B.V. Yeast strains engineered to produce ethanol from acetic acid and glycerol
EP2576762A4 (en) * 2010-06-03 2013-12-04 Mascoma Corp YEAST FOR THE EXPRESSION OF SACCHAROLYTIC ENZYMES FOR CONSOLIDATED BIOVERIC PROCESSING USING STARCH AND CELLULOSE
CA2834053C (en) * 2010-11-18 2019-03-26 Dsm Ip Assets B.V. Yeast strains engineered to produce ethanol from glycerol
KR20140099251A (ko) * 2011-11-30 2014-08-11 디에스엠 아이피 어셋츠 비.브이. 아세트산 및 글리세롤로부터 에탄올을 생성하도록 합성된 이스트 스트레인

Also Published As

Publication number Publication date
EP3321368A3 (en) 2018-05-23
BR112014012963B8 (pt) 2022-04-26
US20180251798A1 (en) 2018-09-06
EP2785849A2 (en) 2014-10-08
BR112014012963A2 (pt) 2020-10-20
CA2857247C (en) 2019-07-23
CN107189954A (zh) 2017-09-22
AU2012346662A1 (en) 2014-06-05
EA201491056A8 (ru) 2015-02-27
CN104126011A (zh) 2014-10-29
WO2013081456A3 (en) 2013-08-15
EP3321368A2 (en) 2018-05-16
DK2785849T3 (en) 2018-01-08
MY169074A (en) 2019-02-13
CN104126011B (zh) 2017-07-11
JP2015504309A (ja) 2015-02-12
PL2785849T3 (pl) 2018-02-28
US20150176032A1 (en) 2015-06-25
US9988649B2 (en) 2018-06-05
ES2648865T3 (es) 2018-01-08
AU2012346662B2 (en) 2016-07-28
CA2857247A1 (en) 2013-06-06
US10941421B2 (en) 2021-03-09
WO2013081456A2 (en) 2013-06-06
EA201491056A1 (ru) 2014-09-30
EP2785849B1 (en) 2017-09-27
BR112014012963B1 (pt) 2022-03-03
MX2014006446A (es) 2014-09-01

Similar Documents

Publication Publication Date Title
DK2785849T3 (en) Yeast strains modified to produce ethanol from acetic acid and glycerol
AU2016358063B2 (en) Functional expression of monooxygenases and methods of use
DK2663645T3 (da) Gærstammer, der er modificeret til produktion af ethanol fra glycerol
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
KR101659101B1 (ko) 박테리아 [2Fe-2S] 다이하이드록시산 탈수효소의 동정 및 용도
AU2017220789B2 (en) Compositions and Methods for Modifying Genomes
DK2576605T3 (en) PREPARATION OF METABOLITES
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
DK2855662T3 (en) RECOMBINANT MICROORGANISMS AND APPLICATIONS THEREOF
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
KR101982360B1 (ko) 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도
CN101939433B (zh) 酵母中生产乙酰-CoA的酶
CN110467679B (zh) 一种融合蛋白、碱基编辑工具和方法及其应用
KR20120136349A (ko) 고가의 화학적 생성물의 미생물 생산, 및 관련 조성물, 방법 및 시스템
CN116083398B (zh) 分离的Cas13蛋白及其应用
KR20140015136A (ko) 3-히드록시프로피온산 및 다른 생성물의 제조 방법
KR20140113997A (ko) 부탄올 생성을 위한 유전자 스위치
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
KR20130117753A (ko) 포스포케톨라아제를 포함하는 재조합 숙주 세포
KR20120099509A (ko) 재조합 숙주 세포에서 육탄당 키나아제의 발현
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
KR20150014953A (ko) 케톨-산 리덕토아이소머라아제 효소 및 사용 방법
KR20120115349A (ko) 저급 알킬 알코올의 발효 생성에 유용한 알코올 탈수소효소(adh)
KR20100118973A (ko) 이소프렌을 생성하기 위한 조성물 및 방법

Legal Events

Date Code Title Description
PA0105 International application

Patent event date: 20140529

Patent event code: PA01051R01D

Comment text: International Patent Application

PG1501 Laying open of application
PC1203 Withdrawal of no request for examination
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid