KR20040104581A - 유전공학용 프로모터 및 플라스미드 시스템 - Google Patents

유전공학용 프로모터 및 플라스미드 시스템 Download PDF

Info

Publication number
KR20040104581A
KR20040104581A KR10-2004-7016903A KR20047016903A KR20040104581A KR 20040104581 A KR20040104581 A KR 20040104581A KR 20047016903 A KR20047016903 A KR 20047016903A KR 20040104581 A KR20040104581 A KR 20040104581A
Authority
KR
South Korea
Prior art keywords
seq
dna
promoter
plasmid
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
KR10-2004-7016903A
Other languages
English (en)
Inventor
마크 에스. 페인
스티븐 케이. 파카타지오
도날드 유진 트림버
아미 광-화 슈
페르난도 발레
라메쉬 네어
필립 슈케일
Original Assignee
이 아이 듀폰 디 네모아 앤드 캄파니
제넨코 인터내셔널, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이 아이 듀폰 디 네모아 앤드 캄파니, 제넨코 인터내셔널, 인코포레이티드 filed Critical 이 아이 듀폰 디 네모아 앤드 캄파니
Publication of KR20040104581A publication Critical patent/KR20040104581A/ko
Ceased legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/36Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/76Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 각각 터미네이터 서열 측면에 위치하는 3종 이상의 다른 유전자 또는 오페론을 클로닝하기에 유용한 제한 효소 인식 부위를 포함하는 저카피수 (low-copy number) 플라스미드 시리즈를 제공하며, 이 때 플라스미드는 단백질 발현 수준을 변화시키는 글루코스 이소머라제 프로모터의 변이체를 함유한다. 본 발명의 재료 및 방법은 미생물에서, 특히 다수의 유전자 삽입을 시도하는 경우에 유전공학용으로 유용하다.

Description

유전공학용 프로모터 및 플라스미드 시스템 {Promoter and Plasmid System for Genetic Engineering}
본 출원은 2002년 4월 22일에 출원된 미국 가출원 제60/374941호를 우선권으로 주장한다.
분자 생명공학은 한 생물체로부터 다른 생물체로 특정 단위의 유전 정보를 전달하는 연구자의 능력을 기초로 하는 학문 분야이다. 클로닝으로 공지되어 있는 이 과정은 유용한 산물을 생산하는 DNA 재조합 기술 또는 상업적 과정에 의존한다 (문헌 [Glick, B.R.; Pasternak, J.J., Molecular Biotechnology Principles andApplications of Recombinant DNA, 2nded. American Society for Microbiology, Washington, DC. (1998)]).
상업적 과정은 대체로 클로닝된 유전자에 의해 코딩되는 단백질이 높은 발현율로 생산될 것을 요구한다. 클로닝된 모든 유전자의 최대 발현을 달성하기 위한 단일 전략은 존재하지 않는다. 대부분의 클로닝된 유전자는 수용가능한 발현 수준을 유발하는 특정 조건 세트가 발견되기까지 상당한 시간과 노력을 투자해야 하는 독특한 분자적 특성을 갖는다.
유전자를 클로닝 벡터에 삽입하는 것만으로는 유전자가 필요한 수준으로 성공적으로 발현될 수 없다. 높은 발현율에 대한 필요성에 대응하여, 전사, 번역, 단백질 안정성, 산소 제한 및 숙주 세포로부터의 분비를 조절하는 다수의 상이한 유전자 성분을 조작함으로써 다수의 특별한 발현 벡터가 제작되어 있다. 보다 구체적으로, 유전자 발현을 조절하기 위해 조작되는 분자적 특성으로는 (1) 관련된 전사 프로모터 및 터미네이터 서열의 특성, (2) 리보솜 결합 부위의 강도, (3) 클로닝된 유전자의 카피수, 및 유전자가 플라스미드에 존재하는지 숙주 세포의 게놈에 통합되어 있는지의 여부, (4) 합성된 외부 단백질의 세포내 최종 위치, (5) 숙주 생물체에서의 번역 효율성, 및 (6) 클로닝된 유전자 단백질의 숙주 세포 내에서의 고유한 안정성이 있다.
또한, 숙주 생물체에 외부 DNA가 도입되어 발현되는 것은 대체로 정상적인 세포 기능을 손상시킬 수도 있는 방식으로 생물체의 대사과정을 변화시킨다. 이러한 현상은 외부 DNA에 의해 숙주에 부과되는 대사성 부담 (load) 또는 짐 (burden)에 의한 것이다. 이 대사성 부담은 1) 플라스미드 카피수 증가, 2) 단백질의 과다생산, 3) 방출 부위의 포화, 및(또는) 4) 외부 단백질 자체에 의한 세포 기능 방해를 비롯한 다양한 상태로부터 초래될 수 있다.
상기 나타낸 장애 요건 중 일부를 처리하는 기술이 공지되어 있다. 몇몇 연구 그룹은 텐덤 (tandem)으로 배열된 다수의 프로모터를 사용하여, 상이한 세포 증식 단계에서 (CN 1186856), 상이한 RNA 중합효소로부터, 또는 상이한 파지 종에서 (US 5547862; 문헌 [J. Biotechnol. 2(5):303-316 (1985)]; [Biotechniques, 18(1):152-154, 156-157 (1995)]) 유전자를 발현시켰다. 다른 연구 그룹은 텐덤으로 반복된 다중 클로닝 부위 (MCS) (문헌 [Gene, 139(1):83-86 (1994)])를 사용하여 플라스미드 벡터 안팎으로의 DNA 이동을 용이하게 하였다. 한 연구 그룹은 포유동물 세포에서 다른 유전자의 발현에 사용되는 다른 프로모터 뒤에 각각 3개의 다중 클로닝 부위를 갖는 고카피수 (high-copy number) 벡터를 사용한다고 보고하였다 (문헌 [Boitech. Bioeng., 57(1):1-10 (1998)]).
이러한 기술에도 불구하고, 대사성 부담의 영향을 최소화시키고, 재조합 단백질 생산량을 조절하여 필요한 생산량을 충족시키고, 형질전환된 숙주 세포의 안정성을 증가시키면서 다수의 유전자 또는 오페론을 용이하고 신속하게 클로닝하는 방법이 해결해야 할 문제로 남아있다.
<발명의 요약>
본 발명자들은 생산용 생물체에서 유전자의 발현 수준을 변화시킬 수 있는신규 글루코스 이소머라제 프로모터 서열을 제작하였다. 본 발명자들은 변이체 GI 프로모터를 함유하는 발현 카세트를, pCL1920으로부터 유래된 저카피수 플라스미드에 혼입시켜 유전공학용 플라스미드 시리즈를 제작하였다. 전사 터미네이터는 전사 관련 프로모터와 상기 구조물의 외부에 위치하는 다른 프로모터를 구분한다.
또한, 본 발명자들은 다수의 희귀 (rare) 제한 효소에 대한 클로닝 부위를 함유하고, 또한 이 구조물에서의 클로닝 또는 이 구조물의 다른 플라스미드 또는 벡터 골격으로의 전달을 용이하게 하는 독특한 뉴클레오티드 서열을 제작하였다. 이러한 독특한 클로닝 부위는 다양한 강도의 적합한 프로모터의 조절하에 발현될 유전자 또는 오페론을 도입할 수 있게 한다.
본 발명은
1. 스트렙토마이세스 리비딘스 (Streptomyces lividins) 글루코스 이소머라제 변이체를 코딩하며, 서열 9 내지 28로 이루어진 군으로부터 선택되는 단리된 또는 재조합 핵산 분자;
2. 스트렙토마이세스 리비딘스 글루코스 이소머라제 변이체를 코딩하며, 서열 9 내지 28 중 어느 하나의 뉴클레오티드 서열을 포함하는 단리된 또는 재조합 핵산 분자;
3. 서열 9 내지 28의 뉴클레오티드 서열을 포함하는, 스트렙토마이세스 리비딘스 글루코스 이소머라제 변이체를 코딩하는 단리된 또는 재조합 핵산 분자의 라이브러리;
4. 상기 나열된 다양한 GI 변이체의 핵산 분자를 포함하는 발현 카세트; 및
5. 상기 나열된 다양한 스트렙토마이세스 리비딘스 글루코스 이소머라제 변이체를 코딩하는 핵산 분자를 포함하는 키트
를 포함한다.
본 발명의 추가의 실시양태는 3개 이상의 전사 터미네이터, 및 임의의 2개의 전사 터미네이터 사이에 하나 이상의 클로닝 부위를 포함하는 DNA 구조물에 관한 것이다. 상기 DNA 구조물의 바람직한 실시양태는 전사 터미네이터인 tonB, thrA 또는 aspA, 및 AvrII, NheI, BfaI, Cac8I, BsaJI 및 StyI로 이루어진 군으로부터 선택된 클로닝 부위를 포함한다. 바람직한 클로닝 부위는 NheI 또는 AvrII이다. 이 구조물의 라이브러리도 본 발명에 포함된다.
본 발명은 하기 DNA 구조물을 포함한다:
서열 30으로 이루어진 pSYCO109mcs 플라스미드,
서열 31로 이루어진 짧은 1.5 GI 프로모터,
서열 32로 이루어진 짧은 1.20 GI 프로모터,
서열 70으로 이루어진 pAH105 플라스미드,
서열 71로 이루어진 pSYCO101 플라스미드,
서열 72로 이루어진 pSYCO103 플라스미드,
서열 73으로 이루어진 pSYCO106 플라스미드,
서열 74로 이루어진 pSYCO109 플라스미드,
서열 78로 이루어진 pSYCO106mcs 플라스미드, 및
서열 79로 이루어진 pRJ50 플라스미드.
본 발명의 추가 실시양태는 제한 효소 AscI, NheI, PacI, RsrII, NsiI, SacII, MluI, AgeI, SapI 및 SnaBI에 대해 특이적인 제한 효소 인식 부위 서열을 함유하는 다중 클로닝 부위를 갖는 벡터에 관한 것이다. 이 벡터의 구체적인 실시양태는 서열 77의 뉴클레오티드 서열이다.
본 발명의 유전 물질은 상기 기재된 핵산 분자 및 그 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 함유하는 형질전환된 숙주 세포를 포함한다.
<서열 목록 및 생물 기탁의 간단한 설명>
본 발명자들은 특허 출원시 뉴클레오티드 및 아미노산 서열의 표준 진술에 대한 규칙 (EPO 의장의 결정에 대한 부가물 I 내지 II, 1992년 12월에 OJ EPO 부록 제2호에 공개됨), 37C.F.R. 1.821-1.825 및 어펜딕스 (Appendix) A 및 B (뉴클레오티드 및(또는) 아미노산 서열을 함유하는 출원 개시문에 대한 요건), 세계 지적 재산권 기구 (WIPO) 표준 ST.25 (1998), 및 EPO 및 PCT의 서열 목록 요건 (규칙 제5.2항 및 제49.5항 (a-bis), 및 관리 지침의 단락 208 및 부가물 C)을 준수하여 83개의 서열을 제공하였다. 서열 기재는 문헌 [Nucleic Acids Research 13:3021-3030 (1985)] 및 [Biochemical Journal 219 (No. 2):345-373 (1984)] (본원에 참고문헌으로 포함된 것으로 간주함)에 기재된 IUPAC-IYUB 표준을 준수하여 뉴클레오티드 서열 문자에 대한 1 문자 코드 및 아미노산 서열에 대한 3 문자 코드를 함유한다.
서열 1은 야생형 스트렙토마이세스 리비딘스 글루코스 이소머라제 (GI) 프로모터에 대한 뉴클레오티드 서열이다.
서열 2 내지 8은 GI 프로모터의 포화 돌연변이유발에 사용되는 올리고뉴클레오티드 프라이머이다. 서열 3 내지 8에서, "N"은 A, T, C 또는 G를 나타낸다.
서열 9 내지 28은 GI 프로모터 변이체에 대한 뉴클레오티드 서열이다.
서열 29는 이. 콜라이 (E. coli)로부터의 yqhD 유전자에 대한 뉴클레오티드 서열이다.
서열 30은 pSYCO109mcs 플라스미드에 대한 뉴클레오티드 서열이다.
서열 31은 짧은 1.5 GI 프로모터에 대한 뉴클레오티드 서열이다.
서열 32는 짧은 1.20 GI 프로모터에 대한 뉴클레오티드 서열이다.
서열 33은 짧은 야생형 GI 프로모터에 대한 뉴클레오티드 서열이다.
서열 34 내지 37은 짧은 GI 프로모터를 혼입시켜 yqhD를 증폭시키는 데 사용되는 올리고뉴클레오티드 프라이머이다.
서열 38 내지 39는 yqhD가 파괴된 구조물 제작에 사용되는 올리고뉴클레오티드 프라이머이다.
서열 40 내지 43은 yqhD의 파괴를 확인하는 데 사용되는 올리고뉴클레오티드 프라이머이다.
서열 44 내지 46은 염색체 ppc 프로모터를 짧은 야생형 GI 프로모터로 치환하는 데 사용되는 올리고뉴클레오티드 프라이머이다.
서열 47은 다중 클로닝 부위 및 터미네이터에 대한 뉴클레오티드 서열이다.
서열 48은 pHK28-26 플라스미드에 대한 뉴클레오티드 서열이다.
서열 49 내지 50은 dhaB3을 증폭시키는 데 사용되는 올리고뉴클레오티드 프라이머이다.
서열 51 내지 52는 dhaB1을 증폭시키는 데 사용되는 올리고뉴클레오티드 프라이머이다.
서열 53 내지 54는 dhaT가 결실된 구조물 생성에 사용되는 올리고뉴클레오티드 프라이머이다.
서열 55 내지 56은 링커 생성에 사용되는 올리고뉴클레오티드이다.
서열 57은 제한 효소 부위에 의해 분리된 3개의 전사 터미네이터를 코딩하는 뉴클레오티드 서열이다.
서열 58 내지 59는 서열 60 생성에 사용되는 올리고뉴클레오티드이다.
서열 60은 EcoRI 및 KpnI 부위가 측면에 위치하는 3개의 전사 터미네이터를 코딩하는 뉴클레오티드 서열이다.
서열 61 내지 62는 서열 60을 증폭시키는 데 사용되는 올리고뉴클레오티드 프라이머이다.
서열 63 내지 66은 발현 카세트를 증폭시키는 데 사용되는 올리고뉴클레오티드 프라이머이다.
서열 67은 pCR-pCL1920 제작에 사용되는 이중-가닥 링커의 뉴클레오티드 서열이다.
서열 68 내지 69는 pTrc99A로부터 rrnBT1T2 터미네이터를 증폭시키는 데 사용되는 올리고뉴클레오티드 프라이머이다.
서열 70은 pAH105 플라스미드에 대한 뉴클레오티드 서열이다.
서열 71은 pSYCO101 플라스미드에 대한 뉴클레오티드 서열이다.
서열 72는 pSYCO103 플라스미드에 대한 뉴클레오티드 서열이다.
서열 73은 pSYCO106 플라스미드에 대한 뉴클레오티드 서열이다.
서열 74는 pSYCO109 플라스미드에 대한 뉴클레오티드 서열이다.
서열 75 내지 76은 서열 77을 형성하는 데 사용되는 올리고뉴클레오티드 프라이머이다.
서열 77은 제한 효소 NheI, RsrII, SacI, AgeI, SnaBI, AscI, PacI, NsiI, MluI 및 SapI에 대한 제한 효소 인식 부위를 함유하는 다중 클로닝 단편의 뉴클레오티드 서열이다.
서열 78은 pSYCO106mcs 플라스미드에 대한 뉴클레오티드 서열이다.
서열 79는 pRJ50 플라스미드에 대한 뉴클레오티드 서열이다.
서열 80 내지 81은 orf 오페론을 증폭시키는 데 사용되는 올리고뉴클레오티드 프라이머이다.
서열 82 내지 83은 실시예 4의 형질전환체를 확인하는 데 사용되는 올리고뉴클레오티드 프라이머이다.
본 발명자들은 특허 절차의 목적상 미생물의 기탁을 국제적으로 공인하는 부타페스트 조약 (Budapest Treaty)에 의거, 하기 생물 기탁을 수행하였다:
기탁자 식별 표시 국제 기탁 번호 기탁일
에스케리치아 콜라이(Escherichia coli) RJ8n ATCC PAT-4216 2002년 4월 9일
본원에 사용된 "ATCC"는 미국 20110-1109 버지니아주 매나서스 유니버시티 블러버드 10801 소재의 아메리칸 타입 컬쳐 컬렉션 (American Type Culture Collection) 국제 기탁 기관을 나타낸다. "ATCC 번호"는 ATCC에 기탁된 배양물의 허가 번호이다.
상기 기탁물은 지정된 국제 기탁 기관에 30년 이상 보관될 것이며, 이를 개시하는 특허가 허여되면 일반 대중이 입수할 수 있을 것이다. 기탁물을 입수할 수 있다고 하더라도, 이것이 정부 조치에 의해 허여된 특허 권리를 훼손하면서까지 본 발명을 실행하도록 허가하는 것은 아니다.
본 발명은 분자 생물학 분야에 속한다. 보다 구체적으로, 본 발명은 3종 이상의 다른 유전자 또는 오페론을 클로닝하기에 유용한 제한 효소 인식 부위를 포함하는 저카피수 (low-copy-number) 플라스미드 시리즈 (series)에 관한 것이며, 이 때 상기 인식 부위는 각각 터미네이터 서열 및 단백질 발현 수준을 변화시키는 프로모터 세트의 측면에 위치한다. 본 발명은 미생물에서, 특히 다수의 유전자 삽입을 시도하는 경우에 유전공학용으로 유용하다.
본 발명자들은 3개 이상의 유일한 클로닝 부위를 함유하며, 이 때 각각의 클로닝 부위가 전사 터미네이터 및 상이한 강도의 프로모터에 의해 서로 작동가능하게 분리된 구조물 시리즈를 제작함으로써 상기 언급된 문제를 해결하였다. 상이한 강도의 프로모터는 스트렙토마이세스 리비딘스 글루코스 이소머라제 (GI) 프로모터 (서열 1)의 변이체이다. 발현 카세트에서 변이체 GI 프로모터를 생산 플랫폼으로서의 SYCO 플라스미드와 조합하면, 다양한 생물과정 프로젝트에 있어서의 생물촉매 개발에 유용한 시스템이 제공된다.
본 발명은 유전자 발현 수준을 조절하는 벡터에서 내생 또는 외생의 유전자 또는 오페론을 용이하고 안정하게 혼입시키게 해준다. 다수의 유전자 또는 오페론을 발현시키기 위해 하나의 플라스미드를 사용하면, 기존의 방법에서 유전자 산물을 생산하기 위해 요구되던, 이. 콜라이 숙주에서 다수의 플라스미드를 유지하기위해 필요한 항생제 마커의 수가 감소된다. 본 발명을 이용하면 대사성 부담의 영향을 최소화시키고, 재조합 단백질의 수율을 최적화시키고, 형질전환된 숙주 세포의 안정성을 증가시킬 수 있다. 본 발명은 2종 이상의 유전자 또는 오페론을 발현시켜야만 산물이 형성될 수 있는 생물학적 과정에서 유전공학용으로 특히 유용하다.
본 발명자들은 유전자 발현 수준을 변화시키는 신규 GI 프로모터 서열을 제작하였다. 본 발명자들은 GI 프로모터 변이체를 함유하는 발현 카세트를, pCL1920으로부터 유래된 저카피수 플라스미드에 혼입시켜 유전공학용 플라스미드 시리즈를 제작하였다. 전사 터미네이터는 전사 관련 프로모터와 상기 구조물의 외부에 위치하는 다른 프로모터를 구분한다.
또한, 본 발명자들은 10개 이상의 희귀 제한 효소에 대한 클로닝 부위를 함유하며, 또한 이 구조물에서의 클로닝 또는 이 구조물의 다른 플라스미드 또는 벡터 골격으로의 전달을 용이하게 하는 유일한 뉴클레오티드 서열을 제작하였다. 이 유일한 클로닝 부위는 다양한 강도의 적합한 프로모터의 조절하에 발현될 유전자 또는 오페론을 도입할 수 있게 한다. 또한, 해당 구조물은 pUC, pBR322, pACYC, pSC101 등을 비롯하여 당업자에게 공지되고 이들에 의해 고려될 임의의 수의 플라스미드 골격에 용이하게 통합시키기 위한 유일한 클로닝 부위가 측면에 위치할 수 있다.
본 발명자들은 본 발명에서 청구된 물질로 형질전환된 이. 콜라이에서 글루코스로부터 1,3-프로판디올 (3G)을 생합성하는 데 있어서의 본 발명의 특정 용도를입증하였다. 본원에 기재된 저카피수 플라스미드 형태로 발현 카세트를 제작하고, 1,3-프로판디올 생산에 사용되는 유전자를 이 벡터에 클로닝하였다. 본 발명은 다른 발현 시스템에서 유전자 발현을 변화시키는 데 사용될 수도 있다.
정의
하기 정의 및 약어는 청구항 및 명세서를 해석하기 위해 사용된다.
"오픈 리딩 프레임 (open reading frame)"을 ORF로 약칭한다.
"중합효소 연쇄 반응"을 PCR로 약칭한다.
용어 "숙주 세포" 또는 "숙주 생물체"는 외부 또는 이종 유전자, 또는 다수 카피의 내생 유전자를 수용하여 이들 유전자를 발현시킴으로써 활성 유전자 산물을 생산할 수 있는 미생물을 나타낸다.
용어 "DNA 구조물" 또는 "구조물"은 인위적으로 제작된 DNA 단편을 나타낸다.
"유전자"는 상부 조절 서열 (5' 비코딩 서열) 및 하부 코딩 서열 (3' 비코딩 서열)을 포함하는, 특정 단백질을 발현시키는 핵산 단편을 나타낸다. "천연 유전자"는 자신의 조절 서열을 갖는, 자연에서 발견되는 유전자를 나타낸다. "키메라 유전자"는 자연에서는 함께 발견되지 않는 조절과 코딩 서열을 포함하는, 천연 유전자가 아닌 임의의 유전자를 나타낸다. 따라서, 키메라 유전자는 다른 공급원으로부터 유래된 조절 서열과 코딩 서열을 포함하거나, 또는 동일한 공급원으로부터 유래되지만 자연에서 발견되는 서열과는 다른 방식으로 배열된 조절 서열과 코딩 서열을 포함할 수 있다. "내생 유전자"는 생물체의 게놈 내에서 본래 위치에 위치하는 천연 유전자를 나타낸다. "외부", "외생" 또는 "이종" 유전자는 통상적으로 숙주 생물체에서는 발견되지 않으나 유전자 전달에 의해 숙주 생물체에 도입된 유전자를 나타낸다. 외부 유전자는 비-천연 생물체에 삽입된 천연 유전자, 또는 키메라 유전자를 포함할 수 있다. "트랜스 유전자 (transgene)"는 형질전환 방법에 의해 게놈에 도입된 유전자이다. "유전자 구조물"은 1종 이상의 특정 단백질의 발현을 코딩하는 핵산 단편을 나타낸다. 유전자 구조물에서, 유전자는 천연, 키메라 또는 외부 유전자일 수 있다.
용어 "단리된 핵산"은 천연 서열에 자연적으로 수반되는 다른 성분 (예를 들어, 리보솜, 중합효소 및(또는) 기원이 되는 종으로부터 유래된 게놈 측면 서열)으로부터 실질적으로 분리된 핵산 (예를 들어, RNA, DNA 또는 혼합된 중합체)을 나타낸다. 이 용어는 재조합 또는 클로닝된 DNA 단리물, 및 화학적으로 합성된 유사체 또는 이종 시스템에 의해 생물학적으로 합성된 유사체를 포함한다.
용어 "코딩"은 유전자가 전사 및 번역 메카니즘을 통해 아미노산 서열을 제작하는 과정을 나타낸다. 특정 아미노산 서열의 코딩 과정은, 코딩된 아미노산의 변화를 유발하지 않는 염기 변화, 또는 하나 이상의 아미노산을 변화시킬 수 있지만 이 DNA 서열에 의해 코딩된 단백질의 기능적 특성에는 영향을 미치지 않는 염기 변화를 수반할 수 있는 DNA 서열을 포함한다. 따라서, 본 발명은 특정하게 예시된 서열 이외의 것도 포함하는 것으로 이해된다. 서열의 변형, 예를 들어 생성된 단백질 분자의 기능적 특성에는 실질적인 영향을 미치지 않는 사일런트 (silent) 변화를 제작하는 서열의 결실, 삽입 또는 치환도 고려된다. 예를 들어, 유전자 코드의 다의성을 반영하거나, 주어진 부위에서 화학적으로 동등한 아미노산 생산을 초래하는 유전자 서열의 변형이 고려된다. 따라서, 알라닌 아미노산 (소수성 아미노산)에 대한 코돈은 보다 덜 소수성인 잔기 (예를 들어, 글리신) 또는 보다 더 소수성인 잔기 (예를 들어, 발린, 류신 또는 이소류신)를 코딩하는 코돈에 의해 치환될 수 있다. 이와 마찬가지로, 음으로 하전된 하나의 잔기를 다른 잔기로 치환하거나 (예를 들어, 아스파르트산을 글루탐산으로 치환), 또는 양으로 하전된 잔기를 다른 잔기로 치환 (예를 들어, 리신을 아르기닌으로 치환)하여 생성되는 변화 또한 생물학적으로 동등한 산물을 생성할 것으로 기대할 수 있다. 단백질 분자의 N-말단 및 C-말단 부분을 치환하여 생성된 뉴클레오티드 변화가 또한 단백질 활성을 변화시킬 것으로 예상되지는 않을 것이다. 몇몇 경우에는, 실제로 단백질의 생물학적 활성을 변화시키는 효과를 연구하기 위해 서열의 돌연변이체를 제조하는 것이 바람직할 수도 있다. 각각의 제안된 변형은 당업계의 통상의 기술 범위에 포함되고, 코딩된 산물에서의 생물학적 활성 보유 여부를 측정하는 것도 마찬가지이다. 또한, 당업자는 본 발명에 포함되는 서열이 또한 엄격한 조건 (0.1X SSC, 0.1% SDS, 65 ℃) 하에서 본원에 예시된 서열과 혼성화되는 능력에 의해 정의된다는 것을 인지하고 있다.
용어 "발현"은 유전자 산물의 서열을 코딩하는 유전자로부터 유전자 산물로 전사 및 번역하는 과정을 나타낸다.
용어 "프로모터"는 RNA 중합효소가 결합하여 유전자 전사를 개시하는 DNA 영역을 나타낸다.
용어 "전사 터미네이터" 또는 "터미네이터"는 단백질 합성을 종결시키는 유전자 성분을 나타낸다.
용어 "오페론"은 조화롭게 조절되는 유전자 집단 (cluster)을 나타낸다.
용어 "폴리펩티드" 및 "단백질"은 유전자 산물을 나타내기 위해 혼용될 수 있다.
용어 "플라스미드", "벡터" 및 "카세트"는 세포의 중심 대사과정에 참여하지 않는 유전자를 보유하며, 통상적으로 고리형 이중-가닥 DNA 분자 형태인 염색체외 성분을 나타낸다. 상기 성분은 임의의 다른 공급원으로부터 유래된 단일-가닥 또는 이중-가닥 DNA 또는 RNA의 자가 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오티드 서열 (선형 또는 고리형)일 수 있다. 이러한 성분은 선별된 유전자 산물에 대한 프로모터 단편 및 DNA 서열을 번역되지 않은 적절한 3' 서열과 함께 세포에 도입시킬 수 있는 유일한 구조물에 연결되거나 재조합된 다수의 뉴클레오티드 서열을 함유한다. "형질전환 카세트"는 외부 유전자를 함유하며, 외부 유전자 이외에도 특정 숙주 세포의 형질전환을 용이하게 하는 성분을 갖는 특정 벡터를 나타낸다. "발현 카세트"는 외부 유전자를 함유하며, 외부 유전자 이외에도 그의 숙주에서 상기 유전자의 발현을 증가시키는 성분을 갖는 특정 벡터를 나타낸다.
용어 "제한 효소"는 특이적이고 유일한 내부 위치에서 주어진 길이의 DNA를 절단하는 효소 군을 나타낸다. DNA에 절단 부위를 생성시킴으로써, 제한 효소는 후속 스플라이싱 (splicing) 또는 DNA 절편의 내부 위치로의 삽입을 가능하게 한다. 용어 "제한 효소 부위" 또는 "제한 효소 인식 부위"는 주어진 제한 효소에 의해 "인식"되어 절단되는 DNA 분자 내의 뉴클레오티드 서열 (염기쌍)을 나타낸다.
제한 효소 부위에 적용되는 용어 "희귀"는 유전자에서 주어진 서열이 낮은 빈도수로 발생하는 것을 나타낸다. 본 발명의 목적상 희귀 제한 효소 부위의 바람직한 군은 AscI, NheI, PacI, RsrII, NsiI, SacII, MluI, AgeI, SapI 및 SnaBI이다.
용어 "클로닝 부위"는 DNA가 삽입될 수 있는 벡터 상의 위치를 나타낸다. 용어 "다중 클로닝 부위" 또는 "mcs"는 벡터 상의 정해진 위치 (제한 효소 부위)에서의 삽입을 허용하는 어느 하나 또는 다수의 상이한 제한 효소 부위를 함유하는 합성 DNA 서열을 나타낸다. 용어 "유일한 클로닝 부위"는 주어진 DNA 서열이 1회 나타나는 클로닝 부위를 나타낸다.
벡터 성분의 상대적인 위치를 설명하는 경우, 관심있는 해당 부위 또는 좌위가 2개의 다른 부위 또는 좌위를 둘로 분리하는 DNA의 중간에 존재한다면, 상기 부위 또는 좌위가 2개의 다른 부위 또는 좌위의 "사이"에 위치한다고 표현한다. 고리형 벡터인 경우, 관심있는 해당 부위 또는 좌위가 벡터 상에서 2개의 다른 부위를 분리하는 최단 길이의 DNA 내에 존재한다면, 상기 부위 또는 좌위가 2개의 다른 부위의 "사이"에 위치한다고 표현한다. 해당 부위 또는 좌위는, 관심있는 부위 또는 좌위의 상부 또는 하부에 위치한 다른 부위의 "측면에" 위치한다고 표현한다.
용어 "유전자적으로 변화된"은 형질전환 또는 돌연변이화에 의해 유전 물질이 변화하는 과정을 나타낸다. 용어 "형질전환" 및 "형질감염"은 핵산을 혼입시킨 후에 세포가 새로운 유전자를 획득하는 것을 나타낸다. 획득한 유전자는 염색체DNA에 통합되거나, 또는 염색체외 복제 서열로서 도입될 수 있다. 용어 "형질전환체"는 형질전환의 산물을 나타낸다.
용어 "글리세롤 데히드라타제" 또는 "데히드라타제 효소"는 글리세롤 분자를 이성질체화 또는 전환시켜 3-히드록시프로피온알데히드를 생성할 수 있는 조효소 B12-의존성 효소 활성을 담당하는 폴리펩티드를 나타낸다. 본 발명의 목적상, 데히드라타제 효소는 바람직한 기질이 각각 글리세롤 및 1,2-프로판디올인 글리세롤 데히드라타제 (진뱅크 (GenBank) U09771, U30903) 및 디올 데히드라타제 (진뱅크 D45071)를 포함한다. 케이. 뉴모니아 (K. pneumoniae) ATCC 25955의 글리세롤 데히드라타제는 유전자 dhaB1, dhaB2 및 dhaB3 (진뱅크 U30903)에 의해 코딩된다. dhaB1, dhaB2 및 dhaB3 유전자는 각각 글리세롤 데히드라타제 효소의 α, β 및 γ서브유닛 (subunit)을 코딩한다. 글리세롤 데히드라타제 및 디올 데히드라타제는 조효소 B12를 사용하는 복합체 (α2β2γ2서브유닛 조성을 가짐)이다.
글리세롤 및 디올 히드라타제는 글리세롤 및 몇몇 다른 기질에 의한 메카니즘-기초의 자멸 (suicide) 불활성화를 거치게 된다 (문헌 [Daniel et al., FEMS Microbiol. Rev. 22:553 (1999)]). 용어 "데히드라타제 재활성화 인자"는 데히드라타제 활성의 재활성화를 담당하는 단백질을 나타낸다. 용어 "데히드라타제 재활성화 활성", "데히드라타제 활성의 재활성화" 또는 "데히드라타제 활성의 재생"은 기질에 대한 촉매 작용이 없는 데히드라타제가 기질에 대한 촉매 작용이 있는 데히드라타제로 전환되는 현상, 데히드라타제 불활성화가 억제되는 현상, 또는 생체 내데히드라타제 효소의 유용한 반감기가 연장되는 현상을 나타낸다. 두 가지 단백질이 데히드라타제 재활성화 인자로서 관련되어 있다는 것이 확인되었다 (WO 9821341 (US 6013494; 본원에 참고문헌으로 포함된 것으로 간주함) 및 그의 참조 문헌; 다니엘 (Daniel) 등의 상기 문헌; 문헌 [Toraya and Mori, J. Biol. Chem. 274:3372 (1999)]; 및 [Tobimatsu et al., J. Bacteriol. 181:4110 (1999)] 참조).
용어 "옥시도리덕타제 (oxidoreductase)" 또는 "1,3-프로판디올 옥시도리덕타제"는 3-히드록시프로피온알데히드를 1,3-프로판디올로 환원시키는 반응을 촉매할 수 있는 효소 활성을 담당하는 폴리펩티드를 나타낸다. 1,3-프로판디올 옥시도리덕타제는, 예를 들어 dhaT 유전자 (진뱅크 U09771, U30903)에 의해 코딩되는 폴리펩티드를 포함한다. 별법으로, 클로스트리디움 (clostridium)의 유전자 adhB와 40% 동일한 이. 콜라이 오픈 리딩 프레임 (NADH-의존성 부탄올 데히드라타제 2로 추정)인 yqhD는 1,3-프로판디올 옥시도리덕타제 (WO 0112833)로서 작용하는 폴리펩티드를 코딩한다.
pSYCO 플라스미드 (pSYCO101, pSYCO103, pSYCO106, pSYCO109, pSYCO106mcs 및 pSYCO109mcs)에 의해 발현되는 효소는 모두 글리세롤 데히드라타제, 데히드라타제 재활성화 인자, 글리세롤-3-포스페이트 데히드로게나제 및 글리세롤-3-포스파타제 발현에 필요한 유전자를 포함한다고 말할 수 있다.
용어 "발효가능한 탄소 기질" 및 "발효가능한 탄소 공급원"은 본 발명의 숙주 생물체에 의해 대사될 수 있는 탄소 공급원을 나타내며, 특히 모노사카라이드, 올리고사카라이드, 폴리사카라이드, 글리세롤, 디히드록시아세톤 및 1-탄소 기질,또는 이들의 혼합물로 이루어진 군으로부터 선택된 탄소 공급원을 나타낸다.
강도가 다른 GI 프로모터 변이체를 사용하는 유전자 발현 시스템
효과적인 유전자 발현 시스템을 위한 최소의 요구조건은 클로닝된 유전자의 상류에 프로모터 (RNA 중합효소가 결합하여 전사를 시작하는 DNA 상의 부위)가 존재하는 것이다. 대체로 강한 프로모터 (RNA 중합효소에 대한 친화성이 높은 프로모터)가 사용되면 근접한 하류 영역이 고도로 또는 빈번하게 전사된다.
프로모터에서, 프로모터 강도 (하류 유전자가 전사되는 수준)를 결정하는 주요 서열 결정인자를 가장 높은 정도로 보존된 염기쌍이다. 보존된 서열로부터 편차가 있는 프로모터는 전사 개시 빈도를 감소시킨다 (문헌 [Hawley, D.K.; McClure, W.R., Nucleic Acids Res., 11:2237-2255 (1983)]).
이. 콜라이 RNA 중합효소에 대한 프로모터는 전사 시작 부위로부터 약 10 및 35 염기쌍 상류에 위치한 2개의 보존된 DNA 서열 영역을 함유하는 것으로 밝혀졌다. 12개의 염기쌍이 프로모터들 사이에 가장 높게 보존되어 있는 것으로 밝혀졌다. 이들 염기쌍은 35 염기쌍 상류 주위 (소위, -35 영역)의 TTGACA, 및 10 염기쌍 상류 주위 (소위, -10 영역)의 TATAAT이다. -10과 -35 영역 사이의 최저 간격은 17 염기쌍 길이이다. 프로모터는 상기 간격이 17 염기쌍에 가까울수록 보다 강해지지만, 간격이 15 및 20 염기쌍 길이인 프로모터도 부분적인 기능을 보유한다.
본 발명자들은 스트렙토마이세스 리비딘스 글루코스 이소머라제 (GI) 프로모터의 변이체를 혼입시킨 구조물 시리즈를 제작하였다. 이 구조물은 필요에 따라 유전자 발현 수준을 변화시키는 능력을 부여하도록 소정 범위의 상이한 강도를 지닌 프로모터 변이체의 라이브러리 또는 키트를 형성한다. 스트렙토마이세스 글루코스 이소머라제 (EC 5.3.1.9)는 글루코스-6-포스페이트가 프럭토스-6-포스페이트로 전환되는 과정을 촉매한다. 포스포글루코스 이소머라제 (pgi)를 코딩하는 유전자의 전사는 특징적인 -10 기호 (signature) 서열 (AATAAT)및 특징적인 -35 기호 서열 (TTGACA)을 함유하는 프로모터에 의해 조절된다. 포화 돌연변이유발이 프로모터의 -35 영역에서 수행되지만, -35 영역으로부터 대략 122 염기쌍만큼 상류에 위치하는 SpeI 제한 효소 부위에 대한 변화 또한 발현된 유전자 활성에 영향을 미친다. 또한, -10 영역과 상기 프로모터 말단 사이의 25개의 염기쌍이 결실되면 SpeI 제한 효소 인식 부위가 변화하더라도 효소 활성이 86% 남아있게 된다. 이러한 특정 결과는 이전에는 보고되지 않았다.
RNA 합성의 전사 종결은 DNA 상의 특정 염기 서열에서 일어나며, 전사 종결을 조절한다. 통상적인 DNA 상의 종결 서열은 반복되지 않는 중심 절편과 함께 역위된 (inverted) 반복 서열을 함유한다. 상기 DNA 서열이 전사되는 경우, RNA는 가닥내에 염기쌍이 형성되어 스템-루프 (stem-loop) 구조를 형성할 수 있다. RNA에서 스템-루프 구조 뒤쪽에 우리딘이 계속 연결되는 경우, 이는 효과적인 전사 터미네이터가 된다. 다른 종결 부위는 GC-풍부한 서열 뒤에 AT-풍부한 서열이 존재하는 영역이다. 이러한 종류의 구조는 임의의 다른 추가 인자를 첨가하지 않고도 전사 종결을 유도하며, 이들은 종종 고유의 터미네이터 또는 rho-독립성 터미네이터로 언급된다.
다른 타입의 터미네이터 서열은 그 기능을 위해 RNA 중합효소 이외에도 이.콜라이로부터의 Rho와 같은 단백질 인자를 필요로 한다고 밝혀졌다. Rho는 RNA 중합효소 또는 DNA에 결합하지 않지만 RNA에 단단하게 결합하여 사슬을 RNA 중합효소-DNA 복합체를 향하여 하향 이동시킨다. 일단 RNA 중합효소가 Rho-의존성 종결 부위에서 정지하면, Rho는 RNA 및 중합효소를 DNA로부터 이탈시켜 전사를 종결시킬 수 있다. 전사 종결과 관련된 다른 단백질은 Rho와 마찬가지로 RNA-결합 단백질이다. 종결과 관련된 서열은 모든 경우에 RNA 수준에서 작동한다. 그러나, RNA는 DNA로부터 전사되기 때문에 전사 종결은 궁극적으로 DNA 상의 특이적인 뉴클레오티드 서열에 의해 결정된다 (문헌 [Madigan, M.T.; Martinko, J.M.; Parker, J.; Brock Biology of Microorganisms, 8thed., Prentice Hall; Upper Saddle River, NJ (1997)]).
본 발명자들은 텐덤으로 위치한 3개의 다른 터미네이터 서열을 포함하는 종결 영역을 제작하였다. 이 3개의 터미네이터는 유전자 또는 오페론의 클로닝에 유용한 제한 효소 부위의 측면에 위치한다. tonB 터미네이터는 이. 콜라이 tonB 유전자와 반대편 유전자 사이에서 발견되는 2-방향성 rho-독립성 전사 터미네이터이다 (문헌 [Postle, K.; Good, R.F., Cell, 41, 577-585 (1985)]). thr 어테뉴에이터 (attenuator) (다른 rho-독립성 터미네이터와 구조적으로 유사함)는 이. 콜라이 트레오닌 오페론의 전사 종결을 용이하게 한다 (문헌 [Yanget et al., J. Biol. Chem., 270:23330-23336 (1995)]). rho-독립성 터미네이터의 구조적 특성을 갖는 aspA 터미네이터는 이. 콜라이 아스파르타제 오페론의 전사 종결을 용이하게 한다(문헌 [Takagi et al., Nucleic Acids Res., 13:2063-2074 (1985)]).
자발적이고 자기-복제적인 유전자 성분으로서의 플라스미드는 이를 클로닝된 DNA를 보유하는 잠재적인 벡터로 만드는 데 기여한다. 자연-발생 플라스미드는 대체로 질이 높은 클로닝 벡터에 필요한 몇몇 중요한 특징이 결여되어 있다. 이러한 특징으로는 (1) 작은 크기 (외생 DNA의 숙주로의 효율적인 전달에 필수적임), (2) 삽입 DNA가 클로닝될 수 있는 유일한 제한 효소 인식 부위, 및 (3) 수용 세포가 클로닝 벡터-삽입 DNA 구조물을 보유하고 있는지 확인하기 위한 1종 이상의 선별가능한 유전자 마커가 있다. 결과적으로, 플라스미드 클로닝 벡터는 유전공학적으로 제작된다 (문헌 [Glick, B.R., Pasternak, J.J., Molecular Biotechnology Principles and Applications of Recombinabt DNA, 2nded., American Society for Microbiology, Washington, DC (1998)]).
pCL1920/21 벡터는 lac 프로모터/오퍼레이터를 보유하는 580 염기쌍의 BstUI 단편, 다중 클로닝 부위, 및 pGB2 (이. 콜라이에서 스펙티노마이신 및 스트렙토마이신에 대한 내성을 부여하는 pSC101-유래된 플라스미드임)의 폴리링커 영역 대신 클로닝된 pUC19의 lacZ 단편을 함유하는 한 쌍의 저카피수 플라스미드이다. pCL1920/21 벡터의 플라스미드 카피수 (세포당 5 카피)는 pUC 벡터의 플라스미드 카피수 (세포 당 200 카피)와 40배 차이가 난다. 따라서, pCL1920/21 벡터는 균주로 형질전환된 경우 프로모터-오퍼레이터의 하류에 삽입된 유전자의 낮은 수준의 발현을 조절한다. 이들은 또한 고카피수인 경우에 유해할 수 있는 유전자를 클로닝하는 데 유용할 것이다. pCL1920/21 벡터는 ColE1-유래된 플라스미드와 상용성이기 때문에, 이들은 pBR322 또는 pUC 유래된 플라스미드와 함께 형질전환된 안정한 형질전환체를 형성하는 데 사용될 수 있다 (문헌 [Lerner et al., Nucleic Acids Res., 18:4631 (1990)]).
본 발명의 플라스미드는 물질의 생물학적 생산을 조절하기 위해 사용되는 다양한 숙주에서 사용될 수 있다.
염색체상에 위치하는 임의의 외생 유전자 또는 오페론의 천연 프로모터 치환에 의한 전사 수준의 변화
청구된 프로모터 변이체 (서열 31 및 32를 포함하는 구조물)는 유전자 또는 오페론의 전사 수준을 변화시키기 위해 임의의 외생 유전자 또는 오페론과 관련된 염색체상에 위치하는 천연 프로모터를 치환하기 위한 방법에 사용될 수 있다. 그 결과 단백질 생산 수준이 변화한다. 치환될 프로모터는 문헌 [Datsenko and Wanner, (2000) PNAS 97:6640-6645]의 λ레드 방법 또는 이와 동등한 방법이 작동가능한 임의의 미생물의 임의의 유전자일 수 있다.
상기 방법에서, 표적 유전자의 5'-코딩 영역에 작동가능하게 연결된 산개형으로 배열된 비-천연 프로모터에 작동가능하게 연결된 선별가능한 마커를 포함하는 키메라 DNA 분자는 중합효소 연쇄 반응 (PCR)에 의해 합성된다. 이 합성 과정은 (1) 한 쌍의 화학적으로 합성된 프라이머, 즉 (a) (i) 치환될 표적 천연 프로모터 말단의 DNA 영역, (ii) 비-천연 프로모터 및 (iii) 선별가능한 마커의 3' 또는 5' 말단으로부터의 DNA 영역을 포함하는 1차 프라이머, 및 (b) (i) 표적 삽입 부위에인접한 DNA 영역 및 (ii) 1차 프라이머에서 사용된 선별가능한 마커의 반대편 말단으로부터의 DNA 영역을 포함하는 2차 프라이머; 및 (2) 선별가능한 마커를 코딩하는 DNA 주형을 사용하여 달성할 수 있다. 이 산물은 다트센코 (Datsenko) 및 워너 (Wanner)의 상기 문헌의 방법을 이용하여 임의의 숙주 세포의 염색체 표적 부위에서 상기와 같이 합성된 DNA 산물에 통합된다. 이 프로토콜의 결과는 표적 천연 프로모터(들)을 비-천연 프로모터를 보유하는 PCR-합성된 키메라 분자로 치환하는 것이다.
상기 방법을 확장하여, 생물학적 촉매 과정 수행시 유전자 발현 수준을 변화시키는 효과를 평가하는 데 이용할 수 있다.
이. 콜라이에서 글루코스로부터의 1,3-프로판디올 (3G) 생합성
본 발명의 플라스미드를 이. 콜라이에서 글루코스로부터 1,3-프로판디올 (3G)을 생합성하는 데 사용할 수 있다. 본 발명의 실시예는 청구된 발명품과 발효가능한 탄소 기질을 1,3-프로판디올로 전환시키는 데 필요한 유전자 기구를 혼입시킨 생산용 생물체 제작을 포함한다.
1,3-프로판디올 생산과 관련된 유전자에는 데히드라타제 유전자 (통상적으로 글리세롤 또는 디올 데히드라타제) 및 옥시도리덕타제 뿐만 아니라, 데히드라타제 효소의 집합 또는 안정성 유지를 보조할 것으로 예상되는 다른 단백질들도 포함된다. 이들 유전자는 숙주 세포에 도입된 트랜스 유전자이거나, 또는 외생 유전자일 수 있다. 이들 유전자 중 하나 이상이 트랜스 유전자일 것이고, 생산용 세포에 도입될 것이다. 탄소 기질을 1,3-프로판디올로 전환시키는 효소 경로를 코딩하는 필수 유전자를 함유하는 재조합 생물체는 당업계에 공지된 기술을 이용하여 제작될 수 있다. 이어서, 형질전환된 생산용 세포를 1,3-프로판디올 생산에 적절한 조건하에서 증식시킨다.
이. 콜라이에서 1,3-프로판디올을 생산하는 방법은 이미 기재되어 있다 (US 5,633,362; US 5,821,092; US 5,686,276; US 6,025,184; US 6,013,494; US 5,599,689; US 6,136,576). 다수의 상이한 유전자의 발현은 글로코스로부터 재조합 이. 콜라이에 의해 1,3-프로판디올을 생산하는 것과 관련되어 있다. 글리세롤 데히드라타제 (dhaB) 및 1,3-프로판디올 옥시도리덕타네 (dhaT)를 코딩하는 유전자를 클렙시엘라 (Klebsiella)와 같은 천연 숙주로부터 단리하고, 숙주 균주 (예를 들어, 이. 콜라이 균주 DH5α 또는 FM5; 케이. 뉴모니아 (K. pneumoniae) 균주 ATCC 25955; 케이. 옥시토카 (K. oxytoca) 균주 ATCC 8724 또는 M5a1; 에스. 세레비지아 (S. cerevisiae) 균주 YPH499; 피. 파스토리스 (P. pastois) 균주 GTS115; 및 에이. 니거 (A. niger) 균주 FS1)를 형질전환시키는 데 사용한다.
클렙시엘라 뉴모니아 (Klebsiella pneumonia), 시트로박터 프레운디 (Citrobacter freundii) 및 클로스트리디움 파르퇴리아눔 (Clostridium pasteurianum)에서, 글리세롤 데히드라타제의 3개의 구조 서브유닛을 코딩하는 유전자 (dhaB1-3 또는 dhaB, C 및 E)는 특이적인 1,3-프로판디올 옥시도리덕타제 (dhaT)를 코딩하는 유전자에 가까이 위치한다. 이들 미생물 사이에서 유전자 구성이 다소 다르지만, 이들 유전자는 orfX 및 orfZ (글리세롤 데히드라타제에 대한 데히드라타제 재활성화 인자를 코딩하는 유전자) 뿐만 아니라 orfY 및 orfW (기능이알려지지 않은 유전자)를 포함하는 군에 군생한다. 이들 미생물의 특이적인 1,3-프로판디올 옥시도리덕타제 (dhaT)는 제3형 알코올 데히드로게나제 족에 속하는 것으로 공지되어 있으며, 이들은 각각 보존된 철-결합 모티프를 나타내고, NAD+/NADH가 관여하는 1,3-프로판디올과 3-HPA의 상호전환에 대해 선호도를 나타낸다. 그러나, NAD+/NADH가 관여하는 1,3-프로판디올과 3-HPA의 상호전환은 또한, 보다 덜 효율적인 반응속도 파라미터를 갖지만 데히드라타제 효소에 특이적으로 관여하지 않는 알코올 데히드로게나제에 의해 촉매된다 (예를 들어, 말의 간 및 제빵용 효모 알코올 데히드로게나제 (E.C. 1.1.1.1)). 글리세롤 데히드라타제 (E.C. 4.2.1.30)와 디올 [1,2-프로판디올] 데히드라타제 (E.C. 4.2.1.28)는 서로 관련되어 있지만, 별개의 유전자에 의해 코딩되는 별개의 효소이다. 클렙시엘라 옥시토카 (Klebsiella oxytoca) 및 살모넬라 타이피무리움 (Salmonella typhimurium)으로부터의 디올 데히드라타제 유전자는 글리세롤 데히드라타제 유전자와 유사하고, orfX 및 orfZ와 유사한 유전자를 포함하는 군에 군생한다 (문헌 [Daniel et al., FEMS Microbiol. Rev. 22:553 (1999)]; [Toraya and Mori, J. Biol. Chem. 274:3372 (1999)]; 진뱅크 AF026270).
글리세롤-3-포스페이트 데히드로게나제 (DAR1, GPD1)를 코딩하는 유전자는 에스. 디아스타티쿠스 (S. diastaticus)로부터 클로닝되어 서열분석되었다 (문헌 [Wang et al., J. Bact. 176:7091-7095 (1994)]). DAR1 유전자를 셔틀 (shuttle) 벡터에 클로닝하고, 이를 발현시켜 활성 효소를 생산하는 이. 콜라이의 형질전환에사용하였다. 왕 (Wang)과 그의 동료들은 (상기 문헌) DAR1이 세포내 삼투압 환경에 의해 조절된다는 것을 인지하고 있지만, 이 유전자가 재조합 미생물에서의 1,3-프로판디올 생산을 증가시키는데 사용될 수 있는 방법은 제안하지 않았다.
다른 글리세롤-3-포스페이트 데히드로게나제 효소가 단리되어 있다. 예를 들어, sn-글리세롤-3-포스페이트 데히드로게나제는 사카로마이세스 세레비지아 (Saccharomyces cerevisiae)로부터 클로닝되어 서열분석되었다 (문헌 [Larason et al., Mol. Microbiol. 10:1101 (1993)]). 문헌 [Albertyn et al., Mol. Cell. Biol. 14:4135 (1994)]은 사카로마이세스 세레비지아로부터의 글리세롤-3-포스페이트 데히드로게나제를 코딩하는 GPD1의 클로닝 방법을 교시하고 있다. 왕과 그의 동료들과 같이 (상기 문헌), 알버틴 (Albertyn)과 그의 동료들, 및 라라손 (Larason)과 그의 동료들은 이 유전자의 조절이 삼투압-민감성이라는 것을 인지하고 있지만, 이 유전자가 재조합 미생물에서 1,3-프로판디올을 생산하는 데 사용될 수 있는 방법은 제안하지 않았다.
G3PDH와 같이, 글리세롤-3-포스파타제를 사카로마이세스 세레비지아로부터 단리하여, 이 단백질이 GPP1 및 GPP2 유전자에 의해 코딩된 것으로 확인되었다 (문헌 [Norbeck et al., J. Biol. Chem. 271:13875 (1996)]). G3PDH를 코딩하는 유전자와 같이, GPP2도 삼투압에 민감한 것으로 보인다.
본 발명은 본 발명의 바람직한 실시양태를 나타내는 하기 실시예에 추가로 정의되어 있다. 상기 논의 및 하기 실시예로부터, 당업자는 본 발명의 필수적인특징을 확인할 수 있으며, 본 발명의 취지 및 범위에서 벗어나지 않고 본 발명을 다양한 용도 및 조건에 적합하도록 다양하게 변화 및 변형시킬 수 있다.
일반적인 방법
실시예에 이용된 표준 재조합 DNA 및 분자 클로닝 기술은 당업계에 공지되어 있으며, 문헌 [Sambrook, J., Fritsch, E.F. and Maniatis, T. Molecular Cloning:A Laboratory Manual; Cold Spring Harbor Laboratory Press: Cold Spring Harbor, (1989) (Maniatis)] 및 [T.J. Silhavy, M.L. Bennan, and L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1984)] 및 [Ausubel, F.M. et al., Current Protocols in Molecular Biology, pub. by Greene Publishing Assoc. and Wiley-lnterscience (1987)]에 기재되어 있다.
박테리아 배양물의 유지 및 증식에 적합한 재료 및 방법이 당업계에 공지되어 있다. 하기 실시예에서 이용하기에 적합한 기술은 문헌 [Manual of Methods for General Bacteriology (Phillipp Gerhardt, R.G.E. Murray, Ralph N. Costilow, Eugene W. Nester, Willis A. Wood, Noel R. Krieg, and G. Briggs Philips, eds), American Society for Microbiology, Washington, DC (1994)] 또는 [Thomas D. Brock in Biotechnology: A Textbook of Industrial Microbiology. Second Edition, Sinauer Associates, Inc., Sunderland, MA (1989)]에서 찾아볼 수 있다. 박테리아 세포의 증식 및 유지에 사용되는 모든 시약, 제한 효소 및 재료는 달리 설명되지 않는 한 알드리치 케미칼즈 (Aldrich Chemicals) (위스콘신주,밀워키), 디프코 레버러토리즈 (DIFCO Laboratories) (미시간주, 디트로이트), GIBCO/BRL (메릴랜드주, 게이더스버그), 뉴 잉글랜드 바이오랩스 (New England Biolabs) (메사추세츠주, 베벌리) 또는 시그마 케미칼 컴퍼니 (Sigma Chemical Company) (미주리주, 세인트 루이스)로부터 수득하였다.
약어의 의미는 하기와 같다: "h"는 시간을 의미하고, "min"은 분을 의미하고, "sec"는 초를 의미하고, "d"는 일을 의미하고, "mL"은 밀리리터를 의미하고, "L"은 리터를 의미하고, "mm"은 밀리미터를 의미하고, "nm"은 나노미터를 의미하고, "mM"은 밀리몰농도를 의미하고, "M"은 몰농도를 의미하고, "mmol"은 밀리몰을 의미하고, "μmole"은 마이크로몰을 의미하고, "g"는 그램을 의미하고, "μg"은 마이크로 그램을 의미한다.
실시예 1
글루코스 이소머라제 프로모터 변이체 제작
스트렙토마이세스 리비딘스 글루코스 이소머라제 (GI) 프로모터 (서열 1)는 특징적인 -10 기호 서열 (AATAAT) 및 특징적인 -35 기호 서열 (-35 T, -34 T, -33 G, -32 A, -31 C, -30 A)을 함유한다. 혼합된 염기 올리고뉴클레오티드를 사용하여, pMP38 (하기 실시예 6에 기재됨) 중 GI 프로모터의 -35 영역에서의 포화 돌연변이유발을 표준 PCR에 의해 수행하였다. 6가지의 각 PCR 반응에서, 상류 프라이머 (서열 2)를 6개의 하류 프라이머 (서열 3 내지 8; 이들 각각은 -35 영역의 단일 위치에 4가지 가능한 염기 (N으로 표기함) 모두의 동등한 혼합물을 함유함) 중 하나와 한 쌍을 이룬다. 또한, 상류 프라이머는 EcoRI 부위 바로 아래의 SpeI 제한효소 부위 (ACTAGT)를 AvrII 제한 효소 부위 (CCTAGG)로 변화시키는 2개의 단일 염기쌍 변화를 혼입시켰다. 6가지 PCR 산물을 EcoRI 및 HindIII로 분해하고, 이들을 각각 EcoRI/HindIII로 분해시킨 pMP38과 라이게이션시켰다. 라이게이션 반응물로 이. 콜라이를 형질전환시키고, SpeI의 AvrII로의 전환에 의한 제한 효소 분석을 통하여 재조합 플라스미드를 확인하고, 뉴클레오티드 서열을 분석하였다. 재조합 플라스미드만이 가능한 -35 영역 변화를 수용할 것으로 예상될 것이다. 24개의 가능한 재조합 결과물 (6 위치의 4 염기) 중, 18개를 수득하였고, 이 중에서 13개가 -35 영역에서의 변화를 나타내었다 (표 1).
-35 영역에서의 가능한 18가지 변화 결과물 중 5가지 변화 결과물이 단리되지 않았지만, 이들은 클로닝되거나 또는 염색체 상에 코딩된 천연 및 비-천연 유전자 또는 오페론의 발현 수준을 변화시키는 데 유용할 수도 있다. 이 5개의 추가 GI 프로모터 변이체를 표 2에 나타내었다.
다른 잠재적인 GI 프로모터 변이체
위치 염기 서열
-31 C G 24
T 25
-32 A G 26
T 27
-33 G T 28
실시예 2
글리세롤 데히드라타제 활성 측정에 의한 글루코스 이소머라제 프로모터 변이체 분석
글리세롤 데히드라타제 (GDH; dhaB1-3에 의해 코딩됨) 활성을 GI 프로모터 돌연변이의 효과를 측정하기 위한 리포터 (reporter)로서 사용하였다 (표 3). -35 영역에서 변화가 일어나지 않더라도, SpeI이 AvrII로 전환되는 2개 염기쌍 변화 (예를 들어, P1.6)에 의해서도 GDH 활성이 현저하게 감소하는 것이 관찰되었다. 또한, P3.4는 -35 영역에서 돌연변이화되지는 않았지만 -10 영역 바로 아래의 25개 염기 쌍이 결실되었으며, 야생형 프로모터의 강도와 거의 유사한 (86%) 것으로 측정되었다.
기질로서 글리세롤 또는 1,2-프로판디올을 사용하여 무세포 추출물에서의 데히드라타제 활성을 측정하였다. 프렌치 프레스 (French press)를 이용하여 세포를 파괴한 후에 세포 파쇄물을 원심분리함으로써 무세포 추출물을 제조하였다. 알데히드의 메틸벤조-2-티아졸론 히드라존과의 반응을 기초로 하는 이 분석은 문헌 [Forage and Foster, Biochim. Biophys. Acta 569:249 (1979))]에 기재되어 있다.
실시예 3
LUX 분석법은 이용한 GI 프로모터 변이체 분석
GI 프로모터 변이체로부터 유도된 발현 수준을 측정하기 위해 제2 타입의 리포터를 사용하였다. 박테리아 생물발광은 5개의 구조 유전자 (luxA, luxB, luxC, luxD 및 luxE)가 협력하여 빛을 발생시키는 현상이다. luxD 산물은 전구체로부터 C14 지방산을 생성한다. C14 지방산은 ATP 의존성 반응에서 활성화되어 luxE 산물의 작용을 통해 아실-효소 컨주게이트를 형성하고, 이는 생물발광 현상을 세포내의 왕성한 활동 상태와 결부시킨다. 아실-효소 (luxE 산물)는 아실 기를 luxC 산물에 제공하는 전달제로서 작용한다. 이어서, NADPH가 아실 컨주게이트를 C14 알데히드로 환원시키는 전자쌍 및 양성자 도너로서 작용하는 반응에서 아실-LuxC 2원 복합체가 환원된다. 이 반응은 세포의 환원력을 박테리아 광 방출과 결부시킨다. 루시퍼라제 (luxA 및 luxB의 산물)에 의해 촉매되는 상기 발광 반응은 빛을 생성한다. 광 방출에 사용되는 에너지는 알데히드가 지방산으로 전환되는 반응 및 FMNH2산화 반응에 의해 제공되며, 이는 빛 생성과 세포내 에너지 상태 사이에 또다른 결부 근거를 제공한다.
포토라브두스 루미네센스 (Photorabdus luminenscens) luxAB 유전자를 GI 프로모터 변이체 강도에 대한 리포터로 사용하였다 (문헌 [Van Dyk et al., Appl. Environ. Microbiol., 180:785-792 (1995)]). 피. 루미네센스 (P. luminenscens) luxAB 유전자를 보유하고, 3' 및 5' 말단에 SpeI 부위를 함유하고, luxA의 개시 코돈에 설계된 NcoI 부위를 함유하는 PCR 단편을 pMCS5 (MobiTec, 독일, 괴팅겐 (Goettingen))의 SpeI 부위에 서브클로닝하여 pJT13을 제작하였다. 이어서, SwaI/NcoI 말단을 갖는 유전자 SOEing PCR-기재의 카나마이신 카세트를 SwaI/NcoI-분해된 pJT13에 클로닝하여 pJT14.HIGHCOPY (고카피수 luxAB 프로모터 프로브)를 제작하였다. 이어서, pJT14.HIGHCOPY를 SpeI으로 분해하여 luxAB::카나마이신 카세트를 제작하였으며, 이를 pRJ50 (서열 79)의 유일한 NheI 부위 (SpeI과 상용성임)에 서브클로닝하여 pJT14.LOWCOPY.1 (저카피수 luxAB 프로모터 프로브)를 제작하였다. GI 프로모터 1.6, 1.5, 1.20, 및 천연 프로모터를 NotI/NcoI 단편으로 pJT14.HIGHCOPY 및 pJT14.LOWCOPY에 클로닝하여 각각 고카피수 구조물 pJT18, pJT19, pJT20 및 pJT25, 및 각각 저카피수 구조물 pJT21.1, pJT22.1, pJT23.1 및 pJT26.1을 제작하였다. 이어서, 생체 내 생물발광 측정을 위해 선별된 이. 콜라이 균주를 상기 플라스미드로 형질전환시켰다.
문헌 [Van Dyk and Rosson, Methods in Molecular Biology, Vol. 102:Bioluminescence Methods and Protocols, 85 (1998)]에 기재된 바와 같이 이. 콜라이 리포터 균주의 배양액, 알데히드 기질로서의 n-데칸알 및 발광측정기를 사용하여 발광도에 의해 프로모터 강도를 측정하였다. 이. 콜라이 클론을 신선한 아가 플레이트로부터 적절한 항생제가 포함된 표준 루리아-베르타니 (Luria-Bertani) 액체 증식 배지를 함유하는 시험 튜브에 접종하고, 37 ℃에서 대략 16시간 동안 호기성 조건하에 (진탕하면서) 증식시켰다. 이어서, 세포를 신선한 배지 25 mL를 함유하는 100-mL 들이 플라스크에서 배양하고, 동일한 조건하에 대략 8 내지 10시간 동안 증식시켰다. 이어서, 각각의 배양액으로부터 분취액 (200 μL)을 취하고, 각각 600 nm에서의 광학 밀도 측정 (스펙트라막스 190 플레이터 판독기 (SpectraMax 190 Plater Reader), 캘리포니아주 서니배일 소재의 몰레큘라 디바이스 코포레이션 (Molecular Devices Corporation)) 및 발광도 측정 (루미노스칸 액센트 타입 392 (Luminoscan Ascent TAype 392), 핀란드 헬싱키 소재의 랩시스템즈 (Labsystems) 사)을 위하여 96-웰의 투명한 백색 플레이트로 옮겼다. 발광도 판독의 경우, 2μL의 외생 알데히드 (n-데칸알)를 각각의 웰에 첨가하여 측정하였다. 이 분석의 결과를 표 4에 나열하였다. 이 발광도 측정값은 글리세롤 데히드라타제 분석에 의해 나타난 것과 유사한 수준의 프로모터 강도를 나타내었다.
실시예 4
상이한 수준의 유전자 발현을 달성하기 위한 단축된 GI 프로모터 서열 사용
yqhD 유전자가 염색체 상에서 파괴되어 생성된 RJ8n (yqhD-) 균주에서 pSYCO109mcs 플라스미드 (실시예 8에 기재됨, 서열 30)로부터의 이. 콜라이 yqhD (서열 29)의 발현 수준을 변화시키기 위해 실시예 1 내지 3에서 기재되고 사용된 GI 프로모터 서열의 서브세트를 사용하였다.
yqhD에 대한 3개의 발현 카세트를 제작하였다. 이들 카세트는 (i) 짧은 1.5 GI (서열 31), 짧은 1.20 GI (서열 32) 또는 짧은 야생형 GI (서열 33)로 명명된 단축된 GI 프로모터 중 하나; (ii) 이. 콜라이 KLP23으로부터의 yqhD (WO9928480); 및 (iii) 트레오닌 터미네이터를 함유한다 (문헌 [Lynn et al., J. Mol. Biol., 183:529-541 (1985)]). 단축된 GI 프로모터 중 하나를 함유하며 RsrII 제한 효소 부위가 혼입된 짧은 1.5 GI (서열 34), 짧은 1.20 GI (서열 35) 또는 짧은 야생형GI (서열 36)에 대한 정방향 (forward) 합성 프라이머, 및 트레오닌 터미네이터를 함유하며 SacI 부위를 포함하는 yqhD에 대한 역방향 (reverse) 프라이머 (서열 37)를 사용하여 게놈 KLP23 DNA로부터 PCR 증폭에 의해 yqhD 유전자를 단리하였다. 플라스미드 pSYCO109mcs를 RsrII/SacI으로 분해하고, RsrII/SacI 분해된 PCR 산물을 플라스미드에 라이게이션시켰다. 전기천공법에 의해 RJ8n (yqhD-) 균주를 라이게이션 혼합물로 형질전환시키고, 각 균주에서의 효소 활성 수준을 비교하였다 (표 5).
yqhD에 의해 발현된 효소 활성은, 환원성 등가물의 공급원으로 NADPH를 사용하여 알데히드인 3-히드록시프로피온알데히드 (3-HPA)와 부탄알을 유사한 속도로 환원시켰다. 3-HPA는 상업적으로 시판되지 않기 때문에, 일반적으로 부탄알을 사용하였다. 총 1 mL 부피의 분석 혼합물은 200 mM 인산칼륨 완충액 (pH 7.5), 10 mM 부탄알, 0.2 mM NADPH, 및 분석될 무세포 추출물로부터의 단백질 대략 0.01 mg을 함유하였다. 단백질 샘플을 첨가한 후 NADPH 산화 반응의 초기 속도를 340 nm에서 흡광도에서의 변화 (Δε= 6.22 mM-1)로 측정하였다. 활성 단위는 35 ℃에서 10 mM 부탄알의 존재하에 NADPH 1 μmol을 1 분 내에 산화시키기 위해 요구되는 값으로 정의하였다. 다양한 균주의 활성을 하기 표 5에 나타내었으며, 이는 보다 긴 GI 프로모터 변이체에 의해 허용되는 발현 수준과 일치하였다.
RJ8n (yqhD-)를 제작하기 위해, 레드-매개성 상동성 재조합에 대한 문헌 [Wanner and Datsenko, PNAS, 97 (12):6640-6645 (2000)]에 기재된 방법을 이용하여 이. 콜라이 MG1655에서 yqhD 유전자를 파괴하였다. 정방향 PCR 프라이머 H1::6574 (서열 38) (yqhD 상동 서열의 42개 염기쌍 및 pKD13에 대한 프라이머 결합 부위 P1 함유) 및 역방향 PCR 프라이머 H2::6706 (서열 39) (yqhD 상동 서열 47 염기쌍 및 pKD13에 대한 프라이머 결합 부위 P4 함유)를 제조하였다. 주형으로서 pKD13을 사용한 PCR 증폭 반응은 각각의 말단에 yqhD 서열을 갖고, 카나마이신 내성 (kanR) 마커 측면에 위치한 FRT (FLP 인식 표적) 부위를 그 뒤쪽에 갖는 PCR 산물을 생성하였다. PCR 산물로 이. 콜라이 MG1655 세포를 전기형질전환시키고, 카나마이신-내성 형질전환체를 선별하였다. 형질전환체의 정확한 삽입을 yqhD 유전자의 측면에 위치하는 프라이머 yqhDUP (서열 82) 및 yqhDDN (서열 83)을 사용하여 PCR에 의해 확인하였다. λ레드 시스템을 함유하는 온도-민감성 플라스미드를 42 ℃에서 균주를 증식시킴으로써 회복시켰다.
yqhD::kan이 파괴된 영역을 P1 형질도입에 의해 RJ8n로 이동시키고, kanR 유전자 (Vec 61, 서열 42; 및 Vec 60, 서열 43) 내부의 프라이머와 한 쌍을 이루는 yqhDUP2 (서열 40) 및 yqhDDN2 (서열 41) 프라이머를 사용하여 PCR에 의해 확인하였다. 카나마이신 마커를 제거하기 위하여, 통합체를 온도-민감성 레플리콘 (pCP20; FLP 레콤비나제 (recombinase)에 대한 유전자를 함유)과 함께 형질전환시켰다. FLP 레콤비나제는 FRT (FLP 인식 표적) 부위 측면에 위치하는 카나마이신 마커를 제거한다. 이어서, 카나마이신-민감성 세포를 42 ℃에서 증식시켜 pCP20을 회복시켰다. 생성된 균주는 RJ8n (yqhD-)이었다.
실시예 5
이. 콜라이 포스포에놀피루베이트 카르복실라제 염색체 프로모터의 GI 프로모터로의 치환
실시예 5는 에스케리치아 콜라이 (Escherichia coli) 게놈의 천연 ppc (포스포에놀피루베이트 카르복실라제 또는 PEP 카르복실라제 코딩) 프로모터의 짧은 야생형 GI 프로모터 (서열 33)에 의한 치환을 설명하고 있다.
ppc 프로모터 치환를 위한 올리고뉴클레오티드 설계:
2개의 올리고뉴클레오티드 (ppcF, 서열 44; 및 ppcR, 서열 45)를 설계하여 천연 ppc 프로모터의 상류 영역에 상동성인 80 염기쌍 서열, 제빵용 효모의 FRT 부위 측면에 위치한 클로로암페니콜-내성 코딩 유전자 (cat), 짧은 야생형 GI 프로모터 서열 (서열 33), 및 천연 ppc 프로모터 전사 시작 부위 +1의 하류 영역에 상동성인 40 염기쌍 서열을 함유하는 카세트를 PCR에 의해 증폭시켰다.
ppcR 프라이머 (서열 45)는 100 뉴클레오티드 길이이며, P1 (천연 ppc 프로모터) 전사 시작 부위의 +1로부터 ppc의 ATG의 상류 41 염기쌍까지의 전체 서열, -35 상류의 4개의 염기쌍으로부터 -10 하류의 9개의 염기쌍까지의 짧은 야생형 GI 프로모터 서열 (서열 33), pKD3 (2개의 FRT 부위 측면에 위치하는 cat 유전자를 함유하는 R6K 플라스미드)에 대한 프라이밍 부위 (워너 (Wanner) 및 카트센코 (Datsenko)의 상기 문헌)를 포함한다. ppcF 프라이머 (서열 44)는 100 뉴클레오티드 길이이며, 천연 ppc 프로모터 상류의 80개의 염기쌍 서열 및 pKD3에 대한 프라이밍 부위를 포함한다.
플라스미드 pKD3을 주형으로 사용하여 프로모터 치환 카세트를 증폭시키기 위해 프라이머 ppcF 및 ppcR (서열 44 및 45)을 사용하였다. 1.15 kb의 PCR 산물을 아가로스 겔에서 전기영동시킨 후 QIA 고속 겔 추출 키트 (QIA quick gel extraction Kit; 캘리포니아주, 발렌시아 소재의 키아젠 인크 (Qiagen, Inc.))를 사용하여 정제하였다.
선형 DNA를 이용하는 상동성 재조합에 의한 에스케레치아 콜라이로의 천연 ppc 프로모터 치환:
아라비노스 프로모터의 조절하에 α, β 및 exo를 발현시키는 레드-리콤비나제 (Red-recombinase) 플라스미드인 pKD46 (다트센코 및 워너, 상기 문헌)을 함유하는 컴피턴트 (competent) 에스케리치아 콜라이 MG1655 세포를 상기 1.15 kb의 선형 DNA 0.5 μg으로 전기형질전환시키고, 생성된 형질전환체를 클로로암페니콜 내성 (15 μg/mL)에 대하여 스크리닝하였다. 재조합 균주를 프라이머 ppcF 및 seqppcR (서열 46)을 사용하여 PCR에 의해 확인하였다. 카세트의 비-특이적인 통합은 PCR 산물을 생성할 수 없지만, 정확한 재조합체는 1.25 kb의 PCR 산물을 생성하였다. seqppcR 프라이머 (서열 46)를 사용하여 1.25 kb의 PCR 산물의 서열을 분석함으로써 짧은 야생형 GI 프로모터의 서열을 확인하였다.
효소 활성 측정
MG1655 및 MG1655 (짧은 야생형 GI-ppc)에서의 PEP 카르복실라제 활성을 하기 분석법을 이용하여 초원심분리된 무세포 추출물 상에서 측정하고, 이를 표 6에 나타내었다. 짧은 야생형 GI 프로모터의 조절하에서의 PPC 활성은 천연 프로모터의 조절하에서 보다 3배 이상 높았다.
340 nm에서의 감소 (NADH 소비 때문)를 혼합물 (0.11 M Tris 완충액 (pH 8.5), NADH (0.22 mM), 황산마그네슘 (11.1 mM), 중탄산나트륨 (11.1 mM), 아세틸-CoA (0.25 mM), 말레이트 DH (시그마), 50 μL의 6U 세포 추출물 및 0.03 포스포에놀피루베이트 (1.11 mM) 함유)에서 측정하였다. 하기 식을 활성을 측정하기 위해 사용하였다:
실시예 6
클렙시엘라 뉴모니아 dha 레귤론 (regulon)으로부터의 유전자에 의한 에스케리치아 콜라이의 형질전환에 사용되는 발현 플라스미드 제작
발현 벡터 pTacIQ 제작:
lacIQ유전자 (문헌 [Farabaugh, Nature, 274(5673):765-769 (1978)]) 및 tac 프로모터 (문헌 [Amann et al., Gene 25:167-178 (1983)])를 pBR322 (문헌 [Sutcliffe, Cold Spring Harb. Symp. Quant. Biol. 43:77-90 (1979)])의 EcoRI 부위에 삽입함으로써 이. 콜라이 발현 벡터 pTacIQ를 제작하였다. 다중 클로닝 부위 및 터미네이터 서열 (서열 47)은 pBR322 서열을 EcoRI으로부터 SphI으로 치환하였다.
글리세롤 데히드라타제 유전자 (dhaB1,2,3,X) 서브클로닝:
5' 말단에는 EcoRI 부위가, 3' 말단에는 XbaI 부위가 혼입된 프라이머 (서열 49 내지 50)를 사용하여, dhaB3 유전자에 대한 오픈 리딩 프레임을 pHK28-26 (서열 48)로부터 PCR에 의해 증폭시켰다. 산물을 pLitmus29 (뉴 잉글랜드 바이오랩스)로 서브클로닝하여 dhaB3을 함유하는 플라스미드 pDHAB3을 제작하였다.
영역 (pHK28-26으로부터 유래한 dhaB 오페론의 dhaB1, dhaB2, dhaB3 및 dhaBX에 대한 전체 코딩 영역을 함유)을 제한 효소 KpnI 및 EcoRI을 사용하여 pBluescriptIIKS+ (캘리포니아주, 라 졸라 소재의 스트라타진 (Stratagene) 사)에 클로닝시켜 플라스미드 pM7을 제작하였다.
플라스미드 pM7을 ApaI 및 XbaI으로 분해함으로써 dhaBX 유전자를 제거하고,5.9 kb의 단편을 정제하고, 이를 플라스미드 pDHAB3으로부터의 325개 염기쌍의 ApaI-XbaI 단편과 라이게이션시켜 pM11 (dhaB1, dhaB2 및 dhaB3 함유)을 제작하였다.
5' 말단에는 HindIII 부위 및 상응하는 리보솜-결합 부위 (RBS)가, 3' 말단에는 XbaI 부위가 혼입된 프라이머 (서열 51 내지 52)를 사용하여, dhaB1 유전자에 대한 오픈 리딩 프레임을 pHK28-26으로부터 PCR에 의해 증폭시켰다. 산물을 pLitmus28 (뉴 잉글랜드 바이오랩스)에 서브클로닝하여 dhaB1을 함유하는 플라스미드 pDT1을 제작하였다.
pM11로부터의 NotI-XbaI 단편 (일부의 dhaB1 유전자, dhaB2 유전자 및 dhaB3 유전자 함유)을 pDT1에 삽입하여 dhaB 발현 플라스미드인 pDT2를 제작하였다. HindIII-XbaI 단편 (pDT2로부터의 dhaB(1,2,3) 유전자 함유)을 pTacIQ에 삽입하여 pDT3을 제작하였다.
1,3-프로판디올 데히드로게나제 유전자 (dhaT) 서브클로닝:
pHK28-26의 KpnI-SacI 단편 (1,3-프로판디올 데히드로게나제 (dhaT) 유전자 함유)을 pBluescriptII KS+에 서브클로닝하여 플라스미드 pAH1을 제작하였다. 주형 DNA로서 pAH1를 사용하고, 5' 말단에는 XbaI 부위가, 3' 말단에는 BamHI 부위가 혼입된 합성 프라이머 (서열 53 내지 54)를 사용하여 dhaT 유전자를 PCR에 의해 증폭시켰다. 이 산물을 pCR-Script (스트라타진)의 SrfI 부위에 서브클로닝하여 dhaT를 함유하는 플라스미드 pAH4 및 pAH5를 제작하였다. 플라스미드 pAH4는 pCR-Script에 lac 프로모터로부터 발현되기에 올바른 배향으로 dhaT 유전자를 함유하고, pAH5는 반대 배향으로 dhaT 유전자를 함유한다. pAH4로부터의 XbaI-BamHI 단편 (dhaT 유전자 함유)을 pTacIQ에 삽입하여 플라스미드 pAH8을 제작하였다. pAH8로부터의 HindII-BamHI 단편 (RBS 및 dhaT 유전자 함유)을 pBluescriptIIKS+에 삽입하여 pAH11을 제작하였다.
dhaT 및 dhaB(1,2,3)에 대한 발현 카세트 제작:
표준 분자 생물학 방법을 이용하여 dhaT 및 dhaB(1,2,3)에 대한 발현 카세트를 상기 기재된 각각의 dhaB(1,2,3) 및 dhaT 서브클론으로부터 조립하였다. SpeI-SacI 단편 (pDT3으로부터의 dhaB(1,2,3) 유전자 함유)을 pAH11의 SpeI-SacI 부위에 삽입하여 pAH24를 제작하였다. 서열 55 내지 56으로부터 생성된 SalI-XbaI 링커를, 제한 효소 SalI-XbaI으로 분해시킨 pAH5에 삽입하여 pDT16을 제작하였다. 링커는 XbaI 부위를 파괴한다. 이어서 pDT16으로부터의 1 kb의 SalI-MluI 단편을, 기존의 SalI-MluI 단편을 치환시킨 pAH24에 삽입하여 pDT18을 제작하였다. pDT18로부터의 SalI-NotI 단편 및 pM7로부터의 NotI-XbaI 단편을 pCL1920 (진뱅크 AX085428)에 삽입함으로써 pDT21을 제작하였다. 스트렙토마이세스 리비딘스로부터의 글루코스 이소머라제 프로모터 서열 (서열 1)을 PCR에 의해 클로닝하고, 이를 pLitmus28의 EcoRI-HindIII 부위에 삽입하여 pDT5를 제작하였다. pDT5의 EcoRI-PvuII 단편 (GI 프로모터 함유)을 pCL1920 (진뱅크 AX085428)의 EcoRI-PvuII 부위에 삽입함으로써 pCL1925를 제작하였다.
스트렙토마이세스 글루코스 이소머라제 프로모터의 조절하에서의 글리세롤 데히드라타제 발현 벡터 제작:
HindIII 제한 효소 단편 (dhaT 함유)을 pDT24로부터 결실시켜 pRN105를 제작하였다. pDT21의 HindIII-MluI 단편 및 pDT21의 MluI-XbaI 단편을 pCL1925의 HindIII-XbaI 부위에 클로닝함으로써 pDT24 플라스미드를 제작하였다. pRN105 주형으로부터 PCR 산물 (유일한 HpaI 제한 효소 부위로부터 dhaX 말단까지의 dhaX의 3' 영역을 포함하고, 5' 말단에는 HpaI 제한 효소 부위를, 3' 말단에는 XbaI 제한 효소 부위를 혼입시킴)을 생성하고, 이를 pRN105의 기존의 HpaI/XbaI 제한 단편을 치환하는 데 사용하여 pMP37을 제작하였다. pDT29 주형으로부터 PCR 산물 (시작 코돈 바로 상류의 유일한 HindIII 제한 효소 부위로부터 dhaB1 내의 유일한 NotI 제한 효소 부위까지의 dhaB1의 5' 영역을 포함하고, 5' 말단에는 HindIII 제한 효소 부위를, 3' 말단에는 NotI 제한 효소 부위를 혼입시킴)을 생성하고, 이를 pRN105의 HindII/NotI 제한 효소 소단편을 치환하는데 사용하여 pRJ25를 제작하였다. pHK28-26의 SacI-EcoRI 단편을 pCL1925의 SacI-EcoRI 부위에 삽입함으로써 pDT29를 제작하였다. HpaI/XbaI 제한 효소 소단편 (pMP37로부터의 dhaX의 5' 영역 함유)을 pRJ25로부터의 XbaI/HpaI 제한 효소 거대 단편에 라이게이션시켜 pMP38을 제작하였고, 이 때 스트렙토마이세스 리비딘스 글루코스 이소머라제 프로모터 (서열 1)가 천연 리보솜 결합 부위를 사용하여 케이. 뉴모니아 (K. pneumoniae) dhaB1-3,X 오페론의 발현을 유도하였다.
실시예 7
1,3-프로판디올 생산을 위한 SYCO 플라스미드 제작:
이. 콜라이 숙주에서 글루코스로부터 1,3-프로판디올을 생산하기 위해, 다른공급원으로부터의 여러 오페론을 발현시킬 수 있다. 이는 글리세롤-3-포스페이트 데히드로게나제, 글리세롤-3-포스페이트 포스파타제 및 글리세롤 데히드라타제 활성을 코딩하는 유전자를 포함한다. 상기 유전자는 예를 들어 클렙시엘라 뉴모니아 (Klebsiella pnuemoniae)로부터의 dha 오페론 (dhaR, dhaT, dhaX 및 dhaB1-3 함유) 및 클렙시엘라 뉴모니아로부터의 orf 오페론 (orfYXW 함유), 및 사카로마이세스 (Saccharomyces)로부터 DAR1 및 GPP2를 함유하는 오페론과 같은 공급원으로부터 입수할 수 있다. 발효시 균주 안정성을 유지하기 위해서는 이. 콜라이 숙주내에 가능한 적은 플라스미드를 보유하는 것이 바람직하다. 이 목적을 위해 단일 플라스미드 상에 3개 이상의 다른 오페론을 클로닝 할 수 있는 플라스미드 시리즈를 제작하였다. RNA 중합효소의 판독-오류를 방지하기 위해 3개의 전사 터미네이터를 단일 클로닝 부위의 측면에 위치시켜 사용하였다. 이러한 전사 터미네이터로는 tonB 터미네이터, thr 어테뉴에이터 및 aspA 터미네이터가 있다. tonB 터미네이터는 이. 콜라이 tonB 유전자와 반대편 유전자 사이에 위치한 2-방향성 rho-독립성 터미네이터이다 (문헌 [Postle, K. and Good, R.F., Cell, 41:577-585 (1985)]). thr 어테뉴에이터는 이. 콜라이 트레오닌 오페론의 전사 종결을 용이하게 한다 (문헌 [Lynn et al., J. Mol. Biol., 183:529-541 (1985)]). aspA 터미네이터는 이. 콜라이 아스파르타제 오페론의 전사 종결을 용이하게 한다 (문헌 [Takagi et al., Nucleic Acid Research. 13(6):2063-2072 (1985)]).
단일 클로닝 부위 측면에 위치하는 3개의 전사 터미네이터를 포함하는 pRJ50 제작:
PCR-매개된 중복 신장 방법을 이용하여 합성 DNA 단편 (tonB, thr 및 aspA 전사 터미네이터 (서열 57), 및 여러 제한 효소 부위 포함)을 조립하였다 (문헌 [Horton et al., BioTechniques, 8:528-535, (1990)]). 3' 말단에서 25 염기쌍 길이에 대하여 서로 상보적인 100 염기 올리고뉴클레오티드 (서열 58 내지 59) 2개를 어닐링시켜 175-염기 DNA 단편 (서열 60)을 제작하였다. 2개의 추가 올리고뉴클레오티드 프라이머 (서열 61 내지 62)를 사용하여 EcoRI 및 KpnI 제한 효소 부위가 측면에 위치하는 175 염기쌍 단편을 추가로 증폭시켰다. 175 염기쌍 PCR 산물을 EcoRI 및 KpnI으로 분해하고, EcoRI/KpnI 분해된 플라스미드 pCL1925에 서브클로닝하여 pRJ50 (서열 79)을 제작하였다.
dhaR, orfY, oryX, orfW 및 dhaB(1,2,3,X)에 대한 발현 카세트 제작:
PCR-매개된 중복 신장 방법으로 공지된 기술에 의해 유전자 dhaT의 처음 5개 코돈과 마지막 5개 코돈 (종결 코돈 추가)을 제외한 모든 코돈을 결실시킨 플라스미드 pDT29의 유도체를 제작하였다.
주형으로서 pDT29를 이용하고, 하기 프라이머를 사용하여 2가지 일차 PCR 산물을 생성하였다:
서열 63:5'-GAC GCA ACA GTA TTC CGT CGC-3';
서열 64:5'-ATG AGC TAT CGT ATG TTC CGC CAG GCA TTC TGA GTG TTA AGG-3';
서열 65:5'-GCC TGG CGG AAC ATA CGA TAG CTC ATA ATA TAC-3';
서열 66:5'-CGG GGC GCT GGG CCA GTA CTG-3'.
서열 65는 서열 66과 쌍을 이루어, 5' dhaB1 (유일한 ScaI 부위), orfY 전체, 및 dhaT의 처음 5개 코돈을 비롯한 핵산을 포함하는 931 염기쌍 길이의 산물을 생성하였다. 서열 63은 서열 64와 쌍을 이루어, dhaT의 마지막 5개 코돈 (종결 코돈 추가), orfX 전체, orfW 전체 및 5' dhaR (유일한 SapI 부위)을 포함하는 핵산을 포함하는 1348 염기쌍 길이의 산물을 생성하였다. 서열 64의 5' 말단에서의 15 염기는 서열 65의 15-염기 부분에 반대로 상보적인 꼬리 (tail)를 구성한다. 이와 유사하게, 서열 65의 5' 말단에서의 11 염기는 서열 64의 11-염기 부분에 반대로 상보적인 꼬리 부분을 구성한다. 따라서, 2가지 일차 PCR 산물은 (중복되는 26-염기쌍 꼬리 부분을 통해) 어닐링된 후 연결되고, PCR에 의해 신장되어 2253 염기쌍의 3차 산물을 생성하였다. 이 3차 산물을 SapI 및 ScaI으로 분해하고, 마찬가지로 SapI 및 ScaI으로 분해한 pDT29에 라이게이션시켜 플라스미드 pKP32를 제작하였으며, 이는 dhaT 내에서의 프레임에 맞는 거대한 결실을 제외하고는 pDT29와 동일하였다.
상이한 GI 프로모터 변이체를 함유하는 orfWXY 및 dhaB1-3을 발현시키는 플라스미드 제작:
pKP32로부터의 orf 오페론을 5'말단에는 HindIII를, 3'말단에는 AvrII를 갖는 프라이머 (서열 80 내지 81)를 사용하여 PCR에 의해 증폭시키고, 이를 pLitmus28 (뉴 잉글랜드 바이오랩스)의 HindIII과 AvrII 사이에 서브클로닝하여 pKP38을 제작하였다. EcoRI/HindIII 제한 단편 (pMP38/1.6으로부터의 GI 돌연변이체 프로모터 P1.6 (서열 9) 함유)을 pKP38의 EcoRI과 HindIII 사이에 서브클로닝하여 pKP39를 제작하였다. AvrII/XbaI 제한 단편 (pMP38/1.6으로부터의 dhaB 발현카세트 함유)을 pLitmus28 (뉴 잉글랜드 바이오랩스)의 AvrII와 XbaI 사이에 서브클로닝하여 pMP39를 제작하였다. AvrII/XbaI 제한 단편 (pMP39로부터의 dhaB 발현 카세트 함유)을 pRJ50의 AvrII 부위에 서브클로닝하여 pSYCO11을 제작하였다. AvrII 제한 단편 (pKP39로부터의 orf 발현 카세트 함유)을 pSYCO11의 NheI 부위에 서브클로닝하여 pSYCO12를 제작하였다. 플라스미드 pSYCO11 및 pSYCO12는 pSYCO11이 orf 오페론을 함유하지 않는다는 것만 제외하고 동일하다.
EcoRI/HindIII 제한 단편 (pMP38/1.5로부터의 GI 돌연변이체 프로모터 P1.5 (서열 10) 함유)을 pKP38의 EcoRI과 HindIII 사이에 서브클로닝하여 pKP40을 제작하였다. AvrII 제한 단편 (pKP40으로부터 P1.5에 의해 유도되는 orf 오페론 함유)을 pSYCO11의 NheI 부위에 서브클로닝하여 pSYCO13을 제작하였다. AvrII/NotI 제한 단편 (P1.6 및 pSYCO103 중 dhaB1의 5' 말단 함유)을 pMP38/1.5로부터의 상응하는 AvrII/NotI 제한 단편으로 치환하여 pSYCO19를 제작하였다.
각각 전사 터미네이터에 의해 분리되어 있는 3개의 오페론을 갖는 pSYCO101, pSYCO103, pSYCO106 및 pSYCO109 벡터 제작:
이중-가닥 핵산 링커 (서열 67)를 pCL1920 (진뱅크 AX085428)의 XbaI과 SmaI 제한 효소 부위 사이에 서브클로닝하여 pCR-pCL1920을 제작하였다. pTrc99A (Amersham Pharmacia Biotech, Piscataway, NJ)로부터 유래된 trc 프로모터, 에스. 세레비지아의 DAR1 및 GPP2 코딩 서열, 및 터미네이터 rrnBT1T2 (pTrc99A로부터)를 포함하는 pAH48의 글리세롤 경로 발현 카세트를 PCR-증폭시키고 (서열 68 내지 69), 이를 pCR-pCL1920의 SrfI 제한 효소 부위에 서브클로닝하여 pAH105 (서열 70)를 제작하였다.
Pvull(2)/PvulI(4) 제한 효소 단편 (pAH105로부터의 DAR1/GPP2 발현 카세트 함유)을 pSYCO12의 Bst1107I 부위에 서브클로닝하여 pSYCO101 (서열 71)을 제작하였다. DAR1/GPP2 오페론은 orf 오페론 및 dhaB 오페론과 반대의 배향을 갖는다. NheI 제한 단편 (pAH105로부터의 DAR1/GPP2 발현 카세트 함유)을 pSYCO19의 XbaI 부위에 서브클로닝하여 pSYCO103 (서열 72)을 제작하였다.
플라스미드 pSYCO103은
(a) 사카로마이세스 세레비지아로부터 수득한 2 가지 외생 유전자 (DAR1 (글리세롤-3-포스페이트 데히드로게나제를 코딩하는 유전자) 및 GPP2 (글리세롤-3-포스파타제를 코딩하는 유전자))의 세트;
(b) 클렙시엘라 뉴모니아로부터 수득한 3 가지 외생 유전자 (dhaB1 (글리세롤 데히드라타제의 "α" 서브유닛을 코딩하는 유전자), dhaB2 (글리세롤 데히드라타제의 "β" 서브유닛을 코딩하는 유전자) 및 dhaB3 (글리세롤 데히드라타제의 "γ" 서브유닛을 코딩하는 유전자))의 세트; 및
(c) 클렙시엘라 뉴모니아로부터 수득한 2 가지 외생 유전자 (dhaBX (데히드라타제 재활성화 인자의 "α" 서브유닛을 코딩하는 유전자) 및 orfX (데히드라타제 재활성 인자의 "β" 서브유닛을 코딩하는 유전자))의 세트
를 포함한다. pSYCO103에서 DAR1/GPP2 오페론은 orf 오페론 및 dhaB 오페론과 동일한 배향을 갖는다.
NheI 제한 단편 (pAH105로부터의 DAR1/GPP2 발현 카세트 함유)을 pSYCO12의XbaI 부위에 서브클로닝하여 pSYCO106 (서열 73)을 제작하였다. DAR1/GPP2 오페론은 orf 오페론 및 dhaB 오페론과 동일한 배향을 갖는다. pSYCO106의 PmlI/NotI 제한 단편을 제거하고, pSYCO106로부터의 중복되는 Stul/NotI 제한 단편으로 치환하여, orfW의 3' 말단 주변에서 141개의 염기쌍이 결실된 pSYCO109 (서열 74)를 제작하였다.
실시예 8
클로닝에 유용한 10개의 희귀 제한 효소 부위를 갖는 신규 뉴클레오티드 서열
추가의 유전자, 오페론 또는 카세트의 클로닝에 유용하고, 또한 한 플라스미드로부터 다른 플라스미드로 카세트를 전달하기 위한, 10개의 희귀 제한 효소 부위를 코딩하기 위한 뉴클레오티드 서열을 고안하였다. 플라스미드 pSCYCO106δS는 pSYCO106을 제한 효소 SpeI으로 절단하고, 클레나우 (Klenow)로 말단을 채우고, 다시 라이게이션하여 제작하였다. pSYCO106δS를 EcoRI으로 분해하여 벡터 골격을 단리한 후, 라이게이션에 의해 다시 고리화하여 pSpREPds를 제작하였다. 올리고뉴클레오티드 (서열 75 내지 76)을 60 ℃에서 어닐링시키고, KpnI/StuI으로 분해하였다. 다중 클로닝 단편 (서열 77)은 제한 효소 NheI, RsrII, SacI, AgeI, SnaBI, AscI, PacI, NsiI, MluI 및 SapI에 대한 인식 부위를 함유한다. 단편을 겔로 정제하고, pSpREPds에 클로닝하여 pSpREPmcs를 제작하였다. pSpREPmcs를 EcoRI으로 선형화시키고, EcoRI 단편 (pSYCO106δS 및 pSYCO109로부터의 경로 유전자를 함유)을 pSpREPmcs에 라이게이션시켜 각각 pSYCO106mcs (서열 78) 및 pSYCO109mcs (서열30)를 제작하였다.
실시예 9
이. 콜라이균주 RJ8n/pSYCO101을 사용한 1,3-프로판디올 생산
플라스미드 pSYCO101 (서열 71)을 사용하여 전기천공용 컴피턴트 이. 콜라이 RJ8n 세포를 형질전환시켜 이. 콜라이 균주 RJ8n/pSYCO101을 제작하였다.
발효기에 시딩하기 위하여, 50 mg/L 스펙티노마이신을 함유하는 2YT 배지 (10 g/L 효모 추출물, 16 g/L 트립톤 및 10 g/L NaCl)에서 RJ8n/pSYCO101을 미리 배양하였다. 2L 들이 엘렌마이어 (Erlenmeyer) 플라스크에 들어있는 배지 500 ml에 냉동 원액 (동결에 대한 보호제로서의 10% 글리세롤)을 접종하여 배양하기 시작하고, 250 rpm의 진탕기 중에서 OD550값이 대략 1.0에 도달할 때까지 35 ℃에서 증식시키고, 이를 발효기에 시딩하는 데 사용하였다.
하기 성분들을 발효 용기 중에서 함께 멸균하였다: 45 g KH2PO4, 12 g 시트르산 일수화물, 12 g MgSO4ㆍ7H2O, 30 g 효모 추출물, 1.8 g 철 암모늄 시트레이트, 5 mL Mazu DF204 (소포제), 1.2 g CaCl2ㆍ2H2O, 7.2 mL 황산 및 60 mL 미량 원소 용액. 멸균시킨 후에, 20 내지 28%의 NH4OH를 사용하여 pH를 6.8로 올리고, 0.30 g 스펙티노마이신 및 글루코스 (67 중량% 공급물로부터)를 첨가하였다. 미량 원소 용액은 시트르산ㆍH2O (4.0 g/L), MnSO4ㆍH20 (3.0 g/L), NaCl (1.0 g/L), FeSO4ㆍ7H2O (0.10 g/L), CoCl2ㆍ6H20 (0.10 g/L), ZnSO4ㆍ7H2O (0.10 g/L),CuSO4ㆍ5H2O (0.010 g/L), H3BO3(0.010 g/L) 및 Na2MoO4ㆍ2H2O (0.010 g/L)를 함유하였다. 접종한 후에, 부피는 6.0 L였고, 글루코스 농도는 10 g/L였다.
15-L 교반 탱크 발효기를 상기 기재된 배지를 사용하여 준비하였다. 온도를 34 ℃에서 조절하고, 수성 암모니아 (20 내지 28 중량%)를 사용하여 pH를 6.8로 조절하였다. 용존산소 (DO) 대조군을 10%로 세팅하고, 배압 (back pressure)을 0.5 bar로 조절하였다. 소수 예외의 경우를 제외하고는, 67 중량%의 글루코스를 공급하여 글루코스 농도를 10 g/L 내지 25 g/L로 유지하였다. 발효시킨지 10 시간이 경과한 후에 비타민 B1210 mg을 첨가하고, 다시 1 시간 후에는 함께 공급하기 시작하였다 (0.0167 mg/mL 용액을 2.64 mg/h의 속도로). 64시간 후에 99 g/L의 1,3-프로판디올 역가를 수득하였다.
SEQUENCE LISTING <110> E.I. du Pont de Nemours and Company <120> Promoter and Plasmid System for Genetic Engineering <130> CL1998 PCT <150> 60/374931 <151> 2002-04-22 <160> 83 <170> Microsoft Office 97 <210> 1 <211> 199 <212> DNA <213> artificial sequence <220> <223> promoter <400> 1 gaattcacta gtcgatctgt gctgtttgcc acggtatgca gcaccagcgc gagattatgg 60 gctcgcacgc tcgactgtcg gacgggggca ctggaacgag aagtcaggcg agccgtcacg 120 cccttgacaa tgccacatcc tgagcaaata attcaaccac taaacaaatc aaccgcgttt 180 cccggaggta accaagctt 199 <210> 2 <211> 36 <212> DNA <213> artificial sequence <220> <223> primer <400> 2 cgggaattcc ctaggcgatc tgtgctgttt gccacg 36 <210> 3 <211> 84 <212> DNA <213> artificial sequence <220> <223> primer <220> <221> misc_feature <222> (74)..(74) <223> N = A, T, C, or G <400> 3 cttaagcttg gttacctccg ggaaacgcgg ttgatttgtt tagtggttga attatttgct 60 caggatgtgg catngtcaag ggcg 84 <210> 4 <211> 84 <212> DNA <213> artificial sequence <220> <223> primer <220> <221> misc_feature <222> (75)..(75) <223> N = A, T, C, or G <400> 4 cttaagcttg gttacctccg ggaaacgcgg ttgatttgtt tagtggttga attatttgct 60 caggatgtgg cattntcaag ggcg 84 <210> 5 <211> 84 <212> DNA <213> artificial sequence <220> <223> primer <220> <221> misc_feature <222> (76)..(76) <223> N = A, T, C, or G <400> 5 cttaagcttg gttacctccg ggaaacgcgg ttgatttgtt tagtggttga attatttgct 60 caggatgtgg cattgncaag ggcg 84 <210> 6 <211> 84 <212> DNA <213> artificial sequence <220> <223> primer <220> <221> misc_feature <222> (77)..(77) <223> N = A, T, C, or G <400> 6 cttaagcttg gttacctccg ggaaacgcgg ttgatttgtt tagtggttga attatttgct 60 caggatgtgg cattgtnaag ggcg 84 <210> 7 <211> 84 <212> DNA <213> artificial sequence <220> <223> primer <220> <221> misc_feature <222> (78)..(78) <223> N = A, T, C, or G <400> 7 cttaagcttg gttacctccg ggaaacgcgg ttgatttgtt tagtggttga attatttgct 60 caggatgtgg cattgtcnag ggcg 84 <210> 8 <211> 84 <212> DNA <213> artificial sequence <220> <223> primer <220> <221> misc_feature <222> (79)..(79) <223> N = A, T, C, or G <400> 8 cttaagcttg gttacctccg ggaaacgcgg ttgatttgtt tagtggttga attatttgct 60 caggatgtgg cattgtcang ggcg 84 <210> 9 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 9 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120 acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 10 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 10 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120 actatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 11 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 11 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120 acgatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 12 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 12 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120 accatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 13 <211> 186 <212> DNA <213> artificial sequence <220> <223> promoter <400> 13 ctaggcgatc tgtgctgttt gccacggtat gcagcaccag cgcgagatta tgggctcgca 60 cgctcgactg tcggacgggg gcactggaac gagaagtcag gcgagccgtc acgcccttga 120 aaatgccaca tcctgagcaa ataattcaac cactaaacaa atcaaccgcg tttcccggag 180 gtaacc 186 <210> 14 <211> 162 <212> DNA <213> artificial sequence <220> <223> promoter <400> 14 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120 acaatgccac atcctgagca aataattttc ccggaggtaa cc 162 <210> 15 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 15 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120 ccaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 16 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 16 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgccctta 120 acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 17 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 17 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttc 120 acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 18 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 18 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgccctcg 120 acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 19 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 19 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgccctag 120 acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 20 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 20 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgccctgg 120 acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 21 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 21 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccgtg 120 acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 22 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 22 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccatg 120 acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 23 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 23 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccctg 120 acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 24 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 24 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120 agaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 25 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 25 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120 ataatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 26 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 26 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120 gcaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 27 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 27 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120 tcaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 28 <211> 187 <212> DNA <213> artificial sequence <220> <223> promoter <400> 28 cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60 acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttt 120 acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180 ggtaacc 187 <210> 29 <211> 1164 <212> DNA <213> Escherichia coli K-12 <400> 29 atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60 ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120 gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180 gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240 gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300 accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360 caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420 gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480 caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540 tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600 gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660 ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720 cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780 ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840 cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900 cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960 gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020 acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080 gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140 cgtatatacg aagccgcccg ctaa 1164 <210> 30 <211> 13470 <212> DNA <213> artificial sequence <220> <223> plasmid <400> 30 ccttaagtga gtcgtattac ggactggccg tcgttttaca acgtcgtgac tgggaaaacc 60 ctggcgttac ccaacttaat cgccttgcag cacatccccc tttcgccagc tggcgtaata 120 gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat ggcgaatggc 180 gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatggtgca 240 ctctcagtac aatctgctct gatgccgcat agttaagcca gccccgacac ccgccaacac 300 ccgctgacga gcttagtaaa gccctcgcta gattttaatg cggatgttgc gattacttcg 360 ccaactattg cgataacaag aaaaagccag cctttcatga tatatctccc aatttgtgta 420 gggcttatta tgcacgctta aaaataataa aagcagactt gacctgatag tttggctgtg 480 agcaattatg tgcttagtgc atctaacgct tgagttaagc cgcgccgcga agcggcgtcg 540 gcttgaacga attgttagac attatttgcc gactaccttg gtgatctcgc ctttcacgta 600 gtggacaaat tcttccaact gatctgcgcg cgaggccaag cgatcttctt cttgtccaag 660 ataagcctgt ctagcttcaa gtatgacggg ctgatactgg gccggcaggc gctccattgc 720 ccagtcggca gcgacatcct tcggcgcgat tttgccggtt actgcgctgt accaaatgcg 780 ggacaacgta agcactacat ttcgctcatc gccagcccag tcgggcggcg agttccatag 840 cgttaaggtt tcatttagcg cctcaaatag atcctgttca ggaaccggat caaagagttc 900 ctccgccgct ggacctacca aggcaacgct atgttctctt gcttttgtca gcaagatagc 960 cagatcaatg tcgatcgtgg ctggctcgaa gatacctgca agaatgtcat tgcgctgcca 1020 ttctccaaat tgcagttcgc gcttagctgg ataacgccac ggaatgatgt cgtcgtgcac 1080 aacaatggtg acttctacag cgcggagaat ctcgctctct ccaggggaag ccgaagtttc 1140 caaaaggtcg ttgatcaaag ctcgccgcgt tgtttcatca agccttacgg tcaccgtaac 1200 cagcaaatca atatcactgt gtggcttcag gccgccatcc actgcggagc cgtacaaatg 1260 tacggccagc aacgtcggtt cgagatggcg ctcgatgacg ccaactacct ctgatagttg 1320 agtcgatact tcggcgatca ccgcttccct catgatgttt aactttgttt tagggcgact 1380 gccctgctgc gtaacatcgt tgctgctcca taacatcaaa catcgaccca cggcgtaacg 1440 cgcttgctgc ttggatgccc gaggcataga ctgtacccca aaaaaacagt cataacaagc 1500 catgaaaacc gccactgcgc cgttaccacc gctgcgttcg gtcaaggttc tggaccagtt 1560 gcgtgagcgc atacgctact tgcattacag cttacgaacc gaacaggctt atgtccactg 1620 ggttcgtgcc ttcatccgtt tccacggtgt gcgtcacccg gcaaccttgg gcagcagcga 1680 agtcgaggca tttctgtcct ggctggcgaa cgagcgcaag gtttcggtct ccacgcatcg 1740 tcaggcattg gcggccttgc tgttcttcta cggcaaggtg ctgtgcacgg atctgccctg 1800 gcttcaggag atcggaagac ctcggccgtc gcggcgcttg ccggtggtgc tgaccccgga 1860 tgaagtggtt cgcatcctcg gttttctgga aggcgagcat cgtttgttcg cccagcttct 1920 gtatggaacg ggcatgcgga tcagtgaggg tttgcaactg cgggtcaagg atctggattt 1980 cgatcacggc acgatcatcg tgcgggaggg caagggctcc aaggatcggg ccttgatgtt 2040 acccgagagc ttggcaccca gcctgcgcga gcaggggaat taattcccac gggttttgct 2100 gcccgcaaac gggctgttct ggtgttgcta gtttgttatc agaatcgcag atccggcttc 2160 agccggtttg ccggctgaaa gcgctatttc ttccagaatt gccatgattt tttccccacg 2220 ggaggcgtca ctggctcccg tgttgtcggc agctttgatt cgataagcag catcgcctgt 2280 ttcaggctgt ctatgtgtga ctgttgagct gtaacaagtt gtctcaggtg ttcaatttca 2340 tgttctagtt gctttgtttt actggtttca cctgttctat taggtgttac atgctgttca 2400 tctgttacat tgtcgatctg ttcatggtga acagctttga atgcaccaaa aactcgtaaa 2460 agctctgatg tatctatctt ttttacaccg ttttcatctg tgcatatgga cagttttccc 2520 tttgatatgt aacggtgaac agttgttcta cttttgtttg ttagtcttga tgcttcactg 2580 atagatacaa gagccataag aacctcagat ccttccgtat ttagccagta tgttctctag 2640 tgtggttcgt tgtttttgcg tgagccatga gaacgaacca ttgagatcat acttactttg 2700 catgtcactc aaaaattttg cctcaaaact ggtgagctga atttttgcag ttaaagcatc 2760 gtgtagtgtt tttcttagtc cgttatgtag gtaggaatct gatgtaatgg ttgttggtat 2820 tttgtcacca ttcattttta tctggttgtt ctcaagttcg gttacgagat ccatttgtct 2880 atctagttca acttggaaaa tcaacgtatc agtcgggcgg cctcgcttat caaccaccaa 2940 tttcatattg ctgtaagtgt ttaaatcttt acttattggt ttcaaaaccc attggttaag 3000 ccttttaaac tcatggtagt tattttcaag cattaacatg aacttaaatt catcaaggct 3060 aatctctata tttgccttgt gagttttctt ttgtgttagt tcttttaata accactcata 3120 aatcctcata gagtatttgt tttcaaaaga cttaacatgt tccagattat attttatgaa 3180 tttttttaac tggaaaagat aaggcaatat ctcttcacta aaaactaatt ctaatttttc 3240 gcttgagaac ttggcatagt ttgtccactg gaaaatctca aagcctttaa ccaaaggatt 3300 cctgatttcc acagttctcg tcatcagctc tctggttgct ttagctaata caccataagc 3360 attttcccta ctgatgttca tcatctgagc gtattggtta taagtgaacg ataccgtccg 3420 ttctttcctt gtagggtttt caatcgtggg gttgagtagt gccacacagc ataaaattag 3480 cttggtttca tgctccgtta agtcatagcg actaatcgct agttcatttg ctttgaaaac 3540 aactaattca gacatacatc tcaattggtc taggtgattt taatcactat accaattgag 3600 atgggctagt caatgataat tactagctag tccttttcct ttgagttgtg ggtatctgta 3660 aattctgcta gacctttgct ggaaaacttg taaattctgc tagaccctct gtaaattccg 3720 ctagaccttt gtgtgttttt tttgtttata ttcaagtggt tataatttat agaataaaga 3780 aagaataaaa aaagataaaa agaatagatc ccagccctgt gtataactca ctactttagt 3840 cagttccgca gtattacaaa aggatgtcgc aaacgctgtt tgctcctcta caaaacagac 3900 cttaaaaccc taaaggctta agtagcaccc tcgcaagctc gggcaaatcg ctgaatattc 3960 cttttgtctc cgaccatcag gcacctgagt cgctgtcttt ttcgtgacat tcagttcgct 4020 gcgctcacgg ctctggcagt gaatgggggt aaatggcact acaggcgcct tttatggatt 4080 catgcaagga aactacccat aatacaagaa aagcccgtca cgggcttctc agggcgtttt 4140 atggcgggtc tgctatgtgg tgctatctga ctttttgctg ttcagcagtt cctgccctct 4200 gattttccag tctgaccact tcggattatc ccgtgacagg tcattcagac tggctaatgc 4260 acccagtaag gcagcggtat catcaacagg cttacccgtc ttactgtcgg gaattcattt 4320 aaatagtcaa aagcctccga ccggaggctt ttgactgcta ggcgatctgt gctgtttgcc 4380 acggtatgca gcaccagcgc gagattatgg gctcgcacgc tcgactgtcg gacgggggca 4440 ctggaacgag aagtcaggcg agccgtcacg cccttgacaa tgccacatcc tgagcaaata 4500 attcaaccac taaacaaatc aaccgcgttt cccggaggta accaagcttg cgggagagaa 4560 tgatgaacaa gagccaacaa gttcagacaa tcaccctggc cgccgcccag caaatggcgg 4620 cggcggtgga aaaaaaagcc actgagatca acgtggcggt ggtgttttcc gtagttgacc 4680 gcggaggcaa cacgctgctt atccagcgga tggacgaggc cttcgtctcc agctgcgata 4740 tttccctgaa taaagcctgg agcgcctgca gcctgaagca aggtacccat gaaattacgt 4800 cagcggtcca gccaggacaa tctctgtacg gtctgcagct aaccaaccaa cagcgaatta 4860 ttatttttgg cggcggcctg ccagttattt ttaatgagca ggtaattggc gccgtcggcg 4920 ttagcggcgg tacggtcgag caggatcaat tattagccca gtgcgccctg gattgttttt 4980 ccgcattata acctgaagcg agaaggtata ttatgagcta tcgtatgttc cgccaggcat 5040 tctgagtgtt aacgagggga ccgtcatgtc gctttcaccg ccaggcgtac gcctgtttta 5100 cgatccgcgc gggcaccatg ccggcgccat caatgagctg tgctgggggc tggaggagca 5160 gggggtcccc tgccagacca taacctatga cggaggcggt gacgccgctg cgctgggcgc 5220 cctggcggcc agaagctcgc ccctgcgggt gggtatcggg ctcagcgcgt ccggcgagat 5280 agccctcact catgcccagc tgccggcgga cgcgccgctg gctaccggac acgtcaccga 5340 tagcgacgat caactgcgta cgctcggcgc caacgccggg cagctggtta aagtcctgcc 5400 gttaagtgag agaaactgaa tgtatcgtat ctatacccgc accggggata aaggcaccac 5460 cgccctgtac ggcggcagcc gcatcgagaa agaccatatt cgcgtcgagg cctacggcac 5520 cgtcgatgaa ctgatatccc agctgggcgt ctgctacgcc acgacccgcg acgccgggct 5580 gcgggaaagc ctgcaccata ttcagcagac gctgttcgtg ctgggggctg aactggccag 5640 cgatgcgcgg ggcctgaccc gcctgagcca gacgatcggc gaagaggaga tcaccgccct 5700 ggagcggctt atcgaccgca atatggccga gagcggcccg ttaaaacagt tcgtgatccc 5760 ggggaggaat ctcgcctctg cccagctgca ccctgatgct tgcgcttgaa ctggcctagc 5820 aaacacagaa aaaagcccgc acctgacagt gcgggctttt tttttcctag gcgatctgtg 5880 ctgtttgcca cggtatgcag caccagcgcg agattatggg ctcgcacgct cgactgtcgg 5940 acgggggcac tggaacgaga agtcaggcga gccgtcacgc ccttgacaat gccacatcct 6000 gagcaaataa ttcaaccact aaacaaatca accgcgtttc ccggaggtaa ccaagcttca 6060 ccttttgagc cgatgaacaa tgaaaagatc aaaacgattt gcagtactgg cccagcgccc 6120 cgtcaatcag gacgggctga ttggcgagtg gcctgaagag gggctgatcg ccatggacag 6180 cccctttgac ccggtctctt cagtaaaagt ggacaacggt ctgatcgtcg aactggacgg 6240 caaacgccgg gaccagtttg acatgatcga ccgatttatc gccgattacg cgatcaacgt 6300 tgagcgcaca gagcaggcaa tgcgcctgga ggcggtggaa atagcccgta tgctggtgga 6360 tattcacgtc agccgggagg agatcattgc catcactacc gccatcacgc cggccaaagc 6420 ggtcgaggtg atggcgcaga tgaacgtggt ggagatgatg atggcgctgc agaagatgcg 6480 tgcccgccgg accccctcca accagtgcca cgtcaccaat ctcaaagata atccggtgca 6540 gattgccgct gacgccgccg aggccgggat ccgcggcttc tcagaacagg agaccacggt 6600 cggtatcgcg cgctacgcgc cgtttaacgc cctggcgctg ttggtcggtt cgcagtgcgg 6660 ccgccccggc gtgttgacgc agtgctcggt ggaagaggcc accgagctgg agctgggcat 6720 gcgtggctta accagctacg ccgagacggt gtcggtctac ggcaccgaag cggtatttac 6780 cgacggcgat gatacgccgt ggtcaaaggc gttcctcgcc tcggcctacg cctcccgcgg 6840 gttgaaaatg cgctacacct ccggcaccgg atccgaagcg ctgatgggct attcggagag 6900 caagtcgatg ctctacctcg aatcgcgctg catcttcatt actaaaggcg ccggggttca 6960 gggactgcaa aacggcgcgg tgagctgtat cggcatgacc ggcgctgtgc cgtcgggcat 7020 tcgggcggtg ctggcggaaa acctgatcgc ctctatgctc gacctcgaag tggcgtccgc 7080 caacgaccag actttctccc actcggatat tcgccgcacc gcgcgcaccc tgatgcagat 7140 gctgccgggc accgacttta ttttctccgg ctacagcgcg gtgccgaact acgacaacat 7200 gttcgccggc tcgaacttcg atgcggaaga ttttgatgat tacaacatcc tgcagcgtga 7260 cctgatggtt gacggcggcc tgcgtccggt gaccgaggcg gaaaccattg ccattcgcca 7320 gaaagcggcg cgggcgatcc aggcggtttt ccgcgagctg gggctgccgc caatcgccga 7380 cgaggaggtg gaggccgcca cctacgcgca cggcagcaac gagatgccgc cgcgtaacgt 7440 ggtggaggat ctgagtgcgg tggaagagat gatgaagcgc aacatcaccg gcctcgatat 7500 tgtcggcgcg ctgagccgca gcggctttga ggatatcgcc agcaatattc tcaatatgct 7560 gcgccagcgg gtcaccggcg attacctgca gacctcggcc attctcgatc ggcagttcga 7620 ggtggtgagt gcggtcaacg acatcaatga ctatcagggg ccgggcaccg gctatcgcat 7680 ctctgccgaa cgctgggcgg agatcaaaaa tattccgggc gtggttcagc ccgacaccat 7740 tgaataaggc ggtattcctg tgcaacagac aacccaaatt cagccctctt ttaccctgaa 7800 aacccgcgag ggcggggtag cttctgccga tgaacgcgcc gatgaagtgg tgatcggcgt 7860 cggccctgcc ttcgataaac accagcatca cactctgatc gatatgcccc atggcgcgat 7920 cctcaaagag ctgattgccg gggtggaaga agaggggctt cacgcccggg tggtgcgcat 7980 tctgcgcacg tccgacgtct cctttatggc ctgggatgcg gccaacctga gcggctcggg 8040 gatcggcatc ggtatccagt cgaaggggac cacggtcatc catcagcgcg atctgctgcc 8100 gctcagcaac ctggagctgt tctcccaggc gccgctgctg acgctggaga cctaccggca 8160 gattggcaaa aacgctgcgc gctatgcgcg caaagagtca ccttcgccgg tgccggtggt 8220 gaacgatcag atggtgcggc cgaaatttat ggccaaagcc gcgctatttc atatcaaaga 8280 gaccaaacat gtggtgcagg acgccgagcc cgtcaccctg cacatcgact tagtaaggga 8340 gtgaccatga gcgagaaaac catgcgcgtg caggattatc cgttagccac ccgctgcccg 8400 gagcatatcc tgacgcctac cggcaaacca ttgaccgata ttaccctcga gaaggtgctc 8460 tctggcgagg tgggcccgca ggatgtgcgg atctcccgcc agacccttga gtaccaggcg 8520 cagattgccg agcagatgca gcgccatgcg gtggcgcgca atttccgccg cgcggcggag 8580 cttatcgcca ttcctgacga gcgcattctg gctatctata acgcgctgcg cccgttccgc 8640 tcctcgcagg cggagctgct ggcgatcgcc gacgagctgg agcacacctg gcatgcgaca 8700 gtgaatgccg cctttgtccg ggagtcggcg gaagtgtatc agcagcggca taagctgcgt 8760 aaaggaagct aagcggaggt cagcatgccg ttaatagccg ggattgatat cggcaacgcc 8820 accaccgagg tggcgctggc gtccgactac ccgcaggcga gggcgtttgt tgccagcggg 8880 atcgtcgcga cgacgggcat gaaagggacg cgggacaata tcgccgggac cctcgccgcg 8940 ctggagcagg ccctggcgaa aacaccgtgg tcgatgagcg atgtctctcg catctatctt 9000 aacgaagccg cgccggtgat tggcgatgtg gcgatggaga ccatcaccga gaccattatc 9060 accgaatcga ccatgatcgg tcataacccg cagacgccgg gcggggtggg cgttggcgtg 9120 gggacgacta tcgccctcgg gcggctggcg acgctgccgg cggcgcagta tgccgagggg 9180 tggatcgtac tgattgacga cgccgtcgat ttccttgacg ccgtgtggtg gctcaatgag 9240 gcgctcgacc gggggatcaa cgtggtggcg gcgatcctca aaaaggacga cggcgtgctg 9300 gtgaacaacc gcctgcgtaa aaccctgccg gtggtggatg aagtgacgct gctggagcag 9360 gtccccgagg gggtaatggc ggcggtggaa gtggccgcgc cgggccaggt ggtgcggatc 9420 ctgtcgaatc cctacgggat cgccaccttc ttcgggctaa gcccggaaga gacccaggcc 9480 atcgtcccca tcgcccgcgc cctgattggc aaccgttccg cggtggtgct caagaccccg 9540 cagggggatg tgcagtcgcg ggtgatcccg gcgggcaacc tctacattag cggcgaaaag 9600 cgccgcggag aggccgatgt cgccgagggc gcggaagcca tcatgcaggc gatgagcgcc 9660 tgcgctccgg tacgcgacat ccgcggcgaa ccgggcaccc acgccggcgg catgcttgag 9720 cgggtgcgca aggtaatggc gtccctgacc ggccatgaga tgagcgcgat atacatccag 9780 gatctgctgg cggtggatac gtttattccg cgcaaggtgc agggcgggat ggccggcgag 9840 tgcgccatgg agaatgccgt cgggatggcg gcgatggtga aagcggatcg tctgcaaatg 9900 caggttatcg cccgcgaact gagcgcccga ctgcagaccg aggtggtggt gggcggcgtg 9960 gaggccaaca tggccatcgc cggggcgtta accactcccg gctgtgcggc gccgctggcg 10020 atcctcgacc tcggcgccgg ctcgacggat gcggcgatcg tcaacgcgga ggggcagata 10080 acggcggtcc atctcgccgg ggcggggaat atggtcagcc tgttgattaa aaccgagctg 10140 ggcctcgagg atctttcgct ggcggaagcg ataaaaaaat acccgctggc caaagtggaa 10200 agcctgttca gtattcgtca cgagaatggc gcggtggagt tctttcggga agccctcagc 10260 ccggcggtgt tcgccaaagt ggtgtacatc aaggagggcg aactggtgcc gatcgataac 10320 gccagcccgc tggaaaaaat tcgtctcgtg cgccggcagg cgaaagagaa agtgtttgtc 10380 accaactgcc tgcgcgcgct gcgccaggtc tcacccggcg gttccattcg cgatatcgcc 10440 tttgtggtgc tggtgggcgg ctcatcgctg gactttgaga tcccgcagct tatcacggaa 10500 gccttgtcgc actatggcgt ggtcgccggg cagggcaata ttcggggaac agaagggccg 10560 cgcaatgcgg tcgccaccgg gctgctactg gccggtcagg cgaattaaac gggcgctcgc 10620 gccagcctct aggtacaaat aaaaaaggca cgtcagatga cgtgcctttt ttcttgtcta 10680 gcgtgcacca atgcttctgg cgtcaggcag ccatcggaag ctgtggtatg gctgtgcagg 10740 tcgtaaatca ctgcataatt cgtgtcgctc aaggcgcact cccgttctgg ataatgtttt 10800 ttgcgccgac atcataacgg ttctggcaaa tattctgaaa tgagctgttg acaattaatc 10860 atccggctcg tataatgtgt ggaattgtga gcggataaca atttcacaca ggaaacagac 10920 catgactagt aaggaggaca attccatggc tgctgctgct gatagattaa acttaacttc 10980 cggccacttg aatgctggta gaaagagaag ttcctcttct gtttctttga aggctgccga 11040 aaagcctttc aaggttactg tgattggatc tggtaactgg ggtactacta ttgccaaggt 11100 ggttgccgaa aattgtaagg gatacccaga agttttcgct ccaatagtac aaatgtgggt 11160 gttcgaagaa gagatcaatg gtgaaaaatt gactgaaatc ataaatacta gacatcaaaa 11220 cgtgaaatac ttgcctggca tcactctacc cgacaatttg gttgctaatc cagacttgat 11280 tgattcagtc aaggatgtcg acatcatcgt tttcaacatt ccacatcaat ttttgccccg 11340 tatctgtagc caattgaaag gtcatgttga ttcacacgtc agagctatct cctgtctaaa 11400 gggttttgaa gttggtgcta aaggtgtcca attgctatcc tcttacatca ctgaggaact 11460 aggtattcaa tgtggtgctc tatctggtgc taacattgcc accgaagtcg ctcaagaaca 11520 ctggtctgaa acaacagttg cttaccacat tccaaaggat ttcagaggcg agggcaagga 11580 cgtcgaccat aaggttctaa aggccttgtt ccacagacct tacttccacg ttagtgtcat 11640 cgaagatgtt gctggtatct ccatctgtgg tgctttgaag aacgttgttg ccttaggttg 11700 tggtttcgtc gaaggtctag gctggggtaa caacgcttct gctgccatcc aaagagtcgg 11760 tttgggtgag atcatcagat tcggtcaaat gtttttccca gaatctagag aagaaacata 11820 ctaccaagag tctgctggtg ttgctgattt gatcaccacc tgcgctggtg gtagaaacgt 11880 caaggttgct aggctaatgg ctacttctgg taaggacgcc tgggaatgtg aaaaggagtt 11940 gttgaatggc caatccgctc aaggtttaat tacctgcaaa gaagttcacg aatggttgga 12000 aacatgtggc tctgtcgaag acttcccatt atttgaagcc gtataccaaa tcgtttacaa 12060 caactaccca atgaagaacc tgccggacat gattgaagaa ttagatctac atgaagatta 12120 gatttattgg atccaggaaa cagactagaa ttatgggatt gactactaaa cctctatctt 12180 tgaaagttaa cgccgctttg ttcgacgtcg acggtaccat tatcatctct caaccagcca 12240 ttgctgcatt ctggagggat ttcggtaagg acaaacctta tttcgatgct gaacacgtta 12300 tccaagtctc gcatggttgg agaacgtttg atgccattgc taagttcgct ccagactttg 12360 ccaatgaaga gtatgttaac aaattagaag ctgaaattcc ggtcaagtac ggtgaaaaat 12420 ccattgaagt cccaggtgca gttaagctgt gcaacgcttt gaacgctcta ccaaaagaga 12480 aatgggctgt ggcaacttcc ggtacccgtg atatggcaca aaaatggttc gagcatctgg 12540 gaatcaggag accaaagtac ttcattaccg ctaatgatgt caaacagggt aagcctcatc 12600 cagaaccata tctgaagggc aggaatggct taggatatcc gatcaatgag caagaccctt 12660 ccaaatctaa ggtagtagta tttgaagacg ctccagcagg tattgccgcc ggaaaagccg 12720 ccggttgtaa gatcattggt attgccacta ctttcgactt ggacttccta aaggaaaaag 12780 gctgtgacat cattgtcaaa aaccacgaat ccatcagagt tggcggctac aatgccgaaa 12840 cagacgaagt tgaattcatt tttgacgact acttatatgc taaggacgat ctgttgaaat 12900 ggtaacccgg gctgcaggca tgcaagcttg gctgttttgg cggatgagag aagattttca 12960 gcctgataca gattaaatca gaacgcagaa gcggtctgat aaaacagaat ttgcctggcg 13020 gcagtagcgc ggtggtccca cctgacccca tgccgaactc agaagtgaaa cgccgtagcg 13080 ccgatggtag tgtggggtct ccccatgcga gagtagggaa ctgccaggca tcaaataaaa 13140 cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct 13200 ctcctgagta ggacaaatcc gccgggagcg gatttgaacg ttgcgaagca acggcccgga 13260 gggtggcggg caggacgccc gccataaact gccaggcatc aaattaagca gaaggccatc 13320 ctgacggatg gcctttttgc gtttctacaa actccagctg gatcgggcgc tagagtatac 13380 atttaaatgg taccggcgcg ccgctagctt aattaacgga ccgatgcatg agctcacgcg 13440 taccggtgct cttcgatcta cgtaagaagg 13470 <210> 31 <211> 42 <212> DNA <213> artificial sequence <220> <223> promoter <400> 31 gcccttgact atgccacatc ctgagcaaat aattcaacca ct 42 <210> 32 <211> 42 <212> DNA <213> artificial sequence <220> <223> promoter <400> 32 gcccttgacg atgccacatc ctgagcaaat aattcaacca ct 42 <210> 33 <211> 42 <212> DNA <213> artificial sequence <220> <223> promoter <400> 33 gcccttgaca atgccacatc ctgagcaaat aattcaacca ct 42 <210> 34 <211> 81 <212> DNA <213> artificial sequence <220> <223> primer <400> 34 cattcggacc ggcccttgac tatgccacat cctgagcaaa taattcaacc actacagcaa 60 agggagcaag taatgaacaa c 81 <210> 35 <211> 81 <212> DNA <213> artificial sequence <220> <223> primer <400> 35 cattcggacc ggcccttgac gatgccacat cctgagcaaa taattcaacc actacagcaa 60 agggagcaag taatgaacaa c 81 <210> 36 <211> 81 <212> DNA <213> artificial sequence <220> <223> primer <400> 36 cattcggacc ggcccttgac aatgccacat cctgagcaaa taattcaacc actacagcaa 60 agggagcaag taatgaacaa c 81 <210> 37 <211> 82 <212> DNA <213> artificial sequence <220> <223> primer <400> 37 cattgagctc aaaaaaaaag cccgcactgt caggtgcggg cttttttctg tgtttaagct 60 tagcgggcgg cttcgtatat ac 82 <210> 38 <211> 62 <212> DNA <213> artificial sequence <220> <223> primer <400> 38 atgtgcgcgc caacgtcatg tgggcggcga ctcaggcgct gagtgtaggc tggagctgct 60 tc 62 <210> 39 <211> 67 <212> DNA <213> artificial sequence <220> <223> primer <400> 39 cagacgcgtt cagcatattg cagcagctta gcgcgcttgg tatcgcgatt ccggggatcc 60 gtcgacc 67 <210> 40 <211> 25 <212> DNA <213> artificial sequence <220> <223> primer <400> 40 gccagcaagc ggcaaatctc ttcac 25 <210> 41 <211> 25 <212> DNA <213> artificial sequence <220> <223> primer <400> 41 gaggcgtaaa aagcttagcg ggcgg 25 <210> 42 <211> 24 <212> DNA <213> artificial sequence <220> <223> primer <400> 42 gcttcctcgt gctttacggt atcg 24 <210> 43 <211> 23 <212> DNA <213> artificial sequence <220> <223> primer <400> 43 cctgcgtgca atccatcttg ttc 23 <210> 44 <211> 100 <212> DNA <213> artificial sequence <220> <223> primer <400> 44 cgatttttta acatttccat aagttacgct tatttaaagc gtcgtgaatt taatgacgta 60 aattcctgct atttattcgt gtgtaggctg gagctgcttc 100 <210> 45 <211> 100 <212> DNA <213> artificial sequence <220> <223> primer <400> 45 tcgcattggc gcgaatatgc tcgggctttg cttttcgtca gtggttgaat tatttgctca 60 ggatgtggca ttgtcaaggg catatgaata tcctccttag 100 <210> 46 <211> 30 <212> DNA <213> artificial sequence <220> <223> primer <400> 46 gcggaatatt gttcgttcat attaccccag 30 <210> 47 <211> 94 <212> DNA <213> artificial sequence <220> <223> terminator <400> 47 agcttaggag tctagaatat tgagctcgaa ttcccgggca tgcggtaccg gatccagaaa 60 aaagcccgca cctgacagtg cgggcttttt tttt 94 <210> 48 <211> 12145 <212> DNA <213> artificial sequence <220> <223> plasmid <400> 48 gtcgaccacc acggtggtga ctttaatgcc gctctcatgc agcagctcgg tggcggtctc 60 aaaattcagg atgtcgccgg tatagttttt gataatcagc aagacgcctt cgccgccgtc 120 aatttgcatc gcgcattcaa acattttgtc cggcgtcggc gaggtgaata tttcccccgg 180 acaggcgccg gagagcatgc cctggccgat atagccgcag tgcatcggtt catgtccgct 240 gccgccgccg gagagcaggg ccaccttgcc agccaccggc gcgtcggtgc gggtcacata 300 cagcgggtcc tgatgcaggg tcagctgcgg atgggcttta gccagcccct gtaattgttc 360 attcagtaca tcttcaacac ggttaatcag ctttttcatt attcagtgct ccgttggaga 420 aggttcgatg ccgcctctct gctggcggag gcggtcatcg cgtaggggta tcgtctgacg 480 gtggagcgtg cctggcgata tgatgattct ggctgagcgg acgaaaaaaa gaatgccccg 540 acgatcgggt ttcattacga aacattgctt cctgattttg tttctttatg gaacgttttt 600 gctgaggata tggtgaaaat gcgagctggc gcgctttttt tcttctgcca taagcggcgg 660 tcaggatagc cggcgaagcg ggtgggaaaa aattttttgc tgattttctg ccgactgcgg 720 gagaaaaggc ggtcaaacac ggaggattgt aagggcatta tgcggcaaag gagcggatcg 780 ggatcgcaat cctgacagag actagggttt tttgttccaa tatggaacgt aaaaaattaa 840 cctgtgtttc atatcagaac aaaaaggcga aagatttttt tgttccctgc cggccctaca 900 gtgatcgcac tgctccggta cgctccgttc aggccgcgct tcactggccg gcgcggataa 960 cgccagggct catcatgtct acatgcgcac ttatttgagg gtgaaaggaa tgctaaaagt 1020 tattcaatct ccagccaaat atcttcaggg tcctgatgct gctgttctgt tcggtcaata 1080 tgccaaaaac ctggcggaga gcttcttcgt catcgctgac gatttcgtaa tgaagctggc 1140 gggagagaaa gtggtgaatg gcctgcagag ccacgatatt cgctgccatg cggaacggtt 1200 taacggcgaa tgcagccatg cggaaatcaa ccgtctgatg gcgattttgc aaaaacaggg 1260 ctgccgcggc gtggtcggga tcggcggtgg taaaaccctc gataccgcga aggcgatcgg 1320 ttactaccag aagctgccgg tggtggtgat cccgaccatc gcctcgaccg atgcgccaac 1380 cagcgcgctg tcggtgatct acaccgaagc gggcgagttt gaagagtatc tgatctatcc 1440 gaaaaacccg gatatggtgg tgatggacac ggcgattatc gccaaagcgc cggtacgcct 1500 gctggtctcc ggcatgggcg atgcgctctc cacctggttc gaggccaaag cttgctacga 1560 tgcgcgcgcc accagcatgg ccggaggaca gtccaccgag gcggcgctga gcctcgcccg 1620 cctgtgctat gatacgctgc tggcggaggg cgaaaaggcc cgtctggcgg cgcaggccgg 1680 ggtagtgacc gaagcgctgg agcgcatcat cgaggcgaac acttacctca gcggcattgg 1740 ctttgaaagc agtggcctgg ccgctgccca tgcaatccac aacggtttca ccattcttga 1800 agagtgccat cacctgtatc acggtgagaa agtggccttc ggtaccctgg cgcagctggt 1860 gctgcagaac agcccgatgg acgagattga aacggtgcag ggcttctgcc agcgcgtcgg 1920 cctgccggtg acgctcgcgc agatgggcgt caaagagggg atcgacgaga aaatcgccgc 1980 ggtggcgaaa gctacctgcg cggaagggga aaccatccat aatatgccgt ttgcggtgac 2040 cccggagagc gtccatgccg ctatcctcac cgccgatctg ttaggccagc agtggctggc 2100 gcgttaattc gcggtggcta aaccgctggc ccaggtcagc ggtttttctt tctcccctcc 2160 ggcagtcgct gccggagggg ttctctatgg tacaacgcgg aaaaggatat gactgttcag 2220 actcaggata ccgggaaggc ggtctcttcc gtcattgccc agtcatggca ccgctgcagc 2280 aagtttatgc agcgcgaaac ctggcaaacg ccgcaccagg cccagggcct gaccttcgac 2340 tccatctgtc ggcgtaaaac cgcgctgctc accatcggcc aggcggcgct ggaagacgcc 2400 tgggagttta tggacggccg cccctgcgcg ctgtttattc ttgatgagtc cgcctgcatc 2460 ctgagccgtt gcggcgagcc gcaaaccctg gcccagctgg ctgccctggg atttcgcgac 2520 ggcagctatt gtgcggagag cattatcggc acctgcgcgc tgtcgctggc cgcgatgcag 2580 ggccagccga tcaacaccgc cggcgatcgg cattttaagc aggcgctaca gccatggagt 2640 ttttgctcga cgccggtgtt tgataaccac gggcggctgt tcggctctat ctcgctttgc 2700 tgtctggtcg agcaccagtc cagcgccgac ctctccctga cgctggccat cgcccgcgag 2760 gtgggtaact ccctgcttac cgacagcctg ctggcggaat ccaaccgtca cctcaatcag 2820 atgtacggcc tgctggagag catggacgat ggggtgatgg cgtggaacga acagggcgtg 2880 ctgcagtttc tcaatgttca ggcggcgaga ctgctgcatc ttgatgctca ggccagccag 2940 gggaaaaata tcgccgatct ggtgaccctc ccggcgctgc tgcgccgcgc catcaaacac 3000 gcccgcggcc tgaatcacgt cgaagtcacc tttgaaagtc agcatcagtt tgtcgatgcg 3060 gtgatcacct taaaaccgat tgtcgaggcg caaggcaaca gttttattct gctgctgcat 3120 ccggtggagc agatgcggca gctgatgacc agccagctcg gtaaagtcag ccacaccttt 3180 gagcagatgt ctgccgacga tccggaaacc cgacgcctga tccactttgg ccgccaggcg 3240 gcgcgcggcg gcttcccggt gctactgtgc ggcgaagagg gggtcgggaa agagctgctg 3300 agccaggcta ttcacaatga aagcgaacgg gcgggcggcc cctacatctc cgtcaactgc 3360 cagctatatg ccgacagcgt gctgggccag gactttatgg gcagcgcccc taccgacgat 3420 gaaaatggtc gcctgagccg ccttgagctg gccaacggcg gcaccctgtt tctggaaaag 3480 atcgagtatc tggcgccgga gctgcagtcg gctctgctgc aggtgattaa gcagggcgtg 3540 ctcacccgcc tcgacgcccg gcgcctgatc ccggtggatg tgaaggtgat tgccaccacc 3600 accgtcgatc tggccaatct ggtggaacag aaccgcttta gccgccagct gtactatgcg 3660 ctgcactcct ttgagatcgt catcccgccg ctgcgcgccc gacgcaacag tattccgtcg 3720 ctggtgcata accggttgaa gagcctggag aagcgtttct cttcgcgact gaaagtggac 3780 gatgacgcgc tggcacagct ggtggcctac tcgtggccgg ggaatgattt tgagctcaac 3840 agcgtcattg agaatatcgc catcagcagc gacaacggcc acattcgcct gagtaatctg 3900 ccggaatatc tcttttccga gcggccgggc ggggatagcg cgtcatcgct gctgccggcc 3960 agcctgactt ttagcgccat cgaaaaggaa gctattattc acgccgcccg ggtgaccagc 4020 gggcgggtgc aggagatgtc gcagctgctc aatatcggcc gcaccaccct gtggcgcaaa 4080 atgaagcagt acgatattga cgccagccag ttcaagcgca agcatcaggc ctagtctctt 4140 cgattcgcgc catggagaac agggcatccg acaggcgatt gctgtagcgt ttgagcgcgt 4200 cgcgcagcgg atgcgcgcgg tccatggccg tcagcaggcg ttcgagccga cgggactggg 4260 tgcgcgccac gtgcagctgg gcagaggcga gattcctccc cgggatcacg aactgtttta 4320 acgggccgct ctcggccata ttgcggtcga taagccgctc cagggcggtg atctcctctt 4380 cgccgatcgt ctggctcagg cgggtcaggc cccgcgcatc gctggccagt tcagccccca 4440 gcacgaacag cgtctgctga atatggtgca ggctttcccg cagcccggcg tcgcgggtcg 4500 tggcgtagca gacgcccagc tgggatatca gttcatcgac ggtgccgtag gcctcgacgc 4560 gaatatggtc tttctcgatg cggctgccgc cgtacagggc ggtggtgcct ttatccccgg 4620 tgcgggtata gatacgatac attcagtttc tctcacttaa cggcaggact ttaaccagct 4680 gcccggcgtt ggcgccgagc gtacgcagtt gatcgtcgct atcggtgacg tgtccggtag 4740 ccagcggcgc gtccgccggc agctgggcat gagtgagggc tatctcgccg gacgcgctga 4800 gcccgatacc cacccgcagg ggcgagcttc tggccgccag ggcgcccagc gcagcggcgt 4860 caccgcctcc gtcataggtt atggtctggc aggggacccc ctgctcctcc agcccccagc 4920 acagctcatt gatggcgccg gcatggtgcc cgcgcggatc gtaaaacagg cgtacgcctg 4980 gcggtgaaag cgacatgacg gtcccctcgt taacactcag aatgcctggc ggaaaatcgc 5040 ggcaatctcc tgctcgttgc ctttacgcgg gttcgagaac gcattgccgt cttttagagc 5100 catctccgcc atgtagggga agtcggcctc ttttaccccc agatcgcgca gatgctgcgg 5160 aataccgata tccatcgaca gacgcgtgat agcggcgatg gctttttccg ccgcgtcgag 5220 agtggacagt ccggtgatat tttcgcccat cagttcagcg atatcggcga atttctccgg 5280 gttggcgatc aggttgtagc gcgccacatg cggcagcagg acagcgttgg ccacgccgtg 5340 cggcatgtcg tacaggccgc ccagctggtg cgccatggcg tgcacgtagc cgaggttggc 5400 gttattgaaa gccatcccgg ccagcagaga agcataggcc atgttttccc gcgcctgcag 5460 attgctgccg agggccacgg cctggcgcag gttgcgggcg atgaggcgga tcgcctgcat 5520 ggcggcggcg tccgtcaccg ggttagcgtc tttggagata taggcctcta cggcgtgggt 5580 cagggcatcc atcccggtcg ccgcggtcag ggcggccggt ttaccgatca tcagcagtgg 5640 atcgttgata gagaccgacg gcagtttgcg ccagctgacg atcacaaact tcactttggt 5700 ttcggtgttg gtcaggacgc agtggcgggt gacctcgctg gcggtgccgg cggtggtatt 5760 gaccgcgacg ataggcggca gcgggttggt cagggtctcg attccggcat actggtacag 5820 atcgccctca tgggtggcgg cgatgccgat gcctttgccg caatcgtgcg ggctgccgcc 5880 gcccacggtg acgatgatgt cgcactgttc gcggcgaaac acggcgaggc cgtcgcgcac 5940 gttggtgtct ttcgggttcg gctcgacgcc gtcaaagatc gccacctcga tcccggcctc 6000 ccgcagataa tgcagggttt tgtccaccgc gccatcttta attgcccgca ggcctttgtc 6060 ggtgaccagc agggcttttt tcccccccag cagctggcag cgttcgccga ctacggaaat 6120 ggcgttgggg ccaaaaaagt taacgtttgg caccagataa tcaaacatac gatagctcat 6180 aatatacctt ctcgcttcag gttataatgc ggaaaaacaa tccagggcgc actgggctaa 6240 taattgatcc tgctcgaccg taccgccgct aacgccgacg gcgccaatta cctgctcatt 6300 aaaaataact ggcaggccgc cgccaaaaat aataattcgc tgttggttgg ttagctgcag 6360 accgtacaga gattgtcctg gctggaccgc tgacgtaatt tcatgggtac cttgcttcag 6420 gctgcaggcg ctccaggctt tattcaggga aatatcgcag ctggagacga aggcctcgtc 6480 catccgctgg ataagcagcg tgttgcctcc gcggtcaact acggaaaaca ccaccgccac 6540 gttgatctca gtggcttttt tttccaccgc cgccgccatt tgctgggcgg cggccagggt 6600 gattgtctga acttgttggc tcttgttcat cattctctcc cgcaccagga taacgctggc 6660 gcgaatagtc agtagggggc gatagtaaaa aactattacc attcggttgg cttgctttat 6720 ttttgtcagc gttattttgt cgcccgccat gatttagtca atagggttaa aatagcgtcg 6780 gaaaaacgta attaagggcg ttttttatta attgatttat atcattgcgg gcgatcacat 6840 tttttatttt tgccgccgga gtaaagtttc atagtgaaac tgtcggtaga tttcgtgtgc 6900 caaattgaaa cgaaattaaa tttatttttt tcaccactgg ctcatttaaa gttccgctat 6960 tgccggtaat ggccgggcgg caacgacgct ggcccggcgt attcgctacc gtctgcggat 7020 ttcacctttt gagccgatga acaatgaaaa gatcaaaacg atttgcagta ctggcccagc 7080 gccccgtcaa tcaggacggg ctgattggcg agtggcctga agaggggctg atcgccatgg 7140 acagcccctt tgacccggtc tcttcagtaa aagtggacaa cggtctgatc gtcgaactgg 7200 acggcaaacg ccgggaccag tttgacatga tcgaccgatt tatcgccgat tacgcgatca 7260 acgttgagcg cacagagcag gcaatgcgcc tggaggcggt ggaaatagcc cgtatgctgg 7320 tggatattca cgtcagccgg gaggagatca ttgccatcac taccgccatc acgccggcca 7380 aagcggtcga ggtgatggcg cagatgaacg tggtggagat gatgatggcg ctgcagaaga 7440 tgcgtgcccg ccggaccccc tccaaccagt gccacgtcac caatctcaaa gataatccgg 7500 tgcagattgc cgctgacgcc gccgaggccg ggatccgcgg cttctcagaa caggagacca 7560 cggtcggtat cgcgcgctac gcgccgttta acgccctggc gctgttggtc ggttcgcagt 7620 gcggccgccc cggcgtgttg acgcagtgct cggtggaaga ggccaccgag ctggagctgg 7680 gcatgcgtgg cttaaccagc tacgccgaga cggtgtcggt ctacggcacc gaagcggtat 7740 ttaccgacgg cgatgatacg ccgtggtcaa aggcgttcct cgcctcggcc tacgcctccc 7800 gcgggttgaa aatgcgctac acctccggca ccggatccga agcgctgatg ggctattcgg 7860 agagcaagtc gatgctctac ctcgaatcgc gctgcatctt cattactaaa ggcgccgggg 7920 ttcagggact gcaaaacggc gcggtgagct gtatcggcat gaccggcgct gtgccgtcgg 7980 gcattcgggc ggtgctggcg gaaaacctga tcgcctctat gctcgacctc gaagtggcgt 8040 ccgccaacga ccagactttc tcccactcgg atattcgccg caccgcgcgc accctgatgc 8100 agatgctgcc gggcaccgac tttattttct ccggctacag cgcggtgccg aactacgaca 8160 acatgttcgc cggctcgaac ttcgatgcgg aagattttga tgattacaac atcctgcagc 8220 gtgacctgat ggttgacggc ggcctgcgtc cggtgaccga ggcggaaacc attgccattc 8280 gccagaaagc ggcgcgggcg atccaggcgg ttttccgcga gctggggctg ccgccaatcg 8340 ccgacgagga ggtggaggcc gccacctacg cgcacggcag caacgagatg ccgccgcgta 8400 acgtggtgga ggatctgagt gcggtggaag agatgatgaa gcgcaacatc accggcctcg 8460 atattgtcgg cgcgctgagc cgcagcggct ttgaggatat cgccagcaat attctcaata 8520 tgctgcgcca gcgggtcacc ggcgattacc tgcagacctc ggccattctc gatcggcagt 8580 tcgaggtggt gagtgcggtc aacgacatca atgactatca ggggccgggc accggctatc 8640 gcatctctgc cgaacgctgg gcggagatca aaaatattcc gggcgtggtt cagcccgaca 8700 ccattgaata aggcggtatt cctgtgcaac agacaaccca aattcagccc tcttttaccc 8760 tgaaaacccg cgagggcggg gtagcttctg ccgatgaacg cgccgatgaa gtggtgatcg 8820 gcgtcggccc tgccttcgat aaacaccagc atcacactct gatcgatatg ccccatggcg 8880 cgatcctcaa agagctgatt gccggggtgg aagaagaggg gcttcacgcc cgggtggtgc 8940 gcattctgcg cacgtccgac gtctccttta tggcctggga tgcggccaac ctgagcggct 9000 cggggatcgg catcggtatc cagtcgaagg ggaccacggt catccatcag cgcgatctgc 9060 tgccgctcag caacctggag ctgttctccc aggcgccgct gctgacgctg gagacctacc 9120 ggcagattgg caaaaacgct gcgcgctatg cgcgcaaaga gtcaccttcg ccggtgccgg 9180 tggtgaacga tcagatggtg cggccgaaat ttatggccaa agccgcgcta tttcatatca 9240 aagagaccaa acatgtggtg caggacgccg agcccgtcac cctgcacatc gacttagtaa 9300 gggagtgacc atgagcgaga aaaccatgcg cgtgcaggat tatccgttag ccacccgctg 9360 cccggagcat atcctgacgc ctaccggcaa accattgacc gatattaccc tcgagaaggt 9420 gctctctggc gaggtgggcc cgcaggatgt gcggatctcc cgccagaccc ttgagtacca 9480 ggcgcagatt gccgagcaga tgcagcgcca tgcggtggcg cgcaatttcc gccgcgcggc 9540 ggagcttatc gccattcctg acgagcgcat tctggctatc tataacgcgc tgcgcccgtt 9600 ccgctcctcg caggcggagc tgctggcgat cgccgacgag ctggagcaca cctggcatgc 9660 gacagtgaat gccgcctttg tccgggagtc ggcggaagtg tatcagcagc ggcataagct 9720 gcgtaaagga agctaagcgg aggtcagcat gccgttaata gccgggattg atatcggcaa 9780 cgccaccacc gaggtggcgc tggcgtccga ctacccgcag gcgagggcgt ttgttgccag 9840 cgggatcgtc gcgacgacgg gcatgaaagg gacgcgggac aatatcgccg ggaccctcgc 9900 cgcgctggag caggccctgg cgaaaacacc gtggtcgatg agcgatgtct ctcgcatcta 9960 tcttaacgaa gccgcgccgg tgattggcga tgtggcgatg gagaccatca ccgagaccat 10020 tatcaccgaa tcgaccatga tcggtcataa cccgcagacg ccgggcgggg tgggcgttgg 10080 cgtggggacg actatcgccc tcgggcggct ggcgacgctg ccggcggcgc agtatgccga 10140 ggggtggatc gtactgattg acgacgccgt cgatttcctt gacgccgtgt ggtggctcaa 10200 tgaggcgctc gaccggggga tcaacgtggt ggcggcgatc ctcaaaaagg acgacggcgt 10260 gctggtgaac aaccgcctgc gtaaaaccct gccggtggtg gatgaagtga cgctgctgga 10320 gcaggtcccc gagggggtaa tggcggcggt ggaagtggcc gcgccgggcc aggtggtgcg 10380 gatcctgtcg aatccctacg ggatcgccac cttcttcggg ctaagcccgg aagagaccca 10440 ggccatcgtc cccatcgccc gcgccctgat tggcaaccgt tccgcggtgg tgctcaagac 10500 cccgcagggg gatgtgcagt cgcgggtgat cccggcgggc aacctctaca ttagcggcga 10560 aaagcgccgc ggagaggccg atgtcgccga gggcgcggaa gccatcatgc aggcgatgag 10620 cgcctgcgct ccggtacgcg acatccgcgg cgaaccgggc acccacgccg gcggcatgct 10680 tgagcgggtg cgcaaggtaa tggcgtccct gaccggccat gagatgagcg cgatatacat 10740 ccaggatctg ctggcggtgg atacgtttat tccgcgcaag gtgcagggcg ggatggccgg 10800 cgagtgcgcc atggagaatg ccgtcgggat ggcggcgatg gtgaaagcgg atcgtctgca 10860 aatgcaggtt atcgcccgcg aactgagcgc ccgactgcag accgaggtgg tggtgggcgg 10920 cgtggaggcc aacatggcca tcgccggggc gttaaccact cccggctgtg cggcgccgct 10980 ggcgatcctc gacctcggcg ccggctcgac ggatgcggcg atcgtcaacg cggaggggca 11040 gataacggcg gtccatctcg ccggggcggg gaatatggtc agcctgttga ttaaaaccga 11100 gctgggcctc gaggatcttt cgctggcgga agcgataaaa aaatacccgc tggccaaagt 11160 ggaaagcctg ttcagtattc gtcacgagaa tggcgcggtg gagttctttc gggaagccct 11220 cagcccggcg gtgttcgcca aagtggtgta catcaaggag ggcgaactgg tgccgatcga 11280 taacgccagc ccgctggaaa aaattcgtct cgtgcgccgg caggcgaaag agaaagtgtt 11340 tgtcaccaac tgcctgcgcg cgctgcgcca ggtctcaccc ggcggttcca ttcgcgatat 11400 cgcctttgtg gtgctggtgg gcggctcatc gctggacttt gagatcccgc agcttatcac 11460 ggaagccttg tcgcactatg gcgtggtcgc cgggcagggc aatattcggg gaacagaagg 11520 gccgcgcaat gcggtcgcca ccgggctgct actggccggt caggcgaatt aaacgggcgc 11580 tcgcgccagc ctctctcttt aacgtgctat ttcaggatgc cgataatgaa ccagacttct 11640 accttaaccg ggcagtgcgt ggccgagttt cttggcaccg gattgctcat tttcttcggc 11700 gcgggctgcg tcgctgcgct gcgggtcgcc ggggccagct ttggtcagtg ggagatcagt 11760 attatctggg gccttggcgt cgccatggcc atctacctga cggccggtgt ctccggcgcg 11820 cacctaaatc cggcggtgac cattgccctg tggctgttcg cctgttttga acgccgcaag 11880 gtgctgccgt ttattgttgc ccagacggcc ggggccttct gcgccgccgc gctggtgtat 11940 gggctctatc gccagctgtt tctcgatctt gaacagagtc agcatatcgt gcgcggcact 12000 gccgccagtc ttaacctggc cggggtcttt tccacgtacc cgcatccaca tatcactttt 12060 atacaagcgt ttgccgtgga gaccaccatc acggcaatcc tgatggcgat gatcatggcc 12120 ctgaccgacg acggcaacgg aattc 12145 <210> 49 <211> 37 <212> DNA <213> artificial sequence <220> <223> primer <400> 49 ggaattcaga tctcagcaat gagcgagaaa accatgc 37 <210> 50 <211> 27 <212> DNA <213> artificial sequence <220> <223> primer <400> 50 gctctagatt agcttccttt acgcagc 27 <210> 51 <211> 33 <212> DNA <213> artificial sequence <220> <223> primer <400> 51 ggccaagctt aaggaggtta attaaatgaa aag 33 <210> 52 <211> 26 <212> DNA <213> artificial sequence <220> <223> primer <400> 52 gctctagatt attcaatggt gtcggg 26 <210> 53 <211> 26 <212> DNA <213> artificial sequence <220> <223> primer <400> 53 gctctagatt attcaatggt gtcggg 26 <210> 54 <211> 42 <212> DNA <213> artificial sequence <220> <223> primer <400> 54 gcgccgtcta gaattatgag ctatcgtatg tttgattatc tg 42 <210> 55 <211> 18 <212> DNA <213> artificial sequence <220> <223> primer <400> 55 tcgacgaatt caggagga 18 <210> 56 <211> 18 <212> DNA <213> artificial sequence <220> <223> primer <400> 56 ctagtcctcc tgaattcg 18 <210> 57 <211> 133 <212> DNA <213> artificial sequence <220> <223> fragment <400> 57 agtcaaaagc ctccgaccgg aggcttttga ctgctagcaa acacagaaaa aagcccgcac 60 ctgacagtgc gggctttttt tttcctaggt acaaataaaa aaggcacgtc agatgacgtg 120 ccttttttct tgt 133 <210> 58 <211> 100 <212> DNA <213> artificial sequence <220> <223> primer <400> 58 ggaattcatt taaatagtca aaagcctccg accggaggct tttgactgct agcaaacaca 60 gaaaaaagcc cgcacctgac agtgcgggct ttttttttcc 100 <210> 59 <211> 100 <212> DNA <213> artificial sequence <220> <223> primer <400> 59 ggggtaccat ttaaatgtat actctagaca agaaaaaagg cacgtcatct gacgtgcctt 60 ttttatttgt acctaggaaa aaaaaagccc gcactgtcag 100 <210> 60 <211> 175 <212> DNA <213> artificial sequence <220> <223> fragment <400> 60 ggaattcatt taaatagtca aaagcctccg accggaggct tttgactgct agcaaacaca 60 gaaaaaagcc cgcacctgac agtgcgggct ttttttttcc taggtacaaa taaaaaaggc 120 acgtcagatg acgtgccttt tttcttgtct agagtataca tttaaatggt acccc 175 <210> 61 <211> 20 <212> DNA <213> artificial sequence <220> <223> primer <400> 61 ggaattcatt taaatagtca 20 <210> 62 <211> 20 <212> DNA <213> artificial sequence <220> <223> primer <400> 62 ggggtaccat ttaaatgtat 20 <210> 63 <211> 21 <212> DNA <213> artificial sequence <220> <223> primer <400> 63 gacgcaacag tattccgtcg c 21 <210> 64 <211> 42 <212> DNA <213> artificial sequence <220> <223> primer <400> 64 atgagctatc gtatgttccg ccaggcattc tgagtgttaa cg 42 <210> 65 <211> 33 <212> DNA <213> artificial sequence <220> <223> primer <400> 65 gcctggcgga acatacgata gctcataata tac 33 <210> 66 <211> 21 <212> DNA <213> artificial sequence <220> <223> primer <400> 66 cggggcgctg ggccagtact g 21 <210> 67 <211> 53 <212> DNA <213> artificial sequence <220> <223> linker <400> 67 tctagaggat ccgctagcac tagtagcccg ggcgctagcg cggccgcccc ggg 53 <210> 68 <211> 37 <212> DNA <213> artificial sequence <220> <223> primer <400> 68 tattcagctg gctagcgtgc accaatgctt ctggcgt 37 <210> 69 <211> 35 <212> DNA <213> artificial sequence <220> <223> primer <400> 69 gatccagctg gagtttgtag aaacgcaaaa aggcc 35 <210> 70 <211> 7283 <212> DNA <213> artificial sequence <220> <223> plasmid <400> 70 tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60 taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120 acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180 ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240 gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300 tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360 gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420 acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480 actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540 tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600 cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660 atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720 agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780 tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840 atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900 tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960 gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020 gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080 acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140 gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200 actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260 cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320 atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380 ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440 gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500 ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560 atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620 atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680 atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740 gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800 ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860 gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920 gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980 tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040 ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100 cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160 ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220 ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280 ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340 ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400 aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460 cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520 atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580 tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640 taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700 tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760 gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 2820 tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880 aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940 gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000 gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060 atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120 gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180 tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240 atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300 tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360 gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420 ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480 aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540 aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600 ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660 caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720 agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780 cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840 tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900 acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 3960 tatcatcaac aggcttaccc gtcttactgt cgggaattcg cgttggccga ttcattaatg 4020 cagctggcac gacaggtttc ccgactggaa agcgggcagt gagcgcaacg caattaatgt 4080 gagttagctc actcattagg caccccaggc tttacacttt atgcttccgg ctcgtatgtt 4140 gtgtggaatt gtgagcggat aacaatttca cacaggaaac agctatgacc atgattacgc 4200 caagcttgca tgcctgcagg tcgactctag aggatccgct agcactagta gccctattca 4260 gctggctagc gtgcaccaat gcttctggcg tcaggcagcc atcggaagct gtggtatggc 4320 tgtgcaggtc gtaaatcact gcataattcg tgtcgctcaa ggcgcactcc cgttctggat 4380 aatgtttttt gcgccgacat cataacggtt ctggcaaata ttctgaaatg agctgttgac 4440 aattaatcat ccggctcgta taatgtgtgg aattgtgagc ggataacaat ttcacacagg 4500 aaacagacca tgactagtaa ggaggacaat tccatggctg ctgctgctga tagattaaac 4560 ttaacttccg gccacttgaa tgctggtaga aagagaagtt cctcttctgt ttctttgaag 4620 gctgccgaaa agcctttcaa ggttactgtg attggatctg gtaactgggg tactactatt 4680 gccaaggtgg ttgccgaaaa ttgtaaggga tacccagaag ttttcgctcc aatagtacaa 4740 atgtgggtgt tcgaagaaga gatcaatggt gaaaaattga ctgaaatcat aaatactaga 4800 catcaaaacg tgaaatactt gcctggcatc actctacccg acaatttggt tgctaatcca 4860 gacttgattg attcagtcaa ggatgtcgac atcatcgttt tcaacattcc acatcaattt 4920 ttgccccgta tctgtagcca attgaaaggt catgttgatt cacacgtcag agctatctcc 4980 tgtctaaagg gttttgaagt tggtgctaaa ggtgtccaat tgctatcctc ttacatcact 5040 gaggaactag gtattcaatg tggtgctcta tctggtgcta acattgccac cgaagtcgct 5100 caagaacact ggtctgaaac aacagttgct taccacattc caaaggattt cagaggcgag 5160 ggcaaggacg tcgaccataa ggttctaaag gccttgttcc acagacctta cttccacgtt 5220 agtgtcatcg aagatgttgc tggtatctcc atctgtggtg ctttgaagaa cgttgttgcc 5280 ttaggttgtg gtttcgtcga aggtctaggc tggggtaaca acgcttctgc tgccatccaa 5340 agagtcggtt tgggtgagat catcagattc ggtcaaatgt ttttcccaga atctagagaa 5400 gaaacatact accaagagtc tgctggtgtt gctgatttga tcaccacctg cgctggtggt 5460 agaaacgtca aggttgctag gctaatggct acttctggta aggacgcctg ggaatgtgaa 5520 aaggagttgt tgaatggcca atccgctcaa ggtttaatta cctgcaaaga agttcacgaa 5580 tggttggaaa catgtggctc tgtcgaagac ttcccattat ttgaagccgt ataccaaatc 5640 gtttacaaca actacccaat gaagaacctg ccggacatga ttgaagaatt agatctacat 5700 gaagattaga tttattggat ccaggaaaca gactagaatt atgggattga ctactaaacc 5760 tctatctttg aaagttaacg ccgctttgtt cgacgtcgac ggtaccatta tcatctctca 5820 accagccatt gctgcattct ggagggattt cggtaaggac aaaccttatt tcgatgctga 5880 acacgttatc caagtctcgc atggttggag aacgtttgat gccattgcta agttcgctcc 5940 agactttgcc aatgaagagt atgttaacaa attagaagct gaaattccgg tcaagtacgg 6000 tgaaaaatcc attgaagtcc caggtgcagt taagctgtgc aacgctttga acgctctacc 6060 aaaagagaaa tgggctgtgg caacttccgg tacccgtgat atggcacaaa aatggttcga 6120 gcatctggga atcaggagac caaagtactt cattaccgct aatgatgtca aacagggtaa 6180 gcctcatcca gaaccatatc tgaagggcag gaatggctta ggatatccga tcaatgagca 6240 agacccttcc aaatctaagg tagtagtatt tgaagacgct ccagcaggta ttgccgccgg 6300 aaaagccgcc ggttgtaaga tcattggtat tgccactact ttcgacttgg acttcctaaa 6360 ggaaaaaggc tgtgacatca ttgtcaaaaa ccacgaatcc atcagagttg gcggctacaa 6420 tgccgaaaca gacgaagttg aattcatttt tgacgactac ttatatgcta aggacgatct 6480 gttgaaatgg taacccgggc tgcaggcatg caagcttggc tgttttggcg gatgagagaa 6540 gattttcagc ctgatacaga ttaaatcaga acgcagaagc ggtctgataa aacagaattt 6600 gcctggcggc agtagcgcgg tggtcccacc tgaccccatg ccgaactcag aagtgaaacg 6660 ccgtagcgcc gatggtagtg tggggtctcc ccatgcgaga gtagggaact gccaggcatc 6720 aaataaaacg aaaggctcag tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg 6780 tgaacgctct cctgagtagg acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac 6840 ggcccggagg gtggcgggca ggacgcccgc cataaactgc caggcatcaa attaagcaga 6900 aggccatcct gacggatggc ctttttgcgt ttctacaaac tccagctgga tcgggcgcta 6960 gcgcggccgc cccgggtacc gagctcgaat tcactggccg tcgttttaca acgtcgtgac 7020 tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc tttcgccagc 7080 tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat 7140 ggcgaatggc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc 7200 atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca gccccgacac 7260 ccgccaacac ccgctgacga gct 7283 <210> 71 <211> 13669 <212> DNA <213> artificial sequence <220> <223> plasmid <400> 71 tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60 taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120 acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180 ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240 gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300 tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360 gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420 acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480 actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540 tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600 cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660 atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720 agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780 tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840 atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900 tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960 gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020 gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080 acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140 gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200 actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260 cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320 atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380 ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440 gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500 ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560 atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620 atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680 atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740 gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800 ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860 gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920 gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980 tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040 ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100 cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160 ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220 ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280 ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340 ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400 aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460 cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520 atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580 tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640 taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700 tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760 gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 2820 tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880 aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940 gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000 gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060 atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120 gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180 tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240 atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300 tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360 gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420 ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480 aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540 aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600 ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660 caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720 agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780 cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840 tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900 acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 3960 tatcatcaac aggcttaccc gtcttactgt cgggaattca tttaaatagt caaaagcctc 4020 cgaccggagg cttttgactg ctaggcgatc tgtgctgttt gccacggtat gcagcaccag 4080 cgcgagatta tgggctcgca cgctcgactg tcggacgggg gcactggaac gagaagtcag 4140 gcgagccgtc acgcccttga caatgccaca tcctgagcaa ataattcaac cactaaacaa 4200 atcaaccgcg tttcccggag gtaaccaagc ttgcgggaga gaatgatgaa caagagccaa 4260 caagttcaga caatcaccct ggccgccgcc cagcaaatgg cggcggcggt ggaaaaaaaa 4320 gccactgaga tcaacgtggc ggtggtgttt tccgtagttg accgcggagg caacacgctg 4380 cttatccagc ggatggacga ggccttcgtc tccagctgcg atatttccct gaataaagcc 4440 tggagcgcct gcagcctgaa gcaaggtacc catgaaatta cgtcagcggt ccagccagga 4500 caatctctgt acggtctgca gctaaccaac caacagcgaa ttattatttt tggcggcggc 4560 ctgccagtta tttttaatga gcaggtaatt ggcgccgtcg gcgttagcgg cggtacggtc 4620 gagcaggatc aattattagc ccagtgcgcc ctggattgtt tttccgcatt ataacctgaa 4680 gcgagaaggt atattatgag ctatcgtatg ttccgccagg cattctgagt gttaacgagg 4740 ggaccgtcat gtcgctttca ccgccaggcg tacgcctgtt ttacgatccg cgcgggcacc 4800 atgccggcgc catcaatgag ctgtgctggg ggctggagga gcagggggtc ccctgccaga 4860 ccataaccta tgacggaggc ggtgacgccg ctgcgctggg cgccctggcg gccagaagct 4920 cgcccctgcg ggtgggtatc gggctcagcg cgtccggcga gatagccctc actcatgccc 4980 agctgccggc ggacgcgccg ctggctaccg gacacgtcac cgatagcgac gatcaactgc 5040 gtacgctcgg cgccaacgcc gggcagctgg ttaaagtcct gccgttaagt gagagaaact 5100 gaatgtatcg tatctatacc cgcaccgggg ataaaggcac caccgccctg tacggcggca 5160 gccgcatcga gaaagaccat attcgcgtcg aggcctacgg caccgtcgat gaactgatat 5220 cccagctggg cgtctgctac gccacgaccc gcgacgccgg gctgcgggaa agcctgcacc 5280 atattcagca gacgctgttc gtgctggggg ctgaactggc cagcgatgcg cggggcctga 5340 cccgcctgag ccagacgatc ggcgaagagg agatcaccgc cctggagcgg cttatcgacc 5400 gcaatatggc cgagagcggc ccgttaaaac agttcgtgat cccggggagg aatctcgcct 5460 ctgcccagct gcacgtggcg cgcacccagt cccgtcggct cgaacgcctg ctgacggcca 5520 tggaccgcgc gcatccgctg cgcgacgcgc tcaaacgcta cagcaatcgc ctgtcggatg 5580 ccctgttctc catggcgcga atcgaagaga ctaggcctga tgcttgcgct tgaactggcc 5640 tagcaaacac agaaaaaagc ccgcacctga cagtgcgggc tttttttttc ctaggcgatc 5700 tgtgctgttt gccacggtat gcagcaccag cgcgagatta tgggctcgca cgctcgactg 5760 tcggacgggg gcactggaac gagaagtcag gcgagccgtc acgcccttga caatgccaca 5820 tcctgagcaa ataattcaac cactaaacaa atcaaccgcg tttcccggag gtaaccaagc 5880 ttcacctttt gagccgatga acaatgaaaa gatcaaaacg atttgcagta ctggcccagc 5940 gccccgtcaa tcaggacggg ctgattggcg agtggcctga agaggggctg atcgccatgg 6000 acagcccctt tgacccggtc tcttcagtaa aagtggacaa cggtctgatc gtcgaactgg 6060 acggcaaacg ccgggaccag tttgacatga tcgaccgatt tatcgccgat tacgcgatca 6120 acgttgagcg cacagagcag gcaatgcgcc tggaggcggt ggaaatagcc cgtatgctgg 6180 tggatattca cgtcagccgg gaggagatca ttgccatcac taccgccatc acgccggcca 6240 aagcggtcga ggtgatggcg cagatgaacg tggtggagat gatgatggcg ctgcagaaga 6300 tgcgtgcccg ccggaccccc tccaaccagt gccacgtcac caatctcaaa gataatccgg 6360 tgcagattgc cgctgacgcc gccgaggccg ggatccgcgg cttctcagaa caggagacca 6420 cggtcggtat cgcgcgctac gcgccgttta acgccctggc gctgttggtc ggttcgcagt 6480 gcggccgccc cggcgtgttg acgcagtgct cggtggaaga ggccaccgag ctggagctgg 6540 gcatgcgtgg cttaaccagc tacgccgaga cggtgtcggt ctacggcacc gaagcggtat 6600 ttaccgacgg cgatgatacg ccgtggtcaa aggcgttcct cgcctcggcc tacgcctccc 6660 gcgggttgaa aatgcgctac acctccggca ccggatccga agcgctgatg ggctattcgg 6720 agagcaagtc gatgctctac ctcgaatcgc gctgcatctt cattactaaa ggcgccgggg 6780 ttcagggact gcaaaacggc gcggtgagct gtatcggcat gaccggcgct gtgccgtcgg 6840 gcattcgggc ggtgctggcg gaaaacctga tcgcctctat gctcgacctc gaagtggcgt 6900 ccgccaacga ccagactttc tcccactcgg atattcgccg caccgcgcgc accctgatgc 6960 agatgctgcc gggcaccgac tttattttct ccggctacag cgcggtgccg aactacgaca 7020 acatgttcgc cggctcgaac ttcgatgcgg aagattttga tgattacaac atcctgcagc 7080 gtgacctgat ggttgacggc ggcctgcgtc cggtgaccga ggcggaaacc attgccattc 7140 gccagaaagc ggcgcgggcg atccaggcgg ttttccgcga gctggggctg ccgccaatcg 7200 ccgacgagga ggtggaggcc gccacctacg cgcacggcag caacgagatg ccgccgcgta 7260 acgtggtgga ggatctgagt gcggtggaag agatgatgaa gcgcaacatc accggcctcg 7320 atattgtcgg cgcgctgagc cgcagcggct ttgaggatat cgccagcaat attctcaata 7380 tgctgcgcca gcgggtcacc ggcgattacc tgcagacctc ggccattctc gatcggcagt 7440 tcgaggtggt gagtgcggtc aacgacatca atgactatca ggggccgggc accggctatc 7500 gcatctctgc cgaacgctgg gcggagatca aaaatattcc gggcgtggtt cagcccgaca 7560 ccattgaata aggcggtatt cctgtgcaac agacaaccca aattcagccc tcttttaccc 7620 tgaaaacccg cgagggcggg gtagcttctg ccgatgaacg cgccgatgaa gtggtgatcg 7680 gcgtcggccc tgccttcgat aaacaccagc atcacactct gatcgatatg ccccatggcg 7740 cgatcctcaa agagctgatt gccggggtgg aagaagaggg gcttcacgcc cgggtggtgc 7800 gcattctgcg cacgtccgac gtctccttta tggcctggga tgcggccaac ctgagcggct 7860 cggggatcgg catcggtatc cagtcgaagg ggaccacggt catccatcag cgcgatctgc 7920 tgccgctcag caacctggag ctgttctccc aggcgccgct gctgacgctg gagacctacc 7980 ggcagattgg caaaaacgct gcgcgctatg cgcgcaaaga gtcaccttcg ccggtgccgg 8040 tggtgaacga tcagatggtg cggccgaaat ttatggccaa agccgcgcta tttcatatca 8100 aagagaccaa acatgtggtg caggacgccg agcccgtcac cctgcacatc gacttagtaa 8160 gggagtgacc atgagcgaga aaaccatgcg cgtgcaggat tatccgttag ccacccgctg 8220 cccggagcat atcctgacgc ctaccggcaa accattgacc gatattaccc tcgagaaggt 8280 gctctctggc gaggtgggcc cgcaggatgt gcggatctcc cgccagaccc ttgagtacca 8340 ggcgcagatt gccgagcaga tgcagcgcca tgcggtggcg cgcaatttcc gccgcgcggc 8400 ggagcttatc gccattcctg acgagcgcat tctggctatc tataacgcgc tgcgcccgtt 8460 ccgctcctcg caggcggagc tgctggcgat cgccgacgag ctggagcaca cctggcatgc 8520 gacagtgaat gccgcctttg tccgggagtc ggcggaagtg tatcagcagc ggcataagct 8580 gcgtaaagga agctaagcgg aggtcagcat gccgttaata gccgggattg atatcggcaa 8640 cgccaccacc gaggtggcgc tggcgtccga ctacccgcag gcgagggcgt ttgttgccag 8700 cgggatcgtc gcgacgacgg gcatgaaagg gacgcgggac aatatcgccg ggaccctcgc 8760 cgcgctggag caggccctgg cgaaaacacc gtggtcgatg agcgatgtct ctcgcatcta 8820 tcttaacgaa gccgcgccgg tgattggcga tgtggcgatg gagaccatca ccgagaccat 8880 tatcaccgaa tcgaccatga tcggtcataa cccgcagacg ccgggcgggg tgggcgttgg 8940 cgtggggacg actatcgccc tcgggcggct ggcgacgctg ccggcggcgc agtatgccga 9000 ggggtggatc gtactgattg acgacgccgt cgatttcctt gacgccgtgt ggtggctcaa 9060 tgaggcgctc gaccggggga tcaacgtggt ggcggcgatc ctcaaaaagg acgacggcgt 9120 gctggtgaac aaccgcctgc gtaaaaccct gccggtggtg gatgaagtga cgctgctgga 9180 gcaggtcccc gagggggtaa tggcggcggt ggaagtggcc gcgccgggcc aggtggtgcg 9240 gatcctgtcg aatccctacg ggatcgccac cttcttcggg ctaagcccgg aagagaccca 9300 ggccatcgtc cccatcgccc gcgccctgat tggcaaccgt tccgcggtgg tgctcaagac 9360 cccgcagggg gatgtgcagt cgcgggtgat cccggcgggc aacctctaca ttagcggcga 9420 aaagcgccgc ggagaggccg atgtcgccga gggcgcggaa gccatcatgc aggcgatgag 9480 cgcctgcgct ccggtacgcg acatccgcgg cgaaccgggc acccacgccg gcggcatgct 9540 tgagcgggtg cgcaaggtaa tggcgtccct gaccggccat gagatgagcg cgatatacat 9600 ccaggatctg ctggcggtgg atacgtttat tccgcgcaag gtgcagggcg ggatggccgg 9660 cgagtgcgcc atggagaatg ccgtcgggat ggcggcgatg gtgaaagcgg atcgtctgca 9720 aatgcaggtt atcgcccgcg aactgagcgc ccgactgcag accgaggtgg tggtgggcgg 9780 cgtggaggcc aacatggcca tcgccggggc gttaaccact cccggctgtg cggcgccgct 9840 ggcgatcctc gacctcggcg ccggctcgac ggatgcggcg atcgtcaacg cggaggggca 9900 gataacggcg gtccatctcg ccggggcggg gaatatggtc agcctgttga ttaaaaccga 9960 gctgggcctc gaggatcttt cgctggcgga agcgataaaa aaatacccgc tggccaaagt 10020 ggaaagcctg ttcagtattc gtcacgagaa tggcgcggtg gagttctttc gggaagccct 10080 cagcccggcg gtgttcgcca aagtggtgta catcaaggag ggcgaactgg tgccgatcga 10140 taacgccagc ccgctggaaa aaattcgtct cgtgcgccgg caggcgaaag agaaagtgtt 10200 tgtcaccaac tgcctgcgcg cgctgcgcca ggtctcaccc ggcggttcca ttcgcgatat 10260 cgcctttgtg gtgctggtgg gcggctcatc gctggacttt gagatcccgc agcttatcac 10320 ggaagccttg tcgcactatg gcgtggtcgc cgggcagggc aatattcggg gaacagaagg 10380 gccgcgcaat gcggtcgcca ccgggctgct actggccggt caggcgaatt aaacgggcgc 10440 tcgcgccagc ctctaggtac aaataaaaaa ggcacgtcag atgacgtgcc ttttttcttg 10500 tctagagtac tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 10560 ttttcccagt cacgacgttg taaaacgacg gccagtgaat tcgagctcgg tacccggggc 10620 ggccgcgcta gcgcccgatc cagctggagt ttgtagaaac gcaaaaaggc catccgtcag 10680 gatggccttc tgcttaattt gatgcctggc agtttatggc gggcgtcctg cccgccaccc 10740 tccgggccgt tgcttcgcaa cgttcaaatc cgctcccggc ggatttgtcc tactcaggag 10800 agcgttcacc gacaaacaac agataaaacg aaaggcccag tctttcgact gagcctttcg 10860 ttttatttga tgcctggcag ttccctactc tcgcatgggg agaccccaca ctaccatcgg 10920 cgctacggcg tttcacttct gagttcggca tggggtcagg tgggaccacc gcgctactgc 10980 cgccaggcaa attctgtttt atcagaccgc ttctgcgttc tgatttaatc tgtatcaggc 11040 tgaaaatctt ctctcatccg ccaaaacagc caagcttgca tgcctgcagc ccgggttacc 11100 atttcaacag atcgtcctta gcatataagt agtcgtcaaa aatgaattca acttcgtctg 11160 tttcggcatt gtagccgcca actctgatgg attcgtggtt tttgacaatg atgtcacagc 11220 ctttttcctt taggaagtcc aagtcgaaag tagtggcaat accaatgatc ttacaaccgg 11280 cggcttttcc ggcggcaata cctgctggag cgtcttcaaa tactactacc ttagatttgg 11340 aagggtcttg ctcattgatc ggatatccta agccattcct gcccttcaga tatggttctg 11400 gatgaggctt accctgtttg acatcattag cggtaatgaa gtactttggt ctcctgattc 11460 ccagatgctc gaaccatttt tgtgccatat cacgggtacc ggaagttgcc acagcccatt 11520 tctcttttgg tagagcgttc aaagcgttgc acagcttaac tgcacctggg acttcaatgg 11580 atttttcacc gtacttgacc ggaatttcag cttctaattt gttaacatac tcttcattgg 11640 caaagtctgg agcgaactta gcaatggcat caaacgttct ccaaccatgc gagacttgga 11700 taacgtgttc agcatcgaaa taaggtttgt ccttaccgaa atccctccag aatgcagcaa 11760 tggctggttg agagatgata atggtaccgt cgacgtcgaa caaagcggcg ttaactttca 11820 aagatagagg tttagtagtc aatcccataa ttctagtctg tttcctggat ccaataaatc 11880 taatcttcat gtagatctaa ttcttcaatc atgtccggca ggttcttcat tgggtagttg 11940 ttgtaaacga tttggtatac ggcttcaaat aatgggaagt cttcgacaga gccacatgtt 12000 tccaaccatt cgtgaacttc tttgcaggta attaaacctt gagcggattg gccattcaac 12060 aactcctttt cacattccca ggcgtcctta ccagaagtag ccattagcct agcaaccttg 12120 acgtttctac caccagcgca ggtggtgatc aaatcagcaa caccagcaga ctcttggtag 12180 tatgtttctt ctctagattc tgggaaaaac atttgaccga atctgatgat ctcacccaaa 12240 ccgactcttt ggatggcagc agaagcgttg ttaccccagc ctagaccttc gacgaaacca 12300 caacctaagg caacaacgtt cttcaaagca ccacagatgg agataccagc aacatcttcg 12360 atgacactaa cgtggaagta aggtctgtgg aacaaggcct ttagaacctt atggtcgacg 12420 tccttgccct cgcctctgaa atcctttgga atgtggtaag caactgttgt ttcagaccag 12480 tgttcttgag cgacttcggt ggcaatgtta gcaccagata gagcaccaca ttgaatacct 12540 agttcctcag tgatgtaaga ggatagcaat tggacacctt tagcaccaac ttcaaaaccc 12600 tttagacagg agatagctct gacgtgtgaa tcaacatgac ctttcaattg gctacagata 12660 cggggcaaaa attgatgtgg aatgttgaaa acgatgatgt cgacatcctt gactgaatca 12720 atcaagtctg gattagcaac caaattgtcg ggtagagtga tgccaggcaa gtatttcacg 12780 ttttgatgtc tagtatttat gatttcagtc aatttttcac cattgatctc ttcttcgaac 12840 acccacattt gtactattgg agcgaaaact tctgggtatc ccttacaatt ttcggcaacc 12900 accttggcaa tagtagtacc ccagttacca gatccaatca cagtaacctt gaaaggcttt 12960 tcggcagcct tcaaagaaac agaagaggaa cttctctttc taccagcatt caagtggccg 13020 gaagttaagt ttaatctatc agcagcagca gccatggaat tgtcctcctt actagtcatg 13080 gtctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacattata cgagccggat 13140 gattaattgt caacagctca tttcagaata tttgccagaa ccgttatgat gtcggcgcaa 13200 aaaacattat ccagaacggg agtgcgcctt gagcgacacg aattatgcag tgatttacga 13260 cctgcacagc cataccacag cttccgatgg ctgcctgacg ccagaagcat tggtgcacgc 13320 tagccagtac atttaaatgg taccctctag tcaaggcctt aagtgagtcg tattacggac 13380 tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc 13440 ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc 13500 cttcccaaca gttgcgcagc ctgaatggcg aatggcgcct gatgcggtat tttctcctta 13560 cgcatctgtg cggtatttca caccgcatat ggtgcactct cagtacaatc tgctctgatg 13620 ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgagct 13669 <210> 72 <211> 13543 <212> DNA <213> artificial sequence <220> <223> plasmid <400> 72 tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60 taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120 acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180 ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240 gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300 tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360 gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420 acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480 actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540 tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600 cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660 atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720 agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780 tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840 atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900 tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960 gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020 gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080 acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140 gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200 actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260 cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320 atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380 ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440 gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500 ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560 atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620 atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680 atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740 gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800 ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860 gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920 gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980 tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040 ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100 cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160 ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220 ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280 ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340 ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400 aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460 cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520 atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580 tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640 taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700 tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760 gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 2820 tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880 aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940 gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000 gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060 atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120 gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180 tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240 atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300 tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360 gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420 ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480 aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540 aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600 ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660 caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720 agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780 cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840 tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900 acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 3960 tatcatcaac aggcttaccc gtcttactgt cgggaattca tttaaatagt caaaagcctc 4020 cgaccggagg cttttgactg ctaggcgatc tgtgctgttt gccacggtat gcagcaccag 4080 cgcgagatta tgggctcgca cgctcgactg tcggacgggg gcactggaac gagaagtcag 4140 gcgagccgtc acgcccttga ctatgccaca tcctgagcaa ataattcaac cactaaacaa 4200 atcaaccgcg tttcccggag gtaaccaagc ttgcgggaga gaatgatgaa caagagccaa 4260 caagttcaga caatcaccct ggccgccgcc cagcaaatgg cggcggcggt ggaaaaaaaa 4320 gccactgaga tcaacgtggc ggtggtgttt tccgtagttg accgcggagg caacacgctg 4380 cttatccagc ggatggacga ggccttcgtc tccagctgcg atatttccct gaataaagcc 4440 tggagcgcct gcagcctgaa gcaaggtacc catgaaatta cgtcagcggt ccagccagga 4500 caatctctgt acggtctgca gctaaccaac caacagcgaa ttattatttt tggcggcggc 4560 ctgccagtta tttttaatga gcaggtaatt ggcgccgtcg gcgttagcgg cggtacggtc 4620 gagcaggatc aattattagc ccagtgcgcc ctggattgtt tttccgcatt ataacctgaa 4680 gcgagaaggt atattatgag ctatcgtatg ttccgccagg cattctgagt gttaacgagg 4740 ggaccgtcat gtcgctttca ccgccaggcg tacgcctgtt ttacgatccg cgcgggcacc 4800 atgccggcgc catcaatgag ctgtgctggg ggctggagga gcagggggtc ccctgccaga 4860 ccataaccta tgacggaggc ggtgacgccg ctgcgctggg cgccctggcg gccagaagct 4920 cgcccctgcg ggtgggtatc gggctcagcg cgtccggcga gatagccctc actcatgccc 4980 agctgccggc ggacgcgccg ctggctaccg gacacgtcac cgatagcgac gatcaactgc 5040 gtacgctcgg cgccaacgcc gggcagctgg ttaaagtcct gccgttaagt gagagaaact 5100 gaatgtatcg tatctatacc cgcaccgggg ataaaggcac caccgccctg tacggcggca 5160 gccgcatcga gaaagaccat attcgcgtcg aggcctacgg caccgtcgat gaactgatat 5220 cccagctggg cgtctgctac gccacgaccc gcgacgccgg gctgcgggaa agcctgcacc 5280 atattcagca gacgctgttc gtgctggggg ctgaactggc cagcgatgcg cggggcctga 5340 cccgcctgag ccagacgatc ggcgaagagg agatcaccgc cctggagcgg cttatcgacc 5400 gcaatatggc cgagagcggc ccgttaaaac agttcgtgat cccggggagg aatctcgcct 5460 ctgcccagct gcacgtggcg cgcacccagt cccgtcggct cgaacgcctg ctgacggcca 5520 tggaccgcgc gcatccgctg cgcgacgcgc tcaaacgcta cagcaatcgc ctgtcggatg 5580 ccctgttctc catggcgcga atcgaagaga ctaggcctga tgcttgcgct tgaactggcc 5640 tagcaaacac agaaaaaagc ccgcacctga cagtgcgggc tttttttttc ctaggcgatc 5700 tgtgctgttt gccacggtat gcagcaccag cgcgagatta tgggctcgca cgctcgactg 5760 tcggacgggg gcactggaac gagaagtcag gcgagccgtc acgcccttga ctatgccaca 5820 tcctgagcaa ataattcaac cactaaacaa atcaaccgcg tttcccggag gtaaccaagc 5880 ttcacctttt gagccgatga acaatgaaaa gatcaaaacg atttgcagta ctggcccagc 5940 gccccgtcaa tcaggacggg ctgattggcg agtggcctga agaggggctg atcgccatgg 6000 acagcccctt tgacccggtc tcttcagtaa aagtggacaa cggtctgatc gtcgaactgg 6060 acggcaaacg ccgggaccag tttgacatga tcgaccgatt tatcgccgat tacgcgatca 6120 acgttgagcg cacagagcag gcaatgcgcc tggaggcggt ggaaatagcc cgtatgctgg 6180 tggatattca cgtcagccgg gaggagatca ttgccatcac taccgccatc acgccggcca 6240 aagcggtcga ggtgatggcg cagatgaacg tggtggagat gatgatggcg ctgcagaaga 6300 tgcgtgcccg ccggaccccc tccaaccagt gccacgtcac caatctcaaa gataatccgg 6360 tgcagattgc cgctgacgcc gccgaggccg ggatccgcgg cttctcagaa caggagacca 6420 cggtcggtat cgcgcgctac gcgccgttta acgccctggc gctgttggtc ggttcgcagt 6480 gcggccgccc cggcgtgttg acgcagtgct cggtggaaga ggccaccgag ctggagctgg 6540 gcatgcgtgg cttaaccagc tacgccgaga cggtgtcggt ctacggcacc gaagcggtat 6600 ttaccgacgg cgatgatacg ccgtggtcaa aggcgttcct cgcctcggcc tacgcctccc 6660 gcgggttgaa aatgcgctac acctccggca ccggatccga agcgctgatg ggctattcgg 6720 agagcaagtc gatgctctac ctcgaatcgc gctgcatctt cattactaaa ggcgccgggg 6780 ttcagggact gcaaaacggc gcggtgagct gtatcggcat gaccggcgct gtgccgtcgg 6840 gcattcgggc ggtgctggcg gaaaacctga tcgcctctat gctcgacctc gaagtggcgt 6900 ccgccaacga ccagactttc tcccactcgg atattcgccg caccgcgcgc accctgatgc 6960 agatgctgcc gggcaccgac tttattttct ccggctacag cgcggtgccg aactacgaca 7020 acatgttcgc cggctcgaac ttcgatgcgg aagattttga tgattacaac atcctgcagc 7080 gtgacctgat ggttgacggc ggcctgcgtc cggtgaccga ggcggaaacc attgccattc 7140 gccagaaagc ggcgcgggcg atccaggcgg ttttccgcga gctggggctg ccgccaatcg 7200 ccgacgagga ggtggaggcc gccacctacg cgcacggcag caacgagatg ccgccgcgta 7260 acgtggtgga ggatctgagt gcggtggaag agatgatgaa gcgcaacatc accggcctcg 7320 atattgtcgg cgcgctgagc cgcagcggct ttgaggatat cgccagcaat attctcaata 7380 tgctgcgcca gcgggtcacc ggcgattacc tgcagacctc ggccattctc gatcggcagt 7440 tcgaggtggt gagtgcggtc aacgacatca atgactatca ggggccgggc accggctatc 7500 gcatctctgc cgaacgctgg gcggagatca aaaatattcc gggcgtggtt cagcccgaca 7560 ccattgaata aggcggtatt cctgtgcaac agacaaccca aattcagccc tcttttaccc 7620 tgaaaacccg cgagggcggg gtagcttctg ccgatgaacg cgccgatgaa gtggtgatcg 7680 gcgtcggccc tgccttcgat aaacaccagc atcacactct gatcgatatg ccccatggcg 7740 cgatcctcaa agagctgatt gccggggtgg aagaagaggg gcttcacgcc cgggtggtgc 7800 gcattctgcg cacgtccgac gtctccttta tggcctggga tgcggccaac ctgagcggct 7860 cggggatcgg catcggtatc cagtcgaagg ggaccacggt catccatcag cgcgatctgc 7920 tgccgctcag caacctggag ctgttctccc aggcgccgct gctgacgctg gagacctacc 7980 ggcagattgg caaaaacgct gcgcgctatg cgcgcaaaga gtcaccttcg ccggtgccgg 8040 tggtgaacga tcagatggtg cggccgaaat ttatggccaa agccgcgcta tttcatatca 8100 aagagaccaa acatgtggtg caggacgccg agcccgtcac cctgcacatc gacttagtaa 8160 gggagtgacc atgagcgaga aaaccatgcg cgtgcaggat tatccgttag ccacccgctg 8220 cccggagcat atcctgacgc ctaccggcaa accattgacc gatattaccc tcgagaaggt 8280 gctctctggc gaggtgggcc cgcaggatgt gcggatctcc cgccagaccc ttgagtacca 8340 ggcgcagatt gccgagcaga tgcagcgcca tgcggtggcg cgcaatttcc gccgcgcggc 8400 ggagcttatc gccattcctg acgagcgcat tctggctatc tataacgcgc tgcgcccgtt 8460 ccgctcctcg caggcggagc tgctggcgat cgccgacgag ctggagcaca cctggcatgc 8520 gacagtgaat gccgcctttg tccgggagtc ggcggaagtg tatcagcagc ggcataagct 8580 gcgtaaagga agctaagcgg aggtcagcat gccgttaata gccgggattg atatcggcaa 8640 cgccaccacc gaggtggcgc tggcgtccga ctacccgcag gcgagggcgt ttgttgccag 8700 cgggatcgtc gcgacgacgg gcatgaaagg gacgcgggac aatatcgccg ggaccctcgc 8760 cgcgctggag caggccctgg cgaaaacacc gtggtcgatg agcgatgtct ctcgcatcta 8820 tcttaacgaa gccgcgccgg tgattggcga tgtggcgatg gagaccatca ccgagaccat 8880 tatcaccgaa tcgaccatga tcggtcataa cccgcagacg ccgggcgggg tgggcgttgg 8940 cgtggggacg actatcgccc tcgggcggct ggcgacgctg ccggcggcgc agtatgccga 9000 ggggtggatc gtactgattg acgacgccgt cgatttcctt gacgccgtgt ggtggctcaa 9060 tgaggcgctc gaccggggga tcaacgtggt ggcggcgatc ctcaaaaagg acgacggcgt 9120 gctggtgaac aaccgcctgc gtaaaaccct gccggtggtg gatgaagtga cgctgctgga 9180 gcaggtcccc gagggggtaa tggcggcggt ggaagtggcc gcgccgggcc aggtggtgcg 9240 gatcctgtcg aatccctacg ggatcgccac cttcttcggg ctaagcccgg aagagaccca 9300 ggccatcgtc cccatcgccc gcgccctgat tggcaaccgt tccgcggtgg tgctcaagac 9360 cccgcagggg gatgtgcagt cgcgggtgat cccggcgggc aacctctaca ttagcggcga 9420 aaagcgccgc ggagaggccg atgtcgccga gggcgcggaa gccatcatgc aggcgatgag 9480 cgcctgcgct ccggtacgcg acatccgcgg cgaaccgggc acccacgccg gcggcatgct 9540 tgagcgggtg cgcaaggtaa tggcgtccct gaccggccat gagatgagcg cgatatacat 9600 ccaggatctg ctggcggtgg atacgtttat tccgcgcaag gtgcagggcg ggatggccgg 9660 cgagtgcgcc atggagaatg ccgtcgggat ggcggcgatg gtgaaagcgg atcgtctgca 9720 aatgcaggtt atcgcccgcg aactgagcgc ccgactgcag accgaggtgg tggtgggcgg 9780 cgtggaggcc aacatggcca tcgccggggc gttaaccact cccggctgtg cggcgccgct 9840 ggcgatcctc gacctcggcg ccggctcgac ggatgcggcg atcgtcaacg cggaggggca 9900 gataacggcg gtccatctcg ccggggcggg gaatatggtc agcctgttga ttaaaaccga 9960 gctgggcctc gaggatcttt cgctggcgga agcgataaaa aaatacccgc tggccaaagt 10020 ggaaagcctg ttcagtattc gtcacgagaa tggcgcggtg gagttctttc gggaagccct 10080 cagcccggcg gtgttcgcca aagtggtgta catcaaggag ggcgaactgg tgccgatcga 10140 taacgccagc ccgctggaaa aaattcgtct cgtgcgccgg caggcgaaag agaaagtgtt 10200 tgtcaccaac tgcctgcgcg cgctgcgcca ggtctcaccc ggcggttcca ttcgcgatat 10260 cgcctttgtg gtgctggtgg gcggctcatc gctggacttt gagatcccgc agcttatcac 10320 ggaagccttg tcgcactatg gcgtggtcgc cgggcagggc aatattcggg gaacagaagg 10380 gccgcgcaat gcggtcgcca ccgggctgct actggccggt caggcgaatt aaacgggcgc 10440 tcgcgccagc ctctaggtac aaataaaaaa ggcacgtcag atgacgtgcc ttttttcttg 10500 tctagcgtgc accaatgctt ctggcgtcag gcagccatcg gaagctgtgg tatggctgtg 10560 caggtcgtaa atcactgcat aattcgtgtc gctcaaggcg cactcccgtt ctggataatg 10620 ttttttgcgc cgacatcata acggttctgg caaatattct gaaatgagct gttgacaatt 10680 aatcatccgg ctcgtataat gtgtggaatt gtgagcggat aacaatttca cacaggaaac 10740 agaccatgac tagtaaggag gacaattcca tggctgctgc tgctgataga ttaaacttaa 10800 cttccggcca cttgaatgct ggtagaaaga gaagttcctc ttctgtttct ttgaaggctg 10860 ccgaaaagcc tttcaaggtt actgtgattg gatctggtaa ctggggtact actattgcca 10920 aggtggttgc cgaaaattgt aagggatacc cagaagtttt cgctccaata gtacaaatgt 10980 gggtgttcga agaagagatc aatggtgaaa aattgactga aatcataaat actagacatc 11040 aaaacgtgaa atacttgcct ggcatcactc tacccgacaa tttggttgct aatccagact 11100 tgattgattc agtcaaggat gtcgacatca tcgttttcaa cattccacat caatttttgc 11160 cccgtatctg tagccaattg aaaggtcatg ttgattcaca cgtcagagct atctcctgtc 11220 taaagggttt tgaagttggt gctaaaggtg tccaattgct atcctcttac atcactgagg 11280 aactaggtat tcaatgtggt gctctatctg gtgctaacat tgccaccgaa gtcgctcaag 11340 aacactggtc tgaaacaaca gttgcttacc acattccaaa ggatttcaga ggcgagggca 11400 aggacgtcga ccataaggtt ctaaaggcct tgttccacag accttacttc cacgttagtg 11460 tcatcgaaga tgttgctggt atctccatct gtggtgcttt gaagaacgtt gttgccttag 11520 gttgtggttt cgtcgaaggt ctaggctggg gtaacaacgc ttctgctgcc atccaaagag 11580 tcggtttggg tgagatcatc agattcggtc aaatgttttt cccagaatct agagaagaaa 11640 catactacca agagtctgct ggtgttgctg atttgatcac cacctgcgct ggtggtagaa 11700 acgtcaaggt tgctaggcta atggctactt ctggtaagga cgcctgggaa tgtgaaaagg 11760 agttgttgaa tggccaatcc gctcaaggtt taattacctg caaagaagtt cacgaatggt 11820 tggaaacatg tggctctgtc gaagacttcc cattatttga agccgtatac caaatcgttt 11880 acaacaacta cccaatgaag aacctgccgg acatgattga agaattagat ctacatgaag 11940 attagattta ttggatccag gaaacagact agaattatgg gattgactac taaacctcta 12000 tctttgaaag ttaacgccgc tttgttcgac gtcgacggta ccattatcat ctctcaacca 12060 gccattgctg cattctggag ggatttcggt aaggacaaac cttatttcga tgctgaacac 12120 gttatccaag tctcgcatgg ttggagaacg tttgatgcca ttgctaagtt cgctccagac 12180 tttgccaatg aagagtatgt taacaaatta gaagctgaaa ttccggtcaa gtacggtgaa 12240 aaatccattg aagtcccagg tgcagttaag ctgtgcaacg ctttgaacgc tctaccaaaa 12300 gagaaatggg ctgtggcaac ttccggtacc cgtgatatgg cacaaaaatg gttcgagcat 12360 ctgggaatca ggagaccaaa gtacttcatt accgctaatg atgtcaaaca gggtaagcct 12420 catccagaac catatctgaa gggcaggaat ggcttaggat atccgatcaa tgagcaagac 12480 ccttccaaat ctaaggtagt agtatttgaa gacgctccag caggtattgc cgccggaaaa 12540 gccgccggtt gtaagatcat tggtattgcc actactttcg acttggactt cctaaaggaa 12600 aaaggctgtg acatcattgt caaaaaccac gaatccatca gagttggcgg ctacaatgcc 12660 gaaacagacg aagttgaatt catttttgac gactacttat atgctaagga cgatctgttg 12720 aaatggtaac ccgggctgca ggcatgcaag cttggctgtt ttggcggatg agagaagatt 12780 ttcagcctga tacagattaa atcagaacgc agaagcggtc tgataaaaca gaatttgcct 12840 ggcggcagta gcgcggtggt cccacctgac cccatgccga actcagaagt gaaacgccgt 12900 agcgccgatg gtagtgtggg gtctccccat gcgagagtag ggaactgcca ggcatcaaat 12960 aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa 13020 cgctctcctg agtaggacaa atccgccggg agcggatttg aacgttgcga agcaacggcc 13080 cggagggtgg cgggcaggac gcccgccata aactgccagg catcaaatta agcagaaggc 13140 catcctgacg gatggccttt ttgcgtttct acaaactcca gctggatcgg gcgctagagt 13200 atacatttaa atggtaccct ctagtcaagg ccttaagtga gtcgtattac ggactggccg 13260 tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag 13320 cacatccccc tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc 13380 aacagttgcg cagcctgaat ggcgaatggc gcctgatgcg gtattttctc cttacgcatc 13440 tgtgcggtat ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat 13500 agttaagcca gccccgacac ccgccaacac ccgctgacga gct 13543 <210> 73 <211> 13543 <212> DNA <213> artificial sequence <220> <223> plasmid <400> 73 tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60 taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120 acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180 ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240 gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300 tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360 gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420 acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480 actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540 tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600 cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660 atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720 agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780 tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840 atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900 tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960 gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020 gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080 acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140 gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200 actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260 cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320 atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380 ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440 gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500 ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560 atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620 atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680 atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740 gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800 ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860 gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920 gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980 tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040 ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100 cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160 ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220 ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280 ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340 ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400 aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460 cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520 atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580 tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640 taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700 tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760 gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 2820 tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880 aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940 gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000 gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060 atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120 gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180 tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240 atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300 tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360 gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420 ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480 aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540 aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600 ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660 caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720 agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780 cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840 tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900 acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 3960 tatcatcaac aggcttaccc gtcttactgt cgggaattca tttaaatagt caaaagcctc 4020 cgaccggagg cttttgactg ctaggcgatc tgtgctgttt gccacggtat gcagcaccag 4080 cgcgagatta tgggctcgca cgctcgactg tcggacgggg gcactggaac gagaagtcag 4140 gcgagccgtc acgcccttga caatgccaca tcctgagcaa ataattcaac cactaaacaa 4200 atcaaccgcg tttcccggag gtaaccaagc ttgcgggaga gaatgatgaa caagagccaa 4260 caagttcaga caatcaccct ggccgccgcc cagcaaatgg cggcggcggt ggaaaaaaaa 4320 gccactgaga tcaacgtggc ggtggtgttt tccgtagttg accgcggagg caacacgctg 4380 cttatccagc ggatggacga ggccttcgtc tccagctgcg atatttccct gaataaagcc 4440 tggagcgcct gcagcctgaa gcaaggtacc catgaaatta cgtcagcggt ccagccagga 4500 caatctctgt acggtctgca gctaaccaac caacagcgaa ttattatttt tggcggcggc 4560 ctgccagtta tttttaatga gcaggtaatt ggcgccgtcg gcgttagcgg cggtacggtc 4620 gagcaggatc aattattagc ccagtgcgcc ctggattgtt tttccgcatt ataacctgaa 4680 gcgagaaggt atattatgag ctatcgtatg ttccgccagg cattctgagt gttaacgagg 4740 ggaccgtcat gtcgctttca ccgccaggcg tacgcctgtt ttacgatccg cgcgggcacc 4800 atgccggcgc catcaatgag ctgtgctggg ggctggagga gcagggggtc ccctgccaga 4860 ccataaccta tgacggaggc ggtgacgccg ctgcgctggg cgccctggcg gccagaagct 4920 cgcccctgcg ggtgggtatc gggctcagcg cgtccggcga gatagccctc actcatgccc 4980 agctgccggc ggacgcgccg ctggctaccg gacacgtcac cgatagcgac gatcaactgc 5040 gtacgctcgg cgccaacgcc gggcagctgg ttaaagtcct gccgttaagt gagagaaact 5100 gaatgtatcg tatctatacc cgcaccgggg ataaaggcac caccgccctg tacggcggca 5160 gccgcatcga gaaagaccat attcgcgtcg aggcctacgg caccgtcgat gaactgatat 5220 cccagctggg cgtctgctac gccacgaccc gcgacgccgg gctgcgggaa agcctgcacc 5280 atattcagca gacgctgttc gtgctggggg ctgaactggc cagcgatgcg cggggcctga 5340 cccgcctgag ccagacgatc ggcgaagagg agatcaccgc cctggagcgg cttatcgacc 5400 gcaatatggc cgagagcggc ccgttaaaac agttcgtgat cccggggagg aatctcgcct 5460 ctgcccagct gcacgtggcg cgcacccagt cccgtcggct cgaacgcctg ctgacggcca 5520 tggaccgcgc gcatccgctg cgcgacgcgc tcaaacgcta cagcaatcgc ctgtcggatg 5580 ccctgttctc catggcgcga atcgaagaga ctaggcctga tgcttgcgct tgaactggcc 5640 tagcaaacac agaaaaaagc ccgcacctga cagtgcgggc tttttttttc ctaggcgatc 5700 tgtgctgttt gccacggtat gcagcaccag cgcgagatta tgggctcgca cgctcgactg 5760 tcggacgggg gcactggaac gagaagtcag gcgagccgtc acgcccttga caatgccaca 5820 tcctgagcaa ataattcaac cactaaacaa atcaaccgcg tttcccggag gtaaccaagc 5880 ttcacctttt gagccgatga acaatgaaaa gatcaaaacg atttgcagta ctggcccagc 5940 gccccgtcaa tcaggacggg ctgattggcg agtggcctga agaggggctg atcgccatgg 6000 acagcccctt tgacccggtc tcttcagtaa aagtggacaa cggtctgatc gtcgaactgg 6060 acggcaaacg ccgggaccag tttgacatga tcgaccgatt tatcgccgat tacgcgatca 6120 acgttgagcg cacagagcag gcaatgcgcc tggaggcggt ggaaatagcc cgtatgctgg 6180 tggatattca cgtcagccgg gaggagatca ttgccatcac taccgccatc acgccggcca 6240 aagcggtcga ggtgatggcg cagatgaacg tggtggagat gatgatggcg ctgcagaaga 6300 tgcgtgcccg ccggaccccc tccaaccagt gccacgtcac caatctcaaa gataatccgg 6360 tgcagattgc cgctgacgcc gccgaggccg ggatccgcgg cttctcagaa caggagacca 6420 cggtcggtat cgcgcgctac gcgccgttta acgccctggc gctgttggtc ggttcgcagt 6480 gcggccgccc cggcgtgttg acgcagtgct cggtggaaga ggccaccgag ctggagctgg 6540 gcatgcgtgg cttaaccagc tacgccgaga cggtgtcggt ctacggcacc gaagcggtat 6600 ttaccgacgg cgatgatacg ccgtggtcaa aggcgttcct cgcctcggcc tacgcctccc 6660 gcgggttgaa aatgcgctac acctccggca ccggatccga agcgctgatg ggctattcgg 6720 agagcaagtc gatgctctac ctcgaatcgc gctgcatctt cattactaaa ggcgccgggg 6780 ttcagggact gcaaaacggc gcggtgagct gtatcggcat gaccggcgct gtgccgtcgg 6840 gcattcgggc ggtgctggcg gaaaacctga tcgcctctat gctcgacctc gaagtggcgt 6900 ccgccaacga ccagactttc tcccactcgg atattcgccg caccgcgcgc accctgatgc 6960 agatgctgcc gggcaccgac tttattttct ccggctacag cgcggtgccg aactacgaca 7020 acatgttcgc cggctcgaac ttcgatgcgg aagattttga tgattacaac atcctgcagc 7080 gtgacctgat ggttgacggc ggcctgcgtc cggtgaccga ggcggaaacc attgccattc 7140 gccagaaagc ggcgcgggcg atccaggcgg ttttccgcga gctggggctg ccgccaatcg 7200 ccgacgagga ggtggaggcc gccacctacg cgcacggcag caacgagatg ccgccgcgta 7260 acgtggtgga ggatctgagt gcggtggaag agatgatgaa gcgcaacatc accggcctcg 7320 atattgtcgg cgcgctgagc cgcagcggct ttgaggatat cgccagcaat attctcaata 7380 tgctgcgcca gcgggtcacc ggcgattacc tgcagacctc ggccattctc gatcggcagt 7440 tcgaggtggt gagtgcggtc aacgacatca atgactatca ggggccgggc accggctatc 7500 gcatctctgc cgaacgctgg gcggagatca aaaatattcc gggcgtggtt cagcccgaca 7560 ccattgaata aggcggtatt cctgtgcaac agacaaccca aattcagccc tcttttaccc 7620 tgaaaacccg cgagggcggg gtagcttctg ccgatgaacg cgccgatgaa gtggtgatcg 7680 gcgtcggccc tgccttcgat aaacaccagc atcacactct gatcgatatg ccccatggcg 7740 cgatcctcaa agagctgatt gccggggtgg aagaagaggg gcttcacgcc cgggtggtgc 7800 gcattctgcg cacgtccgac gtctccttta tggcctggga tgcggccaac ctgagcggct 7860 cggggatcgg catcggtatc cagtcgaagg ggaccacggt catccatcag cgcgatctgc 7920 tgccgctcag caacctggag ctgttctccc aggcgccgct gctgacgctg gagacctacc 7980 ggcagattgg caaaaacgct gcgcgctatg cgcgcaaaga gtcaccttcg ccggtgccgg 8040 tggtgaacga tcagatggtg cggccgaaat ttatggccaa agccgcgcta tttcatatca 8100 aagagaccaa acatgtggtg caggacgccg agcccgtcac cctgcacatc gacttagtaa 8160 gggagtgacc atgagcgaga aaaccatgcg cgtgcaggat tatccgttag ccacccgctg 8220 cccggagcat atcctgacgc ctaccggcaa accattgacc gatattaccc tcgagaaggt 8280 gctctctggc gaggtgggcc cgcaggatgt gcggatctcc cgccagaccc ttgagtacca 8340 ggcgcagatt gccgagcaga tgcagcgcca tgcggtggcg cgcaatttcc gccgcgcggc 8400 ggagcttatc gccattcctg acgagcgcat tctggctatc tataacgcgc tgcgcccgtt 8460 ccgctcctcg caggcggagc tgctggcgat cgccgacgag ctggagcaca cctggcatgc 8520 gacagtgaat gccgcctttg tccgggagtc ggcggaagtg tatcagcagc ggcataagct 8580 gcgtaaagga agctaagcgg aggtcagcat gccgttaata gccgggattg atatcggcaa 8640 cgccaccacc gaggtggcgc tggcgtccga ctacccgcag gcgagggcgt ttgttgccag 8700 cgggatcgtc gcgacgacgg gcatgaaagg gacgcgggac aatatcgccg ggaccctcgc 8760 cgcgctggag caggccctgg cgaaaacacc gtggtcgatg agcgatgtct ctcgcatcta 8820 tcttaacgaa gccgcgccgg tgattggcga tgtggcgatg gagaccatca ccgagaccat 8880 tatcaccgaa tcgaccatga tcggtcataa cccgcagacg ccgggcgggg tgggcgttgg 8940 cgtggggacg actatcgccc tcgggcggct ggcgacgctg ccggcggcgc agtatgccga 9000 ggggtggatc gtactgattg acgacgccgt cgatttcctt gacgccgtgt ggtggctcaa 9060 tgaggcgctc gaccggggga tcaacgtggt ggcggcgatc ctcaaaaagg acgacggcgt 9120 gctggtgaac aaccgcctgc gtaaaaccct gccggtggtg gatgaagtga cgctgctgga 9180 gcaggtcccc gagggggtaa tggcggcggt ggaagtggcc gcgccgggcc aggtggtgcg 9240 gatcctgtcg aatccctacg ggatcgccac cttcttcggg ctaagcccgg aagagaccca 9300 ggccatcgtc cccatcgccc gcgccctgat tggcaaccgt tccgcggtgg tgctcaagac 9360 cccgcagggg gatgtgcagt cgcgggtgat cccggcgggc aacctctaca ttagcggcga 9420 aaagcgccgc ggagaggccg atgtcgccga gggcgcggaa gccatcatgc aggcgatgag 9480 cgcctgcgct ccggtacgcg acatccgcgg cgaaccgggc acccacgccg gcggcatgct 9540 tgagcgggtg cgcaaggtaa tggcgtccct gaccggccat gagatgagcg cgatatacat 9600 ccaggatctg ctggcggtgg atacgtttat tccgcgcaag gtgcagggcg ggatggccgg 9660 cgagtgcgcc atggagaatg ccgtcgggat ggcggcgatg gtgaaagcgg atcgtctgca 9720 aatgcaggtt atcgcccgcg aactgagcgc ccgactgcag accgaggtgg tggtgggcgg 9780 cgtggaggcc aacatggcca tcgccggggc gttaaccact cccggctgtg cggcgccgct 9840 ggcgatcctc gacctcggcg ccggctcgac ggatgcggcg atcgtcaacg cggaggggca 9900 gataacggcg gtccatctcg ccggggcggg gaatatggtc agcctgttga ttaaaaccga 9960 gctgggcctc gaggatcttt cgctggcgga agcgataaaa aaatacccgc tggccaaagt 10020 ggaaagcctg ttcagtattc gtcacgagaa tggcgcggtg gagttctttc gggaagccct 10080 cagcccggcg gtgttcgcca aagtggtgta catcaaggag ggcgaactgg tgccgatcga 10140 taacgccagc ccgctggaaa aaattcgtct cgtgcgccgg caggcgaaag agaaagtgtt 10200 tgtcaccaac tgcctgcgcg cgctgcgcca ggtctcaccc ggcggttcca ttcgcgatat 10260 cgcctttgtg gtgctggtgg gcggctcatc gctggacttt gagatcccgc agcttatcac 10320 ggaagccttg tcgcactatg gcgtggtcgc cgggcagggc aatattcggg gaacagaagg 10380 gccgcgcaat gcggtcgcca ccgggctgct actggccggt caggcgaatt aaacgggcgc 10440 tcgcgccagc ctctaggtac aaataaaaaa ggcacgtcag atgacgtgcc ttttttcttg 10500 tctagcgtgc accaatgctt ctggcgtcag gcagccatcg gaagctgtgg tatggctgtg 10560 caggtcgtaa atcactgcat aattcgtgtc gctcaaggcg cactcccgtt ctggataatg 10620 ttttttgcgc cgacatcata acggttctgg caaatattct gaaatgagct gttgacaatt 10680 aatcatccgg ctcgtataat gtgtggaatt gtgagcggat aacaatttca cacaggaaac 10740 agaccatgac tagtaaggag gacaattcca tggctgctgc tgctgataga ttaaacttaa 10800 cttccggcca cttgaatgct ggtagaaaga gaagttcctc ttctgtttct ttgaaggctg 10860 ccgaaaagcc tttcaaggtt actgtgattg gatctggtaa ctggggtact actattgcca 10920 aggtggttgc cgaaaattgt aagggatacc cagaagtttt cgctccaata gtacaaatgt 10980 gggtgttcga agaagagatc aatggtgaaa aattgactga aatcataaat actagacatc 11040 aaaacgtgaa atacttgcct ggcatcactc tacccgacaa tttggttgct aatccagact 11100 tgattgattc agtcaaggat gtcgacatca tcgttttcaa cattccacat caatttttgc 11160 cccgtatctg tagccaattg aaaggtcatg ttgattcaca cgtcagagct atctcctgtc 11220 taaagggttt tgaagttggt gctaaaggtg tccaattgct atcctcttac atcactgagg 11280 aactaggtat tcaatgtggt gctctatctg gtgctaacat tgccaccgaa gtcgctcaag 11340 aacactggtc tgaaacaaca gttgcttacc acattccaaa ggatttcaga ggcgagggca 11400 aggacgtcga ccataaggtt ctaaaggcct tgttccacag accttacttc cacgttagtg 11460 tcatcgaaga tgttgctggt atctccatct gtggtgcttt gaagaacgtt gttgccttag 11520 gttgtggttt cgtcgaaggt ctaggctggg gtaacaacgc ttctgctgcc atccaaagag 11580 tcggtttggg tgagatcatc agattcggtc aaatgttttt cccagaatct agagaagaaa 11640 catactacca agagtctgct ggtgttgctg atttgatcac cacctgcgct ggtggtagaa 11700 acgtcaaggt tgctaggcta atggctactt ctggtaagga cgcctgggaa tgtgaaaagg 11760 agttgttgaa tggccaatcc gctcaaggtt taattacctg caaagaagtt cacgaatggt 11820 tggaaacatg tggctctgtc gaagacttcc cattatttga agccgtatac caaatcgttt 11880 acaacaacta cccaatgaag aacctgccgg acatgattga agaattagat ctacatgaag 11940 attagattta ttggatccag gaaacagact agaattatgg gattgactac taaacctcta 12000 tctttgaaag ttaacgccgc tttgttcgac gtcgacggta ccattatcat ctctcaacca 12060 gccattgctg cattctggag ggatttcggt aaggacaaac cttatttcga tgctgaacac 12120 gttatccaag tctcgcatgg ttggagaacg tttgatgcca ttgctaagtt cgctccagac 12180 tttgccaatg aagagtatgt taacaaatta gaagctgaaa ttccggtcaa gtacggtgaa 12240 aaatccattg aagtcccagg tgcagttaag ctgtgcaacg ctttgaacgc tctaccaaaa 12300 gagaaatggg ctgtggcaac ttccggtacc cgtgatatgg cacaaaaatg gttcgagcat 12360 ctgggaatca ggagaccaaa gtacttcatt accgctaatg atgtcaaaca gggtaagcct 12420 catccagaac catatctgaa gggcaggaat ggcttaggat atccgatcaa tgagcaagac 12480 ccttccaaat ctaaggtagt agtatttgaa gacgctccag caggtattgc cgccggaaaa 12540 gccgccggtt gtaagatcat tggtattgcc actactttcg acttggactt cctaaaggaa 12600 aaaggctgtg acatcattgt caaaaaccac gaatccatca gagttggcgg ctacaatgcc 12660 gaaacagacg aagttgaatt catttttgac gactacttat atgctaagga cgatctgttg 12720 aaatggtaac ccgggctgca ggcatgcaag cttggctgtt ttggcggatg agagaagatt 12780 ttcagcctga tacagattaa atcagaacgc agaagcggtc tgataaaaca gaatttgcct 12840 ggcggcagta gcgcggtggt cccacctgac cccatgccga actcagaagt gaaacgccgt 12900 agcgccgatg gtagtgtggg gtctccccat gcgagagtag ggaactgcca ggcatcaaat 12960 aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa 13020 cgctctcctg agtaggacaa atccgccggg agcggatttg aacgttgcga agcaacggcc 13080 cggagggtgg cgggcaggac gcccgccata aactgccagg catcaaatta agcagaaggc 13140 catcctgacg gatggccttt ttgcgtttct acaaactcca gctggatcgg gcgctagagt 13200 atacatttaa atggtaccct ctagtcaagg ccttaagtga gtcgtattac ggactggccg 13260 tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag 13320 cacatccccc tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc 13380 aacagttgcg cagcctgaat ggcgaatggc gcctgatgcg gtattttctc cttacgcatc 13440 tgtgcggtat ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat 13500 agttaagcca gccccgacac ccgccaacac ccgctgacga gct 13543 <210> 74 <211> 13402 <212> DNA <213> artificial sequence <220> <223> plasmid <400> 74 tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60 taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120 acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180 ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240 gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300 tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360 gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420 acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480 actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540 tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600 cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660 atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720 agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780 tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840 atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900 tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960 gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020 gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080 acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140 gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200 actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260 cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320 atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380 ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440 gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500 ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560 atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620 atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680 atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740 gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800 ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860 gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920 gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980 tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040 ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100 cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160 ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220 ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280 ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340 ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400 aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460 cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520 atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580 tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640 taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700 tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760 gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 2820 tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880 aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940 gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000 gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060 atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120 gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180 tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240 atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300 tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360 gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420 ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480 aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540 aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600 ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660 caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720 agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780 cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840 tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900 acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 3960 tatcatcaac aggcttaccc gtcttactgt cgggaattca tttaaatagt caaaagcctc 4020 cgaccggagg cttttgactg ctaggcgatc tgtgctgttt gccacggtat gcagcaccag 4080 cgcgagatta tgggctcgca cgctcgactg tcggacgggg gcactggaac gagaagtcag 4140 gcgagccgtc acgcccttga caatgccaca tcctgagcaa ataattcaac cactaaacaa 4200 atcaaccgcg tttcccggag gtaaccaagc ttgcgggaga gaatgatgaa caagagccaa 4260 caagttcaga caatcaccct ggccgccgcc cagcaaatgg cggcggcggt ggaaaaaaaa 4320 gccactgaga tcaacgtggc ggtggtgttt tccgtagttg accgcggagg caacacgctg 4380 cttatccagc ggatggacga ggccttcgtc tccagctgcg atatttccct gaataaagcc 4440 tggagcgcct gcagcctgaa gcaaggtacc catgaaatta cgtcagcggt ccagccagga 4500 caatctctgt acggtctgca gctaaccaac caacagcgaa ttattatttt tggcggcggc 4560 ctgccagtta tttttaatga gcaggtaatt ggcgccgtcg gcgttagcgg cggtacggtc 4620 gagcaggatc aattattagc ccagtgcgcc ctggattgtt tttccgcatt ataacctgaa 4680 gcgagaaggt atattatgag ctatcgtatg ttccgccagg cattctgagt gttaacgagg 4740 ggaccgtcat gtcgctttca ccgccaggcg tacgcctgtt ttacgatccg cgcgggcacc 4800 atgccggcgc catcaatgag ctgtgctggg ggctggagga gcagggggtc ccctgccaga 4860 ccataaccta tgacggaggc ggtgacgccg ctgcgctggg cgccctggcg gccagaagct 4920 cgcccctgcg ggtgggtatc gggctcagcg cgtccggcga gatagccctc actcatgccc 4980 agctgccggc ggacgcgccg ctggctaccg gacacgtcac cgatagcgac gatcaactgc 5040 gtacgctcgg cgccaacgcc gggcagctgg ttaaagtcct gccgttaagt gagagaaact 5100 gaatgtatcg tatctatacc cgcaccgggg ataaaggcac caccgccctg tacggcggca 5160 gccgcatcga gaaagaccat attcgcgtcg aggcctacgg caccgtcgat gaactgatat 5220 cccagctggg cgtctgctac gccacgaccc gcgacgccgg gctgcgggaa agcctgcacc 5280 atattcagca gacgctgttc gtgctggggg ctgaactggc cagcgatgcg cggggcctga 5340 cccgcctgag ccagacgatc ggcgaagagg agatcaccgc cctggagcgg cttatcgacc 5400 gcaatatggc cgagagcggc ccgttaaaac agttcgtgat cccggggagg aatctcgcct 5460 ctgcccagct gcaccctgat gcttgcgctt gaactggcct agcaaacaca gaaaaaagcc 5520 cgcacctgac agtgcgggct ttttttttcc taggcgatct gtgctgtttg ccacggtatg 5580 cagcaccagc gcgagattat gggctcgcac gctcgactgt cggacggggg cactggaacg 5640 agaagtcagg cgagccgtca cgcccttgac aatgccacat cctgagcaaa taattcaacc 5700 actaaacaaa tcaaccgcgt ttcccggagg taaccaagct tcaccttttg agccgatgaa 5760 caatgaaaag atcaaaacga tttgcagtac tggcccagcg ccccgtcaat caggacgggc 5820 tgattggcga gtggcctgaa gaggggctga tcgccatgga cagccccttt gacccggtct 5880 cttcagtaaa agtggacaac ggtctgatcg tcgaactgga cggcaaacgc cgggaccagt 5940 ttgacatgat cgaccgattt atcgccgatt acgcgatcaa cgttgagcgc acagagcagg 6000 caatgcgcct ggaggcggtg gaaatagccc gtatgctggt ggatattcac gtcagccggg 6060 aggagatcat tgccatcact accgccatca cgccggccaa agcggtcgag gtgatggcgc 6120 agatgaacgt ggtggagatg atgatggcgc tgcagaagat gcgtgcccgc cggaccccct 6180 ccaaccagtg ccacgtcacc aatctcaaag ataatccggt gcagattgcc gctgacgccg 6240 ccgaggccgg gatccgcggc ttctcagaac aggagaccac ggtcggtatc gcgcgctacg 6300 cgccgtttaa cgccctggcg ctgttggtcg gttcgcagtg cggccgcccc ggcgtgttga 6360 cgcagtgctc ggtggaagag gccaccgagc tggagctggg catgcgtggc ttaaccagct 6420 acgccgagac ggtgtcggtc tacggcaccg aagcggtatt taccgacggc gatgatacgc 6480 cgtggtcaaa ggcgttcctc gcctcggcct acgcctcccg cgggttgaaa atgcgctaca 6540 cctccggcac cggatccgaa gcgctgatgg gctattcgga gagcaagtcg atgctctacc 6600 tcgaatcgcg ctgcatcttc attactaaag gcgccggggt tcagggactg caaaacggcg 6660 cggtgagctg tatcggcatg accggcgctg tgccgtcggg cattcgggcg gtgctggcgg 6720 aaaacctgat cgcctctatg ctcgacctcg aagtggcgtc cgccaacgac cagactttct 6780 cccactcgga tattcgccgc accgcgcgca ccctgatgca gatgctgccg ggcaccgact 6840 ttattttctc cggctacagc gcggtgccga actacgacaa catgttcgcc ggctcgaact 6900 tcgatgcgga agattttgat gattacaaca tcctgcagcg tgacctgatg gttgacggcg 6960 gcctgcgtcc ggtgaccgag gcggaaacca ttgccattcg ccagaaagcg gcgcgggcga 7020 tccaggcggt tttccgcgag ctggggctgc cgccaatcgc cgacgaggag gtggaggccg 7080 ccacctacgc gcacggcagc aacgagatgc cgccgcgtaa cgtggtggag gatctgagtg 7140 cggtggaaga gatgatgaag cgcaacatca ccggcctcga tattgtcggc gcgctgagcc 7200 gcagcggctt tgaggatatc gccagcaata ttctcaatat gctgcgccag cgggtcaccg 7260 gcgattacct gcagacctcg gccattctcg atcggcagtt cgaggtggtg agtgcggtca 7320 acgacatcaa tgactatcag gggccgggca ccggctatcg catctctgcc gaacgctggg 7380 cggagatcaa aaatattccg ggcgtggttc agcccgacac cattgaataa ggcggtattc 7440 ctgtgcaaca gacaacccaa attcagccct cttttaccct gaaaacccgc gagggcgggg 7500 tagcttctgc cgatgaacgc gccgatgaag tggtgatcgg cgtcggccct gccttcgata 7560 aacaccagca tcacactctg atcgatatgc cccatggcgc gatcctcaaa gagctgattg 7620 ccggggtgga agaagagggg cttcacgccc gggtggtgcg cattctgcgc acgtccgacg 7680 tctcctttat ggcctgggat gcggccaacc tgagcggctc ggggatcggc atcggtatcc 7740 agtcgaaggg gaccacggtc atccatcagc gcgatctgct gccgctcagc aacctggagc 7800 tgttctccca ggcgccgctg ctgacgctgg agacctaccg gcagattggc aaaaacgctg 7860 cgcgctatgc gcgcaaagag tcaccttcgc cggtgccggt ggtgaacgat cagatggtgc 7920 ggccgaaatt tatggccaaa gccgcgctat ttcatatcaa agagaccaaa catgtggtgc 7980 aggacgccga gcccgtcacc ctgcacatcg acttagtaag ggagtgacca tgagcgagaa 8040 aaccatgcgc gtgcaggatt atccgttagc cacccgctgc ccggagcata tcctgacgcc 8100 taccggcaaa ccattgaccg atattaccct cgagaaggtg ctctctggcg aggtgggccc 8160 gcaggatgtg cggatctccc gccagaccct tgagtaccag gcgcagattg ccgagcagat 8220 gcagcgccat gcggtggcgc gcaatttccg ccgcgcggcg gagcttatcg ccattcctga 8280 cgagcgcatt ctggctatct ataacgcgct gcgcccgttc cgctcctcgc aggcggagct 8340 gctggcgatc gccgacgagc tggagcacac ctggcatgcg acagtgaatg ccgcctttgt 8400 ccgggagtcg gcggaagtgt atcagcagcg gcataagctg cgtaaaggaa gctaagcgga 8460 ggtcagcatg ccgttaatag ccgggattga tatcggcaac gccaccaccg aggtggcgct 8520 ggcgtccgac tacccgcagg cgagggcgtt tgttgccagc gggatcgtcg cgacgacggg 8580 catgaaaggg acgcgggaca atatcgccgg gaccctcgcc gcgctggagc aggccctggc 8640 gaaaacaccg tggtcgatga gcgatgtctc tcgcatctat cttaacgaag ccgcgccggt 8700 gattggcgat gtggcgatgg agaccatcac cgagaccatt atcaccgaat cgaccatgat 8760 cggtcataac ccgcagacgc cgggcggggt gggcgttggc gtggggacga ctatcgccct 8820 cgggcggctg gcgacgctgc cggcggcgca gtatgccgag gggtggatcg tactgattga 8880 cgacgccgtc gatttccttg acgccgtgtg gtggctcaat gaggcgctcg accgggggat 8940 caacgtggtg gcggcgatcc tcaaaaagga cgacggcgtg ctggtgaaca accgcctgcg 9000 taaaaccctg ccggtggtgg atgaagtgac gctgctggag caggtccccg agggggtaat 9060 ggcggcggtg gaagtggccg cgccgggcca ggtggtgcgg atcctgtcga atccctacgg 9120 gatcgccacc ttcttcgggc taagcccgga agagacccag gccatcgtcc ccatcgcccg 9180 cgccctgatt ggcaaccgtt ccgcggtggt gctcaagacc ccgcaggggg atgtgcagtc 9240 gcgggtgatc ccggcgggca acctctacat tagcggcgaa aagcgccgcg gagaggccga 9300 tgtcgccgag ggcgcggaag ccatcatgca ggcgatgagc gcctgcgctc cggtacgcga 9360 catccgcggc gaaccgggca cccacgccgg cggcatgctt gagcgggtgc gcaaggtaat 9420 ggcgtccctg accggccatg agatgagcgc gatatacatc caggatctgc tggcggtgga 9480 tacgtttatt ccgcgcaagg tgcagggcgg gatggccggc gagtgcgcca tggagaatgc 9540 cgtcgggatg gcggcgatgg tgaaagcgga tcgtctgcaa atgcaggtta tcgcccgcga 9600 actgagcgcc cgactgcaga ccgaggtggt ggtgggcggc gtggaggcca acatggccat 9660 cgccggggcg ttaaccactc ccggctgtgc ggcgccgctg gcgatcctcg acctcggcgc 9720 cggctcgacg gatgcggcga tcgtcaacgc ggaggggcag ataacggcgg tccatctcgc 9780 cggggcgggg aatatggtca gcctgttgat taaaaccgag ctgggcctcg aggatctttc 9840 gctggcggaa gcgataaaaa aatacccgct ggccaaagtg gaaagcctgt tcagtattcg 9900 tcacgagaat ggcgcggtgg agttctttcg ggaagccctc agcccggcgg tgttcgccaa 9960 agtggtgtac atcaaggagg gcgaactggt gccgatcgat aacgccagcc cgctggaaaa 10020 aattcgtctc gtgcgccggc aggcgaaaga gaaagtgttt gtcaccaact gcctgcgcgc 10080 gctgcgccag gtctcacccg gcggttccat tcgcgatatc gcctttgtgg tgctggtggg 10140 cggctcatcg ctggactttg agatcccgca gcttatcacg gaagccttgt cgcactatgg 10200 cgtggtcgcc gggcagggca atattcgggg aacagaaggg ccgcgcaatg cggtcgccac 10260 cgggctgcta ctggccggtc aggcgaatta aacgggcgct cgcgccagcc tctaggtaca 10320 aataaaaaag gcacgtcaga tgacgtgcct tttttcttgt ctagcgtgca ccaatgcttc 10380 tggcgtcagg cagccatcgg aagctgtggt atggctgtgc aggtcgtaaa tcactgcata 10440 attcgtgtcg ctcaaggcgc actcccgttc tggataatgt tttttgcgcc gacatcataa 10500 cggttctggc aaatattctg aaatgagctg ttgacaatta atcatccggc tcgtataatg 10560 tgtggaattg tgagcggata acaatttcac acaggaaaca gaccatgact agtaaggagg 10620 acaattccat ggctgctgct gctgatagat taaacttaac ttccggccac ttgaatgctg 10680 gtagaaagag aagttcctct tctgtttctt tgaaggctgc cgaaaagcct ttcaaggtta 10740 ctgtgattgg atctggtaac tggggtacta ctattgccaa ggtggttgcc gaaaattgta 10800 agggataccc agaagttttc gctccaatag tacaaatgtg ggtgttcgaa gaagagatca 10860 atggtgaaaa attgactgaa atcataaata ctagacatca aaacgtgaaa tacttgcctg 10920 gcatcactct acccgacaat ttggttgcta atccagactt gattgattca gtcaaggatg 10980 tcgacatcat cgttttcaac attccacatc aatttttgcc ccgtatctgt agccaattga 11040 aaggtcatgt tgattcacac gtcagagcta tctcctgtct aaagggtttt gaagttggtg 11100 ctaaaggtgt ccaattgcta tcctcttaca tcactgagga actaggtatt caatgtggtg 11160 ctctatctgg tgctaacatt gccaccgaag tcgctcaaga acactggtct gaaacaacag 11220 ttgcttacca cattccaaag gatttcagag gcgagggcaa ggacgtcgac cataaggttc 11280 taaaggcctt gttccacaga ccttacttcc acgttagtgt catcgaagat gttgctggta 11340 tctccatctg tggtgctttg aagaacgttg ttgccttagg ttgtggtttc gtcgaaggtc 11400 taggctgggg taacaacgct tctgctgcca tccaaagagt cggtttgggt gagatcatca 11460 gattcggtca aatgtttttc ccagaatcta gagaagaaac atactaccaa gagtctgctg 11520 gtgttgctga tttgatcacc acctgcgctg gtggtagaaa cgtcaaggtt gctaggctaa 11580 tggctacttc tggtaaggac gcctgggaat gtgaaaagga gttgttgaat ggccaatccg 11640 ctcaaggttt aattacctgc aaagaagttc acgaatggtt ggaaacatgt ggctctgtcg 11700 aagacttccc attatttgaa gccgtatacc aaatcgttta caacaactac ccaatgaaga 11760 acctgccgga catgattgaa gaattagatc tacatgaaga ttagatttat tggatccagg 11820 aaacagacta gaattatggg attgactact aaacctctat ctttgaaagt taacgccgct 11880 ttgttcgacg tcgacggtac cattatcatc tctcaaccag ccattgctgc attctggagg 11940 gatttcggta aggacaaacc ttatttcgat gctgaacacg ttatccaagt ctcgcatggt 12000 tggagaacgt ttgatgccat tgctaagttc gctccagact ttgccaatga agagtatgtt 12060 aacaaattag aagctgaaat tccggtcaag tacggtgaaa aatccattga agtcccaggt 12120 gcagttaagc tgtgcaacgc tttgaacgct ctaccaaaag agaaatgggc tgtggcaact 12180 tccggtaccc gtgatatggc acaaaaatgg ttcgagcatc tgggaatcag gagaccaaag 12240 tacttcatta ccgctaatga tgtcaaacag ggtaagcctc atccagaacc atatctgaag 12300 ggcaggaatg gcttaggata tccgatcaat gagcaagacc cttccaaatc taaggtagta 12360 gtatttgaag acgctccagc aggtattgcc gccggaaaag ccgccggttg taagatcatt 12420 ggtattgcca ctactttcga cttggacttc ctaaaggaaa aaggctgtga catcattgtc 12480 aaaaaccacg aatccatcag agttggcggc tacaatgccg aaacagacga agttgaattc 12540 atttttgacg actacttata tgctaaggac gatctgttga aatggtaacc cgggctgcag 12600 gcatgcaagc ttggctgttt tggcggatga gagaagattt tcagcctgat acagattaaa 12660 tcagaacgca gaagcggtct gataaaacag aatttgcctg gcggcagtag cgcggtggtc 12720 ccacctgacc ccatgccgaa ctcagaagtg aaacgccgta gcgccgatgg tagtgtgggg 12780 tctccccatg cgagagtagg gaactgccag gcatcaaata aaacgaaagg ctcagtcgaa 12840 agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctcctga gtaggacaaa 12900 tccgccggga gcggatttga acgttgcgaa gcaacggccc ggagggtggc gggcaggacg 12960 cccgccataa actgccaggc atcaaattaa gcagaaggcc atcctgacgg atggcctttt 13020 tgcgtttcta caaactccag ctggatcggg cgctagagta tacatttaaa tggtaccctc 13080 tagtcaaggc cttaagtgag tcgtattacg gactggccgt cgttttacaa cgtcgtgact 13140 gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct 13200 ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg 13260 gcgaatggcg cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca 13320 tatggtgcac tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc 13380 cgccaacacc cgctgacgag ct 13402 <210> 75 <211> 110 <212> DNA <213> artificial sequence <220> <223> primer <400> 75 gcagtacaaa tgttacgggg taccggcgcg ccgctagctt aattaacgga ccgatgcatg 60 agctcacgcg taccggtgct cttcgatcta cgtaagaagg ccttcctatc 110 <210> 76 <211> 110 <212> DNA <213> artificial sequence <220> <223> primer <400> 76 gataggaagg ccttcttacg tagatcgaag agcaccggta cgcgtgagct catgcatcgg 60 tccgttaatt aagctagcgg cgcgccggta ccccgtaaca tttgtactgc 110 <210> 77 <211> 77 <212> DNA <213> artificial sequence <220> <223> fragment <400> 77 cggcgcgccg ctagcttaat taacggaccg atgcatgagc tcacgcgtac cggtgctctt 60 cgatctacgt aagaagg 77 <210> 78 <211> 13611 <212> DNA <213> artificial sequence <220> <223> plasmid <400> 78 aagtgagtcg tattacggac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 60 cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 120 agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcct 180 gatgcggtat tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct 240 cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc 300 tgacgagctt agtaaagccc tcgctagatt ttaatgcgga tgttgcgatt acttcgccaa 360 ctattgcgat aacaagaaaa agccagcctt tcatgatata tctcccaatt tgtgtagggc 420 ttattatgca cgcttaaaaa taataaaagc agacttgacc tgatagtttg gctgtgagca 480 attatgtgct tagtgcatct aacgcttgag ttaagccgcg ccgcgaagcg gcgtcggctt 540 gaacgaattg ttagacatta tttgccgact accttggtga tctcgccttt cacgtagtgg 600 acaaattctt ccaactgatc tgcgcgcgag gccaagcgat cttcttcttg tccaagataa 660 gcctgtctag cttcaagtat gacgggctga tactgggccg gcaggcgctc cattgcccag 720 tcggcagcga catccttcgg cgcgattttg ccggttactg cgctgtacca aatgcgggac 780 aacgtaagca ctacatttcg ctcatcgcca gcccagtcgg gcggcgagtt ccatagcgtt 840 aaggtttcat ttagcgcctc aaatagatcc tgttcaggaa ccggatcaaa gagttcctcc 900 gccgctggac ctaccaaggc aacgctatgt tctcttgctt ttgtcagcaa gatagccaga 960 tcaatgtcga tcgtggctgg ctcgaagata cctgcaagaa tgtcattgcg ctgccattct 1020 ccaaattgca gttcgcgctt agctggataa cgccacggaa tgatgtcgtc gtgcacaaca 1080 atggtgactt ctacagcgcg gagaatctcg ctctctccag gggaagccga agtttccaaa 1140 aggtcgttga tcaaagctcg ccgcgttgtt tcatcaagcc ttacggtcac cgtaaccagc 1200 aaatcaatat cactgtgtgg cttcaggccg ccatccactg cggagccgta caaatgtacg 1260 gccagcaacg tcggttcgag atggcgctcg atgacgccaa ctacctctga tagttgagtc 1320 gatacttcgg cgatcaccgc ttccctcatg atgtttaact ttgttttagg gcgactgccc 1380 tgctgcgtaa catcgttgct gctccataac atcaaacatc gacccacggc gtaacgcgct 1440 tgctgcttgg atgcccgagg catagactgt accccaaaaa aacagtcata acaagccatg 1500 aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga ccagttgcgt 1560 gagcgcatac gctacttgca ttacagctta cgaaccgaac aggcttatgt ccactgggtt 1620 cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag cagcgaagtc 1680 gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac gcatcgtcag 1740 gcattggcgg ccttgctgtt cttctacggc aaggtgctgt gcacggatct gccctggctt 1800 caggagatcg gaagacctcg gccgtcgcgg cgcttgccgg tggtgctgac cccggatgaa 1860 gtggttcgca tcctcggttt tctggaaggc gagcatcgtt tgttcgccca gcttctgtat 1920 ggaacgggca tgcggatcag tgagggtttg caactgcggg tcaaggatct ggatttcgat 1980 cacggcacga tcatcgtgcg ggagggcaag ggctccaagg atcgggcctt gatgttaccc 2040 gagagcttgg cacccagcct gcgcgagcag gggaattaat tcccacgggt tttgctgccc 2100 gcaaacgggc tgttctggtg ttgctagttt gttatcagaa tcgcagatcc ggcttcagcc 2160 ggtttgccgg ctgaaagcgc tatttcttcc agaattgcca tgattttttc cccacgggag 2220 gcgtcactgg ctcccgtgtt gtcggcagct ttgattcgat aagcagcatc gcctgtttca 2280 ggctgtctat gtgtgactgt tgagctgtaa caagttgtct caggtgttca atttcatgtt 2340 ctagttgctt tgttttactg gtttcacctg ttctattagg tgttacatgc tgttcatctg 2400 ttacattgtc gatctgttca tggtgaacag ctttgaatgc accaaaaact cgtaaaagct 2460 ctgatgtatc tatctttttt acaccgtttt catctgtgca tatggacagt tttccctttg 2520 atatgtaacg gtgaacagtt gttctacttt tgtttgttag tcttgatgct tcactgatag 2580 atacaagagc cataagaacc tcagatcctt ccgtatttag ccagtatgtt ctctagtgtg 2640 gttcgttgtt tttgcgtgag ccatgagaac gaaccattga gatcatactt actttgcatg 2700 tcactcaaaa attttgcctc aaaactggtg agctgaattt ttgcagttaa agcatcgtgt 2760 agtgtttttc ttagtccgtt atgtaggtag gaatctgatg taatggttgt tggtattttg 2820 tcaccattca tttttatctg gttgttctca agttcggtta cgagatccat ttgtctatct 2880 agttcaactt ggaaaatcaa cgtatcagtc gggcggcctc gcttatcaac caccaatttc 2940 atattgctgt aagtgtttaa atctttactt attggtttca aaacccattg gttaagcctt 3000 ttaaactcat ggtagttatt ttcaagcatt aacatgaact taaattcatc aaggctaatc 3060 tctatatttg ccttgtgagt tttcttttgt gttagttctt ttaataacca ctcataaatc 3120 ctcatagagt atttgttttc aaaagactta acatgttcca gattatattt tatgaatttt 3180 tttaactgga aaagataagg caatatctct tcactaaaaa ctaattctaa tttttcgctt 3240 gagaacttgg catagtttgt ccactggaaa atctcaaagc ctttaaccaa aggattcctg 3300 atttccacag ttctcgtcat cagctctctg gttgctttag ctaatacacc ataagcattt 3360 tccctactga tgttcatcat ctgagcgtat tggttataag tgaacgatac cgtccgttct 3420 ttccttgtag ggttttcaat cgtggggttg agtagtgcca cacagcataa aattagcttg 3480 gtttcatgct ccgttaagtc atagcgacta atcgctagtt catttgcttt gaaaacaact 3540 aattcagaca tacatctcaa ttggtctagg tgattttaat cactatacca attgagatgg 3600 gctagtcaat gataattact agctagtcct tttcctttga gttgtgggta tctgtaaatt 3660 ctgctagacc tttgctggaa aacttgtaaa ttctgctaga ccctctgtaa attccgctag 3720 acctttgtgt gttttttttg tttatattca agtggttata atttatagaa taaagaaaga 3780 ataaaaaaag ataaaaagaa tagatcccag ccctgtgtat aactcactac tttagtcagt 3840 tccgcagtat tacaaaagga tgtcgcaaac gctgtttgct cctctacaaa acagacctta 3900 aaaccctaaa ggcttaagta gcaccctcgc aagctcgggc aaatcgctga atattccttt 3960 tgtctccgac catcaggcac ctgagtcgct gtctttttcg tgacattcag ttcgctgcgc 4020 tcacggctct ggcagtgaat gggggtaaat ggcactacag gcgcctttta tggattcatg 4080 caaggaaact acccataata caagaaaagc ccgtcacggg cttctcaggg cgttttatgg 4140 cgggtctgct atgtggtgct atctgacttt ttgctgttca gcagttcctg ccctctgatt 4200 ttccagtctg accacttcgg attatcccgt gacaggtcat tcagactggc taatgcaccc 4260 agtaaggcag cggtatcatc aacaggctta cccgtcttac tgtcgggaat tcatttaaat 4320 agtcaaaagc ctccgaccgg aggcttttga ctgctaggcg atctgtgctg tttgccacgg 4380 tatgcagcac cagcgcgaga ttatgggctc gcacgctcga ctgtcggacg ggggcactgg 4440 aacgagaagt caggcgagcc gtcacgccct tgacaatgcc acatcctgag caaataattc 4500 aaccactaaa caaatcaacc gcgtttcccg gaggtaacca agcttgcggg agagaatgat 4560 gaacaagagc caacaagttc agacaatcac cctggccgcc gcccagcaaa tggcggcggc 4620 ggtggaaaaa aaagccactg agatcaacgt ggcggtggtg ttttccgtag ttgaccgcgg 4680 aggcaacacg ctgcttatcc agcggatgga cgaggccttc gtctccagct gcgatatttc 4740 cctgaataaa gcctggagcg cctgcagcct gaagcaaggt acccatgaaa ttacgtcagc 4800 ggtccagcca ggacaatctc tgtacggtct gcagctaacc aaccaacagc gaattattat 4860 ttttggcggc ggcctgccag ttatttttaa tgagcaggta attggcgccg tcggcgttag 4920 cggcggtacg gtcgagcagg atcaattatt agcccagtgc gccctggatt gtttttccgc 4980 attataacct gaagcgagaa ggtatattat gagctatcgt atgttccgcc aggcattctg 5040 agtgttaacg aggggaccgt catgtcgctt tcaccgccag gcgtacgcct gttttacgat 5100 ccgcgcgggc accatgccgg cgccatcaat gagctgtgct gggggctgga ggagcagggg 5160 gtcccctgcc agaccataac ctatgacgga ggcggtgacg ccgctgcgct gggcgccctg 5220 gcggccagaa gctcgcccct gcgggtgggt atcgggctca gcgcgtccgg cgagatagcc 5280 ctcactcatg cccagctgcc ggcggacgcg ccgctggcta ccggacacgt caccgatagc 5340 gacgatcaac tgcgtacgct cggcgccaac gccgggcagc tggttaaagt cctgccgtta 5400 agtgagagaa actgaatgta tcgtatctat acccgcaccg gggataaagg caccaccgcc 5460 ctgtacggcg gcagccgcat cgagaaagac catattcgcg tcgaggccta cggcaccgtc 5520 gatgaactga tatcccagct gggcgtctgc tacgccacga cccgcgacgc cgggctgcgg 5580 gaaagcctgc accatattca gcagacgctg ttcgtgctgg gggctgaact ggccagcgat 5640 gcgcggggcc tgacccgcct gagccagacg atcggcgaag aggagatcac cgccctggag 5700 cggcttatcg accgcaatat ggccgagagc ggcccgttaa aacagttcgt gatcccgggg 5760 aggaatctcg cctctgccca gctgcacgtg gcgcgcaccc agtcccgtcg gctcgaacgc 5820 ctgctgacgg ccatggaccg cgcgcatccg ctgcgcgacg cgctcaaacg ctacagcaat 5880 cgcctgtcgg atgccctgtt ctccatggcg cgaatcgaag agactaggcc tgatgcttgc 5940 gcttgaactg gcctagcaaa cacagaaaaa agcccgcacc tgacagtgcg ggcttttttt 6000 ttcctaggcg atctgtgctg tttgccacgg tatgcagcac cagcgcgaga ttatgggctc 6060 gcacgctcga ctgtcggacg ggggcactgg aacgagaagt caggcgagcc gtcacgccct 6120 tgacaatgcc acatcctgag caaataattc aaccactaaa caaatcaacc gcgtttcccg 6180 gaggtaacca agcttcacct tttgagccga tgaacaatga aaagatcaaa acgatttgca 6240 gtactggccc agcgccccgt caatcaggac gggctgattg gcgagtggcc tgaagagggg 6300 ctgatcgcca tggacagccc ctttgacccg gtctcttcag taaaagtgga caacggtctg 6360 atcgtcgaac tggacggcaa acgccgggac cagtttgaca tgatcgaccg atttatcgcc 6420 gattacgcga tcaacgttga gcgcacagag caggcaatgc gcctggaggc ggtggaaata 6480 gcccgtatgc tggtggatat tcacgtcagc cgggaggaga tcattgccat cactaccgcc 6540 atcacgccgg ccaaagcggt cgaggtgatg gcgcagatga acgtggtgga gatgatgatg 6600 gcgctgcaga agatgcgtgc ccgccggacc ccctccaacc agtgccacgt caccaatctc 6660 aaagataatc cggtgcagat tgccgctgac gccgccgagg ccgggatccg cggcttctca 6720 gaacaggaga ccacggtcgg tatcgcgcgc tacgcgccgt ttaacgccct ggcgctgttg 6780 gtcggttcgc agtgcggccg ccccggcgtg ttgacgcagt gctcggtgga agaggccacc 6840 gagctggagc tgggcatgcg tggcttaacc agctacgccg agacggtgtc ggtctacggc 6900 accgaagcgg tatttaccga cggcgatgat acgccgtggt caaaggcgtt cctcgcctcg 6960 gcctacgcct cccgcgggtt gaaaatgcgc tacacctccg gcaccggatc cgaagcgctg 7020 atgggctatt cggagagcaa gtcgatgctc tacctcgaat cgcgctgcat cttcattact 7080 aaaggcgccg gggttcaggg actgcaaaac ggcgcggtga gctgtatcgg catgaccggc 7140 gctgtgccgt cgggcattcg ggcggtgctg gcggaaaacc tgatcgcctc tatgctcgac 7200 ctcgaagtgg cgtccgccaa cgaccagact ttctcccact cggatattcg ccgcaccgcg 7260 cgcaccctga tgcagatgct gccgggcacc gactttattt tctccggcta cagcgcggtg 7320 ccgaactacg acaacatgtt cgccggctcg aacttcgatg cggaagattt tgatgattac 7380 aacatcctgc agcgtgacct gatggttgac ggcggcctgc gtccggtgac cgaggcggaa 7440 accattgcca ttcgccagaa agcggcgcgg gcgatccagg cggttttccg cgagctgggg 7500 ctgccgccaa tcgccgacga ggaggtggag gccgccacct acgcgcacgg cagcaacgag 7560 atgccgccgc gtaacgtggt ggaggatctg agtgcggtgg aagagatgat gaagcgcaac 7620 atcaccggcc tcgatattgt cggcgcgctg agccgcagcg gctttgagga tatcgccagc 7680 aatattctca atatgctgcg ccagcgggtc accggcgatt acctgcagac ctcggccatt 7740 ctcgatcggc agttcgaggt ggtgagtgcg gtcaacgaca tcaatgacta tcaggggccg 7800 ggcaccggct atcgcatctc tgccgaacgc tgggcggaga tcaaaaatat tccgggcgtg 7860 gttcagcccg acaccattga ataaggcggt attcctgtgc aacagacaac ccaaattcag 7920 ccctctttta ccctgaaaac ccgcgagggc ggggtagctt ctgccgatga acgcgccgat 7980 gaagtggtga tcggcgtcgg ccctgccttc gataaacacc agcatcacac tctgatcgat 8040 atgccccatg gcgcgatcct caaagagctg attgccgggg tggaagaaga ggggcttcac 8100 gcccgggtgg tgcgcattct gcgcacgtcc gacgtctcct ttatggcctg ggatgcggcc 8160 aacctgagcg gctcggggat cggcatcggt atccagtcga aggggaccac ggtcatccat 8220 cagcgcgatc tgctgccgct cagcaacctg gagctgttct cccaggcgcc gctgctgacg 8280 ctggagacct accggcagat tggcaaaaac gctgcgcgct atgcgcgcaa agagtcacct 8340 tcgccggtgc cggtggtgaa cgatcagatg gtgcggccga aatttatggc caaagccgcg 8400 ctatttcata tcaaagagac caaacatgtg gtgcaggacg ccgagcccgt caccctgcac 8460 atcgacttag taagggagtg accatgagcg agaaaaccat gcgcgtgcag gattatccgt 8520 tagccacccg ctgcccggag catatcctga cgcctaccgg caaaccattg accgatatta 8580 ccctcgagaa ggtgctctct ggcgaggtgg gcccgcagga tgtgcggatc tcccgccaga 8640 cccttgagta ccaggcgcag attgccgagc agatgcagcg ccatgcggtg gcgcgcaatt 8700 tccgccgcgc ggcggagctt atcgccattc ctgacgagcg cattctggct atctataacg 8760 cgctgcgccc gttccgctcc tcgcaggcgg agctgctggc gatcgccgac gagctggagc 8820 acacctggca tgcgacagtg aatgccgcct ttgtccggga gtcggcggaa gtgtatcagc 8880 agcggcataa gctgcgtaaa ggaagctaag cggaggtcag catgccgtta atagccggga 8940 ttgatatcgg caacgccacc accgaggtgg cgctggcgtc cgactacccg caggcgaggg 9000 cgtttgttgc cagcgggatc gtcgcgacga cgggcatgaa agggacgcgg gacaatatcg 9060 ccgggaccct cgccgcgctg gagcaggccc tggcgaaaac accgtggtcg atgagcgatg 9120 tctctcgcat ctatcttaac gaagccgcgc cggtgattgg cgatgtggcg atggagacca 9180 tcaccgagac cattatcacc gaatcgacca tgatcggtca taacccgcag acgccgggcg 9240 gggtgggcgt tggcgtgggg acgactatcg ccctcgggcg gctggcgacg ctgccggcgg 9300 cgcagtatgc cgaggggtgg atcgtactga ttgacgacgc cgtcgatttc cttgacgccg 9360 tgtggtggct caatgaggcg ctcgaccggg ggatcaacgt ggtggcggcg atcctcaaaa 9420 aggacgacgg cgtgctggtg aacaaccgcc tgcgtaaaac cctgccggtg gtggatgaag 9480 tgacgctgct ggagcaggtc cccgaggggg taatggcggc ggtggaagtg gccgcgccgg 9540 gccaggtggt gcggatcctg tcgaatccct acgggatcgc caccttcttc gggctaagcc 9600 cggaagagac ccaggccatc gtccccatcg cccgcgccct gattggcaac cgttccgcgg 9660 tggtgctcaa gaccccgcag ggggatgtgc agtcgcgggt gatcccggcg ggcaacctct 9720 acattagcgg cgaaaagcgc cgcggagagg ccgatgtcgc cgagggcgcg gaagccatca 9780 tgcaggcgat gagcgcctgc gctccggtac gcgacatccg cggcgaaccg ggcacccacg 9840 ccggcggcat gcttgagcgg gtgcgcaagg taatggcgtc cctgaccggc catgagatga 9900 gcgcgatata catccaggat ctgctggcgg tggatacgtt tattccgcgc aaggtgcagg 9960 gcgggatggc cggcgagtgc gccatggaga atgccgtcgg gatggcggcg atggtgaaag 10020 cggatcgtct gcaaatgcag gttatcgccc gcgaactgag cgcccgactg cagaccgagg 10080 tggtggtggg cggcgtggag gccaacatgg ccatcgccgg ggcgttaacc actcccggct 10140 gtgcggcgcc gctggcgatc ctcgacctcg gcgccggctc gacggatgcg gcgatcgtca 10200 acgcggaggg gcagataacg gcggtccatc tcgccggggc ggggaatatg gtcagcctgt 10260 tgattaaaac cgagctgggc ctcgaggatc tttcgctggc ggaagcgata aaaaaatacc 10320 cgctggccaa agtggaaagc ctgttcagta ttcgtcacga gaatggcgcg gtggagttct 10380 ttcgggaagc cctcagcccg gcggtgttcg ccaaagtggt gtacatcaag gagggcgaac 10440 tggtgccgat cgataacgcc agcccgctgg aaaaaattcg tctcgtgcgc cggcaggcga 10500 aagagaaagt gtttgtcacc aactgcctgc gcgcgctgcg ccaggtctca cccggcggtt 10560 ccattcgcga tatcgccttt gtggtgctgg tgggcggctc atcgctggac tttgagatcc 10620 cgcagcttat cacggaagcc ttgtcgcact atggcgtggt cgccgggcag ggcaatattc 10680 ggggaacaga agggccgcgc aatgcggtcg ccaccgggct gctactggcc ggtcaggcga 10740 attaaacggg cgctcgcgcc agcctctagg tacaaataaa aaaggcacgt cagatgacgt 10800 gccttttttc ttgtctagcg tgcaccaatg cttctggcgt caggcagcca tcggaagctg 10860 tggtatggct gtgcaggtcg taaatcactg cataattcgt gtcgctcaag gcgcactccc 10920 gttctggata atgttttttg cgccgacatc ataacggttc tggcaaatat tctgaaatga 10980 gctgttgaca attaatcatc cggctcgtat aatgtgtgga attgtgagcg gataacaatt 11040 tcacacagga aacagaccat gactagtaag gaggacaatt ccatggctgc tgctgctgat 11100 agattaaact taacttccgg ccacttgaat gctggtagaa agagaagttc ctcttctgtt 11160 tctttgaagg ctgccgaaaa gcctttcaag gttactgtga ttggatctgg taactggggt 11220 actactattg ccaaggtggt tgccgaaaat tgtaagggat acccagaagt tttcgctcca 11280 atagtacaaa tgtgggtgtt cgaagaagag atcaatggtg aaaaattgac tgaaatcata 11340 aatactagac atcaaaacgt gaaatacttg cctggcatca ctctacccga caatttggtt 11400 gctaatccag acttgattga ttcagtcaag gatgtcgaca tcatcgtttt caacattcca 11460 catcaatttt tgccccgtat ctgtagccaa ttgaaaggtc atgttgattc acacgtcaga 11520 gctatctcct gtctaaaggg ttttgaagtt ggtgctaaag gtgtccaatt gctatcctct 11580 tacatcactg aggaactagg tattcaatgt ggtgctctat ctggtgctaa cattgccacc 11640 gaagtcgctc aagaacactg gtctgaaaca acagttgctt accacattcc aaaggatttc 11700 agaggcgagg gcaaggacgt cgaccataag gttctaaagg ccttgttcca cagaccttac 11760 ttccacgtta gtgtcatcga agatgttgct ggtatctcca tctgtggtgc tttgaagaac 11820 gttgttgcct taggttgtgg tttcgtcgaa ggtctaggct ggggtaacaa cgcttctgct 11880 gccatccaaa gagtcggttt gggtgagatc atcagattcg gtcaaatgtt tttcccagaa 11940 tctagagaag aaacatacta ccaagagtct gctggtgttg ctgatttgat caccacctgc 12000 gctggtggta gaaacgtcaa ggttgctagg ctaatggcta cttctggtaa ggacgcctgg 12060 gaatgtgaaa aggagttgtt gaatggccaa tccgctcaag gtttaattac ctgcaaagaa 12120 gttcacgaat ggttggaaac atgtggctct gtcgaagact tcccattatt tgaagccgta 12180 taccaaatcg tttacaacaa ctacccaatg aagaacctgc cggacatgat tgaagaatta 12240 gatctacatg aagattagat ttattggatc caggaaacag actagaatta tgggattgac 12300 tactaaacct ctatctttga aagttaacgc cgctttgttc gacgtcgacg gtaccattat 12360 catctctcaa ccagccattg ctgcattctg gagggatttc ggtaaggaca aaccttattt 12420 cgatgctgaa cacgttatcc aagtctcgca tggttggaga acgtttgatg ccattgctaa 12480 gttcgctcca gactttgcca atgaagagta tgttaacaaa ttagaagctg aaattccggt 12540 caagtacggt gaaaaatcca ttgaagtccc aggtgcagtt aagctgtgca acgctttgaa 12600 cgctctacca aaagagaaat gggctgtggc aacttccggt acccgtgata tggcacaaaa 12660 atggttcgag catctgggaa tcaggagacc aaagtacttc attaccgcta atgatgtcaa 12720 acagggtaag cctcatccag aaccatatct gaagggcagg aatggcttag gatatccgat 12780 caatgagcaa gacccttcca aatctaaggt agtagtattt gaagacgctc cagcaggtat 12840 tgccgccgga aaagccgccg gttgtaagat cattggtatt gccactactt tcgacttgga 12900 cttcctaaag gaaaaaggct gtgacatcat tgtcaaaaac cacgaatcca tcagagttgg 12960 cggctacaat gccgaaacag acgaagttga attcattttt gacgactact tatatgctaa 13020 ggacgatctg ttgaaatggt aacccgggct gcaggcatgc aagcttggct gttttggcgg 13080 atgagagaag attttcagcc tgatacagat taaatcagaa cgcagaagcg gtctgataaa 13140 acagaatttg cctggcggca gtagcgcggt ggtcccacct gaccccatgc cgaactcaga 13200 agtgaaacgc cgtagcgccg atggtagtgt ggggtctccc catgcgagag tagggaactg 13260 ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt 13320 gtttgtcggt gaacgctctc ctgagtagga caaatccgcc gggagcggat ttgaacgttg 13380 cgaagcaacg gcccggaggg tggcgggcag gacgcccgcc ataaactgcc aggcatcaaa 13440 ttaagcagaa ggccatcctg acggatggcc tttttgcgtt tctacaaact ccagctggat 13500 cgggcgctag agtatacatt taaatggtac cggcgcgccg ctagcttaat taacggaccg 13560 atgcatgagc tcacgcgtac cggtgctctt cgatctacgt aagaaggcct t 13611 <210> 79 <211> 4490 <212> DNA <213> artificial sequence <220> <223> plasmid <400> 79 tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60 taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120 acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180 ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240 gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300 tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360 gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420 acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480 actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540 tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600 cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660 atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720 agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780 tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840 atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900 tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960 gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020 gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080 acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140 gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200 actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260 cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320 atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380 ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440 gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500 ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560 atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620 atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680 atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740 gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800 ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860 gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920 gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980 tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040 ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100 cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160 ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220 ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280 ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340 ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400 aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460 cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520 atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580 tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640 taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700 tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760 gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 2820 tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880 aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940 gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000 gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060 atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120 gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180 tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240 atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300 tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360 gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420 ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480 aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540 aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600 ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660 caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720 agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780 cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840 tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900 acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 3960 tatcatcaac aggcttaccc gtcttactgt cgggaattca tttaaatagt caaaagcctc 4020 cgaccggagg cttttgactg ctagcaaaca cagaaaaaag cccgcacctg acagtgcggg 4080 cttttttttt cctaggtaca aataaaaaag gcacgtcaga tgacgtgcct tttttcttgt 4140 ctagagtata catttaaatg gtaccctcta gtcaaggcct taagtgagtc gtattacgga 4200 ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca acttaatcgc 4260 cttgcagcac atcccccttt cgccagctgg cgtaatagcg aagaggcccg caccgatcgc 4320 ccttcccaac agttgcgcag cctgaatggc gaatggcgcc tgatgcggta ttttctcctt 4380 acgcatctgt gcggtatttc acaccgcata tggtgcactc tcagtacaat ctgctctgat 4440 gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgagct 4490 <210> 80 <211> 33 <212> DNA <213> artificial sequence <220> <223> primer <400> 80 cataagcttg cgggagagaa tgatgaacaa gag 33 <210> 81 <211> 31 <212> DNA <213> artificial sequence <220> <223> primer <400> 81 acgcctaggc cagttcaagc gcaagcatca g 31 <210> 82 <211> 25 <212> DNA <213> artificial sequence <220> <223> primer <400> 82 ctttaatctg cacaccccaa cccgc 25 <210> 83 <211> 25 <212> DNA <213> artificial sequence <220> <223> primer <400> 83 ggcggtatca atcgagcgat aaccc 25

Claims (13)

  1. 스트렙토마이세스 리비딘스 (Streptomyces lividins) 글루코스 이소머라제 변이체를 코딩하며 서열 9 내지 28 중 어느 하나를 포함하는 핵산 서열을 포함하는 단리된 또는 재조합 폴리뉴클레오티드.
  2. 스트렙토마이세스 리비딘스 글루코스 이소머라제 변이체를 코딩하며 서열 9 내지 28로 이루어진 군으로부터 선택되는 핵산 서열을 포함하는 단리된 또는 재조합 폴리뉴클레오티드.
  3. 서열 9 내지 28의 핵산 서열을 포함하는, 스트렙토마이세스 리비딘스 글루코스 이소머라제 변이체를 코딩하는 핵산 서열을 포함하는 단리된 또는 재조합 폴리뉴클레오티드의 라이브러리.
  4. 제1항의 스트렙토마이세스 리비딘스 글루코스 이소머라제 변이체를 코딩하는 핵산 서열을 포함하는 폴리뉴클레오티드를 포함하는 발현 카세트.
  5. 제1항의 스트렙토마이세스 리비딘스 글루코스 이소머라제 변이체를 코딩하는 핵산 서열을 포함하는 폴리뉴클레오티드를 포함하는 키트.
  6. 3개 이상의 전사 터미네이터, 및 임의의 2개의 전사 터미네이터 사이에 위치한 하나 이상의 클로닝 부위를 포함하는 DNA 구조물.
  7. 제6항에 있어서, 전사 터미네이터가 tonB, thrA 또는 aspA이고, 클로닝 부위가 AvrII, NheI, BfaI, Cac8I, BsaJI 및 StyI로 이루어진 군으로부터 선택되는 것인 DNA 구조물.
  8. 3개 이상의 전사 터미네이터, 및 임의의 2개의 전사 터미네이터 사이에 위치한 하나 이상의 클로닝 부위를 각각 포함하는 DNA 구조물의 라이브러리.
  9. a) 서열 30으로 이루어진 pSYCO109mcs 플라스미드,
    b) 서열 31로 이루어진 짧은 1.5 GI 프로모터에 대한 DNA 구조물,
    c) 서열 32로 이루어진 짧은 1.20 GI 프로모터에 대한 DNA 구조물,
    d) 서열 70으로 이루어진 pAH105 플라스미드에 대한 DNA 구조물,
    e) 서열 71로 이루어진 pSYCO101 플라스미드에 대한 DNA 구조물,
    f) 서열 72로 이루어진 pSYCO103 플라스미드에 대한 DNA 구조물,
    g) 서열 73으로 이루어진 pSYCO106 플라스미드에 대한 DNA 구조물,
    h) 서열 74로 이루어진 pSYCO109 플라스미드에 대한 DNA 구조물,
    i) 서열 78로 이루어진 pSYCO106mcs 플라스미드에 대한 DNA 구조물, 및
    j) 서열 79로 이루어진 pRJ50 플라스미드에 대한 DNA 구조물
    로 이루어진 군으로부터 선택된 DNA 구조물.
  10. 제한 효소 AscI, NheI, PacI, RsrII, NsiI, SacII, MluI, AgeI, SapI 및 SnaBI에 대해 특이적인 제한 효소 인식 부위 서열을 함유하는 다중 클로닝 부위를 갖는 벡터.
  11. 제10항에 있어서, 다중 클로닝 부위가 서열 77의 뉴클레오티드 서열을 갖는 것인 벡터.
  12. 제1항 또는 제9항의 스트렙토마이세스 리비딘스 글루코스 이소머라제 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 형질전환된 숙주 세포.
  13. 제12항에 있어서, 상기 숙주 세포가 RJ8n인 형질전환된 숙주 세포.
KR10-2004-7016903A 2002-04-22 2003-04-22 유전공학용 프로모터 및 플라스미드 시스템 Ceased KR20040104581A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US37493102P 2002-04-22 2002-04-22
US60/374,931 2002-04-22
PCT/US2003/012566 WO2003089621A2 (en) 2002-04-22 2003-04-22 Promoter and plasmid system for genetic engineering

Publications (1)

Publication Number Publication Date
KR20040104581A true KR20040104581A (ko) 2004-12-10

Family

ID=29251224

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2004-7016903A Ceased KR20040104581A (ko) 2002-04-22 2003-04-22 유전공학용 프로모터 및 플라스미드 시스템

Country Status (9)

Country Link
US (5) US8192959B2 (ko)
EP (2) EP1499709B1 (ko)
JP (3) JP2005523020A (ko)
KR (1) KR20040104581A (ko)
CN (1) CN100366730C (ko)
AU (1) AU2003225123A1 (ko)
CA (1) CA2481414C (ko)
MX (1) MXPA04010366A (ko)
WO (1) WO2003089621A2 (ko)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040104581A (ko) * 2002-04-22 2004-12-10 이 아이 듀폰 디 네모아 앤드 캄파니 유전공학용 프로모터 및 플라스미드 시스템
KR101148255B1 (ko) * 2002-10-04 2012-08-08 다니스코 유에스 인크. 고수율을 갖는 1,3-프로판디올의 생물학적 제조 방법
DK1546304T3 (da) * 2002-10-04 2013-08-05 Danisco Us Inc Forbedret produktion af bakteriestammer
US9297028B2 (en) 2005-09-29 2016-03-29 Butamax Advanced Biofuels Llc Fermentive production of four carbon alcohols
RU2394913C2 (ru) 2005-10-26 2010-07-20 Е.И.Дюпон Де Немур Энд Компани Ферментативное получение четырехуглеродных спиртов
US20080274526A1 (en) 2007-05-02 2008-11-06 Bramucci Michael G Method for the production of isobutanol
US8206970B2 (en) 2006-05-02 2012-06-26 Butamax(Tm) Advanced Biofuels Llc Production of 2-butanol and 2-butanone employing aminobutanol phosphate phospholyase
WO2009035500A1 (en) 2007-09-12 2009-03-19 Danisco Us Inc., Genencor Division Trichoderma promoter
CN105368764B (zh) 2007-12-13 2019-03-12 丹尼斯科美国公司 用于生产异戊二烯的组合物和方法
WO2009132220A2 (en) 2008-04-23 2009-10-29 Danisco Us Inc. Isoprene synthase variants for improved microbial production of isoprene
MX318543B (es) * 2008-07-02 2014-03-18 Danisco Us Inc Composiciones y metodos para producir isopreno libre de hidrocarburos de c5 bajo condicion de desacoplamiento y/o intervalos de operacion seguros.
AU2009266989B2 (en) * 2008-07-03 2013-05-02 Pfenex, Inc. High throughput screening method and use thereof to identify a production platform for a multifunctional binding protein
EP2344629B1 (en) 2008-09-15 2018-01-24 Danisco US Inc. Systems using cell culture for production of isoprene
WO2010031062A1 (en) 2008-09-15 2010-03-18 Danisco Us Inc. Increased isoprene production using the archaeal lower mevalonate pathway
CA2737082A1 (en) * 2008-09-15 2010-03-18 Danisco Us Inc. Increased isoprene production using mevalonate kinase and isoprene synthase
EP2340312A2 (en) 2008-09-15 2011-07-06 Danisco US Inc. Conversion of prenyl derivatives to isoprene
CA2737223A1 (en) * 2008-09-15 2010-03-18 Danisco Us Inc. Reduction of carbon dioxide emission during isoprene production by fermentation
US8652823B2 (en) 2008-12-03 2014-02-18 Butamax(Tm) Advanced Biofuels Llc Strain for butanol production with increased membrane unsaturated trans fatty acids
MY161071A (en) 2008-12-30 2017-04-14 Danisco Us Inc Methods of producing isoprene and a co-product
AU2010238770A1 (en) 2009-04-23 2011-11-03 Danisco Us Inc. Three-dimensional structure of isoprene synthase and its use thereof for generating variants
TW201412988A (zh) * 2009-06-17 2014-04-01 Danisco Us Inc 使用dxp及mva途徑之改良之異戊二烯製造
TW201120213A (en) 2009-06-17 2011-06-16 Danisco Us Inc Polymerization of isoprene from renewable resources
TWI434921B (zh) 2009-06-17 2014-04-21 Danisco Us Inc 從生物異戊二烯組合物製造燃料成分之方法及系統
US20110143408A1 (en) * 2009-06-18 2011-06-16 E. I. Du Pont De Nemours And Company Zymomonas with improved arabinose utilization
US8852903B2 (en) 2009-10-23 2014-10-07 E I Du Pont De Nemours And Company Co-metabolism of fructose and glucose in microbial production strains
US20110136190A1 (en) 2009-12-04 2011-06-09 E. I. Du Pont De Nemours And Company Recombinant bacteria for producing glycerol and glycerol-derived products from sucrose
BR112012015117A2 (pt) * 2009-12-22 2019-09-24 Danisco Us Inc "biorreator de membrana para produção aumentada de gás isopreno"
SG196782A1 (en) 2009-12-23 2014-02-13 Danisco Us Inc Compositions and methods for the increased production of isoprene and other products with 6 - phosphogluconolactonase (pgl)
US8933282B2 (en) 2010-06-17 2015-01-13 Danisco Us Inc. Fuel compositions comprising isoprene derivatives
CA2816306A1 (en) 2010-10-27 2012-05-03 Danisco Us Inc. Isoprene synthase variants for improved production of isoprene
US8129170B1 (en) 2010-12-06 2012-03-06 E.I. Du Pont De Nemours And Company Recombinant bacteria having the ability to metabolize sucrose
BR112013018316A2 (pt) 2010-12-22 2018-09-11 Danisco Us Inc composições e métodos para produção aprimorada de isopreno usando dois tipos de enzimas ispg
JP2014502844A (ja) 2010-12-22 2014-02-06 ダニスコ・ユーエス・インク 組み換え細胞による五炭糖の生物学的生産
WO2013086219A1 (en) 2011-12-09 2013-06-13 Danisco Us Inc. Ribosomal promotors from b. subtilis for protein production in microorganisms
US8686114B2 (en) 2012-03-05 2014-04-01 E I Du Pont De Nemours And Company Variant sucrose transporter polypeptides
US9017961B2 (en) 2012-03-05 2015-04-28 E.I. Du Pont De Nemours And Company Recombinant bacteria comprising novel sucrose transporters
US9163263B2 (en) 2012-05-02 2015-10-20 The Goodyear Tire & Rubber Company Identification of isoprene synthase variants with improved properties for the production of isoprene
CA3109801C (en) 2013-08-22 2024-01-09 Andrew Cigan Plant genome modification using guide rna/cas endonuclease systems and methods of use
RU2695428C2 (ru) * 2014-01-20 2019-07-23 Октафарма Аг СПОСОБ ПРОИЗВОДСТВА ФАКТОРА VIII, ИМЕЮЩЕГО УЛУЧШЕННОЕ СООТНОШЕНИЕ FVIII:C/FVIII:Ag
JPWO2015115610A1 (ja) * 2014-01-31 2017-03-23 国立大学法人徳島大学 発現カセット
WO2016007948A1 (en) * 2014-07-11 2016-01-14 Pioneer Hi-Bred International, Inc. Agronomic trait modification using guide rna/cas endonuclease systems and methods of use
ES2778727T3 (es) 2014-08-25 2020-08-11 Geneweave Biosciences Inc Partículas de transducción no replicativas y sistemas indicadores basados en partículas de transducción
WO2017152169A1 (en) 2016-03-04 2017-09-08 Danisco Us Inc. Engineered ribosomal promoters for protein production in microorganisms
US11008602B2 (en) 2017-12-20 2021-05-18 Roche Molecular Systems, Inc. Non-replicative transduction particles and transduction particle-based reporter systems
CN108118058B (zh) * 2017-12-29 2021-06-29 苏州金唯智生物科技有限公司 一种改进的启动子及其应用
CN108118059B (zh) * 2017-12-30 2021-03-19 苏州金唯智生物科技有限公司 一种改进的启动子及其组成的载体和应用
CN110066820B (zh) * 2019-04-29 2021-03-16 华南农业大学 一种荧光菌株E.coli C600及构建方法与应用
CN110438138A (zh) * 2019-07-04 2019-11-12 深圳市深研生物科技有限公司 质粒载体

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06153964A (ja) * 1992-11-20 1994-06-03 Nakano Vinegar Co Ltd プラスミド pMVC18
JP3535535B2 (ja) * 1993-02-26 2004-06-07 天野エンザイム株式会社 糸状菌の形質転換用プラスミドおよびそれを用いた糸状菌の育種法
JP3383341B2 (ja) * 1993-02-26 2003-03-04 天野エンザイム株式会社 糸状菌および酵母で使用可能なポリペプチド発現用プラスミドおよびそれを用いたポリペプチドの製造法
US5547862A (en) 1993-07-29 1996-08-20 Ambion Inc. Vectors containing multiple promoters in the same orientation
JP3556965B2 (ja) * 1993-11-08 2004-08-25 天野エンザイム株式会社 糸状菌および酵母で使用可能なポリペプチド分泌発現用プラスミドおよびそれを用いたポリペプチドの製造法
US5599689A (en) 1995-05-12 1997-02-04 E. I. Du Pont De Nemours And Company Process for making 1,3-propanediol from carbohydrates using mixed microbial cultures
US5686276A (en) 1995-05-12 1997-11-11 E. I. Du Pont De Nemours And Company Bioconversion of a fermentable carbon source to 1,3-propanediol by a single microorganism
US5633362A (en) 1995-05-12 1997-05-27 E. I. Du Pont De Nemours And Company Production of 1,3-propanediol from glycerol by recombinant bacteria expressing recombinant diol dehydratase
JPH09322779A (ja) * 1996-04-01 1997-12-16 Nippon Steel Corp Dna結合性タンパク質のスクリーニング法およびそれに用いられるプラスミド並びにdna結合性タンパク質
EP2034021A1 (en) * 1996-08-23 2009-03-11 Peter Ruhdal Jensen Artificial promoter libraries for selected organisms and promoters derived from such libraries
ATE452979T1 (de) 1996-11-13 2010-01-15 Du Pont Herstellungsverfahren von 1,3-propandiol durch rekombinante organismen
CN1186856A (zh) 1996-12-31 1998-07-08 中国科学院武汉病毒研究所 含三个启动子的杆状病毒转移载体
AU1619199A (en) 1997-12-02 1999-06-16 E.I. Du Pont De Nemours And Company Method for the production of glycerol by recombinant organisms
US6432686B1 (en) * 1998-05-12 2002-08-13 E. I. Du Pont De Nemours And Company Method for the production of 1,3-propanediol by recombinant organisms comprising genes for vitamin B12 transport
WO2001012833A2 (en) 1999-08-18 2001-02-22 E.I. Du Pont De Nemours And Company Process for the biological production of 1,3-propanediol
JP4261196B2 (ja) 2001-04-20 2009-04-30 イー・アイ・デュポン・ドウ・ヌムール・アンド・カンパニー バイオ発酵システムで使用するための生成物除去方法
KR20040104581A (ko) * 2002-04-22 2004-12-10 이 아이 듀폰 디 네모아 앤드 캄파니 유전공학용 프로모터 및 플라스미드 시스템

Also Published As

Publication number Publication date
US20050147968A1 (en) 2005-07-07
US8168608B2 (en) 2012-05-01
WO2003089621A8 (en) 2004-12-29
WO2003089621A3 (en) 2004-04-15
JP5291673B2 (ja) 2013-09-18
US7132527B2 (en) 2006-11-07
WO2003089621A2 (en) 2003-10-30
CA2481414C (en) 2013-04-09
EP2374879A2 (en) 2011-10-12
EP2374879A3 (en) 2012-01-11
MXPA04010366A (es) 2005-02-17
CN100366730C (zh) 2008-02-06
EP1499709B1 (en) 2012-01-04
US20040235099A1 (en) 2004-11-25
JP2010268807A (ja) 2010-12-02
US20110046014A1 (en) 2011-02-24
US20090156430A1 (en) 2009-06-18
CN1646680A (zh) 2005-07-27
JP2009279007A (ja) 2009-12-03
US20070065867A1 (en) 2007-03-22
US7510869B2 (en) 2009-03-31
CA2481414A1 (en) 2003-10-30
JP2005523020A (ja) 2005-08-04
US8192959B2 (en) 2012-06-05
AU2003225123A8 (en) 2003-11-03
AU2003225123A1 (en) 2003-11-03
EP1499709A4 (en) 2006-08-02
EP1499709A2 (en) 2005-01-26

Similar Documents

Publication Publication Date Title
CA2481414C (en) Promoter and plasmid system for genetic engineering
KR100525325B1 (ko) 단일미생물에 의한 발효가능한 탄소원의 1,3-프로판디올로의 생물전환
KR100785997B1 (ko) 1,3-프로판디올을 높은 역가로 생물학적으로 생산하는 방법
US6432686B1 (en) Method for the production of 1,3-propanediol by recombinant organisms comprising genes for vitamin B12 transport
US6428767B1 (en) Method for identifying the source of carbon in 1,3-propanediol
KR20130125785A (ko) 수크로스 대사능을 갖는 재조합 박테리아
AU2013230162A1 (en) Recombinant bacteria comprising novel sucrose transporters
AU2012296494A1 (en) Variant sucrose transporter polypeptides that enable faster sucrose utilization in bacteria
KR20140054232A (ko) 수크로스 이용성이 향상된 재조합 박테리아
AU2013230227A1 (en) Variant sucrose transporter polypeptides
HK1081231A (en) Promoter and plasmid system for genetic engineering
AU7156500A (en) Bioconversion of a fermentable carbon source to 1,3-propanediol by a single microorganism
HK1163161A (en) Promoter and plasmid system for genetic engineering
MXPA02001712A (en) Process for the biological production of 1,3-propanediol with high titer

Legal Events

Date Code Title Description
PA0105 International application

Patent event date: 20041021

Patent event code: PA01051R01D

Comment text: International Patent Application

PG1501 Laying open of application
A201 Request for examination
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20080421

Comment text: Request for Examination of Application

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20100317

Patent event code: PE09021S01D

E601 Decision to refuse application
PE0601 Decision on rejection of patent

Patent event date: 20100701

Comment text: Decision to Refuse Application

Patent event code: PE06012S01D

Patent event date: 20100317

Comment text: Notification of reason for refusal

Patent event code: PE06011S01I