KR20200047668A - 바실러스에서 증가된 단백질 생산을 위한 변형된 5'-비번역 영역(utr) 서열 - Google Patents
바실러스에서 증가된 단백질 생산을 위한 변형된 5'-비번역 영역(utr) 서열 Download PDFInfo
- Publication number
- KR20200047668A KR20200047668A KR1020207009682A KR20207009682A KR20200047668A KR 20200047668 A KR20200047668 A KR 20200047668A KR 1020207009682 A KR1020207009682 A KR 1020207009682A KR 20207009682 A KR20207009682 A KR 20207009682A KR 20200047668 A KR20200047668 A KR 20200047668A
- Authority
- KR
- South Korea
- Prior art keywords
- utr
- bacillus
- nucleic acid
- acid sequence
- mod
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/55—Vectors comprising a special translation-regulating system from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2408—Glucanases acting on alpha -1,4-glucosidic bonds
- C12N9/2411—Amylases
- C12N9/2414—Alpha-amylase (3.2.1.1.)
- C12N9/2417—Alpha-amylase (3.2.1.1.) from microbiological source
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01001—Alpha-amylase (3.2.1.1)
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 개시는 일반적으로 증가된 양의 산업적으로 관련 있는 관심 단백질을 생산할 수 있는 변형된 바실러스 균주 및 이의 숙주 세포에 관한 것이다. 본 개시의 다른 구현예는 변형된 바실러스 서브틸리스(Bacillus subtilis) aprE 5'-비번역 영역(5'-UTR) 핵산 서열을 포함하는 단리된 폴리뉴클레오티드, 이의 벡터, 이의 DNA (발현) 작제물, 이의 변형된 바실러스(딸) 세포, 및 이의 제조 방법 및 사용 방법에 관한 것이다.
Description
[관련 출원에 대한 상호 참조]
본 출원은 2017년 9월 13일에 출원된 미국 가특허 제62/558304호의 이익을 주장하며, 그 전체는 본 명세서에 참조로 포함된다.
[기술분야]
본 개시는 일반적으로 세균학, 미생물학, 유전학, 분자 생물학, 효소학, 및 산업 단백질 생산 등의 분야에 관한 것이다. 더욱 특별하게는, 본 개시의 특정 구현예는 증가된 양의 산업적으로 관련 있는 관심 단백질을 생산할 수 있는 변형된 바실러스(Bacillus) 균주 및 이의 숙주 세포에 관한 것이다. 본 개시의 다른 구현예는 변형된 바실러스 서브틸리스(Bacillus subtilis) aprE 5'-비번역 영역(5'-UTR) 핵산 서열을 포함하는 단리된 폴리뉴클레오티드, 이의 벡터, 이의 DNA (발현) 작제물, 이의 변형된 바실러스(딸) 세포, 및 이의 제조 방법 및 이용 방법에 관한 것이다.
[서열 목록에 대한 참조]
"20180823_NB41250WOPCT_SequenceListing_ST25.txt"로 명명된 서열 목록 텍스트 파일의 전자 제출 내용은 2018년 8월 23일자로 생성되었고, 그 크기는 38 KB이며, 그 전체가 참고로서 본 명세서에 포함된다.
바실러스 서브틸리스(Bacillus subtilis), 바실러스 리체니포르미스(Bacillus licheniformis), 바실러스 아밀로리쿠에파시엔스(Bacillus amyloliquefaciens) 등과 같은 그람 양성 박테리아는, 이들의 우수한 발효 특성 및 높은 수율(예컨대, 배양액 1리터당 최대 25그램; Van Dijl and Hecker, 2013)로 인해 종종 산업 관련 단백질의 생산을 위한 미생물 공장으로서 사용된다. 예를 들어 B. 서브틸리스는 식품, 직물, 세탁, 의료 기기 세척, 제약 산업 등에 필요한 α-아밀라아제(Jensen et al., 2000; Raul et al., 2014)와 프로테아제(Brode et al., 1996)를 생산하는 것으로 잘 알려져 있다(Westers et al., 2004). 이들 비 병원성 그람 양성 박테리아는 독성 부산물(예를 들어, 리포다당류; LPS, 내독소로도 알려짐)이 전혀 없는 단백질을 생산하기 때문에, 유럽 식품 안전성 당국(European Food Safety Authority)의 "공인된 안전성 추정(Qualified Presumption of Safety, QPS)" 자격을 얻었으며, 이들 생산물 중 다수가 미국 식품 의약국(US Food and Drug Administration)으로부터 "일반적으로 안전한 것으로 인정됨(Generally Recognized As Safe, GRAS)" 자격을 얻었다(Olempska-Beer et al., 2006; Earl et al., 2008; Caspers et al., 2010).
따라서, 미생물 숙주 세포에서 단백질(예를 들어, 효소, 항체, 수용체 등)을 생산하는 것은 생명공학 분야에서 특별한 관심 대상이다. 마찬가지로, 하나 이상의 관심 단백질(들)의 생산 및 분비를 위한 바실러스 숙주 세포의 최적화는, 특히 산업적 생명공학 환경에서 높은 관련성을 갖는데, 여기에서 단백질 수율의 작은 개선은 단백질이 대규모의 산업적인 양으로 생산될 때 상당히 중요하다. 더욱 특별하게는, B. 리체니포르미스는 산업적으로 매우 중요한 바실러스 종 숙주 세포이므로, 단백질 발현/생산을 강화/증가시키기 위해 B. 리체니포르미스 숙주 세포를 유전자 변형 및 조작하는 능력은 새롭고 개선된 B. 리체니포르미스 생산 균주의 작제를 위해 대단히 바람직하다.
따라서, 본 명세서에서 개시된 개시 내용은 단백질 생산 능력 등이 증가된 바실러스 숙주 세포(예컨대, 단백질 생산 숙주 세포, 세포 공장)를 수득하고 작제하기 위한 매우 바람직하고 충족되지 않은 필요성에 관한 것이다.
본 개시는 일반적으로 증가된 양의 산업적으로 관련 있는 관심 단백질을 생산할 수 있는 변형된 바실러스 균주 및 이의 숙주 세포에 관한 것이다. 더욱 특별하게는, 본 개시의 특정 구현예는 야생형 바실러스 서브틸리스 aprE 5'-비번역 영역(WT-5′-UTR) 핵산 서열인 서열번호 1로부터 유래된 변형된 바실러스 서브틸리스 aprE 5'-비번역 영역(mod-5'-UTR)을 포함하는 단리된 폴리뉴클레오티드를 대상으로 한다. 특정 구현예에서, mod-5′-UTR은 서열번호 2를 포함한다. 다른 구현예에서, mod-5′-UTR은, 5′에 있고 mod-5′-UTR에 작동 가능하게 연결된 상류(5′) 프로모터 영역 핵산 서열을 더 포함한다.
또 다른 구현예에서, mod-5′-UTR은 관심 단백질을 암호화하는 하류(3′) 개방형 해독틀(ORF) 핵산 서열을 더 포함하고, 이때, ORF 서열은 3'에 있고, mod-5′-UTR에 작동 가능하게 연결된다. 특정한 다른 구현예에서, 단리된 폴리뉴클레오티드는 5′에서 3′ 방향의 식 (I)을 포함한다:
(I):
[Pro] [mod-5′-UTR] [ORF]
(식에서, [Pro]는 바실러스 sp. 세포에서 작동 가능한 프로모터 영역 핵산 서열이고, [mod-5′-UTR]은 변형된 B. 서브틸리스 aprE 5′ 비번역 영역(mod-5′-UTR) 핵산 서열이고, [ORF]는 관심 단백질(POI)을 암호화하는 개방형 해독틀 핵산 서열이며, 이때, [Pro], [mod-5′-UTR] 및 [ORF] 핵산 서열은 작동 가능하게 연결됨). 다른 구현예에서, 벡터 또는 DNA 발현 작제물은 본 개시의 단리된 폴리뉴클레오티드를 포함한다. 또 다른 구현예에서, 재조합 바실러스 sp. 세포는 본 개시의 단리된 폴리뉴클레오티드를 포함한다. 특정 구현예에서, 바실러스 sp.는 바실러스 리체니포르미스 세포이다.
또 다른 구현예에서, 본 개시는 야생형 바실러스 sp. 5′-UTR(WT-5′-UTR) 서열로부터 유래된 변형된 바실러스 sp. 5′-UTR(mod-5′-UTR) 핵산 서열을 포함하는 단리된 폴리뉴클레오티드에 관한 것으로, 단리된 변형 폴리뉴클레오티드는 작동 가능한 조합으로 5'에서 3' 방향의 식 (II)의 핵산 서열을 포함한다:
(II):
[TIS] [mod-5′ UTR] [tss 코돈]
(식에서, [TIS]는 전사 개시 부위(TIS)이고, [mod-5′-UTR]은 변형된 B. 서브틸리스 5′-UTR 핵산 서열을 포함하고, [tss 코돈]은 3 뉴클레오티드 번역 개시 부위(tss) 코돈임). 특정 구현예에서, [mod-5′-UTR] 서열은 서열번호 2를 포함한다. 또 다른 구현예에서, 폴리뉴클레오티드는 (a) 상류(5')에 있고 [TIS]에 작동 가능하게 연결된 핵산 프로모터 서열로서, 바실러스 sp. 세포에서 작동 가능한 핵산 프로모터 서열 및 (b) 하류(3')에 있고 tss 코돈에 작동 가능하게 연결된 ORF 핵산 서열로서, POI를 암호화하는 ORF 핵산 서열을 더 포함한다. 다른 구현예에서, 벡터 또는 DNA 발현 작제물은 본 개시의 단리된 폴리뉴클레오티드를 포함한다. 특정 구현예에서, 재조합 바실러스 sp. 세포는 식 (II)을 폴리뉴클레오티드를 포함한다. 특정한 다른 구현예에서, 바실러스 sp. 세포는 바실러스 리체니포르미스 세포이다.
또 다른 구현예에서, 본 개시는 5'에서 3' 방향으로 및 작동 가능한 조합으로 식 (III)의 핵산 서열을 포함하는 단리된 폴리뉴클레오티드를 대상으로 한다:
(III): [5′-HR] [TIS] [mod-5′-UTR] [tss 코돈] [3′-HR]
(식에서, [TIS]는 전사 개시 부위(TIS)이고, [mod-5′-UTR]은 변형된 B. 서브틸리스 5′-UTR 핵산 서열을 포함하고, [tss 코돈]은 3 뉴클레오티드 번역 개시 부위(tss) 코돈이고, [5′-HR]은 5′-핵산 서열 상동성 영역이고, [3′-HR]은 3′-핵산 서열 상동성 영역이며, 이때, 5′-HR과 3′-HR은 각각 [TIS] 서열의 바로 상류(5') 및 [tss 코돈] 서열의 바로 하류(3')의 게놈(염색체) 영역(좌(locus))에 대해, 도입된 폴리뉴클레오티드 작제물을 상동 재조합에 의한 변형된 바실러스 세포의 게놈 내로 통합시키기에 충분한 상동성을 포함한다). 특정 구현예에서, 벡터 또는 DNA 발현 작제물은 식 (III)의 폴리뉴클레오티드를 포함한다. 특정 구현예에서, 바실러스 sp. 세포는 폴리뉴클레오티드를 포함한다. 특정 구현예에서, 바실러스 sp. 세포는 바실러스 리체니포르미스 세포이다.
또 다른 구현예에서, 본 개시의 개방형 해독틀(ORF) 핵산 서열은 관심 단백질(POI)을 암호화하며, 이때, POI는 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르보닉 언하이드라아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이사아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 하이드롤라아제, 헤미셀룰라아제, 헥소스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리가아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소스 옥시다아제, 및 이의 조합으로 구성된 군으로부터 선택된다.
또 다른 구현예에서, 본 개시는 야생형 바실러스 sp. 5′-UTR(WT-5′-UTR) 서열로부터 유래된 변형된 5′-UTR(mod-5′-UTR) 핵산 서열을 포함하는 단리된 폴리뉴클레오티드에 관한 것으로, 단리된 폴리뉴클레오티드는 5'에서 3' 방향으로 및 작동 가능한 조합으로 식 (IV)의 핵산 서열을 포함한다:
(IV):
[TIS] [5′-UTR -Δ xN ] [tss 코돈]
(식에서, [TIS]는 전사 개시 부위(TIS)이고, [tss 코돈]은 3 뉴클레오티드 번역 개시 부위(tss) 코돈이고, [5′-UTR -ΔxN]은 야생형 바실러스 sp. 5′-UTR 핵산 서열로부터 유래된 변형된 바실러스 sp. 5′ UTR 핵산 서열이며, 이때, mod-5′-UTR 핵산 서열 [5′-UTR -ΔxN]은 WT-5′-UTR 핵산 서열의 원위(3') 말단에 "x"개 뉴클레오티드("N")의 결실(-Δ)을 포함한다).
또 다른 구현예에서, 본 개시는 야생형 바실러스 sp. 5′-UTR(WT-5′-UTR) 서열로부터 유래된 변형된 5′-UTR(mod-5′-UTR) 핵산 서열을 포함하는 단리된 폴리뉴클레오티드에 관한 것으로, 단리된 폴리뉴클레오티드는 5'에서 3' 방향으로 및 작동 가능한 조합으로 식 (V)의 핵산 서열을 포함한다:
(V):
[TIS] [5′-UTR +Δ xN ] [tss 코돈]
(식에서, [TIS]는 전사 개시 부위이고, [tss 코돈]은 3 뉴클레오티드 번역 개시 부위(tss) 코돈이고, [5′-UTR +ΔxN]은 야생형 바실러스 sp. 5′-UTR 핵산 서열로부터 유래된 변형된 바실러스 sp. 5′ UTR 핵산 서열이며, 이때, mod-5′-UTR 핵산 서열 [5′-UTR +ΔxN]은 야생형 바실러스 sp. 5′-UTR 핵산 서열의 원위(3') 말단에 "x"개 뉴클레오티드("N")의 부가(+Δ)를 포함한다).
다른 구현예에서, 본 개시는 이종 관심 단백질(POI)의 생산에 적합한 배지에서 배양될 때 증가된 양의 이종 POI를 생산하는 변형된 바실러스 sp.(딸) 세포를 대상으로 하며, 변형된 바실러스 세포는 5'에서 3' 방향으로 및 작동 가능한 조합으로 식 (I)의 핵산 서열을 포함하는 도입된 발현 작제물을 포함하며,
(I):
[Pro] [mod-5′-UTR] [ORF]
(식에서, [Pro]는 바실러스 sp. 세포에서 작동 가능한 프로모터 영역 핵산 서열이고, [mod-5′-UTR]은 변형된 B. 서브틸리스 비번역 영역(mod-5′-UTR) 핵산 서열이고, [ORF]는 관심 단백질(POI)을 암호화하는 개방형 해독틀 핵산 서열이며, 이때, [Pro], [mod-5′-UTR] 및 [ORF] 핵산 서열은 작동 가능하게 연결됨), 이때 변형된 바실러스 sp.(딸) 세포는 비슷한 조건 하에서 배양될 때 동일한 POI를 생산하는 비변형 바실러스(모) 세포와 비교하여 증가된 양의 이종 POI를 생산한다. 특정 구현예에서, mod-5′-UTR은 서열번호 2를 포함한다. 다른 구현예에서, 세포는 바실러스 리체니포르미스 세포이다. 다른 구현예에서, ORF 서열은 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르보닉 언하이드라아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이사아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 하이드롤라아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리가아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소오스 옥시다아제, 및 이의 조합으로 구성된 군으로부터 선택된 POI를 암호화한다.
특정한 다른 구현예에서, 본 개시는 변형된 바실러스 세포에서 증가된 양의 이종 관심 단백질(POI)을 생산하는 방법에 관한 것으로, 방법은 (a) 모 바실러스 sp. 세포에 5'에서 3' 방향으로 및 작동 가능한 조합으로 핵산 서열 [Pro] [mod-5′-UTR] [ORF]를 포함하는 발현 작제물을 도입하는 단계(이때, [Pro]는 바실러스 sp. 세포에서 작동 가능한 프로모터 영역 핵산 서열이고, [mod-5′-UTR]은 서열번호 2의 mod-5′-UTR 핵산 서열이고, [ORF]는 관심 단백질(POI)을 암호화하는 개방형 해독틀 핵산 서열임), 및 (b) 이종 POI의 생산에 적합한 배지에서 단계 (a)의 변형된 바실러스 sp. 세포를 배양하는 단계를 포함하며, 이때, 변형된 바실러스(딸) 세포는 단계 (b)의 동일한 배지에서 배양된 바실러스 대조군 세포와 비교하여 증가된 양의 POI를 생산하고, 바실러스 대조군 세포는 5'에서 3' 방향으로 및 작동 가능한 조합으로 핵산 서열 [Pro] [WT-5′-UTR] [ORF]를 포함하는 도입된 발현 작제물을 포함하며, 이때, [Pro] 및 [ORF] 핵산 서열은 단계 (a)의 [Pro] 및 [ORF] 서열과 동일하고, [WT-5′-UTR]은 서열번호 1을 포함한다. 특정 구현예에서, 바실러스 세포는 바실러스 리체니포르미스 세포이다. 또 다른 구현예에서, ORF 서열은 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르보닉 언하이드라아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이사아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 하이드롤라아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리가아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소오스 옥시다아제, 및 이의 조합으로 구성된 군으로부터 선택된 POI를 암호화한다.
또 다른 구현예에서, 본 개시는 변형된 바실러스 세포에서 증가된 양의 내인성 관심 단백질(POI)을 생산하는 방법에 관한 것으로, 방법은 (a) 내인성 POI를 생산하는 모 바실러스 세포를 수득하는 단계, (b) 단계 (a)의 세포에 5'에서 3' 방향으로 및 작동 가능한 조합으로 식 (VI)의 핵산 서열을 포함하는 폴리뉴클레오티드 작제물을 도입하는 단계
(VI):
[5′-HR] [mod-5′-UTR] [3′-HR]
(식에서, [mod-5′-UTR]은 서열번호 2를 포함하고, [5′-HR]은 내인성 POI를 암호화하는 내인성 GOI의 내인성 야생형 5′-UTR(WT-5′-UTR) 서열의 바로 상류(5')에 있는 게놈 좌에 대한 상동성을 포함하는 5′-핵산 서열 상동성 영역이고, [3′-HR]은 내인성 POI를 암호화하는 내인성 GOI의 내인성 WT-5′-UTR 서열의 바로 하류(3')에 있는 게놈 좌에 대한 상동성을 포함하는 3′-핵산 서열 상동성 영역이며, 5′-HR과 3′-HR은 상기 게놈 좌에 대해, 도입된 mod-5′-UTR 폴리뉴클레오티드 작제물을 상동 재조합에 의해 변형된 바실러스 세포의 게놈 내로 통합시키기에 충분한 상동성을 포함하여, 내인성 WT-5′-UTR을 서열번호 2의 mod-5′-UTR로 교체한다), 및 (c) 내인성 POI의 생산에 적합한 배지에서 단계 (b)의 변형된 바실러스 sp. 세포를 배양하는 단계를 포함하며, 이때, 단계 (c)의 변형된 세포는 비슷한 조건 하에 배양될 때의 단계 (a)의 모 세포와 비교하여 증가된 양의 내인성 POI를 생산한다.
도 1은 프로모터-WT 5' UTR-개시 코돈 핵산 서열("1"로 표지된 윗 서열) 대 프로모터-mod 5' UTR-개시 코돈 핵산 서열("2"로 표지된 아래 서열)의 핵산 서열 비교를 제시한 것이다. 두 서열의 경우, -35 영역은 밑줄로 표시하였고, -10 영역은 박스로 표시하였으며, 전사 개시 부위는 "+1"로 표지하였고, 5' UTR 서열은 굵은 글자체로 표시하였고, 리보솜 결합 부위(RBS)는 굵은 이탤릭체 로 표시하였다. 수직 막대는 두 서열 사이의 동일성을 나타낸다. 서열 "1"은 B. 서브틸리스 aprE 유전자의 WT-5' UTR을 함유하는 본래의 서열이다. 서열 "2"는 RBS와 개시 코돈(ATG) 사이의 간격을 바꾸는 -1A(Δ 아데닌)이 있는 변형된 aprE 5' UTR(mod-5' UTR)을 함유한다.
생물학적 서열의 간단한 설명
서열번호 1은 야생형 B. 서브틸리스 aprE 5′ UTR(이하, "WT-5′-UTR")의 핵산 서열이다.
서열번호 2는 변형된 B. 서브틸리스 aprE 5′ UTR(이하, "mod-5′-UTR")의 핵산 서열이다.
서열번호 3은 서열번호 21의 아미노산 서열을 포함하는 comK 전사 인자 단백질을 암호화하는 인공 핵산 서열이다.
서열번호 4는 "WT-5'-UTR" 발현 작제물을 포함하는 인공 핵산 서열이다.
서열번호 5는 "mod-5'-UTR" 발현 작제물을 포함하는 인공 핵산 서열이다.
서열번호 6은 바실러스 리체니포르미스 세포의 5′ catH 유전자 서열에 대한 서열 상동성을 포함하는 인공 5′ 상동성 암(arm)(즉, 5′-HR) 핵산 서열이다.
서열번호 7은 catH 유전자를 포함하는 인공 핵산 서열이다.
서열번호 8은 spoVGrrnIp 하이브리드 프로모터를 포함하는 인공 핵산 서열이다.
서열번호 9는 B. 리체니포르미스 α-아밀라아제 단백질 신호 서열을 암호화하는 핵산 서열이다.
서열번호 10은 서열번호 13의 G. 스테아로서모필루스 변이체 α-아밀라아제 단백질을 암호화하는 인공 핵산 서열이다.
서열번호 11은 B. 리체니포르미스 α-아밀라아제 종결자 서열을 포함하는 핵산 서열이다.
서열번호 12는 바실러스 리체니포르미스 세포의 3′ catH 유전자 서열에 대한 서열 상동성을 포함하는 인공 3′ 상동성 암(즉, 3′-HR) 핵산 서열이다.
서열번호 13은 변이체 G. 스테아로서모필루스 α-아밀라아제 단백질의 아미노산 서열이다.
서열번호 14는 인공 핵산 서열 --콜로니 PCR "WT-5′ UTR" 작제물이다.
서열번호 15는 인공 핵산 서열 --콜로니 PCR (-1A 5′ UTR) "mod-5′ UTR" 작제물이다.
서열번호 16은 인공 프라이머 핵산 서열이다.
서열번호 17은 인공 프라이머 핵산 서열이다.
서열번호 18은 인공 프라이머 핵산 서열이다.
서열번호 19는 인공 프라이머 핵산 서열이다.
서열번호 20은 인공 프라이머 핵산 서열이다.
서열번호 21은 서열번호 3에 의해 암호화되는 comK 단백질의 아미노산 서열이다.
생물학적 서열의 간단한 설명
서열번호 1은 야생형 B. 서브틸리스 aprE 5′ UTR(이하, "WT-5′-UTR")의 핵산 서열이다.
서열번호 2는 변형된 B. 서브틸리스 aprE 5′ UTR(이하, "mod-5′-UTR")의 핵산 서열이다.
서열번호 3은 서열번호 21의 아미노산 서열을 포함하는 comK 전사 인자 단백질을 암호화하는 인공 핵산 서열이다.
서열번호 4는 "WT-5'-UTR" 발현 작제물을 포함하는 인공 핵산 서열이다.
서열번호 5는 "mod-5'-UTR" 발현 작제물을 포함하는 인공 핵산 서열이다.
서열번호 6은 바실러스 리체니포르미스 세포의 5′ catH 유전자 서열에 대한 서열 상동성을 포함하는 인공 5′ 상동성 암(arm)(즉, 5′-HR) 핵산 서열이다.
서열번호 7은 catH 유전자를 포함하는 인공 핵산 서열이다.
서열번호 8은 spoVGrrnIp 하이브리드 프로모터를 포함하는 인공 핵산 서열이다.
서열번호 9는 B. 리체니포르미스 α-아밀라아제 단백질 신호 서열을 암호화하는 핵산 서열이다.
서열번호 10은 서열번호 13의 G. 스테아로서모필루스 변이체 α-아밀라아제 단백질을 암호화하는 인공 핵산 서열이다.
서열번호 11은 B. 리체니포르미스 α-아밀라아제 종결자 서열을 포함하는 핵산 서열이다.
서열번호 12는 바실러스 리체니포르미스 세포의 3′ catH 유전자 서열에 대한 서열 상동성을 포함하는 인공 3′ 상동성 암(즉, 3′-HR) 핵산 서열이다.
서열번호 13은 변이체 G. 스테아로서모필루스 α-아밀라아제 단백질의 아미노산 서열이다.
서열번호 14는 인공 핵산 서열 --콜로니 PCR "WT-5′ UTR" 작제물이다.
서열번호 15는 인공 핵산 서열 --콜로니 PCR (-1A 5′ UTR) "mod-5′ UTR" 작제물이다.
서열번호 16은 인공 프라이머 핵산 서열이다.
서열번호 17은 인공 프라이머 핵산 서열이다.
서열번호 18은 인공 프라이머 핵산 서열이다.
서열번호 19는 인공 프라이머 핵산 서열이다.
서열번호 20은 인공 프라이머 핵산 서열이다.
서열번호 21은 서열번호 3에 의해 암호화되는 comK 단백질의 아미노산 서열이다.
본 개시는 일반적으로 단백질 생산 능력 등이 증가된 바실러스 (숙주) 세포(예컨대, 단백질 생산 숙주 세포, 세포 공장)를 생산하고 작제하기 위한 조성물 및 방법에 관한 것이다. 본 개시의 특정 구현예는 변형된 바실러스 서브틸리스 aprE 5'-비번역 영역(5'-UTR) 핵산 서열을 포함하는 단리된 폴리뉴클레오티드, 이의 벡터, 이의 DNA (발현) 작제물, 이의 변형된 바실러스(딸) 세포, 및 이의 제조 방법 및 이용 방법에 관한 것이다. 다른 구현예에서, 본 개시는 변형된 B. 서브틸리스 aprE 5′-비번역 영역(5′-UTR) 핵산 서열을 포함하는 단리된 폴리뉴클레오티드에 관한 것이다. 특정 구현예에서, 본 개시의 변형된 5′-UTR은 5'에 있고 변형된 5′-UTR에 작동 가능하게 연결된 상류(5′) 프로모터 영역 핵산 서열 및/또는 3'에 있고 변형된 5′-UTR에 작동 가능하게 연결된 (관심 단백질을 암호화하는) 하류(3') 개방형 해독틀(ORF) 핵산 서열을 더 포함한다.
또 다른 구현예에서, 본 개시는 5'에서 3' 방향으로 식 (I)을 포함하는 단리된 폴리뉴클레오티드를 대상으로 한다:
(I):
[Pro] [mod-5′-UTR] [ORF]
(식에서, [Pro]는 바실러스 sp. 세포에서 작동 가능한 프로모터 영역 핵산 서열이고, [mod-5′-UTR]은 변형된 5′-UTR 핵산 서열이고, [ORF]는 관심 단백질(POI)을 암호화하는 개방형 해독틀 핵산 서열이며, 이때, [Pro], [5′-UTR] 및 [ORF] 핵산 서열은 작동 가능하게 연결됨). 다른 구현예에서, 본 개시는 본 개시의 단리된 폴리뉴클레오티드를 포함하는 벡터 및 DNA 작제물에 관한 것이다.
다른 구현예에서, 본 개시의 ORF 서열은 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르보닉 언하이드라아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이사아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 하이드롤라아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리가아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소오스 옥시다아제, 및 이의 조합으로 구성된 군으로부터 선택된 POI를 암호화한다.
다른 구현예에서, 본 개시는 이종 관심 단백질(POI)의 생산에 적합한 배지에서 배양될 때 증가된 양의 이종 POI를 생산하는 변형된 바실러스 sp.(딸) 세포에 관한 것으로, 변형된 바실러스 세포는 식 (I)의 핵산 서열을 포함하는 도입된 발현 작제물을 포함하며, 이때, 변형된 바실러스(딸) 세포는 비슷한 조건 하에서 배양될 때 동일한 POI를 생산하는 비변형 바실러스(모) 세포와 비교하여 증가된 양의 이종 POI를 생산한다.
I.
정의
본 명세서에서 기술된 바와 같은, (모) 바실러스 세포, 변형된 바실러스(딸) 세포를 포함하나 이에 한정되지 않는 본 개시의 바실러스 균주 및 숙주 세포, 이의 조성물 및 이의 제조 방법 및 이용 방법과 관련하여, 다음의 용어와 어구를 정의한다.
본 명세서에서 달리 지시되지 않는 한, 본 명세서에서 기술된 1종 이상의 바실러스 균주(즉, 숙주 세포)는 분자 생물학, 미생물학, 단백질 정제, 단백질 및 DNA 시퀀싱 및 다양한 재조합 DNA 방법/기법에서 흔히 사용되는 통상적인 기법을 통해 제조 및 이용될 수 있다.
본 명세서에서 달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 당업자에 의해 일반적으로 이해되는 바와 동일한 의미를 갖는다.
본 명세서에서 제공된 임의의 정의는 본 명세서의 맥락에서 전체로서 해석된다. 본 명세서에서 사용되는 바와 같이, 단수형("a", "an" 및 "the")은, 문맥상 명백하게 달리 지시하지 않는 한, 복수형을 포함한다. 달리 지시되지 않는 한, 핵산 서열은 5'에서 3' 방향으로 좌측에서 우측으로 적히며; 아미노산 서열은 아미노에서 카르복시 방향으로 좌측에서 우측으로 적힌다. 본 명세서에서 사용된 각각의 수치 범위는 마치 더 좁은 수치 범위 전부가 본 명세서에서 명백하게 적힌 것처럼 그러한 더 넓은 수치 범위 내에 있는 더 좁은 모든 수치 범위를 포함한다.
수치 값과 관련하여 본 명세서에서 사용되는 바와 같이, 용어 "약"은 이 용어가 달리 구체적으로 문맥에서 정의되지 않는 한, 그 수치 값의 +/- 0.5의 범위를 나타낸다. 예를 들어, 어구 "약 6의 pH 값"은 pH 값이 달리 구체적으로 정의되지 않는 한, 5.5 내지 6.5의 pH 값을 나타낸다.
본 명세서에서 기재되는 것과 유사하거나 동등한 임의의 방법 및 물질이 본 발명의 조성물 및 방법의 실시 또는 시험에 또한 사용될 수 있지만, 대표적인 예시적 방법 및 물질이 이제 기재된다. 본 명세서에서 인용된 모든 간행물 및 특허는 그 전체가 참조로서 포함된다.
청구범위는 임의의 선택적 요소를 제외하도록 작성될 수 있다는 것 또한 유의한다. 따라서, 이러한 서술은 청구항 요소의 설명과 관련하여 "오로지(solely)", "단지(only)", "제외하는(excluding)", "포함하지 않는(not including)" 등과 같은 배타적인 용어를 사용하거나, "부정적" 한정 또는 이의 단서를 사용하는 것에 대한 선행적 근거로서의 역할을 하기 위한 것이다.
본 개시 내용을 읽을 때 당업자에게 명백해지는 것과 같이, 본 명세서에서 기술되고 예시된 개별적인 구현예 각각은 본 명세서에서 기술된 본 발명의 조성물 및 방법의 범위 또는 사상으로부터 벗어나지 않고도 다른 몇몇 구현예들 중 임의의 구현예의 특징과 쉽게 분리되거나 조합될 수 있는 별개의 구성요소 및 특징을 갖는다. 임의의 언급된 방법은 언급된 사건의 순서로 또는 논리적으로 가능한 임의의 다른 순서로 수행될 수 있다.
본 명세서에서 사용되는 "바실러스 속"은 B. 서브틸리스, B. 리케니포르미스, B. 렌투스(lentus), B. 브레비스(brevis), B. 스테아로서모필루스(stearothermophilus), B. 알칼로필루스(alkalophilus), B. 아밀로리퀘파시엔스, B. 클라우시이(clausii), B. 할로두란스(halodurans), B. 메가테리움(megaterium), B. 코아굴란스(coagulans), B. 써쿨란스(circulans), B. 깁소니이(gibsonii), 및 B. 투링기엔시스(thuringiensis)를 포함하나, 이에 한정되지 않는, 당업자에게 공지된 바와 같은 "바실러스" 속 내의 모든 종을 포함한다. 바실러스 속은 분류학적 재편성을 계속 겪고 있음이 인정된다. 따라서, 이 속은 현재 "지오바실러스 스테아로서모필루스(Geobacillus stearothermophilus)"로 명명된 B. 스테아로서모필루스, 또는 현재 "파에니바실러스 폴리믹사(Paenibacillus polymyxa)"인 B. 폴리믹사와 같은 유기체를 포함하나, 이에 한정되지 않는, 재분류된 종을 포함하는 것으로 본다. 스트레스가 많은 환경적 조건 하에서의 저항성 내생포자의 생성은 바실러스 속의 정의적 특징으로 간주되지만, 이러한 특성은 현재 명명된 알리시클로바실러스(Alicyclobacillus), 암피바실러스(Amphibacillus), 아네우리니바실러스(Aneurinibacillus), 아녹시바실러스(Anoxybacillus), 브레비바실러스(Brevibacillus), 필로바실러스(Filobacillus), 그라실리바실러스(Gracilibacillus), 할로바실러스(Halobacillus), 파에니바실러스(Paenibacillus), 살리바실러스(Salibacillus), 서모바실러스(Thermobacillus), 우레이바실러스(Ureibacillus), 및 비르기바실러스(Virgibacillus)에도 적용된다.
본 명세서에서 사용되는 어구 "비번역 영역"은 "UTR"로 축약될 수 있다.
본 명세서에서 사용되는 어구 "5 프라임 비번역 영역" 또는 "5' 비번역 영역"은 "5'-UTR" 또는 "5' UTR"로 축약될 수 있고, 어구 "3 프라임 비번역 영역" 또는 "3' 비번역 영역"은 "3'-UTR" 또는 "3' UTR"로 축약될 수 있다.
본 명세서에서 사용되는 "야생형" B. 서브틸리스 "aprE 5′ UTR"은 본 명세서에서 "WT-5′ UTR" 서열로 지칭되는 서열번호 1의 뉴클레오티드 서열을 포함한다.
본 명세서에서 사용되는 "변형된" B. 서브틸리스 "aprE 5′ UTR" 또는 "변형된 aprE 5′ UTR"은 상호교환적으로 사용되고, 본 명세서에서 "mod-5′ UTR"으로 축약된다.
본 명세서에서 사용되는 바와 같이, 본 개시의 "mod-5′-UTR"은 mod-5′-UTR이 (i) 서열번호 1의 적어도 제일 3'의 아데닌(A) 뉴클레오티드의 결실 또는 (ii) 서열번호 1의 3' 아데닌(A) 뉴클레오티드 다음의 적어도 하나의 뉴클레오티드의 부가를 포함한다는 점에서 "WT-5′-UTR"(즉, 서열번호 1을 포함하는 WT-5′-UTR)과 차이가 있다.
예를 들어, 제일 3'의 아데닌 뉴클레오티드 위치(예컨대, 서열번호 1 참조)의 결실을 포함하는 mod-5′-UTR은 다음의 명명법 "-1:mod-5′-UTR"을 사용하여 일반적으로 표시될 수 있고, 제일 3'의 뉴클레오티드 중 두 개의 결실(예컨대, 서열번호 1의 아데닌과 구아닌)을 포함하는 mod-5′-UTR은 다음의 명명법 "-2:mod-5′-UTR"을 사용하여 일반적으로 표시될 수 있고, 등 이다.
마찬가지로, 제일 3'의 뉴클레오티드 위치에 뉴클레오티드의 부가(예컨대, 서열번호 1의 아데닌(A)에 대해 3'에 부가된 뉴클레오티드)를 포함하는 mod-5′-UTR은 다음의 명명법 "+1:mod-5′-UTR"을 사용하여 일반적으로 표시될 수 있고, 제일 3'의 뉴클레오티드 위치에 대해 두 개의 뉴클레오티드의 부가(예컨대, 서열번호 1의 아데닌(A)에 대해 3'에 부가된 두 개의 뉴클레오티드)를 포함하는 mod-5′-UTR은 다음의 명명법 "+2:mod-5′-UTR"을 사용하여 일반적으로 표시될 수 있고, 등 이다.
따라서, 본 명세서에서 사용되는 "-1A:mod-5′-UTR"은 서열번호 2의 핵산 서열을 포함한다. WT-5′ UTR 핵산 서열(서열번호 1) 대 -1A:mod-5′-UTR 핵산 서열(서열번호 2)의 비교(예컨대, 도 1 참조)는 -1A:mod-5′-UTR 서열이 WT-5′ UTR 서열과 비교하여 마지막(3') 뉴클레오티드(즉, 아데닌(A))의 결실을 포함함을 보여준다.
본 명세서에서 사용되는 바와 같이, 본 명세서에서 "TIS"로 축약되는 "전사 개시 부위"는 일반적으로 전사가 시작되는 염기 쌍(즉, 개시 부위)을 지칭한다. 통상적으로, 전사 단위의 DNA 서열에서 전사 개시 부위(TIS)는 일반적으로 "+1"로 번호가 매겨진다. 전사 방향(즉, 3'; 하류)으로 연장되는 염기 쌍에는 양의 "(+)" 숫자가 할당되고, 반대 방향(즉, 5'; 상류)으로 연장되는 염기 쌍에는 음의 "(-)" 숫자가 할당된다.
본 명세서에서 사용되는 어구 "번역 개시 부위" 및 "번역 개시 부위 코돈"은 상호교환적으로 사용될 수 있으며, 3개의 뉴클레오티드 번역 개시 부위(tss) 코돈을 지칭한다. 예를 들어, 원핵 생물 "tss 코돈"은 "AUG", "GUG", "UGG" 등을 포함하나 이에 한정되지 않는다. 생물정보학 프로그램/도구는 단백질 암호화 유전자를 검색할 때 대안이 되는(덜 자주 사용되는) 개시 코돈을 확인하기 위하여 쉽게 이용할 수 있다.
본 명세서에서 사용되는 "유전자 변형된 세포", "변형된 세포", "변형된 바실러스 세포", "변형된 세포" 등은 상호교환적으로 사용되며, 변형된 B. 리체니포르미스(딸) 세포가 유래되는 비변형된 바실러스(모) 세포에는 존재하지 않는 적어도 하나의 유전자 변형을 포함하는 재조합 바실러스 세포를 지칭한다.
본 명세서에서 사용되는 용어 "변형", "유전자 변형", "유전자 변경", "유전자 조작" 등은 상호교환적으로 사용되며, 다음을 포함하나 이에 한정되지 않는다: (a) 유전자(또는 이의 개방형 해독틀(ORF))에서 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, 또는 유전자(또는 이의 ORF)의 전사 또는 번역을 위해 요구되는 조절 요소에서 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, (b) 유전자 손상, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자의 하향 조절, (f) 유전자의 상향 조절, (g) 본 명세서에서 개시된 임의의 하나 이상의 핵산 서열 또는 유전자의 특이적 돌연변이 유발 및/또는 (h) 무작위 돌연변이 유발.
본 명세서에서 사용되는 "유전자의 손상", "유전자 손상", "유전자의 불활성화" 및 "유전자 불활성화"는 상호교환적으로 사용되며, 숙주 세포의 기능적 유전자 산물(예컨대, 단백질)의 생산을 실질적으로 방지하는 임의의 유전자 변형을 광의적으로 나타낸다. 예시적인 유전자 손상 방법에는 폴리펩티드 암호화 서열(예컨대, ORF), 프로모터 서열, 인핸서 서열, 또는 또 다른 조절 요소 서열을 포함한, 유전자의 임의의 부분의 전체 또는 부분 결실, 또는 이의 돌연변이 유발이 포함되며, 여기서 돌연변이 유발은 표적 유전자(들)를 손상시키고/불활성화하고 기능적 유전자 산물(즉, 단백질)의 생산을 실질적으로 감소시키거나 방지하는 치환, 삽입, 결실, 역전, 및 이의 임의의 조합 및 변형을 포괄한다.
본 명세서에서 사용되는 용어 유전자 발현의 "하향 조절(down-regulation)" 및 유전자 발현의 "상향 조절(up-regulation)"은 주어진 유전자의 발현을 감소(하향 조절)시키거나 증가(상향 조절)시키는 임의의 방법을 포함한다. 예를 들어, 유전자의 하향 조절은 RNA 유도성 유전자 침묵화, 제어 요소(예컨대, 프로모터, 리보솜 결합 부위(RBS)/샤인-달가노 서열, 비번역 영역(UTR))의 유전자 변형, 코돈 변화 등에 의해 달성될 수 있다.
본 명세서에서 사용되는 "숙주 세포"는 새롭게 도입된 DNA 서열(예컨대, 벡터/DNA 작제물)에 대한 숙주 또는 발현 비히클로서 작용하는 능력을 갖는 세포를 지칭한다. 일부 구현예에서, 본 개시의 숙주 세포는 바실러스 속의 구성원이다.
본 명세서에서 정의되는 용어 "증가된 발현", "강화된 발현", 관심 단백질(POI)의 증가된 발현", "증가된 생산", "POI의 증가된 생산" 등은 비변형 바실러스(모) 세포로부터 유래된 "변형된" 바실러스(딸) 세포를 지칭하며, 이때, "증가"는 비슷한 조건 하에서 배양(성장, 발효)될 때 동일한 POI를 발현/생산하는 "비변형" 바실러스(모) 세포에 대한 것이다.
본 명세서에서 사용되는 용어 "발현"은 본 개시의 핵산 분자로부터 유래된 센스(메신저 RNA, mRNA) 또는 안티센스 RNA의 전사 및 안정적인 축적을 지칭한다. 발현은 mRNA가 폴리펩티드로 번역되는 것을 지칭할 수도 있다. 따라서, 용어 "발현"은 폴리펩티드의 생산에 관여된 임의의 단계를 포함하며, 전사, 전사 후 변형, 번역, 번역 후 변형, 분비 등을 포함하나 이에 한정되지 않는다.
본 명세서에서 정의된 바와 같이, "변형된 세포가 (비변형) 모 세포에 비해 증가된 양의 관심 단백질을 발현/생산한다"와 같은 어구에서 사용되는 바와 같은, 결합된 용어 "발현/생산한다"는, 이 용어("발현/생산한다")가 본 개시의 바실러스(숙주) 세포에서 관심 단백질의 발현 및 생산에 관여하는 임의의 단계를 포함하고자 한 것이다.
본 명세서에서 사용되는 "증가하는" 단백질 생산 또는 "증가된" 단백질 생산은 생산된 단백질(예컨대, 관심 단백질)의 증가된 양을 의미한다. 단백질은 세포 내부에서 생산되거나, 또는 배양 배지 내로 분비(또는 수송)될 수 있다. 특정 구현예에서, 관심 단백질은 배양 배지 내로 생산(분비)된다. 증가된 단백질 생산은, 예를 들어, 비변형 (모) 세포와 비교하여 단백질 또는 (예를 들어, 프로테아제 활성, 아밀라아제 활성, 셀룰라아제 활성, 헤미셀룰라아제 활성 등과 같은) 효소 활성의 최대 수준의 증가, 또는 생산된 총 세포 외 단백질의 최대 수준의 증가로서 검출될 수 있다.
본 명세서에서 사용되는 "핵산"은 뉴클레오티드 서열이나 폴리뉴클레오티드 서열 및 이의 단편 또는 일부를 지칭할 뿐 아니라, 센스 가닥을 나타내거나 안티센스 가닥을 나타내는지와 상관 없이, 이중 가닥이거나 단일 가닥일 수 있는 게놈 또는 합성 기원의 DNA, cDNA, 및 RNA도 지칭한다. 유전 암호의 축퇴로 인해 다수의 뉴클레오티드 서열이 주어진 단백질을 암호화할 수 있다는 것을 이해할 수 있을 것이다. 본 명세서에서 기술된 폴리뉴클레오티드(또는 핵산 분자)는 "유전자", "개방형 해독틀"(ORF), "벡터" 및 "플라스미드"를 포함하는 것이 이해된다.
따라서, 용어 "유전자"는 단백질 암호화 서열의 전부 또는 일부를 포함하는 아미노산의 특정 서열을 암호화하는 폴리뉴클레오티드를 나타내며, 예를 들어 유전자가 발현되는 조건을 결정하는 프로모터 서열과 같은 조절(비전사) DNA 서열이 포함될 수 있다. 유전자의 전사 영역에는 단백질 암호화 서열뿐만 아니라 인트론, 5'-비번역 영역(5'-UTR), 및 3'-비번역 영역(3'-UTR)을 포함하는 비번역 영역(UTR)이 포함될 수 있다.
본 명세서에서 사용되는 용어 "암호화 서열"은 이의 (암호화된) 단백질 산물의 아미노산 서열을 직접 특정하는 뉴클레오티드 서열을 나타낸다. 암호화 서열의 경계는 일반적으로 개방형 해독틀에 의해 결정되는데, 이는 보통 "ATG" 개시 코돈으로 시작된다. 암호화 서열에는 전형적으로 DNA, cDNA, 및 재조합 뉴클레오티드 서열이 포함된다.
본 명세서에서 사용되는 용어 "개방형 해독틀"(이하, "ORF")은 (i) 개시 코돈, (ii) 아미노산을 나타내는 일련의 둘(2개) 이상의 코돈, 및 (iii) 종결 코돈으로 구성되는 연속된(uninterrupted) 해독틀을 포함하는 핵산 또는 핵산 서열(자연 발생이든, 비자연 발생이든, 합성이든 관계 없음)을 의미하며, ORF는 5'에서 3' 방향으로 판독(또는 번역)된다.
본 명세서에서 사용되는 용어 "프로모터"는 암호화 서열 또는 기능성 RNA의 발현을 제어할 수 있는 핵산 서열을 지칭한다. 일반적으로, 암호화 서열은 프로모터 서열에 대하여 3'(하류)에 위치한다. 프로모터는 천연 유전자로부터 그 전체가 유래될 수 있거나, 자연에서 발견되는 상이한 프로모터들로부터 유래되는 상이한 요소들로 구성될 수 있거나, 또는 합성 핵산 절편을 포함할 수 있다. 상이한 프로모터들은 상이한 세포 유형에서의 유전자 또는 상이한 발달 단계에 있는 유전자의 발현을 지시하거나, 상이한 환경 또는 생리적 조건에 응답하여 유전자의 발현을 지시할 수 있음을 당업자는 이해할 것이다. 대부분의 세포 유형에서 대부분의 시점에 유전자가 발현되도록 하는 프로모터는 일반적으로 "구성적 프로모터"로 지칭된다. 또한, 대부분의 경우 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 상이한 길이의 DNA 단편들이 동일한 프로모터 활성을 가질 수 있는 것으로 인식된다. 특정 구현예에서, 본 개시의 프로모터 핵산 서열은 바실러스 세포에서 기능적인 프로모터 서열을 포함하며, 이 프로모터 서열은 저활성, 중활성 또는 고활성 구성적 프로모터, 유도성 프로모터, 탠덤 프로모터, 합성 프로모터, 탠덤 합성 프로모터 등을 포함하나, 이에 한정되지 않는다.
본 명세서에서 사용되는 용어 "작동 가능하게 연결된"은 하나의 기능이 다른 하나에 의해 영향 받도록 하는 단일 핵산 단편 상에서의 핵산 서열들의 결합을 나타낸다. 예를 들어, 프로모터가 암호화 서열(예를 들어, ORF)의 발현에 영향을 줄 수 있는 경우(즉, 해당 암호화 서열이 프로모터의 전사 조절 하에 있을 경우) 프로모터는 해당 암호화 서열과 작동 가능하게 연결된 것이다. 암호화 서열은 센스 또는 안티센스 배향으로 조절 서열에 작동 가능하게 연결될 수 있다.
핵산이 또 다른 핵산 서열과 기능적 관계에 있도록 위치될 때 이 핵산은 "작동 가능하게 연결된" 것이다. 예를 들어, 분비 리더(즉 신호 펩티드, 신호 서열)를 암호화하는 DNA는, 폴리펩티드의 분비에 참여하는 전단백질(pre-protein)로서 발현되는 경우 폴리펩티드에 대한 DNA에 작동 가능하게 연결되거나; 프로모터 또는 인핸서는, 서열의 전사에 영향을 미칠 경우, 암호화 서열에 작동 가능하게 연결되거나; 또는 리보솜 결합 부위는 번역을 촉진하도록 위치되는 경우 암호화 서열에 작동 가능하게 연결된다. 일반적으로 "작동 가능하게 연결된"은 연결되는 DNA 서열들이 인접해 있음을 의미하고, 분비 리더의 경우, 연결되는 DNA 서열들이 인접해 있고 판독 단계(reading phase)에 있음을 의미한다. 그러나 인핸서는 인접해 있을 필요는 없다. 연결은 편리한 제한 부위에서의 라이게이션에 의해 달성된다. 그러한 부위가 존재하지 않는 경우, 합성 올리고뉴클레오티드 어댑터 또는 링커가 통상적인 관례에 따라 사용된다.
예를 들어, 특정 구현예에서, 본 개시의 단리된 폴리뉴클레오티드는 야생형 B. 서브틸리스 aprE 5′-UTR 핵산 서열(즉, WT-5′-UTR; 서열번호 1)로부터 유래된 변형된 aprE 5′-UTR(mod-5′-UTR) 핵산 서열을 포함한다(예컨대, 도 1 참조).
본 명세서에서 사용되는 바와 같이, 관심 유전자의 단백질 암호화 서열에 연결된 관심 유전자(또는 이의 ORF)의 발현을 제어하는 "기능적 프로모터 서열"은, 바실러스 세포에서 암호화 서열의 전사 및 번역을 제어하는 프로모터 서열을 지칭한다. 특정 구현예에서, 사용되는 기능적 프로모터 서열은 자연에서 단리되는 야생형(천연) 유전자와 결합된 바와 같은 천연 프로모터 핵산 서열이다. 다른 구현예에서, 사용되는 기능적 프로모터 서열은 자연에서 단리되는 야생형(천연) 유전자와 결합되지 않는 이종 프로모터 핵산 서열이며, 이때, 이종 프로모터는 구성적 프로모터 또는 유도성 프로모터이다.
본 명세서에서 정의되는 바와 같이, "적합한 조절 서열"은 암호화 서열의 상류(5' 비암호화 서열), 암호화 서열 내, 또는 하류(3' 비암호화 서열)에 위치하고, 결합된 암호화 서열의 전사, RNA 프로세싱이나 안정성, 또는 번역에 영향을 미치는 뉴클레오티드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열, RNA 프로세싱 부위, 이펙터 결합 부위, 및 스템-루프 구조를 포함할 수 있다.
본 명세서에서 정의되는 바와 같이, 적어도 하나의 폴리뉴클레오티드 개방형 해독틀(ORF), 또는 이의 유전자 또는 이의 벡터/DNA 작제물을 "박테리아 세포 내로 도입하는" 또는 "바실러스 세포 내로 도입하는"과 같은 어구에서 사용되는 용어 "도입하는"은 폴리뉴클레오티드를 세포 내로 도입하기 위한 당해 분야에 공지된 방법을 포함하며, 이는 원형질체 융합, 천연 또는 인공 형질전환(예를 들어, 염화칼슘, 전기천공), 형질도입, 형질감염, 접합 등을 포함하나 이에 한정되지 않는다(예컨대, Ferrari et al., 1989 참조).
본 명세서에서 사용되는 바와 같이, "형질전환된"은 세포가 재조합 DNA 기술을 이용하여 형질전환되었음을 의미한다. 형질전환은 일반적으로 하나 이상의 뉴클레오티드 서열(예를 들어, 폴리뉴클레오티드, ORF 또는 유전자)을 세포 내로 삽입함으로써 일어난다. 삽입된 뉴클레오티드 서열은 이종 뉴클레오티드 서열(즉, 형질전환될 세포에서는 자연적으로 발생하지 않는 서열)일 수 있다. 예를 들어, 특정 구현예에서, 모 바실러스 세포는 본 개시의 1개 이상의 DNA 작제물을 모 세포 내로 도입함으로써 변형된다(예컨대, 형질전환된다).
본 명세서에서 사용되는 바와 같이, "형질전환"은 외인성 DNA를 숙주 세포 내로 도입함으로써 DNA가 염색체 통합체 또는 자가 복제성 염색체 외 벡터로서 유지되는 것을 지칭한다.
본 명세서에서 사용되는 바와 같이, "형질전환 DNA", "형질전환 서열" 및 "DNA 작제물"은 서열을 숙주 세포 또는 유기체 내로 도입하는 데 사용되는 DNA를 지칭한다. 형질전환 DNA는 서열을 숙주 세포 또는 유기체 내로 도입하는 데 사용되는 DNA이다. DNA는 PCR 또는 임의의 다른 적절한 기술에 의해 시험관 내에서 생성될 수 있다. 일부 구현예에서, 형질전환 DNA는 유입 서열(incoming sequence)을 포함하는 반면, 다른 바람직한 구현예에서는 상동성 영역(HR)이 측면에 위치하는 유입 서열을 추가로 포함한다. 또 다른 구현예에서, 형질전환 DNA는 말단에 추가된 다른 비상동성 서열(즉, 스터퍼(stuffer) 서열 또는 측면 서열)을 포함한다. 말단은 형질전환 DNA가, 예를 들어, 벡터 내로의 삽입과 같은 폐쇄된 원을 형성하도록 폐쇄될 수 있다.
본 명세서에서 사용되는 바와 같이, 본 명세서에서 개시된 "5′-HR" 또는 "3′-HR"과 같은 "상동성 영역"("HR"로 축약됨)은 바실러스 염색체 내의 서열에 대해 상동성인 핵산 서열을 지칭한다. 더욱 구체적으로, 상동성 영역(HR)은 본 개시에 따라 결실되거나, 손상되거나, 비활성화되거나, 하향 조절될 유전자 또는 유전자의 일부의 바로 측면 암호화 영역과 약 80 내지 100%의 서열 동일성, 약 90 내지 100%의 서열 동일성, 또는 약 95 내지 100%의 서열 동일성을 갖는 상류 또는 하류 영역이다. 이러한 HR 서열은 DNA 작제물이 바실러스 염색체 내의 어디에 통합되는지를 지시하고, 바실러스 염색체의 어느 부분이 유입 서열에 의해 치환되는지를 지시한다. 따라서, 특정 구현예에서, 유입 서열의 양측에는 각 측면에 상동성 영역(HR)이 있다. 다른 구현예에서, 유입 서열 및 HR은 양측의 각 측면에 스터퍼 서열이 있는 단위를 포함한다. 일부 구현예에서 상동성 영역(HR 서열)은 단지 단일측(3' 또는 5')에 존재하지만, 다른 구현예에서는 측면 서열을 갖는 서열의 각 측면에 존재한다. 따라서, 각 상동성 영역의 서열은 바실러스 염색체에서의 서열에 대하여 상동성이다.
본 명세서에서 사용되는 용어 "스터퍼 서열"은 5′-HR 및/또는 3′-HR 상동성 영역이 측면에 있는 임의의 추가 DNA(예컨대, 벡터 서열)를 지칭한다.
따라서, 본 개시를 한정하고자 하는 것은 아니지만, 상동성 영역(HR)은 약 1개의 염기쌍(bp) 내지 200킬로베이스(kb)를 포함할 수 있다. 바람직하게는, 상동성 영역(HR)은 약 1 bp 내지 10.0 kb; 1 bp 내지 5.0 kb; 1 bp 내지 2.5 kb; 1 bp 내지 1.0 kb, 및 0.25 kb 내지 2.5 kb를 포함한다. 상동성 영역은 약 10.0 kb, 5.0 kb, 2.5 kb, 2.0 kb, 1.5 kb, 1.0 kb, 0.5 kb, 0.25 kb 및 0.1 kb를 포함할 수도 있다. 예를 들어, 일부 구현예에서, 선택 마커(예컨대, lysA 유전자, serA 유전자, pyrF 유전자 등)의 5' 및 3' 말단의 측면에는 상동성 영역(5′-HR/3′-HR)이 있으며, 이때, 상동성 영역은 유전자의 암호화 영역의 바로 측면에 있는 핵산 서열을 포함한다.
본 명세서에서 사용되는 용어 "선택 가능한 마커" 및 "선택 마커"는 숙주 세포에서 발현이 가능한 핵산(예컨대, 유전자 또는 ORF)으로서, 선택 가능한 마커 벡터/DNA 작제물을 함유하는 숙주 세포의 선택을 용이하게 하는 핵산을 지칭한다. 따라서, 용어 "선택 가능한 마커"는 숙주 세포가 관심 유입 DNA 작제물을 흡수하였다는 표시를 제공하는 유전자(또는 ORF)를 지칭한다.
본 명세서에서 정의되는 바와 같이, 숙주 세포 "게놈", 박테리아 (숙주) 세포 "게놈", 또는 바실러스 (숙주) 세포 "게놈"은 염색체 유전자 및 염색체 외 유전자를 포함한다.
본 명세서에서 사용되는 용어 "플라스미드", "벡터" 및 "카세트"는 염색체 외 요소를 나타내며, 이는 종종 전형적으로 세포의 중심 대사의 일부가 아니고 대개 원형 이중 가닥 DNA 분자의 형태로 존재하는 유전자를 운반한다. 이러한 요소는 임의의 공급원으로부터 유래되는 단일 가닥 또는 이중 가닥 DNA 또는 RNA의, 선형 또는 원형, 자율 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오티드 서열일 수 있으며, 여기서, 다수의 뉴클레오티드 서열은 선택된 유전자 산물에 대한 DNA 서열 및 프로모터 단편을 적절한 3' 비번역 서열과 함께 세포 내로 도입할 수 있는 독특한 작제물로 연결되거나 재조합되었다.
본 명세서에서 사용되는 용어 "벡터"는 세포에서 복제(증식)될 수 있고 새로운 유전자(또는 ORF 또는 DNA 절편)를 세포 내로 운송할 수 있는 임의의 핵산을 지칭한다. 따라서, 이 용어는 상이한 숙주 세포들 간의 전달을 위해 설계된 핵산 작제물을 지칭한다. 벡터는 바이러스, 박테리오파지, 프로-바이러스, 플라스미드, 파지미드, 트랜스포존, 및 인공 염색체, 예컨대 YAC(효모 인공 염색체), BAC(박테리아 인공 염색체), PLAC(식물 인공 염색체) 등을 포함하는데, 이들은 "에피좀"이다(즉, 자율적으로 복제되거나 숙주 유기체의 염색체 내에 통합될 수 있다).
본 명세서에서 사용되는 용어 "발현 카세트", "DNA 발현 카세트" 및 "발현 벡터"는 표적 세포에서 특정한 핵산의 전사를 가능케 하는 일련의 명시된 핵산 요소를 사용하여 재조합에 의해 또는 합성에 의해 생성된 핵산(DNA) 작제물을 지칭한다(즉, 이들은 위에 기술된 바와 같은, 벡터 또는 벡터 요소이다). 재조합 발현 카세트는 플라스미드, 염색체, 미토콘드리아 DNA, 색소체 DNA, 바이러스, 또는 핵산 단편 내로 포함될 수 있다. 전형적으로, 발현 벡터의 재조합 발현 카세트 부분은, 다른 서열 중에서도, 전사될 핵산 서열 및 프로모터를 포함한다. 일부 구현예에서, DNA 작제물은 표적 세포에서 특정 핵산의 전사를 가능하게 하는 일련의 명시된 핵산 요소를 또한 포함한다.
본 명세서에서 사용되는 "표적화 벡터"는 표적화 벡터가 형질전환시키는 숙주 세포의 염색체 내 영역과 상동성이고 그 영역에서 상동 재조합을 유도할 수 있는 폴리뉴클레오티드 서열을 포함하는 벡터이다. 예를 들어, 표적화 벡터는 상동 재조합을 통하여 숙주 세포의 염색체 내에 돌연변이를 도입하거나 염색체의 돌연변이를 제거하는 데 활용된다. 특정 구현예에서, 이러한 표적화 벡터는 (모) 바실러스 세포의 1개 이상의 유전자를 이의 변형된 바실러스(딸) 세포로 불활성화시키는 데 유용하게 사용된다. 예를 들어, 특정 구현예에서, 표적화 벡터는 바실러스 유전자, 바실러스 프로모터 서열, 바실러스 5′-UTR 서열, 바실러스 3′-UTR 서열 등, 및 이의 조합을 불활성화시키는 데 사용된다. 일부 구현예에서, 표적화 벡터는 예를 들어 말단에 부가된 다른 비상동성 서열(즉, 스터퍼 서열 또는 측면 서열)을 포함한다. 말단은 표적화 벡터가, 예를 들어 벡터 내로의 삽입과 같이, 폐쇄된 원을 형성하도록 폐쇄될 수 있다. 적절한 벡터의 선택 및/또는 작제는 충분히 당업자의 지식 내에 있다.
본 명세서에서 사용되는 용어 "플라스미드"는 클로닝 벡터로서 사용되고, 많은 박테리아 및 일부 진핵 생물에서 염색체 외 자가 복제 유전 요소를 형성하는 원형 이중 가닥(ds) DNA 작제물을 지칭한다. 일부 구현예에서, 플라스미드는 숙주 세포의 게놈 내에 통합되게 된다.
본 명세서에서 사용되는 용어 "관심 단백질" 또는 "POI"는 바실러스 세포, 특히 변형된 바실러스 세포에서 발현되기를 원하는 관심 폴리펩티드를 지칭하며, 이때, POI는 바람직하게는 증가된 수준으로 (즉, "비변형" 바실러스(모) 세포에 비해) 발현된다. 따라서, 본 명세서에서 사용되는 바와 같이, POI는 효소, 기질 결합 단백질, 표면 활성 단백질, 구조 단백질, 수용체 단백질 등일 수 있다. 특정 구현예에서, 본 개시의 변형된 세포는 비변형 바실러스 (모) 세포에 비해, 증가된 양의 이종 관심 단백질 또는 내인성 관심 단백질을 생산한다. 특정 구현예에서, 본 개시의 변형된 세포에 의해 생산된 관심 단백질의 증가된 양은 모 세포에 비해 적어도 0.5%의 증가, 적어도 1.0%의 증가, 적어도 5.0%의 증가, 또는 5.0%보다 더 많은 증가이다. 특정 구현예에서, 증가된 양은 암호화된 POI의 효소 활성, mRNA의 변화, 광학 밀도 측정, 단백질 결합 분석 등에 의해 결정된다.
본 명세서에서 정의되는 바와 같이, "관심 유전자" 또는 "GOI"는 POI를 암호화하는 핵산 서열(예컨대, 폴리뉴클레오티드, 유전자 또는 ORF)을 지칭한다. "관심 단백질"을 암호화하는 "관심 유전자"는 천연 발생적인 유전자, 돌연변이된 유전자 또는 합성 유전자일 수 있다.
본 명세서에서 사용되는 용어 "폴리펩티드" 및 "단백질"은 상호교환 가능하게 사용되며, 펩티드 결합에 의해 연결된 아미노산 잔기를 포함하는 임의의 길이의 중합체를 나타낸다. 아미노산 잔기에 대한 통상적인 1문자 또는 3문자 코드가 본 명세서에서 사용된다. 폴리펩티드는 선형 또는 분지형일 수 있고, 변형된 아미노산을 포함할 수 있으며, 비아미노산이 개재될 수 있다. 폴리펩티드라는 용어는 자연적으로 변형되었거나, 이황화 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화, 또는 임의의 다른 조작 또는 변형, 예컨대, 표지 성분과의 접합과 같은 개입에 의해 변형된 아미노산 중합체를 또한 포함한다. 예를 들어, 아미노산의 하나 이상의 유사체(예컨대, 비천연 아미노산 등을 포함함)뿐만 아니라 당해 분야에 공지된 다른 변형을 포함하는 폴리펩티드도 정의에 포함된다.
특정 구현예에서, 본 개시의 유전자는 상업적으로 관련된 산업용 관심 단백질, 예컨대 효소(예를 들어, 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르보닉 언하이드라아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이사아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 하이드롤라아제, 헤미셀룰라아제, 헥소스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, DN아제, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소스 옥시다아제, 및 이의 조합)를 암호화한다.
본 명세서에서 사용되는 바와 같이, "변이체" 폴리펩티드는, 전형적으로 재조합 DNA 기술에 의한 하나 이상의 아미노산의 치환, 부가, 또는 결실에 의해 모(또는 기준) 폴리펩티드로부터 유래되는 폴리펩티드를 지칭한다. 변이체 폴리펩티드는 적은 수의 아미노산 잔기만큼 모 폴리펩티드와 상이할 수 있으며, 모(기준) 폴리펩티드와의 일차 아미노산 서열 상동성/동일성 수준에 의해 정의될 수 있다.
바람직하게는, 변이체 폴리펩티드는 모(기준) 폴리펩티드 서열과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 심지어 적어도 99%의 아미노산 서열 동일성을 갖는다. 본 명세서에서 사용되는 바와 같이, "변이체" 폴리뉴클레오티드는 변이체 폴리펩티드를 암호화하는 폴리뉴클레오티드를 지칭하며, "변이체 폴리뉴클레오티드"는 모 폴리뉴클레오티드와 명시된 정도의 서열 상동성/동일성을 갖거나, 또는 엄격한 혼성화 조건 하에 모 폴리뉴클레오티드(또는 이의 상보체)와 혼성화된다. 바람직하게는, 변이체 폴리뉴클레오티드는 모(기준) 폴리뉴클레오티드 서열과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 심지어 적어도 99%의 뉴클레오티드 서열 동일성을 갖는다.
본 명세서에서 사용되는 바와 같이, "돌연변이"는 핵산 서열에서의 임의의 변화 또는 변경을 나타낸다. 점 돌연변이, 결실 돌연변이, 침묵 돌연변이, 프레임 시프트 돌연변이, 스플라이싱 돌연변이 등을 포함하는 여러 가지 유형의 돌연변이가 존재한다. 돌연변이는 (예를 들어, 부위 지향적 돌연변이 유발을 통해) 구체적으로 또는 (예를 들어, 화학제, 복구 결핍된 박테리아 균주를 통한 계대를 통해) 무작위로 수행될 수 있다.
본 명세서에서 사용되는 바와 같이, 폴리펩티드 또는 이의 서열의 맥락에서, 용어 "치환"은 하나의 아미노산을 또 다른 아미노산으로 대체하는 것(즉, 치환하는 것)을 의미한다.
본 명세서에서 정의되는 바와 같이, "내인성 유전자"는 유기체의 게놈 내에서 이의 자연적인 위치에 있는 유전자를 지칭한다.
본 명세서에서 정의되는 바와 같이, "이종" 유전자, "비 내인성" 유전자, 또는 "외래" 유전자는 숙주 유기체에서 정상적으로는 발견되지 않지만, 유전자 전달에 의해 숙주 유기체 내로 도입되는 유전자(또는 ORF)를 지칭한다.
본 명세서에서 정의되는 바와 같이, "이종 핵산 작제물" 또는 "이종 핵산 서열"은 이것이 발현되는 세포에 대하여 천연적인 것이 아닌 일부 서열을 갖는다.
용어 "유래된"은 용어 "기인된", "수득된", "수득 가능한" 및 "생성된"을 포함하며, 하나의 명시된 물질 또는 조성물의 기원이 또 다른 명시된 물질 또는 조성물에서 발견되거나, 또 다른 명시된 물질 또는 조성물을 참조하여 기술될 수 있는 특징을 가진다는 것을 일반적으로 나타낸다.
본 명세서에서 사용되는 용어 "상동성"은 상동 폴리뉴클레오티드 또는 폴리펩티드와 관련된다. 둘 이상의 폴리뉴클레오티드 또는 둘 이상의 폴리펩티드가 상동성일 경우, 이는 상동 폴리뉴클레오티드 또는 폴리펩티드가 적어도 60%, 더 바람직하게는 적어도 70%, 한층 더 바람직하게는 적어도 85%, 훨씬 더 바람직하게는 적어도 90%, 더욱 바람직하게는 적어도 95%, 및 가장 바람직하게는 적어도 98%의 "동일성 정도"를 갖는 것을 의미한다. 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 본 명세서에서 정의된 바와 같이 상동성일 정도로 충분히 높은 정도의 동일성을 갖는지는 컴퓨터 프로그램 및 당해 분야에 공지된 기술을 이용하여 두 서열을 정렬시킴으로써 적절하게 조사할 수 있다(예컨대, Smith and Waterman, 1981; Needleman and Wunsch, 1970; Pearson and Lipman, 1988; 위스콘신 유전학 소프트웨어 패키지(제네틱스 컴퓨터 그룹(Genetics Computer Group), 미국 위스콘신 주 매디슨 소재)의 GAP, BESTFIT, FASTA, 및 TFASTA와 같은 프로그램; 및 Devereux et. al., 1984 참조).
본 명세서에서 사용되는 용어 "동일성 백분율(%)"은, 폴리펩티드를 암호화하는 핵산 서열들 또는 폴리펩티드의 아미노산 서열들을 서열 정렬 프로그램을 사용하여 정렬할 때, 이들 사이의 핵산 서열 또는 아미노산 서열의 동일성의 수준을 지칭한다.
본 명세서에서 사용되는 바와 같이, "비생산성(specific productivity)"은 주어진 기간에 걸쳐 시간당 세포당 생산된 단백질의 총량이다.
본 명세서에서 정의되는 용어 "정제된", "단리된" 또는 "풍부화된"은, 생체분자(예를 들어, 폴리펩티드 또는 폴리뉴클레오티드)가 자연에서 이들과 결합되어 있는 자연 발생 구성 성분 중 일부 또는 전부로부터 분리됨으로써 이의 자연 상태로부터 변경되는 것을 의미한다. 이러한 단리 또는 정제는 최종 조성물에서 바람직하지 않은 전체 세포, 세포 잔여물, 불순물, 외부 단백질, 또는 효소를 제거하기 위한 이온 교환 크로마토그래피, 친화성 크로마토그래피, 소수성 분리, 투석, 프로테아제 처리, 황산암모늄 침전 또는 기타 단백질 염 침전, 원심분리, 크기 배제 크로마토그래피, 여과, 미세여과, 겔 전기영동 또는 구배에 의한 분리와 같은 당해 분야에서 인정된 분리 기술에 의해 달성될 수 있다. 그 후, 추가 이득을 제공하는 구성 성분, 예를 들어 활성화제, 항저해제, 바람직한 이온, pH를 제어하기 위한 화합물 또는 기타 효소 또는 화학물질을 정제되거나 단리된 생체분자 조성물에 첨가하는 것이 추가로 가능하다.
본 명세서에서 사용되는 용어 "ComK 폴리펩티드"는, DNA 결합 및 흡수 및 재조합에 관여하는 후기 유능성 유전자(late competence gene)의 발현 활성화와 관련하여, 유능성 발생 이전에 최종 자동 조절 제어 스위치로서 작용하는 전사 인자인 comK 유전자의 산물로서 정의된다(Liu and Zuber, 1998, Hamoen et al., 1998). 본 개시의 특정 구현예에서, 바실러스 세포는 comK 전사 인자를 암호화하는 도입된 플라스미드를 포함한다. 예시적인 comK 핵산 서열 및 폴리펩티드 서열은 서열번호 3 및 서열번호 21에 각각 제시되어 있다.
본 명세서에서 사용되는 바와 같이, "상동 유전자"는 상이한, 그러나 일반적으로 관련된 종으로부터의 유전자 쌍을 나타내며, 이는 서로 대응하고 서로 동일하거나 매우 유사하다. 이 용어는 유전자 복제에 의해 분리된 유전자(예를 들어, 유사(paralogous) 유전자)뿐만 아니라 종분화(speciation)(즉, 새로운 종의 발생)에 의해 분리된 유전자(예를 들어, 이종상동성(orthologous) 유전자)를 포괄한다.
본 명세서에서 사용되는 바와 같이, "오르소로그(orthologue)" 및 "이종상동성 유전자"는 종분화에 의해 공통 조상 유전자(즉, 상동 유전자)로부터 진화된 상이한 종에서의 유전자를 나타낸다. 전형적으로, 오르소로그는 진화 과정 중에 동일한 기능을 유지한다. 오르소로그의 확인은 새롭게 서열 결정된 게놈에서의 유전자 기능의 신뢰 가능한 예측에서 그 용도가 발견된다.
본 명세서에서 사용되는 "파라로그(paralog)" 및 "유사 유전자"는 게놈 내에서의 복제에 의해 연관된 유전자를 나타낸다. 오르소로그는 진화 과정 내내 동일한 기능을 유지하지만, 파라로그에서는, 심지어 일부 기능이 흔히 원래의 것에 연관된다 해도, 새로운 기능이 발달된다. 유사 유전자의 예는 트립신, 키모트립신, 엘라스타아제, 및 트롬빈(이들 전부는 세린 프로테이나아제이며, 동일 종 내에서 함께 나타남)을 암호화하는 유전자를 포함하지만, 이에 한정되는 것은 아니다.
본 명세서에서 사용되는 바와 같이, "유사 서열(analogous sequence)"은 유전자의 기능이 B. 리체니포르미스 세포로부터 유래된 유전자와 본질적으로 동일한 것이다. 또한, 유사 유전자는 바실러스 리체니포르미스 세포의 서열과 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100%의 서열 동일성을 포함한다. 유사 서열은 공지된 서열 정렬 방법에 의해 결정된다. 일반적으로 사용되는 정렬 방법은 BLAST이지만, 서열 정렬에 유용한 다른 방법도 있다.
본 명세서에서 사용되는 용어 "혼성화"는 당해 분야에 공지된 바와 같이, 핵산 가닥이 염기쌍 형성을 통해 상보적 가닥과 결합하는 과정을 지칭한다. 핵산 서열은 두 서열이 중간 정도의 엄격도 내지 고 엄격도의 혼성화 및 세척 조건 하에서 서로에게 특이적으로 혼성화될 경우 기준 핵산 서열에 "선택적으로 혼성화 가능한" 것으로 간주된다. 혼성화 조건은 핵산 결합 복합체 또는 프로브의 용융 온도(Tm)에 기초한다. 예를 들어, "최대 엄격도"는 일반적으로 약 Tm -5℃(프로브의 Tm의 5℃ 아래)에서 발생하고; "고 엄격도"는 Tm의 약 5~10℃ 아래에서 발생하고; "중간 엄격도"는 프로브의 Tm의 약 10~20℃ 아래에서 발생하며; "저 엄격도"는 Tm의 약 20~25℃ 아래에서 발생한다. 기능적으로, 최대 엄격도 조건은 혼성화 프로브와 엄격한 동일성 또는 거의 엄격한 동일성을 갖는 서열을 확인하는 데 사용될 수 있는 반면, 중간 또는 저 엄격도 혼성화는 폴리뉴클레오티드 서열 상동체를 확인하거나 검출하는 데 사용될 수 있다. 중간 정도의 엄격도의 혼성화 조건 및 고 엄격도의 혼성화 조건은 당해 분야에 잘 알려져 있다. 고 엄격도 조건의 예는 약 42℃에서 50%의 포름아미드, 5X SSC, 5X 덴하르트 용액(Denhardt's solution), 0.5%의 SDS 및 100 pg/ml의 변성된 담체 DNA에서의 혼성화에 이어서, 실온(RT)에서 2X SSC 및 0.5%의 SDS 중에서의 2회 세척, 42℃에서의 0.1X SSC 및 0.5%의 SDS 중에서 2회의 추가 세척을 포함한다. 중간 정도의 엄격도 조건의 예는 37℃에서 20%의 포름아미드, 5 x SSC(150 mM NaCl, 15 mM 시트르산삼나트륨), 50 mM의 인산나트륨(pH 7.6), 5 x 덴하르트 용액, 10%의 덱스트란 술페이트 및 20 mg/ml의 변성된 분쇄 연어 정자 DNA를 포함하는 용액에서의 밤새 배양에 이어서, 약 37~50℃에서 1x SSC 중에서의 필터 세척을 포함한다. 당업자라면 프로브 길이 등과 같은 인자를 수용하기 위하여 필요할 경우 온도, 이온 강도 등을 조정하는 방법을 알고 있다.
본 명세서에서 사용되는 바와 같이, "재조합(recombinant)"은 이종 핵산 서열의 도입에 의해 변형되었거나, 그렇게 변형된 세포로부터 세포가 유래되는, 세포 또는 벡터에 대한 참조를 포함한다. 따라서, 예를 들어, 재조합 세포는 세포의 천연(비 재조합) 형태 내에서는 동일한 형태로 발견되지 않는 유전자를 발현하거나, 의도적인 인간의 개입으로 인해, 개입이 없었더라면 비정상적으로 발현되거나 덜 발현되거나 전혀 발현되지 않는, 천연 유전자를 발현한다. "재조합(recombination, recombining)" 또는 "재조합된" 핵산을 생성하는 것은 일반적으로 2개 이상의 핵산 단편을 조립하는 것이며, 조립을 통해 키메라 유전자가 생성된다.
II.
바실러스 숙주 세포에서의 증가된 단백질 생산을 위한 변형된 5′-UTR 서열
본 개시는 일반적으로 단백질 생산 능력 등이 증가된 바실러스 (숙주) 세포(예컨대, 단백질 생산 숙주 세포, 세포 공장)를 생산하고 작제하기 위한 조성물 및 방법에 관한 것이다. 따라서, 본 개시의 특정 구현예는 변형된 B. 서브틸리스 aprE 5'-비번역 영역(mod-5'-UTR) 핵산 서열을 포함하는 단리된 폴리뉴클레오티드, 이의 벡터, 이의 DNA (발현) 작제물, 이의 변형된 바실러스(딸) 세포, 및 이의 제조 방법 및 이용 방법에 관한 것이다.
예를 들어, 메신저 RNA(mRNA) 번역 "개시"는 모든 유기체의 게놈에서 모든 단백질 암호화 유전자의 경우 근본적으로 중요하다는 점은 일반적으로 당해 분야에서 이해된다. 더욱 특별하게는, "신장(elongation)"보다 "개시"가 보통 번역에 있어서 속도 제한 단계이고, mRNA의 5' UTR의 서열에 따라 매우 상이한 효율로 진행된다(Jacques & Dreyfus, 1990). 예를 들어, 원핵생물(즉, 진정세균과 고세균)에서, mRNA의 샤인-달가노(SD) 서열은 번역의 개시자 요소로서 잘 알려져 있다(Shine and Dalgarno, 1974; Shine and Dalgarno, 1975). SD 서열, 전형적으로 "GGAGG"는 개시자 코돈의 대략 10개 뉴클레오티드 상류(5')에 위치한다. SD 서열은 16S rRNA의 3' 말단에서 상보적 서열 "CCUCC"와 쌍을 이룬다. 16S rRNA에서, 상보적 서열(CCUCC)은 3' 끝부분에서 항-SD 서열로 지칭되며, 이의 영역은 단일 가닥이다. SD와 항-SD 서열 사이의 상호 작용(SD 상호 작용)은 개시 코돈 주위에 작은(30S) 리보솜 서브유닛을 고정시켜 "사전 개시 복합체"를 형성함으로써 개시를 늘리는데(Dontsova et al., 1991), 이때, 번역의 효율적인 개시를 위한 SD 상호 작용의 중요성은 진정세균(예컨대, 바실러스 sp.)과 고세균 둘 다에 대해 실험적으로 검증되었다(Jacob et al., 1987).
따라서, 위에서 간단히 언급된 바와 같이, 본 개시의 출원인은 SD 서열(즉, RBS)과 번역 개시 부위 [tss] 코돈(ATG/AUG) 위치 사이의 mRNA 뉴클레오티드 간격(들)과 관련된 놀랍고 예상치 못한 결과를 확인하였다. 임의의 특정 이론, 메커니즘 또는 작용 방식에 구속되기를 바라지 않지만, 출원인은 개시 코돈(ATG/AUG)에 대한 SD 서열(RBS)의 위치를 변화시키는 것이 이러한 서열들이 바실러스 세포에 도입되어 발현될 때 관심 단백질의 생산을 실질적으로 증가시킨다고 생각하고 그 결과를 제시한다.
더욱 특별하게는, 본 개시의 실시예 1은 변형된 5'-비번역 영역(5'-UTR) 핵산 서열의 설계/작제에 관한 것이다. 예를 들어, 야생형 B. 서브틸리스 aprE 5 'UTR 서열(WT-5'-UTR; 서열번호 1) 또는 변형된 5'-UTR 서열(-1A:mod-5′-UTR; 서열번호 2, 도 1 참조)을 포함하는 발현 카세트를 구축하고 이를 모 바실러스 세포에 도입하였는데, 이때 WT-5′-UTR과 -1A:mod-5′-UTR은 상류(5′) 프로모터 및 관심 단백질(즉, α-아밀라아제)을 암호화하는 하류(3′) 개방형 해독틀에 작동 가능하게 연결되었다.
실시예 2에 제시된 바와 같이, WT-5'-UTR을 포함하는 바실러스(딸) 세포 및 -1A:mod-5′-UTR을 포함하는 바실러스(딸) 세포로부터의 상대적인 α-아밀라아제 생산을 표준 방법을 사용하여 측정하였는데, 이때, -1A:mod-5′-UTR 발현 작제물)을 포함하는 딸 세포는 WT-5′ UTR 발현 작제물을 포함하는 딸 세포보다 20% 더 많은 α-아밀라아제를 생산하였다. 더욱 특별하게는, OD550 단위에 기초하여, -1A:mod-5′-UTR 작제물을 포함하는 딸 세포는 WT-5′ UTR 발현 작제물을 포함하는 딸 세포보다 40% 더 많은 α-아밀라아제를 생산하였다(예컨대, 표 1 참조).
따라서, 특정 구현예에서, 본 개시는 변형된 B. 서브틸리스 aprE 5′-비번역 영역(mod-5′-UTR) 핵산 서열을 포함하는 단리된 폴리뉴클레오티드에 관한 것이다. 특정 다른 구현예에서, 본 개시의 변형된 5′-UTR(mod-5′-UTR)은 5'에 있고 변형된 5′-UTR에 작동 가능하게 연결된 상류(5′) 프로모터 영역 핵산 서열 및/또는 3'에 있고 변형된 5′-UTR에 작동 가능하게 연결된 (관심 단백질을 암호화하는) 하류(3') 개방형 해독틀(ORF) 핵산 서열을 더 포함한다.
다른 구현예에서, 본 개시는 5'에서 3' 방향으로 식 (I)을 포함하는 단리된 폴리뉴클레오티드를 대상으로 한다:
(I):
[Pro] [mod-5′-UTR] [ORF]
(식에서, [Pro]는 바실러스 sp. 세포에서 작동 가능한 프로모터 영역 핵산 서열이고, [mod-5′-UTR]은 변형된 B. 서브틸리스 aprE 5′ 비번역 영역(mod-5′-UTR) 핵산 서열이고, [ORF]는 관심 단백질(POI)을 암호화하는 개방형 해독틀 핵산 서열이며, 이때, [Pro], [mod-5′-UTR] 및 [ORF] 핵산 서열은 작동 가능하게 연결됨). 다른 구현예에서, 본 개시는 본 개시의 단리된 폴리뉴클레오티드를 포함하는 벡터 및 DNA 작제물에 관한 것이다.
다른 구현예에서, 본 개시는 이종 관심 단백질(POI)의 생산에 적합한 배지에서 배양될 때 증가된 양의 이종 POI를 생산하는 변형된 바실러스 sp.(딸) 세포에 관한 것으로, 변형된 바실러스 세포는 식 (I)의 핵산 서열을 포함하는 도입된 발현 작제물을 포함하며, 이때, 변형된 바실러스(딸) 세포는 비슷한 조건 하에서 배양될 때 동일한 POI를 생산하는 비변형 바실러스(모) 세포와 비교하여 증가된 양의 이종 POI를 생산한다.
다른 구현예에서, 본 개시는 이러한 mod-5′-UTR 핵산 서열을 포함하는 단리된 폴리뉴클레오티드에 관한 것으로, 이때, 폴리뉴클레오티드는 5'에서 3' 방향으로 및 작동 가능하게 조합된 식 (II)에 제시된 핵산 서열을 포함한다:
(II):
[TIS] [mod-5′ UTR] [tss 코돈]
(식에서, [TIS]는 전사 개시 부위(TIS)이고, [mod-5′-UTR]은 변형된 B. 서브틸리스 aprE 5′-UTR 핵산 서열을 포함하고, [tss 코돈]은 3 뉴클레오티드 번역 개시 부위(tss) 코돈임).
특정한 다른 구현예에서, 본 명세서에 개시된 이러한 "변형된" aprE 5′-UTR(mod-5′-UTR) 핵산 서열은 5'에서 3' 방향으로 및 작동 가능한 조합으로 식 (III)의 핵산 서열을 포함하는 단리된 폴리뉴클레오티드와 관련이 있다:
(III): [5′-HR] [TIS] [mod-5′-UTR] [tss 코돈] [3′-HR]
(식에서, [TIS]는 전사 개시 부위(TIS)이고, [mod-5′-UTR]은 변형된 B. 서브틸리스 aprE 5′-UTR 핵산 서열을 포함하고, [tss 코돈]은 3 뉴클레오티드 번역 개시 부위(tss) 코돈이고, [5′-HR]은 5′-핵산 서열 상동성 영역이고, [3′-HR]은 3′-핵산 서열 상동성 영역이며, 이때, 5′-HR과 3′-HR은 각각 [TIS] 서열의 바로 상류(5') 및 [tss 코돈] 서열의 바로 하류(3')의 게놈(염색체) 영역(좌(locus))에 대해, 도입된 폴리뉴클레오티드 작제물을 상동 재조합에 의한 변형된 바실러스 세포의 게놈 내로 통합시키기에 충분한 상동성을 포함한다).
예를 들어, 특정 구현예에서, 본 개시는 비슷한 조건 하에서 배양될 때 동일한 POI를 생산하는 비변형 바실러스(모) 세포와 비교하여 증가된 양의 내인성 POI를 생산하는 변형된 바실러스(딸) 세포에 관한 것이다. 따라서, 특정 구현예에서, 모 바실러스 sp.는 모 바실러스 세포에 식 (III)의 폴리뉴클레오티드 작제물 등을 도입(예컨대, 형질전환)함으로써 변형되며, 이때, 이로부터 유래된 변형된 (딸) 바실러스 세포는 5′-HR 및 3′-HR에 의해 제공된 바와 같이, 표적화된 (염색체) 게놈 좌로 통합된 변형된 5′ UTR(예컨대, mod-5′ UTR; 서열번호 2)을 포함한다.
본 개시의 또 다른 구현예는 야생형 바실러스 sp. 5′-UTR 서열로부터 유래된 mod-5′-UTR 핵산 서열을 포함하는 단리된 폴리뉴클레오티드에 관한 것으로, 단리된 폴리뉴클레오티드는 5'에서 3' 방향으로 및 작동 가능한 조합으로 식 (IV)의 핵산 서열을 포함한다:
(IV):
[TIS] [5′-UTR - Δ xN ] [tss 코돈]
(식에서, [TIS]는 전사 개시 부위(TIS)이고, [tss 코돈]은 3 뉴클레오티드 번역 개시 부위(tss) 코돈이고, [5′-UTR - ΔxN]은 야생형 바실러스 sp. 5′-UTR 핵산 서열로부터 유래된 변형된 바실러스 sp. 5′-UTR 핵산 서열이며, 이때, mod-5′-UTR 핵산 서열 [5′-UTR - ΔxN]은 야생형 바실러스 sp. 5′-UTR 핵산 서열의 원위(3') 말단에 "x"개 뉴클레오티드("N")의 결실(- Δ)을 포함한다). 예를 들어, 야생형 바실러스 sp. 5′-UTR 핵산 서열의 원위(3') 말단에 단일 뉴클레오티드 결실을 포함하는 mod-5′-UTR 핵산 서열은 "[5′-UTR - Δ 1 N]"로 표시될 수 있고, 야생형 바실러스 sp. 5′-UTR 핵산 서열의 원위(3') 말단에 두 개의 뉴클레오티드가 결실된 것을 포함하는 mod-5′-UTR 핵산 서열은 "[5′-UTR - Δ 2 N]"으로 표시될 수 있고, 등 이다.
마찬가지로, 특정한 다른 구현예에서, 본 개시는 야생형 바실러스 sp. 5′-UTR 서열로부터 유래된 mod-5′-UTR 핵산 서열을 포함하는 단리된 폴리뉴클레오티드에 관한 것으로, 단리된 폴리뉴클레오티드는 5'에서 3' 방향으로 및 작동 가능한 조합으로 식 (V)의 핵산 서열을 포함한다:
(V):
[TIS] [5′-UTR + Δ xN ] [tss 코돈]
(식에서, [TIS]는 전사 개시 부위이고, [tss 코돈]은 3 뉴클레오티드 번역 개시 부위(tss) 코돈이고, [5′-UTR + ΔxN]은 야생형 바실러스 sp. 5′-UTR 핵산 서열로부터 유래된 변형된 바실러스 sp. 5′-UTR 핵산 서열이며, 이때, mod-5′-UTR 핵산 서열 [5′-UTR + ΔxN]은 야생형 바실러스 sp. 5′-UTR 핵산 서열의 원위(3') 말단에 "x"개 뉴클레오티드("N")의 부가( + Δ)를 포함한다). 예를 들어, 야생형 바실러스 sp. 5′-UTR 핵산 서열의 원위(3') 말단에 단일 뉴클레오티드 부가를 포함하는 mod-5′-UTR 핵산 서열은 "[5′-UTR + Δ 1 N]"로 표시될 수 있고, 야생형 바실러스 sp. 5′-UTR 핵산 서열의 원위(3') 말단에 두 개의 부가된 뉴클레오티드를 포함하는 mod-5′-UTR 핵산 서열은 "[5′-UTR + Δ 2 N]"으로 표시될 수 있고, 등 이다.
따라서, 특정 구현예에서, 본 개시의 1개 이상의 단리된 폴리뉴클레오티드는 식 (IV) 또는 (V)에 기재된 바와 같이 작제되며, 이때, mod-5′-UTR은 점진적으로 더 짧은 (3′) 말단(즉, " - ΔxN "이 증가함에 따라) 또는 점진적으로 더 긴 (3′) 말단(" + ΔxN "이 증가함에 따라)을 갖도록 설계/작제된다. 예를 들어, -1 뉴클레오티드 위치의 결실은 (5′-UTR 서열 내에 위치한) 리보솜 결합 부위(RBS)와 번역 개시 부위 코돈(tss 코돈) 사이의 간격의 1 bp 감소를 제공한다(예컨대, 도 1 참조).
따라서, 위에 기술된 바와 같이, 본 개시의 특정 구현예는 비슷한 조건 하에서 배양될 때 동일한 POI를 생산하는 비변형 바실러스(모) 세포와 비교하여 증가된 양의 내인성 또는 이종 POI를 생산하는 이러한 변형된 바실러스(딸) 세포에 관한 것이다. 따라서, 본 개시의 특정한 다른 구현예는 전사 개시 부위(TIS) 서열, 번역 개시 부위(tss) 코돈, 개방형 해독틀(ORF), 5′-UTR, 3′-UTR, 프로모터, 프로모터 영역 등을 포함하나 이에 한정되지 않는, 야생형(천연) 핵산 서열, 변이체 핵산 서열, 변형된 핵산 서열, 이러한 핵산 서열의 분석 및 그 안의 특정한 핵산 서열 특징의 확인에 관한 것이다.
예를 들어, 위에 기술된 "정의" 섹션에 언급된 바와 같이, 전사 개시 부위(TIS)는 전사가 개시되는(즉, 시작 부위) 염기 쌍을 지칭한다. 당업자는 DNA 서열의 시각적 분석에 의해, 더욱 특별하게는 TIS 서열, 프로모터 영역, UTR 등과 같은 다양한 유전자 조절 요소에 대하여 입력 서열(input sequence)(들)을 분석하는 생물정보학 프로그램 및 도구를 사용하여, 특정 유전자(ORF) 서열과 관련된 이러한 TIS 서열을 용이하게 식별할 수 있다. 위에서 이미 정의된 바와 같은 번역 개시 부위(tss)는 3 뉴클레오티드 번역 개시 부위(tss) 코돈을 지칭한다. 예시적인 원핵생물 tss 코돈은 (발생 빈도순으로, 높은 빈도에서 낮은 빈도로) "AUG", "GUG" 및 "UGG"를 포함한다. 예를 들어, 당업자는 (예컨대, 문헌[Haldenwang et al., 1995]의 데이터를 이용하여) 관심 유기체의 공지된 시그마 인자 결합 부위에 대해 동일하거나 거의 동일한 매치에 대한 정규식 검색을 이용하여 프로모터를 확인할 수 있다. 추정 프로모터가 확인되면, 추정 TIS 서열이 할당될 수 있다.
프로모터 등과 같은 핵산 서열 특징을 확인하기 위한 추가 생물정보학 도구에는 PromoterHunter(Klucar et al., 2010), PromPredict(Bansal, 2009), BacPP(de Avila et al., 2011), BPROM (Salamov, 2011) 및 DNA 서열에 대한 다수의 단백질의 결합을 예상하고 각각의 예상 프로모터에 대한 가중 확률 점수를 부여할 수 있는 PRODORIC 도구(Munch et al., 2003)가 포함되나, 이에 한정되지 않는다. 또한, 주어진 유기체로부터 공지된 프로모터로 훈련시켜 프로모터 서열을 효과적으로 예측하도록 딥 러닝 신경망을 훈련시킬 수 있다(Kh et al., PLOSone, Feb 3, 2017). TIS가 확인되면, 5 'UTR은 TIS의 서열 3'(TIS 포함)에서 TSS의 첫 번째 뉴클레오티드까지(TSS의 첫 번째 뉴클레오티드 제외)로 추론할 수 있다. 추정 5 'UTR이 확인되면, 5' UTR의 추가 변형이 본 명세서에 기술된 바와 같이 이루어질 수 있다.
III.
분자 생물학
위에 기술된 바와 같이, 본 개시의 특정 구현예는 모 바실러스 세포로부터 유래된 (재조합) 유전자 변형된 바실러스 세포에 관한 것이다. 특정 구현예에서, 본 개시의 바실러스 세포는 1종 이상의 관심 단백질의 증가된 발현/생산을 위하여 유전자 변형된다. 특정 구현예에서, 본 개시의 바실러스 세포는 본 개시의 mod-5′-UTR을 포함하는 DNA 작제물로부터 관심 단백질을 암호화하는 관심 유전자를 발현하도록 유전자 변형된다. 또 다른 구현예에서, 모 바실러스 세포는 1개 이상의 (내인성) 염색체 유전자를 불활성화시키도록 유전자 변형되고/변형되거나, 불활성인 1개 이상의 (내인성) 염색체 유전자를 회복시키도록 변형된다.
따라서, 본 개시의 특정 구현예는 일반적으로 단백질 생산 능력 등이 증가된 바실러스 숙주 세포(예컨대, 단백질 생산 숙주 세포, 세포 공장)를 생산하고 작제하기 위한 조성물 및 방법에 관한 것이다. 따라서, 본 개시의 특정 구현예는 본 개시의 세포를 유전적으로 변형하는 방법에 관한 것으로, 변형은 (a) 유전자(또는 이의 ORF)에서 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, 또는 유전자 또는 이의 ORF의 전사 또는 번역을 위해 요구되는 조절 요소에서 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, (b) 유전자 손상, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자 하향 조절, (f) 부위 특이적 돌연변이 유발 및/또는 (g) 무작위 돌연변이 유발을 포함한다.
예를 들어, 특정 구현예에서, 본 개시의 변형된 바실러스 세포는 당해 분야에 주지된 방법, 예를 들어 삽입, 손상, 교체, 또는 결실을 이용하여 유전자의 발현을 감소시키거나 제거함으로써 작제된다. 변형 또는 비활성화 대상인 유전자의 부분은, 예를 들어, 암호화 영역이거나 암호화 영역의 발현에 필요한 조절 요소일 수 있다. 이러한 조절 또는 제어 서열의 예는 프로모터 서열 또는 이의 기능적 부분(즉, 핵산 서열의 발현에 영향을 미치기에 충분한 부분)일 수 있다. 변형을 위한 다른 제어 서열은 리더 서열, 프로-펩티드 서열, 신호 서열, 전사 종결자, 전사 활성인자 등을 포함하나 이에 한정되지 않는다.
특정한 다른 구현예에서, 변형된 바실러스 세포는 적어도 하나의 유전자의 발현을 제거하거나 감소시키기 위한 유전자 결실에 의해 작제된다. 유전자 결실 기법은 유전자(들)의 부분 또는 전체 제거를 가능하게 함으로써 이의 발현을 제거하거나, 비 기능적(또는 감소된 활성의) 단백질 산물을 발현시킨다. 이러한 방법에 있어서, 유전자(들)의 결실은 상동성 재조합에 의해, 예컨대 유전자의 측면에 위치하는 5' 및 3' 영역(즉, 5'-HR 및 3'-HR)을 인접하여 함유하도록 작제된 플라스미드/벡터를 사용하여 달성될 수 있다. 인접한 5' 및 3' 영역은 바실러스 세포 내로, 예를 들어, 온도 감수성 플라스미드, 예컨대 pE194 상에서, 플라스미드가 세포에서 확립되도록 허용하는 허용 온도에서 제2 선택 가능한 마커와 연관되어 도입될 수 있다. 그런 다음, 세포를 비 허용 온도로 이동시켜 상동성 측면 영역 중 하나에서 염색체에 통합된 플라스미드를 갖는 세포를 선택한다. 플라스미드의 통합에 대한 선택은 제2 선택 가능한 마커에 대한 선택에 의해 수행된다. 통합 후, 세포를 선택하지 않고 여러 세대 동안 허용 온도로 세포를 이동시킴으로써 제2 상동성 측면 영역에서의 재조합 이벤트가 자극된다. 세포를 플레이팅하여 단일 콜로니를 수득하고, 선택 가능한 마커 둘 다의 상실에 대해 콜로니를 검사한다(예컨대, Perego, 1993 참조). 따라서, 당업자는 전체 또는 부분 결실에 적합한 유전자의 암호화 서열 및/또는 유전자의 비 암호화 서열의 뉴클레오티드 영역을 쉽게 확인할 수 있다.
다른 구현예에서, 본 개시의 변형된 바실러스 세포는 전사 또는 이의 번역에 필요한 유전자 또는 조절 요소에서 하나 이상의 뉴클레오티드를 도입, 치환, 또는 제거함으로써 작제된다. 예를 들어, 뉴클레오티드는 정지 코돈이 도입되거나, 개시 코돈이 제거되거나, 개방형 해독틀이 프레임 시프트되도록 삽입되거나 제거될 수 있다. 이러한 변형은 당해 분야에 공지된 방법에 따라 부위 지향적 돌연변이 유발 또는 PCR에 의해 생성된 돌연변이 유발에 의해 달성될 수 있다(예컨대, Botstein and Shortle, 1985; Lo et al., 1985; Higuchi et al., 1988; Shimada, 1996; Ho et al., 1989; Horton et al., 1989 및 Sarkar and Sommer, 1990 참조). 따라서, 특정 구현예에서, 본 개시의 유전자는 완전 결실이나 부분 결실에 의해 불활성화된다.
또 다른 구현예에서, 변형된 바실러스 세포는 유전자 전환 과정에 의해 작제된다(예컨대, Iglesias and Trautner, 1983 참조). 예를 들어, 유전자 전환 방법에 있어서, 유전자(들)에 상응하는 핵산 서열은 결함 핵산 서열을 생산하도록 시험관 내에서 돌연변이된 다음, 결함 유전자를 생산하기 위한 모 바실러스 세포로 형질전환된다. 상동 재조합에 의해, 결함 핵산 서열은 내인성 유전자를 대체한다. 결함 유전자 또는 유전자 단편이, 결함 유전자를 함유하는 형질전환체의 선택에 사용될 수 있는 마커도 암호화하는 것이 바람직할 수 있다. 예를 들어, 결함 유전자는 선택 가능한 마커와 조합되어 비복제 또는 온도 감수성 플라스미드 상에 도입될 수 있다. 플라스미드의 통합에 대한 선택은 플라스미드 복제를 허용하지 않는 조건 하에서 마커에 대한 선택에 의해 수행된다. 유전자 대체(gene replacement)로 이어지는 제2 재조합 이벤트에 대한 선택은 선택 가능한 마커의 상실 및 돌연변이된 유전자의 획득에 대한 콜로니 검사에 의해 수행된다(Perego, 1993). 대안적으로, 결함 핵산 서열은 아래에 기술된 바와 같이, 유전자의 하나 이상의 뉴클레오티드의 삽입, 치환 또는 결실을 함유할 수 있다.
다른 구현예에서, 변형된 바실러스 세포는 유전자의 핵산 서열에 대해 상보적인 뉴클레오티드 서열을 사용하는 확립된 안티센스 기술에 의해 작제된다(Parish and Stoker, 1997). 더욱 구체적으로, 바실러스 세포에 의한 유전자의 발현은 유전자의 핵산 서열에 대해 상보적이면서 세포 내에서 전사될 수 있고 세포 내에서 생산된 mRNA에 혼성화될 수 있는 뉴클레오티드 서열을 도입함으로써 감소(하향 조절)되거나 제거될 수 있다. 따라서, 상보적인 안티센스 뉴클레오티드 서열이 mRNA에 혼성화될 수 있는 조건 하에서는 번역된 단백질의 양이 감소되거나 제거된다. 이러한 안티센스 방법은 RNA 간섭(RNAi), 소형 간섭 RNA(siRNA), 마이크로RNA(miRNA), 안티센스 올리고뉴클레오티드, Cas9 매개성 유전자 침묵화 등을 포함하나 이에 한정되지 않으며, 이들 모두는 당업자에게 잘 알려져 있다.
다른 구현예에서, 변형된 바실러스 세포는 CRISPR-Cas9 편집을 통해 생산/작제된다. 예를 들어, 관심 단백질을 암호화하는 유전자는 엔도뉴클레아제를 DNA 상의 표적 서열로 모집하는, 가이드 RNA(예컨대, Cas9) 및 Cpf1 또는 가이드 DNA(예컨대, NgAgo)에 결합함으로써 이의 표적 DNA를 찾는, 핵산 가이드된 엔도뉴클레아제에 의해 손상(또는 결실되거나 하향 조절)될 수 있고, 여기서 엔도뉴클레아제는 DNA에서 단일 가닥 또는 이중 가닥 절단을 생성할 수 있다. 이러한 표적화된 DNA 절단은 DNA 복구를 위한 기질이 되고, 제공된 편집 주형과 재조합되어 유전자를 손상시키거나 결실시킬 수 있다. 예를 들어, 핵산 가이드된 엔도뉴클레아제를 암호화하는 유전자(이 목적의 경우, S. 피오게네스(pyogenes)로부터의 Cas9) 또는 Cas9 뉴클레아제를 암호화하는 코돈 최적화된 유전자는 바실러스 세포에서 활성이 있는 프로모터 및 바실러스 세포에서 활성이 있는 종결자에 작동 가능하게 연결됨으로써, 바실러스 Cas9 발현 카세트를 생성한다. 마찬가지로, 관심 유전자에 대해 고유한 하나 이상의 표적 부위가 당업자에 의해 쉽게 확인된다. 예를 들어, 관심 유전자 내의 표적 부위로 유도된 gRNA를 암호화하는 DNA 작제물을 작제하기 위하여, 가변 표적화 도메인(VT)은 (PAM) 프로토-스페이서 인접 모티프의 5'에 있는 표적 부위의 뉴클레오티드, 예컨대, S. 피오게네스 Cas9의 경우 NGG를 포함할 것이며, 이 뉴클레오티드는 S. 피오게네스 Cas9에 대한 Cas9 엔도뉴클레아제 인식 도메인(CER)을 암호화하는 DNA에 융합된다. VT 도메인을 암호화하는 DNA와 CER 도메인을 암호화하는 DNA의 조합에 의해 gRNA를 암호화하는 DNA가 생성된다. 따라서, gRNA를 암호화하는 DNA를 바실러스 세포에서 활성인 프로모터 및 바실러스 세포에서 활성인 종결자에 작동 가능하게 연결함으로써 gRNA에 대한 바실러스 발현 카세트가 생성된다.
특정 구현예에서, 엔도뉴클레아제에 의해 유도된 DNA 절단은 유입 서열로 복구/대체된다. 예를 들어, 위에 기술된 Cas9 발현 카세트 및 gRNA 발현 카세트에 의해 생성된 DNA 절단을 정밀하게 복구하기 위하여, 뉴클레오티드 편집 주형이 제공되어, 세포의 DNA 복구 기작이 편집 주형을 사용할 수 있다. 예를 들어, 표적화된 유전자의 5'에 있는 약 500 bp가 표적화된 유전자의 3'에 있는 약 500 bp에 융합되어 편집 주형을 생성할 수 있고, 이 주형은 바실러스 숙주의 기작에 의해 사용되어 RGEN에 의해 생성된 DNA 절단을 복구한다.
Cas9 발현 카세트, gRNA 발현 카세트 및 편집 주형은 많은 상이한 방법(예컨대, 원형질 융합, 전기 천공, 자연 유능성, 또는 유도된 유능성)을 사용해 세포에 함께 전달될 수 있다. 형질전환된 세포는 표적 유전자의 유전자좌를 증폭시키는 PCR에 의해, 정방향 및 역방향 프라이머로 유전자좌를 증폭시킴으로써 스크리닝된다. 이러한 프라이머는 야생형 유전자좌 또는 RGEN에 의해 편집된 변형된 유전자좌를 증폭시킬 수 있다. 그런 다음, 시퀀싱 프라이머를 사용해 이들 단편을 시퀀싱하여 편집된 콜로니를 확인한다.
또 다른 구현예에서, 변형된 바실러스 세포는 화학적 돌연변이 유발(예컨대, Hopwood, 1970 참조) 및 전위(예컨대, Youngman et al., 1983 참조)를 포함하나 이에 한정되지 않는 당해 분야에 잘 알려진 방법을 이용하여 무작위 또는 특이적 돌연변이 유발에 의해 작제된다. 유전자 변형은, 모 세포에서 돌연변이를 유발시키고 유전자의 발현이 감소되거나 제거된 돌연변이체 세포에 대해 스크리닝함으로써 수행될 수 있다. 특이적이거나 무작위적일 수 있는 돌연변이 유발은, 예를 들어, 적합한 물리적 또는 화학적 돌연변이 유발제를 사용하거나, 적합한 올리고뉴클레오티드를 사용하거나, DNA 서열이 PCR에 의한 돌연변이 유발을 거치게 함으로써 수행될 수 있다. 또한, 돌연변이 유발은 이들 돌연변이화 방법의 임의의 조합을 사용함으로써 수행될 수 있다.
본 목적에 적합한 물리적 또는 화학적 돌연변이 유발제의 예는 자외선(UV) 조사, 하이드록실아민, N-메틸-N'-니트로-N-니트로소구아니딘(MNNG), N-메틸-N'-니트로소구아니딘(NTG), O-메틸 히드록실아민, 아질산, 에틸 메탄 설포네이트(EMS), 아황산수소나트륨, 포름산, 및 뉴클레오티드 유사체를 포함한다. 이러한 제제가 사용될 때, 돌연변이 유발은 일반적으로, 적절한 조건 하에 선택된 돌연변이 유발제가 존재하는 가운데 모 세포를 배양하여 돌연변이를 유발시키고, 유전자의 발현 감소를 나타내거나 유전자를 발현하지 않는 돌연변이체 세포를 선택함으로써 수행된다.
특정한 다른 구현예에서, 변형된 바실러스 세포는 내인성 (염색체) 유전자의 결실을 포함한다. 특정한 다른 구현예에서, 변형된 바실러스 세포는 내인성 (염색체) 유전자의 손상을 포함한다. 다른 구현예에서, 변형된 바실러스 세포는 하향 조절된 내인성 (염색체) 유전자를 포함한다.
국제 공개 제WO2003/083125호는 바실러스 세포를 변형하는 방법, 예컨대, 대장균(E. coli)을 우회하기 위하여 PCR 융합을 사용하여 바실러스 결실 균주 및 DNA 작제물을 생성하는 방법을 개시하고 있다.
국제 공개 제WO2002/14490호는 (1) 통합 플라스미드(pComK)의 작제 및 형질전환, (2) 암호화 서열, 신호 서열 및 프로-펩티드 서열의 무작위 돌연변이 유발, (3) 상동 재조합, (4) 형질전환 DNA에 대한 비 상동성 측면의 부가에 의한 형질전환 효율 증가, (5) 이중 교차(cross-over) 통합의 최적화, (6) 부위 지향적 돌연변이 유발 및 (7) 마커가 없는(marker-less) 결실을 포함하는 바실러스 세포를 변형하는 방법을 개시한다.
당업자는 박테리아 세포(예컨대, E. 콜라이 및 바실러스 spp.) 내로 폴리뉴클레오티드 서열을 도입하는 적합한 방법을 잘 알고 있다(예컨대, Ferrari et al., 1989; Saunders et al., 1984; Hoch et al., 1967; Mann et al., 1986; Holubova, 1985; Chang et al., 1979; Vorobjeva et al., 1980; Smith et al., 1986; Fisher et. al., 1981 및 McDonald, 1984). 실제로, 원형질체 형질전환 및 회합(congression)을 포함하는 형질전환, 형질도입, 및 원형질체 융합과 같은 방법이 알려져 있으며 본 개시에서 사용하기에 적합하다. 형질전환 방법은 본 개시의 DNA 작제물을 숙주 세포 내에 도입하는데 특히 바람직하다.
일반적으로 사용되는 방법 이외에도, 일부 구현예에서, 바실러스 숙주 세포는 직접 형질전환된다(즉, 숙주 세포 내로의 도입 전에 DNA 작제물을 증폭하거나 달리 처리하기 위하여 중간체 세포가 사용되지 않음). 숙주 세포 내로의 DNA 작제물의 도입에는 플라스미드 또는 벡터 내로의 삽입 없이 DNA를 숙주 세포 내에 도입하기 위한 당해 분야에 알려진 물리적 및 화학적 방법이 포함된다. 이러한 방법에는 염화칼슘 침전, 전기 천공, 네이키드 DNA, 리포좀 등이 포함되나 이에 한정되지 않는다. 추가 구현예에서, DNA 작제물은 플라스미드 내로 삽입되지 않고 플라스미드와 함께 공동 형질전환된다. 다른 구현예에서, 선택 마커는 당해 분야에 알려진 방법에 의해 변형된 바실러스 균주로부터 결실되거나 실질적으로 절제된다(예컨대, Stahl et al., 1984 and Palmeros et al., 2000). 일부 구현예에서, 숙주 염색체로부터 벡터를 분해하면 고유(indigenous) 염색체 영역이 제거되면서 측면 영역이 염색체 내에 남는다.
바실러스 세포에서 유전자, 이의 개방형 해독틀(ORF) 및/또는 이의 변이체 서열의 발현에 사용하기 위한 프로모터 및 프로모터 서열 영역은 일반적으로 당업자에게 알려져 있다. 본 개시의 프로모터 서열은 바실러스 세포(예컨대, B. 리체니포르미스 세포)에서 이들이 기능할 수 있도록 일반적으로 선택된다. 바실러스 세포에서 유전자 발현을 유도하는 데 유용한 프로모터는 B. 서브틸리스 알칼리 프로테아제(aprE) 프로모터(Stahl et al., 1984), B. 서브틸리스의 α-아밀라아제 프로모터(Yang et al., 1983), B. 아밀로리퀘파시엔스의 α-아밀라아제 프로모터(Tarkinen et al., 1983), B. 서브틸리스 유래의 중성 프로테아제(nprE) 프로모터(Yang et al., 1984), 돌연변이체 aprE 프로모터(국제 공개 제WO2001/51643호) 또는 B. 서브틸리스, B. 리체니포르미스 또는 기타 관련 바실러스 유래의 임의의 다른 프로모터를 포함하나 이에 한정되지 않는다. 바실러스 세포에서 다양한 활성(프로모터 강도)을 갖는 프로모터 라이브러리를 스크리닝하고 생성하는 방법은 국제 공개 제WO2003/089604호에 기재되어 있다.
IV.
관심 단백질의 생산을 위한 바실러스 세포의 배양
특정 구현예에서 본 개시는 비변형(모) 세포와 비교하여(즉, 상대적으로, 이에 대해) 변형된 바실러스 세포의 단백질 생산성을 증가시키기 위한 방법 및 조성물을 제공한다. 따라서, 특정 구현예에서 본 개시는 변형된 바실러스 세포를 발효/배양하는 단계를 포함하는 관심 단백질(POI)의 생산 방법을 제공하며, 이때, 변형된 세포는 배양 배지 내로 POI를 분비하거나 POI를 세포 내에 유지한다. 당해 분야에 잘 알려진 발효 방법을 적용하여 본 개시의 변형된 및 비변형 바실러스 세포를 발효시킬 수 있다.
예를 들어, 일부 구현예에서, 세포는 회분식 또는 연속 발효 조건 하에서 배양된다. 전통적인 회분식 발효는 배지의 조성이 발효 시작 시 설정되고, 발효 중에는 변경되지 않는 폐쇄 시스템이다. 발효 시작 시, 배지에 요망되는 유기체(들)가 접종된다. 이 방법에서는, 이러한 시스템에 임의의 구성요소를 추가하지 않고도 발효가 일어날 수 있다. 전형적으로, 회분식 발효는 탄소원의 첨가와 관련하여 "회분(batch)”으로서 적합하며, pH 및 산소 농도와 같은 인자를 제어하기 위한 시도가 종종 이루어진다. 회분식 시스템의 대사 산물 및 바이오매스의 조성은 발효가 중단되는 시점까지 지속적으로 변화한다. 전형적인 회분식 배양물 내에서, 세포는 정적 지체기를 지나 고성장 로그기로, 마지막으로는, 성장 속도가 줄어들거나 성장이 멈추는 정지기까지 진행될 수 있다. 처리되지 않는 경우, 정지기에 있는 세포는 결국 사멸한다. 일반적으로, 로그기에 있는 세포가 산물의 생산 벌크를 담당한다.
표준 회분식 시스템을 적절하게 변형시킨 것이 "유가식 발효(fed-batch fermentation)" 시스템이다. 전형적인 회분식 시스템이 변형된 이러한 시스템에서는, 발효가 진행됨에 따라 기질이 증분 첨가된다. 유가식 시스템은 이화대사 억제가 세포의 대사를 저해할 가능성이 있을 때, 그리고 배지 중에 제한된 양의 기질이 있는 것이 바람직한 경우 유용하다. 유가식 시스템에서 실제 기질 농도를 측정하는 것은 어렵기 때문에, pH, 용존 산소 및 폐가스, 예컨대 CO2의 분압과 같은 측정가능한 인자의 변화에 기초하여 추정된다. 회분식 및 유가식 발효는 당해 분야에서 일반적이며 공지되어 있다.
연속식 발효는 규정 발효 배지가 생물 반응기에 연속적으로 첨가되고, 동량의 조정 배지가 프로세싱을 위하여 동시에 제거되는 개방 시스템이다. 연속식 발효는 일반적으로 배양물을 일정한 고밀도로 유지하는데, 이때 세포는 주로 성장의 로그기에 있다. 연속식 발효는 세포 성장 및/또는 산물 농도에 영향을 미치는 하나 이상의 인자의 조절을 허용한다. 예를 들어, 일 구현예에서, 탄소원 또는 질소원과 같은 제한 영양소는 고정된 비율로 유지되고 다른 모든 파라미터는 적정 수준이 되도록 한다. 다른 시스템에서는, 배지 탁도에 의해 측정되는 세포 농도를 일정하게 유지하면서, 성장에 영향을 미치는 다수의 인자를 계속 변경할 수 있다. 연속식 시스템은 정상 상태의 성장 조건을 유지하려고 한다. 따라서, 배지의 배출로 인한 세포 손실은 발효에서 세포 성장 속도와 균형을 이룰 것이다. 연속식 발효 공정을 위한 영양소 및 성장 인자를 조절하는 방법뿐만 아니라, 산물 형성 속도를 최대화하기 위한 기법이 산업 미생물학 분야에 잘 알려져 있다.
따라서, 특정 구현예에서, 형질전환된 (변형된) 숙주 세포에 의해 생산된 POI는 숙주 세포를 원심분리 또는 여과에 의해 배지로부터 분리하는 것, 또는 필요할 경우 세포를 파괴하는 것 및 상청액을 세포 분획 및 잔사로부터 제거하는 것을 포함하는 통상적인 절차에 의해 배양 배지로부터 회수할 수 있다. 전형적으로 청징화 후, 상청액 또는 여과액의 단백질성 성분을 염, 예를 들어 황산암모늄에 의해 침전시킨다. 그 후, 침전된 단백질은 가용성이 되며, 이온 교환 크로마토그래피와 같은 다양한 크로마토그래피 절차 및 겔 여과에 의해 정제될 수 있다.
V.
변형된 (숙주) 세포에 의해 생산된 관심 단백질
본 개시의 관심 단백질(POI)은 임의의 내인성 또는 이종 단백질일 수 있으며, 이는 이러한 POI의 변이체일 수 있다. 단백질은 하나 이상의 이황화 가교를 함유할 수 있거나, 기능적 형태가 단량체 또는 다량체인 단백질이다. 즉, 단백질은 4차 구조를 가지며, 복수의 동일한(상동성) 또는 동일하지 않은(이종) 서브유닛으로 구성되며, 이때, POI 또는 이의 변이체 POI는 바람직하게는 관심 특성을 갖는 것이다.
따라서, 특정 구현예에서, 본 개시의 변형된 세포는 내인성 POI, 이종 POI 또는 이들 중 하나 이상의 조합을 발현한다.
특정 구현예에서, 본 개시의 변형된 바실러스 세포는 (비변형) 모 바실러스 세포와 비교하여 POI의 비생산성(Qp) 증가를 나타낸다. 예를 들어, 비생산성(Qp)의 검출은 단백질 생산을 평가하는 데 적합한 방법이다. 비생산성(Qp)은 다음 식을 사용하여 결정될 수 있다:
"Qp = gP/gDCW·hr"
여기서, "gP"는 탱크에서 생산된 단백질의 그램이고, "gDCW"는 탱크 내 건조 세포 중량(DCW)의 그램이고, "hr"은 접종 시점으로부터의 발효 시간(h)으로서, 이는 생산 시간 및 성장 시간을 포함한다.
따라서, 특정한 다른 구현예에서, 본 개시의 변형된 바실러스 세포는 비변형(모) 세포와 비교하여 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 또는 그 이상의 비생산성(Qp) 증가를 포함한다.
특정 구현예에서, POI 또는 이의 변이체 POI는 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르보닉 언하이드라아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이사아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 하이드롤라아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리가아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소오스 옥시다아제, 및 이의 조합으로 구성된 군으로부터 선택된다.
따라서, 특정 구현예에서, POI 또는 이의 변이체 POI는 효소 위원회(EC) 번호 EC 1, EC 2, EC 3, EC 4, EC 5 또는 EC 6으로부터 선택된 효소이다.
예를 들어, 특정 구현예에서, POI는 EC 1.10.3.2(예컨대, 락카아제), EC 1.10.3.3(예컨대, L-아스코르브산 옥시다아제), EC 1.1.1.1(예컨대, 알코올 탈수소효소), EC 1.11.1.10(예컨대, 염화물 퍼옥시다아제), EC 1.11.1.17(예컨대, 퍼옥시다아제), EC 1.1.1.27(예컨대, L-락트산 탈수소효소), EC 1.1.1.47(예컨대, 글로코오스 1-탈수소효소), EC 1.1.3.X(예컨대, 글로코오스 옥시다아제), EC 1.1.3.10(예컨대, 피라노오스 옥시다아제), EC 1.13.11.X(예컨대, 디옥시게나아제), EC 1.13.11.12(예컨대, 리네올레이트 13S-리폭시게나아제), EC 1.1.3.13(예컨대, 알코올 옥시다아제), EC 1.14.14.1(예컨대, 모노옥시게나아제), EC 1.14.18.1(예컨대, 모노페놀 모노옥시게나아제) EC 1.15.1.1(예컨대, 수퍼옥사이드 디스무타아제), EC 1.1.5.9(이전 EC 1.1.99.10, 예컨대, 글루코스 탈수소효소), EC 1.1.99.18(예컨대, 셀로비오스 탈수소효소), EC 1.1.99.29(예컨대, 피라노오스 탈수소효소), EC 1.2.1.X(예컨대, 지방산 리덕타아제), EC 1.2.1.10(예컨대, 아세트알데히드 탈수소효소), EC 1.5.3.X(예컨대, 프룩토실 아민 리덕타아제), EC 1.8.1.X(예컨대, 이황화물 리덕타아제) 및 EC 1.8.3.2(예컨대, 티올 옥시다아제)로부터 선택된 EC 1(옥시도리덕타아제) 효소를 포함하나 이에 한정되지 않는 옥시도리덕타아제 효소이다.
특정 구현예에서, POI는, EC 2.3.2.13(예컨대, 트랜스글루타미나아제), EC 2.4.1.X(예컨대, 헥소실트랜스퍼라아제), EC 2.4.1.40(예컨대, 알터나수크라아제), EC 2.4.1.18(예컨대, 1,4 알파-글루칸 분지화 효소), EC 2.4.1.19(예컨대, 시클로말토덱스트린 글루카노트랜스퍼라아제), EC 2.4.1.2(예컨대, 덱스트린 덱스트라나아제), EC 2.4.1.20(예컨대, 셀로비오스 포스포릴라아제), EC 2.4.1.25(예컨대, 4-알파-글루카노트랜스퍼라아제), EC 2.4.1.333(예컨대, 1,2-베티-올리고글루칸 포스포 트랜스퍼라아제), EC 2.4.1.4(예컨대, 아밀로수크라아제), EC 2.4.1.5(예컨대, 덱스트란수크라아제), EC 2.4.1.69(예컨대, 갈락토시드 2-알파-L-푸코실 트랜스퍼라아제), EC 2.4.1.9(예컨대, 이눌로수크라아제), EC 2.7.1.17(예컨대, 자일룰로키나제), EC 2.7.7.89(이전 EC 3.1.4.15였음, 예컨대, [글루타민 합성효소]-아데닐-L-티로신 포스포릴라아제), EC 2.7.9.4(예컨대, 알파 글루칸 키나제) 및 EC 2.7.9.5(예컨대, 포스포글루칸 키나제)로부터 선택된 EC 2(트랜스퍼라아제) 효소를 포함하나 이에 한정되지 않는 트랜스퍼라아제 효소이다.
다른 구현예에서 POI는 EC 3.1.X.X(예컨대, 에스테라아제), EC 3.1.1.1(예컨대, 펙티나아제), EC 3.1.1.14(예컨대, 클로로필라아제), EC 3.1.1.20(예컨대, 탄나아제), EC 3.1.1.23(예컨대, 글리세롤-에스테르 아실하이드롤라아제), EC 3.1.1.26(예컨대, 갈락토리파아제), EC 3.1.1.32(예컨대, 포스포리파아제 A1), EC 3.1.1.4(예컨대, 포스포리파아제 A2), EC 3.1.1.6(예컨대, 아세틸에스테라아제), EC 3.1.1.72(예컨대, 아세틸자일란 에스테라아제), EC 3.1.1.73(예컨대, 페룰로일 에스테라아제), EC 3.1.1.74(예컨대, 큐티나아제), EC 3.1.1.86(예컨대, 람노갈락투로난 아세틸에스테라아제), EC 3.1.1.87(예컨대, 푸모신 B1 에스테라아제), EC 3.1.26.5(예컨대, 리보뉴클레아제 P), EC 3.1.3.X(예컨대, 포스포릭 모노에스테르 하이드롤라아제), EC 3.1.30.1(예컨대, 아스퍼질러스 뉴클레아제 S1), EC 3.1.30.2(예컨대, 세라티아 마르세센스(Serratia marcescens) 뉴클레아제), EC 3.1.3.1(예컨대, 알칼리 포스파타아제), EC 3.1.3.2(예컨대, 산 포스파타아제), EC 3.1.3.8(예컨대, 3-피타아제), EC 3.1.4.1(예컨대, 포스포디에스테라아제 I), EC 3.1.4.11(예컨대, 포스포이노시티드 포스포리파아제 C), EC 3.1.4.3(예컨대, 포스포리파아제 C), EC 3.1.4.4(예컨대, 포스포리파아제 D), EC 3.1.6.1(예컨대, 아릴설파타아제), EC 3.1.8.2(예컨대, 디이소프로필-플루오로포스파타아제), EC 3.2.1.10(예컨대, 올리고-1,6-글루코시다아제), EC 3.2.1.101(예컨대, 만난 엔도-1,6-알파-만노시다아제), EC 3.2.1.11(예컨대, 알파-1,6-글루칸-6-글루카노하이드롤라아제), EC 3.2.1.131(예컨대, 자일란 알파-1,2-글루쿠로노시다아제), EC 3.2.1.132(예컨대, 키토산 N-아세틸글루코사미노하이드롤라아제), EC 3.2.1.139(예컨대, 알파-글루쿠로니다아제), EC 3.2.1.14(예컨대, 키티나아제), EC 3.2.1.151(예컨대, 자일로글루칸-특이적 엔도-베타-1,4-글루카나아제), EC 3.2.1.155(예컨대, 자일로글루칸-특이적 엑소-베타-1,4-글루카나아제), EC 3.2.1.164(예컨대, 갈락탄 엔도-1,6-베타-갈락토시다아제), EC 3.2.1.17(예컨대, 리소자임), EC 3.2.1.171(예컨대, 람노갈락투로난 하이드롤라아제), EC 3.2.1.174(예컨대, 람노갈락투로난 람노하이드롤라아제), EC 3.2.1.2(예컨대, 베타-아밀라아제), EC 3.2.1.20(예컨대, 알파-글루코시다아제), EC 3.2.1.22(예컨대, 알파-갈락토시다아제), EC 3.2.1.25(예컨대, 베타-만노시다아제), EC 3.2.1.26(예컨대, 베타-프룩토푸라노시다아제), EC 3.2.1.37(예컨대, 자일란 1,4-베타-자일로시다아제), EC 3.2.1.39(예컨대, 글루칸 엔도-1,3-베타-D-글루코시다아제), EC 3.2.1.40(예컨대, 알파-L-람노시다아제), EC 3.2.1.51(예컨대, 알파-L-푸코시다아제), EC 3.2.1.52(예컨대, 베타-N-아세틸헥소스아미니다아제), EC 3.2.1.55(예컨대, 알파-N-아라비노푸라노시다아제), EC 3.2.1.58(예컨대, 글루칸 1,3-베타-글루코시다아제), EC 3.2.1.59(예컨대, 글루칸 엔도-1,3-알파-글루코시다아제), EC 3.2.1.67(예컨대, 갈락투란 1,4-알파-갈락투로니다아제), EC 3.2.1.68(예컨대, 이소아밀라아제), EC 3.2.1.7(예컨대, 1-베타-D-프룩탄 프룩타노하이드롤라아제), EC 3.2.1.74(예컨대, 글루칸 1,4-β-글루코시다아제), EC 3.2.1.75(예컨대, 글루칸 엔도-1,6-베타-글루코시다아제), EC 3.2.1.77(예컨대, 만난 1,2-(1,3)-알파-만노시다아제), EC 3.2.1.80(예컨대, 프록탄 베타-프룩토시다아제), EC 3.2.1.82(예컨대, 엑소-폴리-알파-갈락투로노시다아제), EC 3.2.1.83(예컨대, 카파-카라기나아제), EC 3.2.1.89(예컨대, 아라비노갈락탄 엔도-1,4-베타-갈락토시다아제), EC 3.2.1.91(예컨대, 셀룰로오스 1,4-베타-셀로비오시다아제), EC 3.2.1.96(예컨대, 만노실-글리코프로테인 엔도-베타-N-아세틸글루코사미니다아제), EC 3.2.1.99(예컨대, 아라비난 엔도-1,5-알파-L-아라비나아제), EC 3.4.X.X(예컨대, 펩티다아제), EC 3.4.11.X(예컨대, 아미노펩티다아제), EC 3.4.11.1(예컨대, 류실 아미노펩티다아제), EC 3.4.11.18(예컨대, 메티오닐 아미노펩티다아제), EC 3.4.13.9(예컨대, Xaa-Pro 디펩티다아제), EC 3.4.14.5(예컨대, 디펩티딜-펩티다아제 IV), EC 3.4.16.X(예컨대, 세린형 카르복시펩티다아제), EC 3.4.16.5(예컨대, 카르복시펩티다아제 C), EC 3.4.19.3(예컨대, 피로글루타밀-펩티다아제 I), EC 3.4.21.X(예컨대, 세린 엔도펩티다아제), EC 3.4.21.1(예컨대, 키모트립신), EC 3.4.21.19(예컨대, 글루타밀 엔도펩티다아제), EC 3.4.21.26(예컨대, 프롤릴 올리고펩티다아제), EC 3.4.21.4(예컨대, 트립신), EC 3.4.21.5(예컨대, 트롬빈), EC 3.4.21.63(예컨대, 오리진), EC 3.4.21.65(예컨대, 서모미콜린), EC 3.4.21.80(예컨대, 스트렙토그리신 A), EC 3.4.22.X(예컨대, 시스테인 엔도펩티다아제), EC 3.4.22.14(예컨대, 액티니데인), EC 3.4.22.2(예컨대, 파파인), EC 3.4.22.3(예컨대, 피카인), EC 3.4.22.32(예컨대, 줄기 브로멜라인), EC 3.4.22.33(예컨대, 열매 브로멜라인), EC 3.4.22.6(예컨대, 키모파파인), EC 3.4.23.1(예컨대, 펩신 A), EC 3.4.23.2(예컨대, 펩신 B), EC 3.4.23.22(예컨대, 엔도티아펩신), EC 3.4.23.23(예컨대, 무코르펩신), EC 3.4.23.3(예컨대, 가스트릭신), EC 3.4.24.X(예컨대, 메탈로엔도펩티다아제), EC 3.4.24.39(예컨대, 듀테롤리신), EC 3.4.24.40(예컨대, 세랄리신), EC 3.5.1.1(예컨대, 아스파라기나아제), EC 3.5.1.11(예컨대, 페니실린 아미다아제), EC 3.5.1.14(예컨대, N-아실-지방족-L-아미노산 아미도하이드롤라아제), EC 3.5.1.2(예컨대, L-글루타민 아미도하이드롤라아제), EC 3.5.1.28(예컨대, N-아세틸무라모일-L-알라닌 아미다아제), EC 3.5.1.4(예컨대, 아미다아제), EC 3.5.1.44(예컨대, 단백질-L-글루타민 아미도하이드롤라아제), EC 3.5.1.5(예컨대, 우레아제), EC 3.5.1.52(예컨대, 펩티드-N(4)-(N-아세틸-베타-글루코사미닐)아스파라긴 아미다아제), EC 3.5.1.81(예컨대, N-아실-D-아미노산 데아실라아제), EC 3.5.4.6(예컨대, AMP 데아미나아제) 및 EC 3.5.5.1(예컨대, 니트릴라아제)로부터 선택된 EC 3(하이드롤라아제) 효소를 포함하나 이에 한정되지 않는 하이드롤라아제이다.
다른 구현예에서, POI는 EC 4.1.2.10(예컨대, 만델로니트릴 리아제), EC 4.1.3.3(예컨대, N-아세틸뉴라미네이트 리아제), EC 4.2.1.1(예컨대, 탄산 탈수효소), EC 4.2.2.- (예컨대, 람노갈락투로난 리아제), EC 4.2.2.10(예컨대, 펙틴 리아제), EC 4.2.2.22(예컨대, 펙테이트 트리사카라이드-리아제), EC 4.2.2.23(예컨대, 람노갈락투로난 엔도리아제) 및 EC 4.2.2.3(예컨대, 만누로네이트-특이적 알기네이트 리아제)로부터 선택된 EC 4(리아제) 효소를 포함하나 이에 한정되지 않는 리아제 효소이다.
특정한 다른 구현예에서, POI는, EC 5.1.3.3(예컨대, 알도오스 1-에피머라아제), EC 5.1.3.30(예컨대, D-사이코스 3-에피머라아제), EC 5.4.99.11(예컨대, 이소말툴로스 신타아제) 및 EC 5.4.99.15(예컨대, (1→4)-α-D-글루칸 1-α-D-글로코실무타아제)로부터 선택된 EC 5(이소머라아제) 효소를 포함하나 이에 한정되지 않는 이소머라아제 효소이다.
또 다른 구현예에서, POI는 EC 6.2.1.12(예컨대, 4-쿠마레이트:코엔자임 A 리가아제) 및 EC 6.3.2.28(예컨대, L-아미노산-알파-리가아제)로부터 선택된 EC 6 (리가아제) 효소를 포함하나 이에 한정되지 않는 리가아제 효소이다.
따라서, 특정 구현예에서, 산업용 프로테아제 생산 바실러스 숙주 세포는 특히 바람직한 발현 숙주를 제공한다. 마찬가지로, 특정한 다른 구현예에서, 산업용 아밀라아제 생산 바실러스 숙주 세포는 특히 바람직한 발현 숙주를 제공한다.
예를 들어, 바실러스 spp.에 의해 일반적으로 분비되는 2가지 일반적인 유형의 프로테아제, 즉 중성(또는 "메탈로프로테아제") 및 알칼리(또는 "세린") 프로테아제가 있다. 예를 들어, 바실러스 서브틸리신 단백질(효소)은 본 개시에 사용하기 위한 예시적인 세린 프로테아제이다. 서브틸리신 168, 서브틸리신 BPN', 서브틸리신 칼스버그, 서브틸리신 DY, 서브틸리신 147 및 서브틸리신 309와 같은 매우 다양한 바실러스 서브틸리신이 확인되었고, 서열 분석되었다(예를 들어, WO 1989/06279 및 Stahl et al., 1984). 본 개시의 일부 구현예에서, 변형된 바실러스 세포는 돌연변이체(즉, 변이체) 프로테아제를 생산한다. 국제 공개 제WO1999/20770호; 제WO1999/20726호; 제WO1999/20769호; 제WO1989/06279호; U.S. RE34,606; 미국 특허 제4,914,031호; 제4,980,288호; 제5,208,158호; 제5,310,675호; 제5,336,611호; 제5,399,283호; 제5,441,882호; 제5,482,849호; 제5,631,217호; 제5,665,587호; 제5,700,676호; 제5,741,694호; 제5,858,757호; 제5,880,080호; 제6,197,567호 및 제6,218,165호와 같은 많은 참조 문헌이 변이체 프로테아제의 예를 제공하고 있다. 따라서, 특정 구현예에서, 본 개시의 변형된 바실러스 세포는 프로테아제를 암호화하는 발현 작제물을 포함한다.
특정한 다른 구현예에서, 본 개시의 변형된 바실러스 세포는 아밀라아제를 암호화하는 발현 작제물을 포함한다. 매우 다양한 아밀라아제 효소 및 이의 변이체가 당업자에게 공지되어 있다. 예를 들어, 국제 공개 제WO2006/037484호 및 제WO 2006/037483호는 용매 안정성이 개선된 변이체 α-아밀라아제를 기술하고, 공개 제WO1994/18314호는 산화 안정성 α-아밀라아제 변이체를 기술하고, 공개 제WO1999/19467호, 제WO2000/29560호 및 제WO2000/60059호는 터마밀 유사 α-아밀라아제 변이체를 기술하고, 공개 제WO2008/112459는 바실러스 종 707번으로부터 유래된 α-아밀라아제 변이체를 기술하고, 공개 제WO1999/43794호는 말토게닉 α-아밀라아제 변이체를 기술하고, 공개 제WO1990/11352호는 초-내열성 α-아밀라아제 변이체를 기술하며, 공개 제WO2006/089107호는 과립 전분 가수분해 활성을 갖는 α-아밀라아제를 기술하고 있다.
다른 구현예에서, 본 개시의 변형된 세포에서 발현되고 생산된 POI 또는 변이체 POI는 펩티드, 펩티드 호르몬, 성장 인자, 응고 인자, 케모카인, 사이토카인, 림포카인, 항체, 수용체, 유착 분자, 미생물 항원(예를 들어, HBV 표면 항원, HPV E7 등), 및 이의 변이체 및 이의 단편 등이다. 다른 유형의 관심 단백질(또는 이의 변이체)은 식품 또는 작물에 영양적 가치를 제공할 수 있는 것일 수 있다. 비제한적인 예는 항-영양성 인자의 형성을 억제할 수 있는 식물성 단백질 및 더 바람직한 아미노산 조성을 갖는 (예를 들어, 비 형질전환 식물보다 리신 함량이 높은) 식물성 단백질을 포함한다.
세포 내 및 세포 외 발현 단백질의 활성을 검출 및 측정하기 위한 다양한 분석법이 당업자에게 공지되어 있다. 특히, 프로테아제의 경우, 폴린법(Folin method)을 사용하여 280 nm에서의 흡광도로 측정하거나 비색법으로 측정한 카제인 또는 헤모글로빈으로부터 산-가용성 펩티드의 방출에 기초한 분석이 있다(예를 들어, Bergmeyer et al., 1984). 다른 분석법은 발색 기질의 가용화를 수반한다(예를 들어, Ward, 1983 참조). 다른 예시적인 분석법은 석시닐-Ala-Ala-Pro-Phe-파라-니트로아닐리드 분석법(SAAPFpNA) 및 2,4,6-트리니트로벤젠 설포네이트 나트륨 염 분석법(TNBS 분석법)을 포함한다. 당업자에게 공지된 많은 추가의 참고 문헌이 적합한 방법을 제공한다(예를 들어, Wells et al., 1983; Christianson et al., 1994 and Hsia et al., 1999 참조).
국제 공개 제WO2014/164777호는 본 명세서에서 기술된 아밀라아제 활성에 유용한 세랄파(Ceralpha) α-아밀라아제 활성 분석법을 개시하고 있다.
숙주 세포에서 관심 단백질의 분비 수준의 결정 수단 및 발현된 단백질의 검출 수단은 단백질에 특이적인 다클론 또는 단클론 항체를 이용한 면역분석법의 사용을 포함한다. 예는 효소 결합 면역흡착 분석법(ELISA), 방사면역분석법(RIA), 형광 면역분석법(FIA), 및 형광 활성화 세포 분류법(FACS)을 포함한다.
실시예
본 발명의 특정 양태는 다음 실시예를 고려하여 추가로 이해될 수 있는데, 다음 실시예는 제한하는 것으로 간주되어서는 안 된다. 재료 및 방법에 대한 변형은 당업자에게 명백할 것이다.
실시예 1
-1A UTR 발현 작제물의 작제 및 아밀라아제 생산의 시험
야생형 B. 서브틸리스 aprE 5′ UTR(서열번호 1) 또는 변형된 5′ UTR(서열번호 2)의 발현 카세트를 생성하여 바실러스 세포에서 관심 단백질을 암호화하는 유전자의 발현에 미치는 변형된 5' 비번역 영역(5′-UTR)의 영향을 시험하였다(예컨대 도 1 참조). 더욱 특별하게는, 본 실시예는 다양한 (변형된) 5′ UTR 작제물의 평가를 위한 바실러스 균주/숙주 세포의 생성 및 이러한 변형된 5′ UTR 작제물이 상류(5′) 프로모터 및 관심 단백질을 암호화하는 하류(3') 개방형 해독틀에 작동 가능하게 연결될 때 관심 단백질의 생산에 미치는 이들의 영향을 기술한다.
본 실시예에서, 자일로스 유도성 comK 암호화 서열(서열번호 3)을 운반하는 플라스미드를 포함하는 모 B. 리체니포르미스 세포를 37℃에서 125 ml의 차단 플라스크 안에 담긴, 100 μg/ml의 스펙티노마이신 중염산염을 함유하는 15 ml의 L 액체 배지(1% (w/v)의 트립톤, 0.5%의 효모 추출물(w/v), 1%의 NaCl(w/v))에서 250 RPM으로 밤새 성장시켰다. 밤새 배양물을 250 ml의 차단 플라스크에 담긴, 100 μg/ml의 스펙티노마이신 중염산염을 함유하는 25 ml의 신선한 L 액체 배지에서 0.7 OD600 단위까지 희석시켰다. 세포를 37℃(250 RMP)에서 1시간 동안 성장시켰다. D-자일로스를 0.1% (w/v)가 될 때까지 50% (w/v) 모액으로부터 첨가하였다. 세포를 37℃(250 RPM)에서 4시간 더 성장시키고, 1700 x g에서 7분 동안 펠릿화하였다.
폐 배지(spent medium)를 사용하여 세포를 1/4 부피의 원 배양물에 재현탁시켰다. 100 μl의 농축된 세포를 대략 1 μg의 야생형(WT) 5′ UTR 발현 작제물(WT-5′ UTR; 서열번호 4) 또는 변형된 5′ UTR 발현 작제물(mod-5′ UTR; 서열번호 5)과 혼합하였다. 예를 들어, 각 발현 카세트는 (5'에서 3' 방향으로) 야생형 B. 서브틸리스 aprE 5′ UTR(서열번호 1) 또는 변형된 aprE 5′ UTR(서열번호 2)에 작동 가능하게 연결된, 동일한 5′ catH 상동성 암(서열번호 6), catH 유전자(서열번호 7) 및 spoVGrrnIp 하이브리드 프로모터(서열번호 8)을 포함하였다. 또한, 서열번호 9의 아밀라아제 신호 서열을 암호화하는 DNA에 이어진, 서열번호 13의 변이체 G. 스테아로서모필루스 α-아밀라아제를 암호화하는 서열번호 10의 DNA(ORF)에 5′ UTR을 작동 가능하게 연결하였다(예컨대, 전체가 참조로서 본 명세서에 포함된 국제 공개 제WO2009/134670 호 참조). 변이체 G. 스테아로서모필루스 α-아밀라아제를 암호화하는 DNA(ORF)(서열번호 10)의 3' 말단을 서열번호 11의 아밀라아제 종결자에 작동 가능하게 연결하였고, 서열번호 11의 아밀라아제 종결자는 3′ catH 상동성 암(서열번호 12)에 작동 가능하게 연결하였다. 형질전환 반응물을 약 90분 동안 37℃에서 1000 RPM으로 배양하였다.
1.5% (w/v) 한천으로 응고시킨 10 μg/ml의 클로람페니콜을 함유하는 L 액체 배지로 채워진 페트리 플레이트 상에 형질전환 혼합물을 플레이팅하였다. 플레이트를 37℃에서 2시간 동안 배양하였다. 1.5% (w/v) 한천으로 응고시킨 1% (w/v) 불용성 옥수수 전분을 함유하는 L 액체 배지로 채워진 페트리 플레이트 상에서 콜로니를 도말 정제하였다. 플레이트는 콜로니가 형성될 때까지 37℃에서 24시간 동안 배양하였다. 전분 가수 분해는 할로를 형성하면서 콜로니를 둘러싸고 있는 불용성 전분을 제거함으로써 나타나는데, 이를 변이체 G. 스테아로서모필루스 α-아밀라아제 단백질(서열번호 13)을 발현하는 형질전환체를 선택하는 데 사용하였다. 일반적인 기술 및 프라이머 쌍: 정방향 프라이머(TGTGTGACGGCTATCATGCC; 서열번호 16)/역방향 프라이머(TTGAGAGCCGGCGTTCC; 서열번호 17)를 이용하여 할로 생산 콜로니로부터 콜로니 PCR을 사용하여 catH 좌(WT 작제물; 서열번호 14)(변형된 작제물, 서열번호 15)를 증폭시켰다. 일반적인 기술을 이용하여 과량의 프라이머 및 뉴클레오티드로부터 PCR 산물을 정제하고, Sanger의 방법 및 다음의 시퀀싱 프라이머를 이용하여 서열을 분석하였다:
AACGAGTTGGAACGGCTTGC; 정방향(서열번호 18),
GGCAACACCTACTCCAGCTT; 정방향(서열번호 19),
GATCACTCCGACATCATCGG; 정방향(서열번호 20).
WT-5′ UTR 발현 카세트(서열번호 4)를 포함하는 서열이 확인된 B. 리체니포르미스(딸) 세포를 딸 세포 BF134로 저장하고, 변형된 5′-UTR (mod-5′ UTR) 발현 카세트(서열번호 5)를 포함하는 서열이 확인된 B. 리체니포르미스 (딸) 세포를 딸 세포 BF117로 저장하였다.
실시예 2
관심 단백질의 생산에 미치는 변형된 5′ UTR의 영향 평가
본 실시예에서, 위의 실시예 1에 기술된 변형된 B. 리체니포르미스 딸 세포(즉, 서열번호 4를 포함하는 딸 세포 BF134 및 서열번호 5를 포함하는 딸 세포 BF117)를 84시간 동안 일반적인 발효 조건 하에서 성장시켰다. 더욱 구체적으로, 일반적인 방법을 사용하여 B. 리체니포르미스 딸 세포 BF134와 BF117의 상대적인 아밀라아제 생산을 측정하고, 이의 결과를 아래 표 1에 기재하였다.
표 1에 제시된 바와 같이, (mod-5′ UTR 발현 작제물; 서열번호 5를 포함하는) BF117 세포는 (WT-5′ UTR 발현 작제물; 서열번호 4를 포함하는) BF134 세포보다 20% 더 많은 아밀라아제를 생산하였다. 더욱 특별하게는, OD550 단위에 기초하여, BF117 세포는 BF134 세포보다 40% 더 많은 아밀라아제를 생산하였다.
참고문헌
국제 공개 제1989/06279호
국제 공개 제1999/20726호
국제 공개 제1999/20769호
국제 공개 제1999/20770호
국제 공개 제2002/14490호
국제 공개 제2003/083125호
국제 공개 제2003/089604호
국제 공개 제2014/164777호
미국 특허 제4,914,031호
미국 특허 제4,980,288호
미국 특허 제5,208,158호
미국 특허 제5,310,675호
미국 특허 제5,336,611호
미국 특허 제5,399,283호
미국 특허 제5,441,882호
미국 특허 제5,482,849호
미국 특허 제5,631,217호
미국 특허 제5,665,587호
미국 특허 제5,700,676호
미국 특허 제5,741,694호
미국 특허 제5,858,757호
미국 특허 제5,880,080호
미국 특허 제6,197,567호
미국 특허 제6,218,165호
미국 특허 출원 공개 제2014/0329309호
U.S. RE 34,606
Bansal, "Relative stability of DNA as a generic criterion for promoter prediction: whole genome annotation of microbial genomes with varying nucleotide base composition", Mol. Biosyst., 5: 1758-1769, 2009.
Bergmeyer et al., "Methods of Enzymatic Analysis" vol. 5, Peptidases, Proteinases and their Inhibitors, Verlag Chemie, Weinheim, 1984.
Botstein and Shortle, Science 229: 4719, 1985.
Brode et al., "Subtilisin BPN' variants: increased hydrolytic activity on surface-bound substrates via decreased surface activity", Biochemistry, 35(10):3162-3169, 1996.
Caspers et al., "Improvement of Sec-dependent secretion of a heterologous model protein in Bacillus subtilis by saturation mutagenesis of the N-domain of the AmyE signal peptide", Appl. Microbiol. Biotechnol., 86(6):1877-1885, 2010.
Chang et al., Mol. Gen. Genet., 168:11-115, 1979.
Christianson et al., Anal. Biochem., 223:119 -129, 1994.
de Avila et al., "BacPP: bacterial promoter prediction - a tool for accurate sigma-factor specific assignment in enterobacteria", J. Theor. Biol., 287, 92-99, 2011.
Devereux et a/., Nucl. Acid Res., 12: 387-395, 1984.
Dontsova et al., "The location of mRNA in the ribosomal 30S initiation complex; site-directed cross-linking of mRNA analogues carrying several photoreactive labels simultaneously on either side of the AUG start codon", EMBO J., 10:2613-2620, 1991.
Earl et al., "Ecology and genomics of Bacillus subtilis", Trends in Microbiology.,16(6):269-275, 2008.
Ferrari et al., "Genetics," in Harwood et al. (ed.), Bacillus, Plenum Publishing Corp., 1989.
Fisher et. al., Arch. Microbiol., 139:213-217, 1981.
Haldenwang et al., Microbiol Reviews 59(1):1-30, 1995.
Hamoen et al., Genes Dev. 12:1539- 1550, 1998.
Higuchi et al., Nucleic Acids Research 16: 7351, 1988.
Ho et al., Gene 77: 61, 1989.
Hoch et al., J. Bacteriol., 93:1925 -1937, 1967.
Holubova, Folia Microbiol., 30:97, 1985.
Hopwood, The Isolation of Mutants in Methods in Microbiology (J. R. Norris and D. W. Ribbons, eds.) pp 363-433, Academic Press, New York, 1970.
Horton et al., Gene 77: 61, 1989.
Hsia et al., Anal Biochem., 242:221-227, 1999.
Iglesias and Trautner, Molecular General Genetics 189: 73-76, 1983.
Jacob et al., "A single base change in the Shine-Dalgarno region of the 16S rRNA of E. coli affects translation of many proteins", PNAS, 84:4757-4761, 1987.
Jacques and Dreyfus, "Translation initiation in E. coli: old and new questions", Mol. Microbiol. 4: 1063-1067, 1990.
Jensen et al., "Cell-associated degradation affects the yield of secreted engineered and heterologous proteins in the Bacillus subtilis expression system" Microbiology, 146 (Pt 10:2583-2594, 2000.
Klucar et al., Nucleic Acids Res. 38:D366-D370, 2010.
Liu and Zuber, 1998,
Lo et al., Proceedings of the National Academy of Sciences USA 81: 2285, 1985.
Mann et al., Current Microbiol., 13:131 -135, 1986.
McDonald, J. Gen. Microbiol., 130:203, 1984.
Munch et al., Nucleic Acids Res., 31(1):266-269, 2003
Needleman and Wunsch, J. Mol. Biol., 48: 443, 1970.
Olempska-Beer et al., “Food-processing enzymes from recombinant microorganisms--a review”’ Regul. Toxicol. Pharmacol., 45(2):144-158, 2006.
Palmeros et al., Gene 247:255 -264, 2000.
Parish and Stoker, FEMS Microbiology Letters 154: 151-157, 1997.
Pearson and Lipman, Proc. Natl. Acad. Sci. USA 85: 2444, 1988.
Perego, 1993, In A. L. Sonneshein, J. A. Hoch, and R. Losick, editors, Bacillus subtilis and Other Gram-Positive Bacteria, Chapter 42, American Society of Microbiology, Washington, D.C.
Raul et al., “Production and partial purification of alpha amylase from Bacillus subtilis (MTCC 121) using solid state fermentation”, Biochemistry Research International, 2014.
Salamov, "Automatic annotation of microbial genomes and metagenomic sequences", In: Li RW (ed), Metagenomics and its applications in agriculture, biomedicine and environmental studies . Nova Science Publishers, Hauppauge, NY, pp. 61-78, 2011.
Sarkar and Sommer, BioTechniques 8: 404, 1990.
Saunders et al., J. Bacteriol., 157:718-726, 1984.
Shimada, Meth. Mol. Biol. 57: 157; 1996
Shine and Dalgarno, "Determinant of cistron specificity in bacterial ribosomes", Nature, 254: 34-38, 1975.
Shine and Dalgarno, "The 3’-terminal sequence of E. coli 16s ribosomal RNA: complementary to nonsense triplets and ribosome binding sites", PNAS, 71: 1342-1346, 1974.
Smith and Waterman, Adv. Appl. Math., 2: 482, 1981.
Smith et al., Appl. Env. Microbiol., 51 :634 1986.
Stahl and Ferrari, J. Bacteriol., 158:411-418, 1984.
Stahl et al, J. Bacteriol., 158 :411-418, 1984.
Tarkinen, et al, J. Biol. Chem. 258: 1007-1013, 1983.
Van Dijl and Hecker, "Bacillus subtilis: from soil bacterium to super-secreting cell factory", Microbial Cell Factories, 12(3). 2013.
Vorobjeva et al., FEMS Microbiol. Lett., 7:261-263, 1980.
Ward, "Proteinases," in Fogarty (ed.)., Microbial Enzymes and Biotechnology. Applied Science, London, pp 251-317, 1983.
Wells et al., Nucleic Acids Res. 11 :7911-7925, 1983.
Westers et al., "Bacillus subtilis as cell factory for pharmaceutical proteins: a biotechnological approach to optimize the host organism", Biochimica et Biophysica Acta., 1694:299-310, 2004.
Yang et al, J. Bacteriol.,160: 15-21, 1984.
Yang et al., Nucleic Acids Res. 11: 237-249, 1983.
Youngman et al., Proc. Natl. Acad. Sci. USA 80: 2305-2309, 1983.
<110> DANISCO US, Inc.
De Lange, Dennis
Frisch, Ryan L.
Masson, Helen Olivia
<120> Modified 5'-Untranslated Region (UTR) Sequences For Increased
Protein Production in Bacillus Cells
<130> NB41250-WO-PCT
<150> US 62/558304
<151> 2017-09-13
<160> 21
<170> PatentIn version 3.5
<210> 1
<211> 58
<212> DNA
<213> Bacillus subtilis
<400> 1
acagaatagt cttttaagta agtctactct gaattttttt aaaaggagag ggtaaaga 58
<210> 2
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Modified 5'-UTR
<400> 2
acagaatagt cttttaagta agtctactct gaattttttt aaaaggagag ggtaaag 57
<210> 3
<211> 579
<212> DNA
<213> Artificial Sequence
<220>
<223> comK
<400> 3
atgagcacag aggatatgac aaaggatacg tatgaagtaa acagttcgac aatggctgtc 60
ctgcctctgg gtgaggggga gaaatccgcc tcaaaaatac ttgagaccga caggactttc 120
cgcgtcaata tgaagccgtt tcaaattatc gaaagaagct gccgctattt cggatcgagc 180
tatgcgggaa gaaaagcggg cacatatgaa gtcattaaag tttcccataa accgccgatc 240
atggtggatc actcaaacaa catttttctt ttccccacat tttcctcaac tcgtcctcag 300
tgcgggtggc tttcccatgc gcatgttcac gagttttgcg cggcaaagta tgacaacacg 360
tttgtcacgt ttgtcaacgg ggaaacgctg gagctgcccg tatccatctc atctttcgaa 420
aaccaggttt accgaacggc atggctgaga acaaaattta tcgacaggat tgaaggaaac 480
cccatgcaga agaaacagga atttatgctc tatccgaaag aagaccggaa tcagctgata 540
tacgaattca tcctcaggga gctgaaaaag cgctattga 579
<210> 4
<211> 6208
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic WT-5'-UTR construct
<400> 4
ggctatgacg aaacgattgc agcctatgag gcgagtctcg aaaagctcgg acttgactac 60
cttgatttat acctgatcca ctggcctgtt gaaggacgct acaaagcggc gtggaaagcg 120
cttgaaacac tttatgaaca aggacgcgta aaagcaatcg gagtgagcaa ttttcagatt 180
caccatctgg aagacttgct gaaagatgcc gccgtcaaac cggcgatcaa ccaggttgag 240
tatcatccgc ggctgacgca gaaagagctg caagcgtttt gccgtgcgca cggcatccag 300
ctgcaagcat ggtcgccgct gatgcaaggc caattgctca gccatccact gctgaaagat 360
atcgcggaca agtacggcaa gacaccggcc caagtcattt tgcgctggga tttgcaaaac 420
ggggtcgtta cgattccgaa gtcgactaaa gcggagcgga ttgcccaaaa cgcggacata 480
tttgattttg aactgaccac cgaggaaatg aagcaaattg acgcgctgaa tgaaaacacc 540
cgtgtcggcc ctgatcccga taactttgac ttttaacaaa acggccccgt tcgacattcg 600
aacggggctt taattgaatt gtgcggttac accgccggac tccatcatca tcagttcttt 660
tttcatatcc aatccgcccc ggtatcccgt gagctgcccg cttttaccga taacccgatg 720
gcaaggcacc accattaaca gcggatttgc gccgatcgcc gcgcctactg cccgcacagc 780
ggcctgcttt tcaatatgct cggcgatatc ggaataggag caagtgctgc cgtaagggat 840
ttcggagagc gccttccaca ctgccagctg aaaaggcgtg ccggcaaggt cgacaggaaa 900
gctgaaatga gttcgcttgc cgttcaaata cgcctgcagc tgctcggcgt attctgccaa 960
tcctttgtca tcccgaatga aaactggctg tgtaaatctt ttttcagccc aagcggccaa 1020
atcctcgaag ccttgattcc atccccctgt aaaacagagc ccgcgggcag tcgccccaat 1080
gtgaatctgc caacctcggc aaataagcgt acgccagtat acgatttgat cgtccatatg 1140
tttacctccg tttcatttgc cggtacgacg tcggcgattg cccagtcttc tttttaaaca 1200
aagaggcaaa atattccgca ttcgcaatgc ctaccattga agcgatttct gcgatcgatc 1260
gttctgaatg agcaagcaaa tcgaccgctt tctcaatcct tttctgcagg atgtattctg 1320
ccggcgagac gcctttgatt cgtttaaatg tccgctgcag gtgaaaaggg ctgatatggc 1380
acctgtcagc caaagcttgc agagacagcg gatcgcgata agattcctcg atgatttcca 1440
ccacacgctg tgccagctct tcatccggca gcagcgcccc ggccggattg cagcgtttgc 1500
aggggcggta cccttctgat aaagcatctt ttgcattgaa aaagatctgc acattgtcga 1560
tttgcggaac tctcgatttg caggaagggc ggcaaaatat gccggtcgtt ttgaccgcgt 1620
aataaaaaac tccgtcatag gcggaatcgt tttccgtaat cgcccgccac atttcaggcg 1680
tcaatcgtga tttgctgttc atatcttcac cccgatctat gtcagtataa cctatatgac 1740
agccggaggt ggagaggcgg agaacggcac agcaagaaga caaagaagaa gagagactgt 1800
tgcctggacc tccgaaacgc gctacaattc atttacaaca caggatgggg tgagaatatt 1860
gccggaatca gtgaagcagg cctcctaaaa taaaaatcta tattttagga ggtaaaacat 1920
gaattttcaa acaatcgagc ttgacacatg gtatagaaaa tcttattttg accattacat 1980
gaaggaagcg aaatgttctt tcagcatcac ggcaaacgtc aatgtgacaa atttgctcgc 2040
cgtgctcaag aaaaagaagc tcaagctgta tccggctttt atttatatcg tatcaagggt 2100
cattcattcg cgccctgagt ttagaacaac gtttgatgac aaaggacagc tgggttattg 2160
ggaacaaatg catccgtgct atgcgatttt tcatcaggac gaccaaacgt tttccgccct 2220
ctggacggaa tactcagacg atttttcgca gttttatcat caatatcttc tggacgccga 2280
gcgctttgga gacaaaaggg gcctttgggc taagccggac atcccgccca atacgttttc 2340
agtttcttct attccatggg tgcgcttttc aaacttcaat ttaaaccttg ataacagcga 2400
acacttgctg ccgattatta caaacgggaa atacttttca gaaggcaggg aaacattttt 2460
gcccgtttcc ttgcaagttc accatgcagt gtgtgacggc tatcatgccg gcgcttttat 2520
aaacgagttg gaacggcttg ccgccgattg tgaggagtgg cttgtgtgac agaggaaagg 2580
ccgatatgat tcggcctttt ttatatgtac ttcttagcgg gtctcttaac ccccctcgag 2640
gtcgctgata aacagctgac atcaatatcc tattttttca aaaaatattt taaaaagttg 2700
ttgacttaaa agaagctaaa tgttatagta ataaaacaga atagtctttt aagtaagtct 2760
actctgaatt tttttaaaag gagagggtaa agaatgaaac aacaaaaacg gctttacgcc 2820
cgattgctga cgctgttatt tgcgctcatc ttcttgctgc ctcattctgc agctagcgca 2880
gccgcaccgt ttaacggtac catgatgcag tattttgaat ggtacttgcc ggatgatggc 2940
acgttatgga ccaaagtggc caatgaagcc aacaacttat ccagccttgg catcaccgct 3000
ctttggctgc cgcccgctta caaaggaaca agccgcagcg acgtagggta cggagtatac 3060
gacttgtatg acctcggcga attcaatcaa aaagggaccg tccgcacaaa atatggaaca 3120
aaagctcaat atcttcaagc cattcaagcc gcccacgccg ctggaatgca agtgtacgcc 3180
gatgtcgtgt tcgaccataa aggcggcgct gacggcacgg aatgggtgga cgccgtcgaa 3240
gtcaatccgt ccgaccgcaa ccaagaaatc tcgggcacct atcaaatcca agcatggacg 3300
aaatttgatt ttcccgggcg gggcaacacc tactccagct ttaagtggcg ctggtaccat 3360
tttgacggcg ttgattggga cgaaagccga aaattaagcc gcatttacaa attcaggggc 3420
atcggcaaag cgtgggattg gccggtagac acagaaaacg gaaactatga ctacttaatg 3480
tatgccgacc ttgatatgga tcatcccgaa gtcgtgaccg agctgaaaaa ctgggggaaa 3540
tggtatgtca acacaacgaa cattgatggg ttccggcttg atgccgtcaa gcatattaag 3600
ttcagttttt ttcctgattg gttgtcgtat gtgcgttctc agactggcaa gccgctattt 3660
accgtcgggg aatattggag ctatgacatc aacaagttgc acaattacat tacgaaaaca 3720
aacggaacga tgtctttgtt tgatgccccg ttacacaaca aattttatac cgcttccaaa 3780
tcagggggcg catttgatat gcgcacgtta atgaccaata ctctcatgaa agatcaaccg 3840
acattggccg tcaccttcgt tgataatcat gacaccgaac ccggccaagc gcttcagtca 3900
tgggtcgacc catggttcaa accgttggct tacgccttta ttctaactcg gcaggaagga 3960
tacccgtgcg tcttttatgg tgactattat ggcattccac aatataacat tccttcgctg 4020
aaaagcaaaa tcgatccgct cctcatcgcg cgcagggatt atgcttacgg aacgcaacat 4080
gattatcttg atcactccga catcatcggg tggacaaggg aaggggtcac tgaaaaacca 4140
ggatccgggc tggccgcact gatcaccgat gggccgggag gaagcaaatg gatgtacgtt 4200
ggcaaacaac acgctggaaa agtgttctat gaccttaccg gcaaccggag tgacaccgtc 4260
accatcaaca gtgatggatg gggggaattc aaagtcaatg gcggttcggt ttcggtttgg 4320
gttcctagaa aaacgaccta aaagcttctc gaggttaaca gaggacggat ttcctgaagg 4380
aaatccgttt ttttattttt aacatctctc actgctgtgt gattttactc acggcatttg 4440
gaacgccggc tctcaacaaa ctttctgtag tgaaaatcat gaaccaaacg gatcgtcggc 4500
ctgattaaca gctgaaagct gccgatcaca aacatccata gtcccgccgg cttcagttcc 4560
tcggagaaaa agcagaagct cccgacaagg aataaaaggc cgatgagaaa atcgtttaat 4620
gtatgtagaa ctttgtatct ttttttgaaa aagagttcat atcgattgtt attgttttgc 4680
ggcattgctt gatcactcca atccttttat ttaccctgcc ggaagccgga gtgaaacgcc 4740
ggtatacata ggatttatga attaggaaaa catatgggga aataaaccat ccaggagtga 4800
aaaatatgcg gttattcata tgtgcatcgt gcctgttcgg cttgattgtt ccgtcatttg 4860
aaacgaaagc gctgacgttt gaagaattgc cggttaaaca agcttcaaaa caatgggaag 4920
ttcaaatcgg taaagccgaa gccggaaacg gaatggcgaa accggaaaaa ggagcgtttc 4980
atacttatgc tgtcgaaatc aaaaacattg gacacgatgt ggcttcggcg gaaatttttg 5040
tctatcggaa cgagcctaat tcttcaacga aattttcgct ttggaacatt cctcacgaaa 5100
atccggtttc tttagccaaa agcttaaatc acggaagctc tgtcaagcac cgcaatctgc 5160
ttatggcaga gaatgcgacc gaattggaag tggacatgat ttggacggaa aaaggaagcg 5220
aaggcagact tttaaaggaa acgttcattt tcaagggaga tgaatcatga agaaaaaatg 5280
gccgttcatc gtcaacggtc tttttttaat gacttaggca gccgatcgtt cggccatacg 5340
atatcgaagc gacctcgaac cagcagagct cgtcacaaaa catttgcatt taaagaaaaa 5400
tacaggatgt tttcaccaat atttttctca atgatgatac actattgaca agctgctact 5460
ttgggagggt gtttccatag atgccgatga agcaaaaaca ccaaatgtgt catgagagct 5520
ctctctaatc gatataaaag tagggtgaac cggggttgtc aatctgtaaa agatcttttt 5580
ttatcccgtg atacgctttt ggaattctga atcttcaaga aagtccccag ccttttgctg 5640
atcaatcgag aacaaaggat gatacatatg aaaagaatag ataaaatcta ccatcagctg 5700
ctggataatt ttcgcgaaaa gaatatcaat cagcttttaa agatacaagg gaattcggct 5760
aaagaaatcg ccgggcagct gcaaatggag cgttccaatg tcagctttga attaaacaat 5820
ctggttcggg ccaaaaaggt gatcaagatt aaaacgttcc ccgtccgcta catcccggtg 5880
gaaattgttg aaaacgtctt gaacatcaaa tggaattcag agttgatgga ggttgaagaa 5940
ctgaggcggc tggctgacgg ccaaaaaaag ccggcgcgca atatatccgc cgatcccctc 6000
gagctcatga tcggggctaa agggagcttg aaaaaggcaa tttctcaggc gaaagcggca 6060
gtcttttatc ctccgcacgg cttgcatatg ctgctgctcg ggccgacggg ttcggggaaa 6120
tcgctgtttg cgaatcggat ctaccagttc gccgtttatt ctgacatatt gaagcccgat 6180
tccccgttca tcacattcaa ctgtgcag 6208
<210> 5
<211> 6207
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic mod-5-UTR construct
<400> 5
ggctatgacg aaacgattgc agcctatgag gcgagtctcg aaaagctcgg acttgactac 60
cttgatttat acctgatcca ctggcctgtt gaaggacgct acaaagcggc gtggaaagcg 120
cttgaaacac tttatgaaca aggacgcgta aaagcaatcg gagtgagcaa ttttcagatt 180
caccatctgg aagacttgct gaaagatgcc gccgtcaaac cggcgatcaa ccaggttgag 240
tatcatccgc ggctgacgca gaaagagctg caagcgtttt gccgtgcgca cggcatccag 300
ctgcaagcat ggtcgccgct gatgcaaggc caattgctca gccatccact gctgaaagat 360
atcgcggaca agtacggcaa gacaccggcc caagtcattt tgcgctggga tttgcaaaac 420
ggggtcgtta cgattccgaa gtcgactaaa gcggagcgga ttgcccaaaa cgcggacata 480
tttgattttg aactgaccac cgaggaaatg aagcaaattg acgcgctgaa tgaaaacacc 540
cgtgtcggcc ctgatcccga taactttgac ttttaacaaa acggccccgt tcgacattcg 600
aacggggctt taattgaatt gtgcggttac accgccggac tccatcatca tcagttcttt 660
tttcatatcc aatccgcccc ggtatcccgt gagctgcccg cttttaccga taacccgatg 720
gcaaggcacc accattaaca gcggatttgc gccgatcgcc gcgcctactg cccgcacagc 780
ggcctgcttt tcaatatgct cggcgatatc ggaataggag caagtgctgc cgtaagggat 840
ttcggagagc gccttccaca ctgccagctg aaaaggcgtg ccggcaaggt cgacaggaaa 900
gctgaaatga gttcgcttgc cgttcaaata cgcctgcagc tgctcggcgt attctgccaa 960
tcctttgtca tcccgaatga aaactggctg tgtaaatctt ttttcagccc aagcggccaa 1020
atcctcgaag ccttgattcc atccccctgt aaaacagagc ccgcgggcag tcgccccaat 1080
gtgaatctgc caacctcggc aaataagcgt acgccagtat acgatttgat cgtccatatg 1140
tttacctccg tttcatttgc cggtacgacg tcggcgattg cccagtcttc tttttaaaca 1200
aagaggcaaa atattccgca ttcgcaatgc ctaccattga agcgatttct gcgatcgatc 1260
gttctgaatg agcaagcaaa tcgaccgctt tctcaatcct tttctgcagg atgtattctg 1320
ccggcgagac gcctttgatt cgtttaaatg tccgctgcag gtgaaaaggg ctgatatggc 1380
acctgtcagc caaagcttgc agagacagcg gatcgcgata agattcctcg atgatttcca 1440
ccacacgctg tgccagctct tcatccggca gcagcgcccc ggccggattg cagcgtttgc 1500
aggggcggta cccttctgat aaagcatctt ttgcattgaa aaagatctgc acattgtcga 1560
tttgcggaac tctcgatttg caggaagggc ggcaaaatat gccggtcgtt ttgaccgcgt 1620
aataaaaaac tccgtcatag gcggaatcgt tttccgtaat cgcccgccac atttcaggcg 1680
tcaatcgtga tttgctgttc atatcttcac cccgatctat gtcagtataa cctatatgac 1740
agccggaggt ggagaggcgg agaacggcac agcaagaaga caaagaagaa gagagactgt 1800
tgcctggacc tccgaaacgc gctacaattc atttacaaca caggatgggg tgagaatatt 1860
gccggaatca gtgaagcagg cctcctaaaa taaaaatcta tattttagga ggtaaaacat 1920
gaattttcaa acaatcgagc ttgacacatg gtatagaaaa tcttattttg accattacat 1980
gaaggaagcg aaatgttctt tcagcatcac ggcaaacgtc aatgtgacaa atttgctcgc 2040
cgtgctcaag aaaaagaagc tcaagctgta tccggctttt atttatatcg tatcaagggt 2100
cattcattcg cgccctgagt ttagaacaac gtttgatgac aaaggacagc tgggttattg 2160
ggaacaaatg catccgtgct atgcgatttt tcatcaggac gaccaaacgt tttccgccct 2220
ctggacggaa tactcagacg atttttcgca gttttatcat caatatcttc tggacgccga 2280
gcgctttgga gacaaaaggg gcctttgggc taagccggac atcccgccca atacgttttc 2340
agtttcttct attccatggg tgcgcttttc aaacttcaat ttaaaccttg ataacagcga 2400
acacttgctg ccgattatta caaacgggaa atacttttca gaaggcaggg aaacattttt 2460
gcccgtttcc ttgcaagttc accatgcagt gtgtgacggc tatcatgccg gcgcttttat 2520
aaacgagttg gaacggcttg ccgccgattg tgaggagtgg cttgtgtgac agaggaaagg 2580
ccgatatgat tcggcctttt ttatatgtac ttcttagcgg gtctcttaac ccccctcgag 2640
gtcgctgata aacagctgac atcaatatcc tattttttca aaaaatattt taaaaagttg 2700
ttgacttaaa agaagctaaa tgttatagta ataaaacaga atagtctttt aagtaagtct 2760
actctgaatt tttttaaaag gagagggtaa agatgaaaca acaaaaacgg ctttacgccc 2820
gattgctgac gctgttattt gcgctcatct tcttgctgcc tcattctgca gctagcgcag 2880
ccgcaccgtt taacggtacc atgatgcagt attttgaatg gtacttgccg gatgatggca 2940
cgttatggac caaagtggcc aatgaagcca acaacttatc cagccttggc atcaccgctc 3000
tttggctgcc gcccgcttac aaaggaacaa gccgcagcga cgtagggtac ggagtatacg 3060
acttgtatga cctcggcgaa ttcaatcaaa aagggaccgt ccgcacaaaa tatggaacaa 3120
aagctcaata tcttcaagcc attcaagccg cccacgccgc tggaatgcaa gtgtacgccg 3180
atgtcgtgtt cgaccataaa ggcggcgctg acggcacgga atgggtggac gccgtcgaag 3240
tcaatccgtc cgaccgcaac caagaaatct cgggcaccta tcaaatccaa gcatggacga 3300
aatttgattt tcccgggcgg ggcaacacct actccagctt taagtggcgc tggtaccatt 3360
ttgacggcgt tgattgggac gaaagccgaa aattaagccg catttacaaa ttcaggggca 3420
tcggcaaagc gtgggattgg ccggtagaca cagaaaacgg aaactatgac tacttaatgt 3480
atgccgacct tgatatggat catcccgaag tcgtgaccga gctgaaaaac tgggggaaat 3540
ggtatgtcaa cacaacgaac attgatgggt tccggcttga tgccgtcaag catattaagt 3600
tcagtttttt tcctgattgg ttgtcgtatg tgcgttctca gactggcaag ccgctattta 3660
ccgtcgggga atattggagc tatgacatca acaagttgca caattacatt acgaaaacaa 3720
acggaacgat gtctttgttt gatgccccgt tacacaacaa attttatacc gcttccaaat 3780
cagggggcgc atttgatatg cgcacgttaa tgaccaatac tctcatgaaa gatcaaccga 3840
cattggccgt caccttcgtt gataatcatg acaccgaacc cggccaagcg cttcagtcat 3900
gggtcgaccc atggttcaaa ccgttggctt acgcctttat tctaactcgg caggaaggat 3960
acccgtgcgt cttttatggt gactattatg gcattccaca atataacatt ccttcgctga 4020
aaagcaaaat cgatccgctc ctcatcgcgc gcagggatta tgcttacgga acgcaacatg 4080
attatcttga tcactccgac atcatcgggt ggacaaggga aggggtcact gaaaaaccag 4140
gatccgggct ggccgcactg atcaccgatg ggccgggagg aagcaaatgg atgtacgttg 4200
gcaaacaaca cgctggaaaa gtgttctatg accttaccgg caaccggagt gacaccgtca 4260
ccatcaacag tgatggatgg ggggaattca aagtcaatgg cggttcggtt tcggtttggg 4320
ttcctagaaa aacgacctaa aagcttctcg aggttaacag aggacggatt tcctgaagga 4380
aatccgtttt tttattttta acatctctca ctgctgtgtg attttactca cggcatttgg 4440
aacgccggct ctcaacaaac tttctgtagt gaaaatcatg aaccaaacgg atcgtcggcc 4500
tgattaacag ctgaaagctg ccgatcacaa acatccatag tcccgccggc ttcagttcct 4560
cggagaaaaa gcagaagctc ccgacaagga ataaaaggcc gatgagaaaa tcgtttaatg 4620
tatgtagaac tttgtatctt tttttgaaaa agagttcata tcgattgtta ttgttttgcg 4680
gcattgcttg atcactccaa tccttttatt taccctgccg gaagccggag tgaaacgccg 4740
gtatacatag gatttatgaa ttaggaaaac atatggggaa ataaaccatc caggagtgaa 4800
aaatatgcgg ttattcatat gtgcatcgtg cctgttcggc ttgattgttc cgtcatttga 4860
aacgaaagcg ctgacgtttg aagaattgcc ggttaaacaa gcttcaaaac aatgggaagt 4920
tcaaatcggt aaagccgaag ccggaaacgg aatggcgaaa ccggaaaaag gagcgtttca 4980
tacttatgct gtcgaaatca aaaacattgg acacgatgtg gcttcggcgg aaatttttgt 5040
ctatcggaac gagcctaatt cttcaacgaa attttcgctt tggaacattc ctcacgaaaa 5100
tccggtttct ttagccaaaa gcttaaatca cggaagctct gtcaagcacc gcaatctgct 5160
tatggcagag aatgcgaccg aattggaagt ggacatgatt tggacggaaa aaggaagcga 5220
aggcagactt ttaaaggaaa cgttcatttt caagggagat gaatcatgaa gaaaaaatgg 5280
ccgttcatcg tcaacggtct ttttttaatg acttaggcag ccgatcgttc ggccatacga 5340
tatcgaagcg acctcgaacc agcagagctc gtcacaaaac atttgcattt aaagaaaaat 5400
acaggatgtt ttcaccaata tttttctcaa tgatgataca ctattgacaa gctgctactt 5460
tgggagggtg tttccataga tgccgatgaa gcaaaaacac caaatgtgtc atgagagctc 5520
tctctaatcg atataaaagt agggtgaacc ggggttgtca atctgtaaaa gatctttttt 5580
tatcccgtga tacgcttttg gaattctgaa tcttcaagaa agtccccagc cttttgctga 5640
tcaatcgaga acaaaggatg atacatatga aaagaataga taaaatctac catcagctgc 5700
tggataattt tcgcgaaaag aatatcaatc agcttttaaa gatacaaggg aattcggcta 5760
aagaaatcgc cgggcagctg caaatggagc gttccaatgt cagctttgaa ttaaacaatc 5820
tggttcgggc caaaaaggtg atcaagatta aaacgttccc cgtccgctac atcccggtgg 5880
aaattgttga aaacgtcttg aacatcaaat ggaattcaga gttgatggag gttgaagaac 5940
tgaggcggct ggctgacggc caaaaaaagc cggcgcgcaa tatatccgcc gatcccctcg 6000
agctcatgat cggggctaaa gggagcttga aaaaggcaat ttctcaggcg aaagcggcag 6060
tcttttatcc tccgcacggc ttgcatatgc tgctgctcgg gccgacgggt tcggggaaat 6120
cgctgtttgc gaatcggatc taccagttcg ccgtttattc tgacatattg aagcccgatt 6180
ccccgttcat cacattcaac tgtgcag 6207
<210> 6
<211> 1702
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'-HR to catH locus
<400> 6
ggctatgacg aaacgattgc agcctatgag gcgagtctcg aaaagctcgg acttgactac 60
cttgatttat acctgatcca ctggcctgtt gaaggacgct acaaagcggc gtggaaagcg 120
cttgaaacac tttatgaaca aggacgcgta aaagcaatcg gagtgagcaa ttttcagatt 180
caccatctgg aagacttgct gaaagatgcc gccgtcaaac cggcgatcaa ccaggttgag 240
tatcatccgc ggctgacgca gaaagagctg caagcgtttt gccgtgcgca cggcatccag 300
ctgcaagcat ggtcgccgct gatgcaaggc caattgctca gccatccact gctgaaagat 360
atcgcggaca agtacggcaa gacaccggcc caagtcattt tgcgctggga tttgcaaaac 420
ggggtcgtta cgattccgaa gtcgactaaa gcggagcgga ttgcccaaaa cgcggacata 480
tttgattttg aactgaccac cgaggaaatg aagcaaattg acgcgctgaa tgaaaacacc 540
cgtgtcggcc ctgatcccga taactttgac ttttaacaaa acggccccgt tcgacattcg 600
aacggggctt taattgaatt gtgcggttac accgccggac tccatcatca tcagttcttt 660
tttcatatcc aatccgcccc ggtatcccgt gagctgcccg cttttaccga taacccgatg 720
gcaaggcacc accattaaca gcggatttgc gccgatcgcc gcgcctactg cccgcacagc 780
ggcctgcttt tcaatatgct cggcgatatc ggaataggag caagtgctgc cgtaagggat 840
ttcggagagc gccttccaca ctgccagctg aaaaggcgtg ccggcaaggt cgacaggaaa 900
gctgaaatga gttcgcttgc cgttcaaata cgcctgcagc tgctcggcgt attctgccaa 960
tcctttgtca tcccgaatga aaactggctg tgtaaatctt ttttcagccc aagcggccaa 1020
atcctcgaag ccttgattcc atccccctgt aaaacagagc ccgcgggcag tcgccccaat 1080
gtgaatctgc caacctcggc aaataagcgt acgccagtat acgatttgat cgtccatatg 1140
tttacctccg tttcatttgc cggtacgacg tcggcgattg cccagtcttc tttttaaaca 1200
aagaggcaaa atattccgca ttcgcaatgc ctaccattga agcgatttct gcgatcgatc 1260
gttctgaatg agcaagcaaa tcgaccgctt tctcaatcct tttctgcagg atgtattctg 1320
ccggcgagac gcctttgatt cgtttaaatg tccgctgcag gtgaaaaggg ctgatatggc 1380
acctgtcagc caaagcttgc agagacagcg gatcgcgata agattcctcg atgatttcca 1440
ccacacgctg tgccagctct tcatccggca gcagcgcccc ggccggattg cagcgtttgc 1500
aggggcggta cccttctgat aaagcatctt ttgcattgaa aaagatctgc acattgtcga 1560
tttgcggaac tctcgatttg caggaagggc ggcaaaatat gccggtcgtt ttgaccgcgt 1620
aataaaaaac tccgtcatag gcggaatcgt tttccgtaat cgcccgccac atttcaggcg 1680
tcaatcgtga tttgctgttc at 1702
<210> 7
<211> 938
<212> DNA
<213> Artificial Sequence
<220>
<223> catH gene
<400> 7
atcttcaccc cgatctatgt cagtataacc tatatgacag ccggaggtgg agaggcggag 60
aacggcacag caagaagaca aagaagaaga gagactgttg cctggacctc cgaaacgcgc 120
tacaattcat ttacaacaca ggatggggtg agaatattgc cggaatcagt gaagcaggcc 180
tcctaaaata aaaatctata ttttaggagg taaaacatga attttcaaac aatcgagctt 240
gacacatggt atagaaaatc ttattttgac cattacatga aggaagcgaa atgttctttc 300
agcatcacgg caaacgtcaa tgtgacaaat ttgctcgccg tgctcaagaa aaagaagctc 360
aagctgtatc cggcttttat ttatatcgta tcaagggtca ttcattcgcg ccctgagttt 420
agaacaacgt ttgatgacaa aggacagctg ggttattggg aacaaatgca tccgtgctat 480
gcgatttttc atcaggacga ccaaacgttt tccgccctct ggacggaata ctcagacgat 540
ttttcgcagt tttatcatca atatcttctg gacgccgagc gctttggaga caaaaggggc 600
ctttgggcta agccggacat cccgcccaat acgttttcag tttcttctat tccatgggtg 660
cgcttttcaa acttcaattt aaaccttgat aacagcgaac acttgctgcc gattattaca 720
aacgggaaat acttttcaga aggcagggaa acatttttgc ccgtttcctt gcaagttcac 780
catgcagtgt gtgacggcta tcatgccggc gcttttataa acgagttgga acggcttgcc 840
gccgattgtg aggagtggct tgtgtgacag aggaaaggcc gatatgattc ggcctttttt 900
atatgtactt cttagcgggt ctcttaaccc ccctcgag 938
<210> 8
<211> 95
<212> DNA
<213> Artificial Sequence
<220>
<223> spoVGrrnIp promoter
<400> 8
gtcgctgata aacagctgac atcaatatcc tattttttca aaaaatattt taaaaagttg 60
ttgacttaaa agaagctaaa tgttatagta ataaa 95
<210> 9
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> amylase signal sequence
<400> 9
atgaaacaac aaaaacggct ttacgcccga ttgctgacgc tgttatttgc gctcatcttc 60
ttgctgcctc attctgcagc tagcgca 87
<210> 10
<211> 1461
<212> DNA
<213> Artificial Sequence
<220>
<223> variant amylase
<400> 10
gccgcaccgt ttaacggtac catgatgcag tattttgaat ggtacttgcc ggatgatggc 60
acgttatgga ccaaagtggc caatgaagcc aacaacttat ccagccttgg catcaccgct 120
ctttggctgc cgcccgctta caaaggaaca agccgcagcg acgtagggta cggagtatac 180
gacttgtatg acctcggcga attcaatcaa aaagggaccg tccgcacaaa atatggaaca 240
aaagctcaat atcttcaagc cattcaagcc gcccacgccg ctggaatgca agtgtacgcc 300
gatgtcgtgt tcgaccataa aggcggcgct gacggcacgg aatgggtgga cgccgtcgaa 360
gtcaatccgt ccgaccgcaa ccaagaaatc tcgggcacct atcaaatcca agcatggacg 420
aaatttgatt ttcccgggcg gggcaacacc tactccagct ttaagtggcg ctggtaccat 480
tttgacggcg ttgattggga cgaaagccga aaattaagcc gcatttacaa attcaggggc 540
atcggcaaag cgtgggattg gccggtagac acagaaaacg gaaactatga ctacttaatg 600
tatgccgacc ttgatatgga tcatcccgaa gtcgtgaccg agctgaaaaa ctgggggaaa 660
tggtatgtca acacaacgaa cattgatggg ttccggcttg atgccgtcaa gcatattaag 720
ttcagttttt ttcctgattg gttgtcgtat gtgcgttctc agactggcaa gccgctattt 780
accgtcgggg aatattggag ctatgacatc aacaagttgc acaattacat tacgaaaaca 840
aacggaacga tgtctttgtt tgatgccccg ttacacaaca aattttatac cgcttccaaa 900
tcagggggcg catttgatat gcgcacgtta atgaccaata ctctcatgaa agatcaaccg 960
acattggccg tcaccttcgt tgataatcat gacaccgaac ccggccaagc gcttcagtca 1020
tgggtcgacc catggttcaa accgttggct tacgccttta ttctaactcg gcaggaagga 1080
tacccgtgcg tcttttatgg tgactattat ggcattccac aatataacat tccttcgctg 1140
aaaagcaaaa tcgatccgct cctcatcgcg cgcagggatt atgcttacgg aacgcaacat 1200
gattatcttg atcactccga catcatcggg tggacaaggg aaggggtcac tgaaaaacca 1260
ggatccgggc tggccgcact gatcaccgat gggccgggag gaagcaaatg gatgtacgtt 1320
ggcaaacaac acgctggaaa agtgttctat gaccttaccg gcaaccggag tgacaccgtc 1380
accatcaaca gtgatggatg gggggaattc aaagtcaatg gcggttcggt ttcggtttgg 1440
gttcctagaa aaacgaccta a 1461
<210> 11
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> amylase terminator sequence
<400> 11
aagcttctcg aggttaacag aggacggatt tcctgaagga aatccgtttt tttatttt 58
<210> 12
<211> 1809
<212> DNA
<213> Artificial Sequence
<220>
<223> 3'-HR to CatH locus
<400> 12
taacatctct cactgctgtg tgattttact cacggcattt ggaacgccgg ctctcaacaa 60
actttctgta gtgaaaatca tgaaccaaac ggatcgtcgg cctgattaac agctgaaagc 120
tgccgatcac aaacatccat agtcccgccg gcttcagttc ctcggagaaa aagcagaagc 180
tcccgacaag gaataaaagg ccgatgagaa aatcgtttaa tgtatgtaga actttgtatc 240
tttttttgaa aaagagttca tatcgattgt tattgttttg cggcattgct tgatcactcc 300
aatcctttta tttaccctgc cggaagccgg agtgaaacgc cggtatacat aggatttatg 360
aattaggaaa acatatgggg aaataaacca tccaggagtg aaaaatatgc ggttattcat 420
atgtgcatcg tgcctgttcg gcttgattgt tccgtcattt gaaacgaaag cgctgacgtt 480
tgaagaattg ccggttaaac aagcttcaaa acaatgggaa gttcaaatcg gtaaagccga 540
agccggaaac ggaatggcga aaccggaaaa aggagcgttt catacttatg ctgtcgaaat 600
caaaaacatt ggacacgatg tggcttcggc ggaaattttt gtctatcgga acgagcctaa 660
ttcttcaacg aaattttcgc tttggaacat tcctcacgaa aatccggttt ctttagccaa 720
aagcttaaat cacggaagct ctgtcaagca ccgcaatctg cttatggcag agaatgcgac 780
cgaattggaa gtggacatga tttggacgga aaaaggaagc gaaggcagac ttttaaagga 840
aacgttcatt ttcaagggag atgaatcatg aagaaaaaat ggccgttcat cgtcaacggt 900
ctttttttaa tgacttaggc agccgatcgt tcggccatac gatatcgaag cgacctcgaa 960
ccagcagagc tcgtcacaaa acatttgcat ttaaagaaaa atacaggatg ttttcaccaa 1020
tatttttctc aatgatgata cactattgac aagctgctac tttgggaggg tgtttccata 1080
gatgccgatg aagcaaaaac accaaatgtg tcatgagagc tctctctaat cgatataaaa 1140
gtagggtgaa ccggggttgt caatctgtaa aagatctttt tttatcccgt gatacgcttt 1200
tggaattctg aatcttcaag aaagtcccca gccttttgct gatcaatcga gaacaaagga 1260
tgatacatat gaaaagaata gataaaatct accatcagct gctggataat tttcgcgaaa 1320
agaatatcaa tcagctttta aagatacaag ggaattcggc taaagaaatc gccgggcagc 1380
tgcaaatgga gcgttccaat gtcagctttg aattaaacaa tctggttcgg gccaaaaagg 1440
tgatcaagat taaaacgttc cccgtccgct acatcccggt ggaaattgtt gaaaacgtct 1500
tgaacatcaa atggaattca gagttgatgg aggttgaaga actgaggcgg ctggctgacg 1560
gccaaaaaaa gccggcgcgc aatatatccg ccgatcccct cgagctcatg atcggggcta 1620
aagggagctt gaaaaaggca atttctcagg cgaaagcggc agtcttttat cctccgcacg 1680
gcttgcatat gctgctgctc gggccgacgg gttcggggaa atcgctgttt gcgaatcgga 1740
tctaccagtt cgccgtttat tctgacatat tgaagcccga ttccccgttc atcacattca 1800
actgtgcag 1809
<210> 13
<211> 486
<212> PRT
<213> Artificial Sequence
<220>
<223> variant amylase
<400> 13
Ala Ala Pro Phe Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr Leu
1 5 10 15
Pro Asp Asp Gly Thr Leu Trp Thr Lys Val Ala Asn Glu Ala Asn Asn
20 25 30
Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys
35 40 45
Gly Thr Ser Arg Ser Asp Val Gly Tyr Gly Val Tyr Asp Leu Tyr Asp
50 55 60
Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr
65 70 75 80
Lys Ala Gln Tyr Leu Gln Ala Ile Gln Ala Ala His Ala Ala Gly Met
85 90 95
Gln Val Tyr Ala Asp Val Val Phe Asp His Lys Gly Gly Ala Asp Gly
100 105 110
Thr Glu Trp Val Asp Ala Val Glu Val Asn Pro Ser Asp Arg Asn Gln
115 120 125
Glu Ile Ser Gly Thr Tyr Gln Ile Gln Ala Trp Thr Lys Phe Asp Phe
130 135 140
Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His
145 150 155 160
Phe Asp Gly Val Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg Ile Tyr
165 170 175
Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Pro Val Asp Thr Glu
180 185 190
Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His
195 200 205
Pro Glu Val Val Thr Glu Leu Lys Asn Trp Gly Lys Trp Tyr Val Asn
210 215 220
Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys
225 230 235 240
Phe Ser Phe Phe Pro Asp Trp Leu Ser Tyr Val Arg Ser Gln Thr Gly
245 250 255
Lys Pro Leu Phe Thr Val Gly Glu Tyr Trp Ser Tyr Asp Ile Asn Lys
260 265 270
Leu His Asn Tyr Ile Thr Lys Thr Asn Gly Thr Met Ser Leu Phe Asp
275 280 285
Ala Pro Leu His Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Ala
290 295 300
Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gln Pro
305 310 315 320
Thr Leu Ala Val Thr Phe Val Asp Asn His Asp Thr Glu Pro Gly Gln
325 330 335
Ala Leu Gln Ser Trp Val Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala
340 345 350
Phe Ile Leu Thr Arg Gln Glu Gly Tyr Pro Cys Val Phe Tyr Gly Asp
355 360 365
Tyr Tyr Gly Ile Pro Gln Tyr Asn Ile Pro Ser Leu Lys Ser Lys Ile
370 375 380
Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gln His
385 390 395 400
Asp Tyr Leu Asp His Ser Asp Ile Ile Gly Trp Thr Arg Glu Gly Val
405 410 415
Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro
420 425 430
Gly Gly Ser Lys Trp Met Tyr Val Gly Lys Gln His Ala Gly Lys Val
435 440 445
Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Val Thr Ile Asn Ser
450 455 460
Asp Gly Trp Gly Glu Phe Lys Val Asn Gly Gly Ser Val Ser Val Trp
465 470 475 480
Val Pro Arg Lys Thr Thr
485
<210> 14
<211> 1967
<212> DNA
<213> Artificial Sequence
<220>
<223> colony pcr construct
<400> 14
tgtgtgacgg ctatcatgcc ggcgctttta taaacgagtt ggaacggctt gccgccgatt 60
gtgaggagtg gcttgtgtga cagaggaaag gccgatatga ttcggccttt tttatatgta 120
cttcttagcg ggtctcttaa cccccctcga ggtcgctgat aaacagctga catcaatatc 180
ctattttttc aaaaaatatt ttaaaaagtt gttgacttaa aagaagctaa atgttatagt 240
aataaaacag aatagtcttt taagtaagtc tactctgaat ttttttaaaa ggagagggta 300
aagaatgaaa caacaaaaac ggctttacgc ccgattgctg acgctgttat ttgcgctcat 360
cttcttgctg cctcattctg cagctagcgc agccgcaccg tttaacggta ccatgatgca 420
gtattttgaa tggtacttgc cggatgatgg cacgttatgg accaaagtgg ccaatgaagc 480
caacaactta tccagccttg gcatcaccgc tctttggctg ccgcccgctt acaaaggaac 540
aagccgcagc gacgtagggt acggagtata cgacttgtat gacctcggcg aattcaatca 600
aaaagggacc gtccgcacaa aatatggaac aaaagctcaa tatcttcaag ccattcaagc 660
cgcccacgcc gctggaatgc aagtgtacgc cgatgtcgtg ttcgaccata aaggcggcgc 720
tgacggcacg gaatgggtgg acgccgtcga agtcaatccg tccgaccgca accaagaaat 780
ctcgggcacc tatcaaatcc aagcatggac gaaatttgat tttcccgggc ggggcaacac 840
ctactccagc tttaagtggc gctggtacca ttttgacggc gttgattggg acgaaagccg 900
aaaattaagc cgcatttaca aattcagggg catcggcaaa gcgtgggatt ggccggtaga 960
cacagaaaac ggaaactatg actacttaat gtatgccgac cttgatatgg atcatcccga 1020
agtcgtgacc gagctgaaaa actgggggaa atggtatgtc aacacaacga acattgatgg 1080
gttccggctt gatgccgtca agcatattaa gttcagtttt tttcctgatt ggttgtcgta 1140
tgtgcgttct cagactggca agccgctatt taccgtcggg gaatattgga gctatgacat 1200
caacaagttg cacaattaca ttacgaaaac aaacggaacg atgtctttgt ttgatgcccc 1260
gttacacaac aaattttata ccgcttccaa atcagggggc gcatttgata tgcgcacgtt 1320
aatgaccaat actctcatga aagatcaacc gacattggcc gtcaccttcg ttgataatca 1380
tgacaccgaa cccggccaag cgcttcagtc atgggtcgac ccatggttca aaccgttggc 1440
ttacgccttt attctaactc ggcaggaagg atacccgtgc gtcttttatg gtgactatta 1500
tggcattcca caatataaca ttccttcgct gaaaagcaaa atcgatccgc tcctcatcgc 1560
gcgcagggat tatgcttacg gaacgcaaca tgattatctt gatcactccg acatcatcgg 1620
gtggacaagg gaaggggtca ctgaaaaacc aggatccggg ctggccgcac tgatcaccga 1680
tgggccggga ggaagcaaat ggatgtacgt tggcaaacaa cacgctggaa aagtgttcta 1740
tgaccttacc ggcaaccgga gtgacaccgt caccatcaac agtgatggat ggggggaatt 1800
caaagtcaat ggcggttcgg tttcggtttg ggttcctaga aaaacgacct aaaagcttct 1860
cgaggttaac agaggacgga tttcctgaag gaaatccgtt tttttatttt taacatctct 1920
cactgctgtg tgattttact cacggcattt ggaacgccgg ctctcaa 1967
<210> 15
<211> 1966
<212> DNA
<213> Artificial Sequence
<220>
<223> colony pcr construct -1A
<400> 15
tgtgtgacgg ctatcatgcc ggcgctttta taaacgagtt ggaacggctt gccgccgatt 60
gtgaggagtg gcttgtgtga cagaggaaag gccgatatga ttcggccttt tttatatgta 120
cttcttagcg ggtctcttaa cccccctcga ggtcgctgat aaacagctga catcaatatc 180
ctattttttc aaaaaatatt ttaaaaagtt gttgacttaa aagaagctaa atgttatagt 240
aataaaacag aatagtcttt taagtaagtc tactctgaat ttttttaaaa ggagagggta 300
aagatgaaac aacaaaaacg gctttacgcc cgattgctga cgctgttatt tgcgctcatc 360
ttcttgctgc ctcattctgc agctagcgca gccgcaccgt ttaacggtac catgatgcag 420
tattttgaat ggtacttgcc ggatgatggc acgttatgga ccaaagtggc caatgaagcc 480
aacaacttat ccagccttgg catcaccgct ctttggctgc cgcccgctta caaaggaaca 540
agccgcagcg acgtagggta cggagtatac gacttgtatg acctcggcga attcaatcaa 600
aaagggaccg tccgcacaaa atatggaaca aaagctcaat atcttcaagc cattcaagcc 660
gcccacgccg ctggaatgca agtgtacgcc gatgtcgtgt tcgaccataa aggcggcgct 720
gacggcacgg aatgggtgga cgccgtcgaa gtcaatccgt ccgaccgcaa ccaagaaatc 780
tcgggcacct atcaaatcca agcatggacg aaatttgatt ttcccgggcg gggcaacacc 840
tactccagct ttaagtggcg ctggtaccat tttgacggcg ttgattggga cgaaagccga 900
aaattaagcc gcatttacaa attcaggggc atcggcaaag cgtgggattg gccggtagac 960
acagaaaacg gaaactatga ctacttaatg tatgccgacc ttgatatgga tcatcccgaa 1020
gtcgtgaccg agctgaaaaa ctgggggaaa tggtatgtca acacaacgaa cattgatggg 1080
ttccggcttg atgccgtcaa gcatattaag ttcagttttt ttcctgattg gttgtcgtat 1140
gtgcgttctc agactggcaa gccgctattt accgtcgggg aatattggag ctatgacatc 1200
aacaagttgc acaattacat tacgaaaaca aacggaacga tgtctttgtt tgatgccccg 1260
ttacacaaca aattttatac cgcttccaaa tcagggggcg catttgatat gcgcacgtta 1320
atgaccaata ctctcatgaa agatcaaccg acattggccg tcaccttcgt tgataatcat 1380
gacaccgaac ccggccaagc gcttcagtca tgggtcgacc catggttcaa accgttggct 1440
tacgccttta ttctaactcg gcaggaagga tacccgtgcg tcttttatgg tgactattat 1500
ggcattccac aatataacat tccttcgctg aaaagcaaaa tcgatccgct cctcatcgcg 1560
cgcagggatt atgcttacgg aacgcaacat gattatcttg atcactccga catcatcggg 1620
tggacaaggg aaggggtcac tgaaaaacca ggatccgggc tggccgcact gatcaccgat 1680
gggccgggag gaagcaaatg gatgtacgtt ggcaaacaac acgctggaaa agtgttctat 1740
gaccttaccg gcaaccggag tgacaccgtc accatcaaca gtgatggatg gggggaattc 1800
aaagtcaatg gcggttcggt ttcggtttgg gttcctagaa aaacgaccta aaagcttctc 1860
gaggttaaca gaggacggat ttcctgaagg aaatccgttt ttttattttt aacatctctc 1920
actgctgtgt gattttactc acggcatttg gaacgccggc tctcaa 1966
<210> 16
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 16
tgtgtgacgg ctatcatgcc 20
<210> 17
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 17
ttgagagccg gcgttcc 17
<210> 18
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 18
aacgagttgg aacggcttgc 20
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 19
ggcaacacct actccagctt 20
<210> 20
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 20
gatcactccg acatcatcgg 20
<210> 21
<211> 192
<212> PRT
<213> Artificial Sequence
<220>
<223> comK protein
<400> 21
Met Ser Thr Glu Asp Met Thr Lys Asp Thr Tyr Glu Val Asn Ser Ser
1 5 10 15
Thr Met Ala Val Leu Pro Leu Gly Glu Gly Glu Lys Ser Ala Ser Lys
20 25 30
Ile Leu Glu Thr Asp Arg Thr Phe Arg Val Asn Met Lys Pro Phe Gln
35 40 45
Ile Ile Glu Arg Ser Cys Arg Tyr Phe Gly Ser Ser Tyr Ala Gly Arg
50 55 60
Lys Ala Gly Thr Tyr Glu Val Ile Lys Val Ser His Lys Pro Pro Ile
65 70 75 80
Met Val Asp His Ser Asn Asn Ile Phe Leu Phe Pro Thr Phe Ser Ser
85 90 95
Thr Arg Pro Gln Cys Gly Trp Leu Ser His Ala His Val His Glu Phe
100 105 110
Cys Ala Ala Lys Tyr Asp Asn Thr Phe Val Thr Phe Val Asn Gly Glu
115 120 125
Thr Leu Glu Leu Pro Val Ser Ile Ser Ser Phe Glu Asn Gln Val Tyr
130 135 140
Arg Thr Ala Trp Leu Arg Thr Lys Phe Ile Asp Arg Ile Glu Gly Asn
145 150 155 160
Pro Met Gln Lys Lys Gln Glu Phe Met Leu Tyr Pro Lys Glu Asp Arg
165 170 175
Asn Gln Leu Ile Tyr Glu Phe Ile Leu Arg Glu Leu Lys Lys Arg Tyr
180 185 190
Claims (37)
- 야생형 바실러스 서브틸리스 aprE 5'-비번역 영역(WT-5′-UTR) 핵산 서열인 서열번호 1로부터 유래된 변형된 바실러스 서브틸리스 aprE 5'-비번역 영역(mod-5'-UTR) 핵산 서열을 포함하는 단리된 폴리뉴클레오티드.
- 제1항에 있어서, mod-5′-UTR은 서열번호 2를 포함하는 것인, 폴리뉴클레오티드.
- 제1항에 있어서, mod-5′-UTR은 상류(5′) 프로모터 영역 핵산 서열 5′을 더 포함하고, mod-5′-UTR에 작동 가능하게 연결되는 것인, 폴리뉴클레오티드.
- 제1항에 있어서, mod-5′-UTR은 관심 단백질을 암호화하는 하류(3′) 개방형 해독틀(ORF) 핵산 서열을 더 포함하고, 이때, ORF 서열은 3'이고 mod-5′-UTR에 작동 가능하게 연결되는 것인, 폴리뉴클레오티드.
- 제1항에 있어서, 5'에서 3' 방향의 식 (I)을 포함하는 폴리뉴클레오티드:
(I): [Pro] [mod-5′-UTR] [ORF]
(식에서, [Pro]는 바실러스 sp. 세포에서 작동 가능한 프로모터 영역 핵산 서열이고, [mod-5′-UTR]은 변형된 B. 서브틸리스 aprE 5′ 비번역 영역(mod-5′-UTR) 핵산 서열이고, [ORF]는 관심 단백질(POI)을 암호화하는 개방형 해독틀 핵산 서열이며, 이때, [Pro], [mod-5′-UTR] 및 [ORF] 핵산 서열은 작동 가능하게 연결됨). - 제1항의 폴리뉴클레오티드를 포함하는 벡터.
- 제1항의 폴리뉴클레오티드를 포함하는 DNA 발현 작제물.
- 제1항의 폴리뉴클레오티드를 포함하는 바실러스 sp. 세포.
- 제8항에 있어서, 세포는 바실러스 리체니포르미스 세포인 것인, 바실러스 sp. 세포.
- 야생형 바실러스 sp. 5′-UTR(WT-5′-UTR) 서열로부터 유래된 변형된 바실러스 sp. 5′-UTR(mod-5′-UTR) 핵산 서열을 포함하는 단리된 폴리뉴클레오티드로서, 단리된 변형 폴리뉴클레오티드는 작동 가능한 조합으로 5'에서 3' 방향의 식 (II)의 핵산 서열을 포함하는 것인, 폴리뉴클레오티드:
(II): [TIS] [mod-5′ UTR] [tss 코돈]
(식에서, [TIS]는 전사 개시 부위(TIS)이고, [mod-5′-UTR]은 변형된 B. 서브틸리스 5′-UTR 핵산 서열을 포함하고, [tss 코돈]은 3 뉴클레오티드 번역 개시 부위(tss) 코돈임). - 제10항에 있어서, [mod-5′-UTR] 서열은 서열번호 2를 포함하는 것인, 폴리뉴클레오티드.
- 제10항에 있어서,
(a) 상류(5')에 있고 [TIS]에 작동 가능하게 연결된 핵산 프로모터 서열로서, 바실러스 sp. 세포에서 작동 가능한 핵산 프로모터 서열 및
(b) 하류(3')에 있고 tss 코돈에 작동 가능하게 연결된 ORF 핵산 서열로서, POI를 암호화하는 ORF 핵산 서열
을 더 포함하는 폴리뉴클레오티드. - 제10항의 폴리뉴클레오티드를 포함하는 벡터.
- 제10항의 폴리뉴클레오티드를 포함하는 DNA 발현 작제물.
- 제10항의 폴리뉴클레오티드를 포함하는 바실러스 sp. 세포.
- 제15항에 있어서, 세포는 바실러스 리체니포르미스 세포인 것인, 바실러스 sp. 세포.
- 5'에서 3' 방향으로 및 작동 가능한 조합으로 식 (III)의 핵산 서열을 포함하는 단리된 폴리뉴클레오티드:
(III): [5′-HR] [TIS] [mod-5′-UTR] [tss 코돈] [3′-HR]
(식에서, [TIS]는 전사 개시 부위(TIS)이고, [mod-5′-UTR]은 변형된 B. 서브틸리스 5′-UTR 핵산 서열을 포함하고, [tss 코돈]은 3 뉴클레오티드 번역 개시 부위(tss) 코돈이고, [5′-HR]은 5′-핵산 서열 상동성 영역이고, [3′-HR]은 3′-핵산 서열 상동성 영역이며, 이때, 5′-HR과 3′-HR은 각각 [TIS] 서열의 바로 상류(5') 및 [tss 코돈] 서열의 바로 하류(3')의 게놈(염색체) 영역(좌(locus))에 대해, 도입된 폴리뉴클레오티드 작제물을 상동 재조합에 의한 변형된 바실러스 세포의 게놈 내로 통합시키기에 충분한 상동성을 포함한다). - 제17항의 폴리뉴클레오티드를 포함하는 벡터.
- 제17항의 폴리뉴클레오티드를 포함하는 DNA 발현 작제물.
- 제17항의 폴리뉴클레오티드를 포함하는 바실러스 sp. 세포.
- 제17항에 있어서, 세포는 바실러스 리체니포르미스 세포인 것인, 바실러스 sp. 세포.
- 제1항에 있어서, ORF 서열은 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르보닉 언하이드라아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이사아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 하이드롤라아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리가아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소오스 옥시다아제, 및 이의 조합으로 구성된 군으로부터 선택된 POI를 암호화하는 것인, 폴리뉴클레오티드.
- 제12항에 있어서, ORF 서열은 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르보닉 언하이드라아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이사아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 하이드롤라아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리가아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소오스 옥시다아제, 및 이의 조합으로 구성된 군으로부터 선택된 POI를 암호화하는 것인, 폴리뉴클레오티드.
- 야생형 바실러스 sp. 5′-UTR(WT-5′-UTR) 서열로부터 유래된 변형된 5′-UTR(mod-5′-UTR) 핵산 서열을 포함하는 단리된 폴리뉴클레오티드로서, 단리된 폴리뉴클레오티드는 5'에서 3' 방향으로 및 작동 가능한 조합으로 식 (IV)의 핵산 서열을 포함하는 것인, 폴리뉴클레오티드:
(IV): [TIS] [5′-UTR - Δ xN ] [tss 코돈]
(식에서, [TIS]는 전사 개시 부위(TIS)이고, [tss 코돈]은 3 뉴클레오티드 번역 개시 부위(tss) 코돈이고, [5′-UTR -ΔxN]은 야생형 바실러스 sp. 5′-UTR 핵산 서열로부터 유래된 변형된 바실러스 sp. 5′-UTR 핵산 서열이며, 이때, mod-5′-UTR 핵산 서열 [5′-UTR -ΔxN]은 WT-5′-UTR 핵산 서열의 원위(3') 말단에 "x"개 뉴클레오티드("N")의 결실( - Δ)을 포함한다). - 야생형 바실러스 sp. 5′-UTR(WT-5′-UTR) 서열로부터 유래된 변형된 5′-UTR(mod-5′-UTR) 핵산 서열을 포함하는 단리된 폴리뉴클레오티드로서, 단리된 폴리뉴클레오티드는 5'에서 3' 방향으로 및 작동 가능한 조합으로 식 (V)의 핵산 서열을 포함하는 것인, 폴리뉴클레오티드:
(V): [TIS] [5′-UTR + Δ xN ] [tss 코돈]
(식에서, [TIS]는 전사 개시 부위이고, [tss 코돈]은 3 뉴클레오티드 번역 개시 부위(tss) 코돈이고, [5′-UTR + ΔxN]은 야생형 바실러스 sp. 5′-UTR 핵산 서열로부터 유래된 변형된 바실러스 sp. 5′-UTR 핵산 서열이며, 이때, mod-5′-UTR 핵산 서열 [5′-UTR + ΔxN]은 야생형 바실러스 sp. 5′-UTR 핵산 서열의 원위(3') 말단에 "x"개 뉴클레오티드("N")의 부가( + Δ)를 포함한다). - 제24항 또는 제25항의 폴리뉴클레오티드를 포함하는 벡터.
- 제24항 또는 제25항의 폴리뉴클레오티드를 포함하는 DNA 발현 작제물.
- 제24항 또는 제25항의 폴리뉴클레오티드를 포함하는 바실러스 sp. 세포.
- 제24항 또는 제25항에 있어서, 세포는 바실러스 리체니포르미스 세포인 것인, 바실러스 sp. 세포.
- 이종 관심 단백질(POI)의 생산에 적합한 배지에서 배양될 때 증가된 양의 이종 POI를 생산하는 변형된 바실러스 sp.(딸) 세포로서, 변형된 바실러스 세포는 5'에서 3' 방향으로 및 작동 가능한 조합으로 식 (I)의 핵산 서열을 포함하는 도입된 발현 작제물을 포함하며
(I): [Pro] [mod-5′-UTR] [ORF]
(식에서, [Pro]는 바실러스 sp. 세포에서 작동 가능한 프로모터 영역 핵산 서열이고, [mod-5′-UTR]은 변형된 B. 서브틸리스 비번역 영역(mod-5′-UTR) 핵산 서열이고, [ORF]는 관심 단백질(POI)을 암호화하는 개방형 해독틀 핵산 서열이며, 이때, [Pro], [mod-5′-UTR] 및 [ORF] 핵산 서열은 작동 가능하게 연결됨),
이때 변형된 바실러스 sp.(딸) 세포는 비슷한 조건 하에서 배양될 때 동일한 POI를 생산하는 비변형 B. 리체니포르미스(모) 세포와 비교하여 증가된 양의 이종 POI를 생산하는 것인, 바실러스 세포. - 제30항에 있어서, mod-5′-UTR은 서열번호 2를 포함하는 것인, 바실러스 세포.
- 제30항에 있어서, 세포는 바실러스 리체니포르미스 세포인 것인, 바실러스 세포.
- 제30항에 있어서, ORF 서열은 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르보닉 언하이드라아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이사아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 하이드롤라아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리가아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소오스 옥시다아제, 및 이의 조합으로 구성된 군으로부터 선택된 POI를 암호화하는 것인, 바실러스 세포.
- 변형된 바실러스 세포에서 증가된 양의 이종 관심 단백질(POI)을 생산하는 방법으로,
(a) 모 바실러스 sp. 세포에 5'에서 3' 방향으로 및 작동 가능한 조합으로 핵산 서열 [Pro] [mod-5′-UTR] [ORF]를 포함하는 발현 작제물을 도입하는 단계(이때, [Pro]는 바실러스 sp. 세포에서 작동 가능한 프로모터 영역 핵산 서열이고, [mod-5′-UTR]은 서열번호 2의 mod-5′-UTR 핵산 서열이고, [ORF]는 관심 단백질(POI)을 암호화하는 개방형 해독틀 핵산 서열임), 및
(b) 이종 POI의 생산에 적합한 배지에서 단계 (a)의 변형된 바실러스 sp. 세포를 배양하는 단계를 포함하며, 이때, 변형된 바실러스(딸) 세포는 단계 (b)의 동일한 배지에서 배양된 바실러스 대조군 세포와 비교하여 증가된 양의 POI를 생산하고, 바실러스 대조군 세포는 5'에서 3' 방향으로 및 작동 가능한 조합으로 핵산 서열 [Pro] [WT-5′-UTR] [ORF]를 포함하는 도입된 발현 작제물을 포함하며, 이때, [Pro] 및 [ORF] 핵산 서열은 단계 (a)의 [Pro] 및 [ORF] 서열과 동일하고, [WT-5′-UTR]은 서열번호 1을 포함하는 것인, 방법. - 제34항에 있어서, 세포는 바실러스 리체니포르미스 세포인 것인, 바실러스 세포.
- 제34항에 있어서, ORF 서열은 아세틸 에스테라아제, 아릴 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 카르보닉 언하이드라아제, 카르복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 라이사아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코오스 옥시다아제, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 하이드롤라아제, 헤미셀룰라아제, 헥소오스 옥시다아제, 하이드롤라아제, 인버타아제, 이소머라아제, 락카아제, 리가아제, 리파아제, 라이아제, 만노시다아제, 옥시다아제, 옥시도리덕타아제, 펙테이트 라이아제, 펙틴 아세틸 에스테라아제, 펙틴 데폴리머라아제, 펙틴 메틸 에스테라아제, 펙틴 분해 효소, 퍼하이드롤라아제, 폴리올 옥시다아제, 퍼옥시다아제, 페놀옥시다아제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스퍼라아제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소오스 옥시다아제, 및 이의 조합으로 구성된 군으로부터 선택된 POI를 암호화하는 것인, 바실러스 세포.
- 변형된 바실러스 세포에서 증가된 양의 내인성 관심 단백질(POI)을 생산하는 방법으로,
(a) 내인성 POI를 생산하는 모 바실러스 세포를 수득하는 단계,
(b) 단계 (a)의 세포에 5'에서 3' 방향으로 및 작동 가능한 조합으로 식 (VI)의 핵산 서열을 포함하는 폴리뉴클레오티드 작제물을 도입하는 단계
(VI): [5′-HR] [mod-5′-UTR] [3′-HR]
(식에서, [mod-5′-UTR]은 서열번호 2를 포함하고, [5′-HR]은 내인성 POI를 암호화하는 내인성 GOI의 내인성 야생형 5′-UTR(WT-5′-UTR) 서열의 바로 상류(5')에 있는 게놈 좌에 대한 상동성을 포함하는 5′-핵산 서열 상동성 영역이고, [3′-HR]은 내인성 POI를 암호화하는 내인성 GOI의 내인성 WT-5′-UTR 서열의 바로 하류(3')에 있는 게놈 좌에 대한 상동성을 포함하는 3′-핵산 서열 상동성 영역이며, 5′-HR과 3′-HR은 상기 게놈 좌에 대해, 도입된 mod-5′-UTR 폴리뉴클레오티드 작제물을 상동 재조합에 의해 변형된 바실러스 세포의 게놈 내로 통합시키기에 충분한 상동성을 포함하여, 내인성 WT-5′-UTR을 서열번호 2의 mod-5′-UTR로 교체한다), 및
(c) 내인성 POI의 생산에 적합한 배지에서 단계 (b)의 변형된 바실러스 sp. 세포를 배양하는 단계를 포함하며, 이때, 단계 (c)의 변형된 세포는 비슷한 조건 하에 배양될 때의 단계 (a)의 모 세포와 비교하여 증가된 양의 내인성 POI를 생산하는 것인, 방법.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201762558304P | 2017-09-13 | 2017-09-13 | |
| US62/558,304 | 2017-09-13 | ||
| PCT/US2018/049470 WO2019055261A1 (en) | 2017-09-13 | 2018-09-05 | MODIFIED 5 'NON-TRANSLATED REGION (UTR) SEQUENCES FOR INCREASED PROTEIN PRODUCTION IN BACILLUS |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR20200047668A true KR20200047668A (ko) | 2020-05-07 |
Family
ID=63684542
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020207009682A Withdrawn KR20200047668A (ko) | 2017-09-13 | 2018-09-05 | 바실러스에서 증가된 단백질 생산을 위한 변형된 5'-비번역 영역(utr) 서열 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US20210032639A1 (ko) |
| EP (1) | EP3682010A1 (ko) |
| JP (1) | JP7218985B2 (ko) |
| KR (1) | KR20200047668A (ko) |
| CN (1) | CN111094576A (ko) |
| WO (1) | WO2019055261A1 (ko) |
Families Citing this family (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102715197B1 (ko) * | 2018-01-03 | 2024-10-08 | 다니스코 유에스 인크. | 증가된 단백질 생산을 위한 돌연변이체 및 유전자 변형된 바실러스 세포 및 이의 방법 |
| KR102931179B1 (ko) * | 2019-04-05 | 2026-02-25 | 다니스코 유에스 인크. | 선형 재조합 dna 작제물 및 이의 조성물을 이용하여 공여 dna 서열을 바실러스 게놈 내에 통합시키기 위한 방법 |
| CN114945665A (zh) | 2020-01-15 | 2022-08-26 | 丹尼斯科美国公司 | 用于增强地衣芽孢杆菌中蛋白产生的组合物和方法 |
| CN112163328B (zh) * | 2020-09-18 | 2022-03-04 | 武汉大学 | 一种基于深度学习和数据驱动的岩土颗粒材料本构建模方法 |
| US20240263185A1 (en) | 2021-05-24 | 2024-08-08 | Danisco Us Inc. | Compositions and methods for enhanced protein production in bacillus cells |
| EP4387982A2 (en) | 2021-08-20 | 2024-06-26 | Danisco US Inc. | Methods and compositions for enhanced protein production in bacillus cells |
| KR20240099301A (ko) | 2021-11-16 | 2024-06-28 | 다니스코 유에스 인크. | 바실러스 세포에서 단백질 생산을 향상시키기 위한 조성물 및 방법 |
| EP4433586A2 (en) | 2021-11-18 | 2024-09-25 | Danisco US Inc. | High performance alpha-amylases for starch liquefaction |
| EP4504756A1 (en) | 2022-04-01 | 2025-02-12 | Danisco US Inc. | Pro-region mutations enhancing protein production in gram-positive bacterial cells |
| CN115161237B (zh) * | 2022-07-15 | 2023-07-11 | 华南农业大学 | 一株能降解脂多糖并抑制α-葡萄糖苷酶的凝结芽孢杆菌及其应用 |
| JP2025535419A (ja) * | 2022-10-24 | 2025-10-24 | ダニスコ・ユーエス・インク | バチルス属(Bacillus)細胞におけるタンパク質産生の強化のための組成物及び方法 |
| CN116200416B (zh) * | 2023-02-15 | 2024-03-12 | 北京康乐卫士生物技术股份有限公司 | 一种基于Tac启动子的质粒表达载体构建及其用途 |
| WO2025101486A1 (en) | 2023-11-09 | 2025-05-15 | Danisco Us Inc. | Methods and compositions for enhanced protein production in bacillus cells |
| CN117688823B (zh) * | 2024-02-04 | 2024-05-14 | 北京航空航天大学 | 一种岩土颗粒轨迹预测方法、电子设备及介质 |
| CN120098984B (zh) * | 2025-05-08 | 2025-07-18 | 山东三元生物科技股份有限公司 | 一种d-阿洛酮糖3-差向异构酶及其重组载体、菌株和应用 |
| CN120118809B (zh) * | 2025-05-08 | 2025-11-07 | 山东三元生物科技股份有限公司 | 产d-阿洛酮糖-3-差向异构酶的菌株、菌体固定化颗粒及催化方法 |
| CN120514724B (zh) * | 2025-07-24 | 2025-10-10 | 济南瑞隆安生物技术有限公司 | 一种siRNA在制备餐后高血糖治疗制剂中的应用 |
Family Cites Families (37)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5310675A (en) | 1983-06-24 | 1994-05-10 | Genencor, Inc. | Procaryotic carbonyl hydrolases |
| US4760025A (en) | 1984-05-29 | 1988-07-26 | Genencor, Inc. | Modified enzymes and methods for making same |
| US5763257A (en) | 1984-05-29 | 1998-06-09 | Genencor International, Inc. | Modified subtilisins having amino acid alterations |
| EP0254735B2 (en) | 1986-01-15 | 1998-06-17 | Amgen Inc. | METHOD FOR PRODUCTION OF THERMALLY STABLE AND pH STABLE SUBTILISIN ANALOGS |
| US4980288A (en) | 1986-02-12 | 1990-12-25 | Genex Corporation | Subtilisin with increased thermal stability |
| US4914031A (en) | 1987-04-10 | 1990-04-03 | Amgen, Inc. | Subtilisin analogs |
| DK6488D0 (da) | 1988-01-07 | 1988-01-07 | Novo Industri As | Enzymer |
| CN1056187C (zh) | 1988-02-11 | 2000-09-06 | 金克克国际有限公司 | 新的蛋白水解酶及其在洗涤剂中的应用 |
| DE3909096A1 (de) | 1989-03-20 | 1990-09-27 | Garabed Antranikian | Alpha-amylase |
| US5665587A (en) | 1989-06-26 | 1997-09-09 | Novo Nordisk A/S | Modified subtilisins and detergent compositions containing same |
| DK97190D0 (da) | 1990-04-19 | 1990-04-19 | Novo Nordisk As | Oxidationsstabile detergentenzymer |
| US5482849A (en) | 1990-12-21 | 1996-01-09 | Novo Nordisk A/S | Subtilisin mutants |
| ES2121014T3 (es) | 1991-05-01 | 1998-11-16 | Novo Nordisk As | Enzimas estabilizadas y composiciones detergentes. |
| PT867504E (pt) | 1993-02-11 | 2003-08-29 | Genencor Int | Alfa-amilase estavel a oxidacao |
| DE4411223A1 (de) | 1994-03-31 | 1995-10-05 | Solvay Enzymes Gmbh & Co Kg | Verwendung alkalischer Proteasen in gewerblichen Textilwaschverfahren |
| US6187576B1 (en) | 1997-10-13 | 2001-02-13 | Novo Nordisk A/S | α-amylase mutants |
| AR015977A1 (es) | 1997-10-23 | 2001-05-30 | Genencor Int | Variantes de proteasa multiplemente substituida con carga neta alterada para su empleo en detergentes |
| CN1292028B (zh) | 1998-02-27 | 2013-08-14 | 诺维信公司 | 麦芽α淀粉酶变体 |
| US6835550B1 (en) | 1998-04-15 | 2004-12-28 | Genencor International, Inc. | Mutant proteins having lower allergenic response in humans and methods for constructing, identifying and producing such proteins |
| US6197565B1 (en) | 1998-11-16 | 2001-03-06 | Novo-Nordisk A/S | α-Amylase variants |
| WO2000060059A2 (en) | 1999-03-30 | 2000-10-12 | NovozymesA/S | Alpha-amylase variants |
| US6509185B1 (en) | 2000-01-07 | 2003-01-21 | Genencor International, Inc. | Mutant aprE promotor |
| WO2002014490A2 (en) | 2000-08-11 | 2002-02-21 | Genencor International, Inc. | Bacillus transformation, transformants and mutant libraries |
| DK1495128T3 (da) | 2002-03-29 | 2014-08-11 | Genencor Int | Forstærket proteinekspression i Bacillus |
| JP2006513692A (ja) | 2002-04-22 | 2006-04-27 | ジェネンコー・インターナショナル・インク | 様々なレベルの遺伝子発現を生じる修飾プロモーターを作成する方法 |
| DE102004047777B4 (de) | 2004-10-01 | 2018-05-09 | Basf Se | Alpha-Amylase-Varianten mit erhöhter Lösungsmittelstabilität, Verfahren zu deren Herstellung sowie deren Verwendung |
| DE102004047776B4 (de) | 2004-10-01 | 2018-05-09 | Basf Se | Gegen Di- und/oder Multimerisierung stabilisierte Alpha-Amylase-Varianten, Verfahren zu deren Herstellung sowie deren Verwendung |
| WO2006089107A1 (en) | 2005-02-18 | 2006-08-24 | Genencor International, Inc. | Polypeptides having alpha-amylase and granular starch hydrolyzing activity |
| BRPI0808513A2 (pt) | 2007-03-09 | 2014-08-19 | Danisco Us Inc Genencor Div | Variantes de alfa-amilase de espécies de bacillus alcalifílico, composições compreendendo variantes de alfa-amilase e métodos de uso |
| US20110097778A1 (en) | 2008-04-30 | 2011-04-28 | Power Scott D | Chimeric alpha-amylase variants |
| EP2186880A1 (en) | 2008-11-07 | 2010-05-19 | DSM IP Assets B.V. | Improved production of riboflavin |
| SG172806A1 (en) * | 2008-12-30 | 2011-08-29 | Danisco Us Inc | Methods of producing isoprene and a co-product |
| WO2013086219A1 (en) | 2011-12-09 | 2013-06-13 | Danisco Us Inc. | Ribosomal promotors from b. subtilis for protein production in microorganisms |
| ES2676895T5 (es) | 2013-03-11 | 2022-04-27 | Danisco Us Inc | Variantes combinatorias de alfa-amilasa |
| US20180030456A1 (en) | 2015-02-19 | 2018-02-01 | Danisco Us Inc. | Enhanced protein expression |
| CN105441512B (zh) * | 2016-01-20 | 2019-02-19 | 天津科技大学 | 一种制备低聚果糖的方法及其酶制剂 |
| CN109071615A (zh) | 2016-03-04 | 2018-12-21 | 丹尼斯科美国公司 | 用于在微生物中产生蛋白质的工程化核糖体启动子 |
-
2018
- 2018-09-05 KR KR1020207009682A patent/KR20200047668A/ko not_active Withdrawn
- 2018-09-05 US US16/647,191 patent/US20210032639A1/en not_active Abandoned
- 2018-09-05 WO PCT/US2018/049470 patent/WO2019055261A1/en not_active Ceased
- 2018-09-05 JP JP2020515233A patent/JP7218985B2/ja active Active
- 2018-09-05 CN CN201880058992.XA patent/CN111094576A/zh active Pending
- 2018-09-05 EP EP18778709.8A patent/EP3682010A1/en active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| JP2020534821A (ja) | 2020-12-03 |
| WO2019055261A1 (en) | 2019-03-21 |
| EP3682010A1 (en) | 2020-07-22 |
| US20210032639A1 (en) | 2021-02-04 |
| CN111094576A (zh) | 2020-05-01 |
| JP7218985B2 (ja) | 2023-02-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR20200047668A (ko) | 바실러스에서 증가된 단백질 생산을 위한 변형된 5'-비번역 영역(utr) 서열 | |
| US12448626B2 (en) | Compositions and methods for increased protein production in Bacillus licheniformis | |
| CN113366108B (zh) | 新颖启动子序列及其增强芽孢杆菌属细胞蛋白生产的方法 | |
| US12281316B2 (en) | Methods and compositions for efficient genetic modifications of Bacillus licheniformis strains | |
| US12534716B2 (en) | Compositions and methods for enhanced protein production in bacillus licheniformis | |
| EP3735478B1 (en) | Mutant and genetically modified bacillus cells and methods thereof for increased protein production | |
| KR102500121B1 (ko) | 향상된 단백질 발현 | |
| JP7656603B2 (ja) | バチルス属(bacillus)細胞における強化されたタンパク質産生のための組成物及び方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0105 | International application |
St.27 status event code: A-0-1-A10-A15-nap-PA0105 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| A201 | Request for examination | ||
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| T11-X000 | Administrative time limit extension requested |
St.27 status event code: U-3-3-T10-T11-oth-X000 |
|
| PC1202 | Submission of document of withdrawal before decision of registration |
St.27 status event code: N-1-6-B10-B11-nap-PC1202 |
