KR20090057072A

KR20090057072A - 척추동물 세포에 의한 비천연 아미노산의 부위 특이적 도입

Info

Publication number: KR20090057072A
Application number: KR1020097006398A
Authority: KR
Inventors: 펭 티안; 테아 노먼; 스테파니 츄
Original assignee: 암브룩스, 인코포레이티드
Priority date: 2006-09-08
Filing date: 2007-09-07
Publication date: 2009-06-03
Also published as: HK1132760A1; ATE542888T1; CA2662752C; WO2008030612A3; CN101528914A; CA2662752A1; AU2007292891B2; IL225738A; IL225738A0; NZ574673A; EP2064316A4; EP2064316A2; CN104328086A; WO2008030612A2; EP2064316B1; US20100093082A1; MX2009002524A; JP2010502221A; IL196893A0; CN101528914B

Abstract

본 발명은 척추동물 세포에서 유전적으로 코딩되는 아미노산의 수를 확장시키는 번역 성분을 제조하는 방법 및 조성물을 제공한다. 상기 번역 성분은 오르소고날 tRNA, 오르소고날 아미노아실-tRNA 합성효소, 오르소고날 tRNA/합성효소 쌍 및 비천연 아미노산을 포함한다. 척추동물 세포에서 비천연 아미노산을 포함하는 단백질 및 그 제조 방법이 또한 제공된다.

Description

척추동물 세포에 의한 비천연 아미노산의 부위 특이적 도입{SITE SPECIFIC INCORPORATION OF NON-NATURAL AMINO ACIDS BY VERTEBRATE CELLS}

본 발명은 척추동물 세포에서의 번역 생화학 분야에 관한 것이다. 본 발명은 척추동물 세포에서 오르소고날(orthogonal) tRNA, 오르소고날 합성효소 및 이들의 쌍을 제조하는 방법 및 조성물에 관한 것이다. 본 발명은 또한 비천연 아미노산의 조성물, 비천연 아미노산을 포함하는 단백질 및 척추동물 세포에서 비천연 아미노산을 포함하는 단백질을 제조하는 방법에 관한 것이다.

박테리아에서 인간에 이르기까지 알려진 모든 생물의 유전자 코드는 동일한 20종의 일반 아미노산을 코딩하다. 동일한 20종의 천연 아미노산의 상이한 조합이 광합성에서 신호 전달 및 면역반응에 이르는, 실질적으로 모든 복잡한 생명 현상을 수행하는 단백질을 형성한다. 단백질의 구조 및 기능을 연구하고 변형시키기 위하여, 과학자들은 단백질의 유전자 코드 및 아미노산 서열 모두를 조작하는 시도를 해 왔다. 그러나, 단백질을 20개의 유전적으로 코딩되는 표준 빌딩 블록으로 제한하는 유전자 코드에 의한 구속을 제거하는 것은, 셀레노시스테인(예를 들어, A. Bock et al., (1991), Molecular Microbiology 5:515-20) 및 피롤리신(예를 들어, G. Srinivasan, et al., (2002), Science 296:1459-62)의 드문 경우를 제외하고는 어려웠다.

이러한 구속을 제거하는 데 얼마간의 진전이 있었지만, 이러한 과정은 제한적이었으며, 단백질 구조 및 기능을 합리적으로 제어하는 능력은 아직 아주 초기 단계에 있다. 예를 들어, 화학자들은 작은 분자를 합성하고 그 구조를 조작하는 방법 및 전략을 개발하여 왔다(예를 들어, E. J. Corey, & X. M. Cheng, The Logic of Chemical Synthesis(Wiley-Interscience, New York, 1995)). 전합성(예를 들어, B. Merrifield, (1986), Science 232:341-7 (1986)), 및 반합성 방법(예를 들어, D. Y. Jackson et al., (1994) Science 266:243-7; and, P. E. Dawson, & S. B. Kent, (2000), Annual Review of Biochemistry 69:923-60)은 펩티드 및 작은 단백질을 합성하는 것을 가능하게 하였지만, 이런 방법들을 10 킬로 달톤(kDa)이 넘는 단백질에 사용하기에는 한계가 있다. 돌연변이 유발법도 강력하기는 하지만, 제한된 수의 구조적 변화로 한정된다. 많은 경우에, 일반 아미노산의 근사한 구조적 유사체를 경쟁적으로 도입하는 것이 가능하였다(예를 들어, R. Furter, (1998), Protein Science 7:419-26; K. Kirshenbaum, et al., (2002), ChemBioChem 3:235-7: and, V. Doring et al., (2001), Science 292:501-4).

단백질 구조 및 기능을 조작하는 능력을 확장시키려는 시도로서, 화학적으로 아실화된 오르소고날 tRNA를 사용하는 시험관내 방법이 개발되었으며, 이는 비천연 아미노산이 시험관내에서 넌센스 코돈에 응답하여 선택적으로 통합(도입)되는 것을 가능하게 하였다(예를 들어, J. A. Ellman, et al., (1992), Science 255:197-200). 신규한 구조 및 물리적 특성을 갖는 아미노산을 단백질 내로 선택적으로 도 입하여 단백질 폴딩 및 안정성, 생분자 인식 및 촉매 작용을 연구하였다(예를 들어, D. Mendel, et al., (1995), Annual Review of Biophysics and Biomolecular Structure 24:435-462; and, V. W. Cornish, et al., (Mar. 31, 1995), Angewandte Chemie-International Edition in English 34:621-633). 그러나, 이러한 과정의 화학량론적 특성으로 인해 제조될 수 있는 단백질의 양은 극히 제한되었다.

비천연 아미노산을 세포 내로 미세주사하였다. 예를 들어, 비천연 아미노산을 화학적으로 잘못 아실화된(misacylated) 테트라하이메나 써모필라(Tetrahymena thermophila) tRNA(예를 들어, M.E. Saks, et al., (1996), An engineered Tetrahymena tRNAGln for in vivo incorporation of unnatural amino acids into proteins by nonsense suppression, J. Biol. Chem. 271:23169-23175) 및 관련 mRNA를 미세주사하여 제노푸스(Xenopus) 난모 세포 중 니코틴 아세틸콜린 수용체 내로 도입하였다(예를 들어, M.W. Nowak, et al., (1998), In vivo incorporation of unnatural amino acids into ion channels in Xenopus oocyte expression system, Method Enzymol. 293:504-529). 이에 의해 독특한 물리적 또는 화학적 성질을 갖는 측쇄를 함유하는 아미노산을 도입함으로써 난모 세포 중 수용체의 상세한 생물물리학적 연구를 할 수 있었다(D. A. Dougherty (2000), Unnatural amino acids as probes of protein structure and function, Curr. Opin. Chem. Biol. 4:645-6520). 불행하게도, 이 방법도 미세주사될 수 있는 세포 중의 단백질에 한정적으로만 사용될 수 있는데, 관련 tRNA는 시험관내에서 화학적으로 아실화되어 재아실화될 수 없기 때문에 단백질의 수율은 매우 낮다.

이 한계를 극복하기 위하여, 원핵 세포 에스케리치아 콜라이(Escherichia coli)의 단백질 생합성 기구에 새로운 성분을 가하였으며(예를 들어, L. Wang, et al., (2001), Science 292:498-500), 이에 의해 생체내 비천연 아미노산을 유전적으로 코딩하는 것이 가능하게 되었다. 이 방법을 이용하여 신규 화학적, 물리적 또는 생물학적 특성을 갖는 다수의 새로운 아미노산, 비제한적인 예로서, 광친화도 표지, 및 광이성질체화 가능한 아미노산, 케토 아미노산 및 글리코실화 아미노산이 이 콜라이 중에서 앰버 코돈 TAG에 응답하여 단백질 내로 높은 신뢰도 및 효율로 도입되어 왔다(예를 들어, J. W. Chin et al., (2002), Journal of the American Chemical Society 124:9026-9027; J. W. Chin, & P. G. Schultz, (2002), ChemBioChem 11:1135-1137; J. W. Chin, et al., (2002), PNAS United States of America 99:11020-11024: and, L. Wang, & P. G. Schultz, (2002), Chem. Comm., 1-10). 그러나, 원핵 세포 및 진핵 세포의 번역 기구는 매우 보존적이지는 않다. 따라서, 이 콜라이에 가해진 생합성 기구의 성분은 종종 척추동물 세포 내에서 단백질 내로 비천연 아미노산을 도입하는 데 부위 특이적으로 사용되지 않을 수 있다. 예를 들어, 이 콜라이에서 사용되었던 메타노코커스 자니쉬( Methanococcus jannaschii ) 타이로실-tRNA 합성효소/tRNA 쌍은 척추동물 세포에서 오르소고날하지 않다. 또한, 원핵 세포가 아닌 진핵 세포에서의 tRNA 전사는 RNA 폴리머라제 III에 의해 수행되며, 이는 척추동물 세포에서 전사될 수 있는 tRNA 구조 유전자의 일차 서열에 제한을 두고 있다. 더구나, 원핵 세포와는 대조적으로, 척추동물 세포 중의 tRNA는 이들이 전사되는 장소인 핵으로부터 이출되어 세포질로 들어감으로써 번역 시에 기능을 할 수 있다. 마지막으로, 척추동물 80S 리보좀은 70S 원핵 세포 리보좀과는 차이가 있다. 따라서, 척추동물 유전자 코드를 확장하기 위해서 개선된 생합성 기구 성분을 개발할 필요가 있다. 본 발명은 하기 개시내용으로부터 명백해지는 바와 같이, 위와 같은 또한 다른 필요를 충족시키기 위한 것이다.

[발명의 개요]

본 발명은 척추동물 세포에서 성장하는 폴리펩티드 사슬에 비천연 아미노산을 통합시키기 위해 척추동물 단백질 생합성 기구에 사용되는 번역 성분, 예를 들어, 오르소고날 아미노아실-tRNA 합성효소(O-RS)와 오르소고날 tRNA(O-tRNA)의 쌍 및 이들의 개별 성분을 갖는 척추동물 세포를 제공한다.

본 발명의 조성물은 척추동물 세포에서 오르소고날 tRNA(O-tRNA)를 적어도 하나의 비천연 아미노산으로 우선적으로 아미노아실화하는 오르소고날 아미노아실-tRNA 합성효소(O-RS)(예를 들어, 에스케리치아 콜라이, 바실러스 스테아로써모필러스 등의 비척추동물 유기체로부터 유래된)를 포함하는 척추동물 세포(예를 들어, 포유류 세포, 조류 세포, 어류 세포, 파충류 세포, 양서류 세포, 비포유류 동물로부터 유래한 세포 등)를 포함한다. 경우에 따라, 2 이상의 O-tRNA가 주어진 척추동물 세포에서 아미노아실화될 수 있다. 일 측면에 있어서, O-RS는 O-tRNA를 비천연 아미노산으로, 예컨대, 서열 번호 86 또는 45에 개시된 아미노산 서열을 갖는 O-RS가 아미노아실화하는 것의, 예를 들어, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 60%, 적어도 75%, 적어도 80%, 또는 심지어 90% 또는 그 이상의 효율로 아미노아실화한다. 일 실시태양에 있어서, 본 발명의 O-RS는 O-tRNA를 비천연 아미노산으로, O-RS가 O-tRNA를 천연 아미노산으로 아미노아실화하는 것보다, 예를 들어, 적어도 10배, 적어도 20배, 적어도 30배 더 큰 효율로 아미노아실화한다.

일 실시태양에 있어서, O-RS 또는 그 일부분은 서열 번호 3 내지 35 중 어느 하나에 개시된 폴리뉴클레오티드 서열 또는 이의 상보적 폴리뉴클레오티드 서열에 의해 코딩된다. 또 다른 실시태양에 있어서, O-RS는 서열 번호 36 내지 63 및/또는 86 중 어느 하나에 개시된 아미노산 서열 또는 이의 보존적 변이체를 포함한다. 또 다른 실시태양에 있어서, O-RS는 천연 타이로실 아미노아실-tRNA 합성효소(TyrRS)의 아미노산 서열과, 예를 들어, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 또는 그 이상 동일하며, 그룹 A 내지 E로부터의 2 이상의 아미노산 치환을 포함하는 아미노산 서열을 포함한다. 그룹 A는 이 콜라이 TyrRS의 Tyr37에 상응하는 위치에 발린, 이소루신, 루신, 글리신, 세린, 알라닌 또는 트레오닌을 포함하고; 그룹 B는 이 콜라이 TyrRS의 Asn126에 상응하는 위치에 아스파르테이트를 포함하며; 그룹 C는 이 콜라이 TyrRS의 Asp182에 상응하는 위치에 트레오닌, 세린, 아르기닌, 아스파라긴 또는 글리신을 포함하고; 그룹 D는 이 콜라이 TyrRS의 Phe183에 상응하는 위치에 메티오닌, 알라닌, 발린 또는 타이로신을 포함하고; 그룹 E는 이 콜라이 TyrRS의 Leu186에 상응하는 위치에 세린, 메티오닌, 발린, 시스테인, 트레오닌 또는 알라닌을 포함한다.

또 다른 실시태양에 있어서, O-RS는 천연 아미노산에 비교하여 비천연 아미노산에 대해 하나 이상의 개선된 또는 증진된 효소 특성을 나타낸다. 예를 들어, 천연 아미노산에 비하여 비천연 아미노산에 대한 개선된 또는 증진된 효소 특성은, 예를 들어, 보다 높은 Km, 보다 낮은 Km, 보다 높은 kcat, 보다 낮은 kcat, 보다 낮은 kcat/km, 보다 높은 kcat/km 등을 포함한다.

척추동물 세포는 또한 경우에 따라 비천연 아미노산을 포함한다. 척추동물 세포는 경우에 따라 오르소고날 tRNA(O-tRNA)(예를 들어, 에스케리치아 콜라이, 바실러스 스테아로써모필러스 등의 비척추동물 유기체로부터 유래된)를 포함하며, O-tRNA는 셀렉터 코돈을 인식하며, O-RS에 의해 비천연 아미노산으로 우선적으로 아미노아실화된다. 일 측면에 있어서, O-tRNA는 단백질 내로의 비천연 아미노산의 도입을, 예를 들어, 서열 번호 65에 개시된 폴리뉴클레오티드 서열을 포함하거나 세포에서 그로부터 프로세싱된 tRNA의 효율의 적어도 45%, 적어도 50%, 적어도 60%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 또는 99% 이상의 효율로 매개한다. 또 다른 측면에 있어서, O-tRNA는 서열 번호 65의 서열을 포함하며, O-RS는 서열 번호 36 내지 63 및/또는 86 중 어느 하나에 개시된 아미노산 서열 및/또는 이의 보존적 변이체로부터 선택된 폴리펩티드 서열을 포함한다.

또 다른 실시태양에 있어서, 척추동물 세포는 관심있는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산을 포함하는데, 그 폴리뉴클레오티드는 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함한다. 일 측면에 있어서, 비천연 아미노산을 포함하는 관심있는 폴리펩티드의 수율은, 셀렉터 코돈이 없는 폴리뉴클레오티드에 의해 세포로부터 얻어지는 관심있는 천연 폴리펩티드에 대해 얻어지는 수율의, 예를 들어, 적어도 2.5%, 적어도 5%, 적어도 10%, 적어도 25%, 적어도 30%, 적어도 40%, 50% 또는 그 이상이다. 또 다른 측면에 있어서, 세포는 비천연 아미노산의 부재하에 관심있는 폴리펩티드를, 비천연 아미노산 존재하의 폴리펩티드의 수율의, 예를 들어, 35% 미만, 30% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 2.5% 미만의 수율로 제조한다.

본 발명은 또한 오르소고날 아미노아실-tRNA 합성효소(O-RS), 오르소고날 tRNA(O-tRNA), 비천연 아미노산, 및 관심있는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산을 포함하는 척추동물 세포를 제공한다. 폴리뉴클레오티드는 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함한다. 또한, O-RS는 척추동물 세포에서 오르소고날 tRNA(O-tRNA)를 비천연 아미노산으로 우선적으로 아미노아실화하며, 세포는 비천연 아미노산의 부재하에 관심있는 폴리펩티드를, 비천연 아미노산 존재하의 폴리펩티드의 수율의, 예를 들어, 35% 미만, 30% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 2.5% 미만의 수율로 제조한다.

오르소고날 tRNA(O-tRNA)를 포함하는 척추동물 세포를 포함하는 조성물 또한 본 발명의 특징이다. 일반적으로, O-tRNA는 생체내에서 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질 내로 비천연 아미노산의 도입을 매개한다. 일 실시태양에 있어서, O-tRNA는 단백질 내로의 비천연 아미노산의 도입을, 서열 번호 65에 개시된 폴리뉴클레오티드를 포함하거나 세포 내에서 그로부터 프로세싱된 tRNA 효율의, 예를 들어, 적어도 45%, 적어도 50%, 적어도 60%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 또는 심지어 99% 또는 그 이상의 효율로 매개한다. 또 다른 실시태양에 있어서, O-tRNA는 서열 번호 65에 개시된 폴리뉴클레오티드 서열 또는 이의 보존적 변이체를 포함하거나 세포에서 그로부터 프로세싱된다. 또 다른 실시태양에 있어서, O-tRNA는 재생 가능한 O-tRNA를 포함한다.

본 발명의 일 측면에 있어서, 상기 O-tRNA는 전사후 변형된다. 본 발명은 또한 척추동물 세포에서 O-tRNA를 코딩하는 핵산 또는 이의 상보적 폴리뉴클레오티드를 제공한다. 일 실시태양에 있어서, 상기 핵산은 A 박스 및 B 박스를 포함한다.

본 발명은 또한 번역 성분, 예컨대, O-RS 또는 O-tRNA/O-RS 쌍을 제조하는 방법(및 이들 방법에 의해 제조된 번역 성분)을 특징으로 한다. 예를 들어, 본 발명은 척추동물 세포에서 오르소고날 tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 오르소고날 아미노아실-tRNA 합성효소(O-RS)를 제조하는 방법을 제공한다. 이와 같은 방법은, 예를 들어, (a) 제1 종의 척추동물 세포 집단[척추동물 세포는 각각 i) 아미노아실-tRNA 합성효소(RS) 라이브러리의 구성원, ii) 오르소고날 tRNA(O-tRNA), iii) 양성 선택 마커를 코딩하는 폴리뉴클레오티드, 및 iv) 음성 선택 마커를 코딩하는 폴리뉴클레오티드를 포함함]을 비천연 아미노산 존재하에 양성 선택하는 단계(이때 양성 선택을 극복하는 세포는 비천연 아미노산 존재하에 오르소고날 tRNA(O-tRNA)를 아미노아실화하는 활성 RS를 포함함)를 포함한다. 이어서, (b) 양성 선택을 극복한 세포를 비천연 아미노산 부재하에 음성 선택하여 O-tRNA를 천연 아미노산으로 아미노아실화하는 활성 RS를 제거한다. 이러한 과정은 O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 O-RS를 제공한다.

일부 실시태양에 있어서, 양성 선택 마커를 코딩하는 폴리뉴클레오티드는 반응 요소에 작동 가능하게 연결되어 있고, 세포는 a) 반응 요소로부터의 전사를 조절하는 전사 조절인자 단백질(예를 들어, 척추동물 전사 조절인자 단백질 등)을 코딩하며, b) 적어도 하나의 셀렉터 코돈을 포함하는 폴리뉴클레오티드를 더 포함한다. 비천연 아미노산으로 아미노아실화된 O-tRNA에 의한 전사 조절인자 단백질 내로의 비천연 아미노산의 도입은 양성 선택 마커의 전사로 이어진다. 일 실시태양에 있어서, 전사 조절인자 단백질은 전사 활성화 인자 단백질(예를 들어, GAL4 등)이고, 셀렉터 코돈은 앰버 종결 코돈으로서, 앰버 종결 코돈이 전사 활성화 인자 단백질의 DNA 결합 도메인을 코딩하는 폴리뉴클레오티드의 부분 내에 또는 실질적으로 그에 근접하여 위치한다.

양성 선택 마커는 각종 분자 중 임의의 것일 수 있다. 일 실시태양에 있어서, 양성 선택 마커는 성장을 위한 영양 보충물을 포함하며, 선택은 그 영양 보충물이 결여된 배지에서 이루어진다. 또 다른 실시태양에 있어서, 양성 선택 마커를 코딩하는 폴리뉴클레오티드는, 예를 들어, ura3, leu2, lys2, lacZ 유전자, his3(예를 들어, his3 유전자가 이미다졸 글리세롤 포스페이트 탈수소효소를 코딩하는 경우, 3-아미노트리아졸(3-AT)을 제공함으로써 검출됨) 등이다. 또 다른 실시태양에 있어서, 양성 선택 마커를 코딩하는 폴리뉴클레오티드는 셀렉터 코돈을 포함한다.

양성 선택 마커에서와 같이, 음성 선택 마커도 다양한 분자 중 어느 것이나 가능하다. 일부 실시태양에 있어서, 음성 선택 마커를 코딩하는 폴리뉴클레오티드는 그로부터 전사 조절인자 단백질에 의해 전사가 매개되는 반응 요소에 작동 가능하게 연결되어 있다. 비천연 아미노산으로 아미노아실화된 O-tRNA에 의한 전사 조절인자 단백질 내로의 비천연 아미노산의 도입은 음성 선택 마커의 전사로 이어진다. 일 실시태양에 있어서, 음성 선택 마커를 코딩하는 폴리뉴클레오티드는, 예를 들어, ura3 유전자이며, 음성 선택은 5-플루오로오로트산(5-FOA)을 포함하는 배지 상에서 수행된다. 또 다른 실시태양에 있어서, 음성 선택에 사용되는 배지는 음성 선택 마커에 의해 검출 가능한 물질로 전환되는 선택제 또는 스크리닝제를 포함한다. 본 발명의 일 측면에 있어서, 검출 가능한 물질은 독성 물질이다. 일 실시태양에 있어서, 음성 선택 마커를 코딩하는 폴리뉴클레오티드는 셀렉터 코돈을 포함한다.

일부 실시태양에 있어서, 양성 선택 마커 및/또는 음성 선택 마커는 적절한 반응물의 존재하에 형광을 내거나 발광 반응을 촉진하는 폴리펩티드를 포함한다. 본 발명의 일 측면에 있어서, 양성 선택 마커 및/또는 음성 선택 마커는 형광 활성화된 세포 분류(FACS) 또는 발광에 의해 검출된다. 일부 실시태양에 있어서, 양성 선택 마커 및/또는 음성 선택 마커는 친화도에 기초한 스크리닝 마커, 또는 전사 조절인자 단백질을 포함한다. 일 실시태양에 있어서, 하나의 같은 폴리뉴클레오티드가 양성 선택 마커 및 음성 선택 마커를 둘 다 코딩한다.

일 실시태양에 있어서, 본 발명의 양성 선택 마커 및/또는 음성 선택 마커를 코딩하는 폴리뉴클레오티드는 적어도 2개의 셀렉터 코돈을 포함할 수 있으며, 셀렉터 코돈 각각 또는 둘 다가 적어도 2개의 상이한 셀렉터 코돈을 포함하거나 적어도 2개의 동일한 셀렉터 코돈을 포함할 수 있다.

추가 수준의 선택/스크리닝 엄격도가 또한 본 발명의 방법에 사용될 수 있다. 일 실시태양에 있어서, 그 방법은 단계 (a), (b) 또는 (a)와 (b) 두 단계 모두에 변화하는 양의 불활성 합성효소를 제공하는 것을 포함할 수 있으며, 여기서 변화하는 양의 불활성 합성효소가 추가 수준의 선택 또는 스크리닝 엄격도를 제공한다. 일 실시태양에 있어서, O-RS를 제조하는 방법의 단계 (a), (b) 또는 (a)와 (b) 두 단계 모두는, 예를 들어, 양성 및/또는 음성 선택 마커의 선택 또는 스크리닝 엄격도를 변화시키는 것을 포함한다. 방법은 경우에 따라 0-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 O-RS에 추가의 선택 회차, 예를 들어, 추가의 양성 선택 회차, 추가의 음성 선택 회차, 또는 양성 및 음성 선택을 둘 다 조합한 회차를 수행하는 것을 포함한다.

일 실시태양에 있어서, 선택 또는 스크리닝 과정은 1회 이상의 양성 또는 음성 선택 또는 스크리닝을 포함할 수 있으며, 이는 예를 들어, 아미노산 투과성에 있어서의 변화, 번역 효율에 있어서의 변화, 번역 신뢰도에 있어서의 변화 등을 포함한다. 하나 이상의 변화는 단백질을 제조하는 데 사용되는 오르소고날 tRNA-tRNA 합성효소 쌍의 성분을 코딩하는 하나 이상의 폴리뉴클레오티드에 있어서의 돌연변이에 기초한다.

일반적으로, RS의 라이브러리(예를 들어, 돌연변이 RS의 라이브러리)는 적어도 하나의, 예컨대, 비척추동물 유기체로부터의 아미노아실-tRNA 합성효소(RS)로부터 유래된 RS를 포함한다. 일 실시태양에 있어서, RS 라이브러리는 불활성 RS로부터 유래하며, 예컨대, 활성 RS를 돌연변이 유발시켜 불활성 RS를 제조한 경우이다. 또 다른 실시태양에 있어서, 불활성 RS는 아미노산 결합 포켓을 포함하며, 아미노산 결합 포켓을 구성하는 하나 이상의 아미노산은 하나 이상의 다른 아미노산으로 치환되고, 예컨대, 치환된 아미노산은 알라닌으로 치환된 경우가 있다.

일부 실시태양에 있어서, O-RS를 제조하는 방법은 추가로 RS를 코딩하는 핵산 상에 무작위 돌연변이 유발, 부위 특이적 돌연변이 유발, 재조합, 키메라 제작 또는 이들의 조합 등을 수행함으로써, 돌연변이 RS 라이브러리를 제조하는 것을 포함한다. 일부 실시태양에 있어서, 방법은 추가로, 예를 들어, (c) O-RS를 코딩하는 핵산을 단리하는 단계; (d) 핵산으로부터 돌연변이된 O-RS를 코딩하는 한 세트의 폴리뉴클레오티드를 제조하는 단계(예를 들어, 무작위 돌연변이 유발, 부위 특이적 돌연변이 유발, 재조합, 키메라 제작 또는 이들의 임의의 조합에 의하여); 및 (e) O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 돌연변이된 O-RS가 얻어질 때까지 단계 (a) 및/또는 (b)를 반복하는 단계를 포함한다. 본 발명의 일 측면에 있어서, 단계 (c) 내지 (e)는 적어도 2회 수행된다.

O-tRNA/O-RS 쌍을 제조하는 방법 역시 본 발명의 특징이다. 일 실시태양에 있어서, O-RS는 상기한 바와 같이 얻어지며, O-tRNA는 제1 종의 척추동물 세포(척추동물 세포는 tRNA 라이브러리의 구성원을 포함함)의 집단을 음성 선택하여, 척추동물 세포에 내인성인 아미노아실-tRNA 합성효소(RS)에 의해 아미노아실화되는 tRNA 라이브러리의 구성원을 포함하는 세포를 제거하는 단계에 의해 얻어진다. 이는 제1 종의 척추동물 세포에 오르소고날한 tRNA의 풀(pool)을 제공한다. 본 발명의 일 측면에 있어서, tRNA의 라이브러리는 적어도 하나의, 예를 들어, 비척추동물 유기체로부터의 tRNA로부터 유래되는 tRNA를 포함한다. 본 발명의 또 다른 측면에 있어서, 아미노아실-tRNA 합성효소(RS)의 라이브러리는 적어도 하나의, 예컨대, 비척추동물 유기체로부터의 아미노아실-tRNA 합성효소(RS)로부터 유래되는 RS를 포함한다. 본 발명의 또 다른 측면에 있어서, tRNA의 라이브러리는 적어도 하나의, 제1의 비척추동물 유기체로부터의 tRNA로부터 유래되는 tRNA를 포함한다. 아미노아실-tRNA 합성효소(RS)의 라이브러리는 경우에 따라 적어도 하나의 제2의 비척추동물 유기체로부터의 아미노아실-tRNA 합성효소(RS)로부터 유래되는 RS를 포함한다. 일 실시태양에 있어서, 제1 및 제2 비척추동물 유기체는 동일하다. 다른 식으로, 제1 및 제2의 비척추동물 유기체는 다를 수 있다. 본 발명의 방법에 의해 제조된 특이적 O-tRNA/O-RS 쌍 역시 본 발명의 특징이다.

본 발명의 또 다른 특징은 하나의 종에서 번역 성분을 제조하고, 선택/스크리닝된 번역 성분을 제2의 종으로 도입하는 방법이다. 예를 들어, 제1의 종(예를 들어, 효모 등의 척추동물 종)에서 O-tRNA/O-RS 쌍을 제조하는 방법은 O-tRNA를 코딩하는 핵산 및 O-RS를 코딩하는 핵산을 제2의 종(예를 들어, 포유동물, 곤충, 진균류, 조류, 식물 등)의 척추동물 세포로 도입하는 단계를 추가로 포함한다. 제2의 종은 도입된 번역 성분을 사용하여 생체내에서, 예컨대, 번역시에 비천연 아미노산을 성장하는 폴리펩티드 사슬 내로 통합시킬 수 있다.

또 다른 실시태양에 있어서, 척추동물 세포에서 오르소고날 tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 오르소고날 아미노아실-tRNA 합성효소(O-RS)를 제조하는 방법은, (a) 제1 종(예를 들어, 효모 등과 같은 척추동물 종)의 척추동물 세포의 집단을, 비천연 아미노산의 존재하에 양성 선택하는 단계를 포함한다. 제1 종의 척추동물 세포는 각각 i) 아미노아실-tRNA 합성효소(RS) 라이브러리의 구성원, ii) 오르소고날 tRNA(O-tRNA), iii) 양성 선택 마커를 코딩하는 폴리뉴클레오티드, 및 iv) 음성 선택 마커를 코딩하는 폴리뉴클레오티드를 포함한다. 양성 선택을 극복하는 세포는 비천연 아미노산의 존재하에 오르소고날 tRNA(O-tRNA)를 아미노아실하는 활성 RS를 포함한다. 양성 선택을 극복한 세포를 비천연 아미노산의 부재하에 음성 선택하여 O-tRNA를 천연아미노산으로 아미노아실화하는 활성 RS를 제거함으로써, O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 O-RS를 제공한다. O-tRNA를 코딩하는 핵산 및 O-RS를 코딩하는 핵산을 제2의 종(예를 들어, 포유동물, 곤충, 진균, 조류, 식물 등)의 척추동물 세포 내로 도입한다. 이들 성분은 제2의 종 내에서 번역될 때 사용되어 제2의 종에서 비천연 아미노산을 관심있는 단백질 또는 폴리펩티드 내에 통합시킬 수 있다. 일 실시태양에 있어서, O-tRNA 및/또는 O-RS를 제2의 종의 척추동물 세포 내로 도입한다.

일부 실시태양에 있어서, O-tRNA는 제1의 종의 척추동물 세포(척추동물 세포는 tRNA 라이브러리의 구성원을 포함함)를 음성 선택하여, 척추동물 세포에 내인성인 아미노아실-tRNA 합성효소(RS)에 의해 아미노아실화되는 tRNA 라이브러리의 구성원을 포함하는 세포를 제거하는 단계를 포함한다. 이 과정은 제1 종 및 제2 종의 척추동물 세포에 오르소고날한 tRNA의 풀을 제공한다.

적어도 하나의 비천연 아미노산을 갖는 단백질(또는 관심있는 폴리펩티드)도 또한 본 발명의 특징이다. 본 발명의 일부 실시태양에 있어서, 적어도 하나의 비천연 아미노산을 갖는 단백질은 적어도 하나의 번역후 변형을 포함한다. 일 실시태양에 있어서, 적어도 하나의 번역후 변형은 제2의 반응성 기를 포함하는 분자(예를 들어, 염료, 폴리에틸렌 글리콜 유도체와 같은 중합체, 광가교결합제, 세포독성 화합물, 친화도 표지, 비오틴 유도체, 수지, 제2 단백질 또는 폴리펩티드, 금속 킬레이터, 보조 인자, 지방산, 탄수화물, 폴리뉴클레오티드(예를 들어, DNA, RNA 등) 등)를 [3+2] 고리화 첨가 반응에 의해 제1의 반응성 기를 포함하는 적어도 하나의 비천연 아미노산에 부착시키는 것을 포함한다. 예를 들어, 제1의 반응성 기는 알키닐 잔기(예를 들어, 비천연 아미노산 p-프로파길옥시페닐알라닌 중, 이 기는 또한 종종 아세틸렌 잔기라고도 불리움)이고, 제2의 반응성 기는 아지도 잔기이다. 또 다른 예에서, 제1의 반응성 기는 아지도 잔기(예를 들어, 비천연 아미노산 p-아지도-L-페닐알라닌 중)이고, 제2의 반응성 기는 알키닐 잔기이다. 일부 실시태양에 있어서, 본 발명의 단백질은 적어도 하나의 번역후 변형을 포함하는 적어도 하나의 비천연 아미노산(예를 들어, 케토 비천연 아미노산)을 포함하며, 여기서 적어도 하나의 번역후 변형은 당류 잔기를 포함한다. 일부 실시태양에 있어서, 번역후 변형은 척추동물 세포 생체내에서 만들어진다.

일부 실시태양에 있어서, 단백질은 척추동물 세포 생체내에서 만들어지는 적어도 하나의 번역후 변형을 포함하며, 그러한 번역후 변형은 원핵생물 세포에서는 일어나지 않는 것이다. 번역후 변형의 예는 아세틸화, 아실화, 지질 변형, 팔미토일화, 팔미테이트 부가, 포스포릴화, 당지질 결합 변형 등을 포함하나, 이에 한정되는 것은 아니다. 일 실시태양에 있어서, 번역후 변형은 올리고당을 아스파라긴에 GlcNAc-아스파라긴 결합[예를 들어, 올리고당이 (GlcNAc-Man)₂-Man-GlcNAc-GlcNAc 등을 포함하는 경우 등]를 통해 부착시키는 것을 포함한다. 또 다른 실시태양에 있어서, 번역후 변형은 올리고당(예를 들어, Gal-GalNAc, Gal-GlcNAc 등)를 세린 또는 트레오닌에 GalNAc-세린, GalNAc-트레오닌, GlcNAc-세린 또는 GlcNAc-트레오닌 결합을 통해 부착시키는 것을 포함한다. 일부 실시태양에 있어서, 본 발명의 단백질 또는 폴리펩티드는 분비 또는 편재화 서열, 에피토프 태그, FLAG 태그, 폴리히스티딘 태그, GST 융합부 등을 포함할 수 있다.

일반적으로, 단백질은 임의의 이용 가능한 단백질(예를 들어, 치료용 단백질, 진단용 단백질, 산업용 효소 또는 이들의 일부분 등)과, 예를 들어, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 또는 심지어 적어도 99% 또는 그 이상 동일하며, 하나 이상의 비천연 아미노산을 포함한다. 일 실시태양에 있어서, 본 발명의 조성물은 관심있는 단백질 또는 폴리펩티드와 부형제(예를 들어, 완충제, 제약상 허용 가능한 부형제 등)를 포함한다.

관심있는 단백질 또는 폴리펩티드는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 또는 10개 또는 그 이상의 비천연 아미노산을 함유할 수 있다. 비천연 아미노산은 동일하거나 상이할 수 있으며, 단백질 내에 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 그 이상의 상이한 비천연 아미노산을 포함하는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 그 이상의 상이한 위치가 있을 수 있다. 일부 실시태양에 있어서, 단백질의 천연 형태에 존재하는 적어도 하나, 그러나 전부보다는 작은 수의 아미노산이 비천연 아미노산으로 치환된다.

단백질(또는 관심있는 폴리펩티드)의 예로는 사이토카인, 성장 인자, 성장 인자 수용체, 인터페론, 인터루킨, 염증 분자, 암유전자 생성물, 펩티드 호르몬, 신호 전달 분자, 스테로이드 호르몬 수용체, 에리스로포이에틴(EPO), 인슐린, 인간 성장 호르몬, 알파-1 안티트립신, 안지오스타틴, 항용혈 인자, 항체, 아포지단백질, 아포단백질, 심방 나트륨 이뇨 인자, 심방 나트륨 이뇨 폴리펩티드, 심방 펩티드, C-X-C 케모카인, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG, 칼시토닌, c-kit 리간드, 사이토카인, CC 케모카인, 단핵구 화학유인 단백질-1, 단핵구 화학유인 단백질-2, 단핵구 화학유인 단백질-3, 단핵구 염증 단백질-1 알파, 단핵구 염증 단백질-1 베타, RANTES, I309, R83915, R91733, HCC1, T58847, D31065, T64262, CD40, CD40 리간드, c-kit 리간드, 콜라겐, 콜로니 자극 인자(CSF), 보체 인자 5a, 보체 억제제, 보체 수용체 1, 사이토카인, DHFR, 상피세포 호중구 활성화 펩티드-78, GROα/MGSA, GROβ, GROγ, MIP-1α, MIP-1δ, MCP-1, 상피세포 성장 인자(EGF), 상피세포 호중구 활성화 펩티드, 에리스로포이에틴(EPO), 박리 독소(exfoliating toxin), 인자 IX, 인자 VII, 인자 VIII, 인자 X, 섬유아세포 성장 인자(FGF), 피브리노겐, 피브로넥틴, G-CSF, GM-CSF, 글루코세레브로시다제, 고나도트로핀, 성장 인자, 성장 인자 수용체, 헤지호그(Hedgehog) 단백질, 헤모글로빈, 간세포 성장 인자(HGF), 히루딘, 인간 혈청 알부민, ICAM-1, ICAM-1 수용체, LFA-1, LFA-1 수용체, 인슐린, 인슐린 유사 성장 인자(IGF), IGF-I, IGF-II, 인터페론, IFN-α, IFN-β, IFN-γ, 인터루킨, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, 각질 세포 성장 인자(KGF), 락토페린, 백혈병 억제 인자, 루시퍼라제, 뉴투린, 호중구 억제 인자(NIF), 온코스타틴 M, 골원성 단백질, 암유전자 생성물, 부갑상선 호르몬, PD-ECSF, PDGF, 펩티드 호르몬, 인간 성장 호르몬, 플레이오트로핀, 단백질 A, 단백질 G, 발열성 외독소 A, B 또는 C, 릴렉신, 레닌, SCF, 가용성 보체 수용체 I, 가용성 I-CAM 1, 가용성 인터루킨 수용체, 가용성 TNF 수용체, 소마토메딘, 소마토스타틴, 소마토트로핀, 스트렙토키나제, 슈퍼항원, 스타필로코커스 장독소, SEA, SEB, SEC1, SEC2, SEC3, SED, SEE, 스테로이드 호르몬 수용체, 슈퍼옥시드 디스뮤타제(SOD), 독성 쇼크 증후군 독소, 티모신 알파 1, 조직 플라스미노겐 활성화 인자, 종양 성장 인자(TGF), TGF-α, TGF-β, 종양 괴사 인자, 종양 괴사 인자 알파, 종양 괴사 인자 베타, 종양 괴사 인자 수용체(TNFR), VLA-4 단백질, VCAM-1 단백질, 혈관 내피세포 성장 인자(VEGEF), 유로키나제, Mos, Ras, Raf, Met; p53, Tat, Fos, Myc, Jun, Myb, Rel, 에스트로겐 수용체, 프로게스테론 수용체, 테스토스테론 수용체, 알도스테론 수용체, LDL 수용체, SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1, ICAM-1/LFA-1, 히알루린/CD44 및 코르티코스테론, 진뱅크(Genbank) 또는 다른 데이터베이스에 존재하는 단백질 등, 또는 이들의 일부분을 포함하나, 이에 한정되는 것은 아니다. 일 실시태양에 있어서, 관심있는 폴리펩티드는 전사 조절인자 단백질(예를 들어, 전사 활성화 인자 단백질(GAL4 등), 또는 전사 억제제 단백질 등) 또는 그 일부분을 포함한다.

본 발명의 척추동물 세포는 비천연 아미노산을 포함하는 단백질을 많은 유용한 양으로 합성하는 능력을 제공한다. 예를 들어, 비천연 아미노산을 포함하는 단백질은 세포 추출물, 완충액, 제약상 허용 가능한 부형제 등에, 예컨대, 적어도 10 ㎍(단백질)/ℓ, 적어도 50 ㎍/ℓ, 적어도 75 ㎍/ℓ, 적어도 100 ㎍/ℓ, 적어도 200 ㎍/ℓ, 적어도 250 ㎍/ℓ, 또는 적어도 500 ㎍/ℓ 또는 그 이상의 농도로 제조될 수 있다. 일부 실시태양에 있어서, 본 발명의 조성물은 비천연 아미노산을 포함하는 단백질을, 예를 들어, 적어도 10 ㎍, 적어도 50 ㎍, 적어도 75 ㎍, 적어도 100 ㎍, 적어도 200 ㎍, 적어도 250 ㎍, 또는 적어도 500 ㎍ 또는 그 이상 포함한다.

일부 실시태양에 있어서, 관심있는 단백질 또는 폴리펩티드(또는 그 일부분)는 핵산에 의해 코딩된다. 일반적으로는, 핵산은 적어도 1개의 셀렉터 코돈, 적어도 2개의 셀렉터 코돈, 적어도 3개의 셀렉터 코돈, 적어도 4개의 셀렉터 코돈, 적어도 5개의 셀렉터 코돈, 적어도 6개의 셀렉터 코돈, 적어도 7개의 셀렉터 코돈, 적어도 8개의 셀렉터 코돈, 적어도 9개의 셀렉터 코돈, 또는 10개 또는 그 이상의 셀렉터 코돈을 포함한다.

본 발명은 또한 척추동물 세포에서 적어도 하나의 비천연 아미노산을 포함하는 적어도 하나의 단백질을 제조하는 방법(그러한 방법에 의해 제조된 단백질뿐만 아니라)을 제공한다. 그 방법은, 예를 들어, 적절한 배지 중에서 적어도 하나의 셀렉터 코돈을 포함하며, 단백질을 코딩하는 핵산을 포함하는 척추동물 세포를 배양하는 것을 포함한다. 척추동물 세포는 또한 세포 내에서 기능하고, 셀렉터 코돈을 인식하는 오르소고날 tRNA(O-tRNA), 및 O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실하는 오르소고날 아미노아실 tRNA 합성효소(O-RS)를 포함하며, 배지는 비천연 아미노산을 포함한다. 일 실시태양에 있어서, O-RS는 O-tRNA를 비천연 아미노산으로, 예를 들어, 서열 번호 86 또는 45에 개시된 아미노산 서열을 갖는 O-RS가 아미노아실화하는 효율의, 예를 들어, 적어도 45%, 적어도 50%, 적어도 60%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 또는 심지어 99% 또는 그 이상의 효율로 아미노아실화한다. 또 다른 실시태양에 있어서, O-tRNA는 서열 번호 64 또는 65 또는 이의 상보적 폴리뉴클레오티드 서열을 포함하거나, 그로부터 프로세싱되거나 또는 그에 의해 코딩된다. 또 다른 실시태양에 있어서, O-RS는 서열 번호 36 내지 63 및/또는 86 중 어느 하나에 개시된 아미노산 서열을 포함한다.

일 실시태양에 있어서, 상기 방법은 단백질 내로 제1 반응성 기를 갖는 비천연 아미노산을 도입하는 단계, 및 그 단백질을 제2 반응성 기를 포함하는 분자(예를 들어, 염료, 폴리에틸렌 글리콜 유도체와 같은 중합체, 광가교결합제, 세포독성 화합물, 친화도 표지, 비오틴 유도체, 수지, 제2 단백질 또는 폴리펩티드, 금속 킬레이터, 보조 인자, 지방산, 탄수화물, 폴리뉴클레오티드(예를 들어, DNA, RNA 등) 등)와 접촉시키는 단계를 더 포함한다. 제1 반응성 기는 제2 반응성 기와 반응하여 분자를 비천연 아미노산에 [3+2] 고리화 첨가 반응을 통해 부착시킨다. 일 실시태양에 있어서, 제1 반응성 기는 알키닐 또는 아지도 잔기이고, 제2 반응성 기는 아지도 또는 알키닐 잔기이다. 예를 들어, 제1 반응성 기는 알키닐 잔기(예를 들어, 비천연 아미노산 p-프로파길옥시페닐알라닌 중)이고, 제2 반응성 기는 아지도 잔기이다. 또 다른 예에서, 제1 반응성 기는 아지도 잔기(예를 들어, 비천연 아미노산 p-아지도-L-페닐알라닌 중)이고, 제2 반응성 기는 알키닐 잔기이다.

일부 실시태양에 있어서, 코딩되는 단백질은 치료용 단백질, 진단용 단백질, 산업용 효소 또는 그 일부분을 포함한다. 일 실시태양에 있어서, 그와 같은 방법에 의해 제조된 단백질은 비천연 아미노산을 통해 변형된다. 비천연 아미노산은, 예를 들어, 친핵성-친전자성 반응, [3+2] 고리화 첨가 반응 등에 의해서 변형된다. 또 다른 실시태양에 있어서, 그와 같은 방법에 의해 제조된 단백질은 생체내에서 적어도 하나의 번역후 변형(예를 들어, N-글리코실화, O-글리코실화, 아세틸화, 아실화, 지질 변형, 팔미토일화, 팔미테이트 부가, 포스포릴화, 당지질 결합 변형 등)에 의해 변형된다.

스크리닝 또는 선택용 전사 조절인자 단백질을 제조하는 방법(이러한 방법에 의해서 제조되는 스크리닝 또는 선택용 전사 조절인자 단백질과 같이)이 또한 제공된다. 이 방법은, 예를 들어, 핵산 결합 도메인을 코딩하는 제1 폴리뉴클레오티드 서열을 선택하는 단계, 및 제1 폴리뉴클레오티드 서열이 적어도 하나의 셀렉터 코돈을 포함하도록 돌연변이시키는 단계를 포함한다. 이 과정은 스크리닝 또는 선택 폴리뉴클레오티드 서열을 제공한다. 방법은 또한, 예를 들어, 전사 활성화 도메인을 코딩하는 제2의 폴리뉴클레오티드 서열을 선택하는 단계; 제2의 폴리뉴클레오티드 서열에 작동 가능하게 연결된 스크리닝 또는 선택 폴리뉴클레오티드 서열을 포함하는 구성체를 제공하는 단계; 및 구성체, 비천연 아미노산, 오르소고날 tRNA 합성효소(O-RS) 및 오르소고날 tRNA(O-tRNA)를 세포 내로 도입하는 단계를 포함한다. 이들 성분으로, O-RS는 O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하고, O-tRNA는 셀렉터 코돈을 인식하여 스크리닝 또는 선택 폴리뉴클레오티드 서열 중 셀렉터 코돈에 응답하여 비천연 아미노산을 핵산 결합 도메인 내로 통합시킨다. 이 과정은 스크리닝 또는 선택 전사 조절인자 단백질을 제공한다.

일부 실시태양에 있어서, 본 발명의 조성물 및 방법은 척추동물 세포를 포함한다. 본 발명의 척추동물 세포는, 예를 들어, 포유동물 세포, 효모 세포, 진균 세포, 식물 세포, 곤충 세포 등 어느 것이라도 무방하다. 본 발명의 번역 성분은 여러 유기체, 예를 들어, 비척추동물 유기체로서 원핵 생물(예를 들어, 에스케리치아 콜라이, 바실러스 스테아로써모필러스 등) 또는 원시 박테리아류, 또는 척추동물로부터 유래할 수 있다.

본 발명의 셀렉터 코돈은 척추동물 단백질 생합성 기구의 유전자 코돈 프레임워크를 확장시킨다. 각종 셀렉터 코돈은 어느 것이나 사용할 수 있으며, 비제한적인 예로서, 종결 코돈(예를 들어, 앰버 코돈, 오커 코돈, 또는 오팔 종결 코돈), 넌센스 코돈, 희귀 코돈, 4(또는 그 이상의) 염기 코돈 등을 사용할 수 있다.

본 명세서에 기재된 조성물 및 방법에 사용될 수 있는 비천연 아미노산의 예는 p-아세틸-L-페닐알라닌, p-요오도-L-페닐알라닌, O-메틸-L-타이로신, p-프로파길옥시페닐알라닌, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, O-4-알릴-L-타이로신, 4-프로필-L-타이로신, 트리-O-아세틸-GlcNAcβ-세린, L-Dopa, 플루오르화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, L-포스포세린, 포스포노세린, 포스포노타이로신, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, 타이로신 아미노산의 비천연 유사체; 글루타민 아미노산의 비천연 유사체; 페닐알라닌 아미노산의 비천연 유사체; 세린 아미노산의 비천연 유사체; 트레오닌 아미노산의 비천연 유사체; 알킬, 아릴, 아실, 아지도, 시아노, 할로, 히드라진, 히드라지드, 히드록실, 알케닐, 알키닐, 에테르, 티올, 설포닐, 셀레노, 에스테르, 티오산, 보레이트, 보로네이트, 포스포, 포스포노, 포스핀, 헤테로시클릭, 엔온, 이민, 알데히드, 히드록실아민, 케토, 또는 아미노 치환된 아미노산, 또는 이들의 임의의 조합; 광활성화 가능한 가교결합제를 갖는 아미노산; 스핀 표지 아미노산; 형광 아미노산; 금속 결합 아미노산; 금속 함유 아미노산; 방사성 아미노산; 광케이징된(photocaged) 아미노산 및/또는 광이성질체화 가능한 아미노산; 비오틴 또는 비오틴 유사체 함유 아미노산; 케토 함유 아미노산; 폴리에틸렌 글리콜 또는 폴리에테르를 포함하는 아미노산; 중원자 치환된 아미노산; 화학적 절단 또는 광절단 가능한 아미노산; 연장된 측쇄를 갖는 아미노산; 독성 기를 함유하는 아미노산; 당 치환된 아미노산; 탄소 결합된 당 함유 아미노산; 산화환원 활성 아미노산; α-히드록시 함유 아미노산; 아미노 티오산; α,α-이치환 아미노산; β-아미노산; 프롤린 또는 히스티딘이 아닌 시클릭 아미노산, 및 페닐알라닌, 타이로신 또는 트립토판이 아닌 방향족 아미노산 등을 포함하나, 이에 한정되는 것은 아니다.

본 발명은 또한 폴리펩티드(O-RS) 및 폴리뉴클레오티드, 예를 들어, O-tRNA, O-RS 또는 그 일부분(예를 들어, 합성효소의 활성 부위)을 코딩하는 폴리뉴클레오티드, 아미노아실-tRNA 합성효소 변이체를 제작하는 데 사용되는 올리고뉴클레오티드, 하나 이상의 셀렉터 코돈을 포함하는 관심있는 단백질 또는 폴리펩티드를 코딩하는 폴리뉴클레오티드 등을 제공한다. 예를 들어, 본 발명의 폴리펩티드는 서열 번호 36 내지 63 및/또는 86 중 어느 하나에 개시된 아미노산 서열을 포함하는 폴리펩티드, 서열 번호 3 내지 35 중 어느 하나에 개시된 폴리뉴클레오티드 서열에 의해 코딩되는 아미노산 서열을 포함하는 폴리펩티드, 및 서열 번호 36 내지 63 및/또는 86 중 어느 하나에 개시된 아미노산 서열을 포함하는 폴리펩티드에 대해 특이적인 항체와 특이적 면역반응성을 나타내는 폴리펩티드, 또는 서열 번호 3 내지 35 중 어느 하나에 개시된 폴리뉴클레오티드 서열에 의해 코딩되는 아미노산 서열을 포함하는 폴리펩티드를 포함한다.

본 발명의 폴리펩티드에는 또한 천연 타이로실 아미노아실-tRNA 합성효소(TyrRS)(예를 들어, 서열 번호 2)의 서열과 적어도 90% 동일한 아미노산 서열을 포함하며, 그룹 A 내지 E(상기한 바와 같음)의 두 개 이상의 아미노산 치환을 포함하는 폴리펩티드가 포함된다. 마찬가지로, 본 발명의 폴리펩티드는 또한 경우에 따라 서열 번호 36 내지 63 및/또는 86 중 어느 하나의 적어도 20개의 연속적 아미노산과 상기한 그룹 A 내지 E의 2 개 이상의 아미노산 치환을 포함하는 폴리펩티드를 포함한다. 상기한 임의의 폴리펩티드의 보존적 변이를 포함하는 아미노산 서열이 또한 본 발명의 폴리펩티드로서 포함된다.

일 실시태양에 있어서, 조성물은 본 발명의 폴리펩티드 및 부형제(예를 들어, 완충제, 물, 제약상 허용 가능한 부형제 등)를 포함한다. 본 발명은 또한 본 발명의 폴리펩티드와 특이적 면역반응성을 나타내는 항체 또는 항혈청을 제공한다.

본 발명에 따르면 또한 폴리뉴클레오티드가 제공된다. 본 발명의 폴리뉴클레오티드는 하나 이상의 셀렉터 코돈을 갖는, 본 발명의 관심있는 단백질 또는 폴리펩티드를 코딩하는 것을 포함한다. 또한, 본 발명의 폴리뉴클레오티드는, 예를 들어, 서열 번호 3 내지 35, 64 내지 85 중 어느 하나에 개시된 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드; 그에 상보적이거나 이의 폴리펩티드 서열을 코딩하는 폴리뉴클레오티드; 및/또는 서열 번호 36 내지 63 및/또는 86 중 어느 하나에 개시된 아미노산 서열을 포함하는 폴리펩티드 또는 이의 보존적 변이체를 코딩하는 폴리뉴클레오티드를 포함한다. 본 발명의 폴리뉴클레오티드는 또한 본 발명의 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함한다. 마찬가지로, 고도로 엄격한 조건하에 실질적으로 핵산의 전체 길이에 걸쳐 상기한 바와 같은 폴리뉴클레오티드에 하이브리드화하는 핵산도 또한 본 발명의 폴리뉴클레오티드이다.

본 발명의 폴리뉴클레오티드는 또한 천연 타이로실 아미노아실-tRNA 합성효소(TyrRS)(예를 들어, 서열 번호 2) 서열과 적어도 90% 동일한 아미노산 서열을 포함하며, 상기 그룹 A 내지 E(상기한 바와 같음)에서와 같은 2 이상의 돌연변이를 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함한다. 상기 폴리뉴클레오티드와 적어도 70%, (또는 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 또는 그 이상) 동일한 폴리뉴클레오티드, 및/또는 상기한 임의의 폴리뉴클레오티드의 보존적 변이를 포함하는 폴리뉴클레오티드가 본 발명의 폴리뉴클레오티드에 포함된다.

일부 실시태양에 있어서, 벡터(예를 들어, 플라스미드, 코스미드, 파지, 바이러스 등)는 본 발명의 폴리뉴클레오티드를 포함한다. 일 실시태양에 있어서, 벡터는 발현 벡터이다. 또 다른 실시태양에 있어서, 발현 벡터는 본 발명의 하나 이상의 폴리뉴클레오티드에 작동 가능하게 연결 프로모터를 포함한다. 또 다른 실시태양에 있어서, 세포는 본 발명의 폴리뉴클레오티드를 포함하는 벡터를 포함한다.

또 다른 측면에 있어서, 본 발명은 화합물의 조성물 및 그러한 화합물을 제조하는 방법을 제공한다. 예를 들어, 화합물은 비천연 아미노산(예를 들어, p-(프로파길옥시)-페닐알라닌(예를 들어, 도 11의 1), 아지도 염료(예를 들어, 화학 구조 4 및 6에 나타낸 것과 같음), 알키닐 폴리에틸렌 글리콜(예를 들어, 화학 구조 7에 나타낸 것과 같음; n은, 예를 들어, 50 내지 10,000, 75 내지 5,000, 100 내지 2,000, 100 내지 1,000 사이의 정수임) 등을 포함한다. 본 발명의 실시태양에 있어서, 알키닐 폴리에틸렌 글리콜은 분자량이, 예를 들어, 약 5,000 내지 약 100,000 Da, 약 20,000 내지 약 50, 000 Da, 약 20,000 내지 약 10,000 Da(예를 들어, 20,000 Da)이다.

예를 들어, 단백질 및 세포와 함께 이들 화합물을 포함하는 각종 조성물이 제공된다. 일 측면에 있어서, p-(프로파길옥시)-페닐알라닌 비천연 아미노산을 포함하는 조성물은 오르소고날 tRNA를 추가로 포함한다. 비천연 아미노산은 오르소고날 tRNA에 결합될 수 있으며(예컨대, 공유적으로), 예를 들어, 오르소고날 tRNA에 아미노-아실 결합을 통하여 공유 결합되거나, 오르소고날 tRNA의 말단 리보스 당의 3 'OH 또는 2 'OH에 공유 결합된다.

키트도 또한 본 발명의 특징이다. 예를 들어, 세포 중에서 적어도 하나의 비천연 아미노산을 포함하는 단백질을 제조하기 위한 키트가 제공되는데, 이 키트는 O-tRNA를 코딩하는 폴리뉴클레오티드 서열 또는 O-tRNA, 및 O-RS를 코딩하는 폴리뉴클레오티드 서열 또는 O-RS를 함유하는 용기를 포함한다. 일 실시태양에 있어서, 상기 키트는 적어도 하나의 비천연 아미노산을 더 포함한다. 또 다른 실시태양에 있어서, 상기 키트는 단백질 제조에 관한 설명 자료를 더 포함한다.

[도면의 간단한 설명]

도 1은 hGH로의 파라-아세틸-페닐알라닌의 도입을 도시하고 있다.

도 2는 다양한 농도의 파라-아세틸-페닐알라닌의 hGH로의 도입을 도시하고 있다.

[상세한 설명]

본 발명을 상세하게 설명하기에 앞서, 본 발명은 특정 장치나 생물학적 계에 한정되는 것이 아니라 당연히 변화될 수 있는 것이라는 것을 이해하여야 한다. 또한, 본 명세서에서 사용된 용어들은 단지 특정 실시태양을 기술할 목적으로 사용되는 것으로서 제한할 의도로 사용되는 것이 아니라는 것도 이해하여야 한다. 본 명세서 및 첨부된 특허청구의 범위에서 "하나의" "그" 등의 단수 형태는 문맥상 명백히 단수를 의미하는 것이 아닌 한 복수 형태를 포함한다. 따라서, 예를 들어, "(하나의) 세포"라는 것은 2 이상의 세포의 조합을 의미하는 것을 포함하며, "박테리아"는 박테리아의 혼합물을 포함한다.

본 명세서 또는 하기에서 달리 정의되지 않는 한, 본 명세서에 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 분야의 통상의 지식을 가진 자에게 통상적으로 이해되는 의미를 갖는다.

상동성: 단백질 및/또는 단백질 서열은 이 서열들이 천연적으로나 인공적으로 공통의 조상 단백질 또는 단백질 서열로부터 유래되었을 때 "상동성"이다. 마찬가지로, 핵산 및/또는 핵산 서열은 이들이 천연적으로나 인공적으로 공통의 조상 핵산 또는 핵산 서열로부터 유래되었을 때 "상동성"이다. 예를 들어, 천연 핵산은 임의의 돌연변이 유발법으로 변형되어 하나 이상의 셀렉터 코돈을 포함할 수 있다. 발현되었을 때, 이 돌연변이된 핵산은 하나 이상의 비천연 아미노산을 포함하는 폴리펩티드를 코딩한다. 돌연변이 과정은 추가로 하나 이상의 표준 코돈을 변화시킴으로써 돌연변이 단백질을 제조할 수 있다. 상동성은 일반적으로는 2 이상의 핵산 또는 단백질(또는 이들의 서열) 사이의 서열 유사성으로부터 추정된다. 상동성을 확립하는 데 유용한 서열들 사이의 정확한 유사성 퍼센트는 해당 핵산 및 단백질에 따라 달라질 것이나, 적게는 25% 서열 유사성도 통상적으로 상동성을 확립하는 데 사용된다. 보다 높은 서열 유사성, 예를 들어, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 99% 이상의 유사성 또한 상동성을 확립하는 데 사용될 수 있다. 서열 유사성 퍼센트를 측정하는 방법(예를 들어, 디폴트 파라미터를 사용하는 BLASTP 및 BLASTN)이 본 명세서에 기재되어 있으며, 일반적으로 이용 가능하다.

오르소고날: 본 명세서에서 "오르소고날"이란 세포 또는 번역계에 내인성인 상응하는 분자에 비하여 세포의 내인성 성분과 감소된 효율로 기능하거나 세포의 내인성 성분과 기능하지 못하는 분자(예를 들어, 오르소고날 tRNA(O-tRNA) 및/또는 오르소고날 아미노아실-tRNA 합성효소(O-RS))를 의미한다. tRNA 및 아미노아실-tRNA 합성효소에 있어서, 오르소고날이란 내인성 tRNA가 내인성 tRNA 합성효소와 기능하는 것에 비하여 오르소고날 tRNA가 내인성 tRNA 합성효소와 기능하는 것이, 또는 내인성 tRNA 합성효소가 내인성 tRNA와 기능하는 것에 비하여 오르소고날 아미노아실-tRNA 합성효소가 내인성 tRNA와 기능하는 것이 불능이거나 또는 감소된 효율, 예를 들어, 20% 미만, 10% 미만, 5% 미만, 또는 1% 미만으로 효율적이라는 것을 의미한다. 오르소고날 분자는 세포 내에 기능적 내인성 상보적 분자를 가지고 있지 않다. 예를 들어, 세포 내의 오르소고날 tRNA는 내인성 tRNA의 내인성 RS에 의한 아미노아실화와 비교할 때 세포의 임의의 내인성 RS에 의해 감소된 또는 심지어는 제로의 효율로 아미노아실화된다. 또 다른 예로서, 오르소고날 RS는 내인성 tRNA의 내인성 RS에 의한 아미노아실화와 비교할 때 세포 중의 관심있는 내인성 tRNA를 감소된 또는 심지어는 제로의 효율로 아미노아실화한다. 제1 오르소고날 분자와 함께 기능하는 제2 오르소고날 분자를 세포 내로 도입할 수 있다. 예를 들어, 오르소고날 tRNA/RS 쌍은 세포 내에서 함께 효율적으로(예를 들어, 상응하는 tRNA/RS 내인성 쌍 효율의 50% 효율, 60% 효율, 70% 효율, 75% 효율, 80% 효율, 90% 효율, 95% 효율, 또는 99% 또는 그 이상의 효율) 기능하는, 도입된 상보적 성분을 포함한다.

상보적: "상보적"이란 오르소고날 쌍, 예컨대, O-RS가 O-tRNA를 아미노아실화하는 경우와 같이 함께 기능하는 O-tRNA와 O-RS의 성분을 이르는 것이다.

우선적(으로) 아미노아실화: "우선적(으로) 아미노아실화"란 O-RS가 천연 tRNA 또는 O-tRNA를 제조하는 데 사용되는 출발 물질을 아미노아실화하는 것에 비해 O-RS가 O-tRNA를 비천연 아미노산으로 아미노아실화하는 효율이, 예를 들어, 70% 효율적, 75% 효율적, 85% 효율적, 90% 효율적, 95% 효율적, 또는 99% 이상 효율적인 것을 의미한다. 비천연 아미노산은 성장하는 폴리펩티드 사슬 내로 높은 신뢰도로, 예를 들어, 주어진 셀렉터 코돈에 대해 약 75%를 초과하는 효율, 주어진 셀렉터 코돈에 대해 약 80%를 초과하는 효율, 주어진 셀렉터 코돈에 대해 약 90%를 초과하는 효율, 주어진 셀렉터 코돈에 대해 약 95%를 초과하는 효율, 또는 주어진 셀렉터 코돈에 대해 약 95%를 초과하는 효율 또는 그 이상의 효율로 통합된다.

셀렉터 코돈: "셀렉터 코돈"이란 번역 과정 중 O-tRNA에 의해 인식되나 내인성 tRNA에 의해서는 인식되지 않는 코돈을 말한다. O-tRNA 안티코돈 루프는 mRNA 상의 셀렉터 코돈을 인식하고, 폴리펩티드 중 그 위치에 이의 아미노산, 예를 들어, 비천연 아미노산을 통합시킨다. 셀렉터 코돈은, 예를 들어, 넌센스 코돈, 예컨대, 앰버, 오커 및 오팔 코돈과 같은 종결 코돈; 4개 또는 그 이상의 염기 코돈; 희귀 코돈; 천연 또는 비천연 염기쌍으로부터 유도된 코돈 등을 포함한다.

서프레서 tRNA: 서프레서 tRNA는 주어진 번역계에서, 예컨대, 셀렉터 코돈에 반응하여 폴리펩티드 내로 아미노산을 도입하는(통합시키는) 메카니즘을 제공함으로써, 메신저 RNA(mRNA)의 판독을 변화시키는 tRNA를 의미한다. 예를 들어, 서프레서 tRNA는 종결 코돈, 4염기 코돈, 희귀 코돈 등을 읽고 지나갈 수 있다.

재생 가능한 tRNA: "재생 가능한 tRNA"란 번역 중 하나 이상의 폴리펩티드 사슬 내로 아미노산(예를 들어, 비천연 아미노산)을 도입하기 위해 아미노산(예를 들어, 비천연 아미노산)으로 아미노아실화되고 반복적으로 탈아미노아실화될 수 있는 tRNA를 의미한다.

번역계: "번역계"란 천연 아미노산을 성장하는 폴리펩티드 사슬(단백질) 내로 통합시키는 성분들의 전체 세트를 의미한다. 번역계의 성분들은, 예를 들어, 리보좀, tRNA, 합성효소, mRNA, 아미노산 등을 포함할 수 있다. 본 발명의 성분들(예를 들어, O-RS, O-tRNA, 비천연 아미노산 등)이 시험관내 또는 생체내 번역계, 예를 들어, 척추동물 세포, 예를 들어, 효모 세포, 포유류 세포, 식물 세포, 조류 세포, 진균 세포, 곤충 세포 등에 가해질 수 있다.

비천연 아미노산: 본 명세서에서 "비천연 아미노산"이란 20 가지의 천연 아미노산, 셀레노시스테인 또는 피롤리신 중 하나가 아닌 임의의 아미노산, 변형된 아미노산 및/또는 아미노산 유사체를 말한다.

유래된: 본 명세서에서 "(로부터) 유래된"이란 특정 분자 또는 유기체로부터 단리되거나 그로부터의 정보를 사용하여 만들어지 성분을 이르는 말이다.

불활성 RS: "불활성 RS"란 돌연변이되어 더 이상 이의 천연 동족(cognate) tRNA를 아미노산으로 아미노아실화할 수 없는 합성효소를 의미한다.

양성 선택 또는 스크리닝 마커: "양성 선택 또는 스크리닝 마커"란 발현이나 활성화 등에 의해 존재하는 경우, 양성 선택 마커가 없는 세포로부터 양성 선택 마커가 있는 세포를 구별하게 해주는 마커를 의미한다.

음성 선택 또는 스크리닝 마커: 본 명세서에서 "음성 선택 또는 스크리닝 마커"는 발현이나 활성화 등에 의해 존재하는 경우, 목적하는 특성을 갖지 않는 세포를 찾아내도록(예를 들어, 목적하는 특성을 갖는 세포와 비교하여) 하는 마커를 의미한다.

리포터: 본 명세서에서 "리포터"란 관심있는 계의 표적 성분을 선택하는 데 사용될 수 있는 성분이다. 예를 들어, 리포터는 형광 스크리닝 마커(예를 들어, 녹색 형광 단백질), 발광 마커(예를 들어, 반딧불이 루시퍼라제 단백질), 친화도에 기초한 스크리닝 마커, 또는 선택 마커 유전자, 예컨대, his3, ura33, leu2, lys2, lacZ, β-gal/lacZ(β-갈락토시다제), Adh(알콜 데하이드로게나제) 등을 포함할 수 있다.

척추동물: "척추동물"이란 발생계통상 진핵생물(Eucarya)에 속하는 생물, 예를 들어, 포유류, 파충류, 조류 등의 동물을 의미한다.

비진핵생물: 본 명세서에서 "비진핵생물"이란 비척추동물 유기체를 말한다. 예를 들어, 비척추동물 유기체는 발생계통상 진정세균(Eubacteria), 예를 들어, 에스케리치아 콜라이(Escherichia coli), 써머스 써모필러스(Thermus thermophilus), 바실러스 스테아로써모필러스(Bacillus stearothermophilus) 등; 또는 고세균(Archaea), 예를 들어, 메타노코커스 쟈나쉬(Methanococcus jannaschii), 메타노박테리움 써모오토트로피컴(Methanobacterium thermoautotrophicum), 할로박테리움(Halobacterium) 속으로서 할로페락스 볼카니(Haloferax volcanii) 및 할로박테리움 종 NRC-1, 아키오글로버스 풀지더스(Archaeoglobus fulgidus), 파이로코커스 퓨리오수스(Pyrococcus furiosus), 파이로코커스 호리코쉬(Pyrococcus horikoshii), 유로파이럼 페르닉스(Aeuropyrum pernix) 등에 속할 수 있다.

항체: 본 명세서에서, "항체"는 면역글로불린 유전자(들)에 의해 실질적으로 코딩되는 폴리펩티드 또는 이의 단편으로서, 분석 대상물(항원)에 특이적으로 결합하고 인식하는 것을 포함하나, 이에 한정되는 것은 아니다. 항체의 예는 폴리클로날, 모노클로날, 키메라, 및 단일쇄 항체 등을 포함한다. Fab 단편, 및 파지 디스플레이를 포함하는 발현 라이브러리에 의해 제조된 단편을 포함하는 면역글로불린 단편이 또한 본 명세서에서 사용되는 "항체"라는 용어에 포함된다. 항체의 구조 및 용어에 대해서는, 예를 들어, 문헌(Paul, Fundamental Immunology, 4th Ed., 1999, Raven Press, New York)을 참조할 수 있다.

보존적 변이체: "보존적 변이체"는 보존적 변이체 O-tRNA 또는 보존적 변이체 O-RS와 같은 번역 성분으로서, 이들이 기초한 성분, 즉, O-tRNA 또는 O-RS와 유사하게 기능을 수행하지만 서열 내에 변화를 갖는 성분을 의미한다. 예를 들어, O-RS는 상보적 O-tRNA 또는 보존적 변이체 O-tRNA를 비천연 아미노산으로 아미노아실화할 것이지만, O-tRNA와 보존적 변이체 O-tRNA는 동일한 서열을 갖지는 않는다. 보존적 변이체는 그것이 상응하는 O-tRNA 또는 O-RS에 상보적인 한, 서열 내에 예컨대, 1개의 변이, 2개의 변이, 3개의 변이, 4개의 변이, 또는 5개 또는 그 이상의 변이를 가질 수 있다.

선택제 또는 스크리닝제: 본 명세서에서 "선택제 또는 스크리닝제"는 이의 존재시에 집단으로부터 특정 성분의 선택/스크리닝을 가능하게 하는 물질을 의미한다. 선택제 또는 스크리닝제는, 예를 들어, 영양소, 항생제, 빛의 파장, 항체, 발현된 폴리펩티드(예를 들어, 전사 조절인자 단백질) 등을 포함하나, 이에 한정되는 것은 아니다. 선택제는 농도, 강도 등에 있어서 변화될 수 있다.

검출 가능한 물질: 본 명세서에서 "검출 가능한 물질"이란 활성화되거나, 변화되거나, 발현되거나 하였을 때, 집단으로부터 특정 성분을 선택/스크리닝하는 것을 가능하게 하는 물질을 말한다. 검출 가능한 물질은 화합물일 수 있으며, 예를 들어, 5-플루오로오로트산(5-FOA)이 있는데, 이는 예컨대, URA3 리포터의 발현이라는 조건하에 URA3 리포터를 발현하는 세포를 사멸시키는 독소 생성물로서 검출 가능하게 된다.

척추동물 세포에서 유전자 코드에 의해 부과된 화학적 구속을 넘어서서 단백질의 구조를 직접적으로 유전적으로 변형시키는 능력은 세포 프로세싱을 프로빙하고 조작하는 강력한 분자상 도구를 제공할 것이다. 본 발명은 척추동물 세포에서 유전적으로 코딩되는 아미노산의 수를 확장하는 번역 성분을 제공한다. 이 성분은 tRNA(예를 들어, 오르소고날 tRNA, O-tRNA), 아미노아실-tRNA 합성효소(예를 들어, 오르소고날 합성효소, O-RS), O-tRNA/O-RS 쌍, 및 비천연 아미노산을 포함한다.

일반적으로, 본 발명의 O-tRNA는 효율적으로 발현 및 프로세싱되며, 척추동물 세포에서 번역 중에 기능을 하지만, 숙주의 아미노아실-tRNA 합성효소에 의해 상당히 아미노아실화되지는 않는다. 본 발명의 O-tRNA는 통상의 20개 아미노산 중 어느 것도 코딩하지 않는 셀렉터 코돈에 응답하여 mRNA 번역시에 비천연 아미노산을 성장하는 폴리펩티드 사슬로 전달한다.

본 발명의 O-RS는 척추동물 세포에서 본 발명의 O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하지만, 숙주의 세포질 tRNA의 어느 것도 아미노아실화하지 않는다. 또한, 본 발명의 아미노아실-tRNA 합성효소의 특이성으로 인해 내인성 아미노산을 배척하면서 비천연 아미노산을 수용한다. 예시적 O-RS의 아미노산 서열 또는 그 일부분을 포함하는 폴리펩티드가 또한 본 발명의 특징이다. 본 발명의 특징은 또한 번역 성분인 O-tRNA, O-RS 및 그 일부분을 코딩하는 폴리뉴클레오티드이다.

본 발명은 또한 척추동물 세포에서 사용하기 위한, 비천연 아미노산을 이용하는 목적하는 번역 성분, 예를 들어, O-RS, 및 오르소고날 쌍(오르소고날 tRNA 및 오르소고날 아미노아실-tRNA 합성효소)을 제조하는 방법(및 그와 같은 방법에 의해 제조된 번역 성분)을 제공한다. 예를 들어, 이 콜라이로부터의 타이로실-tRNA 합성효소/tRNA_CUA 쌍이 본 발명의 0-tRNA/O-RS 쌍이다. 또한, 본 발명은 하나의 척추동물 세포에서 번역 성분을 선택 및/또는 스크리닝하고, 일단 선택 및/또는 스크리닝되면 그 성분을 다른 척추동물 세포(선택 및/또는 스크리닝에 사용되지 않은 척추동물 세포)에서 사용하는 방법을 특징으로 한다. 예를 들어, 척추동물 세포를 위한 번역 성분을 제조하기 위한 선택 및/또는 스크리닝 방법은 효모, 예를 들어, 사카로마이세스 세레비시아(Saccharomyces cerevisiae)에서 수행될 수 있으며, 그 다음 선택된 성분을 다른 척추동물 세포, 예를 들어, 다른 효모 세포, 포유류 세포, 곤충 세포, 식물 세포, 진균 세포 등에서 사용할 수 있다.

본 발명은 또한 척추동물 세포에서 비천연 아미노산을 포함하는 단백질을 제조하는 방법을 제공한다. 단백질은 본 발명의 번역 성분을 사용하여 제조된다. 본 발명은 비천연 아미노산을 포함하는 단백질(및 본 발명의 방법으로 제조된 단백질)을 제공한다. 관심있는 단백질 또는 폴리펩티드는 또한 원핵 세포에서는 일어나지 않는 번역후 변형, 예컨대, [3+2] 고리화 첨가 반응 또는 친핵성-친전자성 반응을 통해 가해지는 변형을 포함할 수 있다. 일부 실시태양에 있어서는, 비천연 아미노산을 포함하는 전사 조절인자 단백질을 제조하는 방법(및 그러한 방법에 의해 제조된 단백질)이 또한 본 발명에 포함된다. 비천연 아미노산을 포함하는 단백질을 포함하는 조성물도 또한 본 발명의 특징을 이룬다.

비천연 아미노산을 갖는 단백질 또는 폴리펩티드를 제조하기 위한 키트도 또한 본 발명의 특징이다.

오르소고날 아미노아실 - tRNA 합성효소( O- RS )

척추동물 세포에서 관심있는 단백질 또는 폴리펩티드에 비천연 아미노산을 특이적으로 포함시키기 위해, 20종의 일반 아미노산이 아닌 단지 목적하는 비천연 아미노산만이 tRNA에 충전되도록 합성효소의 기질 특이성을 변화시킨다. 오르소고날 합성효소가 아미노산을 구별하지 않는 경우, 표적 부위에 천연 및 비천연 아미노산의 혼합물을 포함하는 돌연변이 단백질이 생긴다. 본 발명은 기질 특이성을 특정 비천연 아미노산에 대하여 변화시킨 오르소고날 아미노아실-tRNA 합성효소를 제조하는 조성물 및 방법을 제공한다.

오르소고날 아미노아실-tRNA 합성효소(O-RS)를 포함하는 척추동물 세포 또한 본 발명의 특징이다. O-RS는 척추동물 세포에서 오르소고날 tRNA(O-tRNA)를 비천연 아미노산으로 우선적으로 아미노아실화한다. 일부 실시태양에 있어서, O-RS는 1개 이상, 예를 들어, 2개 이상, 3개 이상의 비천연 아미노산을 이용한다. 따라서, 본 발명의 O-RS는 O-tRNA를 상이한 비천연 아미노산으로 우선적으로 아미노아실화할 수 있는 능력을 가질 수 있다. 이러한 능력은 어떠한 비천연 아미노산 또는 비천연 아미노산의 조합이 세포에 의해 허용될 수 있는지를 선택하고(거나) 세포에 의해 삽입이 허용되는 비천연 아미노산의 상이한 양을 선택함으로써 추가 수준의 조절이 가능하다.

본 발명의 O-RS는 경우에 따라 천연 아미노산에 비하여 비천연 아미노산에 대해 하나 이상의 개선되거나 증진된 효소 특성을 갖는다. 이러한 특성은, 예를 들어, 천연 아미노산, 예를 들어, 20종의 공지된 일반 아미노산에 비하여, 비천연 아미노산에 대한 더 높은 Km, 더 낮은 Km, 더 높은 kcat, 더 낮은 kcat, 더 낮은 kcat/km, 더 높은 kcat/km 등을 포함한다.

경우에 따라, O-RS는 척추동물 세포에 O-RS 또는 그 일부분을 포함하는 폴리펩티드 및/또는 O-RS 또는 그 일부분을 코딩하는 폴리뉴클레오티드에 의하여 제공될 수 있다. 예를 들어, O-RS 또는 그 일부분은 서열 번호 3 내지 35 중 어느 하나에 개시된 폴리뉴클레오티드 서열 또는 이의 상보적 폴리뉴클레오티드 서열에 의해 코딩된다. 또 다른 실시태양에 있어서, O-RS는 서열 번호 36 내지 63 및/또는 86 중 어느 하나에 개시된 아미노산 서열 또는 이의 보존적 변이체를 포함한다. 예시적 O-RS 분자의 서열에 대해서는 표 5, 6 및 8, 및 실시예 6을 참조할 수 있다.

O-RS는 또한 천연 타이로실 아미노아실-tRNA 합성효소(TyrRS)의 아미노산 서열(예를 들어, 서열 번호 2에 개시된 서열)과, 예를 들어, 90% 이상, 95% 이상, 98% 이상, 99% 이상, 또는 심지어 99.5% 이상 동일하며, 그룹 A 내지 E의 2 이상의 아미노산을 포함하는 아미노산 서열을 포함한다. 그룹 A는 이 콜라이 TyrRS의 Tyr37에 상응하는 위치에 발린, 이소루신, 루신, 글리신, 세린, 알라닌 또는 트레오닌을 포함하고; 그룹 B는 이 콜라이 TyrRS의 Asn126에 상응하는 위치에 아스파르테이트를 포함하며; 그룹 C는 이 콜라이 TyrRS의 Asp182에 상응하는 위치에 트레오닌, 세린, 아르기닌, 아스파라긴 또는 글리신을 포함하고; 그룹 D는 이 콜라이 TyrRS의 Phe183에 상응하는 위치에 메티오닌, 알라닌, 발린 또는 타이로신을 포함하고; 그룹 E는 이 콜라이 TyrRS의 Leu186에 상응하는 위치에 세린, 메티오닌, 발린, 시스테인, 트레오닌 또는 알라닌을 포함한다. 또한, 본 명세서의 표 4, 표 6 및 표 8을 참조할 수 있다.

O-RS 이외에, 본 발명의 척추동물 세포는 추가의 성분, 예를 들어, 비천연 아미노산을 포함할 수 있다. 척추동물 세포는 또한 오르소고날 tRNA(O-tRNA)(예를 들어, 이 콜라이, 바실러스 스테아로써모필러스 등과 같은 비척추동물 유기체로부터 유래된 것)를 포함할 수 있으며, 여기서 O-tRNA는 셀렉터 코돈을 인식하여 O-RS에 의해 비천연 아미노산으로 우선적으로 아미노아실화된다. 관심있는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산으로서, 폴리뉴클레오티드가 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는 핵산 또는 이러한 하나 이상의 핵산의 조합이 또한 세포 내에 존재할 수 있다.

일 측면에 있어서, O-tRNA는 비천연 아미노산을 단백질 내로 통합시키는 것을, 서열 번호 65에 개시된 폴리뉴클레오티드 서열을 포함하거나 그로부터 프로세싱된 tRNA의 효율의 45% 이상, 50% 이상, 60% 이상, 75% 이상, 80% 이상, 90% 이상, 95% 또는 99% 이상의 효율로 매개한다. 또 다른 측면에 있어서, O-tRNA는 서열 번호 65를 포함하며, O-RS는 서열 번호 36 내지 63 및/또는 86 중 어느 하나에 개시된 폴리펩티드 서열 및/또는 이의 보존적 변이체를 포함한다. 예시적 O-RS 및 O-tRNA 분자의 서열에 대해서는 본 명세서의 표 5 및 실시예 6을 참조할 수 있다.

일례로서, 척추동물 세포는 오르소고날 아미노아실-tRNA 합성효소(O-RS), 오르소고날 tRNA(O-tRNA), 비천연 아미노산, 및 관심있는 폴리펩티드로서 0-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는, 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산을 포함한다. O-RS는 척추동물 세포에서 오르소고날 tRNA(O-tRNA)를 비천연 아미노산으로 우선적으로 아미노아실화하고, 세포는 관심있는 폴리펩티드를 비천연 아미노산의 부재하에, 비천연 아미노산의 존재하에서의 수율보다, 예를 들어, 30% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 2.5% 미만의 수율로 제조한다.

본 발명의 특징인 O-RS의 제조 방법은 경우에 따라 야생형 합성효소의 프레임워크로부터 돌연변이 합성효소의 풀을 생성하는 단계, 및 돌연변이된 RS를 20종의 일반 아미노산에 비하여 비천연 아미노산에 대한 특이성에 기초하여 선택하는 단계를 포함한다. 그러한 합성효소를 단리하기 위하여, 선택 방법은 (i) 민감한 것이고(초기 회차로부터의 목적하는 합성효소의 활성이 낮을 수 있고, 집단이 작기 때문에); (ii) "조정 가능"하고(다른 선택 회차에서 선택 엄격도를 달리하는 것이 바람직하기 때문에); (iii) 일반적인 것(그 방법이 다른 비천연 아미노산에도 사용될 수 있도록)이다.

척추동물 세포에서 오르소고날 tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 오르소고날 아미노아실-tRNA 합성효소(O-RS)를 제조하는 방법은 일반적으로는 양성 선택 후에 음성 선택을 하는 선택의 조합을 수행하는 것을 포함한다. 양성 선택에서, 양성 마커의 비필수 위치에 도입된 셀렉터 코돈을 억제하는 것이 척추동물 세포로 하여금 양성 선택 압력하에 살아남도록 한다. 비천연 아미노산의 존재하에, 생존 세포는 따라서 오르소고날 서프레서 tRNA를 비천연 아미노산으로 충전하는 활성 합성효소를 코딩한다. 음성 선택에서, 음성 마커의 비필수 위치에 도입된 셀렉터 코돈을 억제하는 것이 천연 아미노산 특이성을 갖는 합성효소를 제거한다. 양성 및 음성 선택의 생존 세포는 오르소고날 서프레서 tRNA를 비천연 아미노산만으로(또는 적어도 우선적으로) 아미노아실화(충전)하는 합성효소를 코딩한다.

예를 들어, 위와 같은 방법은 (a) 제1 종의 척추동물 세포 집단(척추동물 세포는 각각 i) 아미노아실-tRNA 합성효소(RS) 라이브러리의 구성원, ii) 오르소고날 tRNA(O-tRNA), iii) 양성 선택 마커를 코딩하는 폴리뉴클레오티드, 및 iv) 음성 선택 마커를 코딩하는 폴리뉴클레오티드를 포함함)을 비천연 아미노산 존재하에 양성 선택하는 단계(이때 양성 선택을 극복하는 세포는 비천연 아미노산 존재하에 오르소고날 tRNA(O-tRNA)를 아미노아실화하는 활성 RS를 포함함); 및 (b) 양성 선택을 극복한 세포를 비천연 아미노산 부재하에 음성 선택하여 O-tRNA를 천연 아미노산으로 아미노아실화하는 활성 RS를 제거함으로써, O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 O-RS를 제공하는 단계를 포함한다.

양성 선택 마커는 각종 분자 중 어느 것이나 무방하다. 일 실시태양에 있어서, 양성 선택 마커는 성장을 위한 영양 보충물을 제공하는 생성물이며, 선택은 영양 보충물이 결핍된 배지 상에서 수행된다. 양성 선택 마커를 코딩하는 폴리뉴클레오티드의 예는 세포의 아미노산 영양 요구성 보완에 기초한 리포터 유전자, his3 유전자(예를 들어, his3 유전자가 이미다졸 글리세롤 포스페이트 데하이드라타제를 코딩하는 경우, 3-아미노트리아졸(3-AT)을 제공함으로써 검출됨), ura3 유전자, leu2 유전자, lys2 유전자, lacZ 유전자, adh 유전자 등을 포함하나, 이에 한정되는 것은 아니다. 문헌(GM. Kishore, & D.M. Shah, (1988), Amino acid biosynthesis inhibitors as herbicides, Annual Review of Biochemistry 57:627-663)을 참조할 수 있다. 일 실시태양에 있어서, lacZ 제조는 오르소-니트로페닐-β-D-갈락토피라노사이드(ONPG) 가수분해에 의해 검출된다(예를 들어, LG. Serebriiskii, & E.A. Golemis, (2000), Uses of lacZ to study gene function: evaluation of beta-galactosidase assays employed in the yeast two-hybrid system, Analytical Biochemistry 285:1-15). 추가의 양성 선택 마커는, 예를 들어, 루시퍼라제, 녹색 형광 단백질(GFP), YFP, EGFP, RFP, 항생제 내성 유전자 생성물(예를 들어, 클로람페니콜 아세틸트랜스퍼라제(CAT)), 전사 조절인자 단백질(예를 들어, GAL4) 등을 포함한다. 경우에 따라, 양성 선택 마커를 코딩하는 폴리뉴클레오티드는 셀렉터 코돈을 포함한다.

양성 선택 마커를 코딩하는 폴리뉴클레오티드는 반응 요소에 작동 가능하게 연결될 수 있다. 반응 요소로부터의 전사를 조절하는 전사 조절인자 단백질을 코딩하며, 하나 이상의 셀렉터 코돈을 포함하는 또 다른 폴리뉴클레오티드가 또한 존재할 수 있다. 비천연 아미노산으로 아미노아실화된 O-tRNA에 의해 전사 조절인자 단백질 내에 비천연 아미노산을 도입하면 양성 선택 마커를 코딩하는 폴리뉴클레오티드(예를 들어, 리포터 유전자)의 전사가 일어난다. 경우에 따라, 셀렉터 코돈은 전사 조절인자 단백질의 DNA 결합 도메인을 코딩하는 폴리뉴클레오티드의 부분 내에 또는 실질적으로 그에 근접하게 위치된다.

음성 선택 마커를 코딩하는 폴리뉴클레오티드도 또한 그로부터 전사 조절인자 단백질에 의해 전사가 매개되는 반응 요소에 작동 가능하게 연결될 수 있다(예를 들어, AJ. DeMaggio. et al., (2000), The yeast split-hybrid system, Method Enzymol. 328:128-137; H.M. Shih, et al., (1996), A positive genetic selection for disrupting protein-protein interactions: identification of CREB mutations that prevent association with the coactivator CBP, Proc. Natl. Acad. Sci. U.S.A. 93:13896-13901; M. Vidal, et al., (1996), Genetic characterization of a mammalian protein-protein interaction domain by using a yeast reverse two-hybrid system, [comment], Proc. Natl. Acad. Sci. U.S.A. 93:10321-10326; and, M. Vidal, et al., (1996), Reverse two-hybrid and one-hybrid systems to detect dissociation of protein-protein and DNA-protein interactions. [comment], Proc. Natl. Acad. Sci. U.S.A. 93:10315-10320). 천연 아미노산으로 아미노아실화된 O-tRNA에 의해 전사 조절인자 단백질 내에 천연 아미노산을 도입하면 음성 선택 마커의 전사가 일어난다. 경우에 따라, 음성 선택 마커는 셀렉터 코돈을 포함한다. 일 실시태양에 있어서, 본 발명의 양성 선택 마커 및/또는 음성 선택 마커는 2 이상의 셀렉터 코돈을 포함할 수 있으며, 이들 둘 다 또는 각각은 2 이상의 상이한 셀렉터 코돈 또는 2 이상의 동일한 셀렉터 코돈을 포함할 수 있다.

전사 조절인자 단백질은 핵산 서열(예를 들어, 반응 요소)에 (직접적으로 또는 간접적으로) 결합하여, 반응 요소에 작동 가능하게 연결된 서열의 전사를 조절하는 분자이다. 전사 조절인자 단백질은 전사 활성화 인자 단백질(예를 들어, GAL4, 핵 호르몬 수용체, AP1, CREB5 LEF/tcf 패밀리 구성원, SMAD, VP16, SPl 등), 전사 억제제 단백질(예를 들어, 핵 호르몬 수용체, 그로우초(Groucho)/tle 패밀리, 인그레일드(Engrailed) 패밀리 등), 또는 환경에 따라 두 가지 활성을 모두 가질 수 있는 단백질(예를 들어, LEF/tcf, 호모박스 단백질 등)일 수 있다. 반응 요소는 일반적으로는 전사 조절인자 단백질에 의해 인식되는 핵산 서열 또는 전사 조절인자 단백질과 함께 협동하여 작용하는 또 다른 물질이다.

전사 조절인자 단백질의 또 다른 예는 전사 활성화 인자 단백질 GAL4이다(예를 들어, A. Laughon, et al., (1984), Identification of two proteins encoded by the Saccharomyces cerevisiae GAL4 gene, Molecular & Cellular Biology 4:268-275; A. Laughon, & R.F. Gesteland, (1984), Primary structure of the Saccharomyces cerevisiae GAL4 gene, Molecular & Cellular Biology 4:260-267; L. Keegan, et al., (1986), Separation of DNA binding from the transcription-activating function of a vertebrate regulatory protein, Science 231:699-704: and, M. Ptashne, (1988), How vertebrate transcriptional activators work, Nature 335:683-689). 이러한 881개 아미노산 단백질의 N-말단 147개 아미노산은 DNA 서열에 특이적으로 결합하는 DNA 결합 도메인(DBD)을 형성한다(M. Carey, et al., (1989), An amino-terminal fragment ofGAL4 binds DNA as a dimer, J. Mol. Biol. 209:423-432; and, E. Giniger, et al., (1985), Specific DNA binding of GAL4, a positive regulatory protein of yeast, Cell 40:767-774). DBD는 사이에 존재하는 단백질 서열에 의해 C-말단 113개 아미노산의 활성화 도메인(AD)에 연결되어 있으며, AD가 DNA에 결합될 때 전사를 활성화시킬 수 있다(J. Ma, & M. Ptashne, (1987), Deletion analysis of GAL4 defines two transcriptional activating segments, Cell 48:847-853: and, J. Ma, & M. Ptashne, (1987), The carboxy-terminal 30 amino acids of GAL4 are recognized by GAL80, Cell 50:137-142). 앰버 코돈을, 예컨대, GAL4의 N-말단 DBD 및 이의 C-말단 AD를 모두 함유하는 단일 폴리펩티드의 N-말단 DBD 쪽으로 배치시킴으로써 O-tRNA/O-RS 쌍에 의한 앰버 억제가 GAL4에 의한 전사 활성화에 연결될 수 있다. GAL4 활성화된 리포터 유전자는 이들 유전자로 양성 및 음성 선택을 하는 데 사용될 수 있다.

음성 선택을 하는 데 사용되는 배지는 음성 선택 마커에 의해 검출 가능한 물질로 전환되는 선택 또는 스크리닝제를 포함할 수 있다. 본 발명의 일 측면에 있어서, 검출 가능한 물질은 독성 물질이다. 음성 선택 마커를 코딩하는 폴리뉴클레오티드는, 예를 들어, ura3 유전자일 수 있다. 예를 들어, URA3 리포터를 GAL4 DNA 결합 부위를 포함하는 프로모터의 조절하에 둘 수 있다. 음성 선택 마커가, 예를 들어, 셀렉터 코돈을 갖는 GAL4를 코딩하는 폴리뉴클레오티드의 번역에 의해 제조되었을 때, GAL4는 URA3의 전사를 활성화시킨다. 음성 선택은 5-플루오로오로트산(5-FOA)을 포함하는 배지 상에서 수행되며, 5-플루오로오로트산은 ura3 유전자의 유전자 생성물에 의해 검출 가능한 물질(예를 들어, 세포를 죽이는 독성 물질)로 전환된다(J.D. Boeke, et al., (1984), A positive selection for mutants lacking orotidine-5'-phosphate decarboxylase activity in yeast: 5-fluoroorotic acid resistance, Molecular & General Genetics 197:345-346); M. Vidal, et al., (1996), Genetic characterization of a mammalian protein-protein interaction domain by using a yeast reverse two-hybrid system. [comment], Proc. Natl. Acad. Sci. U.S.A. 93:10321-10326; and, M. Vidal, et al., (1996), Reverse two-hybrid and one-hybrid systems to detect dissociation of protein-protein and DNA-protein interactions, [comment], Proc. Natl. Acad. Sci. U.S.A. 93:10315-10320).

양성 선택 마커와 마찬가지로, 음성 선택 마커 또한 각종 분자 중 어느 하나일 수 있다. 일 실시태양에 있어서, 양성 선택 마커 및/또는 음성 선택 마커는 적절한 반응물의 존재하에 형광을 내거나 발광 반응을 촉진하는 폴리펩티드이다. 예를 들어, 음성 선택 마커는 루시퍼라제, 녹색 형광 단백질(GFP), YFP, EGFP, RPP, 항생제 내성 유전자 생성물(예를 들어, 클로람페니콜 아세틸트랜스퍼라제(CAT)), lacZ 유전자 생성물, 전사 조절인자 단백질 등을 포함하나, 이에 한정되는 것은 아니다. 본 발명의 한 측면에 있어서, 양성 선택 마커 및/또는 음성 선택 마커는 형광 활성화 세포 분류(FACS) 또는 발광에 의해 검출된다. 다른 예에서, 양성 선택 마커 및/또는 음성 선택 마커는 친화도에 기초한 스크리닝 마커를 포함한다. 같은 폴리뉴클레오티드가 양성 선택 마커 및 음성 선택 마커를 둘 다 코딩할 수 있다.

추가 수준의 선택 및/또는 스크리닝 엄격도를 본 발명의 방법에 사용할 수 있다. 선택 또는 스크리닝 엄격도는 O-RS를 제조하는 방법의 하나 또는 두 단계 모두에서 다를 수 있다. 이는 예컨대, 양성 선택 마커 및/또는 음성 선택 마커를 코딩하는 폴리뉴클레오티드 중 반응 요소의 양을 변화시키는 것, 어느 한 단계 또는 두 단계 모두에 변화하는 양의 불활성 합성효소를 가하는 것, 사용되는 선택 및/또는 스크리닝제의 양을 변화시키는 것 등을 포함할 수 있다. 추가 회차의 양성 및/또는 음성 선택을 수행할 수 있다.

선택 또는 스크리닝 과정은 1회 이상의 양성 또는 음성 선택 또는 스크리닝을 포함할 수 있으며, 이는 예를 들어, 아미노산 투과성에 있어서의 변화, 번역 효율에 있어서의 변화, 번역 신뢰도에 있어서의 변화 등을 포함한다. 일반적으로, 하나 이상의 변화는 단백질을 제조하는 데 사용되는 오르소고날 tRNA-tRNA 합성효소 쌍의 성분을 포함하거나 이를 코딩하는 하나 이상의 폴리뉴클레오티드에 있어서의 변이에 기초한다.

모델 풍부화 연구를 과량의 불활성 합성효소로부터 활성 합성효소를 신속히 선택하는 데 사용할 수도 있다. 양성 및/또는 음성 모델 선택 연구가 수행될 수 있다. 예를 들어, 강력한 활성 아미노아실-tRNA 합성효소를 포함하는 척추동물 세포를 변화하는 배수의 과량의 불활성 아미노아실-tRNA 합성효소와 혼합한다. 비선택 배지에서 성장하고, 예를 들어, X-GAL 오버레이로 분석된 세포와, 선택 배지에서 성장하고 살아남을 수 있고(예를 들어, 히스티딘 및/또는 우라실 부재하에) 예를 들어, X-GAL 분석으로 평가한 세포 사이의 비율 비교를 수행한다. 음성 모델 선택에 있어서, 강력한 활성 아미노아실-tRNA 합성효소를 변화하는 배수의 과량의 불활성 아미노아실-tRNA 합성효소와 혼합하고, 선택을 음성 선택 물질, 예를 들어, 5-FOA로 수행한다.

일반적으로, RS의 라이브러리(예를 들어, 돌연변이 RS의 라이브러리)는 적어도 하나의 아미노아실-tRNA 합성효소(RS), 예를 들어, 비척추동물 유기체로부터 유래한 RS를 포함한다. 일 실시태양에 있어서, RS의 라이브러리는 불활성 RS로부터 유래하며, 예컨대, 불활성 RS는 활성 RS를, 예를 들어, 합성효소 내 활성 부위, 합성효소 편집 메카니즘 부위, 합성효소의 상이한 도메인의 조합에 의한 상이한 부위 등에서 돌연변이 유발시켜 제조된다. 예를 들어, RS의 활성 부위 내의 잔기를, 예를 들어, 알라닌 잔기로 돌연변이시킨다. 알라닌 돌연변이된 RS를 코딩하는 폴리뉴클레오티드는 알라닌 잔기를 모든 20종의 아미노산으로 돌연변이시키는 주형으로 사용된다. 돌연변이 RS 라이브러리를 선택 및/또는 스크리닝하여 O-RS를 제조한다. 또 다른 실시태양에 있어서, 불활성 RS는 하나 이상의 아미노산이 하나 이상의 상이한 아미노산으로 치환된 아미노산 결합 포켓을 포함한다. 일례에 있어서, 치환된 아미노산은 알라닌으로 치환된다. 경우에 따라, 알라닌 돌연변이된 RS를 코딩하는 폴리뉴클레오티드는 알라닌 잔기를 모든 20종의 아미노산으로 돌연변이시키는 주형으로 사용되고, 선택 및/또는 스크리닝된다.

O-RS를 제조하는 방법은 당업계에 알려진 각종 돌연변이 유발 기술을 사용하여 RS 라이브러리를 생성하는 단계를 추가로 포함한다. 예를 들어, 돌연변이 RS는 부위 특이적 돌연변이 유발, 무작위 점 돌연변이 유발, 상동 재조합, DNA 셔플링 또는 다른 반복적 돌연변이 유발법, 키메라 제작 또는 이들의 임의의 조합에 의해 생성될 수 있다. 예를 들어, 돌연변이 RS의 라이브러리는 2 이상의 다른, 예컨대, 보다 작고 덜 다양한 "서브-라이브러리"로부터 제조될 수 있다. 일단 합성효소에 양성 및 음성 선택/스크리닝 전략을 수행한 후에, 이들 합성효소를 추가로 돌연변이시킬 수 있다. 예를 들어, O-RS를 코딩하는 핵산을 단리하고; 이로부터(예를 들어, 무작위 돌연변이 유발, 부위 특이적 돌연변이 유발, 재조합 또는 이들의 조합에 의해) 돌연변이된 O-RS를 코딩하는 한 세트의 폴리뉴클레오티드를 제조할 수 있으며; 이들 개개의 단계 또는 단계들의 조합을 O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 돌연변이된 O-RS가 얻어질 때까지 반복할 수 있다. 본 발명의 일 측면에 있어서, 상기 단계들을 2회 이상 수행한다.

O-RS 제조에 관한 추가의 상세한 사항은 WO 2002/086075(발명의 명칭: "Methods and compositions for the production of orthogonal tRNA-aminoacyl tRNA synthetase pairs") 및 문헌(Hamano-Takaku et ah, (2000) A mutant Escherichia coli Tyrosyl-tRNA Synthetase Utilizes the Unnatural Amino Acid Azatyrosine More Efficiently than Tyrosine, Journal of Biological Chemistry. 275(51):40324-40328; Kiga et al., (2002), An engineered Escherichia coli tyrosyl-tRNA synthetase for site-specific incorporation of an unnatural amino acid into proteins in vertebrate translation and its application in a wheat germ cell-free system, PNAS 99(15): 9715-9723; and, Francklyn et al., (2002), Aminoacyl-tRNA synthetases: Versatile players in the changing theater of translation: RNA 8:1363-1372)을 참조할 수 있다.

오르소고날 tRNA

본 발명에 따르면 오르소고날 tRNA(O-tRNA)를 포함하는 진핵 세포가 제공된다. 오르소고날 tRNA는 생체내에서 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질 내로 비천연 아미노산을 도입하는 것을 매개한다. 일부 실시태양에 있어서, 본 발명의 O-tRNA는 비천연 아미노산을 단백질 내로, 서열 번호 65에 개시된 폴리뉴클레오티드를 포함하거나 세포내에서 그로부터 프로세싱된 tRNA의 효율의, 예를 들어, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 60%, 적어도 75%, 적어도 80%, 또는 심지어는 90% 이상의 효율로 통합시킨다(본 명세서의 표 5 참조).

본 발명의 O-tRNA의 예는 서열 번호 65이다(실시예 6 및 표 5 참조). 서열 번호 65는 프리 스플라이싱/프로세싱 전사체로서, 경우에 따라 세포 내에서 예컨대, 표준 내인성 세포내 스플라이싱 및 프로세싱 기구를 사용하여 프로세싱되며, 변형되어 활성 O-tRNA를 형성한다. 일반적으로, 그러한 프리 스플라이싱 전사체의 집단이 세포 내에서 활성 tRNA의 집단을 형성한다. 본 발명은 또한 O-tRNA의 보존적 변이체 및 이의 프로세싱된 세포 생성물을 포함한다. 예를 들어, O-tRNA의 보존적 변이체는 서열 번호 65의 O-tRNA와 같이 기능하고, 프로세싱된 형태에서 tRNA L형 구조를 유지하지만, 서열은 동일하지 않은(또한 야생형 tRNA 분자가 아닌) 분자를 포함한다. 일반적으로, 본 발명의 O-tRNA는 재생 가능한 O-tRNA로서, O-tRNA는 생체내에서 다시 아미노아실화되어 셀렉터 코돈에 반응하여 폴리뉴클레오티드에 의해 코딩되는 단백질 내로 비천연 아미노산의 도입을 매개한다.

원핵 세포가 아닌 진핵 세포에서의 tRNA의 전사는 RNA 폴리머라제 III에 의해 이루어지며, 이 효소는 척추동물 세포에서 전사될 수 있는 tRNA 구조 유전자의 일차 서열에 제한을 둔다. 또한, 척추동물 세포에서 tRNA는 이들이 전사된 곳인 핵으로부터 세포질로 나와서 번역시에 기능하게 된다. 본 발명의 O-tRNA를 코딩하는 핵산 및 이들의 상보적 폴리뉴클레오티드가 또한 본 발명의 특징이다. 본 발명의 일 측면에 있어서, 본 발명의 O-tRNA를 코딩하는 핵산은 내부 프로모터 서열, 예컨대, A 박스(예를 들어, TRGCNNAGY) 및 B 박스(예를 들어, GGTTCGANTCC, 서열 번호 87)를 포함한다. A 박스 및 B 박스 서열의 추가적인 예는 문헌 [Geiduschek, (1988), Transcription by RNA Polymerase III, Ann. Rev. Biochem. 57:873-917]에서 확인할 수 있다. 본 발명의 O-tRNA는 또한 전사후 변형될 수 있다. 예를 들어, 진핵 세포에서 tRNA 유전자의 전사후 변형은 각각 Rnase P 및 3'-엔도뉴클레아제에 의한 5'- 및 3'-측면 서열의 제거를 포함한다. 3'-CCA 서열의 부가 또한 진핵 세포에서 tRNA 유전자의 전사후 변형의 하나이다.

일 실시태양에 있어서, O-tRNA는 tRNA 라이브러리의 구성원을 포함하는 제1 종의 척추동물 세포의 집단을 음성 선택하여 얻어진다. 음성 선택은 척추동물 세포에 내인성인 아미노아실-tRNA 합성효소(RS)에 의해 아미노아실화되는 tRNA 라이브러리의 구성원을 포함하는 세포를 제거한다. 이 과정은 제1 종의 척추동물 세포에 오르소고날한 tRNA의 풀을 제공한다.

대안으로, 또는 폴리펩티드 내로 비천연 아미노산을 도입하는 상기 기재된 다른 방법과 함께, 트랜스-번역계를 사용할 수 있다. 이러한 계는 에스케리치아 콜라이에 존재하는, tmRNA라 불리는 분자를 포함한다. 이 RNA 분자는 구조적으로 알라닐 tRNA와 관련이 있으며, 알라닐 합성효소에 의해 아미노아실화된다. tmRNA와 tRNA의 차이는 안티코돈 루프가 특이한 큰 서열로 대체되어 있다는 것이다. 이 서열은 리보좀이 tmRNA 내에 코딩된 오픈 리딩 프레임을 주형으로 사용하여 머뭇거리고 있는 서열 상에서 번역을 재개할 수 있도록 한다. 본 발명에서, 오르소고날 합성효소에 의해 우선적으로 아미노아실화되고, 비천연 아미노산으로 충전되는 오르소고날 tmRNA가 제조될 수 있다. 그러한 계에 의하여 유전자를 전사함으로써, 리보좀이 특정 위치에서 지연되면, 비천연 아미노산이 그 위치에 도입되고, 오르소고날 tmRNA 내에 코딩된 서열을 사용하여 번역이 재개된다.

재조합 오르소고날 tRNA를 제조하는 또 다른 방법은, 예를 들어, 국제 특허 출원 WO 2002/086075(발명의 명칭: "Methods and compositions for the production of orthogonal tRNA-aminoacyl tRNA synthetase pairs")에서 찾아볼 수 있으며, 또한 문헌(Forster et al., (2003) Programming peptidomimetic synthetases by translating genetic codes designed de novo PNAS 100(11):6353-6357; and, Feng et al., (2003), Expanding tRNA recognition of a tRNA synthetase by a single amino acid change, PNAS 100(10): 5676-5681)을 참조할 수 있다.

오르소고날 tRNA 및 오르소고날 아미노아실-tRNA 합성효소 쌍

오르소고날 쌍은, 예를 들어, 서프레서 tRNA, 프레임쉬프트 tRNA 등의 O-tRNA와 O-RS로 이루어진다. O-tRNA는 내인성 합성효소에 의해서 아실화되지 않으며, 생체내에서 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질 내로 비천연 아미노산을 도입하는 것을 매개할 수 있다. O-RS는 O-tRNA를 인식하며, 척추동물 세포에서 O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화한다. 오르소고날 쌍을 제조하는 방법, 그러한 방법에 의해 제조된 오르소고날 쌍, 및 척추동물 세포에 사용하기 위한 오르소고날 쌍의 조성물이 본 발명에 포함된다. 다수의 오르소고날 tRNA/합성효소 쌍의 개발은 척추동물 세포에서 상이한 코돈을 사용하여 다수의 비천연 아미노산을 동시에 도입하는 것을 가능하게 할 수 있다.

척추동물 세포에서 오르소고날 O-tRNA/O-RS 쌍은 비효율적인 종 교차 아미노아실화를 갖는 다른 유기체로부터 쌍, 예를 들어, 넌센스 서프레서 쌍을 이입함으로써 제조될 수 있다. O-tRNA 및 O-RS는 척추동물 세포에서 효율적으로 발현 및 프로세싱되고, O-tRNA는 핵으로부터 세포질로 효율적으로 이출된다. 예를 들어, 그와 같은 쌍 중 하나는 이 콜라이로부터의 타이로실-tRNA 합성효소/tRNA_CUA 쌍이다(예를 들어, H. M. Goodman, et al., (1968), Nature 217:1019-24; and, D. G. Barker, et al., (1982), FEBS Letters 150:419-23). 이 콜라이 타이로실-tRNA 합성효소는 그것과 이의 동족 이 콜라이 tRNA_CUA가 둘 다 에스 세레비시아의 세포질에 발현되었을 때, 동족 이 콜라이 tRNA_CUA를 효율적으로 아미노아실화하지만, 에스 세레비시아 tRNA는 아미노아실화하지 않는다(예를 들어, H. Edwards, & P. Schimmel, (1990), Molecular & Cellular Biology 10:1633-41; and, H. Edwards, et al., (1991), PNAS United States of America 88:1153-6). 또한, 이 콜라이 타이로실 tRNA_CUA는 에스 세레비시아 아미노아실-tRNA 합성효소에 대해서는 불량한 기질이지만(예를 들어, V. Trezeguet, et al., (1991), Molecular & Cellular Biology 11 :2744-51), 에스 세레비시아 중 단백질 번역시에는 효율적으로 기능한다. 이에 대해서는, 예를 들어, 문헌들(H. Edwards, & P. Schimmel, (1990) Molecular & Cellular Biology 10:1633-41 ; H. Edwards, et al., (1991). PNAS United States of America 88:1153-6; and, V. Trezeguet, et al., (1991), Molecular & Cellular Biology 11:2744-51)을 참조할 수 있다. 또한, 이 콜라이 TyrRS는 tRNA에 결합된 비천연 아미노산을 교정하는 편집 기구를 가지고 있지 않다.

O-tRNA 및 O-RS는 천연 발생이거나, 각종 생물로부터의 천연 tRNA 및/또는 RS의 돌연변이 유발에 의해 유도될 수 있으며, 이는 tRNA 라이브러리 및/또는 RS 라이브러리를 제조한다. 본 명세서의 "공급원 및 숙주"란을 참조할 수 있다. 각종 실시태양에 있어서, O-tRNA 및 O-RS는 하나 이상의 생물로부터 유래된다. 다른 실시태양에 있어서, O-tRNA는 제1 종으로부터의 천연 또는 돌연변이된 천연 tRNA로부터 유래하며, O-RS는 제2 종으로부터의 천연 또는 돌연변이된 천연 RS로부터 유래한다. 일 실시태양에 있어서, 제1 및 제2의 비척추동물 유기체는 동일하다. 이와는 달리, 제1 및 제2의 비척추동물 유기체는 상이할 수 있다.

O-RS 및 O-tRNA를 제조하는 방법에 관해서는 본 명세서의 "오르소고날 아미노아실-tRNA 합성효소" 및 "O-tRNA"란을 참조할 수 있다. 또한, 국제 특허 출원 WO 2002/086075(발명의 명칭: "Methods and compositions for the production of orthogonal tRNA-aminoacyltRNA synthetase pairs")을 참조할 수 있다.

신뢰도, 효율 및 수율

신뢰도란 비천연 아미노산 또는 아미노산과 같은 목적하는 분자가 성장하는 폴리펩티드 사슬 내로 목적하는 위치에서 삽입되는 정확도를 의미한다. 본 발명의 번역 성분은 셀렉터 코돈에 반응하여 비천연 아미노산을 단백질 내로 높은 신뢰도로 도입한다. 예를 들어, 본 발명의 성분을 사용하여, 목적하는 비천연 아미노산을(예를 들어, 셀렉터 코돈에 반응하여) 성장하는 폴리펩티드 사슬 내 목적하는 위치로 도입하는 효율은, 특정 천연 아미노산이 성장하는 폴리펩티드 사슬 내 목적하는 위치로 원하지 않게 도입되는 것의, 예컨대, 75% 초과, 85% 초과, 95% 초과, 또는 심지어는 99%를 초과하는 효율이다.

효율은 또한 관련 대조에 비하여 O-RS가 O-tRNA를 비천연 아미노산으로 아미노아실화하는 정도를 의미한다. 본 발명의 O-RS는 이의 효율로 정의될 수 있다. 본 발명의 일부 실시태양에 있어서, O-RS는 다른 O-RS와 비교된다. 예를 들어, 본 발명의 O-RS는 O-tRNA를 비천연 아미노산으로, 예를 들어, 서열 번호 86 또는 45에 개시된 아미노산 서열을 갖는 O-RS 또는 표 5에 나타낸 다른 RS가 O-tRNA를 아미노아실화하는 것에 비하여, 예컨대, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 또는 심지어 적어도 99% 이상의 효율로 아미노아실화한다. 또 다른 실시태양에 있어서, 본 발명의 O-RS는 O-tRNA를 비천연 아미노산으로, O-RS가 O-tRNA를 천연 아미노산으로 아미노아실화하는 것보다 10배 이상, 20배 이상, 30배 이상 효율적으로 아미노아실화한다.

본 발명의 번역 성분을 사용할 때, 비천연 아미노산을 포함하는 관심있는 폴리펩티드의 수율은, 세포로부터 폴리뉴클레오티드에 셀렉터 코돈이 결여된 관심있는 천연 폴리펩티드에 대해 얻어지는 수율의, 예컨대, 적어도 5%, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 50% 또는 그 이상이다. 또 다른 실시태양에 있어서, 세포는 비천연 아미노산의 부재하에 관심있는 폴리펩티드를, 비천연 아미노산 존재하의 폴리펩티드 수율의, 예컨대, 30% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 2.5% 미만의 수율로 제조한다.

공급원 및 숙주 생물

본 발명의 오르소고날 번역 성분은 일반적으로는 척추동물 세포 또는 번역계에 사용하기 위하여 비척추동물 유기체로부터 유래한다. 예를 들어, 오르소고날 O-tRNA는 비척추동물 유기체로서, 에스케리치아 콜라이, 써머스 써모필러스, 바실러스 스테아로써모필러스 등과 같은 진정세균, 또는 메타노코커스 쟈나쉬, 메타노박테리움 써모오토트로피컴, 할로박테리움 속으로서 할로페락스 볼카니 및 할로박테리움 종 NRC-1, 아키오글로버스 풀지더스, 파이로코커스 퓨리오수스, 파이로코커스 호리코쉬, 유로파이럼 페르닉스 등의 고세균으로부터 유래될 수 있는 한편, 오르소고날 O-RS는 비척추동물 유기체로서, 에스케리치아 콜라이, 써머스 써모필러스, 바실러스 스테아로써모필러스 등의 진정세균, 또는 메타노코커스 쟈나쉬, 메타노박테리움 써모오토트로피컴, 할로박테리움 속으로서 할로페락스 볼카니 및 할로박테리움 종 NRC-1, 아키오글로버스 풀지더스, 파이로코커스 퓨리오수스, 파이로코커스 호리코쉬, 유로파이럼 페르닉스 등의 고세균으로부터 유래할 수 있다. 또한, 성분들이 관심있는 세포 또는 번역계에 오르소고날한 경우 또는 성분들이 변형되어(예를 들어, 돌연변이되어) 세포 또는 번역계에 오르소고날하게 된 경우, 척추동물 공급원, 예컨대, 식물, 조류, 원생생물, 진균, 효모, 동물(예를 들어, 포유동물, 곤충, 절지동물 등) 등이 또한 사용될 수 있다.

O-tRNA/O-RS 쌍의 개별 성분은 동일한 생물 또는 상이한 생물로부터 유래될 수 있다. 일 실시태양에 있어서, O-tRNA/O-RS 쌍은 동일한 생물로부터 유래한다. 예를 들어, O-tRNA/O-RS 쌍은 이 콜라이로부터의 타이로실-tRNA 합성효소/tRNA_CUA 쌍으로부터 유래할 수 있다. 또한, O-tRNA/O-RS 쌍의 O-tRNA 및 O-RS는 경우에 따라 다른 생물로부터 유래될 수 있다.

오르소고날 O-tRNA, O-RS 또는 O-tRNA/O-RS 쌍을 척추동물 세포에서 선택 또는 스크리닝 및/또는 사용하여 비천연 아미노산을 포함하는 폴리펩티드를 제조할 수 있다. 척추동물 세포는 각종 공급원, 예컨대, 임의의 척추동물(예를 들어, 포유동물, 양서류, 조류, 파충류, 어류 등)로부터 유래된 것일 수 있다. 본 발명의 번역 성분을 갖는 척추동물 세포의 조성물 또한 본 발명의 특징이다.

본 발명은 또한 하나의 종에서 경우에 따라 그 종에 사용하기 위하여 및/또는 제2의 종에 사용하기 위하여(경우에 따라 추가의 선택/스크리닝 없이) 효율적으로 스크리닝하는 방법을 제공한다. 예를 들어, O-tRNA/O-RS의 성분들을 하나의 종, 예컨대, 쉽게 조작할 수 있는 종(효모 세포와 같은)에서 선택 또는 스크리닝한 다음, 제2의 종에서 비천연 아미노산을 생체내 통합시키는 데 사용하기 위하여 제2의 척추동물 종, 예컨대, 식물(예를 들어, 단자엽 또는 쌍자엽 식물과 같은 고등식물), 조류, 원생생물, 진균, 효모, 동물(예를 들어, 포유동물, 곤충, 절지동물 등) 등에 도입한다.

예를 들어, 사카로마이세스 세레비시아를 척추동물 제1 종으로 선택할 수 있으며, 이는 이 종이 단세포이고, 세대 기간이 짧고, 유전자가 비교적 잘 규명되어 있기 때문이다(예를 들어, Burke, et al., (2000) Methods in Yeast Genetics Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY). 또한, 진핵 세포의 번역 기구는 고도로 보존되어 있기 때문에(예를 들어, (1996) Translational Control. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; Y. Kwok, & J.T. Wong, (1980), Evolutionary relationship between Halobacterium cutirubrum and eukaryotes determined by use of aminoacyl-tRNA synthetases as phylogenetic probes, Canadian Journal of Biochemistry 58:213-218; and, (2001) The Ribosome. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY), 에스 세레비시아에서 발견된 비천연 아미노산의 도입을 위한 aaRS 유전자를 고등 척추동물로 도입하여 동족 tRNA와 협동하여 비천연 아미노산을 도입하는 데 사용될 수 있게 할 수 있다(예를 들어, K. Sakamoto, et al., (2002) Site-specific incorporation of an unnatural amino acid into proteins in mammalian cells, Nucleic Acids Res. 30:4692-4699; and, C. Kohrer, et al., (2001), Import of amber and ochre suppressor tRNA's into mammalian cells: a general approach to site-specific insertion of amino acid analogues into proteins, Proc. Natl. Acad. Sci. U.S.A. 98:14310-14315).

일례로서, 본 명세서에 기재된 바와 같이 제1 종에서 O-tRNA/O-RS를 제조하는 방법은 O-tRNA를 코딩하는 핵산과 O-RS를 코딩하는 핵산을 제2의 종(예를 들어, 포유동물, 곤충, 진균, 조류, 식물 등)의 척추동물 세포 내로 도입하는 것을 추가로 포함한다. 또 다른 예로서, 척추동물 세포에서 오르소고날 tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 오르소고날 아미노아실-tRNA 합성효소(O-RS)를 제조하는 방법은 (a) 제1 종(예를 들어, 효모 등)의 척추동물 세포의 집단을 비천연 아미노산의 존재하에 양성 선택하는 것을 포함한다. 척추동물 세포 각각은 i) 아미노아실-tRNA 합성효소(RS) 라이브러리의 구성원, ii) 오르소고날 tRNA(O-tRNA), iii) 양성 선택 마커를 코딩하는 폴리뉴클레오티드, 및 iv) 음성 선택 마커를 코딩하는 폴리뉴클레오티드를 포함한다. 양성 선택에서 살아남는 세포는 비천연 아미노산의 존재하에 오르소고날 tRNA(O-tRNA)를 아미노아실화하는 활성 RS를 포함한다. 양성 선택에서 살아남은 세포를 비천연 아미노산의 부재하에 음성 선택하여 O-tRNA를 천연 아미노산으로 아미노아실화하는 활성 RS를 제거한다. 이러한 과정은 O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 O-RS를 제공한다. O-tRNA를 코딩하는 핵산 및 O-RS를 코딩하는 핵산(또는 성분 O-tRNA 및/또는 O-RS)을 제2의 종, 예를 들어, 포유류, 곤충, 진균, 조류, 식물 등의 척추동물 세포 내로 도입한다. 일반적으로, O-tRNA는 tRNA 라이브러리의 구성원을 포함하는 제1 종의 척추동물 세포의 집단을 음성 선택하여 얻어진다. 음성 선택은 척추동물 세포에 내인성인 아미노아실-tRNA 합성효소(RS)에 의해 아미노아실화되는 tRNA 라이브러리의 구성원을 포함하는 세포를 제거하여, 제1 종 및 제2 종의 척추동물 세포에 오르소고날한 tRNA의 풀을 제공한다.

셀렉터 코돈

본 발명의 셀렉터 코돈은 단백질 생합성 기구의 유전자 코돈 프레임워크를 확장시킨다. 예를 들어, 셀렉터 코돈은 독특한 3염기 코돈, 앰버 코돈(UAG), 오팔 코돈(UGA)과 같은 종결 코돈 등의 넌센스 코돈, 비천연 코돈, 4염기 이상의 코돈, 희귀 코돈 등을 포함한다. 다수의, 예를 들어, 1개 이상, 2개 이상, 3개 이상의 셀렉터 코돈이 목적하는 유전자 내로 도입될 수 있다. 하나의 유전자는 주어진 셀렉터 코돈의 다수 개의 카피를 포함할 수 있거나, 다수의 상이한 셀렉터 코돈 또는 이들의 조합을 포함할 수 있다.

일 실시태양에 있어서, 척추동물 세포 내에서 비천연 아미노산을 생체내 통합하기 위한 방법은 종결 코돈인 셀렉터 코돈을 사용하는 것을 포함한다. 예를 들어, 종결 코돈, 예컨대, UAG를 인식하는 O-tRNA가 제조되어 O-RS에 의해 목적하는 비천연 아미노산으로 아미노아실화된다. 이와 같은 O-tRNA는 천연 숙주의 아미노아실-tRNA 합성효소에 의해서는 인식되지 않는다. 관심있는 폴리펩티드의 관심있는 위치에 종결 코돈, 예컨대, TAG를 도입하기 위하여 통상의 부위 특이적 돌연변이 유발법을 사용할 수 있다(예를 들어, Sayers, J.R., et al., (1988), 5',3'Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis. Nucleic Acids Res, 791-802). O-RS, O-tRNA 및 관심있는 폴리펩티드를 코딩하는 핵산이 생체내에 조합되어 존재할 때, UAG 코돈에 응답하여 비천연 아미노산이 통합됨으로써 특정 위치에 비천연 아미노산을 포함하는 폴리펩티드가 제조된다.

생체내 비천연 아미노산의 도입은 척추동물 숙주세포를 상당히 교란시키지 않으면서 이루어질 수 있다. 예를 들어, UAG 코돈에 대한 억제 효율이 O-tRNA, 예컨대, 앰버 서프레서 tRNA와 척추동물 방출 인자(예를 들어, eRF가 있으며, 종결 코돈에 결합하여 성장하는 펩티드의 리보좀으로부터의 방출을 개시함) 사이의 경쟁에 따라 달라지므로, O-tRNA, 예를 들어, 서프레서 tRNA의 발현 수준을 증가시키는 등의 방법으로 억제 효율을 조절할 수 있다.

셀렉터 코돈은 또한 연장된 코돈, 예를 들어, 4염기, 5염기, 6염기 또는 그 이상의 염기의 코돈 등, 4염기 이상의 코돈을 포함한다. 4염기 코돈의 예는 AGGA, CUAG, UAGA, CCCU 등을 포함한다. 5염기 코돈의 예는 AGGAC, CCCCU, CCCUC, CUAGA. CUACU5 UAGGC 등을 포함한다. 본 발명의 특징은 프레임쉬프트 억제에 기초하여 연장된 코돈을 사용하는 것을 포함한다. 4염기 이상의 코돈은 같은 단백질 내에 하나 또는 다수의 비천연 아미노산을 삽입할 수 있다. 일례로서, 돌연변이된 O-tRNA, 예를 들어, 8 내지 10개 뉴클레오티드 이상의 안티코돈 루프를 갖는 특별한 프레임쉬프트 서프레서 tRNA의 존재하에, 4염기 이상의 코돈은 하나의 아미노산으로 판독된다. 다른 실시태양에 있어서, 안티코돈 루프는, 예를 들어, 4염기 이상의 코돈, 5염기 이상의 코돈 또는 6염기의 이상 코돈을 판독할 수 있다. 가능한 256개의 4염기 코돈이 존재할 수 있으므로, 같은 세포 내에서 4염기 이상의 코돈을 사용하여 다수의 비천연 아미노산을 코딩할 수 있다(Anderson et al., (2002) Exploring the Limits of Codon and Anticodon Size, Chemistry and Biology, 9:237-244; Magliery, (2001) Expanding the Genetic Code: Selection of Efficient Suppressors of Four-base Codons and Identification of "Shifty " Four-base Codons with a Library Approach in Escherichia coli, J. Moi. Biol. 307: 755-769).

예를 들어, 4염기 코돈은 시험관내 생합성법에서 단백질 내로 비천연 아미노산을 도입하는 데 사용되어 왔다(예를 들어, Ma et al., (1993) Biochemistry 32:7939; and Hohsaka et al., (1999) J. Am. Chem. Soc. 121:34). CGGG 및 AGGU를 사용하여 시험관내에서 두 가지 화학적으로 아실화된 프레임쉬프트 서프레서 tRNA로 스트렙타비딘에 각각 2-나프틸알라닌 및 리신의 NBD 유도체를 동시에 도입하였다(Hohsaka et al., (1999) J. Am. Chem. Soc. 121 :12194). 시험관내 연구에서 무어(Moore et al.) 등은 NCUA 안티코돈을 갖는 tRNALeu 유도체가 UAGN 코돈(N은 U, A, G 또는 C일 수 있음)을 억제하는 것을 조사하였으며, 4중 UAGA가 UCUA 안티코돈을 갖는 tRNALeu로 해독될 수 있고, 이때 효율은 13 내지 26%로서 0 또는 -1 프레임에서 해독은 거의 없다는 것을 발견하였다(Moore et al., (2000) J. Mol. Biol., 298:195). 일 실시태양에 있어서, 희귀 코돈 또는 넌센스 코돈에 기초한 연장된 코돈이 본 발명에 사용될 수 있으며, 이는 다른 원하지 않는 위치에서 미스센스 리드쓰루(readthrough) 및 프레임쉬프트 억제를 감소시킬 수 있을 것이다.

주어진 계에서, 내인성 계가 천연 염기 코돈을 사용하지 않거나 아주 드물게 사용하는 경우, 셀렉터 코돈은 그러한 천연 3염기 코돈 중 하나를 포함할 수 있다. 예를 들어, 이것은 천연 3염기 코돈을 인식하는 tRNA가 결여된 계 및/또는 3염기 코돈이 희귀 코돈인 계를 포함한다.

셀렉터 코돈은 경우에 따라 비천연 염기쌍을 포함한다. 이들 비천연 염기쌍은 또한 존재하는 유전자 알파벳을 확장시킨다. 하나의 추가의 염기쌍은 삼중 코돈의 수를 64에서 125로 증가시킨다. 세 번째 염기쌍의 특성은 안정하고 선택적인 염기쌍 형성, 폴리머라제에 의한 높은 신뢰도로 DNA 내로의 효율적인 효소적 도입, 및 초기 비천연 염기쌍 합성 후의 효율적인 계속된 프라이머 연장을 포함한다. 본 발명의 방법 및 조성물에 사용될 수 있는 비천연 염기쌍에 대한 설명이, 예를 들어, 문헌(Hirao, et al., (2002) An unnatural base pair for incorporating amino acid analogues into protein, Nature Biotechnology, 20:177-182)에 기재되어 있다. 다른 관련 간행물은 하기에 열거되어 있다.

생체내 사용을 위해서, 비천연 뉴클레오시드는 막 투과성이며, 포스포릴화되어 상응하는 트리포스페이트를 형성한다. 또한, 증가된 유전적 정보는 안정하고, 세포내 효소에 의해 파괴되지 않는다. 베너(Benner) 등의 이전의 연구는 캐논형 왓슨-크릭 쌍(canonical Watson-Crick pairs)의 것과는 다른 수소 결합 패턴을 이용하였으며, 가장 주목할 만한 예는 이소-C:이소-G 쌍이다(Switzer et al., (1989) J. Am. Chem. Soc. 111 :8322; and Piccirilli et al., (1990) Nature, 343:33; Kool, (2000) Curr. Opin. Chem. Biol.. 4:602). 이들 염기는 일반적으로 천연 염기와 어느 정도 잘못된 쌍을 형성하며, 효소적으로 복제될 수 없다. 쿨(Kool)과 이의 동료들은 염기들 사이의 소수성 팩킹 상호작용이 수소 결합을 대체하여 염기쌍 형성을 일으킬 수 있음을 입증하였다(Kool, (2000) Curr. Opin. Chem. Biol.. 4:602; and Guckian and Kool, (1998) Angew. Chem. Int. Ed. Engl.. 36, 2825). 상기한 모든 요건을 충족시키는 비천연 염기쌍 개발을 위한 노력으로서, 슐츠(Schultz), 로메스버그(Romesberg) 및 동료들은 일련의 비천연 소수성 염기들을 쳬계적으로 합성 및 연구하였다. PICS:PICS 자기 쌍(self-pair)은 천연 염기쌍보다 안정한 것으로 밝혀졌으며, 이 콜라이 DNA 폴리머라제 I의 클레나우(Klenow) 단편(KF)에 의해 DNA 내로 효율적으로 통합될 수 있다(예를 들어, McMinn et al., (1999) J. Am. Chem. Soc., 121:11586; and Ogawa et al., (2000) J. Am. Chem. Soc. 122:3274). 3MN:3MN 자기 쌍이 생물학적 기능을 하기에 충분한 효율 및 선택성으로 KF에 의해 합성될 수 있다(예를 들어, Ogawa et al., (2000) J. Am. Chem. Soc. 122:8803). 그러나, 두 염기들은 모두 더 이상의 복제에 대한 사슬 종결 인자로 작용할 수 있다. PICS 자기 쌍을 복제하는 데 사용될 수 있는 돌연변이 DNA 폴리머라제가 최근 개발되었다. 또한, 7AI 자기 쌍이 복제될 수 있다(예를 들어, Tae et al., (2001) J. Am. Chem. Soc. 123:7439). 신규 메탈로염기 쌍 Dipic:Py이 최근 개발되었는데, 이는 Cu(II)에 결합시 안정한 쌍을 형성한다(Meggers et al., (2000) J. Am. Chem. Soc. 122:10714). 연장된 코돈 및 비천연 코돈은 실질적으로 천연 코돈에 오르소고날하기 때문에, 본 발명의 방법은 이러한 특성을 이용하여 그들에 대한 오르소고날 tRNA를 제조할 수 있다.

번역 바이패싱(bypassing) 계를 또한 목적하는 폴리펩티드 내에 비천연 아미노산을 도입하는 데 사용할 수 있다. 번역 바이패싱 계에서, 큰 서열이 유전자 내로 삽입되지만, 단백질로 번역되지는 않는다. 그러한 서열은 리보좀이 그 서열을 건너뛰어 삽입물의 하류에서 번역을 다시 시작하도록 유도하는 단서로서 작용하는 구조를 포함한다.

비천연 아미노산

본 명세서에서, 비천연 아미노산이란 셀레노시스테인 및/또는 피롤리신 및 하기 유전적으로 코딩되는 20종의 알파-아미노산 이외의 임의의 아미노산, 변형 아미노산 또는 아미노산 유사체를 의미한다: 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 이소루신, 루신, 리신,메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 타이로신, 발린. 알파-아미노산의 일반적 구조가 화학식 I에 도시되어 있다:

비천연 아미노산은 일반적으로 화학식 I의 임의의 구성체로서, R 기는 20종의 천연 아미노산 내의 측쇄와 다른 임의의 치환기일 수 있다, 20종의 천연 아미노산 구조에 대해서는, 예를 들어, 문헌(Biochemistry by L. Stryer, 3rd ed. 1988, Freeman and Company, New York)을 참조할 수 있다. 본 발명의 비천연 아미노산이 상기 20종의 천연 알파-아미노산이 아닌 천연적으로 발생하는 화합물일 수 있음에 주목하여야 한다.

본 발명의 비천연 아미노산이 일반적으로는 측쇄에 있어서 천연 아미노산과 다르기 때문에, 비천연 아미노산은 천연 단백질에서 형성되는 것과 같은 방식으로 다른, 예컨대, 천연 또는 비천연 아미노산과 아미드 결합을 형성한다. 그러나, 비천연 아미노산은 천연 아미노산과는 확실히 구별되는 측쇄를 갖는다. 예를 들어, 화학식 I의 R은 경우에 따라 알킬-, 아릴-, 아실-, 케토-, 아지도-, 히드록실-, 히드라진, 시아노-, 할로-, 히드라지드, 알케닐, 알키닐, 에테르, 티올, 셀레노-, 설포닐-, 보레이트, 보로네이트, 포스포, 포스포노, 포스핀, 헤테로시클릭, 엔온, 이민, 알데히드, 에스테르, 티오산, 히드록실아민, 아민 등, 또는 이들의 조합을 포함한다. 관심있는 다른 비천연 아미노산은 광활성화 가능한 가교결합제를 포함하는 아미노산, 스핀 표지된 아미노산, 형광 아미노산, 금속 결합 아미노산, 금속 함유 아미노산, 방사성 아미노산, 신규 작용기를 갖는 아미노산, 다른 분자와 공유 또는 비공유 상호작용하는 아미노산, 광케이징된 아미노산 및/또는 광이성질체화 가능한 아미노산, 비오틴 또는 비오틴 유사체 함유 아미노산, 케토 함유 아미노산, 폴리에틸렌 글리콜 또는 폴리에테르를 포함하는 아미노산, 중원자 치환된 아미노산, 화학적 절단 또는 광절단 가능한 아미노산, 천연 아미노산에 비해 연장된 측쇄(예를 들어, 폴리에테르 또는 장쇄 탄화수소, 예를 들어, 탄소수가 약 5 또는 약 10을 넘는 것)를 갖는 아미노산, 탄소 결합된 당 함유 아미노산, 산화환원 활성 아미노산, 아미노 티오산 함유 아미노산, 및 하나 이상의 독소 잔기를 함유하는 아미노산을 포함하나, 이에 한정되는 것은 아니다. 일부 실시태양에 있어서, 비천연 아미노산은, 예를 들어, 단백질을 고상 지지체에 결합시키는 데 사용하기 위한 광활성화 가능한 가교결합제를 갖는다. 일 실시태양에 있어서, 비천연 아미노산은 아미노산 측쇄에 부착된 당류 잔기(예를 들어, 글리코실화 아미노산) 및/또는 다른 탄수화물 변형을 갖는다.

신규 측쇄를 함유하는 비천연 아미노산 이외에, 비천연 아미노산은 또한 경우에 따라 예를 들어, 화학식 II 및 III의 구조에 나타난 바와 같은 변형된 골격 구조를 포함한다:

상기 식에서, Z는 일반적으로 OH, NH₂, SH, NH-R' 또는 S-R'를 포함하며; X 및 Y는 동일하거나 상이할 수 있으며, 일반적으로 S 또는 O를 포함하고, R 및 R'는 경우에 따라 동일하거나 상이할 수 있으며, 일반적으로 수소 또는 상기 화학식 I의 비천연 아미노산에 대해 기재된 바와 같은 R 기로부터 선택된다. 예를 들어, 본 발명의 비천연 아미노산은 경우에 따라 화학식 II 및 III에 나타낸 바와 같이 아미노 또는 카복실 기에 치환기를 갖는다. 이러한 유형의 비천연 아미노산은, 예를 들어, 통상의 20종의 천연 아미노산과 같은 측쇄 또는 비천연 측쇄를 갖는 α-히드록시 산, α-티오산, α-아미노티오카복실레이트를 포함하나, 이에 한정되는 것은 아니다. 또한, α-탄소에서의 치환은 경우에 따라 L, D, 또는 α,α-이치환 아미노산, 예컨대, D-글루타메이트, D-알라닌, D-메틸-O-타이로신, 아미노부티르산 등을 포함한다. 다른 구조적 대용 아미노산으로는 시클릭 아미노산, 예를 들어, 프롤린 유사체뿐만 아니라 3, 4, 6, 7, 8 및 9원 환 프롤린 유사체; β 및 γ 아미노산, 예를 들어, 치환된 β-알라닌 및 γ-아미노 부티르산이 있다. 예를 들어, 많은 비천연 아미노산이 타이로신, 글루타민, 페닐알라닌 등의 천연 아미노산에 기초한다. 타이로신 유사체는 파라 치환된 타이로신, 오르소 치환된 타이로신 및 메타 치환된 타이로신을 포함하며, 치환된 타이로신은 예를 들어, 케토기(예를 들어, 아세틸기), 벤조일기, 아미노기, 히드라진, 히드록시아민, 티올기, 카복시기, 이소프로필기, 메틸기, C₆-C₂₀ 직쇄 또는 분지쇄 탄화수소, 포화 또는 불포화 탄화수소, O-메틸기, 폴리에테르기, 니트로기, 알키닐기 등을 포함한다. 또한, 다중 치환된 아릴 환도 또한 고려된다. 본 발명의 글루타민 유사체는 α-히드록시 유도체, γ-치환된 유도체, 사이클릭 유도체, 및 아미드 치환된 글루타민 유도체를 포함하나, 이에 한정되는 것은 아니다. 페닐알라닌 유사체의 예는 파라-치환된 페닐알라닌, 오르소 치환된 페닐알라닌 및 메타 치환된 페닐알라닌으로서, 치환기가, 예를 들어 히드록시기, 메톡시기, 메틸기, 알릴기, 알데히드, 아지도, 요오도, 브로모, 케토기(예를 들어, 아세틸기), 벤조일기, 알키닐기를 포함하나, 이에 한정되는 것은 아니다. 비천연 아미노산의 구체적인 예는 p-아세틸-L-페닐알라닌, p-프로파길옥시페닐알라닌, O-메틸-L-타이로신, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, O-4-알릴-L-타이로신, 4-프로필-L-타이로신, 트리-O-아세틸-GlcNAcβ-세린, L-Dopa, 플루오르화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, L-포스포세린, 포스포노세린, 포스포노타이로신, p-요오도-페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌 및 이소프로필-L-페닐알라닌 등을 포함하나, 이에 한정되는 것은 아니다. 각종 비천연 아미노산의 구조가 예를 들어, WO 2002/085923(발명의 명칭: "In vivo incorporation of unnatural amino acids")의 도 16, 17, 18, 19, 26 및 29에 제공되어 있다. 또 다른 메티오닌 유사체에 대해서는, 문헌(Kiick et al., (2002) Incorporation of azides into recombinant proteins for chemoselective modification by the Staudinger ligation, PNAS 99:19-24)의 도 1의 구조 2 내지 5를 참조할 수 있다.

일 실시태양에 있어서, 비천연 아미노산(예를 들어, p-(프로파길옥시)-페닐알라닌)을 포함하는 조성물이 제공된다. p-(프로파길옥시)-페닐알라닌을 포함하는 각종 조성물 및 예를 들어, 단백질 및/또는 세포가 또한 제공된다. 일 측면에 있어서, p-(프로파길옥시)-페닐알라닌 비천연 아미노산을 포함하는 조성물은 추가로 오르소고날 tRNA를 포함한다. 비천연 아미노산은 오르소고날 tRNA에(예를 들어, 공유적으로) 결합될 수 있으며, 예컨대, 오르소고날 tRNA에 아미노-아실 결합을 통해 공유 결합되거나, 또는 오르소고날 tRNA의 말단 리보스 당의 3'OH 또는 2'OH에 공유 결합될 수 있다.

단백질 내로 통합될 수 있는 비천연 아미노산을 통한 화학적 잔기는 단백질에 각종 장점 및 조작을 가능하게 한다. 예를 들어, 케토 작용기의 독특한 반응성은 시험관내 및 생체내에서 단백질을 다수의 각종 히드라진- 및 히드록실아민 함유 반응제로 선택적으로 변형할 수 있게 한다. 중원자 비천연 아미노산은, 예를 들어, X-선 구조 데이터를 페이징하는 데 유용할 수 있다. 비천연 아미노산을 사용한 중원자의 부위 특이적 도입은 중원자 위치를 선택함에 있어서 선택성과 유연성을 제공한다. 광반응성 비천연 아미노산(예를 들어, 벤조페논 및 페닐아지드와 같은 아릴아지드 측쇄를 갖는 아미노산)은, 예를 들어, 시험관내 및 생체내 단백질을 광가교결합시키는 데 있어서 효율적이다. 광반응성 비천연 아미노산의 예는 p-아지도-페닐알라닌 및 p-벤조일-페닐알라닌을 포함하나, 이에 한정되는 것은 아니다. 광반응성 비천연 아미노산을 갖는 단백질은 광반응성 기 제공 일시적(및/또는 공간적) 콘트롤을 여기시켜 의도에 따라 가교결합될 수 있다. 일 실시태양에 있어서, 비천연 아미노산의 메틸기는, 예를 들어, 핵자기 공명 및 진동 분광분석을 이용하는 경우, 지엽적 구조 및 동력학의 프로브로서 동위원소로 표지된, 예컨대, 메틸기로 치환될 수 있다. 알키닐 또는 아지도 작용기는, 예를 들어, 단백질을 [3+2] 고리화 첨가 반응 반응을 통해 다른 분자로 선택적으로 변형시키는 것을 가능하게 한다.

비천연 아미노산의 화학적 합성

상기 제공된 많은 수의 비천연 아미노산이, 예를 들어, 시그마(Sigma, USA) 또는 알드리치(Aldrich; Milwaukee, WI, USA)로부터 시판되고 있다. 시판되고 있지 않은 것은 경우에 따라 본 명세서에 기재된 바에 따라, 각종 문헌에 기재된 방법에 따라 또는 당업계에 알려진 표준 방법으로 합성될 수 있다. 유기 합성 기술에 대해서는, 예를 들어, 문헌(Organic Chemistry by Fessendon and Fessendon, (1982, Second Edition, Willard Grant Press, Boston Mass.); Advanced Organic Chemistry by March(Third Edition, 1985, Wiley and Sons, New York); and Advanced Organic Chemistry by Carey and Sundberg(Third Edition, Parts A and B, 1990, Plenum Press, New York))을 참조할 수 있다. 비천연 아미노산의 합성을 기술하고 있는 다른 간행물은, 예를 들어, WO 2002/085923(발명의 명칭: "In vivo incorporation of Unnatural Amino Acids") 및 문헌(Matsoukas et al., (1995) J. Med. Chem.. 38, 4660-4669; King, F.E. & Kidd, D.A.A. (1949) A New Synthesis of Glutamine and of γ-Dipeptides of Glutamic Acid from Phthylated Intermediates. J. Chem. Soc. 3315-3319; Friedman, O.M. & Chatterrji, R. (1959) Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents. J. Am. Chem. Soc. 81, 3750-3752; Craig, J.C. et al., (1988) Absolute Configuration of the Enantiomers of 7-Chloro-4 [[4-(diethylamino)-1-methylbutyl]amino]quinoline(Chloroquine). J. Org. Chem. 53, 1167-1170; Azoulay, M., Vilmont, M. & Frappier, F. (1991) Glutamine analogues as Potential Antimalarials,. Eur. J. Med. Chem. 26, 201-5; Koskinen, A.M.P. & Rapoport, H. (1989) Synthesis of 4-Substituted Prolines as Conformationally Constrained Amino Acid Analogues. J. Org. Chem. 54, 1859-1866; Christie, B.D. & Rapoport, H. (1985) Synthesis of Optically Pure Pipecolates from L-Asparagine. Application to the Total Synthesis of(+)-Apovincamine through Amino Acid Decarbonylation and lminium Ion Cyclization. J. Org. Chem. 1989:1859-1866; Barton et al., (1987) Synthesis of Novel α-Amino-Acids and Derivatives Using Radical Chemistry: Synthesis of L- and D-α-Amino-Adipic Acids, L-α-aminopimelic Acid and Appropriate Unsaturated Derivatives. Tetrahedron Lett. 43:4297-4308; and, Subasinghe et al., (1992) Quisqualic acid analogues: synthesis of beta-heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site, J. Med. Chem. 35:4602-7)을 포함한다.

비천연 아미노산의 세포 흡수

척추동물 세포에 의한 비천연 아미노산의 흡수는, 예컨대, 단백질 내로 도입하기 위해 비천연 아미노산을 설계하고 선택할 때 일반적으로 고려되는 한 가지 문제이다. 예를 들어, α-아미노산의 높은 전하 밀도는 이들 화합물이 세포 투과성이지 못할 것이라는 암시를 준다. 천연 아미노산은 척추동물 세포 내로 일련의 단백질 기초 운송계에 의해 흡수된다. 가능하다면 어떤 비천연 아미노산이 세포에 의해 흡수될 것인가를 평가하는 빠른 스크리닝을 수행할 수 있다. 독성 분석에 대해서는 출원(발명의 명칭: "Protein Arrays," 대리인 사건 번호 P1OOlUS00, 2002년 12월 22일 출원) 및 문헌(Liu, D.R. & Schultz, P.G. (1999) Progress toward the evolution of an organism with an expanded genetic code, PNAS United States 96:4780-4785)을 참조할 수 있다. 각종 분석법으로 흡수를 쉽게 분석할 수 있지만, 세포 흡수 경로에 이용될 수 있는 비천연 아미노산을 설계하는 것에 대한 다른 대안은 생체내 아미노산을 제조하는 생합성 경로를 제공하는 것이다.

비천연 아미노산의 생합성

세포 내에는 아미노산 및 다른 화합물을 제조하기 위한 많은 생합성 경로가 이미 존재한다. 특정 비천연 아미노산의 생합성 경로는 자연, 예를 들어, 척추동물 세포에는 존재하지 않을 수 있지만, 본 발명은 그러한 방법을 제공한다. 예를 들어, 비천연 아미노산의 생합성 경로는 경우에 따라 숙주 세포에 새로운 효소를 가하거나 존재하는 생합성 경로를 변화시켜 숙주 세포 내에 생성될 수 있다. 추가되는 새로운 효소는 경우에 따라 천연 효소이거나 인공적으로 개발된 효소이다. 예를 들어, p-아미노페닐알라닌의 생합성(예를 들어, WO 2002/085923, 발명의 명칭 "In vivo incorporation of unnatural amino acids"에 기재된 바와 같은)은 다른 생물로부터 공지된 효소의 조합을 가하는 것이다. 이들 효소에 대한 유전자는 척추동물 세포를 그러한 유전자를 포함하는 플라스미드로 형질전환시킴으로써 세포 내에 도입될 수 있다. 유전자는 세포 내에서 발현될 때 목적하는 화합물을 제조하는 효소적 경로를 제공한다. 임의로 가해지는 효소 유형의 예는 하기 실시예에 제공되어 있다. 추가되는 효소 서열은, 예를 들어, 진뱅크부터 얻을 수 있다. 인공적으로 개발된 효소 또한 경우에 따라 같은 방법으로 세포에 가해진다. 이와 같은 방식으로, 세포 내 기구 및 자원이 조작되어 아미노산을 제조하게 된다.

생합성 경로에 사용하거나 기존의 경로를 개발하는 데 사용하기 위한 신규 효소를 제조하는 데 각종 방법을 이용할 수 있다. 경우에 따라, 예를 들어, 맥시젠(Maxygen, Inc., www.maxygen.com)에 의해 개발된 바와 같은 반복적 재조합을 이용하여 신규 효소 및 경로를 개발할 수 있다(예를 들어, Stemmer(1994), Rapid evolution of a protein in vitro by DNA shuffling, Nature 370(4):389-391 ; and, Stemmer, (1994), DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution, Proc . Natl . Acad . Sci . USA .. 91 : 10747-10751). 마찬가지로, 경우에 따라 제넨코(Genencor, www.genencor.com)에 의해 개발된 디자인패스(DesignPath™)를 사용하여 대사 경로 가공, 예를 들어, 세포에서 O-메틸-L-타이로신을 제조하는 경로를 가공할 수 있다. 이러한 기술은, 예컨대, 기능적 게놈 분석, 분자 개발 및 설계를 통해 확인되는 바와 같은, 새로운 유전자의 조합을 사용하여 숙주 생물내 기존의 경로를 사용하여 재구축할 수 있다. 다이버사 코포레이션(Diversa Corporation, www.diversa.com)은 또한 예를 들어, 새로운 경로를 생성하기 위해 유전자 및 유전자 경로의 라이브러리를 신속하게 스크리닝하는 기술을 제공한다.

일반적으로, 본 발명의 가공된 생합성 경로로 제조되는 비천연 아미노산은 단백질 생합성에 충분한 농도, 예를 들어, 천연 세포 내의 양이지만, 다른 아미노산의 농도에 영향을 미치거나 다른 세포 내 자원을 소진시키지 않는 정도로 제조된다. 이와 같은 방식으로 생체내 제조되는 전형적인 농도는 약 10 mM 내지 약 0.05 mM이다. 일단 세포가 특별한 경로에 바람직한 효소를 제조하는 데 사용되는 유전자를 포함하는 플라스미드로 형질전환되어 비천연 아미노산이 제조되면, 경우에 따라 리보좀 단백질 합성 및 세포 성장을 위한 비천연 아미노산의 제조를 더욱 최적화하기 위한 생체내 선택이 이용된다.

비천연 아미노산을 갖는 폴리펩티드

하나 이상의 비천연 아미노산을 갖는 단백질 또는 폴리펩티드는 본 발명의 특징이다. 본 발명은 또한 본 발명의 조성물 및 방법을 사용하여 제조된 적어도 하나의 비천연 아미노산을 갖는 단백질 또는 폴리펩티드를 포함한다. 부형제(예를 들어, 제약상 허용 가능한 부형제)가 또한 단백질과 함께 존재할 수 있다.

척추동물 세포 내에서 하나 이상의 비천연 아미노산을 갖는 관심있는 단백질 또는 폴리펩티드를 제조함으로써, 단백질이나 폴리펩티드는 일반적으로 척추동물 세포의 번역후 변형을 포함하게 될 것이다. 일부의 실시태양에 있어서, 단백질은 하나 이상의 비천연 아미노산과 척추동물 세포에서 생체내에서 만들어지는 적어도 하나의 번역후 변형을 포함하는데, 그와 같은 번역후 변형은 원핵 세포에서는 만들어지지 않는다. 예를 들어, 번역후 변형은 아세틸화, 아실화, 지질 변형, 팔미토일화, 팔미테이트 부가, 포스포릴화, 당-지질 결합 변형, 글리코실화 등을 포함한다. 일 측면에 있어서, 번역후 변형은 올리고당(예를 들어, (GlcNAc-Man)₂-Man-GlcNAc-GlcNAc))를 아스파라긴에 GlcNAc-아스파라긴 결합을 통해 부착시키는 것을 포함한다. 표 7은 척추동물 단백질의 N-결합된 올리고당의 예를 보여주고 있는데(도시되지 않은 추가의 잔기가 있을 수 있음), 이를 참조할 수 있다. 또 다른 측면에 있어서, 번역후 변형은 올리고당(예를 들어, Gal-GalNAc, Gal-GlcNAc 등)를 세린 또는 트레오닌에 GalNAc-세린 또는 GalNAc-트레오닌 결합 또는 GlcNAc-세린 또는 GlcNAc-트레오닌 결합을 통해 부착시키는 것을 포함한다.

표 7: GlcNAc-결합을 통한 올리고당의 예

또 다른 측면에 있어서, 번역후 변형은 전구체(예를 들어, 칼시토닌 전구체, 칼시토닌 유전자 관련 펩티드 전구체, 프리프로부갑상선 호르몬, 프리프로인슐린, 프로인슐린, 프리프로-오피오멜라노코르틴, 프로-오피오멜라노코르틴 등)의 단백질 분해 프로세싱, 멀티서브유닛 단백질로의 어셈블리 또는 거대분자 어셈블리, 세포내 다른 위치로의 번역(예를 들어, 소포체, 골지체, 핵, 라이소좀, 퍼옥시좀, 미토콘드리아, 엽록체, 액포 등과 같은 소기관으로 또는 분비 경로를 통하여) 등을 포함한다. 일부 실시태양에 있어서, 단백질은 분비 또는 편재화 서열, 에피토프 태그, FLAG 태그, 폴리히스티딘 태그, GST 융합부 등을 포함한다.

비천연 아미노산의 하나의 장점은 다른 분자를 부착시킬 수 있는 추가의 화학적 잔기를 제공한다는 것이다. 이들 변형은 척추동물 세포에서 생체내 또는 시험관내에서 만들어질 수 있다. 따라서, 일부 실시태양에 있어서, 번역후 변형은 비천연 아미노산을 통해서 이루어진다. 예를 들어, 번역후 변형은 친핵성-친전자성 반응을 통해 일어날 수 있다. 단백질의 선택적 변형에 현재 사용되고 있는 대부분의 반응은 친핵성 및 친전자성 반응 파트너 사이의 공유 결합 형성, 예를 들어, α-할로케톤과 히스티딘 또는 시스테인 측쇄의 반응을 포함한다. 이 경우에 선택성은 단백질 중 친핵성 잔기의 수 및 접근성에 의해 결정된다. 본 발명의 단백질에서, 다른 보다 선택적인 반응, 예컨대, 시험관내 및 생체내에서 비천연 케토아미노산과 하이드라진 또는 아미노옥시 화합물과의 반응을 이용할 수 있다(예를 들어, Cornish, et al., (1996) Am. Chem. Soc. 118:8150-8151; Mahal, et al., (1997) Science, 276:1 125-1128; Wang, et al., (2001) Science 292:498-500; Chin, et al., (2002) Am. Chem. Soc. 124:9026-9027; Chin, et al., (2002) Proc. Natl. Acad. Sci. 99:11020-11024; Wang, et al., (2003) Proc. Natl. Acad. Sci., 100:56-61; Zhang, et al., (2003) Biochemistry, 42:6735-6746; and, Chin, et al., (2003) Science, in press). 이는 실질적으로 모든 단백질을 다수의 반응제, 예를 들어, 형광물질, 가교결합제, 당류 유도체 및 세포독성 분자로 선택적 표지하는 것을 가능하게 한다(미국 특허 출원 제10/686,944호, 발명의 명칭 "Glycoprotein synthesis," 2003년 10월 15일 출원). 번역후 변형, 예를 들어, 아지도 아미노산을 통한 변형은, 또한 스토딩거(Staudinger) 연결을 통해서(예를 들어, 트리아릴포스핀 반응제와 함께) 이루어질 수 있다(예를 들어, Kiick et al., (2002) Incorporation of azides into recombinant proteins for chemoselective modification by the Staudinger ligation, PNAS 99: 19-24).

본 발명은 단백질의 선택적 변형을 위한 또 다른 고도의 효율적 방법을 제공하는데, 이는 비천연 아미노산, 예를 들어, 아지드 또는 알키닐 잔기를 함유하는 비천연 아미노산을 셀렉터 코돈에 반응하여 단백질 내로 유전적으로 통합시키는 것을 포함한다. 이들 아미노산 사슬은 이어서, 예컨대, 각각 알키닐 또는 아지드 유도체와 함께 휘스젠(Huisgen) [3+2] 고리화 첨가 반응 반응(예를 들어, Padwa, A. in Comprehensive Organic Synthesis. Vol. 4, (1991) Ed. Trost, B. M., Pergamon, Oxford, p. 1069-1109; and, Huisgen, R. in 1,3-Dipolar Cycloaddition Chemistry. (1984) Ed. Padwa, A., Wiley, New York, p. 1-176)에 의해서 변형될 수 있다. 예를 들어, 도 16을 참조할 수 있다. 이 방법이 친핵성 치환이 아닌 고리화 첨가 반응을 포함하는 것이기 때문에, 단백질은 극도로 높은 선택성으로 변형될 수 있다. 이 반응은 실온에서 수성 조건하에 촉매량의 Cu(I) 염을 반응 혼합물에 가함으로써 탁월한 방향선택성(1,4 > 1,5)으로 수행될 수 있다(예를 들어, Tornoe, et al., (2002) Org. Chem. 67:3057-3064; and, Rostovtsev, et al., (2002) Angew. Chem. Int. Ed. 41:2596-2599). 사용될 수 있는 또 다른 방법은 이비소(biarsenic) 화합물 상에서 테트라시스테인 모티프로 리간드 교환하는 것이다(예를 들어, Griffin, et al., (1998) Science 281:269-272).

본 발명의 단백질에 비천연적으로 코딩된 아미노산의 작용기를 통해 부가될 수 있는 분자는 상보적인 작용기를 갖는 실질적으로 모든 분자이다. 그러한 분자는 염료, 형광 물질, 가교결합제, 당류 유도체, 중합체(예를 들어, 폴리에틸렌 글리콜의 유도체), 광가교결합제, 세포독성 화합물, 친화도 표지, 비오틴 유도체, 수지, 비드, 제2 단백질 또는 폴리펩티드(또는 그 이상의 단백질 또는 폴리펩티드 등), 폴리뉴클레오티드(예를 들어, DNA, RNA 등), 금속 킬레이터, 보조 인자, 지방산, 탄수화물 등을 포함하나, 이에 한정되는 것은 아니다. 또 다른 측면으로서, 본 발명은 그와 같은 분자를 포함하는 조성물 및 이러한 분자, 예컨대, n이 50 내지 10,000, 75 내지 5,000, 100 내지 2,000, 100 내지 1,000 사이의 정수인 폴리에틸렌 글리콜을 제조하는 방법을 제공한다. 본 발명의 실시태양에 있어서, 폴리에틸렌 글리콜은 분자량이, 예를 들어, 약 5,000 내지 약 100,000 Da, 약 20,000 내지 약 30,000, 약 40,000 또는 약 50,000 Da, 약 20,000 내지 약 10,000 Da이다.

단백질 또는 세포와 함께 이들 화합물을 포함하는 각종 조성물이 또한 제공된다. 본 발명의 일 측면에 있어서, 아지도 염료(예를 들어, 화학 구조 4 또는 화학 구조 6)를 포함하는 단백질은 하나 이상의 비천연 아미노산(예를 들어, 알키닐 아미노산)을 추가로 포함하며, 여기서 아지도 염료는 [3+2] 고리화 첨가 반응을 통해서 비천연 아미노산에 부착된다.

본 발명의 척추동물 세포는 비천연 아미노산을 유용한 다량으로 포함하는 단백질을 합성하는 능력을 제공한다. 일 측면에 있어서, 조성물은 경우에 따라 비천연 아미노산을 포함하는 단백질을 10 ㎍ 이상, 50 ㎍ 이상, 75 ㎍ 이상, 100 ㎍ 이상, 200 ㎍ 이상, 250 ㎍ 이상, 500 ㎍ 이상, 1 mg 이상, 10 mg 이상 포함하거나, 생체내 단백질 제조 방법(재조합 단백질 제조 및 정제에 관한 상세한 사항이 본 명세서에 기재되어 있음)에서 얻어질 수 있는 양만큼 포함한다. 또 다른 측면에 있어서, 단백질은 경우에 따라 조성물 중에, 예컨대, 세포 용해물, 완충액, 제약용 완충액 또는 다른 액상 현탁액(예를 들어, 약 1 nl 내지 약 100 L 중 어느 부피로나) 중에, 예컨대, 10 ㎍(단백질)/L 이상, 50 ㎍/L 이상, 75 ㎍/L 이상, 100 ㎍/L 이상, 200 ㎍/L 이상, 250 ㎍/L 이상, 500 ㎍/L 이상, 1 mg/L 이상, 또는 10 mg/L 또는 그 이상의 농도로 존재한다. 척추동물 세포에서 하나 이상의 비천연 아미노산을 포함하는 단백질을 다량(다른 방법, 예컨대, 시험관내 번역에서 일반적으로 얻어지는 것보다 많은 양) 제조하는 것 또한 본 발명의 특징이다.

비천연 아미노산의 도입은 단백질 구조 및/또는 기능에 있어서의 맞춤식 변화, 예를 들어, 크기, 산성도, 친전자도, 수소 결합, 소수성도, 프로테아제 표적 부위의 접근성, 잔기로의 표적 유도(예를 들어, 단백질 어레이를 위해) 등을 변화시키기 위해 수행될 수 있다. 비천연 아미노산을 포함하는 단백질은 증가되거나 심지어는 전혀 새로운 촉매적 또는 물리적 특성을 갖는다. 예를 들어, 다음 특성들이 경우에 따라 단백질 내로 비천연 아미노산을 포함시키는 것에 의해 변화된다: 독성, 생체내 분포, 구조적 특성, 분광 특성, 화학 및/또는 광화학 특성, 촉매 능력, 반감기(예를 들어, 혈청 반감기), 다른 분자와, 예를 들어, 공유적으로 또는 비공유적으로 반응하는 능력 등. 하나 이상의 비천연 아미노산을 포함하는 단백질을 포함하는 조성물은, 예를 들어, 신규 치료제, 진단제, 촉매 효소, 산업용 효소, 결합 단백질(예를 들어, 항체), 및 단백질 구조 및 기능의 연구에 유용하다(예를 들어, Dougherty, (2000) Unnatural Amino Acids as Probes of Protein Structure and Function, Current Opinion in Chemical Biology 4:645-652).

본 발명의 일 측면에 있어서, 조성물은 적어도 1개, 예를 들어, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 또는 적어도 10개 또는 그 이상의 비천연 아미노산을 갖는 하나 이상의 단백질을 포함한다. 비천연 아미노산은 동일하거나 상이할 수 있으며, 단백질 내에는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 또는 그 이상의 상이한 비천연 아미노산을 포함하는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 또는 그 이상의 상이한 부위가 있을 수 있다. 또 다른 측면에 있어서, 조성물은 단백질 중 적어도 하나 이상의, 그러나 전부보다는 적은 수의 특정 아미노산이 비천연 아미노산으로 치환된 단백질을 포함한다. 2개 이상의 비천연 아미노산을 갖는 주어진 단백질에서, 비천연 아미노산은 동일하거나 상이할 수 있다(예컨대, 단백질은 2개 이상의 상이한 유형의 비천연 아미노산을 포함하거나, 같은 비천연 아미노산 2개를 포함할 수 있다). 3개 이상의 비천연 아미노산을 포함하는 주어진 단백질에서, 비천연 아미노산은 동일하거나 상이하거나, 또는 같은 종류의 다수의 아미노산과 하나 이상의 다른 비천연 아미노산의 조합일 수 있다.

실질적으로 비천연 아미노산을 포함하는 어떠한 단백질이나 그 일부분(및, 예를 들어, 하나 이상의 셀렉터 코돈을 포함하는 상응하는 코딩 핵산)을 본 명세서 기재된 조성물 및 방법을 사용하여 제조할 수 있다. 수백 수천의 공지된 단백질을 확인하기 위한 시도는 없었지만, 이들 중 어느 것이나 하나 이상의 비천연 아미노산을 포함하도록, 예를 들어, 관련 번역계에 하나 이상의 적절한 셀렉터 코돈을 포함하도록 이용 가능한 돌연변이 유발법을 맞춤 사용하여 변형시킬 수 있다. 공지된 단백질에 대한 공공 서열 저장 기관은 진뱅크, EMBL, DDBJ 및 NCBI를 포함한다. 인터넷을 검색하여 다른 저장 기관도 쉽게 찾을 수 있을 것이다.

일반적으로, 단백질은 임의의 이용 가능한 단백질(예를 들어, 치료용 단백질, 진단용 단백질, 산업용 효소, 또는 이들의 일부분)에, 예를 들어, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 또는 적어도 99% 또는 그 이상 동일하며, 하나 이상의 비천연 아미노산을 포함한다. 치료제, 진단제, 및 하나 이상의 비천연 아미노산을 포함하도록 변형될 수 있는 다른 단백질의 예는 알파-1 안티트립신, 안지오스타틴, 항용혈 인자, 항체(항체에 대한 상세 설명은 이하 기재됨), 아포지단백질, 아포단백질, 심방 나트륨 이뇨 인자, 심방 나트륨 이뇨 폴리펩티드, 심방 펩티드, C-X-C 케모카인(예를 들어, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG), 칼시토닌, CC 케모카인(예를 들어, 단핵구 화학유인 단백질-1, 단핵구 화학유인 단백질-2, 단핵구 화학유인 단백질-3, 단핵구 염증 단백질-1 알파, 단핵구 염증 단백질-1 베타, RANTES, I309, R83915, R91733, HCC1, T58847, D31065, T64262), CD40 리간드, C-kit 리간드, 콜라겐, 콜로니 자극 인자(CSF), 보체 인자 5a, 보체 억제제, 보체 수용체 1, 사이토카인(예를 들어, 상피세포 호중구 활성화 펩티드-78, GROα/MGSA, GROβ, GROγ, MIP-1α, MIP-1δ, MCP-1), 상피세포 성장 인자(EGF), 에리스로포이에틴("EPO", 하나 이상의 비천연 아미노산 도입에 의한 변형의 바람직한 표적이 됨), 박리 독소 A 및 B, 인자 IX, 인자 VII, 인자 VIII, 인자 X, 섬유아세포 성장 인자(FGF), 피브리노겐, 피브로넥틴, G-CSF, GM-CSF, 글루코세레브로시다제, 고나도트로핀, 성장 인자, 헤지호그 단백질(예를 들어, 소닉(Sonic), 인디언(Indian), 데저트(Desert)), 헤모글로빈, 간세포 성장 인자(HGF), 히루딘, 인간 혈청 알부민, 인슐린, 인슐린 유사 성장 인자(IGF), 인터페론(예를 들어, IFN-α, IFN-β, IFN-γ), 인터루킨(예를 들어, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12 등), 각질 세포 성장 인자(KGF), 락토페린, 백혈병 억제 인자, 루시퍼라제, 뉴투린, 호중구 억제 인자(NIF), 온코스타틴 M, 골원성 단백질, 부갑상선 호르몬, PD-ECSF, PDGF, 펩티드 호르몬(예를 들어, 인간 성장 호르몬), 플레이오트로핀, 단백질 A, 단백질 G, 발열성 외독소 A, B 및 C, 릴렉신, 레닌, SCF, 가용성 보체 수용체 I, 가용성 I-CAM 1, 가용성 인터루킨 수용체(IL-I, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15), 가용성 TNF 수용체, 소마토메딘, 소마토스타틴, 소마토트로핀, 스트렙토키나제, 슈퍼항원, 즉 스타필로코커스 외독소(SEA, SEB, SEC1, SEC2, SEC3, SED, SEE), 슈퍼옥시드 디스뮤타제(SOD), 독성 쇼크 증후군 독소(TSST-I), 티모신 알파 1, 조직 플라스미노겐 활성화 인자, 종양 괴사 인자 베타(TNFβ), 종양 괴사 인자 수용체(TNFR), 종양 괴사 인자-알파(TNFα), 혈관 내피세포 성장 인자(VEGEF), 유로키나제 및 기타 여러 가지를 포함하나, 이에 한정되는 것은 아니다.

본 명세서에 기재된 바와 같은 비천연 아미노산의 생체내 도입을 위한 조성물 및 방법을 사용하여 만들 수 있는 한 부류의 단백질은 전사 조절인자 또는 그 일부분을 포함한다. 전사 조절인자의 예는 세포 성장, 분화, 조절 등을 조절하는 유전자 및 전사 조절인자 단백질을 포함한다. 전사 조절인자는 원핵 생물, 바이러스, 및 진균, 식물, 효모, 곤충 및 포유류 등의 동물 등을 포함하는 진핵 생물에서 발견되어, 광범위한 치료 표적을 제공한다. 발현 및 전사 활성화 인자는 많은 메카니즘을 통해서, 예컨대, 수용체에의 결합, 신호 전달 캐스케이드 자극, 전사 인자의 발현 조절, 프로모터 및 인핸서에의 결합, 프로모터 및 인핸서에 결합하는 단백질에의 결합, DNA 풀기, 프리-mRNA 스플라이싱, RNA 폴리아데닐화 및 RNA 분해를 통해서 전사를 조절하는 것이 잘 알려져 있다. 예를 들어, 척추동물 세포 중 GAL4 단백질 또는 그 일부분의 조성물이 또한 본 발명의 특징이다. 일반적으로, GAL4 단백질 또는 그 일부분은 하나 이상의 비천연 아미노산을 포함한다. "오르소고날 아미노아실-tRNA 합성효소"란을 참조할 수 있다.

본 발명의 단백질의 한 부류(하나 이상의 비천연 아미노산을 포함하는 단백질)는 발현 활성화제, 예컨대, 사이토카인, 염증 분자, 성장 인자, 이들의 수용체, 및 암유전자 생성물, 예를 들어, 인터루킨(예를 들어, IL-1, IL-2, IL-8 등), 인터페론, FGF, IGF-I, IGF-II, FGF, PDGF, TNF, TGF-α, TGF-β, EGF, KGF, SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1, ICAM-l/LFA-1, 및 히알루린/CD44; 신호 전달 분자 및 상응하는 암유전자 생성물, 예를 들어, Mos, Ras, Raf 및 Met; 및 전사 활성화 인자 및 억제제, 예를 들어, p53, Tat, Fos, Myc, Jun, Myb, Re1 및 스테로이드 호르몬 수용체, 예컨대, 에스트로겐, 프로게스테론, 테스토스테론, 알도스테론, LDL 수용체 리간드 및 코르티코스테론 수용체를 포함한다.

하나 이상의 비천연 아미노산을 갖는 효소(예를 들어, 산업용 효소) 또는 그 일부분이 또한 본 발명에 의해 제공된다. 효소의 예는, 아미다제, 아미노산 라세마제, 아실라제, 데할로게나제, 디옥시게나제, 다아릴프로판 퍼옥시다제, 에피머라제, 에폭시드 하이드롤라제, 에스터라제, 이소머라제, 키나제, 글루코스 이소머라제, 글리코시다제, 글리코실 트랜스퍼라제, 할로퍼옥시다제, 모노옥시게나제(예를 들어, p450s), 리파제, 리그닌 퍼옥시다제, 니트릴 하이드라타제, 니트릴라제, 프로테아제, 포스파타제, 서브틸리신, 트랜스아미나제 및 뉴클레아제 등을 포함하나, 이에 한정되는 것은 아니다.

이들 단백질 중 다수가 상업적으로 이용 가능한 것이고(예를 들어, Sigma BioSciences 2002 카탈로그 및 가격표 참조), 상응하는 단백질 서열 및 유전자, 및 일반적으로는 이들의 변이체가 잘 알려져 있다(예를 들어, 진뱅크). 이들 중 어느 것이나 본 발명에 따른 하나 이상의 비천연 아미노산 삽입에 의해 변형되어, 예컨대, 관심있는 한 가지 이상의 치료, 진단 또는 효소 특성과 관련하여 단백질을 변화시킬 수 있다. 치료 관련 특성의 예는 혈청 반감기, 보관 반감기, 안정성, 면역원성, 치료 활성, 검출 가능성(예를 들어, 표지 또는 표지 결합 부위와 같은 리포터기를 비천연 아미노산 내에 포함시켜), LD₅₀ 또는 다른 부작용의 감소, 소화관을 통해 체내로 들어가는 능력(예를 들어, 경구 투여 가능성) 등을 포함한다. 진단제 관련 특성의 예는 보관 반감기, 안정성, 진단 활성, 검출 가능성 등을 포함한다. 효소 관련 특성의 예는 보관 반감기, 안정성, 효소 활성, 제조 성능 등을 포함한다.

각종 다른 단백질이 하나 이상의 비천연 아미노산을 갖도록 변형될 수 있다. 예를 들어, 본 발명은 하나 이상의 백신 단백질 내의 하나 이상의 천연 아미노산을 비천연 아미노산으로 치환하는 것을 포함하며, 백신 단백질은, 예컨대, 감염성 진균, 예를 들어, 아스퍼질러스(Aspergillus), 캔디다(Candida) 종; 박테리아, 특히 병원성 박테리아의 모델인 이 콜라이뿐만 아니라, 스타필로코커스(예를 들어, 스타필로코커스 오레우스(Staphylococcus aureus)) 또는 스트렙토코커스(예를 들어, 스트렙토코커스 뉴모니아(Streptococci pneumoniae))와 같은 의학적으로 중요한 박테리아; 포자충(예를 들어, 플라스모디아(Plasmodia)), 근족충(예를 들어, 엔트아메바(Entamoeba)) 및 편모충(트리파노소마(Trypanosoma), 레이쉬마니아(Leishmania), 트리코모나스(Trichomonas), 쟈르디아(Giardia) 등)과 같은 원생동물; (+)RNA 바이러스(예를 들어, 백시니아와 같은 폭스바이러스; 폴리오와 같은 피코르나바이러스; 루벨라와 같은 토가바이러스; HCV와 같은 플라비바이러스; 및 코로나바이러스), (-)RNA 바이러스(예를 들어, VSV와 같은 랍도바이러스; RSV와 같은 파라믹소바이러스; 인플루엔자와 같은 오르소믹소바이러스; 버냐바이러스; 및 아레나바이러스), dsDNA 바이러스(예를 들어, 레오바이러스), RNA로부터 DNA 복제 바이러스, 즉, 레트로바이러스, 예를 들어, HIV 및 HTLV, 및 DNA로부터 RNA 복제 바이러스, 예를 들어, 간염 바이러스 B로부터의 것이다.

농업 관련 단백질, 예컨대, 곤충 내성 단백질(예를 들어, Cry 단백질), 전분 및 지질 제조 효소, 식물 및 곤충 독소, 독소 내성 단백질, 마이코톡신 해독 단백질, 식물 생장 효소(예를 들어, 리뷸로스 1,5-비스포스페이트 카복실라제/옥시게나제, "RUBISCO"), 리폭시게나제(LOX), 및 포스포에놀피루베이트(PEP) 카복실라제가 또한 비천연 아미노산 변형의 적절한 표적이다.

본 발명은 또한 척추동물 세포에서 하나 이상의 비천연 아미노산을 포함하는하나 이상 단백질을 제조하는 방법(및 이와 같은 방법에 의해 제조된 단백질)을 제공한다. 예를 들어, 그 방법은 적어도 하나 이상의 셀렉터 코돈을 포함하며 단백질을 코딩하는 핵산을 포함하는 척추동물 세포를 적절한 배지 중에서 배양하는 단계를 포함한다. 척추동물 세포는 또한 그 세포 내에서 기능하고 셀렉터 코돈을 인식하는 오르소고날 tRNA(O-tRNA); 및 O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하는 오르소고날 아미노아실 tRNA 합성효소(O-RS)를 포함하고, 배지는 비천연 아미노산을 포함한다.

일 실시태양에 있어서, 본 발명의 방법은 단백질 내에 제1 반응성 기를 갖는 비천연 아미노산을 도입하는 단계; 및 단백질을 제2의 반응성 기를 갖는 분자(예를 들어, 염료, 폴리에틸렌 글리콜 유도체와 같은 중합체, 광가교결합제, 세포독성 화합물, 친화도 표지, 비오틴 유도체, 수지, 제2 단백질 또는 폴리펩티드, 금속 킬레이터, 보조 인자, 지방산, 탄수화물, 폴리뉴클레오티드(예를 들어, DNA, RNA 등) 등)와 접촉시키는 단계를 포함한다. 제1 반응성 기는 제2 반응성 기와 반응하여 분자를 [3+2] 고리화 첨가 반응을 통해 비천연 아미노산에 부착시킨다. 일 실시태양에 있어서, 제1 반응성 기는 알키닐 또는 아지도 잔기이고, 제2 반응성 기는 아지도 또는 알키닐 잔기이다. 예를 들어, 제1 반응성 기는 알키닐 잔기(예를 들어, 비천연 아미노산 p-프로파길옥시페닐알라닌 중)이고, 제2 반응성 기는 아지도 잔기이다. 또 다른 실시태양에 있어서, 제1 반응성 기는 아지도 잔기(예를 들어, 비천연 아미노산 p-아지도-L-페닐알라닌 중)이고, 제2 반응성 기는 알키닐 잔기이다.

일 실시태양에 있어서, O-RS는 O-tRNA를 비천연 아미노산으로, 예컨대, 서열 번호 86 또는 45에 개시된 아미노산 서열을 갖는 O-RS의 효율의 적어도 50%의 효율로 아미노아실화한다. 또 다른 실시태양에 있어서, O-tRNA는 서열 번호 65 또는 64, 또는 이의 상보적 폴리뉴클레오티드 서열을 포함하거나, 그로부터 프로세싱되거나, 그에 의해 코딩된다. 또 다른 실시태양에 있어서, O-RS는 서열 번호 36 내지 63 및/또는 86 중 어느 하나에 개시된 아미노산 서열을 포함한다.

코딩된 단백질은, 예를 들어, 치료용 단백질, 진단용 단백질, 산업용 효소 또는 이들의 일부분을 포함할 수 있다. 경우에 따라, 본 발명의 방법에 의해 제조된 단백질은 비천연 아미노산을 통해 더욱 변형된다. 예를 들어, 본 발명의 방법에 의해 제조된 단백질은 경우에 따라 적어도 하나의 생체내 번역후 변형에 의해 변형된다.

스크리닝 또는 선택용 전사 조절인자 단백질을 제조하는 방법(및 그러한 방법에 의해 제조된 스크리닝 또는 선택 전사 조절인자 단백질)이 또한 제공된다. 예를 들어, 방법은 핵산 결합 도메인을 코딩하는 제1 폴리뉴클레오티드 서열을 선택하는 단계; 및 제1 폴리뉴클레오티드 서열이 적어도 하나의 셀렉터 코돈을 포함하도록 돌연변이 유발시키는 단계를 포함한다. 이에 의해 스크리닝 또는 선택용 폴리뉴클레오티드 서열이 제공된다. 이 방법은 또한 전사 활성화 도메인을 코딩하는 제2의 폴리뉴클레오티드 서열을 선택하는 단계; 제2의 폴리뉴클레오티드 서열에 작동 가능하게 연결된 스크리닝 또는 선택용 폴리뉴클레오티드 서열을 포함하는 구성체를 제공하는 단계; 및 세포 내로 상기 구성체, 비천연 아미노산, 오르소고날 tRNA 합성효소(O-RS) 및 오르소고날 tRNA(O-tRNA)를 도입하는 단계를 포함한다. 이들 성분들 존재하에, O-RS는 O-tRNA를 비천연 아미노산으로 우선적으로 아미노아실화하고, O-tRNA는 셀렉터 코돈을 인식하여, 스크리닝 또는 선택용 폴리뉴클레오티드 서열 중 셀렉터 코돈에 반응하여 비천연 아미노산을 핵산 결합 도메인 내로 도입함으로써, 스크리닝 또는 선택용 전사 조절인자 단백질을 제공한다.

일부 실시태양에 있어서, 본 발명의 방법 및/또는 조성물 중의 관심있는 단백질 또는 폴리펩티드(또는 그 일부분)은 핵산에 의해 코딩된다. 일반적으로, 핵산은 적어도 하나의 셀렉터 코돈, 적어도 2개의 셀렉터 코돈, 적어도 3개의 셀렉터 코돈, 적어도 4개의 셀렉터 코돈, 적어도 5개의 셀렉터 코돈, 적어도 6개의 셀렉터 코돈, 적어도 7개의 셀렉터 코돈, 적어도 8개의 셀렉터 코돈, 적어도 9개의 셀렉터 코돈, 10개 또는 그 이상의 셀렉터 코돈을 포함한다.

관심있는 단백질 또는 폴리펩티드를 코딩하는 유전자는 당업자에게 잘 알려져 있고, 본 명세서의 "돌연변이 유발 및 다른 분자생물학적 기술"란에 기술된 방법을 사용하여, 비천연 아미노산의 도입을 위한 하나 이상의 셀렉터 코돈을 포함하도록 변이될 수 있다. 예를 들어, 관심있는 단백질에 대한 핵산을 돌연변이시켜 하나 이상의 셀렉터 코돈을 포함하게 하여, 하나 이상의 비천연 아미노산을 도입할 수 있다. 본 발명은 적어도 하나의 비천연 아미노산을 포함하는 임의의 그러한 변이체, 예를 들어, 단백질 변이체 또는 버전을 포함한다. 마찬가지로, 본 발명은 상응하는 핵산, 즉, 하나 이상의 비천연 아미노산을 코딩하는 하나 이상의 셀렉터 코돈을 갖는 임의의 핵산을 포함한다.

비천연 아미노산을 포함하는 재조합 단백질의 정제

본 발명의 단백질, 예컨대, 비천연 아미노산을 포함하는 단백질, 비천연 아미노산을 포함하는 단백질에 대한 항체 등은, 당업자에게 알려져 있고 사용되고 있는 표준 과정으로 부분적으로 또는 실질적으로 균질한 정도로 정제될 수 있다. 따라서, 본 발명의 폴리펩티드는 당업계에 잘 알려진 많은 방법 중 임의의 방법, 비제한적인 예로서, 황산암모늄 또는 에탄올 침전, 산 또는 염기 추출, 칼럼 크로마토그래피, 친화도 칼럼 크로마토그래피, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로스 크로마토그래피, 소수성 상호작용 크로마토그래피, 히드록실 아파타이트 크로마토그래피, 렉틴 크로마토그래피, 겔 전기 영동 등의 방법으로 회수 및 정제될 수 있다. 정확하게 폴딩된 성숙 단백질을 제조하는 데 바람직한 경우, 단백질 리폴딩 단계를 이용할 수 있다. 높은 순도가 요구되는 경우, 고성능 액체 크로마토그래피(HPLC), 친화도 크로마토그래피 또는 다른 적절한 방법을 최종 정제 단계에 사용할 수 있다. 일 실시태양에 있어서, 비천연 아미노산(또는 비천연 아미노산을 포함하는 단백질)에 대해서 만들어진 항체를 정제 시약으로, 예를 들어, 하나 이상의 비천연 아미노산을 포함하는 단백질의 친화도에 기초한 정제에 사용한다. 일단 필요에 따라 부분적으로 또는 균질한 정도로 정제되면, 폴리펩티드는 경우에 따라, 예컨대, 분석 성분, 치료 반응제, 또는 항체 제조의 면역원으로 사용된다.

본 명세서에 기재된 다른 참고 문헌 외에, 각종 정제/단백질 폴딩 방법이 당업계에 잘 알려져 있으며, 예를 들어, 문헌(R. Scopes, Protein Purification. Springer-Verlag, N.Y. (1982); Deutscher, Methods in Enzymology Vol. 182: Guide to Protein Purification. Academic Press, Inc. N.Y. (1990); Sandana(1997) Bioseparation of Proteins. Academic Press, Inc.; Bollag et al., (1996) Protein Methods, 2nd Edition Wiley-Liss, NY; Walker(1996) The Protein Protocols Handbook Humana Press, NJ, Harris and Angal(1990) Protein Purification Applications: A Practical Approach IRL Press at Oxford, Oxford, England; Harris and Angal Protein Purification Methods: A Practical Approach IRL Press at Oxford, Oxford, England; Scopes(1993) Protein Purification: Principles and Practice 3rd Edition Springer Verlag, NY; Janson and Ryden(1998) Protein Purification: Principles. High Resolution Methods and Applications. Second Edition Wiley-VCH, NY; and Walker(1998) Protein Protocols on CD-ROM Humana Press, NJ) 및 그 문헌에 인용된 참고 문헌에 기재되어 있다.

척추동물 세포에서 비천연 아미노산을 포함하는 관심있는 단백질 또는 폴리펩티드를 제조하는 것의 장점은, 일반적으로 그 단백질 또는 폴리펩티드가 천연의 구조로 폴딩된다는 것이다. 그러나, 본 발명의 일부 실시태양에 있어서, 당업자는 합성, 발현 및/또는 정제 후에 단백질이 관련 단백질의 바람직한 구조와는 다른 구조를 가질 수 있다는 것을 잘 인식하고 있을 것이다. 본 발명의 일 측면은, 발현된 단백질이 경우에 따라 변성된 다음 다시 재생되는 것이다. 이는, 예를 들어, 샤페로닌을 관심있는 단백질 또는 폴리펩티드에 가하고(거나) 단백질을 구아니딘 HCl과 같은 카오트로픽제에 용해시키는 것에 의해 수행된다.

일반적으로, 발현된 단백질을 변성 및 환원시킨 다음, 폴리펩티드가 원하는 구조로 폴딩되도록 하는 것이 때때로 바람직할 수 있다. 예를 들어, 구아니딘, 우레아, DTT, DTE 및/또는 샤페로닌을 관심있는 번역 생성물에 가할 수 있다. 단백질을 환원, 변성 및 재생시키는 방법은 당업자에게 잘 알려져 있다(상기 참고 문헌, 및 Debinski, et al., (1993) L. Biol. Chem.. 268: 14065-14070; Kreitman and Pastan(1993) Bioconjug. Chem., 4: 581-585; and Buchner, et al., (1992) Anal. Biochem. 205: 263-270). 데빈스키(Debinski) 등은, 예를 들어, 구아니딘-DTE 중에서 봉입체 단백질을 변성 및 환원시키는 것을 기재하고 있다. 단백질은, 예를 들어, 산화된 글루타티온 및 L-아르기닌을 함유하는 산화환원 완충액 중에서 리폴딩될 수 있다. 리폴딩 시약은 하나 이상의 폴리펩티드 또는 다른 발현 생성물과 접촉되도록 흘려 넣거나 다른 방식으로 전달될 수 있고, 역으로도 할 수 있다.

항체

일 실시태양에 있어서, 본 발명은 본 발명의 분자, 예컨대, 합성효소, tRNA, 및 비천연 아미노산을 포함하는 단백질에 대한 항체 분자를 제공한다. 본 발명의 분자에 대한 항체는 정제 시약으로서, 예를 들어, 본 발명의 분자를 정제하는 데 사용할 수 있다. 또한, 항체는 합성효소, tRNA, 또는 비천연 아미노산을 포함하는 단백질의 존재를 지시하는 지시제 시약으로서, 예컨대, 분자의 존재나 위치를 조사하는 데(예를 들어, 생체내 또는 원래 위치에서) 사용될 수 있다.

본 발명의 항체는 실질적으로 또는 부분적으로 면역글로불린 유전자 또는 면역글로불린 유전자의 단편에 의해 코딩되는 하나 이상의 폴리펩티드를 포함하는 단백질일 수 있다. 알려진 면역글로불린 유전자는 카파, 람다, 알파, 감마, 델타, 엡실론 및 뮤 불변 영역뿐만 아니라 무수히 많은 면역글로불린 가변 영역 유전자를 포함한다. 경쇄는 카파 또는 람다로 분류된다. 중쇄는 감마, 뮤, 알파, 델타 또는 엡실론으로 분류되며, 이는 다시 각각 면역글로불린 클래스 IgG, IgM, IgA, IgD 및 IgE에 해당한다. 전형적인 면역글로불린(예를 들어, 항체) 구조 단위는 테트라머를 포함한다. 각 테트라머는 2개의 동일한 쌍의 폴리펩티드로 이루어지는데, 각 쌍은 하나의 "경쇄"(약 25 kD) 및 하나의 "중쇄"(약 50 내지 70 kD)를 갖는다. 각 사슬의 N-말단은 주로 항원 인식을 담당하는 약 100 내지 110 또는 그 이상의 아미노산으로 된 가변 영역을 한정한다. 가변 경쇄(VL) 및 가변 중쇄(VH)는 각각 이들 경쇄 및 중쇄를 이르는 것이다.

항체는 온전한 면역글로불린으로 존재하거나, 각종 펩티다제 분해에 의해 제조된, 다수의 잘 특성화된 단편으로서 존재한다. 따라서, 예를 들어, 펩신은 항체를 힌지 영역 중 디설파이드 결합 아래에서 절단하여 F(ab')₂를 제조하는데, 이는 Fab의 이량체로서 그 자체는 디설파이드 결합에 의해서 V_H-C_H1에 연결된 경쇄이다. F(ab')₂는 온화한 조건하에 환원되어 힌지 영역에서 디설파이드 결합을 파괴함으로써 F(ab')₂ 이량체를 Fab' 단량체로 전환시킨다. Fab' 단량체는 실질적으로는 힌지 영역의 일부를 갖는 Fab이다(다른 항체 단편에 대한 상세한 사항에 대해서는, Fundamental Immunology, 4th addition, W.E. Paul, ed., Raven Press, N. Y. (1999)를 참조). 각종 항체 단편이 온전한 항체의 분해에 의해 정의되는 한편, 당업자는 그러한 Fab' 단편 등이 화학적으로 또는 재조합 DNA 기술을 이용하여 신규(de novo) 합성될 수 있다는 것을 알 것이다. 본 명세서에서 항체란 경우에 따라 전체 항체의 변형에 의해서나 재조합 DNA 기술을 이용한 신규 합성에 의한 항체 단편을 포함한다. 항체는 단일쇄 항체를 포함하며, 이의 비제한적인 예로서, 단일쇄 Fv(sFv 또는 scFv) 항체는 가변 중쇄 및 가변 경쇄가 함께 연결되어(직접 또는 펩티드 링커를 통하여) 연속 폴리펩티드를 형성하고 있다. 본 발명의 항체는, 예를 들어, 폴리클로날, 모노클로날, 키메라, 인간화, 단일쇄, Fab 단편, Fab 발현 라이브러리에 의해 제조된 단편 등을 포함한다.

일반적으로, 본 발명의 항체는 각종 분자 생물학 또는 약제학 과정에서 일반적인 시약 및 치료제로서 가치가 있다. 폴리클로날 및 모노클로날 항체의 제조 방법이 알려져 있으며, 본 발명의 항체를 만드는 데 적용될 수 있다. 다수의 기초적 서적이 표준 항체 제조 방법을 기재하고 있다[예를 들어, Borrebaeck(ed)(1995) Antibody Engineering. 2nd Edition Freeman and Company, NY(Borrebaeck); McCafferty et al., (1996) Antibody Engineering. A Practical Approach IRL at Oxford Press, Oxford, England(McCafferty), and Paul(1995) Antibody Engineering Protocols Humana Press, Towata, NJ(Paul); Paul(ed.), (1999) Fundamental Immunology. Fifth edition Raven Press, N. Y.; Coligan(1991) Current Protocols in Immunology Wiley/Greene, NY; Harlow and Lane(1989) Antibodies: A Laboratory Manual Cold Spring Harbor Press, NY; Stites et al., (eds.) Basic and Clinical Immunology(4th ed.) Lange Medical Publications, Los Altos, CA, and references cited therein; Goding(1986) Monoclonal Antibodies: Principles and Practice(2d ed.) Academic Press, New York, NY; and Kohler and Milstein(1975) Nature 256: 495-497].

예컨대, 항원을 동물 내로 주사하는 것과 같은 것이 아닌, 항체 제조를 위한 다양한 재조합 기술이 개발되어 왔으며, 본 발명에 사용될 수 있다. 예를 들어, 파지 또는 유사 벡터 중에 재조합 항체 라이브러리를 제조 및 선택하는 것이 가능할 수 있다(예를 들어, Winter et al., (1994) Making Antibodies by Phage Display Technology Annu. Rev. Immunol. 12:433-55 및 그에 인용된 문헌). 또한, 문헌(Griffiths and Duncan(1998) Strategies for selection of antibodies by phage display, Curr Opin Biotechnol. 9: 102-8; Hoogenboom et al., (1998) Antibody phage display technology and its applications, Immunotechnology 4: 1-20; Gram et al., (1992) in vitro selection and affinity maturation of antibodies from a naive combinatorial immunoglobulin library, PNAS 89:3576-3580; Huse et al., (1989) Science 246: 1275-1281; and Ward, et al., (1989) Nature 341 : 544-546)을 참조할 수 있다.

일 실시태양에 있어서, 항체 라이브러리는 필라멘트상 박테리오파지 표면 상에 관련 중쇄 및 경쇄 가변 도메인을 디스플레이하기 위해 클로닝된 V 유전자의 레퍼토리(예를 들어, 림프구 집단으로부터 수거되거나, 시험관내 조립된)를 포함할 수 있다. 파지는 항원에 결합함으로써 선택된다. 가용성 항체가 파지 감염된 박테리아로부터 발현되며, 항체는, 예를 들어, 돌연변이 유발을 통해 개선될 수 있다(예를 들어, Balint and Larrick(1993) Antibody Engineering by Parsimonious Mutagenesis, Gene 137:109-118; Stemmer et al., (1993) Selection of an Active Single Chain Fv Antibody From a Protein Linker Library Prepared by Enzymatic Inverse PCR Biotechniques 14(2):256-65; Crameri et al., (1996) Construction and evolution of antibody-phage libraries by DNA shuffling, Nature Medicine 2:100-103: and Crameri and Stemmer(1995) Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes, BioTechniques 18:194-195).

재조합 항체 파지계를 클로닝 및 발현하기 위한 키트 역시 알려져 있으며 이용될 수 있다("재조합 파지 항체계, 마우스 ScFv 모듈," 제조원 Amersham-Pharmacia Biotechnology, Uppsala, Sweden). 사슬 셔플링에 의한 고친화도 인간 항체를 위한 박테리오파지 항체 라이브러리가 또한 제조되었다(예를 들어, Marks et al., (1992) By-Passing Immunization: Building High Affinity Human Antibodies by Chain Shuffling, Biotechniques 10:779-782). 항체가 다수의 상업용 기관(예를 들어, Bethyl Laboratories, Montgomery, TX; Anawa, Switzerland; Eurogentec, Belgium and Philadelphia, PA, US 등)에 의해 제조될 수 있음이 잘 알려져 있다.

일부 실시태양에 있어서, 예컨대, 항체가 치료용으로 투여되는 경우, 본 발명의 항체를 인간화하는 것이 유용하다. 인간화 항체를 사용함으로써 치료용 항체에 대한 원치않는 면역 반응이 감소될 수 있다(환자가 사람인 경우). 항체에 관한 상기 참조 문헌들은 인간화 전략도 기술하고 있다. 인간화 항체 외에 인간 항체가 또한 본 발명의 특징이다. 인간 항체는 특징적 인간 면역글로불린 서열로 이루어진다. 인간 항체는 아주 광범위하게 다양한 기술에 의해 제조될 수 있다(예를 들어, Larrick et al., 미국 특허 제5,001,065호). 트리오마 기술에 의해 인간 항체를 제조하는 일반적인 방법은 문헌에 기재되어 있다(예를 들어, Ostberg et al(1983), Hybridoma 2: 361-367, Ostberg, 미국 특허 제4,634,664호, 및 Engelman et al., 미국 특허 제4,634,666호).

단백질의 정제 및 검출에서 항체를 이용하는 다수의 방법이 알려져 있으며, 본 명세서에 기재된 바와 같은 비천연 아미노산을 포함하는 단백질을 검출 및 정제하는 데 사용될 수 있다. 일반적으로, 항체는 ELISA, 웨스턴 블롯팅, 면역화학, 친화도 크로마토그래피 방법, SPR 및 많은 다른 방법에 유용한 시약이다. 상기한 참고 문헌들은 ELISA 분석, 웨스턴 블롯, 표면 플라즈몬 공명(SPR) 등을 수행하는 방법을 상세하게 기재하고 있다.

본 발명의 일 측면에 있어서, 본 발명의 항체 그 자체가 비천연 아미노산을 포함하여, 관심있는 특성(예를 들어, 개선된 반감기, 안정성, 독성 등)을 갖는 항체를 제공한다. 이에 대해 본 명세서의 "비천연 아미노산을 포함하는 폴리펩티드"란을 참조할 수 있다. 항체는 현재 임상 연구 중인 모든 화합물의 거의 50%를 차지하며(Wittrup, (1999) Phage on display, Tibtech 17: 423-424), 항체는 진단 시약으로서 아주 널리 사용되고 있다. 따라서, 항체를 비천연 아미노산으로 변형하는 것은 이들 값진 시약을 변형하는 중요한 수단을 제공한다.

예를 들어, 진단 분야에는 많은 MAb 용도가 있다. 분석법은 단순한 스팟 테스트에서, 좀더 복잡한 방법, 예컨대, 종양 이미지화를 위한 방사성 표지 NR-LU-10 MAb(DuPont Merck Co.)에 이른다(Rusch et al., (1993) NR-LU-10 monoclonal antibody scanning. A helpful new adjunct to computed tomography in evaluating non-small-cell lung cancer. J. Thorac Cardiovasc Surg. 106: 200-4). 상기한 바와 같이, MAb는 ELISA, 웨스턴 블롯팅, 면역화학, 친화도 크로마토그래피 방법 등을 위한 중심적인 시약이다. 그러한 어느 항체나 변형되어 하나 이상의 비천연 아미노산을 포함함으로써, 예를 들어, 표적에 대한 항체의 특이성 또는 결합능을 변화시키거나, 비천연 아미노산 내에 검출 표지(예를 들어, 분광분석, 형광, 발광 등)를 포함시킴으로써 하나 이상의 검출 특성을 변화시킬 수 있다.

유용한 항체 시약의 한 부류는 치료용 항체이다. 예를 들어, 항체는 항체 의존적 세포 매개 세포독성(ADCC) 또는 보체 매개 용해(CML)에 의한 파괴를 위해 종양 세포를 표적으로 함으로써 종양 성장을 정지시키는 종양 특이적 모노클로날 항체일 수 있다(이들 항체의 유형을 때대로 "매직 불렛"이라고 함). 한 예는 리툭산(Rituxan)으로서, 이는 비호지킨(Non-Hodgkins) 림프종의 치료를 위한 항-CD20 MAb이다(Scott(1998) Rituximab: a new therapeutic monoclonal antibody for non-Hodgkin's lymphoma Cancer Pract 6: 195-7). 두 번째 예는 종양 성장의 중요 성분과 간섭하는 항체이다. 헤르셉틴(Herceptin)은 전이상 유방암의 치료를 위한 항-HER-2 모노클로날 항체이며, 그와 같은 작용 메카니즘을 갖는 항체의 예이다(Baselga et al., (1998) Recombinant humanized anti-HER2 antibody(Herceptin) enhances the antitumor activity of paclitaxel and doxorubicin against HER2/neu overexpressing human breast cancer xenografts [published erratum appears in Cancer Res(1999) 59(8):2020], Cancer Res 58: 2825-31). 세 번째 예는 세포독성 화합물(독소, 방사선 핵종 등)을 직접 종양 또는 다른 관심있는 부위로 전달하기 위한 항체이다. 예를 들어, 그러한 모노클로날 항체는 CYT-356로서, 이는 방사선을 직접 전립선 암세포로 유도하는 90Y-결합된 항체이다(Deb et al., (1996) Treatment of hormone-refractory prostate cancer with 90Y-CYT-356 monoclonal antibody Clin Cancer Res 2: 1289-97). 네 번째 용도는 항체 유도 효소 전구약물 치료법으로, 종양으로 유도된 효소가 종양 근처에서 전신적으로 투여된 전구약물을 활성화시킨다. 예를 들어, 카복시펩티다제 A에 연결된 항-Ep-CAM1 항체가 결직장암의 치료를 위해 개발되고 있다(Wolfe et al., (1999) Antibody-directed enzyme prodrug therapy with the T268G mutant of human carboxypeptidase Al: in vitro and in vivo studies with prodrugs of methotrexate and the thymidylate synthase inhibitors GW1031 and GW1843 Bioconjug Chem. 10:38-48). 다른 항체(예를 들어, 길항제)는 치료를 위해 정상 세포 기능을 특이적으로 억제하도록 설계된다. 그 일례는 오르소클론(Orthoclone) OKT3로서, 급성 조직 이식 거부를 감소시키기 위해 존슨 앤드 존슨(Johnson and Johnson)에 의해 개발된 항-CD3 MAb이다(Strate et al., (1990) Orthoclone OKT3 as first-line therapy in acute renal allograft rejection Transplant Proc. 22: 219-20). 다른 부류의 항체 생성물은 작용제(agonist)이다. 이들 모노클로날 항체는 치료를 위해 정상 세포 기능을 특이적으로 증진하도록 설계된 것이다. 예를 들어, 신경 치료를 위한 아세틸콜린 수용체의 모노클로날 항체 기반 작용제가 개발 중에 있다(Xie et al., (1997) Direct demonstration of MuSK involvement in acetylcholine receptor clustering through identification of agonist ScFv Nat. Biotechnol. 15: 768-71). 이들 항체 중 어느 것이나 하나 이상의 비천연 아미노산을 포함하도록 변형되어 하나 이상의 치료 특성(특이성, 결합능, 혈청 반감기 등)을 증진시킬 수 있다.

항체 생성물의 또 다른 부류는 새로운 기능을 제공한다. 이러한 군의 주된 항체는 촉매 항체로서, 예컨대, 효소의 촉매 능력을 모방하도록 가공된 Ig 서열이 있다(Wentworth and Janda(1998) Catalytic antibodies Curr Opin Chem Biol 2: 138-44). 예를 들어, 흥미를 끄는 용도는 촉매 항체 mAb-15A10을 중독증 치료를 위해 생체내 코카인을 가수분해하도록 사용하는 것을 포함한다(Mets et al., (1998) A catalytic antibody against cocaine prevents cocaine's reinforcing and toxic effects in rats Proc Natl Acad Sci USA 95: 10176-81). 촉매 항체는 또한 하나 이상의 비천연 아미노산을 포함하도록 변형되어 관심있는 특성 하나 이상을 개선시킨다.

면역반응성에 의한 폴리펩티드의 정의

본 발명의 폴리펩티드가 각종의 신규 폴리펩티드 서열(예를 들어, 본 발명의 번역계에서 합성된 단백질의 경우, 비천연 아미노산을 포함하는 서열, 또는 본 발명의 신규 합성효소의 경우에는 표준 아미노산의 새로운 서열)을 제공하기 때문에, 폴리펩티드는 또한 예를 들어, 면역 분석에서 인식될 수 있는 새로운 구조적 특징을 제공한다. 본 발명의 폴리펩티드에 특이적으로 결합하는 항체 또는 항혈청뿐만 아니라 그러한 항체 또는 항혈청에 의해 결합되는 폴리펩티드가 본 발명의 특징이다.

예를 들어, 본 발명은 서열 번호 36 내지 63 및/또는 86 중 하나 이상으로부터 선택된 아미노산 서열을 포함하는 면역원에 대하여 제조된 항체 또는 항혈청에 특이적으로 결합하거나 그와 특이적으로 면역반응하는 합성효소 단백질을 포함한다. 다른 동족체와의 교차 반응성을 제거하기 위하여, 항체 또는 항혈청을 이용 가능한 대조군 합성효소 동족체, 예를 들어, 야생형 이 콜라이 타이로실 합성효소(TyrRS)(예를 들어, 서열 번호 2)로 서브트랙션(subtraction)한다.

전형적인 포맷 중 하나에 있어서, 면역분석은 서열 번호 36 내지 63 및/또는 86 중 하나 이상에 상응하는 하나 이상의 서열 또는 이의 실질적 부분서열(subsequence)(즉, 제공된 전체 길이 서열의 적어도 약 30% 이상)을 포함하는 하나 이상의 폴리펩티드에 대해 유발시킨 폴리클로날 항체 또는 항혈청을 사용한다. 서열 번호 36 내지 63 및 86으로부터 유도된 유력한 폴리펩티드 면역원의 세트를 이하 총칭하여 "면역원성 폴리펩티드"라 한다. 생성된 항혈청은 경우에 따라 대조군 합성효소 동족체에 대하여 낮은 교차 반응성 갖는 것으로 선택되며, 면역 분석에서 폴리클로날 항혈청을 사용하기 전에 교차 반응성을, 예를 들어, 하나 이상의 대조군 합성효소 동족체를 사용하여 면역흡착에 의해 제거한다.

면역분석에 사용하기 위한 항혈청을 제조하기 위하여, 하나 이상의 면역원성 폴리펩티드를 본 명세서에 기재된 바와 같이 제조 및 정제한다. 예를 들어, 재조합 단백질은 재조합 세포에서 제조될 수 있다. 동종 번식 마우스(마우스의 실질적 유전적 일치성에 기인하여 보다 재현성 있는 결과가 얻어지므로 이 분석에 사용함)를 프로인트(Freund) 보조제와 같은 표준 보조제와 함께 면역원성 단백질로 표준 마우스 면역화 프로토콜로 면역화시킨다. 특이적 면역반응성을 결정하기 위해 사용될 수 있는 항체 제조 및 면역분석 포맷 및 조건에 관한 표준적 사항에 관해서는, 예를 들어, 문헌(Harlow and Lane(1988) Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, New York)을 참조할 수 있다. 항체에 대한 추가의 참고 문헌 및 고찰은 본 명세서에 기재되어 있으며, 면역반응성에 의해 폴리펩티드를 정의/검출하는 항체를 만드는 데 응용될 수 있다. 또한, 본 명세서에 개시된 서열로부터 유도된 하나 이상의 합성 또는 재조합 폴리펩티드가 캐리어 단백질에 접합되어 면역원으로 사용될 수 있다.

폴리클로날 혈청을 풀링(pooling)하여, 면역분석, 예를 들어, 고체 지지체 상에 고정된 하나 이상의 면역원성 단백질을 사용하는 고상 면역분석으로 면역원성 폴리펩티드에 대한 역가를 측정(적정)한다. 역가가 10⁶ 이상인 폴리클로날 항혈청을 선택하여 풀링하고, 대조군 합성효소 폴리펩티드로 서브트랙션하여, 서브트랙션, 풀링 및 적정된 폴리클로날 항혈청을 얻는다.

서브트랙션, 풀링 및 적정된 폴리클로날 항혈청을 경쟁 면역분석으로 대조군 동족체에 대한 교차반응성에 대해 테스트한다. 이 경쟁 분석에서, 서브트랙션 및 적정된 폴리클로날 항혈청에 대해 적정된 폴리클로날 항혈청이 면역원성 합성효소에 결합하는 것이 대조군 합성효소 동족체에 결합하는 것에 비하여 적어도 약 5 내지 10배 높은 시그널 대 노이즈 비율을 가져오는 특이적 결합 조건을 결정한다. 즉, 결합/세척 반응의 엄격도를 알부민 또는 비지방 건조 우유와 같은 비특이적 경쟁자를 가하고(거나) 염 조건, 온도 등을 조정함으로써 조정한다. 이들 결합/세척 조건은 추후 분석에서 테스트 폴리펩티드(면역원성 폴리펩티드 및/또는 대조군 폴리펩티드와 비교되는 폴리펩티드)가 풀링 및 서브트랙션된 폴리클로날 항혈청에 의해 특이적으로 결합되는지 여부를 측정하는 데 사용된다. 특히, 특이적 결합 조건하에서 대조군 합성효소 동족체보다 적어도 2 내지 5배 높은 시그널 대 노이즈 비율, 및 면역원성 폴리펩티드에 비해 적어도 약 1/2의 시그널 대 노이즈 비율을 나타내는 테스트 폴리펩티드는 공지된 합성효소에 비하여 면역원성 폴리펩티드와 실질적 구조 유사성을 가지며, 따라서 본 발명의 폴리펩티드이다.

또 다른 예에서, 경쟁 결합 포맷의 면역분석을 테스트 폴리펩티드의 검출을 위해 사용한다. 예를 들어, 상기한 바와 같이, 교차 반응 항체를 대조군 폴리펩티드를 사용한 면역흡착에 의해 풀링된 항혈청 혼합물로부터 제거한다. 면역원성 폴리펩티드를 고체 지지체에 고정화시키고, 서브트랙션 및 풀링된 항혈청에 노출시킨다. 테스트 단백질을 분석에 가하여 풀링 및 서브트랙션된 항혈청에 결합하기 위해 경쟁하도록 한다: 테스트 단백질이 면역원성 단백질에 비하여 풀링 및 서브트랙션된 항혈청에 결합하기 위해 경쟁하는 능력을, 분석에 가해진 면역원성 단백질이 결합을 위해 경쟁하는 능력(면역원성 폴리펩티드는 풀링된 항혈청에 결합하기 위하여 고정화된 면역원성 폴리펩티드와 효율적으로 경쟁함)과 비교한다. 테스트 단백질에 대한 퍼센트 교차 반응성을 표준 계산법에 따라 계산한다.

평행 분석으로서, 대조군 단백질이 풀링 및 서브트랙션된 항혈청에 결합하기 위해 경쟁하는 능력을 경우에 따라 면역원성 단백질이 항혈청에 결합하기 위해 경쟁하는 능력과 비교하여 측정한다. 다시, 대조군 단백질에 대한 퍼센트 교차 반응성을 표준 계산법에 따라 계산한다. 퍼센트 교차 반응성이 대조군 폴리펩티드에 비해 테스트 폴리펩티드에 있어서 적어도 5 내지 10배 높은 경우, 및/또는 테스트 폴리펩티드의 결합이 대략 면역원성 폴리펩티드의 결합의 범위 내에 있는 경우, 테스트 폴리펩티드는 풀링 및 서브트랙션된 항혈청에 특이적으로 결합하는 것으로 본다.

일반적으로, 면역흡착 및 풀링된 항혈청은 본 명세서에 기재된 바와 같이, 임의의 테스트 폴리펩티드를 면역원성 및/또는 대조군 폴리펩티드에 비교하기 위해 경쟁적 결합 면역분석에 사용될 수 있다. 이와 같은 비교를 위하여, 면역원성, 테스트 및 대조군 폴리펩티드를 넓은 범위의 농도에서 각각 분석하고, 서브트랙션된 항혈청이, 예를 들어, 고정화된 대조, 테스트 또는 면역원성 단백질에 결합하는 것을 50% 억제하는 데 필요한 각 단백질의 양을 표준 기술을 이용하여 측정한다. 경쟁 분석에서 결합에 요구되는 테스트 폴리펩티드의 양이 요구되는 면역원성 폴리펩티드의 양의 두 배보다 작은 경우, 테스트 폴리펩티드는 면역원성 폴리펩티드에 대해 제조된 항체에 특이적으로 결합한다고 할 수 있으며, 단, 그 양은 대조군 폴리펩티드에 대한 것보다 약 5 내지 10배 높은 것이어야 한다.

특이성의 추가 측정으로서, 풀링된 항혈청을 경우에 따라 면역원성 폴리펩티드(대조군 폴리펩티드가 아님)로, 면역원성 단백질로 서브트랙션 및 풀링된 항혈청이 면역흡착에 사용된 면역원성 폴리펩티드에 결합하는 것이 거의 또는 전혀 검출되지 않을 때까지 완전히 면역흡착시킨다. 이와 같이 완전히 면역흡착된 항혈청을 테스트 폴리펩티드와의 반응성에 대해 테스트한다. 반응성이 거의 없거나 전혀 관찰되지 않는 경우(즉, 완전히 면역흡착된 항혈청이 면역원성 폴리펩티드에 결합하는 것에 대해 관찰된 시그널 대 노이즈 비율의 2배 이하인 경우), 테스트 폴리펩티드는 면역원성 단백질에 의해 유발된 항혈청에 의해 특이적으로 결합되는 것이다.

제약 조성물

본 발명의 폴리펩티드 또는 단백질(예를 들어, 합성효소, 하나 이상의 비천연 아미노산을 포함하는 단백질 등)은 경우에 따라 치료용으로, 예를 들어, 적절한 제약용 담체와 함께 사용된다. 그러한 조성물은, 예를 들어, 치료 유효량의 화합물 및 제약상 허용 가능한 담체 또는 부형제를 포함한다. 그러한 담체 또는 부형제는 생리 염수, 완충된 생리 염수, 덱스트로스, 물, 글리세롤, 에탄올 및/또는 이들의 조합을 포함하나, 이에 한정되는 것은 아니다. 제제는 투여 방식에 적절하게 제조된다. 일반적으로, 단백질을 투여하는 방법은 당업계에 잘 알려져 있으며, 본 발명의 폴리펩티드를 투여하는 데에도 적용될 수 있다.

하나 이상의 본 발명의 폴리펩티드를 포함하는 치료 조성물은 경우에 따라 효능, 조직 대사를 확인하기 위해서, 또한 투여량을 결정하기 위해서 당업계에 알려진 방법에 따라 하나 이상의 적절한 시험관내 및/또는 생체내 질병 동물 모델에서 테스트된다. 특히, 투여량은 초기에는 천연 아미노산 동족체에 비교한 본 발명의 비천연 아미노산 변형체의 활성, 안정성 및 다른 적절한 수단을 측정하여(예를 들어, 하나 이상의 비천연 아미노산을 포함하도록 변형된 EPO를 천연 아미노산 EPO와 비교) 관련 분석에서 결정된다.

투여는 분자를 궁극적으로는 혈액 또는 조직 세포와 접촉하도록 도입하는 데 일반적으로 사용되는 경로 중 어느 것에 의해서나 이루어진다. 본 발명의 비천연 아미노산 폴리펩티드는 임의의 적절한 방식으로, 경우에 따라 하나 이상의 제약상 허용 가능한 담체와 함께 투여된다. 본 발명에서 그러한 폴리펩티드를 환자에 투여하는 적절한 방법을 이용할 수 있지만, 2 이상의 경로가 특정 조성물의 투여에 이용될 수 있으며, 또한 어느 한 경로는 종종 다른 경로보다 즉각적이고 효율적인 작용 또는 반응을 제공한다.

제약상 허용 가능한 담체는 부분적으로는 투여되는 조성물뿐만 아니라 그 조성물을 투여하는 데 사용되는 방법에 의해 결정된다. 따라서 아주 광범위한 약학 제제로 본 발명의 제약 조성물을 제형화할 수 있다.

폴리펩티드 조성물은 각종 경로, 예를 들어, 경구, 정맥내, 복강내, 근육내, 경피, 피하, 국소, 설하, 또는 직장내 투여될 수 있으나, 투여 경로가 이에 한정되는 것은 아니다. 비천연 아미노산 폴리펩티드 조성물은 또한 리포좀을 통해 투여될 수 있다. 그러한 투여 경로 및 적절한 제형은 당업자에게 일반적으로 알려져 있다.

비천연 아미노산 폴리펩티드는 단독으로 또는 다른 적절한 성분과 함께 흡입 투여를 위해 에어로졸 제제(즉, "분무화"될 수 있음)로 만들어질 수 있다. 에어로졸 제제는 가압된 허용 가능한 추진제, 예컨대, 디클로로디플루오로메탄, 프로판, 질소 내로 제제화된다.

비경구 투여, 예를 들어, 관절내(관절강 내로), 정맥내, 근육내, 피내, 복강내 및 피하 경로에 적절한 제제는 수성 및 비수성, 등장성 멸균 주사 용액(이러한 제제는 항산화제, 완충제, 정균제, 제제를 의도하는 수약자의 혈액과 등장성으로 만드는 용질을 함유할 수 있음), 및 수성 및 비수성 멸균 현탁액(현탁화제, 용해제, 증점제, 안정화제 및 보존제를 함유할 수 있음)을 포함한다. 포장된 핵산의 제제는 앰풀이나 바이알 같은, 일회 투여 또는 복수회 투여 밀봉 용기에 존재할 수 있다.

비경구 및 정맥 투여가 바람직한 투여 방법이다. 특히, 천연 아미노산 동족체 체료제에 이미 사용되고 있는 경로(예를 들어, EPO, GCSF, GMCSF, IFN, 인터루킨, 항체 및/또는 임의의 다른 약제로서 전달되는 단백질에 일반적으로 사용되는 경로)는 현재 사용되고 있는 제제와 함께 본 발명의 비천연 아미노산을 포함하는 단백질(예를 들어, 현재의 치료용 단백질의 PEG화 변형체 등)에 바람직한 투여 경로 및 제제를 제공한다.

본 발명과 관련하여 환자에 투여되는 용량은 환자에 있어서 시간이 지남에 따라 유익한 치료 반응을 나타내거나, 또는, 예를 들어, 적용증에 따라 병원체에 의한 감염 또는 다른 적절한 활성을 억제하는 데 충분한 양이다. 투여량은 특정 조성물/제제의 효능, 사용된 비천연 아미노산을 포함하는 폴리펩티드의 활성, 안정성, 또는 혈청 반감기 및 환자의 상태뿐만 아니라 치료될 환자의 체중 또는 체표면적에 의해 결정된다. 투여량 크기는 또한 특정 환자에서 특정 조성물/제제의 투여에 수반되는 부작용의 존재, 성질 및 정도에 따라 결정된다.

질병(예를 들어, 암, 유전병, 당뇨병, AIDS 등)의 치료 또는 예방에서 투여될 조성물/제제의 유효량을 결정함에 있어서, 의사는 순환 혈장 수준, 제제 독성, 질병의 진행 및/또는 관련있는 경우, 항-비천연 아미노산 폴리펩티드 항체의 제조를 고려할 것이다.

예를 들어, 체중 70 kg의 환자에게 투여되는 용량은, 일반적으로는 현재 사용되고 있는 치료용 단백질의 투여량과 동등한 범위 내이며, 관련 조성물의 변화된 활성 또는 혈청 반감기에 따라 조정된다. 본 발명의 조성물/제제는 알려진 통상의 치료법, 비제한적인 예로서, 항체 투여, 백신 투여, 세포독성제, 비천연 아미노산 폴리펩티드, 핵산, 뉴클레오티드 유사체, 생물 반응 개질제의 투여 등에 의해 치료 조건을 증진시킬 수 있다.

투여에 있어서, 본 발명의 제제는 관련 제제의 LD₅₀, 및/또는 환자의 전반적 건강 상태를 고려하여 각종 농도에서 비천연 아미노산의 부작용 여부 관찰에 의해 결정된 비율로 투여된다. 투여는 단일회로 또는 분할 투여로 이루어질 수 있다.

제제의 주입을 받는 환자가 발열, 오한 또는 근육 통증을 나타내는 경우, 그 환자는 적절한 양의 아스피린, 이부프로펜, 아세트아미노펜 또는 다른 통증/발열 조절 약물을 투여받는다. 주입에 대해 발열, 근육통 및 오한을 경험한 환자에게는 차후의 주입 30분 전에 아스피린, 아세트아미노펜, 예를 들어, 디펜히드라민을 미리 투약한다. 메페리딘은 해열제 및 항히스타민제에 신속히 반응하지 않는 보다 강한 오한 및 근육통에 사용된다. 치료는 반응의 심각도에 따라서 속도를 늦추거나 불연속적으로 실시된다.

핵산 및 폴리펩티드 서열 및 변이체

본 명세서에 기재된 바와 같이, 본 발명은 핵산 폴리뉴클레오티드 서열 및 폴리펩티드 아미노산 서열, 예를 들어, O-tRNA 및 O-RS, 및 예를 들어, 이들 서열을 포함하는 조성물 및 방법을 제공한다. 상기 서열의 예, 예를 들어, O-tRNA 및 O-RS의 예가 본 명세서에 개시되어 있다(표 5, 예컨대, 서열 번호 3 내지 65, 86, 서열 번호 1 및 2를 제외한 다른 서열). 그러나, 당업자는 본 발명이 본 명세서, 예를 들어, 실시예 및 표 5에 개시된 서열에만 한정되는 것이 아니라는 것을 잘 알 것이다. 당업자는 또한 본 발명이 본 명세서에 기재된 기능, 예를 들어, O-tRNA 또는 O-RS를 코딩하는 것과 관련된 많은 서열 및 심지어는 관련되지 않은 서열도 제공한다는 것을 알 것이다.

본 발명은 또한 폴리펩티드(O-RS) 및 폴리뉴클레오티드, 예를 들어, O-tRNA, O-RS 또는 그 일부분을 코딩하는 폴리뉴클레오티드(예를 들어, 합성효소의 활성 부위), 아미노아실-tRNA 합성효소 변이체를 제작하기 위한 올리고뉴클레오티드를 제공한다. 예를 들어, 본 발명의 폴리펩티드는 서열 번호 36 내지 63 및/또는 86 중 어느 하나에 개시된 아미노산 서열을 포함하는 폴리펩티드, 서열 번호 3 내지 35 중 어느 하나에 개시된 폴리뉴클레오티드 서열에 의해 코딩되는 아미노산 서열을 포함하는 폴리펩티드, 및 서열 번호 36 내지 63 및/또는 86 중 어느 하나에 개시된 아미노산 서열을 포함하는 폴리펩티드 또는 서열 번호 3 내지 35 중 어느 하나에 개시된 폴리뉴클레오티드 서열에 의해 코딩되는 아미노산 서열을 포함하는 폴리펩티드에 특이적인 항체와 특이적으로 면역반응하는 폴리펩티드를 포함한다.

본 발명의 폴리펩티드 중에는, 천연 타이로실 아미노아실-tRNA 합성효소(TyrRS)의 아미노산 서열(예를 들어, 서열 번호 2)과 적어도 90% 일치하는 아미노산 서열을 포함하며, 그룹 A 내지 E의 아미노산 2 이상을 포함하는 폴리펩티드가 포함된다. 예를 들어, 그룹 A는 이 콜라이 TyrRS의 Tyr37에 상응하는 위치에 발린, 이소루신, 루신, 글리신, 세린, 알라닌 또는 트레오닌을 포함하고; 그룹 B는 이 콜라이 TyrRS의 Asn126에 상응하는 위치에 아스파르테이트를 포함하며, 그룹 C는 이 콜라이 TyrRS의 Asp182에 상응하는 위치에 트레오닌, 세린, 아르기닌, 아스파라긴 또는 글리신을 포함하며, 그룹 D는 이 콜라이 TyrRS의 Phe183에 상응하는 위치에 메티오닌, 알라닌, 발린 또는 타이로신을 포함하며; 그룹 E는 이 콜라이 TyrRS의 Leu186에 상응하는 위치에 세린, 메티오닌, 발린, 시스테인, 트레오닌 또는 알라닌을 포함한다. 마찬가지로, 본 발명의 폴리펩티드는 또한 서열 번호 36 내지 63, 및/또는 86의 적어도 20개의 연속 아미노산을 포함하며, 그룹 A-E에서 상기한 바와 같은 2 이상의 아미노산 치환을 갖는 폴리펩티드를 포함한다. 또한, 표 4, 6 및/또는 표 8을 참조할 수 있다. 상기 폴리펩티드의 보존적 변이를 포함하는 아미노산 서열 또한 본 발명의 폴리펩티드에 포함된다.

본 발명에 의하면 폴리뉴클레오티드 역시 제공된다. 본 발명의 폴리뉴클레오티드는 본 발명의 관심있는 단백질 또는 폴리펩티드를 코딩하는 폴리뉴클레오티드, 또는 하나 이상의 셀렉터 코돈을 포함하는 폴리뉴클레오티드, 또는 둘 다를 포함하는 폴리뉴클레오티드를 포함한다. 예를 들어, 서열 번호 3 내지 35, 64 내지 85 중 어느 하나에 개시된 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드; 그러한 서열에 상보적이거나 이의 폴리펩티드 서열을 코딩하는 폴리뉴클레오티드; 및/또는 서열 번호 36 내지 63 및/또는 86 중 어느 하나에 개시된 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드, 또는 이의 보존적 변이체를 포함한다. 본 발명의 폴리뉴클레오티드는 또한 본 발명의 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함한다. 마찬가지로, 상기한 폴리뉴클레오티드에 실질적으로 핵산의 전 길이에 걸쳐 고엄격 조건하에 하이브리드화하는 핵산도 또한 본 발명의 폴리뉴클레오티드이다.

본 발명의 폴리뉴클레오티드는 또한 천연 타이로실 아미노아실-tRNA 합성효소(TyrRS)의 서열(예를 들어, 서열 번호 2)과 적어도 90% 동일한 아미노산 서열을 포함하며, 상기한 바와 같은 그룹 A 내지 E에 속하는 2 이상의 치환을 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함한다. 상기한 폴리뉴클레오티드와 적어도 70%, (또는 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 또는 그 이상) 동일한 폴리뉴클레오티드, 및/또는 상기한 폴리뉴클레오티드 중 어느 하나의 보존적 변이를 포함하는 폴리뉴클레오티드도 또한 본 발명의 폴리뉴클레오티드에 속한다.

일부 실시태양에 있어서, 벡터(예를 들어, 플라스미드, 코스미드, 파지, 바이러스 등)는 본 발명의 폴리뉴클레오티드를 포함한다. 일 실시태양에 있어서, 벡터는 발현 벡터이다. 또 다른 실시태양에 있어서, 발현 벡터는 하나 이상의 본 발명의 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함한다. 또 다른 실시태양에 있어서, 세포는 본 발명의 폴리뉴클레오티드를 포함하는 벡터를 포함한다.

당업자는 개시된 서열의 많은 변이체가 본 발명에 포함된다는 것을 알 것이다. 예를 들어, 기능적으로 동일한 서열을 제조하는, 개시된 서열의 보존적 변이체가 본 발명에 포함된다. 핵산 폴리뉴클레오티드 변이체는, 그와 같은 변이체가 적어도 하나의 개시된 서열에 하이브리드화할 때, 본 발명에 포함되는 것으로 간주된다. 본 명세서에 개시된 서열의, 예를 들어, 표준 서열 비교 기법에 의해 결정된 바와 같은 독특한 부분서열이 또한 본 발명에 포함된다.

보존적 변이

유전자 코드의 축퇴성으로 인해, "침묵 치환"(즉, 코딩된 폴리펩티드에 변화를 가져오지 않는 핵산 서열 중의 치환)은 아미노산을 코딩하는 모든 핵산 서열의 내재된 특징이다. 마찬가지로, 아미노산 서열 중 하나 또는 여러 개의 아미노산이 매우 유사한 특성의 다른 아미노산으로 치환되는 것인 "보존적 아미노산 치환"도 또한 개시된 구성체에 매우 유사한 것으로 쉽게 밝혀진다. 개시된 각 서열의 보존적 변이체는 본 발명의 특징이다.

특정 핵산 서열의 보존적 변이체는 동일하거나 실질적으로 동일한 아미노산 서열을 코딩하는 핵산, 또는 핵산이 아미노산 서열을 코딩하고 있지 않은 경우, 실질적으로 동일한 서열을 이르는 말이다. 당업자는 코딩된 서열에서 단일 아미노산 또는 소수 퍼센트(일반적으로는 5% 미만, 보다 일반적으로는 4%, 2% 또는 1% 미만)의 아미노산을 변화, 부가, 결실시키는 개개의 치환, 결실 또는 부가는, 그러한 변화가 아미노산의 결실, 아미노산의 부가 또는 화학적으로 유사한 아미노산으로의 치환을 가져오는 경우, "보존적으로 변형된 변이체"라는 것을 잘 인식하고 있다. 본 발명의 목록에 개시된 폴리펩티드 서열의 "보존적 변이체"는 폴리펩티드 서열 중 소수 퍼센트, 일반적으로는 5% 미만, 보다 일반적으로는 2% 또는 1% 미만의 아미노산이 동일한 보존적 치환 군에 속하는 보존적으로 선택된 아미노산으로 치환되는 것을 포함한다. 마지막으로, 핵산 분자의 코딩된 활성을 변화시키지 않는 서열의 부가, 예를 들어, 비기능적 서열의 부가는 기초 핵산의 보존적 변이체 이다.

기능적으로 유사한 아미노산을 제공하는 보존적 치환의 표가 당업계에 잘 알려져 있다. 다음 표는 서로에 대해 "보존적 치환"을 포함하는 천연 아미노산을 포함하는 군의 예를 나타내고 있다.

보존적 치환 군
1	알라닌(A) 세린(S) 트레오닌(T)
2	아스파르트산(D) 글루탐산(E)
3	아스파라긴(N) 글루타민(Q)
4	아르기닌(R) 리신(K)
5	이소루신(I) 루신(L) 메티오닌(M) 발린(V)
6	페닐알라닌(F) 타이로신(Y) 트립토판(W)

핵산 하이브리드화

비교 하이브리드화를 이용하여 이의 보존적 변이체를 포함하는 본 발명의 핵산을 찾아낼 수 있으며, 이 비교 하이브리드화 방법은 본 발명의 핵산을 구별하는 바람직한 방법이다. 또한, 고도, 초고도, 및 최고 초고도의 엄격한 조건하에 서열 번호 3 내지 35, 64 내지 85에 하이브리드화하는 표적 핵산이 본 발명의 특징이다. 그러한 핵산의 예는 주어진 서열에 비하여 하나 또는 여러 개의 침묵 또는 보존적 핵산 치환을 갖는 핵산을 포함한다.

테스트 핵산은 그것이 완전히 매칭된 상보적 표적에 하이브리드화하는 것의 적어도 1/2의 정도로 프로브에 하이브리드화할 때, 즉, 완전하게 매칭된 프로브가 완전하게 매칭된 상보적 표적에 임의의 비매칭된 표적 핵산에 하이브리드화하는 것에 대해 관찰되는 값의 적어도 약 5 내지 10배 높은 시그널 대 노이즈 비율로 하이브리드화하는 조건하에 프로브가 표적에 하이브리드화하는 것의 적어도 1/2만큼 높은 시그널 대 노이즈 비율로 프로브에 하이브리드화할 때, 프로브 핵산에 특이적으로 하이브리드화한다고 말해진다.

핵산은 이들이 일반적으로는 용액 중에서 회합될 때 "하이브리드화"한다. 핵산은 각종의 잘 특성화된 물리화학적 힘, 예를 들어, 수소 결합, 용매 배제, 염기 스택킹 등에 의해 하이브리드화한다. 핵산의 하이브리드화에 대한 광범위한 지침 사항이 문헌(Tijssen(1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes part I chapter 2, "Overview of principles of hybridization and the strategy of nucleic acid probe assays," (Elsevier, New York), and Ausubel, supra)에 기재되어 있다. 또한, 문헌(Hames and Higgins(1995) Gene Probes 1 IRL Press at Oxford University Press, Oxford, England, (Hames and Higgins 1) and Hames and Higgins(1995) Gene Probes 2 IRL Press at Oxford University Press, Oxford, England(Hames and Higgins 2))은 올리고뉴클레오티드를 포함하는 DNA 및 RNA의 합성, 표지, 검출 및 정량에 관해 상세하게 기재하고 있다.

서던 또는 노던 블롯 중 필터 상의 100개를 넘는 상보적 잔기를 갖는 상보적 핵산의 하이브리드화를 위한 엄격한 하이브리드화 조건의 예는, 42℃에서 1 mg의 헤파린과 함께 50% 포르말린을 사용하여 밤새 수행하는 것이다. 엄격한 세척 조건의 예는 65℃에서 15분간의 0.2 x SSC 세척이다(SSC 완충액에 관해서는 상기 Sambrook의 문헌 참조). 종종 고엄격도 세척을 하기 전에 저엄격도 세척을 선행하여 백그라운드 프로브 시그널을 제거한다. 저엄격도 세척의 예는 40℃에서 15분간의 2 x SSC 세척이다. 일반적으로, 특정 하이브리드화 분석에서 관련 없는 프로브에 대해 관찰된 값의 5배가 넘는(높은) 시그널 대 노이즈 비율은 특이적 하이브리드화의 검출을 나타낸다.

서던 및 노던 하이브리드화와 같은 핵산 하이브리드화 실험과 관련하여 "엄격한 하이브리드화 세척 조건"은 서열에 따라 달라지는 것이며, 다른 환경 파라미터 하에 달라진다. 핵산의 하이브리드화에 관한 광범위한 지침은 문헌(Tijssen(1993), supra, and in Hames and Higgins, 1 and 2)에 나타나 있다. 엄격한 하이브리드화 및 세척 조건은 어느 테스트 핵산에 대해서나 경험적으로 쉽게 결정될 수 있다. 예를 들어, 고도로 엄격한 하이브리드화 및 세척 조건을 결정함에 있어서, 선택된 세트의 기준이 충족될 때까지 하이브리드화 및 세척 조건을 점차적으로 증가시킨다(예를 들어, 온도를 증가시키거나, 염 농도를 감소시키거나, 세척제 농도를 증가시키고(거나) 하이브리드화 또는 세척 중에 포르말린과 같은 유기 용매의 농도를 증가시킨다). 예를 들어, 프로브가 완전하게 매칭된 상보적 표적에, 매칭되지 않는 표적에 하이브리드화하는 것에 대해 관찰된 값보다 적어도 5배 높은 시그널 대 노이즈 비율로 결합할 때까지 하이브리드화 및 세척 조건을 점차적으로 증가시킨다.

"매우 엄격한" 조건은 특정 프로브에 대한 열 융점(Tm)과 같아지도록 선택된다. Tm은 테스트 서열의 50%가 완전하게 매칭된 프로브에 하이브리드화하는 온도(소정의 이온 강도 및 pH 하의)이다. 본 발명에서, 일반적으로 "고도로 엄격한" 하이브리드화 및 세척 조건은 정의된 이온 강도 및 pH에서 특정 서열에 대한 Tm보다 약 5℃ 더 낮은 온도가 되도록 선택된다.

"초고도로 엄격한" 하이브리드화 및 세척 조건은 프로브가 완전하게 매칭된 상보적 표적에, 매칭되지 않은 표적 핵산에 하이브리드화하는 것에 대해 관찰된 값보다 적어도 10 배 높은 시그널 대 노이즈 비율로 결합할 때까지 하이브리드화 및 세척 조건을 점차적으로 증가시킨 하이브리드화 및 세척 조건이다. 그러한 조건하에 완전하게 매칭된 상보적 표적 핵산에 대한 값의 적어도 1/2의 시그널 대 노이즈 비율로 프로브에 하이브리드화하는 표적 핵산은 프로브에 초고도 엄격도 조건하에 결합하다고 말해진다.

마찬가지로, 보다 높은 수준의 엄격도는 관련 하이브리드화 분석의 하이브리드화 및 세척 조건을 점차적으로 증가시켜 결정될 수 있다. 예를 들어, 프로브가 완전하게 매칭된 상보적 표적에, 매칭되지 않은 표적에 하이브리드화하는 것에 대해 관찰된 값보다 적어도 10배, 20배, 50배, 100배 또는 500배 또는 그 이상의 배수로 높은 시그널 대 노이즈 비율로 결합할 때까지 점차적으로 증가시킨 하이브리드화 및 세척 조건을 예로 들 수 있다. 그러한 조건하에 완전하게 매칭된 상보적 표적 핵산에 대한 값의 적어도 1/2의 시그널 대 노이즈 비율로 프로브에 하이브리드화하는 표적 핵산은 프로브에 최고 초고도의 엄격도 조건하에 결합한다고 한다.

엄격한 조건하에 서로 하이브리드화하지 않는 핵산일지라도 이들이 코딩하는 폴리펩티드가 실질적으로 동일하면 실질적으로 동일하다. 이러한 경우는, 예를 들어, 핵산의 한 카피가 유전자 코드에 의해 허용되는 최대의 코돈 축퇴성을 이용하여 생성되는 경우에 일어난다.

독특한 부분서열

일 측면에 있어서, 본 발명은 명세서에 개시된 O-tRNA 및 O-RS의 서열로부터 선택된 핵산 중의 독특한 부분서열을 포함하는 핵산을 제공한다. 독특한 부분서열은 임의의 공지된 O-tRNA 또는 O-RS 핵산 서열에 상응하는 핵산과 비교하여 독특하다. 정렬은, 예를 들어, 디폴트 파라미터로 설정된 BLAST를 이용하여 수행할 수 있다. 어느 독특한 부분서열이나, 예를 들어, 본 발명의 핵산을 찾아내는 프로브로서 유용하다.

마찬가지로, 본 발명은 본 명세서 개시된 O-RS의 서열로부터 선택된 폴리펩티드 중의 독특한 부분서열을 포함하는 폴리펩티드를 포함한다. 여기서, 독특한 부분서열이란 임의의 공지된 폴리펩티드 서열에 상응하는 폴리펩티드와 비교하여 독특한 것을 의미한다.

본 발명은 또한 O-RS의 서열로부터 선택된 폴리펩티드 중의 독특한 부분서열을 코딩하는 독특한 코딩 올리고뉴클레오티드에 엄격한 조건하에 하이브리드화하는 표적 핵산을 제공하며, 여기서 독특한 부분서열은 임의의 대조군 폴리펩티드(예를 들어, 본 발명의 합성효소가 돌연변이에 의해 그로부터 유래된 패어런트 서열)에 상응하는 폴리펩티드에 비하여 독특한 것이다. 독특한 부분서열은 상기한 바와 같이 결정된다.

서열 비교, 동일성 및 상동성

2 이상의 핵산 또는 폴리펩티드 서열에 있어서, "동일한" 또는 퍼센트 "동일성"이란 2 이상의 서열 또는 부분서열이 최대 일치를 위해 비교 및 정렬되었을 때, 하기 서열 비교 알고리즘 중 하나(또는 당업자가 이용할 수 있는 다른 알고리즘)를 이용하여 또는 시각적 조사에 의해 측정된 바, 동일하거나 특정 퍼센트 동일한 아미노산 잔기 또는 뉴클레오티드를 갖는 것을 의미한다.

두 핵산 또는 폴리펩티드(예를 들어, O-tRNA 또는 O-RS를 코딩하는 DNA, 또는 O-RS의 아미노산 서열)와 관련하여 "실질적으로 동일한"이란 2 이상의 서열 또는 부분서열이 최대 일치를 위해 비교 및 정렬되었을 때, 서열 비교 알고리즘을 이용하여 또는 시각적 조사에 의해 측정된 바, 적어도 약 60%, 바람직하게는 80%, 가장 바람직하게는 90 내지 95%에 이르는 뉴클레오티드 또는 아미노산 잔기 동일성을 갖는 것을 의미한다. 그러한 "실질적으로 동일한" 서열은 실제적인 조상에 대한 언급이 없이, 일반적으로 "상동성"인 것으로 간주된다. 바람직하게는, "실질적 동일성"은 길이에 있어서 적어도 약 50개 잔기의 서열 영역에 걸쳐서, 보다 바람직하게는, 길이에 있어서 적어도 약 100개 잔기의 서열 영역에 걸쳐서 존재하며, 가장 바람직하게는 비교되는 두 서열의 적어도 약 150개 잔기에 걸쳐 또는 전체 길이에 걸쳐 실질적으로 동일하다.

서열 비교 및 상동성 결정에 있어서, 일반적으로 하나의 서열이 표준 서열로 작용하고, 이에 테스트 서열을 비교한다. 서열 비교 알고리즘을 사용할 때, 테스트 서열 및 표준 서열을 컴퓨터 내로 입력하고, 필요에 따라 부분서열 좌표를 지정하고, 서열 알고리즘 프로그램 파라미터를 지정한다. 서열 비교 알고리즘은 지정된 프로그램 파라미터에 기초하여 표준 서열에 대한 테스트 서열의 퍼센트 동일성을 계산한다.

비교를 위한 서열의 최적 정렬은, 예를 들어, 국부적 상동성 알고리즘에 의해(Smith & Waterman, Adv. Appl. Math. 2:482(1981)), 상동성 정렬 알고리즘에 의해(Needleman & Wunsch, J. Mol. Biol. 48:443(1970)), 유사성 방법을 검색하여(Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444(1988)), 이들 알고리즘의 컴퓨터화 실행에 의해(GAP, BESTFIT, FASTA, and TFASTA in the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI), 또는 시각적 조사에 의해(Ausubel et al., infra)에 의해 수행될 수 있다.

퍼센트 서열 동일성 또는 서열 유사성을 결정하는 데 적절한 알고리즘의 한 예는 BLAST 알고리즘으로서, 이는 문헌(Altschul et al., J. Mol. Biol. 215:403-410(1990))에 기재되어 있다. BLAST 분석을 수행하기 위한 소프트웨어는 국립생물공학 정보센터(the National Center for Biotechnology Information; www.ncbi.nlm.nih.gov/)를 통해 공개적으로 이용이 가능하다. 이 알고리즘은 대상 서열에서 길이 W의 짧은 워드(word)를 찾아내어 제일 먼저 하이 스코어링 서열 쌍(HSP)을 찾는 것을 포함하며, 이는 데이터베이스 서열 중 같은 길이의 워드와 정렬될 때 매칭되거나 어느 정도 양의 값의 한계치 스코어 T를 충족시킨다. T는 이웃 워드 스코어 한계치로 불리운다(Altschul et al., supra). 이들 초기의 이웃 워드 히트는 그들을 함유하는 더 긴 길이의 HSP를 찾기 위한 검색을 개시하는 시드(seed)로서 작용한다. 워드 히트는 이어서 누적 정렬 스코어가 증가될 수 있는 한 각 서열을 따라서 양 방향으로 연장된다. 누적 스코어는, 뉴클레오티드 서열에 대해서 파라미터 M(매칭된 잔기의 쌍에 대한 리워드 스코어; 항상 0보다 큼) 및 N(미스매칭된 잔기에 대한 패널티 스코어; 항상 0보다 작음)을 사용하여 계산된다. 아미노산 서열에 대해서는, 누적 스코어를 계산하기 위해 스코어링 매트릭스를 이용한다. 각 방향으로의 워드 히트의 연장은 누적 정렬 스코어가 얻어진 최대 값으로부터 수량 X만큼 떨어졌을 때, 누적 스코어가 하나 이상의 음의 값의 스코어링 잔기 정렬의 누적으로 인해 0 또는 그 이하로 내려갈 때, 또는 서열의 어느 한 쪽 말단에 달했을 때 정지된다. BLAST 알고리즘 파라미터 W, T, 및 X는 정렬의 감도 및 속도를 결정한다. BLASTN 프로그램(뉴클레오티드 서열용)은 디폴트로서 워드 길이(W) 11, 기대치(E) 10, 컷 오프 100, M=5, N=-4, 및 두 서열 모두 비교를 사용한다. 아미노산 서열에 대해, BLASTP 프로그램은 디폴트로서 워드 길이(W) 3, 기대치(E) 10, 및 BLOSUM62 스코어링 매트릭스(Henikoff & Henikoff(l989) Proc. Natl. Acad. Sci. USA 89: 109151)를 사용한다.

퍼센트 서열 동일성을 계산하는 것 이외에, BLAST 알고리즘은 또한 두 서열 사이의 통계적 유사성 분석을 수행한다(예를 들어, Karlin & Altschul, Proc. Nat'l. Acad. Sci. USA 90:5873-5787(1993)). BLAST 알고리즘에 의해 제공되는 하나의 유사도 척도는 최소 합계 확률(P(N))로서, 이는 두 뉴클레오티드 또는 아미노산 서열 간의 매치가 우연히 일어날 확률을 나타내는 것이다. 예를 들어, 핵산은 그를 표준 핵산과 비교하여 최소 합계 확률이 약 0.1 미만, 보다 바람직하게는 약 0.01 미만, 가장 바람직하게는 약 0.001 미만인 경우, 표준 서열에 유사한 것으로 간주된다.

돌연변이 유발 및 다른 분자생물학 기술

분자생물학적 기술을 기재하고 있는 일반 서적은 문헌(Berger and Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology volume 152 Academic Press, Inc., San Diego, CA(Berger); Sambrook et al., Molecular Cloning - A Laboratory Manual(2nd Ed), Vol. 1-3. Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 1989("Sambrook") and Current Protocols in Molecular Biology. F.M. Ausubel et al., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., (supplemented through 1999)("Ausubel"))을 포함한다. 이들 서적은 돌연변이 유발, 벡터의 사용, 플라스미드 및 람다 파지를 위한 DNA 제조, 프로모터 및 예를 들어, 비천연 아미노산을 포함하는 단백질 제조를 위한 셀렉터 코돈을 포함하는 유전자, 오르소고날 tRNA, 오르소고날 합성효소 및 이들의 쌍의 제조과 관련된 많은 다른 관련 주제를 기재하고 있다.

각종 유형의 돌연변이 유발법을 본 발명에서 사용하여, 예를 들어, tRNA 라이브러리를 제조하거나, 합성효소 라이브러리를 제조하거나, 관심있는 단백질 또는 폴리펩티드 중 비천연 아미노산을 코딩하는 셀렉터 코돈을 삽입한다. 이들 방법은 부위 특이적, 무작위 점 돌연변이 유발, 상동 재조합, DNA 셔플링 또는 다른 반복적 돌연변이 유발법, 키메라 제작, 우라실 함유 주형을 사용한 돌연변이 유발, 올리고뉴클레오티드 유도 돌연변이 유발, 포스포로티오에이트 변형 DNA 돌연변이 유발, 갭이 있는 이중 가닥 DNA를 사용한 돌연변이 유발 또는 이들의 조합을 포함하나, 이에 한정되는 것은 아니다. 또 다른 적절한 방법은 포인트 미스매치 복구, 수복 결함 숙주를 이용한 돌연변이 유발, 제한 선택 및 제한 정제, 결실 돌연변이 유발, 전체 유전자 합성에 의한 돌연변이 유발, 이중 가닥 파괴 복구 등을 포함한다. 예를 들어, 키메라 구성체를 포함하는 돌연변이 유발도 본 발명에 포함된다. 일 실시태양에 있어서, 돌연변이 유발은 천연 분자, 또는 변경되거나 돌연변이된 천연 분자에 대한 공지된 정보, 예를 들어, 서열, 서열 비교, 물리적 특성, 결정 구조 등에 의해 가이딩될 수 있다.

상기 서적 및 본 명세서의 실시예는 이들 과정을 기재하고 있다. 추가 정보는 하기 간행물들 및 이들에 인용된 참고 문헌에 기재되어 있다:

상기한 방법들 중 많은 방법에 대한 상세한 사항을 문헌(Methods in Enzymology Volume 154)에서 찾아볼 수 있으며, 이 문헌은 또한 각종 돌연변이 유발법에 있어서의 문제 해결을 위한 유용한 수단을 기재하고 있다.

본 발명은 또한 비천연 아미노산을 오르소고날 tRNA/RS 쌍을 통해 생체내에 통합시키기 위한 척추동물 숙주 세포 및 생물에 관한 것이다. 숙주 세포는 본 발명의 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드를 포함하는 구성체, 예를 들어, 클로닝 벡터 또는 발현 벡터일 수 있는 본 발명의 벡터로 유전적으로 조작(예를 들어, 형질전환, 형질도입 또는 형질감염)된다. 벡터는, 예를 들어, 플라스미드, 박테리아, 바이러스, 네이키드 폴리뉴클레오티드, 또는 접합 폴리뉴클레오티드일 수 있다. 벡터를 전기천공(From et al., Proc. Natl. Acad. Sci. USA 82, 5824(1985)), 바이러스 벡터에 의한 감염, 작은 비드 또는 입자의 매트릭스 내에 또는 표면 상에 핵산을 갖는 소립자의 고속 탄도 침투(Klein et al., Nature 327, 70-73(1987)) 등을 포함하는 표준 방법으로 세포 및/또는 미생물 내로 도입한다.

조작된 숙주 세포는 스크리닝 단계, 프로모터 활성화 또는 형질전환체 선택 등의 단계에서 필요에 따라 적절히 보충된 통상의 영양 배지 중에서 배양된다. 이들 세포는 경우에 따라 트랜스제닉 유기체 내에서 배양될 수 있다. 예컨대, 세포 단리 및 배양(예를 들어, 후속되는 핵산 단리를 위한)에 대한 다른 유용한 참고 문헌으로는 문헌(Freshney(1994) Culture of Animal Cells, a Manual of Basic Technique, third edition, Wiley-Liss, New York and the references cited therein; Payne et al(1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY; Gamborg and Phillips(eds)(1995) Plant Cell. Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag(Berlin Heidelberg New York) and Atlas and Parks(eds) The Handbook of Microbiological Media(1993) CRC Press, Boca Raton, FL)이 있다.

본 발명은 또한 오르소고날 tRNA/RS 쌍을 통해 비천연 아미노산을 도입하는 능력을 갖는 척추동물 세포주에 관한 것이다. 이들 세포주는 본 발명의 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드를 포함하는 구성체로 형질전환, 형질도입 또는 형질감염된 숙주 세포에 관해 당업계에 알려져 있는 세포 배양 기술을 사용하여 수립될 수 있다. 이와 같은 기술은 덱스트란 매개 형질감염, 인산칼슘 침전, 염화칼슘 처리, 폴리브렌 매개 형질감염, 프로토플라스트 융합, 전기천공, 바이러스 또는 파지 감염, 폴리뉴클레오티드의 리포좀 내 캡슐화, 및 직접 미세주사를 포함하나, 이에 한정되는 것은 아니다.

세포는 DNA가 일시적으로 또는 안정적으로 도입될 수 있게 하는 방식으로 형질전환 또는 형질감염된다. 재조합 단백질의 장기간 고수율 제조를 위해서는 안정한 발현이 바람직하다. 예를 들어, 항체 분자를 안정하게 발현하는 세포주가 조작될 수 있다. 바이러스 복제 기점을 함유하는 발현 벡터를 사용하기 보다는 숙주 세포를 적절한 발현 조절 요소(예를 들어, 프로모터, 인핸서, 서열, 전사 터미네이터, 폴리아데닐화 위치 등)에 의해 조절되는 DNA 및 선택 마커에 의해 형질전환시킬 수 있다. 외래 DNA를 도입한 후에, 조작된 세포를 풍부한 배지에서 1 내지 2일 동안 배양한 후, 선택 배지로 옮긴다. 재조합 플라스미드 중 선택 마커는 선택에 대한 내성을 부여하며, 세포로 하여금 플라스미드를 염색체 내로 안정하게 통합하게 하며, 성장하여 다시 클로닝되어 세포주로 확장될 수 있는 중심을 형성하게 한다. 이 방법을 사용하여 항체 분자를 발현하는 세포주를 조작한다. 그러한 조작된 세포주는 항체 분자와 직접적으로 또는 간접적으로 상호작용하는 화합물을 스크리닝하고 평가하는 데 유용하다. 또한, 당업계에 잘 알려진 다른 기술, 예컨대, 바이러스 매개 벡터 형질감염 기술로 세포를 임시적으로 형질감염할 수 있다.

표적 핵산을 세포 내로 도입하는 몇몇 잘 알려진 방법을 이용할 수 있으며, 그 중 어느 것이나 본 발명에 사용할 수 있다. 이들 방법은, 수용 세포와 DNA를 함유하는 박테리아 프로토플라스트의 융합, 전기천공, 발사 충격 및 바이러스 벡터로 감염(하기 설명함) 등을 포함한다. 박테리아 세포는 본 발명의 DNA 구성체를 함유하는 플라스미드의 수를 증폭시키는 데 사용할 수 있다. 박테리아를 로그 단계로 성장시킨 다음, 박테리아 내의 플라스미드를 당업계에 알려진 각종 방법으로 단리할 수 있다(예를 들어, Sambrook의 상기 문헌). 또한, 많은 키트가 박테리아로부터 플라스미드를 정제하는 데 이용할 수 있다(예를 들어, EasyPrep™, FlexiPrep™, Pharmacia Biotech; StrataClean™, Stratagene; QIAprep™, Qiagen). 단리되고 정제된 플라스미드를 추가로 조작하여 다른 플라스미드를 제조하고, 세포를 형질감염시키거나 생물을 감염시키기 위한 관련 벡터 내로 통합시키는 데 사용할 수 있다. 전형적인 벡터는 전사 및 번역 터미네이터, 전사 및 번역 개시 서열, 및 특정 표적 핵산의 발현 조절에 유용한 프로모터를 포함한다. 벡터는 경우에 따라 적어도 하나의 독립적 터미네이터 서열, 진핵 세포, 원핵 세포 또는 둘 다(예를 들어, 셔틀 벡터)에서 카세트의 복제를 허용하는 서열, 및 원핵 세포 및 척추동물 세포계를 위한 선택 마커를 함유하는 총괄적 발현 카세트를 포함한다. 벡터는 원핵 세포, 진핵 세포, 또는 바람직하게는 양자 모두에서 복제 및 통합되기에 적절하다(Giliman & Smith, Gene 8:81(1979); Roberts, et al., Nature. 328:731(1987); Schneider, B., et al., Protein Expr. Purif. 6435:10(1995); Ausubel, Sambrook, Berger(all supra)). 클로닝에 유용한 박테리아 및 박테리오파지의 카탈로그가, 예를 들어, ATCC에 의해 제공된다(The ATCC Catalogue of Bacteria and Bacteriophage(1992) Gherna et al., (eds) published by the ATCC). 시퀀싱, 클로닝에 대한 추가의 기초적 과정 및 분자 생물학의 다른 측면 및 이의 기초가 되는 이론적 고려 사항 등이 또한 문헌에 기재되어 있다(Watson et al., (1992) Recombinant DNA Second Edition Scientific American Books, NY). 또한, 실질적으로 어느 핵산(표준, 비표준을 불문하고, 실질적으로 임의의 표지된 핵산)이라도 여러 상업적 공급원[The Midland Certified Reagent Company(Midland, TX, www.mcrc.com); The Great American Gene Company(Ramona, CA, www.genco.com), ExpressGen Inc. (Chicago, IL, www.expressgen.com), Operon Technologies Inc. (Alameda, CA) 등]으로부터 맞춤식 또는 표준 주문할 수 있다.

키트

키트 역시 본 발명의 특징이다. 예를 들어, 세포 내에서 적어도 하나의 비천연 아미노산을 포함하는 단백질을 제조하기 위한 키트가 제공되며, 이 키트는 O-tRNA를 코딩하는 폴리뉴클레오티드 서열, 및/또는 O-tRNA, 및/또는 O-RS를 코딩하는 폴리뉴클레오티드 서열, 및/또는 O-RS를 함유하는 용기를 포함한다. 일 실시태양에 있어서, 상기 키트는 추가로 적어도 하나의 비천연 아미노산을 포함한다. 또 다른 실시태양에 있어서, 상기 키트는 추가로 단백질 제조에 관한 설명 자료를 포함한다.

하기 실시예는 청구된 발명을 제한하려는 것이 아니라 상세히 설명하기 위해 제공되는 것이다. 당업자는 청구된 발명의 범주를 벗어남이 없이 변화시킬 수 있는 비결정적 변수들을 인지하고 있을 것이다.

실시예 1 : 척추동물 세포 내에서 비천연 아미노산을 도입하는 아미노아실-tRNA 합성효소의 제조 방법 및 조성물

새로운 물리적, 화학적 또는 생물학적 특성을 갖는 비천연 아미노산을 포함하도록 척추동물 세포 유전자 코드를 확장시키는 것은 이들 세포에서 단백질 기능을 분석하고 조절하는 데 있어 강력한 수단을 제공할 것이다. 이러한 목적을 향해, 사카로마이세스 세레비시아에서 앰버 코돈에 응답하여 비천연 아미노산을 단백질 내로 높은 신뢰도로 도입하는 아미노아실-tRNA 합성효소의 단리를 위한 일반적인 접근법이 기재되어 있다. 이 방법은 GAL4의 DNA 결합 도메인과 전사 활성화 도메인 사이의 앰버 코돈을 억제하여 GAL4 응답성 리포터 유전자인 HIS3, URA3 또는 LacZ를 활성화시키는 것에 기초한다. 활성 에스케리치아 콜라이 타이로실-tRNA 합성효소(EcTyrRS) 변이체의 양성 선택을 위한 GAL4 리포터의 최적화가 기재되어 있다. 불활성 EcTyrRS 변이체를 '독성 대립자'로서 배양 배지에 가해지는 작은 분자(5-플루오로오로트산(5-FOA))를 사용하여 URA3 리포터로 음성 선택하는 것이 또한 개발되었다. 중요한 점은, 양성 및 음성 선택 모두를 단일 세포 상에 일정 범위의 엄격도로 수행할 수 있다는 것이다. 이는 돌연변이 합성효소의 대형 라이브러리로부터 일정 범위의 아미노아실-tRNA 합성효소(aaRS) 활성을 단리하는 것을 촉진시킨다. 목적하는 aaRS 표현형을 단리하는 방법의 힘은 모델 선택에 의해 입증된다.

실시예 2

포유동물 세포에서 pAF의 부위 특이적 도입

플라즈미드 제작:

Sal I 및 EcoR V 제한효소 부위에서 N-말단 쳔연 분비 신호를 갖는 hGH를 코딩하는 DNA 삽입물과 pMl-MT 벡터(Roche)를 결찰시켜 야생형 인간 성장 호르몬(hGH) 및 hGH 앰버 돌연변이체 발현 벡터를 제작하였다.

5' 제한효소 부위 EcoR I 및 BgI II, 인간 tRNA^Tyr의 5' 측접 서열(GGATTACGCATGCTCAGTGCAATCTTCGGTTGCCTGGACTAGCGCTCCGGTTTTTCTGTGCTGAACCTCAGGGGACGCCGACACACGTACACGTC(서열 번호 88)), 3'-CCA이 결실된 비. 스테아로써모필러스 tRNA 앰버 억제 돌연변이체, 인간 tRNA^Tyr의 3' 측접 서열(GACAAGTGCGGTTΓTTTTCTCCAGCTCCCGATGACTTATGGC(서열 번호 89)) 및 3' 제한효소 부위 BamH I 및 Hind III를 포함하는 단일 카비 비. 스테아로써모필러스 tRNA 발현 삽입물을 하기의 프라이머를 이용한 중첩 PCR을 통해 제작하였다:

FTam 73: EcoR I 및 BgI II 부위를 갖는 포워드 프라이머

GTACGAATTCCCGAGATCTGGATTACGCATGCTCAGTGCAATCTTCGGTTGCCTGGACTAGCGCTCCGGTTTTTCTGTGC(서열 번호 90)

FTam 74: FTam73과 중첩되는 리버스 프라이머

AGTCCGCCGCGTTTAGCCACTTCGCTACCCCTCCGACGTGTACGTGTGTCGGCGTCCCCTGAGGTTCAGCACAGAAAAACCGGAGCGC(서열 번호 91)

FTam 75: FTam74 및 FTam 76과 중첩되는 포워드 프라이머

GAAGTGGCTAAACGCGGCGGACTCTAAATCCGCTCCCTTTGGGTTCGGCGGTTCGAATCCGTCCCCCTCCA GACAAGTG(서열 번호 92)

FTam 76: BamH I 및 Hind III 부위를 가지며, FTam 75와 중첩되는 리버스 프라이머

GATGCAAGCTTGATGGATCCGCCATAAGTCATCGGGAGCTGGAGAAAAAAACCGCACTTGTCTGGAGGGGGACGG(서열 번호 93)

단일 카피 tRNA 발현 벡터를 제작하기 위해, 상기 기술한 삽입물을 EcoR I/Hind III으로 효소분해하고 동일한 제한효소로 절단한 pUC 19 벡터에 결찰시켰다. 2 카피 tRNA 발현 벡터의 제작을 위해, 단일 카피 삽입물을 EcoR I 및 BamH I으로 효소분해하고 EcoR I 및 Bgl II로 절단한 단일 카피 발현 벡터에 결찰시켰다. 결찰된 생성물은 5' EcoR I 및 3' Bgl II 부위를 재생시켰다. 유사한 전략을 반복적인 방식으로 사용하여 직렬 카피의 tRNA 서열을 포함하는 발현 벡터를 제작할 수 있다.

FLAG 태그(DYKDDDDK)를 야생형 이.콜라이 Tyr tRNA 합성효소 및 비천연 아미노산을 충전시킨 이의 돌연변이체의 C-말단에 부가하였다. RS 유전자를 PCR을 통해 증폭하고 pcDNA3.1/Zeo(+)(Invitrogen)에 결찰시켰다.

세포 배양

형질감염 하루전에, 대략 3.5×10⁵ CHO K1 세포를 10% 태아 소혈청(FBS) (Hyclone) 및 100 U/ml 페니실린 G 나트륨 및 100 ug/ml 스트렙토마이신 설페이트(Gibco)가 보충된 F-12 + Glutmax 배지(Gibco) 중의 6-웰 조직 배양 플레이트(BD bioscience)의 각 웰에 플레이팅하였다. 이 플레이트를 37℃, 5% CO₂에서 항온배양하였다. 95% 합류점에서, 리포펙타민 2000(Invitrogen)에 대한 표준 형질감염 프로토콜에 따라서 형질감염을 수행하였다. 일시적인 억제를 관찰하기 위해, 각 플라즈미드(즉, tRNA, RS, GOI 플라즈미드) 1 ㎍을 각 웰에 부가하였다. 항온반응 4시간 후, 형질감염 용액을 2 ml의 성장 배지(10% FBS 혈청 및 100 U/ml 페니실린 G 나트륨 및 100 ug/ml 스트렙토마이신 설페이트가 보충된 F-12 + Glutmax 배지)로 교체하였다. 비천연 아미노산 tRNA/RS 쌍으로 형질감염된 이들 웰에 대해서, 보충물로서 상응하는 비천연 아미노산 1 mM을 부가하였다. 대부분의 경우, 실험은 3회 반복하여 수행하였다. hGH의 발현은 활성 인간 성장 호르몬 ELISA 키트( Diagnostic Systems Laboratories Inc.)를 이용하여 40 시간 이후에 분석하였다.

결과:

CHO-K1에서 비천연 아미노선에 의한 부위 특이적 앰버 억제(도 1).

앰버 억제의 비천연 아미노산 의존성은 hGH G131 앰버 돌연변이체를 이용하여 평가하였다. CHO Kl 세포는 앰버-억제 비. 스테아로써모필러스 tRNA 돌연변이체의 6 직렬 카피를 보유하는 플라즈미드; hGH-G131 앰버 돌연변이체를 코딩하는 목적 유전자 플라즈미드; 및 티로신(Tyr), 파라-아세틸페닐알라닌(pAF), 파라-아지도페닐알라닌(pAz) 및 파라-벤조일페닐알라닌(pBz)를 이용하여 이의 동족 tRNA를 아미노아실화시키는 이.콜라이 Tyr tRNA 합성효소 돌연변이체를 코딩하는 플라즈미드와 함께 공동형질감염시켰다. 형질감염 용액과 함께 4시간 항온반응시킨 후, 형질 감염 용액은 성장 배지 +/- 상응하는 1 mM 비천연 아미노산으로 교체하였다. hGH의 발현은 24시간 후에 분석하였다. pAF 및 pBz에 대해, 전장 hGH 발현은 상응하는 비천연 아미노산의 존재하에서만 관찰되었다. 비천연 아미노선이 없는 경우, 어떠한 전장 hGH 발현도 검출되지 않았다. pAZ를 이용한 앰버 억제의 경우, pAZ의 존재 및 부재하에서 어떠한 hGH 발현도 관찰되지 않았다. 이는 항-FLAG 웨스턴 블랏에 의해 관찰되었던, pAZ tRNA 합성효소의 발현 불능에 의한 것인 듯 하다.

Tyr 및 pAF의 앰버 억제에 대한 pAF 농도의 영향은 hGH E88 앰버 돌연변이체를 이용하여 평가하였다. hGH E88 앰버 돌연변이체, 6-카피(도 2) 비. 스테아로써모필러스 tRNA, 및 Tyr와 pAF가 충전된 상응하는 이.콜라이 tRNA 합성효소를 코딩하는 플라즈미드를 CHO K1 세포에 공동 형질감염시켰다. 형질감염 용액과 함께 4시간 항온반응시킨 후, 형질감염 용액을 1 M HCl(성장 배지 부피에 대해 1:1000)이 부가되거나 부가되지 않은 성장 배지로 교체하였다. 최종 배지는 다음으로 1 M HCl 중 1 M pAF 스톡 용액을 이용하여 1, 2, 4, 6, 8 및 10 mM pAF를 보충하였고, 동일 부피의 1 M NaOH로 중성화시켰다. hGH 발현은 42시간 후에 분석하였다. Tyr 역제의 경우, 억제 효율은 HCl/NaOH 처리에 따라 약간 감소하였다. pAF 억제의 경우, 어떠한 hGH 발현도 pAF 부재하에서 검출되지 않았다. Tyr 및 pAF-기반 억제 둘 모두에서, 효율은 1 및 2 mM pAF에서 최대였다. 억제 효율은 pAF 농도가 4 mM에서 10 mM로 증가함에 따라 감소하였다.

실시예 3

하이브리드 tRNA를 이용한 pAF를 갖는 현탁 세포에서의 인간 Fc의 앰버 억제

인간 Fc I21 앰버 돌연변이체, 인간 tRNA 및 pAF를 충전한 이.콜라이 tRNA 합성효소 돌연변이체를 포함하는 플라즈미드를 CHO-S FreeStyle 현택 세포에 공동 형질감염시켰다. 4 카피의 htRNA를 실험에서 사용하였다. 발현 배지는 1 mM pAF를 포함하였다. 인간 Fc의 발현은 형질감염 72 시간 후에 분석하였다. 형질감염된 pAF 특이적 합성효소(pAFRS)의 양이 감소함에 따라 보다 높은 인간 Fc의 억제가 검출되었다.

hIgGl-Fc2 DNA 서열:

5' IL2 신호 서열:

ATGTACAGGATGCAACTCCTGTCTTGCATTGCACTAAGTCT (서열 번호 95)

hIgGl-Fc2 단백질 서열

IL2 신호 서열:

MYRMQLLSCIALSLALVTNS (서열 번호 97)

일 측면에 있어서, 본 발명은 다른 치환 분자에 커플링된 비천연 아미노산을 포함하는 단백질의 제조 방법 및 관련 조성물을 제공한다.

본 명세서에 기재된 실시예 및 실시태양은 단지 예시의 목적으로 주어진 것으로서, 이들에 비추어 각종 수정 및 변경이 당업자에게 명백할 것이며, 이들 수정 또는 변경이 또한 본 발명의 요지 및 취지, 및 첨부된 청구의 범위에 포함되는 것임을 이해하여야 한다.

본 명세서에서 발명을 명확히 하고 이해를 쉽게 할 목적으로 어느 정도 상세하게 기재하고 있으나, 본 명세서에 개시된 사항을 읽음으로써 본 발명의 진정한 범주를 벗어나지 않고서도 형식적 및 상세한 사항에 있어 여러 가지 변화가 가능하다는 것이 당업자에게 명백할 것이다. 예를 들어, 본 명세서 기재된 모든 기술 및 장치는 여러 가지 조합으로 사용될 수 있을 것이다. 모든 문헌, 특허, 특허 출원 및/또는 본 출원에 인용된 다른 문헌들은, 이러한 개개의 문헌, 특허, 특허 출원 및/또는 다른 문헌들이 어떠한 의도로든 본 명세서에 포함되는 것으로 개별적으로 표시된 것과 같은 정도로, 모든 목적을 위해 그 전문이 본 명세서에 포함된다.

표 5

^a이 클론은 또한 Asp165Gly 돌연변이체를 포함한다.

SEQUENCE LISTING <110> Feng, Tian Norman, Thea Chu, Stephanie <120> SITE SPECIFIC INCORPORATION OF NON-NATURAL AMINO ACIDS BY VERTEBRATE CELLS <130> AMBX-0123.00PCT <150> 60/843,473 <151> 2006-09-08 <160> 97 <170> PatentIn version 3.4 <210> 1 <211> 1275 <212> DNA <213> Escherichia coli <400> 1 atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcgctcta ttgcggcttc 120 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360 gctatcgcgg cgaacaacta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 420 gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gttgcagggt 540 tatgacttcg cctgtctgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600 cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660 tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaactgaa 720 ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780 atcaacactg cggatgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840 gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900 tatgtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960 aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020 gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080 caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140 tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200 gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260 atttgctgga aataa 1275 <210> 2 <211> 424 <212> PRT <213> Escherichia coli <400> 2 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Tyr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Asp Phe Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 3 <211> 1275 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 3 atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcgt gtgtggcttc 120 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360 gctatcgcgg ccaataatta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 420 gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gctgcagggt 540 tatagtatgg cctgtttgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600 cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660 tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaactgaa 720 ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780 atcaacactg cggatgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840 gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900 tatgtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960 aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020 gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080 caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140 tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200 gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260 atttgctgga aataa 1275 <210> 4 <211> 1275 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 4 atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcac ttgtggcttc 120 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360 gctatcgcgg ccaataatta tgactggttc agcaatatga atgtgctgac cttcctgcgc 420 gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gctgcagggt 540 tatacgtatg cctgtctgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600 cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660 tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaactgaa 720 ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780 atcaacactg cggatgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840 gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900 tatgtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960 aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020 gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080 caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140 tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200 gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260 atttgctgga aataa 1275 <210> 5 <211> 1275 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 5 atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcgt gtgtggcttc 120 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360 gctatcgcgg ccaataatta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 420 gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gctgcagggt 540 tatagtatgg cctgtttgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600 cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660 tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaactgaa 720 ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780 atcaacactg cggatgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840 gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900 tatgtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960 aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020 gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080 caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140 tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200 gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260 atttgctgga aataa 1275 <210> 6 <211> 1275 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 6 atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcgt gtgtggcttc 120 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360 gctatcgcgg ccaataatta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 420 gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gctgcagggt 540 tatagtatgg cctgtttgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600 cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660 tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaactgaa 720 ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780 atcaacactg cggatgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840 gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900 tatgtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960 aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020 gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080 caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140 tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200 gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260 atttgctgga aataa 1275 <210> 7 <211> 1275 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 7 atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcac gtgtggcttc 120 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360 gctatcgcgg ccaataatta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 420 gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacagcct gctgcagggt 540 tatacgatgg cctgtctgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600 cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660 tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaactgaa 720 ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780 atcaacactg cggatgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840 gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900 tatgtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960 aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020 gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080 caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140 tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200 gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260 atttgctgga aataa 1275 <210> 8 <211> 540 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 8 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcagcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatacg tatgcctgtc tgaacaaaca gtacggtgtg 540 <210> 9 <211> 540 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 9 cgggggctgg taccccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcagcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatacg tatgcctgtc tgaacaaaca gtacggtgtg 540 <210> 10 <211> 540 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 10 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcagcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatacg tatgcctgtc tgaacaaaca gtacggtgtg 540 <210> 11 <211> 540 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 11 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttattcg tatgcctgtg cgaacaaaca gtacggtgtg 540 <210> 12 <211> 540 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 12 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcagcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatacg tatgcctgtc tgaacaaaca gtacggtgtg 540 <210> 13 <211> 540 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 13 cgggggctgg taccccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcctttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttattct attgcctgtt cgaacaaaca gtacggtgtg 540 <210> 14 <211> 540 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 14 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcgtgtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatagt attgcctgtt tgaacaaaca gtacggtgtg 540 <210> 15 <211> 540 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 15 cgggggctgg taccccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcgtgtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatagt attgcctgtt tgaacaaaca gtacggtgtg 540 <210> 16 <211> 540 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 16 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tctggtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaagg ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaatt gttatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatatg cgtgcctgtg agaacaaaca gtacggtgtg 540 <210> 17 <211> 624 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 17 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcatttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaaggtc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatggt atggcctgtg ctaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccaatgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 18 <211> 609 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 18 caggtgacgg acgaggaagc gttagcagag cgactggcgc aaggcccgat cgcactcggt 60 tgtggcttcg atcctaccgc tgacagcttg catttggggc atcttgttcc attgttatgc 120 ctgaaacgct tccagcaggc gggccacaag ccggttgcgc tggtaggcgg cgcgacgggt 180 ctgattggcg acccgagctt caaagctgcc gagcgtaagc tgaacaccga agaaactgtt 240 caggagtggg tggacaaaat ccgtaagcag gttgccccgt tcctcgattt cgactgtgga 300 gaaaactctg ctatcgcggc caataattat gactggttcg gcaatatgaa tgtgctgacc 360 ttcctgcgcg atattggcaa acacttctcc gttaaccaga tgatcaacaa agaagcggtt 420 aagcagcgtc tcaaccgtga agatcagggg atttcgttca ctgagttttc ctacaacctg 480 ctgcagggtt atggttttgc ctgtttgaac aaacagtacg gtgtggtgct gcaaattggt 540 ggttctgacc agtggggtaa catcacttct ggtatcgacc tgacccgtcg tctgcatcag 600 aatcaggtg 609 <210> 19 <211> 591 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 19 gcgttagcag agcgactggc gcaaggcccg atcgcactcg ggtgtggctt cgatcctacc 60 gctgacagct tgcatttggg gcatcttgtt ccattgttat gcctgaaacg cttccagcag 120 gcgggccaca agccggttgc gctggtaggc ggcgcgacgg gtctgattgg cgacccgagc 180 ttcaaagctg ccgagcgtaa gctgaacacc gaagaaactg ttcaggagtg ggtggacaaa 240 atccgtaagc aggttgcccc gttcctcgat ttcgactgtg gagaaaactc tgctatcgcg 300 gccaataatt atgactggtt cggcaatatg aatgtgctga ccttcctgcg cgatattggc 360 aaacacttct ccgttaacca gatgatcaac aaagaagcgg ttaagcagcg tctcaaccgt 420 gaagatcagg ggatttcgtt cactgagttt tcctacaacc tgctgcaggg ttatggttat 480 gcctgtatga acaaacagta cggtgtggtg ctgcaaattg gtggttctga ccagtggggt 540 aacatcactt ctggtatcga cctgacccgt cgtctgcatc agaatcaggt g 591 <210> 20 <211> 621 <212> DNA <213> Artificial <220> <223> artificial synthetase <220> <221> misc_feature <222> (26)..(26) <223> n is a, c, g, or t <220> <221> misc_feature <222> (612)..(612) <223> n is a, c, g, or t <220> <221> misc_feature <222> (618)..(618) <223> n is a, c, g, or t <400> 20 gggctggtag cccaggtgac ggacgnagaa gcgttagcag agcgactggc gcaaggcccg 60 atcgcactcc tttgtggctt cgatcctacc gctgacagct tgcatttggg gcatcttgtt 120 ccattgttat gcctgaaacg cttccagcag gcgggccaca agccggttgc gctggtaggc 180 ggcgcgacgg gtctgattgg cgacccgagc ttcaaagctg ccgagcgtaa gctgaacacc 240 gaagaaactg ttcaggagtg ggtggacaaa atccgtaagc aggttgcccc gttcctcgat 300 ttcgactgtg gagaaaactc tgctatcgcg gccaataatt atgactggtt cggcaatatg 360 aatgtgctga ccttcctgcg cgatattggc aaacacttct ccgttaacca gatgatcaac 420 aaagaagcgg ttaagcagcg tctcaaccgt gaagatcagg ggatttcgtt cactgagttt 480 tcctacaacc tgctgcaggg ttattctatg gcctgtgcga acaaacagta cggtgtggtg 540 ctgcaaattg gtggttctga ccagtggggt aacatcactt ctggtatcga cctgacccgt 600 cgtctgcatc anaatcangt g 621 <210> 21 <211> 588 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 21 ttagcagagc gactggcgca aggcccgatc gcactcgttt gtggcttcga tcctaccgct 60 gacagcttgc atttggggca tcttgttcca ttgttatgcc tgaaacgctt ccagcaggcg 120 ggccacaagc cggttgcgct ggtaggcggc gcgacgggtc tgattggcga cccgagcttc 180 aaagctgccg agcgtaagct gaacaccgaa gaaactgttc aggagtgggt ggacaaaatc 240 cgtaagcagg ttgccccgtt cctcgatttc gactgtggag aaaactctgc tatcgcggcc 300 aataattatg actggttcgg caatatgaat gtgctgacct tcctgcgcga tattggcaaa 360 cacttctccg ttaaccagat gatcaacaaa gaagcggtta agcagcgtct caaccgtgaa 420 gatcagggga tttcgttcac tgagttttcc tacaacctgc tgcagggtta ttctgcggcc 480 tgtgcgaaca aacagtacgg tgtggtgctg caaattggtg gttctgacca gtggggtaac 540 atcacttctg gtatcgacct gacccgtcgt ctgcatcaga atcaggtg 588 <210> 22 <211> 600 <212> DNA <213> Artificial <220> <223> artificial synthetase <220> <221> misc_feature <222> (403)..(403) <223> n is a, c, g, or t <220> <221> misc_feature <222> (513)..(513) <223> n is a, c, g, or t <220> <221> misc_feature <222> (515)..(515) <223> n is a, c, g, or t <220> <221> misc_feature <222> (518)..(518) <223> n is a, c, g, or t <220> <221> misc_feature <222> (531)..(531) <223> n is a, c, g, or t <400> 22 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcct gtgtggcttc 60 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 120 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 180 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 240 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 300 gctatcgcgg ccaataatta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 360 gatattggca aacacttctc cgttaaccag atgatcaaca aanaagcggt taagcagcgt 420 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gctgcagggt 480 tattcggctg cctgtgcgaa caaacagtac ggngnggngc tgcaaattgg nggttctgac 540 caggggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca aaatcaggtg 600 <210> 23 <211> 591 <212> DNA <213> Artificial <220> <223> artificial synthetase <220> <221> misc_feature <222> (588)..(588) <223> n is a, c, g, or t <400> 23 gcgttagcag agcgactggc gcaaggcccg atcgcactcg tttgtggctt cgatcctacc 60 gctgacagct tgcatttggg gcatcttgtt ccattgttgt gcctgaaacg cttccagcag 120 gcgggccaca agccggttgc gctggtaggc ggcgcgacgg gtctgattgg cgacccgagc 180 ttcaaagctg ccgagcgtaa gctgaacacc gaagaaactg ttcaggagtg ggtggacaaa 240 atccgtaagc aggttgcccc gttcctcgat ttcgactgtg gagaaaactc tgctatcgcg 300 gccaataatt atgactggtt cggcaatatg aatgtgctga ccttcctgcg cgatattggc 360 aaacacttct ccgttaacca gatgatcaac aaagaagcgg ttaagcagcg tctcaaccgt 420 gaagatcagg ggatttcgtt cactgagttt tcctacaacc tgctgcaggg ttatagtgcg 480 gcctgtgtta acaaacagta cggtgtggtg ctgcaaattg gtggttctga ccagtggggt 540 aacatcactt ctggtatcga cctgacccgt cgtctgcatc agaatcangt g 591 <210> 24 <211> 600 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 24 gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcat ttgtggcttc 60 gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 120 ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 180 gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 240 gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 300 gctatcgcgg ccaatgatta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 360 gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 420 ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gctgcagggt 480 tataattttg cctgtgtgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 540 cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 600 <210> 25 <211> 579 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 25 cgactggcgc aaggcccgat cgcactcacg tgtggcttcg atcctaccgc tgacagcttg 60 catttggggc atcttgttcc attgttatgc ctgaaacgct tccagcaggc gggccacaag 120 ccggttgcgc tggtaggcgg cgcgacgggt ctgattggcg acccgagctt caaagctgcc 180 gagcgtaagc tgaacaccga agaaactgtt caggagtggg tggacaaaat ccgtaagcag 240 gttgccccgt tcctcgattt cgactgtgga gaaaactctg ctatcgcggc caataattat 300 gactggttcg gcaatatgaa tgtgctgacc ttcctgcgcg atattggcaa acacttctcc 360 gttaaccaga tgatcaacaa agaagcggtt aagcagcgtc tcaaccgtga agatcagggg 420 atttcgttca ctgagttttc ctacaatctg ctgcagggtt attcggctgc ctgtcttaac 480 aaacagtacg gtgtggtgct gcaaattggt ggttctgacc agtggggtaa catcacttct 540 ggtatcgacc tgacccgtcg tctgcatcag aatcaggtg 579 <210> 26 <211> 624 <212> DNA <213> Artificial <220> <223> artificial synthetase <220> <221> misc_feature <222> (13)..(13) <223> n is a, c, g, or t <220> <221> misc_feature <222> (599)..(599) <223> n is a, c, g, or t <400> 26 cgggggctgg tancccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcgggtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttattct atggcctgtt tgaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctganc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 27 <211> 625 <212> DNA <213> Artificial <220> <223> artificial synthetase <220> <221> misc_feature <222> (600)..(600) <223> n is a, c, g, or t <400> 27 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacgtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca atctgctgca gggttattcg gctgcctgtc ttaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgaacctgan 600 ccgtcgtctg catcaaaatc aagtg 625 <210> 28 <211> 624 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 28 cgggggctgg taccccaagt gacggacgag gaaacgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tctcttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcaggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatacg atggcctgtg tgaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 29 <211> 624 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 29 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcgcgtgcgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaagg ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttattct tatgcctgtc ttaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 30 <211> 624 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 30 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcgcgtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatacg atggcctgtt gtaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 31 <211> 624 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 31 cgggggctgg taccccaagt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacgtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcgctgag 480 ttttcctaca acctgctgca gggttatacg tttgcctgta tgaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 32 <211> 606 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 32 gtgacggacg aggaagcgtt agcagagcga ctggcgcaag gcccgatcgc actcacgtgt 60 ggcttcgatc ctaccgctga cagcttgcat ttggggcatc ttgttccatt gttatgcctg 120 aaacgcttcc agcaggcggg ccacaagccg gttgcgctgg taggcggcgc gacgggtctg 180 attggcgacc cgagcttcaa agctgccgag cgtaagctga acaccgaaga aactgttcag 240 gagtgggtgg acaaaatccg taagcaggtt gccccgttcc tcgatttcga ctgtggagaa 300 aactctgcta tcgcggccaa taattatgac tggttcggca atatgaatgt gctgaccttc 360 ctgcgcgata ttggcaaaca cttctccgtt aaccagatga tcaacaaaga agcggttaag 420 cagcgtctca accgtgaaga tcaggggatt tcgttcactg agttttccta caatctgctg 480 cagggttatt cggctgcctg tcttaacaaa cagtacggtg tggtgctgca aattggtggt 540 tctgaccagt ggggtaacat cacttctggt atcgacctga cccgtcgtct gcatcagaat 600 caggtg 606 <210> 33 <211> 624 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 33 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcgtttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttattcg atggcctgta cgaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 34 <211> 624 <212> DNA <213> Artificial <220> <223> artificial synthetase <220> <221> misc_feature <222> (13)..(13) <223> n is a, c, g, or t <400> 34 cgggggctgg tancccaagt gacggacggg gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcagttgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatctcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatagt tttgcctgtc tgaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 35 <211> 624 <212> DNA <213> Artificial <220> <223> artificial synthetase <400> 35 cgggggctgg tagcccaggt gacggacgag gaagcgttag cagagcgact ggcgcaaggc 60 ccgatcgcac tcacgtgtgg cttcgatcct accgctgaca gcttgcattt ggggcatctt 120 gttccattgt tatgcctgaa acgcttccag caggcgggcc acaagccggt tgcgctggta 180 ggcggcgcga cgggtctgat tggcgacccg agcttcaaag ctgccgagcg taagctgaac 240 accgaagaaa ctgttcagga gtgggtggac aaaatccgta agcaggttgc cccgttcctc 300 gatttcgact gtggagaaaa ctctgctatc gcggccaata attatgactg gttcggcaat 360 atgaatgtgc tgaccttcct gcgcgatatt ggcaaacact tctccgttaa ccagatgatc 420 aacaaagaag cggttaagca gcgtctcaac cgtgaagatc aggggatttc gttcactgag 480 ttttcctaca acctgctgca gggttatacg tttgcctgta ctaacaaaca gtacggtgtg 540 gtgctgcaaa ttggtggttc tgaccagtgg ggtaacatca cttctggtat cgacctgacc 600 cgtcgtctgc atcagaatca ggtg 624 <210> 36 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 36 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Val Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Tyr Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 37 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 37 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ile Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 38 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 38 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Val Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 39 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 39 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Val Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 40 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 40 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Thr Met Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 41 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 41 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Thr Tyr Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 42 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 42 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Leu Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Ser Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 43 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 43 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Leu Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 44 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 44 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Arg Met Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 45 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 45 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ile Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Gly Met Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 46 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 46 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Gly Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Gly Phe Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 47 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 47 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Gly Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Gly Tyr Ala Cys Met Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 48 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 48 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Leu Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 49 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 49 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Val Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Ala Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 50 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 50 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Leu Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Ala Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 51 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 51 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Val Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Ala Ala Cys Val Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 52 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 52 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ile Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asp Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Asn Phe Ala Cys Val Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 53 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 53 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Ala Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 54 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 54 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Gly Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 55 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 55 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Ala Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 56 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 56 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ser Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Thr Met Ala Cys Val Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 57 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 57 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ala Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Tyr Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 58 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 58 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ala Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Thr Met Ala Cys Cys Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 59 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 59 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Thr Phe Ala Cys Met Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 60 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 60 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Val Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 61 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 61 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Val Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Met Ala Cys Thr Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 62 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 62 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ser Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Ser Phe Ala Cys Leu Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 63 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 63 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Thr Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Asp Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Thr Phe Ala Cys Thr Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 64 <211> 129 <212> DNA <213> Escherichia coli <400> 64 agcttcccga taagggagca ggccagtaaa aagcattacc ccgtggtggg gttcccgagc 60 ggccaaaggg agcagactct aaatctgccg tcatcgacct cgaaggttcg aatccttccc 120 ccaccacca 129 <210> 65 <211> 129 <212> RNA <213> Escherichia coli <400> 65 agcuucccga uaagggagca ggccaguaaa aagcauuacc ccgugguggg guucccgagc 60 ggccaaaggg agcagacucu aaaucugccg ucaucgaccu cgaagguucg aauccuuccc 120 ccaccacca 129 <210> 66 <211> 34 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 66 atgaagtagc tgtcttctat cgaacaagca tgcg 34 <210> 67 <211> 34 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 67 cgaacaagca tgcgattagt gccgacttaa aaag 34 <210> 68 <211> 33 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 68 cgctactctc ccaaatagaa aaggtctccg ctg 33 <210> 69 <211> 32 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 69 ctggaacagc tatagctact gatttttcct cg 32 <210> 70 <211> 34 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 70 gccgtcacag attagttggc ttcagtggag actg 34 <210> 71 <211> 33 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 71 gattggcttc ataggagact gatatgctct aac 33 <210> 72 <211> 33 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 72 gcctctatag ttgagacagc atagaataat gcg 33 <210> 73 <211> 35 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 73 gagacagcat agatagagtg cgacatcatc atcgg 35 <210> 74 <211> 37 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 74 gaataagtgc gacatagtca tcggaagaga gtagtag 37 <210> 75 <211> 35 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 75 ggtcaaagac agttgtaggt atcgattgac tcggc 35 <210> 76 <211> 34 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 76 cgctactctc cccaaattta aaaggtctcc gctg 34 <210> 77 <211> 34 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 77 cgctactctc cccaaatata aaaggtctcc gctg 34 <210> 78 <211> 34 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 78 cgctactctc cccaaatgga aaaggtctcc gctg 34 <210> 79 <211> 34 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 79 cgctactctc cccaaagata aaaggtctcc gctg 34 <210> 80 <211> 34 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 80 cgctactctc cccaaaaaaa aaaggtctcc gctg 34 <210> 81 <211> 34 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 81 gccgtcacag attttttggc ttcagtggag actg 34 <210> 82 <211> 34 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 82 gccgtcacag attatttggc ttcagtggag actg 34 <210> 83 <211> 34 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 83 gccgtcacag attggttggc ttcagtggag actg 34 <210> 84 <211> 34 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 84 gccgtcacag atgatttggc ttcagtggag actg 34 <210> 85 <211> 34 <212> DNA <213> Artificial <220> <223> oligonucleotide primer <400> 85 gccgtcacag ataaattggc ttcagtggag actg 34 <210> 86 <211> 424 <212> PRT <213> Artificial <220> <223> artificial synthetase <400> 86 Met Ala Ser Ser Asn Leu Ile Lys Gln Leu Gln Glu Arg Gly Leu Val 1 5 10 15 Ala Gln Val Thr Asp Glu Glu Ala Leu Ala Glu Arg Leu Ala Gln Gly 20 25 30 Pro Ile Ala Leu Ile Cys Gly Phe Asp Pro Thr Ala Asp Ser Leu His 35 40 45 Leu Gly His Leu Val Pro Leu Leu Cys Leu Lys Arg Phe Gln Gln Ala 50 55 60 Gly His Lys Pro Val Ala Leu Val Gly Gly Ala Thr Gly Leu Ile Gly 65 70 75 80 Asp Pro Ser Phe Lys Ala Ala Glu Arg Lys Leu Asn Thr Glu Glu Thr 85 90 95 Val Gln Glu Trp Val Asp Lys Ile Arg Lys Gln Val Ala Pro Phe Leu 100 105 110 Asp Phe Asp Cys Gly Glu Asn Ser Ala Ile Ala Ala Asn Asn Tyr Asp 115 120 125 Trp Phe Gly Asn Met Asn Val Leu Thr Phe Leu Arg Asp Ile Gly Lys 130 135 140 His Phe Ser Val Asn Gln Met Ile Asn Lys Glu Ala Val Lys Gln Arg 145 150 155 160 Leu Asn Arg Glu Gly Gln Gly Ile Ser Phe Thr Glu Phe Ser Tyr Asn 165 170 175 Leu Leu Gln Gly Tyr Gly Met Ala Cys Ala Asn Lys Gln Tyr Gly Val 180 185 190 Val Leu Gln Ile Gly Gly Ser Asp Gln Trp Gly Asn Ile Thr Ser Gly 195 200 205 Ile Asp Leu Thr Arg Arg Leu His Gln Asn Gln Val Phe Gly Leu Thr 210 215 220 Val Pro Leu Ile Thr Lys Ala Asp Gly Thr Lys Phe Gly Lys Thr Glu 225 230 235 240 Gly Gly Ala Val Trp Leu Asp Pro Lys Lys Thr Ser Pro Tyr Lys Phe 245 250 255 Tyr Gln Phe Trp Ile Asn Thr Ala Asp Ala Asp Val Tyr Arg Phe Leu 260 265 270 Lys Phe Phe Thr Phe Met Ser Ile Glu Glu Ile Asn Ala Leu Glu Glu 275 280 285 Glu Asp Lys Asn Ser Gly Lys Ala Pro Arg Ala Gln Tyr Val Leu Ala 290 295 300 Glu Gln Val Thr Arg Leu Val His Gly Glu Glu Gly Leu Gln Ala Ala 305 310 315 320 Lys Arg Ile Thr Glu Cys Leu Phe Ser Gly Ser Leu Ser Ala Leu Ser 325 330 335 Glu Ala Asp Phe Glu Gln Leu Ala Gln Asp Gly Val Pro Met Val Glu 340 345 350 Met Glu Lys Gly Ala Asp Leu Met Gln Ala Leu Val Asp Ser Glu Leu 355 360 365 Gln Pro Ser Arg Gly Gln Ala Arg Lys Thr Ile Ala Ser Asn Ala Ile 370 375 380 Thr Ile Asn Gly Glu Lys Gln Ser Asp Pro Glu Tyr Phe Phe Lys Glu 385 390 395 400 Glu Asp Arg Leu Phe Gly Arg Phe Thr Leu Leu Arg Arg Gly Lys Lys 405 410 415 Asn Tyr Cys Leu Ile Cys Trp Lys 420 <210> 87 <211> 11 <212> DNA <213> Artificial <220> <223> B box sequence <220> <221> misc_feature <222> (8)..(8) <223> n is a, c, g, or t <400> 87 ggttcgantc c 11 <210> 88 <211> 95 <212> DNA <213> Artificial <220> <223> B. stearothermophilus tRNA expression insert <400> 88 ggattacgca tgctcagtgc aatcttcggt tgcctggact agcgctccgg tttttctgtg 60 ctgaacctca ggggacgccg acacacgtac acgtc 95 <210> 89 <211> 42 <212> DNA <213> Artificial <220> <223> B. stearothermophilus tRNA amber suppression mutant <400> 89 gacaagtgcg gtttttttct ccagctcccg atgacttatg gc 42 <210> 90 <211> 80 <212> DNA <213> Artificial <220> <223> FTam 73: forward primer <400> 90 gtacgaattc ccgagatctg gattacgcat gctcagtgca atcttcggtt gcctggacta 60 gcgctccggt ttttctgtgc 80 <210> 91 <211> 88 <212> DNA <213> Artificial <220> <223> FTam 74: Reverse primer <400> 91 agtccgccgc gtttagccac ttcgctaccc ctccgacgtg tacgtgtgtc ggcgtcccct 60 gaggttcagc acagaaaaac cggagcgc 88 <210> 92 <211> 75 <212> DNA <213> Artificial <220> <223> FTam 75: Forward primer <400> 92 gatgcaagct tgatggatcc gccataagtc atcgggagct ggagaaaaaa accgcacttg 60 tctggagggg gacgg 75 <210> 93 <211> 75 <212> DNA <213> Artificial <220> <223> FTam 76: Reverse primer <400> 93 gatgcaagct tgatggatcc gccataagtc atcgggagct ggagaaaaaa accgcacttg 60 tctggagggg gacgg 75 <210> 94 <211> 790 <212> DNA <213> Artificial <220> <223> hIgG1-Fc2 DNA <400> 94 ctgagatcac cggcgaagga gggccaccat gtacaggatg caactcctgt cttgcattgc 60 actaagtctt gcacttgtca cgaattcgat atcggccatg gttagatctg acaaaactca 120 cacatgccca ccgtgcccag cacctgaact cctgggggga ccgtcagtct tcctcttccc 180 cccaaaaccc aaggacaccc tcatgatctc ccggacccct gaggtcacat gcgtggtggt 240 ggacgtgagc cacgaagacc ctgaggtcaa gttcaactgg tacgtggacg gcgtggaggt 300 gcataatgcc aagacaaagc cgcgggagga gcagtacaac agcacgtacc gtgtggtcag 360 cgtcctcacc gtcctgcacc aggactggct gaatggcaag gagtacaagt gcaaggtctc 420 caacaaagcc ctcccagccc ccatcgagaa aaccatctcc aaagccaaag ggcagccccg 480 agaaccacag gtgtacaccc tgcccccatc ccgggaggag atgaccaaga accaggtcag 540 cctgacctgc ctggtcaaag gcttctatcc cagcgacatc gccgtggagt gggagagcaa 600 tgggcagccg gagaacaact acaagaccac gcctcccgtg ctggactccg acggctcctt 660 cttcctctac agcaagctca ccgtggacaa gagcaggtgg cagcagggga acgtcttctc 720 atgctccgtg atgcatgagg gtctgcacaa ccactacacg cagaagagcc tctccctgtc 780 tccgggtaaa 790 <210> 95 <211> 41 <212> DNA <213> Artificial <220> <223> 5' IL2 signal sequence <400> 95 atgtacagga tgcaactcct gtcttgcatt gcactaagtc t 41 <210> 96 <211> 254 <212> PRT <213> Artificial <220> <223> hIgG1-Fc2 protein sequence <400> 96 Met Tyr Arg Met Gln Leu Leu Ser Cys Ile Ala Leu Ser Leu Ala Leu 1 5 10 15 Val Thr Asn Ser Ile Ser Ala Met Val Arg Ser Asp Lys Thr His Thr 20 25 30 Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe 35 40 45 Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro 50 55 60 Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val 65 70 75 80 Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr 85 90 95 Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val 100 105 110 Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys 115 120 125 Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser 130 135 140 Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro 145 150 155 160 Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val 165 170 175 Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly 180 185 190 Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp 195 200 205 Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp 210 215 220 Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Gly Leu His 225 230 235 240 Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys 245 250 <210> 97 <211> 20 <212> PRT <213> Artificial <220> <223> IL2 signal sequence protein <400> 97 Met Tyr Arg Met Gln Leu Leu Ser Cys Ile Ala Leu Ser Leu Ala Leu 1 5 10 15 Val Thr Asn Ser 20

Claims

오르소고날 아미노아실-tRNA 합성효소(O-RS)를 포함하는 척추동물 세포 또는 세포주로서, 여기서 O-RS는 척추동물 세포에서 파라-아세틸-페닐알라닌(PAF)으로 오르소고날 tRNA(O-tRNA)를 우선적으로 아미노아실화시키는 것인 척추동물 세포 또는 세포주.
제1항에 있어서, O-RS는 O-RS가 천연 아미노산으로 O-tRNA를 아미노아실화시키는 것에 비하여 10배 이상 더욱 효과적으로 O-tRNA를 PAF로 아미노아실화시키는 것인 세포 또는 세포주.
제1항에 있어서, 0-RS는 비척추동물 유기체로부터 유래한 것인 세포 또는 세포주.
제3항에 있어서, 비척추동물 유기체는 에스케리치아 콜라이(Escherichia coli) 또는 바실러스 스테아로써모필러스(Bacillus stearothermophilus)인 세포 또는 세포주.
제1항에 있어서, 척추동물 세포 또는 세포주는 포유류의 것인 세포 또는 세포주.
제5항에 있어서, 척추동물 세포주는 인간 세포주인 세포주.
제1항에 있어서, O-RS는 천연 아미노산과 비교하여 하나 이상의 비천연 아미노산에 대해 하나 이상의 개선되거나 향상된 효소 특성을 가지며, 상기 특성은 보다 높은 K_m, 보다 낮은 K_m, 보다 높은 k_cat, 보다 낮은 k_cat, 보다 낮은 k_cat/k_m 및 보다 높은 k_cat/k_m으로 이루어진 군으로부터 선택된 것인 세포 또는 세포주.
제1항에 있어서, O-tRNA는 비척추동물 유기체로부터 유래한 것인 세포 또는 세포주.
제8항에 있어서, 비척추동물 유기체는 에스케리치아 콜라이 또는 바실러스 스테아로써모필러스인 세포 또는 세포주.
제1항에 있어서, 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산을 더 포함하고, 여기서 상기 폴리뉴클레오티드는 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는 세포 또는 세포주.
제10항에 있어서, 셀렉터 코돈은 앰버 코돈, 오커 코돈, 오팔 코돈 또는 4 또는 그 이상의 염기 코돈으로 이루어진 군으로부터 선택되는 세포 또는 세포주.
제10항에 있어서, 셀렉터 코돈은 앰버 코돈인 세포 또는 세포주.
제10항에 있어서, 셀렉터 코돈은 오커 코돈인 세포 또는 세포주.
제10항에 있어서, 셀렉터 코돈은 오팔 코돈인 세포 또는 세포주.
제10항에 있어서, 셀렉터 코돈은 4 또는 그 이상의 염기 코돈을 포함하는 세포 또는 세포주.
제10항에 있어서, 하나 이상의 비천연 아미노산을 포함하는 목적하는 폴리펩티드의 수율은 폴리뉴클레오티드에 상기 셀렉터 코돈이 결실된 세포로부터 유래하는 목적하는 천연 발생 폴리펩티드에 대해 얻어지는 것의 5% 이상인 세포 또는 세포주.
제1항에 있어서, 세포는 하나 이상의 비천연 아미노산의 존재하에 폴리펩티드 수율의 30%보다 낮은 수율로 하나 이상의 비천연 아미노산의 부재하에 목적하는 폴리펩티드를 생산하는 세포 또는 세포주.
제10항에 있어서, 목적하는 폴리펩티드는 치료용 단백질, 진단용 단백질, 산업용 효소 또는 이의 부분인 세포 또는 세포주.
제10항에 있어서, 목적하는 폴리펩티드가 사이토카인, 성장 인자, 성장 인자 수용체, 인터페론, 인터루킨, 염증 분자, 암유전자 생성물, 펩티드 호르몬, 신호 전달 분자, 스테로이드 호르몬 수용체, 에리스로포이에틴(EPO), 인슐린, 인간 성장 호르몬, 알파-1 안티트립신, 안지오스타틴, 항용혈 인자, 항체, 아포지단백질, 아포단백질, 심방 나트륨 이뇨 인자, 심방 나트륨 이뇨 폴리펩티드, 심방 펩티드, C-X-C 케모카인, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG, 칼시토닌, c-kit 리간드, 사이토카인, CC 케모카인, 단핵구 화학유인 단백질-1, 단핵구 화학유인 단백질-2, 단핵구 화학유인 단백질-3, 단핵구 염증 단백질-1 알파, 단핵구 염증 단백질-1 베타, RANTES, I309, R83915, R91733, HCC1, T58847, D31065, T64262, CD40, CD40 리간드, c-kit 리간드, 콜라겐, 콜로니 자극 인자(CSF), 보체 인자 5a, 보체 억제제, 보체 수용체 1, 사이토카인, DHFR, 상피세포 호중구 활성화 펩티드-78, GROα/MGSA, GROβ, GROγ, MIP-1α, MIP-1δ, MCP-1, 상피세포 성장 인자(EGF), 상피세포 호중구 활성화 펩티드, 에리스로포이에틴(EPO), 박리 독소(exfoliating toxin), 인자 IX, 인자 VII, 인자 VIII, 인자 X, 섬유아세포 성장 인자(FGF), 피브리노겐, 피브로넥틴, G-CSF, GM-CSF, 글루코세레브로시다제, 고나도트로핀, 성장 인자, 성장 인자 수용체, 헤지호그(Hedgehog) 단백질, 헤모글로빈, 간세포 성장 인자(HGF), 히루딘, 인간 혈청 알부민, ICAM-1, ICAM-1 수용체, LFA-1, LFA-1 수용체, 인슐린, 인슐린 유사 성장 인자(IGF), IGF-I, IGF-II, 인터페론, IFN-α, IFN-β, IFN-γ, 인터루킨, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, 각질 세포 성장 인자(KGF), 락토페린, 백혈병 억제 인자, 루시퍼라제, 뉴투린, 호중구 억제 인자(NIF), 온코스타틴 M, 골원성 단백질, 암유전자 생성물, 부갑상선 호르몬, PD-ECSF, PDGF, 펩티드 호르몬, 인간 성장 호르몬, 플레이오트로핀, 단백질 A, 단백질 G, 발열성 외독소 A, B 또는 C, 릴렉신, 레닌, SCF, 가용성 보체 수용체 I, 가용성 I-CAM 1, 가용성 인터루킨 수용체, 가용성 TNF 수용체, 소마토메딘, 소마토스타틴, 소마토트로핀, 스트렙토키나제, 슈퍼항원, 스타필로코커스 장독소, SEA, SEB, SEC1, SEC2, SEC3, SED, SEE, 스테로이드 호르몬 수용체, 슈퍼옥시드 디스뮤타제(SOD), 독성 쇼크 증후군 독소, 티모신 알파 1, 조직 플라스미노겐 활성화 인자, 종양 성장 인자(TGF), TGF-α, TGF-β, 종양 괴사 인자, 종양 괴사 인자 알파, 종양 괴사 인자 베타, 종양 괴사 인자 수용체(TNFR), VLA-4 단백질, VCAM-1 단백질, 혈관 내피세포 성장 인자(VEGEF), 유로키나제, Mos, Ras, Raf, Met; p53, Tat, Fos, Myc, Jun, Myb, Rel, 에스트로겐 수용체, 프로게스테론 수용체, 테스토스테론 수용체, 알도스테론 수용체, LDL 수용체, SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1, ICAM-1/LFA-1, 히알루린/CD44 및 코르티코스테론으로 구성된 군에서 선택되는 단백질 또는 단백질의 일부분을 포함하는 것인 세포 또는 세포주.
오르소고날 아미노아실-tRNA 합성효소(O-RS)를 포함하는 척추동물 세포 또는 세포주로서, 여기서 O-RS는 척추동물 세포에서 파라-아미노-페닐알라닌으로 오르소고날 tRNA(O-tRNA)를 우선적으로 아미노아실화시키는 것인 척추동물 세포 또는 세포주.
제1항에 있어서, O-RS는 O-RS가 천연 아미노산으로 O-tRNA를 아미노아실화시키는 것에 비해 10배 이상 더욱 효율적으로 O-tRNA를 파라-아미노-페닐알라닌으로 아미노아실화시키는 세포 또는 세포주.
제20항에 있어서, O-RS는 비척추동물 유기체로부터 유래된 것인 세포 또는 세포주.
제22항에 있어서, 비척추동물 유기체는 에스케리치아 콜라이 또는 바실러스 스테아로써모필러스인 세포 또는 세포주.
제20항에 있어서, 척추동물 세포 또는 세포주는 포유류의 것인 세포 또는 세포주.
제20항에 있어서, 척추동물 세포주는 인간 세포주인 세포주.
제20항에 있어서, O-RS는 천연 아미노산에 비하여 하나 이상의 비천연 아미 노산에 대해 하나 이상의 개선되거나 향상된 효소 특성을 가지며, 상기 특성은 보다 높은 K_m, 보다 낮은 K_m, 보다 높은 k_cat, 보다 낮은 k_cat, 보다 낮은 k_cat/k_m 및 보다 높은 k_cat/k_m으로 이루어진 군으로부터 선택된 것인 세포 또는 세포주.
제20항에 있어서, O-tRNA는 비척추동물 유기체로부터 유래한 것인 세포 또는 세포주.
제27항에 있어서, 비척추동물 유기체는 에스케리치아 콜라이 또는 바실러스 스테아로써모필러스인 세포 또는 세포주.
제20항에 있어서, 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산을 더 포함하고, 여기서 상기 폴리뉴클레오티드는 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는 세포 또는 세포주.
제29항에 있어서, 셀렉터 코돈은 앰버 코돈, 오커 코돈, 오팔 코돈 또는 4 또는 그 이상의 염기 코돈으로 이루어진 군으로부터 선택되는 세포 또는 세포주.
제29항에 있어서, 셀렉터 코돈은 앰버 코돈인 세포 또는 세포주.
제29항에 있어서, 셀렉터 코돈은 오커 코돈인 세포 또는 세포주.
제29항에 있어서, 셀렉터 코돈은 오팔 코돈인 세포 또는 세포주.
제29항에 있어서, 셀렉터 코돈은 4 또는 그 이상의 염기 코돈을 포함하는 세포 또는 세포주.
제29항에 있어서, 하나 이상의 비천연 아미노산을 포함하는 목적하는 폴리펩티드의 수율은 폴리뉴클레오티드에 상기 셀렉터 코돈이 결실된 세포로부터 유래하는 목적하는 천연 발생 폴리펩티드에 대해 얻어지는 것의 5% 이상인 세포 또는 세포주.
제20항에 있어서, 세포는 하나 이상의 비천연 아미노산의 존재하에 폴리펩티드 수율의 30%보다 낮은 수율로 하나 이상의 비천연 아미노산의 부재하에 목적하는 폴리펩티드를 생산하는 세포 또는 세포주.
제29항에 있어서, 목적하는 폴리펩티드는 치료용 단백질, 진단용 단백질, 산업용 효소 또는 이의 부분인 세포 또는 세포주.
제29항에 있어서, 목적하는 폴리펩티드가 사이토카인, 성장 인자, 성장 인자 수용체, 인터페론, 인터루킨, 염증 분자, 암유전자 생성물, 펩티드 호르몬, 신호 전달 분자, 스테로이드 호르몬 수용체, 에리스로포이에틴(EPO), 인슐린, 인간 성장 호르몬, 알파-1 안티트립신, 안지오스타틴, 항용혈 인자, 항체, 아포지단백질, 아포단백질, 심방 나트륨 이뇨 인자, 심방 나트륨 이뇨 폴리펩티드, 심방 펩티드, C-X-C 케모카인, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG, 칼시토닌, c-kit 리간드, 사이토카인, CC 케모카인, 단핵구 화학유인 단백질-1, 단핵구 화학유인 단백질-2, 단핵구 화학유인 단백질-3, 단핵구 염증 단백질-1 알파, 단핵구 염증 단백질-1 베타, RANTES, I309, R83915, R91733, HCC1, T58847, D31065, T64262, CD40, CD40 리간드, c-kit 리간드, 콜라겐, 콜로니 자극 인자(CSF), 보체 인자 5a, 보체 억제제, 보체 수용체 1, 사이토카인, DHFR, 상피세포 호중구 활성화 펩티드-78, GROα/MGSA, GROβ, GROγ, MIP-1α, MIP-1δ, MCP-1, 상피세포 성장 인자(EGF), 상피세포 호중구 활성화 펩티드, 에리스로포이에틴(EPO), 박리 독소(exfoliating toxin), 인자 IX, 인자 VII, 인자 VIII, 인자 X, 섬유아세포 성장 인자(FGF), 피브리노겐, 피브로넥틴, G-CSF, GM-CSF, 글루코세레브로시다제, 고나도트로핀, 성장 인자, 성장 인자 수용체, 헤지호그(Hedgehog) 단백질, 헤모글로빈, 간세포 성장 인자(HGF), 히루딘, 인간 혈청 알부민, ICAM-1, ICAM-1 수용체, LFA-1, LFA-1 수용체, 인슐린, 인슐린 유사 성장 인자(IGF), IGF-I, IGF-II, 인터페론, IFN-α, IFN-β, IFN-γ, 인터루킨, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, 각질 세포 성장 인자(KGF), 락토페린, 백혈병 억제 인자, 루시퍼라제, 뉴투린, 호중구 억제 인 자(NIF), 온코스타틴 M, 골원성 단백질, 암유전자 생성물, 부갑상선 호르몬, PD-ECSF, PDGF, 펩티드 호르몬, 인간 성장 호르몬, 플레이오트로핀, 단백질 A, 단백질 G, 발열성 외독소 A, B 또는 C, 릴렉신, 레닌, SCF, 가용성 보체 수용체 I, 가용성 I-CAM 1, 가용성 인터루킨 수용체, 가용성 TNF 수용체, 소마토메딘, 소마토스타틴, 소마토트로핀, 스트렙토키나제, 슈퍼항원, 스타필로코커스 장독소, SEA, SEB, SEC1, SEC2, SEC3, SED, SEE, 스테로이드 호르몬 수용체, 슈퍼옥시드 디스뮤타제(SOD), 독성 쇼크 증후군 독소, 티모신 알파 1, 조직 플라스미노겐 활성화 인자, 종양 성장 인자(TGF), TGF-α, TGF-β, 종양 괴사 인자, 종양 괴사 인자 알파, 종양 괴사 인자 베타, 종양 괴사 인자 수용체(TNFR), VLA-4 단백질, VCAM-1 단백질, 혈관 내피세포 성장 인자(VEGEF), 유로키나제, Mos, Ras, Raf, Met; p53, Tat, Fos, Myc, Jun, Myb, Rel, 에스트로겐 수용체, 프로게스테론 수용체, 테스토스테론 수용체, 알도스테론 수용체, LDL 수용체, SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1, ICAM-1/LFA-1, 히알루린/CD44 및 코르티코스테론으로 구성된 군에서 선택되는 단백질 또는 단백질의 일부분을 포함하는 것인 세포 또는 세포주.
제1항에 있어서, 세포주는 일시적으로 형질감염된 척추동물 세포주.
제1항에 있어서, 세포주는 안정하게 형질감염된 척추동물 세포주.
오르소고날 tRNA(O-tRNA)를 포함하는 척추동물 세포 또는 세포주로서, 여기 서 O-tRNA는 생체 내에서 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질로 파라-아세틸-페닐알라닌이 도입되는 것을 매개하는 것인 척추동물 세포 또는 세포주.
제41항에 있어서, 단백질은 2 이상의 비천연 아미노산을 포함하는 세포 또는 세포주.
제41항에 있어서, 단백질은 2 이상의 상이한 비천연 아미노산을 포함하는 세포 또는 세포주.
제41항에 있어서, 단백질은 약학적으로 허용되는 부형제를 더 포함하는 세포 또는 세포주.
오르소고날 tRNA(O-tRNA)를 포함하는 세포 또는 세포주로서, 여기서 O-tRNA는 생체 내에서 O-tRNA에 의해 인식되는 셀렉터 코돈을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질로 파라-아미노-페닐알라닌이 도입되는 것을 매개하는 것인 세포 또는 세포주.
제45항에 있어서, 단백질은 2 이상의 비천연 아미노산을 포함하는 세포 또는 세포주.
제45항에 있어서, 단백질은 2 이상의 상이한 비천연 아미노산을 포함하는 세포 또는 세포주.
제45항에 있어서, 단백질은 약학적으로 허용되는 부형제를 더 포함하는 세포 또는 세포주.
세포에서 하나 이상의 비천연 아미노산을 포함하는 단백질을 생산하기 위한 키트로서, O-tRNA를 코딩하는 폴리뉴클레오티드 서열, 및 O-RS를 코딩하는 폴리뉴클레오티드 서열 또는 O-RS를 함유하는 용기를 포함하는 키트.
제49항에 있어서, 하나 이상의 비천연 아미노산을 더 포함하는 키트.
제49항에 있어서, 단백질을 생산하기 위한 설명 자료를 더 포함하는 키트.