JP2004507247A

JP2004507247A - Ｄｎａ末端改変を使用する指向された分子進化のための方法および組成物

Info

Publication number: JP2004507247A
Application number: JP2002522312A
Authority: JP
Inventors: スマイダー，　ボーン
Original assignee: インテグリジェン，　インコーポレイテッド
Priority date: 2000-08-18
Filing date: 2001-08-17
Publication date: 2004-03-11
Also published as: EP1311709A4; EP1311709A1; WO2002016642A9; WO2002016642A1; AU2001286528A1; CA2419961A1

Abstract

図３に示されるように、指向された進化のための方法が記載され、ここで、遺伝的要素は、ランダムに切断され、ポリヌクレオチドの欠失もしくは付加または両方が、付加または欠失を有する関連した遺伝的要素のライブラリーを生成することを可能にする。対応するライブラリー集団もまた記載される。これらのプロセスは、遺伝子の指向された進化に必要である配列空間の重要なサンプリングを可能にする。目的の遺伝的要素において非常に小さいヌクレオチド欠失を行うための方法が、さらに記載される。

Description

【０００１】
（発明の分野）
本発明は、指向された進化に関し、遺伝子操作およびタンパク質操作に適用することができる方法を包含する。指向された進化を用いて、遺伝子またはタンパク質の機能を改善または変化させることを目標に、遺伝子配列を進化させる。指向された進化は、医薬品開発、バイオレメディエーション（ｂｉｏｒｅｍｅｄｉａｔｉｏｎ）、バイオリーチング（ｂｉｏｌｅａｃｈｉｎｇ）、および化学産業を含むが、これらに限定されない多くの分野に適用することができる。
【０００２】
（発明の背景）
近年、インビトロでの進化プロセスをシミュレートし、それにより特定遺伝子中で遺伝子変化を誘導して、それらの機能を変化または改善させる試みがなされてきた。遺伝子を変化させる技術がここ数年の間に知られてきたが、一般に、これらの方法を成功させるために、コードタンパク質構造および機能に関する詳細な特徴が必要とされた。ＤＮＡシャッフリング技術は、この障壁をある程度まで克服し、ここ数年でいくつかの遺伝子を首尾よく進化させるために適用されてきた［Ｍｉｎｓｈｕｌｌ＆Ｓｔｅｍｍｅｒ、米国特許第５，８３７，４５８号（１９９８年）］。
【０００３】
天然の進化は、環境中の遺伝子に関して、何百万年もかけて起こった。インビトロ進化は、数日または数週間で天然プロセスを模倣することを試みるものである。インビトロ戦略が成功するためには、進化理論のいくつかの様相を理解しなくてはならない。第１に、配列空間の概念が、既定長のタンパク質の考え得る配列の総数を規定する［Ｋａｕｆｆｍａｎ，（１９９３）］。したがって、
【０００４】
【数１】

であり、式中、配列空間Ｓは、考え得る配列数であり、Ｎは、タンパク質長である。インビトロ進化実験では、最も改善または変化した活性を有するタンパク質の分画を特定するために、目的のタンパク質のＳ配列を探索することが最も望ましい。中程度の５０個のアミノ酸を有するタンパク質は、２０^５０個の考え得る異なる配列のＳを有することがすぐに理解でき、その数は、現在の分子生物学技術による分析に関して事実上無限である。第２に、ほとんどのアミノ酸変化が、タンパク質にとって有害であることが明らかである。これらの変化は、タンパク質を不活性にし得るか、適切なフォールディングの崩壊を引き起こし得るか、またはインビボでのタンパク質もしくはｍＲＮＡに対する不安定性を引き起こし得る。有害な変異に対する有利な変異の平均比率は、１０^５分の１であると推定されている［Ｒａｄｍａｎら、Ａｎｎ，Ｎ．Ｙ．Ａｃａｄ．Ｓｃｉ．８７０：１４６−５５（１９９９）］。これに関して、変異率は、それらの機能を改善するために遺伝子を変異させる場合に重要なパラメータである。変異率が高すぎると、有害な変異が、有利な変異とともにｃｉｓで生じ、その状態により、有利な変異を含有する得られたタンパク質が、付随する有害な変異に起因して不活性であるため、有利な変異を有する遺伝子を特定することが不可能となる。第３に、より高い変異率の結末を克服するために、相同組換えを利用して、二重クロスオーバー事象により有害な変異を除去し得る。第４に、任意のインビトロ進化技術は、タンパク質の機能を改善または変化させる配列を特定するために、選択スクリーニングを必要とする。
【０００５】
現在の分子進化の主な障壁は、目的のタンパク質に関する配列空間を効率的に探索することができないことである。これに関して、１つより多い残基が異なる配列を生成および特定する能力が非常に重要であり、ここで、これらの配列は、タンパク質機能に対してさらな効果を有し得る。このさらなる効果は、アミノ酸相互依存にて記載し得る。例えば、残基ｉに単一の変異を有するタンパク質は、ｊでの付随する変異もまた存在しない限り、検出可能な機能のいかなる増大をも有さない場合がある。これに関して、進化が成功するためには、標的配列の考え得る２変異改変体すべてが、サンプリングされ、機能改善に関して試験されるべきである。一般に、長さＮのタンパク質のＲ変異体数は、以下：
【０００６】
【数２】

によって表され、ここで、Ｒは、変異改変体の数であり、２０は、各位置での考え得るアミノ酸数を表す。したがって、長さ５０のタンパク質に関しては、４９０，０００個の異なる２変異改変体が存在する。
【０００７】
配列空間のこれらの統計学的解析において、臨界値は、タンパク質長である（すなわち、Ｒ変異改変体数は、タンパク質長に依存する）。しかし、本質的には、任意の目的のタンパク質長は、三次元空間のアミノ酸残基の整列ほど、その機能にとって重要ではない場合がある。実際に、「触媒作業空間（ｃａｔａｌｙｔｉｃ　ｔａｓｋ　ｓｐａｃｅ）の仮説的概念は、この原理を説明すると提唱されている（Ｋａｕｆｆｍａｎ，１９９３）。タンパク質長Ｎを変化させることなくアミノ酸残基を変化させることは、Ｎを増加または減少させるいくつかの方法において、タンパク質の三次元構造に影響を及ぼし得ない。あるいは、Ｎの変化は、タンパク質の生物学的機能を全く変化させ得ない。相同タンパク質の事実上任意のファミリーの分析により、メンバーは、時には実質的な挿入または欠失を伴って異なる長さを有するが、区別不可能な生物学的機能を保持し得ることが明らかである。したがって、上記式は、おそらく、生物学的機能の改善または変化に関して探索する場合、スクリーニングされるべき様々なＲ変異改変体の正確な見解を提供しない。研究室では、タンパク質のＲ変異体の近隣と、ヌクレオチドがあらゆる位置で付加または欠失される多くの変異体数の全てを探索することが最適である。
【０００８】
欠失の場合には、Ｄ変異体欠失数は、以下：
【０００９】
【数３】

で表され、式中、Ｎは、タンパク質の初期長であり、Ｄは、欠失が起きる位置の数である。アミノ酸付加の場合には、考え得るすべての付加に関する同様の式が、２０個のアミノ酸のいずれかが任意の位置で付加され得るという事実を説明し：
【００１０】
【数４】

であり、式中、Ａは、考え得る付加変異体数である。付加および欠失変異体の場合では、これらの式はともに、唯一のアミノ酸が各位置で付加または欠失されると仮定している。しかし、インビトロ分子進化に関しては、各位置で付加または欠失した１個、２個、３個、・・・Ｃ個全ての数のアミノ酸を探索することが最適である。したがって、欠失変異体に関して、各位置で欠失された可変アミノ酸を有する配列数は、以下：
【００１１】
【数５】

であり、式中Ｃ_Ｄは、各位置で欠失したアミノ酸数を表し、Ｄは、欠失が起きる位置の数である。付加変異体に関して、式は、以下：
【００１２】
【数６】

となり、式中、Ｃ_Ａは、各位置での付加したアミノ酸数であり、Ａは、付加が生じる位置の数である。
【００１３】
現在の分子生物学技術のみが、空間全体の分画を、目的のタンパク質に関して生成およびサンプリングすることを可能にするため、生成されるべき実験空間について記載する式を定義することができる。この式はまた、ライブラリー構築技術の改善のモニタリングを可能とし、タンパク質機能に関連する空間の解析を可能にする。実験的に探索されるべき空間全体を、以下：
【００１４】
【数７】

として定義することができ、ここで、アミノ酸は、様々な組合せおよび順列で、他の残基に対して変異される（Ｓ_Ｒ）か、欠失される（Ｓ_ＣＤ）か、または付加される（Ｓ_ＣＡ）。もちろん、現在の分子化学技術により、ライブラリーを創出することが可能であり、ここでＲ＝１であればＳ_Ｒ＝Ｎであり、Ｄ＝１であればＳ_ＣＤ＝Ｎであり、Ａ＝１であればＳ_ＣＡ＝２０Ｎである。続いて、Ｎ＝５０のタンパク質について、この仮説的ライブラリーは、２０^＊Ｎ^３＝２．５×１０^６個の異なる配列を有し、ここで１つの位置での変化、欠失および付加の順列すべてが表される。
【００１５】
タンパク質進化に関する配列空間に関する上記議論は、種々の方法で、進化配列のインビトロ操作に適用してもよい。本質的に、酵素ファミリーの異なる触媒活性の進化は、大きく２つのカテゴリー：１）活性部位のアミノ酸は同一であるが、構造フォールド（ｆｏｌｄ）の差異が酵素に異なる基質特異性をもたせるもの［Ｐｅｒｏｎａ＆Ｃｒａｉｋ，Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２７２：２９９８７−９０（１９９７）］、および２）酵素構造は同一であるが、活性部位の残基の差異が、酵素に異なる反応を触媒させるもの［Ｂａｂｂｉｔｔ＆Ｇｅｒｌｔ，Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２７２：３０５９１−４（１９９７）］に類別することができる。前者の例は、セリンプロテアーゼファミリーであり、後者の例は、エノラーゼスーパーファミリーである。
【００１６】
これらのカテゴリー間の差異は、取るに足らないことのように思えるが、それらは、分子進化の方法および配列空間の概念にとって重要な意味を持つ。類似の構造フォールドを有するファミリーの酵素に関して、触媒機構のために触媒活性部位が同一残基を必要とするようであるため、タンパク質長全体にわたって配列空間をサンプリングする分子進化アプローチは、酵素の特異性を変化させる最適な戦略であるようである。しかし、第２の型の酵素に関しては、タンパク質の全長にわたって探索する配列空間を増加することはおそらく必要ではない。それよりも、重要な触媒ドメインの配列空間サンプリングを増加させることが、分子進化プロセスを最適化する。これに関して、全遺伝子配列にわたって展開される２０^５個の配列空間をサンプリングするよりも、２０個のアミノ酸それぞれに対して重要な５個のアミノ酸を変化させ、このより限定された空間（２０^５個）をサンプリングすることがより良好である。さらに、重要な領域における考え得る付加または欠失の変異体と同数をサンプリングすることはまた、インビトロ進化プロトコルの考え得る成功に寄与する。したがって、第２の型の酵素ファミリーに属する遺伝子の分子進化を最適化する方法は、非常に重要であり、かつ堅固な技術。
【００１７】
遺伝子ドメインの交換（ｓｗａｐｐｉｎｇ）は、生体分子の新たな機能または改善された機能を進化させるために効率的な手段である。単一ヌクレオチド残基の変化は、遺伝子およびタンパク質機能に影響を及ぼし得るものの、遺伝子中の複数残基の大量の交換が、タンパク質機能に劇的に影響を及ぼし得る。例えば、Ｅ．ｃｏｌｉおよびＳａｌｍｏｎｅｌｌａは、高度に関連した細菌種であるが、これらの遺伝的内容の差異は、単一残基の変化ではなく遺伝子交換事象にほぼ完全に起因する。さらに、大量のＤＮＡの変換が遺伝子を創出する交換事象は、凝固カスケードのような経路で数回起きたと考えられ、ならびに転位により新規転写カセットを創出することが考えられる［Ｂｅｌｌ，（１９９７）；Ｐａｔｔｈｙ，（１９９９）］。
【００１８】
天然に存在する分子進化の周知の例は、免疫系での抗体産生の基礎を成すものである。哺乳類の前リンパ球（ｐｒｅ−ｌｙｍｐｈｏｃｙｔｅ）では、天然の分子進化が日常的に首尾よく生じる。抗体は、混乱させるアレイの種々の抗原を結合することが可能であるが、類似のアミノ酸配列および二次構造を有している。抗体遺伝子は、遺伝子セグメントとして生殖系列で整列される（図２）。リンパ球成熟中、これらのセグメント（可変または「Ｖ」、多様性または「Ｄ］、および結合性または「Ｊ」と呼ぶ）は、Ｖ（Ｄ）Ｊ組換えと称したプロセスにおいて互いに並置され、機能的抗体またはＴ細胞受容体遺伝子を創出する。複数のＶセグメント、Ｄセグメント、およびＪセグメントは、相当量の多様性を可能とし、したがって、種々の抗原結合特異性が、リンパ球の最終レパートリーで創出される。この機構により創出された多様性を、コンビナトリアル多様性（ｃｏｍｂｉｎａｔｏｒｉａｌ　ｄｅｖｅｒｓｉｔｙ）と称する。別の型の多様性もまた、Ｖ（Ｄ）Ｊ組換え中に創出され、これは、コンビナトリアル多様性と同様に重要である［Ｄａｖｉｓ＆Ｂｊｏｒｋｍａｎ，Ｎａｔｕｒｅ　３３４：３９５−４０２（１９８８）］。この多様性を結合多様性と称し、それは、ヌクレオチドが遺伝子セグメントの結合部で損失または獲得される場合に創出される。重要なことに、これらの結合部は、抗原と接触する抗体分子の領域をコードし、したがって、この型の多様性は、多様性であるが機能的な免疫系を創出するために重要である。
【００１９】
免疫系によって利用される２つの型の多様性は、分子進化の実施に関して、以下の方法で特徴付けられ得る。免疫グロブリン遺伝子におけるコンビナトリアル多様性の生成は、複数の機能性Ｖ遺伝子セグメント、Ｄ遺伝子セグメントおよびＪ遺伝子セグメントを提供することによって配列空間全体のサンプリングが可能となり、その各メンバーは、配列がわずかに異なるが、依然としてセグメントのファミリーの他のメンバーに対して相同である。これに関して、Ｖ遺伝子セグメント、Ｄ遺伝子セグメントおよびＪ遺伝子セグメントの組合せ再配列は、新規抗体遺伝子を生成するために、「ドメイン交換」事象として機能する。結合多様性の生成は、連結されるべきＤＮＡの末端にランダムヌクレオチドを付加または欠失させる機構により、抗原を接触するのに重要な残基で配列空間のより大きな局所的サンプリングを可能にする。
【００２０】
遺伝子進化に関する上述の問題、すなわち莫大な配列空間の探索における困難、ランダム変異誘発の有害な変異の優勢、およびアミノ酸相互依存に起因して、研究室で機能的配列空間を探索する堅固な方法を考案することが困難であった。ライブラリー形式で変異タンパク質を創出するのに現在広範に使用される方法は、誤りがちなポリメラーゼ連鎖反応［Ｃａｌｄｗｅｌｌ＆Ｊｏｙｃｅ，（１９９２）；Ｇｒａｍら、Ｐｒｏｃ　Ｎａｔｌ　Ａｃａｄ　Ｓｃｉ　８９：３５７６−８０（１９９２）］、およびカセット変異誘発［Ａｒｋｉｎ＆Ｙｏｕｖａｎ，Ｐｒｏｃ　Ｎａｔｌ　Ａｃａｄ　Ｓｃｉ　８９：７８１１−５（１９９２）；Ｈｅｒｍｅｓら、Ｐｒｏｃ　Ｎａｔｌ　Ａｃａｄ　Ｓｃｉ　８７：６９６−７００（１９９０）；Ｏｌｉｐｈａｎｔら、Ｇｅｎｅ　４４：１７７−８３（１９８６）；Ｓｔｅｍｍｅｒ＆Ｍｏｒｒｉｓ，Ｂｉｏｔｅｃｈｎｉｑｕｅｓ　１３：２１４−２０（１９９２）］であり、これらの方法では最適化される特定領域が、合成的に変異誘発されたオリゴヌクレオチドで置き換えられる。あるいは、宿主細胞の変異誘発遺伝子（ｍｕｔａｔｏｒ）系統が、変異頻度を加算するために使用されてきた［Ｇｒｅｅｎｅｒら、Ｍｏｌ　Ｂｉｏｔｅｃｈｎｏｌ　７：１８９−９５（１９９７）］。各場合において、「変異雲（ｍｕｔａｎｔ　ｃｌｏｕｄ）」［Ｋａｕｆｆｍａｎ，（１９９３）］は、元の配列中のある種の部位付近に生成される。
【００２１】
誤りがちなＰＣＲは、長い配列にわたって低レベルの点変異をランダムに導入するために、低忠実度の重合条件を使用する。誤りがちなＰＣＲをまた使用して、未知の配列のフラグメントの混合物を変異誘発し得る。誤りがちなＰＣＲは、ｄＩＴＰの存在下でｄＮＴＰの個々の濃度を変化させることによって、遺伝子をランダムに変異させることができる［Ｃａｌｄｗｅｌｌ＆Ｊｏｙｃｅ，（１９９２）：Ｌｅｕｎｇ＆Ｍｉｙａｍｏｔｏ，Ｎｕｃｌｅｉｃ　Ａｃｉｄｓ　Ｒｅｓ　１７：１１７７−９５（１９８９）；Ｓｐｅｅら、Ｎｕｃｌｅｉｃ　Ａｃｉｄｓ　Ｒｅｓ　２１：７７７−８（１９９３）］。
【００２２】
しかし、コンピュータシミュレーションは、点変異単独では、多くの場合緩やかすぎて、連続した配列進化に必要なブロック変化を可能にし得ないことを示唆した。公開されている誤りがちなＰＣＲプロトコルは一般に、０．５〜１．０ｋｂより長いＤＮＡフラグメントの信頼性高い増幅に不適切であり、それらの実際の適用は限られる。さらに、誤りがちなＰＣＲの繰り返しのサイクルは、中立変異の蓄積を引き起こし、それは例えば、タンパク質を免疫原性にし得る。
【００２３】
オリゴヌクレオチド指向性変異誘発では、短い配列が、合成的に変異誘発されたオリゴヌクレオチドで置き換えられる。このアプローチは、遠位変異の組合せを生成せず、したがって有意にコンビナトリアルではない。莫大な配列長に対して限定されたライブラリーサイズは、タンパク質最適化のために多数回の選択が回避できないことを意味する。合成オリゴヌクレオチドによる変異誘発は、各回の選択後に個々のクローンを配列決定し、続いてファミリーに類別し、単一ファミリーを任意に選択し、そのファミリーをコンセンサスモチーフへと縮小させる必要があり、そのコンセンサスモチーフは、再合成され、単一遺伝子に再挿入され、続いてさらに選択される。このプロセスは、統計学的ボトルネックを構成し、それは多数回の変異誘発について集中的に労力を有し、また実用的ではない。
【００２４】
制限部位を組込むランダムプライマーまたは部分的縮重プライマーを利用する飽和変異誘発方法についても記載されている［Ｈｉｌｌら、Ｍｅｔｈｏｄｓ　Ｅｎｚｙｍｏｌ　１５５：５５８−６８（１９８７）；Ｏｌｉｐｈａｎｔら、Ｇｅｎｅ　４４；１７７−８３（１９８６）；Ｒｅｉｄｈａａｒ−Ｏｌｓｏｎら、Ｍｅｔｈｏｄｓ　Ｅｎｚｙｍｏｌ　２０８：５６４−８６（１９９１）］。
【００２５】
「カセット」変異誘発は、変異タンパク質のライブラリーを創出するための別の方法である［Ｂｏｃｋら、米国特許第５，８３０，７２０号（１９９５年）；Ｃｈｒｉｓｔｏｕ＆ＭｃＣａｂｅ、米国特許第５，８３０，７２８号（１９９８年）；Ｈｉｌｌら、Ｍｅｔｈｏｄｓ　Ｅｎｚｙｍｏｌ　１５５：５５８−６８（１９８７）；Ｍｉｌｌｅｒら、米国特許第５，８３０，７４０号（１９９８年）；Ｓｈｉｒａｉｓｈｉ＆Ｓｈｉｍｕｒａ，Ｇｅｎｅ　６４：３１３−９（１９８８）；Ｓｔｅｍｍｅｒ＆Ｃｒａｍｅｒｉ、米国特許第５，８３０，７２１号（１９９８年）］。カセット変異誘発は典型的に、部分的にランダム化された配列で、鋳型の配列ブロック長を置き換える。したがって、得られ得る最大の情報内容は、カセットのランダム化された部分中のランダム配列の数に統計学的に限定される。
【００２６】
プロトコルもまた開発されており、それにより、オリゴヌクレオチドの合成は、非天然ホスホルアミダイトで「ドープ（ｄｏｐｅ）」され、ランダム変異誘発を標的化する遺伝子セクションのランダム化を生じる［Ｗａｎｇ＆Ｈｏｏｖｅｒ，Ｊ　Ｂａｃｔｅｒｉｏｌ　１７９：５８１２−９（１９９７）］。この方法により、ランダム置換率を維持しながら、位置の選択の制御が可能となる。
【００２７】
ＺａｃｃｏｌｏおよびＧｈｅｒａｒｄｉ（１９９９）は、ピリミジンヌクレオチシドアナログおよびプリンヌクレオチシドアナログを利用するランダム変異誘発方法について記載している［Ｚａｃｃｏｌｏ＆Ｇｈｅｒａｒｄｉ，Ｊ　Ｍｏｌ　Ｂｉｏｌ　２８５：７７５−８３（１９９９）］。この方法は、セファロスポリン、セフォタキシムに対する触媒速度の増加を伴う　−ラクタマーゼを示す置換変異を達成するのに成功した。Ｃｒｅａは、「ウォークスルー（ｗａｌｋ　ｔｈｒｏｕｇｈ）」方法を記載し、ここでは、既定のアミノ酸が、あらかじめ選択された位置で標的配列に導入される［Ｃｒｅａ，米国特許第５，７９８，２０８号（１９９８年）］。
【００２８】
挿入変異および／または欠失変異により標的遺伝子を変異させる方法が開発されている。挿入変異は、ｓｔａｐｈｙｌｏｃｏｃｃａｌヌクレアーゼの内部に蓄積され得ることが実証された［Ｋｅｅｆｅら、Ｐｒｏｔｅｉｎ　Ｓｃｉ　３：３９１−４０１（１９９４）］。開発された欠失変異誘発方法の例としては、エキソヌクレアーゼ（例えば、エキソヌクレアーゼＩＩＩまたはＢａｌ３１）の利用、または点欠失を組み込むオリゴヌクレオチド指向性欠失によるものが挙げられる［Ｎｅｒら、Ｎｕｃｌｅｉｃ　Ａｃｉｄｓ　Ｒｅｓ　１７：４０１５−２３（１９８９）］。さらに、Ｌｉｅｔｚは、ランダム配列を有するオリゴヌクレオチドが挿入および欠失を誘導するためにＰＣＲと組合わせられ得る方法について記載する。この技術による機能の強化は示されておらず、過剰変異誘発（すなわち、ポリヌクレオチド１つ当たり多すぎる挿入または欠失を作製する）の容量が、この方法では重要である［Ｌｉｅｔｚ，米国特許第６，２５１，６０４号（２００１年）］。
【００２９】
インビトロでタンパク質を進化させるのに最も頻繁に使用される技術は、「ＤＮＡシャッフリング」として知られている。この方法では、遺伝子改変のライブラリーは、遺伝子の相同配列をフラグメント化し、そのフラグメントを互いにランダムにアニーリングさせ、ポリメラーゼを用いてオーバーハングを充填することにより創出される。次に、完全長遺伝子ライブラリーは、ポリメラーゼ連鎖反応（ＰＣＲ）により再構築される。この方法の有用性は、アニーリングの工程に生じ、それにより相同配列は、互いにアニーリングし得、両方の出発配列の特性を有する配列を産生し得る。実際に、この方法は、相同性であるが、いくつかの位置で有意な差異を含む２つ以上の遺伝子間の組換えに影響を及ぼす。いくつかの相同配列を用いるライブラリーの創出により、ランダムに変異した単一出発配列を用いる場合よりも多くの配列空間をサンプリングすることが可能となることを示した［Ｃｒａｍｅｒｉら、Ｎａｔｕｒｅ　３９１；２８８−９１（１９９８）］。この効果は、進化の年月が、異なる種のホモログ間の種々の有利な変異または中立の変異に関してすでに選択されていたという事実に起因するようである。ホモログから出発すると、次いで、スクリーニングされるべきライブラリーの創出において有害な変異数をかなり限定する。ホモログの有利な位置をコンビナトリアルに再配列すると、明らかに生化学反応を触媒するのに最適な二次タンパク質構造を可能にすることができる。得られた進化タンパク質は、出発配列各々に起因する明確な特徴を含有するようであり、選択後、劇的に改善された機能を生じる。
【００３０】
ＤＮＡシャッフリング技術の変法が考案された。一プロセスは、「付着伸長（ｓｔａｇｇｅｒｅｄ　ｅｘｔｅｎｓｉｏｎ）」プロセス、またはＳｔＥＰと呼ばれる。伸長プライマーにより創出されるフラグメントのプールを再構築するのではなく、完全長遺伝子を鋳型の存在下で直接アセンブリする。ＳｔＥＰは、変性、続く極端に省略されたアニーリング／伸長工程の繰り返しサイクルから構成される。各サイクルでは、伸長フラグメントを、相補性に基づいた種々の鋳型にアニーリングさせ得、さらに少し伸長して、「組換えカセット」を創出することができる。この鋳型転換により、ほとんどのポリヌクレオチドは、異なる親遺伝子由来の配列を含有する（すなわち、新規組換え体である）。このプロセスは、完全長遺伝子が形成するまで繰り返される。それに続いて、任意の遺伝子増幅工程を行うことができる［Ａｒｎｏｌｄら、米国特許第６，１７７，２６３号（２００１年）］。
【００３１】
別の技術では、初期ＤＮＡのフラグメント化は、標的遺伝子の付加物（ａｄｄｕｃｔ）形成を誘導することで、伸長反応中のポリメラーゼの早発性終結により達成することができる［Ｓｈｏｒｔ、米国特許第５，９６５，４０８号（１９９９年）］。異なる技術では、融合遺伝子のライブラリーを生成するために２つのホモログの各々に漸増性切断を誘導することにより、ライブラリーが創出され、ライブラリーの各々が、各ホモログからのドメインを含有する［Ｏｓｔｅｒｍｅｉｅｒら、Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．１７：１２０５−９（１９９９）］。このアプローチの利点は、以前の方法のアニーリング工程が省略されるため、出発配列間の有意な相同性が必要とされないことである。しかし、選択技術をライブラリーに適用する後に、この技術の変法が実際に改善された遺伝子機能の生成を引き起こすか否かは明らかではない。
【００３２】
種々の生物体由来の遺伝子の対立遺伝子を用いる遺伝子シャッフリングのこれまで記載されてきた方法は、コンビナトリアル多様性を生じさせるが、出発配列に見出される相同性により限定される。さらに、これらの方法は、抗体遺伝子セグメントのＶ（Ｄ）Ｊ結合により形成される結合多様性を生成する機構を提供しない。本発明は、指向性様式またはランダム様式のいずれかでタンパク質配列または核酸配列由来の残基を付加および欠失させることで、結合多様性に類似した機構を利用する。本発明はまた、コンビナトリアルＶ（Ｄ）Ｊ組換えにより生成されるコンビナトリアル多様性に類似した「遺伝子交換」事象を提供する。これは、遺伝子をインビトロで進化させる手段を大いに強化する。
【００３３】
（発明の要旨）
本発明は、以下の工程：
（ａ）ポリヌクレオチド中にランダムにヌクレオチド残基を付加または欠失させて、付加または欠失を含有するポリヌクレオチドのライブラリーを生成する工程；および
（ｂ）必要に応じて、工程（ａ）のポリヌクレオチドのプールを、所望の機能または特徴をコードするポリヌクレオチドを特定することが可能な選択手順に供する工程、
による核酸配列の指向された分子進化を包含する。工程（ａ）および（ｂ）は、必要に応じて反復し得る。本発明の方法により生成されるライブラリーもまた、記載され、そして意図される。
【００３４】
独自に、本発明は、タンパク質二次構造に有意に影響を及ぼす配列を含む配列空間のサンプリングを可能とし、したがって進化した遺伝子中の変化した機能または改善した機能を特定する蓋然性を高めることが可能である。さらに、本発明は、他の現在の技術によりサンプリングすることができない配列空間のサンプリングを可能にする。さらに、本発明を用いて創出したポリヌクレオチドのライブラリーは、他の現在の技術を利用して得ることができない。
【００３５】
いくつかの方法および組成物が、以下に記載されそして意図される。本発明の１つの方法は、遺伝的要素の配列中の異なる位置にヌクレオチド欠失を有するポリヌクレオチド配列のライブラリーを生成するための方法であって、以下の工程：
（ａ）この該遺伝的要素を含む複数コピーの環状ポリヌクレオチドを、ランダムな切断に供して、複数の線状ポリヌクレオチドを獲得する工程であって、このポリヌクレオチドの各々は、少なくとも１つの３’末端および５’末端を有する、工程；および
（ｂ）工程（ａ）由来の上記ポリヌクレオチドを、このポリヌクレチドのＤＮＡ末端の１つから少なくとも１つのヌクレオチドを取り除くプロセスに供して、欠失ポリヌクレオチド配列のライブラリーを生成する工程であって、このライブラリーは、異なるランダムな位置に欠失を有する複数の欠失ポリヌクレオチド配列を含む、工程、を包含する。さらに所望される場合、工程（ｂ）由来のポリヌクレオチドが、上記３’末端および５’末端を互いに共有結合するプロセスに供され得、そして上記ポリヌクレオチドのライブラリーは、目的の機能について選択するプロセスにさらに供され得る。欠失ポリヌクレオチドのライブラリーは、２個より多くかまたはそれ以上、例えば、少なくとも１０個、２０個もしくは３０個またはそれ以上の欠失を含んでもよく、あるいはさらには各々が他と異なる位置にランダム欠失を有する５０〜１００個の別個のヌクレオチドが得られてもよい。作製される欠失数は、出発材料および技術者の目標に依存する。いくつかの実施形態では、欠失ポリヌクレオチドのライブラリーは、少なくとも１個、２個、３個、４個、もしくは５個またはそれ以上の別個のヌクレオチドの非常に短い欠失を含む。異なる実施形態では、ライブラリーは、５０〜１００個またはそれ以上のヌクレオチドのより大きな欠失を含んでもよい。別の実施形態では、環状ポリヌクレオチドの複数コピーの組成物は、遺伝的要素に対する天然に存在するホモログを含まない。さらに、工程（ａ）および（ｂ）は、任意に反復され得る。別の任意の方法は、工程（ｂ）で欠失位置にヌクレオチドを挿入するプロセスを包含する。
【００３６】
各々異なる３’末端および５’末端を有する、複数の（好ましくは２個より多い、より好ましくは５個より多い、最も好ましくは１０個より多い）線状ポリヌクレオチドのライブラリーを含む実質的に純粋な組成物であって、環化される場合には各々の線状ポリヌクレオチドが他のものと同一である組成物について、記載されそして意図される。
【００３７】
異なるランダム欠失を有することによってのみ各々が他と異なる、少なくとも２個の（好ましくいは５個より多い、より好ましくは１０個より多い）欠失ポリヌクレオチドのライブラリーを含む実質的に純粋な組成物もまた、記載されそして意図される。必要に応じて、このような欠失ポリヌクレオチドはさらに、欠失位置に挿入された少なくとも１つのヌクレオチドを含む。
【００３８】
本発明の別の方法は、遺伝的要素中のランダムな位置にヌクレオチド付加を有するポリヌクレオチド配列のライブラリーを生成するための方法であって、以下の工程：
（ａ）この遺伝的要素を含む複数コピーの環状ポリヌクレオチドの組成物を、ランダムな切断に供して、複数の線状ポリヌクレオチドを獲得する工程であって、このポリヌクレオチドの各々は、少なくとも１つの３’末端および５’末端を有する、工程；および
（ｂ）工程（ａ）由来のポリヌクレオチドを、このポリヌクレチドの末端の１つに少なくとも１つのヌクレオチドを付加するプロセスに供して、付加ポリヌクレオチド配列のライブラリーを生成する工程であって、このライブラリーは、異なるランダムな位置に付加を有する複数の付加配列を含む、工程、
を包含する。さらに、所望される場合、工程（ｂ）由来の付加ポリヌクレオチドは、上記３’末端および５’末端を互いに共有結合するプロセスに供され得る。必要に応じて、上記ポリヌクレオチドのライブラリーは、目的の機能について選択するプロセスに供され得る。
【００３９】
本明細書に記載される方法のいずれかにおいて、切断は好ましくは、エンドヌクレアーゼ、好ましくはＳ１の使用により起きる。この方法は、付加ポリヌクレオチドのライブラリーが、各々が他と異なる位置にヌクレオチドのランダム付加を有する任意数の異なるポリヌクレオチド、例えば、少なくとも５個、１０個、２０個または３０個の別個のポリヌクレオチドを含むことを可能にする。本発明の１つの実施形態では、環状ポリヌクレオチドの複数コピーの組成物は、遺伝的要素に対する天然に存在するホモログを含まない。必要に応じて、この方法の工程（ａ）および（ｂ）は、反復され得る。別のオプションは、工程（ｂ）での付加点でヌクレオチドを欠失させるプロセスを包含する。任意数のヌクレオチドは、出発分子および技術者の目標に応じて、工程（ｂ）で付加され得、例えば１〜３個、３〜５０個、もしくは５０〜１００個またはそれ以上のヌクレオチドが、工程（ｂ）で付加され得る。
【００４０】
異なるランダム付加を有することでのみ各々が他と異なる、少なくとも２個（好ましくは、少なくとも５個、最も好ましくは、少なくとも１０個）の付加ポリヌクレオチドのライブラリーを含む、実質的に純粋な組成物が、意図される。
【００４１】
さらに、驚くべきことに、本発明は、ポリヌクレオチドの末端で短い欠失を作製して、末端に短い欠失（１〜１００個、好ましくは１〜３５個、最も好ましくは１〜１０個）を有するポリヌクレオチドの集団を生産する方法を提供する。次いで、このような欠失を有するＤＮＡ末端を他のＤＮＡ末端と共有結合させることができ、特定の内部位置に欠失を含有するポリヌクレオチドのライブラリーを生成することができる。多くの場合、連結されるべき２つの末端は、得られた連結産物が環状ポリヌクレオチドを含むように、同一ＤＮＡ分子上に存在する。このような方法および組成物は、タンパク質工学および指向された進化の領域で重要である。
【００４２】
（発明の詳細な説明）
遺伝子交換（ｓｗａｐｐｉｎｇ）事象は、高分子の進化における主要な駆動力（ｄｒｉｖｅｒ）を構成する。交換事象は、ヌクレオチドの挿入、欠失、または置換を含み得る。交換事象は、相同組換えを介して発生し得るが、抗体遺伝子セグメントに用いられるＶ（Ｄ）Ｊ組換えおよびＤＮＡ末端結合機構において発生するように、非相同的手段によっても発生し得る［Ｓｍｉｄｅｒ＆Ｃｈｕ，Ｓｅｍ．Ｉｍｍｕｎ．９：１８９−９７（１９９７）］。分子進化に関する現在の技術は、遺伝子交換のために一般的に適用可能な非相同的手段を提供するものではない。
【００４３】
本発明の適用には、改善した機能または変化した機能を有する新規な遺伝的要素の産生が含まれる。これらの遺伝的要素は、かなりの商業的価値を有し得る。例えば、遺伝的要素はタンパク質製剤の産生を強化し得る。遺伝的要素は、モノクローナル抗体、または病気を処置するために用いられる酵素などのタンパク質製剤をコードし得る。さらに、遺伝的要素は、化学品製造などの工業プロセスにおいて重要な酵素をコードし得るか、あるいは洗濯用界面活性剤（すなわち、プロテアーゼ、リパーゼまたはエステラーゼ）のような製品中に用いられ得る。さらに、遺伝的要素は、病原菌耐性のための手段を提供する、または、植物種による新規な栄養素の産生を可能にするといったような、農業における重要な用途を有し得る。さらに、遺伝的要素は、新規な抗生物質、色素または他の低分子のような、ヒトへの使用のための新規な製品を生産するため、微生物において用いられ得る。このように、その機能を改善または変化させるための遺伝的要素の改変は、いくつかの異なる産業に無数の適用を有する。
【００４４】
本発明を記載する目的のために、以下の用語は有用であり、かつ、以下のような意味を有する。
【００４５】
（定義）
用語「塩基」は、アデニン、グアニン、チミン、シトシンまたはウラシルのいずれかからなる核酸成分をいう。さらに、「プリン」は、アデニンまたはグアニンのいずれかを指し、「ピリミジン」は、チミン、シトシンまたはウラシルのいずれかをいう。
【００４６】
用語「ヌクレオシド」は、ピリミジンまたはプリンのペントース環（例えば、リボースまたはデオキシリボース）との共有結合を含む分子をいう。
【００４７】
用語「ヌクレオチド」は、ヌクレオシドのリン酸エステルをいう。
【００４８】
用語「ポリヌクレオチド」は、ホスホジエステル結合のような結合を介して、少なくとも１個の他のヌクレオチドの１つの３’ヒドロキシルに共有結合したあるヌクレオチドの少なくとも１個の５’ヒドロキシルを含有する分子をいう。ポリヌクレオチドは必然的に、以下に定義されるような、「残基」を含有する「位置」からなる。
【００４９】
ポリヌクレオチド配列またはポリペプチド配列に関する場合、用語「位置」は、ポリヌクレオチドまたはポリペプチド鎖中の目的の残基の場所をいう。例えば、ポリヌクレオチド配列中の「位置」は、少なくとも１個の他のヌクレオチドに関する、ポリヌクレオチド鎖中のヌクレオチドの場所として定義される。例えば、単純なポリヌクレオチドＴＧにおいて、Ｔは位置１（自身に関して）であり、Ｇは位置２（位置１のＴに関して）である。最も遠位の５’ヌクレオチドを基準として標識し、位置１として標識することが慣例であることが多い。ＤＮＡのような、遺伝子をコードする二本鎖のポリヌクレオチドでは、時に、遺伝子の翻訳開始部位が位置１として標識されることが多い。これはしばしば、ＡＴＧの翻訳開始配列におけるアデニンである。ＡＴＧからの５’に配置された位置は、負の位置（例えば、−１１、−３５など）が与えられ、ＡＴＧに対して３’に配置された位置は正の位置が与えられる。当業者は、用語「位置」の性質を、ポリヌクレオチドの配列における番号付けスキームに関するものとして理解する。「配列」は、各位置を占める残基の構成に起因する記号列（ｓｔｒｉｎｇ）をいう。例えば、配列ＡＴＧは、塩基アデニンがチミンの直前の位置を占め、チミンがグアニンの直前の位置を占めることを意味する。「特定の位置」は、その配列および構成が公知である少なくとも２個のヌクレオチド間のポリヌクレオチド中の位置をいう。
【００５０】
ポリヌクレオチドまたはポリペプチドに関する場合、用語「残基」は、ポリヌクレオチドについてはプリンヌクレオチドまたはピリミジンヌクレオチドをいい、ポリペプチドについてはアミノ酸をいう。
【００５１】
「遺伝的要素」は、機能をコードするポリヌクレオチドの配列を意味する。例えば、「遺伝的要素」は、ポリペプチド配列をコードし得、プロモーター機能、エンハンサー機能、翻訳開始部位または停止部位、あるいはＲＮＡスプライシング部位などをコードし得る。遺伝的要素は、他の遺伝的要素と作動可能に連結することができ、例えば、プロモーターは、タンパク質をコードする遺伝的要素と作動可能に連結して、目的の細胞型でのタンパク質の発現を可能にする。用語「遺伝子」および「目的の遺伝子」は、ポリペプチドをコードすることができるポリヌクレオチドをいう。
【００５２】
ポリヌクレオチドに関する用語「交換」または「遺伝子交換」は、以下のいずれかを意味する：１）ポリヌクレオチド中の連続した位置を占める少なくとも２個の残基の欠失の発生、または２）ポリヌクレオチドへの連続した位置を占める少なくとも２個の残基の付加の発生、または３）ポリヌクレオチド中の連続した位置を占める少なくとも２個の残基の、他の残基との置換。
【００５３】
ポリヌクレオチドに適用される場合、用語「ヌクレオチド欠失」は、ポリヌクレオチドが、得られるポリヌクレオチドを親の配列、野生型配列または他の参照配列と比較した場合、ポリヌクレオチド鎖中の１以上の位置から１個以上の特定の残基が除去されたことを意味する。
【００５４】
用語「ヌクレオチド挿入」または「ヌクレオチド付加」は、親の配列、野生型の配列、または他の参照配列と比較した場合、ポリヌクレオチドがポリヌクレオチド鎖に付加された特定の残基を有し、これにより少なくとも１個の元の残基がポリヌクレオチド中の新たな位置を現在占めていることを意味する。
【００５５】
用語「ポリヌクレオチド配列のライブラリー」は、ポリヌクレオチドの混合物をいい、ここで、この混合物中の少なくとも１つの配列が少なくとも１つの他の配列と、配列の構成または長さにおいて異なっており、例えば、２つの配列を比較した場合に少なくとも１つの位置が異なるヌクレオチドによって占められているか、または、他方の配列と比較した場合に少なくとも１つのヌクレオチド位置がもう一方の配列中に存在しない、ポリヌクレオチドの混合物をいう。
【００５６】
用語「ＤＮＡ」は、デオキシリボ核酸をいう。当業者は、ＤＮＡに関して本明細書中で記載されている操作がＲＮＡにも適用し得ることを理解する。
【００５７】
用語「ＤＮＡ末端」または末端は、ホスホジエステル結合が分解したＤＮＡ鎖中の位置をいう。一本鎖ＤＮＡの末端では、１個のヌクレオチドが他の１個のヌクレオチドと共有結合しているのみである。「二本鎖ＤＮＡ末端またはＲＮＡの末端」は、分子がもはや二本鎖でない、二本鎖ＤＮＡ分子またはＲＮＡ分子における位置をいう。一般に、ＤＮＡ末端は当業者に認識可能である。二本鎖ＤＮＡの末端は、５’オーバーハング、３’オーバーハングまたはヘアピン構造を有する平滑部分として特徴付けられる。ＤＮＡ末端は５’リン酸基を含有してもしなくてもよい。
【００５８】
本明細書中で使用される場合、用語「切断」は、ホスホジエステル結合のような２個のヌクレオチドの間の結合の開裂をいう。
【００５９】
用語「環状ポリヌクレオチド」は、二本鎖ＤＮＡ末端が全く存在しないポリヌクレオチドをいう。環状ポリヌクレオチドは一本鎖であっても二本鎖であってもよい。しかし、環状ポリヌクレオチドは一本鎖ＤＮＡ末端を含有していてもよい。環状ポリヌクレオチドは、一本鎖ＤＮＡ末端が存在するが互いにハイブリダイズした二本鎖分子の２つの鎖を水素結合が維持し、その結果二本鎖ＤＮＡ末端が互いに接近した２つの一本鎖末端の存在により形成されない場合に存在する。このような環状二本鎖ポリヌクレオチドは、「ニック（ｎｉｃｋｅｄ）」と呼ばれることが多い。
【００６０】
用語「線状ポリヌクレオチド」は、少なくとも１つの、しかしほとんどは２つのＤＮＡ末端を含有するポリヌクレオチドである。線状ポリヌクレオチドは、一本鎖であっても二本鎖であってもよい。
【００６１】
ポリヌクレオチドに適用される場合、用語「ランダム」または「ランダムな位置」は、任意の特定の残基位置が選択され得るプロセスをいう。本明細書中で用いられるランダムは、ヌクレオチドの切断点または位置のすべてが等しい頻度で選定（ｓｅｌｅｃｔ）または選択される（ｃｈｏｓｅｎ）ことを意味しない。むしろランダムは、プロセスの予測不可能な性質に関し、すなわち、ある事象がどこで発生するのか、または、任意の塩基がどの位置を有するかを作業者が演繹的に予測できない。最終的に、利用可能な位置または塩基についてランダムとなるべきプロセスに関して、すべての位置が切断のために利用可能である必要はない。例えば、長さＮのポリヌクレオチドは、操作により影響を受けるその位置（すなわち、１、２、・・・Ｎ）のいずれかまたは全てを有し得る。残基の付加（挿入）または欠失では、ポリヌクレオチドは必然的に共有結合（例えばホスホジエステル結合）は切断されねばならず、その後その残基は欠失されるかまたは付加される（すなわち、位置の総数はそれぞれ増加するかまたは減少する）。長さＮのポリヌクレオチド中の「ランダムな位置での欠失」と記載する際、任意またはすべてのＮ（環状ポリヌクレオチド中）またはＮ−１（線状ポリヌクレオチド中）のヌクレオチド間の共有結合（すなわち、ホスホジエステル結合）が分解し、末端における少なくとも１個のヌクレオチドが再連結に先立って除去されることを意味する。それゆえ、「ランダムな位置での欠失」を引き起こすプロセスでは、ポリヌクレオチドの最終的な長さ（Ｎ、すなわち位置の数）は必然的に減少する。同様に、長さＮのポリヌクレオチド中の「ランダムな位置での挿入」と記載する際、任意またはすべてのＮ（環状ポリヌクレオチド中）またはＮ−１（線状ポリヌクレオチド中）のヌクレオチド間の共有結合（すなわち、ホスホジエステル結合）は分解し、少なくとも１個の新たなヌクレオチド（すなわち、新たな位置）が再連結に先立って末端に付加されることを意味する。それゆえ、「ランダムな位置での挿入」を引き起こすプロセスでは、ポリヌクレオチドの最終的な長さ（Ｎ、すなわち位置の数）は必然的に増加する。「ランダムな位置での欠失」および「ランダムな位置での挿入」を含むプロセスの組合せにより、ポリヌクレオチドの最終的な長さを不変に維持することが可能な場合もある（すなわち、付加が欠失を相殺し、最終的な位置の数が同じに維持されるが、その位置を占めるヌクレオチドが異なり得る）。長さＮのポリヌクレオチド中の「ランダムな切断」または「シングルランダム分解（ｓｉｎｇｌｅ　ｒａｎｄｏｍ　ｂｒｅａｋ）」と記載する場合、単一のポリヌクレオチド分子中の残基位置間のＮ（環状ポリヌクレオチド中）またはＮ−１（線状ポリヌクレオチド中）の共有結合のいずれか１つが切断されることを意味する。したがって、ポリヌクレオチドの多くのコピーを含む１つの容器中で、シングルランダム分解が種々の分子の種々の位置で発生し得る。
【００６２】
本明細書中で使用される場合、「実質的に純粋な」とは、対象種が、存在する優先種であり（すなわち、モルを基準とした場合、組成物中に他のいかなる個別の高分子種よりもより多く存在している）、好ましくは、実質的に精製された分画が、存在するすべての高分子種の少なくとも約５０％（モルを基準として）を対象種が含有する組成物であることを意味する。一般に、実質的に純粋な組成物は、組成物中に存在するすべての高分子種の約８０〜９０％を超えて構成する。最も好ましくは、対象種は、基本的に均一になるまで精製され（組成物中に従来の検出方法により汚染種を検出することができない）、ここで、この組成物は、基本的に単一の高分子種からなる。溶媒種、低分子（５００ダルトン未満）および元素イオン種は、高分子種とはみなされない。
【００６３】
用語「相同（ｈｏｍｏｌｏｇｏｕｓ）」または「相同（ｈｏｍｅｏｌｏｇｏｕｓ）」は、１つの一本鎖核酸配列が相補的な一本鎖核酸配列にハイブリダイズし得ることを意味する。ハイブリダイゼーションの程度は、配列間の同一性の量、および後述するように温度や塩濃度といったハイブリダイゼーションの条件を含む多くの要因に依存し得る。好ましくは、同一性の領域は約５ｂｐを超え、より好ましくは同一性の領域は１０ｂｐを超える。このように、「ホモログ」は、同一でないが、生理学的条件下で互いにハイブリダイズし得る核酸分子である。二本鎖ホモログは、変性させた後に互いにハイブリダイズし得る。
【００６４】
用語「異種」は、１つの一本鎖核酸配列が、別の一本鎖核酸配列またはその相補体にハイブリダイズすることができないことを意味する。したがって、異種の範囲とは、核酸フラグメントまたはポリヌクレオチドが、配列中に別の核酸またはポリヌクレオチドにハイブリダイズすることができない範囲または領域を有することを意味する。このような領域または範囲は、例えば、変異領域である。
【００６５】
用語「同一」または「同一性」は、２つの核酸配列が同一の配列または相補的配列を有することを意味する。したがって、「同一性領域」とは、核酸フラグメントまたはポリヌクレオチドの領域または範囲が、別のポリヌクレオチドまたは核酸フラグメントと同一であるかまたはそれに相補的であることを意味する。
【００６６】
用語「増幅」は、核酸フラグメントのコピー数が増大することを意味する。
【００６７】
用語「野生型」は、核酸フラグメントがいかなる変異をも含まないことを意味する。「野生型」タンパク質とは、このタンパク質が天然に見られる活性に匹敵するレベルで活性であることを意味し、天然に見られるアミノ酸配列を典型的に含む。本発明の１つの局面では、用語「野生型」または「親配列」は、配列の操作に先立つ、開始配列または参照配列を示す。
【００６８】
用語「関連ポリヌクレオチド」は、ポリヌクレオチドの領域または範囲が同一であり、ポリヌクレオチドの領域または範囲が異種であることを意味する。
【００６９】
用語「キメラポリヌクレオチド」は、野生型であるヌクレオチド領域および変異した領域をこのポリヌクレオチドが含むことを意味する。また、この用語は、このポリヌクレオチドが、あるポリヌクレオチド由来の野生型領域および別の関連ポリヌクレオチド由来の野生型領域を含むことを意味する。
【００７０】
本明細書中で使用される場合、用語「集団」は、ポリヌクレオチド、核酸フラグメントまたはタンパク質のような構成成分を集めたものを意味する。「混合集団」とは、核酸またはタンパク質と同一のファミリーに属する（すなわち、関連する）が、配列が異なり（すなわち、同一でない）、したがって、その生物活性が異なる構成成分を集めたものを意味する。「ライブラリー」は、少なくとも２つの構成成分がいくつかの点（化学組成、長さ等）で異なっている集団を必然的に意味する。
【００７１】
用語「特定の核酸フラグメント」は、特定の末端地点を有しかつ特定の核酸配列を有する、核酸フラグメントを意味する。１つの核酸フラグメントが第２の核酸フラグメントの一部と同一の配列を有するが異なる末端を有する、２つの核酸フラグメントは、２つの異なる特異的核酸フラグメントを含む。同一の配列を有するが異なる５’または３’末端を有する２つの核酸フラグメントは、２つの異なる特異的核酸フラグメントを含む。
【００７２】
用語「変異」は、野生型の核酸配列の配列変化またはペプチドの配列変化を意味する。このような変異は、転位または転換などの点変異であり得る。変異は、欠失、挿入または複製であってもよい。
【００７３】
本明細書中で使用されるポリペプチドの表記では、標準的な用法および慣例に従い、左向きの方向はアミノ末端方向であり、右向きの方向はカルボキシ末端方向である。同様に、特記しない限り、一本鎖ポリヌクレオチド配列の左側末端は５’末端であり、二本鎖ポリヌクレオチド配列の左向き方向は５’方向をいう。新生ＲＮＡ転写物の５’から３’付加の方向は、転写方向をいい、このＲＮＡと同一の配列を有し、かつＲＮＡ転写物のこの５’末端に対して５’であるＤＮＡ鎖上の配列領域を、「上流配列」と呼び、このＲＮＡと同一の配列を有し、かつコードＲＮＡ転写物の３’末端に対して３’であるＤＮＡ鎖上の配列領域を、「下流配列」という。
【００７４】
本明細書中である対象に対して適用される場合、用語「天然に存在する」は、対象が天然に見出しされ得るという事実をいう。例えば、天然の供給源から単離され得る生物（ウイルスを含む）中に存在し、研究室で人間の手により意図的に改変されていないポリペプチド配列またはポリヌクレオチド配列は、天然に存在する。一般に、用語天然に存在するは、非病理的（病気になっていない）個体中に存在するような対象、例えば、その種に典型的なものをいう。
【００７５】
本明細書中で使用される場合、用語「生理学的条件」は、温度、ｐＨ、イオン強度、粘性などをいい、これは、生存可能な微生物に適合し、および／または生存可能な培養酵母細胞もしくは哺乳動物細胞中の細胞内に典型的に存在する生化学的パラメータをいう。例えば、典型的な研究培養条件下で増殖させた酵母細胞中の細胞内条件が、生理学的条件である。インビトロ転写カクテルに適したインビトロ反応条件が、通常、生理学的条件である。一般に、インビトロの生理学的条件は、５０〜２００ｍＭのＮａＣｌまたはＫＣｌ、ｐＨ６．５〜８．５、２０〜４５℃、および０．００１〜１０ｍＭの２価カチオン（例えば、Ｍｇ^＋＋、Ｃａ^＋＋）、好ましくは、約１５０ｍＭ　ＮａＣｌまたはＫＣｌ、ｐＨ７．２〜７．６、５ｍＭ　２価カチオンを含み、０．０１〜１．０％の非特異的タンパク質（例えば、ＢＳＡ）を含む場合が多い。非イオン性界面活性剤（Ｔｗｅｅｎ、ＮＰ−４０、Ｔｒｉｔｏｎ　Ｘ−１００）が、通常約０．００１〜２％で、典型的には０．０５〜０．２％（ｖ／ｖ）で、しばしば存在し得る。特定の水性条件が、従来の方法に従い専門家によって選択され得る。一般的な手引きとしては、以下の緩衝化水性条件が適用可能であり得る：１０〜２５０ｍＭ　ＮａＣｌ、５〜５０ｍＭのＴｒｉｓ　ＨＣｌ、ｐＨ５〜８、２価カチオン（複数可）および／または金属キレート剤および／または非イオン性界面活性剤および／または膜画分および／または消泡剤および／または閃光剤（ｓｃｉｎｔｉｌｌａｎｔ）を任意に添加する。
【００７６】
本明細書中で使用される場合、「リンカー」または「スペーサー」とは、ＤＮＡ結合タンパク質およびランダムペプチドのような２個の分子を接続し、この２個の分子を好ましい配置に位置させるように機能し、例えば、その結果、ランダムペプチドがＤＮＡ結合タンパク質から最少の立体障害でレセプターに結合することができる分子または分子団をいう。
【００７７】
本明細書中で使用される場合、用語「作動可能に連結された」は、機能的関連におけるポリヌクレオチド要素の連結をいう。核酸は、別の核酸配列との機能的関連に配置された場合、「作動可能に連結され」る。例えば、プロモーターまたはエンハンサーは、コード配列の転写を影響する場合、このコード配列に作動可能に連結される。作動可能に連結されるとは、連結されるＤＮＡ配列が典型的に連続し、２つのタンパク質コード領域を結合する必要がある場合に、連続し、リーディングフレーム中にある。
【００７８】
（進化ランダム分子のライブラリー生産）
本発明は、ランダムな位置でのヌクレオチドの欠失、挿入または欠失および挿入の組合せのいずれかを含有するポリヌクレオチドのライブラリーを作製する方法を提供する。実際は、本発明は、相同性または増幅技術を必要とすることなく遺伝的要素を「交換」する手段を提供する。遺伝的要素の交換は高分子、細胞および生物の進化の推進力であることが知られている［Ｏｓｔｅｒｍｅｉｅｒ＆Ｂｅｎｋｏｖｉｃ，Ａｄｖ　Ｐｒｏｔｅｉｎ　Ｃｈｅｍ　５５：２９−７７（２０００）］。ＰＣＲに基づく遺伝子シャッフリングのような現在の技術では、相同性と独立した遺伝的要素を有意に交換することができない。
【００７９】
（欠失）
１つの実施形態では、本発明は、集団のメンバーが単一のランダムな位置での欠失の存在により互いに異なる、ヌクレオチド集団を作製する方法を提供する。本発明の一方法は、例えば、以下の工程：
（ａ）２つの末端を作製するために、複数コピーのポリヌクレオチドの組成物をランダムな位置で切断する工程；
（ｂ）工程（ａ）からの上記ポリヌクレオチドを、上記ポリヌクレオチドの末端のうちの一末端から、少なくとも１個のヌクレオチドを除去するプロセスに供する工程；および
（ｃ）工程（ｂ）からの上記ポリヌクレオチドを、必要に応じて、上記末端を互いに共有結合させ、１つの位置での欠失により他のものと異なる少なくとも１個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスに供する工程、
を包含する。
【００８０】
さらに、本発明は、ポリヌクレオチドの集団を提供し、この集団のメンバーは、単一のランダムな位置での欠失の存在により互いに異なる。欠失が、遺伝的要素の有害または不要な機能の除去を可能にすることが意図される。これらの機能は、プロテアーゼ部位、イオン結合ドメイン、阻害的転写因子に関するＤＮＡ結合配列、タンパク質の免疫原性ドメイン等を含み得る。
【００８１】
さらなる実施形態では、本発明は、例えば、１つより多い位置で欠失を含有するポリヌクレオチドを生成する方法を提供する。１つの方法は、以下の工程：
（ａ）２つの末端を作製するために、ランダムな位置で複数コピーのポリヌクレオチドの組成物を切断する工程；
（ｂ）工程（ａ）からの上記ポリヌクレオチドを、上記ポリヌクレオチドの上記末端から少なくとも１個のヌクレオチドを除去するプロセスに供する工程；および
（ｃ）任意に、工程（ｂ）からの上記ポリヌクレオチドを、上記末端を互いに共有結合させ、１つの位置での欠失により他のものと異なる少なくとも１個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスに供する工程、
を包含する。次いで、所望されるならば、目的の機能が、選択されてもよい（工程（ｄ））。さらに、所望されるならば、工程（ａ）〜（ｃ）または工程（ａ）〜（ｄ）が、１〜５０回以上反復され得る。
【００８２】
さらに、本発明は、１つより多い位置での欠失を含有するポリヌクレオチドの集団を提供する。複数の位置での欠失が、遺伝的要素の多くの有害または不要な機能の除去を可能にすることが意図される。これらの機能は、当業者には十分理解されるように、プロテアーゼ部位、イオン結合ドメイン、阻害的転写因子に関するＤＮＡ結合配列、タンパク質の免疫原性ドメインまたは目的の他の機能の任意の組合せを含み得る。
【００８３】
（挿入）
１つの実施形態では、本発明は、ポリヌクレオチドの集団を作製する方法を提供し、この集団のメンバーは、単一のランダムな位置での挿入の存在により互いに異なる。１つの方法は、以下の工程：
（ａ）２つの末端を作製するために、ランダムな位置でポリヌクレオチドの複数コピーの組成物を切断する工程；
（ｂ）工程（ａ）からの上記ポリヌクレオチドを、上記ポリヌクレオチドの少なくとも１つの末端に、少なくとも１個のヌクレオチドを挿入するプロセスに供する工程；および
（ｃ）任意に、工程（ｂ）からの上記ポリヌクレオチドを、上記末端を互いに共有結合させ、１つの位置での挿入により他のものと異なる少なくとも１個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスを付す工程、
を包含する。
【００８４】
さらに、本発明は、ポリヌクレオチドの集団を提供し、この集団のメンバーは、単一のランダムな位置での挿入の存在により互いに異なる。本発明のこの実施形態は、遺伝的要素に新たな融合を発生させ得る。例えば、毒素は、標的化される分子（例えば、抗体）に融合され得、重要な代謝経路の酵素モジュール（例えば、ポリケチドシンダーゼ（ｓｙｎｔｈｅｔａｓｅ））は、新たな方法で融合され得、または結合ドメイン（すなわち、核酸結合ドメイン、低分子結合ドメインまたはイオン結合ドメイン、プロテアーゼ部位、または他の翻訳後修飾モジュール）のような新たな機能は、、既存の遺伝的要素中に組み込まれ得る。
【００８５】
同様に、別の実施形態では、本発明は、１つより多い位置での挿入を含有するポリヌクレオチドを生成する方法を提供する。１つの方法は、以下の工程：
（ａ）ランダムな位置で複数コピーのポリヌクレオチドの組成物を切断する工程；
（ｂ）工程（ａ）からの上記ポリヌクレオチドを、上記ヌクレオチドの少なくとも１つの上記末端に、少なくとも１個のヌクレオチドを挿入するプロセスに供する工程；および
（ｃ）任意に、工程（ｂ）からの上記ポリヌクレオチドを、上記ＤＮＡ末端を互いに共有結合させ、１つの位置での挿入により他のものと異なる少なくとも１個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスに供する工程；および
（ｄ）任意に、目的の機能を選択する工程、
を包含する。工程（ａ）〜（ｂ）、（ａ）〜（ｃ）または（ａ）〜（ｄ）は、１〜５０回以上繰り返されてもよい。
【００８６】
さらに、本発明は、１つより多い位置での挿入を含有するポリペプチドの集団を提供する。本発明のこの実施形態は、遺伝的要素に複数の新たな融合を発生させ得る。例えば、以下のものは、目的の遺伝子にコンビナトリアル様式で融合され得る；毒素は、標的化される分子（例えば、抗体）に融合され得、重要な代謝経路の酵素モジュール（例えば、ポリケチドシンダーゼ）は、新たな方法で融合され得、または複数の結合ドメイン（すなわち、核酸結合部位、イオン結合ドメイン、プロテアーゼ部位、または他の翻訳後修飾モジュール）のような新たな機能は、既存の遺伝的要素中に組み込まれ得る。
【００８７】
（挿入および欠失の組合せ）
１つの実施形態では、本発明は、ポリヌクレオチドの集団を作製する方法を提供し、この集団のメンバーが単一のランダムな位置での欠失および挿入の存在により互いに異なる。この方法は、以下の工程：
（ａ）２つの末端を作製するために、ランダムな位置で複数コピーのポリヌクレオチドの組成物を切断する工程；
（ｂ）工程（ａ）からの上記ポリヌクレオチドを、上記ポリヌクレオチドの上記末端のうちの１つの末端から、少なくとも１個のヌクレオチドを除去するプロセスに供する工程；
（ｃ）工程（ｂ）からの上記ポリヌクレオチドを、工程（ｂ）からの上記ポリヌクレオチドの上記ＤＮＡ末端のうちの少なくとも１つの末端に、少なくとも１個のヌクレオチドを挿入するプロセスに供する工程；
（ｄ）任意に、工程（ｃ）からの上記ポリヌクレオチドを、上記ＤＮＡ末端を互いに共有結合させ、１つの位置での欠失または挿入により他のものと異なる少なくとも１個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスに供する工程、
を包含する。
【００８８】
さらに、本発明は、ポリペプチドの集団を提供し、そのメンバーが単一のランダムな位置での欠失および挿入の組合せにより互いに異なる。本実施形態は、新たな異種ドメインが目的の遺伝子中のドメインと置き換わることを可能にすることを意図する。これに関して、新たな機能、例えば、リガンド結合または酵素触媒が、遺伝的要素に付与され得る。同様に、ネイティブな機能は、本実施形態を利用して強化され得る。
【００８９】
別の実施形態では、本発明は、１つより多い位置での挿入および欠失を含有するポリヌクレオチドを生成する方法を提供する。この点で、欠失は、挿入とは異なる位置で発生してもよく、または、欠失と挿入は、同じ位置で発生してもよい。さらに、欠失および／または挿入は、複数の位置で発生し得る。本方法は、以下の工程：
（ａ）２つの末端を作製するため、ランダムな位置で複数コピーのポリヌクレオチドの組成物を切断する工程；
（ｂ）工程（ａ）からの上記ポリヌクレオチドを、上記ポリヌクレオチドの上記末端ののうちの１つの末端から、少なくとも１個のヌクレオチドを除去するプロセスに供する工程；
（ｃ）任意に、工程（ｂ）からの上記ポリヌクレオチドを、上記ポリヌクレオチドの上記末端のうちの少なくとも１つの末端に、少なくとも１個のヌクレオチドを挿入するプロセスに供する工程；
（ｄ）任意に、工程（ｃ）からの上記ポリヌクレオチドを、上記末端を互いに共有結合させ、１つの位置での欠失および挿入により他とのもの異なる少なくとも１個のポリヌクレオチドを含有するポリヌクレオチドのライブラリーを生産するプロセスに供する工程；
（ｅ）任意に、目的の機能について選択する工程；および、任意に工程（ａ）〜（ｄ）のいずれかを、１〜５０回以上繰り返す工程、
を含む。
【００９０】
さらに、本発明は、１つより多い位置での挿入および欠失を含有するポリヌクレオチドの集団を提供する。本発明のこの実施形態は、古典的な指向された進化を可能にすることが意図され、この進化では、複数回のランダムな位置での挿入、ランダムな位置での欠失、ならびに挿入および欠失の組合せが生じ、各回の間で遺伝的要素は、必要に応じて選択に供される。本実施形態は、遺伝的要素の機能の改善または改変を可能にする。
【００９１】
（出発材料）
本発明は、研究者にとって目的の任意のポリペプチドに適用可能である。ポリペプチドは、核酸、すなわち、ＲＮＡまたはＤＮＡであってもよい。ポリヌクレオチドは、しばしば、遺伝的要素または１つ以上の目的の遺伝子からなるＤＮＡである。出発材料は、天然の供給源より得ることができるか、あるいは、研究室で合成（例えば、遺伝子合成）されたポリヌクレオチドであっても、研究室で操作された天然の供給源由来のポリヌクレオチドであってもよい。ポリヌクレオチドのいくつかの供給源は、公共のデータバンク、例えば、Ｇｅｎｂａｎｋ（ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ：８０／Ｇｅｎｂａｎｋ／ｉｎｄｅｘ．ｈｔｍｌ）から入手できるか、または、市販されている（Ｃｅｌｅｒａ，Ｒｏｃｋｖｉｌｌｅ，ＭＤ；Ｉｎｃｙｔｅ，Ｐａｌｏ　Ａｌｔｏ，ＣＡ；Ｃｌｏｎｔｅｃｈ，Ｐａｌｏ　Ａｌｔｏ，ＣＡ；Ｉｎｖｉｔｒｏｇｅｎ，Ｃａｒｌｓｂａｄ，ＣＡ）。
【００９２】
核酸は、任意の供給源から、例えば、ｐＢＲ３２２のようなプラスミドから、クローニングされたＤＮＡまたはＲＮＡから、あるいは、細菌、酵母、ウイルスおよび植物または動物のようなより高等生物を含む任意の供給源からの天然のＤＮＡまたはＲＮＡから得られ得る。ＤＮＡまたはＲＮＡは、血液または組織材料から抽出してもよい。鋳型ポリヌクレオチドは、ポリヌクレオチド連鎖反応（ＰＣＲ）を用いた増幅により得てもよい［Ｍｕｌｌｉｓ、米国特許第４，６８３，２０２号（１９８７年）；Ｍｕｌｌｉｓら、米国特許第４，６８３，１９５号（１９８７年）］。あるいは、ポリヌクレオチドは、細胞中に存在するベクター中に存在してもよく、当該分野において公知の方法で細胞を培養し、細胞から核酸を抽出することにより、十分な核酸を得ることができる。
【００９３】
ベクターの選択は、ポリヌクレオチド配列のサイズ、および、本発明の方法で用いられる宿主細胞に依存する。鋳型は、プラスミド、ファージ、コスミド、ファージミド、ウイルス（例えば、レトロウイルス、パラインフルエンザウイルス、ヘルペスウイルス、レオウイルス、パラミクソウイルスなど）、またはそれらの選択された部分（例えば、コートタンパク質、スパイク糖タンパク質、キャプシドタンパク質）であってもよい。例えば、コスミド、ファージミド、ＹＡＣおよびＢＡＣが好ましく、ここで、これらのベクターは大きな核酸フラグメントを安定に増殖させることができるため、変異される特定の核酸配列はより大きい。
【００９４】
特定の核酸配列がベクターにクローニングされる場合、各ベクターを宿主細胞に挿入し、宿主細胞にこのベクターを増幅させることによりクローン増幅され得る。核酸配列の絶対数が増大する一方、変異体の数は増大しないため、これはクローン増幅（ｃｌｏｎａｌ　ａｍｐｌｉｆｉｃａｔｉｏｎ）といわれる。
【００９５】
出発材料は、実質的に純粋な形態であるべきである。ポリヌクレオチドは、二本鎖でも一本鎖でもよいが、より好ましいのは二本鎖である。さらに、ポリヌクレオチドは、線状でも環状でもよいが、好ましい実施形態では、ポリヌクレオチドは環状である。環状形態のポリヌクレオチドは、当業者に周知の技術により、細菌、酵母、植物、または哺乳動物の細胞ののような生物由来のプラスミドＤＮＡの調製により調製されてもよい［Ｍａｎｉａｔｉｓら、（１９８９）］。反応容器内の種々の特定の核酸フラグメントの数は、少なくとも約１００個、好ましくは少なくとも約５００個、より好ましくは少なくとも約１０００個である。
【００９６】
出発材料（すなわち、ポリヌクレオチド）は、実質的に純粋な形態であるものの、ホモログまたは関連配列無しで同様に存在し得る。換言すると、最初の容器中のポリヌクレオチドはすべて同一であり得るが、これらはまた関連しているか、関連していない、すなわち異種であり得る。実際、本発明の実施は、出発材料の配列により影響されることはない。さらに、出発材料の配列は、既知であっても既知でなくてもよい。指向された進化の目的のため、必要とされるものは、ポリペプチドの機能を検出する方法（例えば、スクリーニングアッセイ）だけである。
【００９７】
（ランダムな位置でのポリヌクレオチドの切断）
概して、核酸フラグメントは、多くの異なる方法で切断されてもよい。核酸フラグメントは、容易に入手可能なＤＮＡｓｅＩ、Ｓ１ヌクレアーゼ、Ｐ１または大豆ヌクレアーゼ、あるいはＲＮＡｓｅのようなヌクレアーゼで消化され得る。他の酵素、例えば、ＲＡＧ１およびＲＡＧ２、トポイソメラーゼおよびインテグラーゼは、ポリヌクレオチドを切断することができる。核酸は、超音波処理法により、または小型のオリフィス（ｏｒｉｆｉｃｅ）を有するチューブに通すことにより、ランダムに剪断され得る。照射（例えば、γ線照射または紫外線照射）の使用もまた、ポリヌクレオチドを切断することができる。化学薬剤（例えば、ブレオマイシンまたはメタンスルホン酸メチル（ＭＭＳ））もまた、ポリヌクレオチドを切断できる。
【００９８】
挿入または欠失を含有する、機能的に変異した遺伝子の生成について実質的な重要なことは、ポリヌクレオチドを少ない回数、通常は、１回と１０回との間、好ましくは１回と５回との間、最も好ましくは１回切断することである。本発明は、反応容器中で１個のポリヌクレオチド当り１つの位置でのみ切断が起こるようにポリヌクレオチドを切断するための手段を提供する。重要なことは、本発明が、ポリヌクレオチドのほぼランダムな切断（すなわち、異なる分子中のいくつかの異なる位置での切断）のための手段を提供することである。切断は、二本鎖または一本鎖で起こり得る（すなわち、一本鎖末端または二本鎖末端を生じる）。ポリヌクレオチドを切断できる酵素の例は、ＤＮａｓｅＩ、Ｓ１ヌクレアーゼ、Ｐ１ヌクレアーゼだけでなく、トポイソメラーゼ、トランスポゾン、およびインテグラーゼを含む。切断は、トポイソメラーゼ、トランスポゾンおよびインテグラーゼなどの酵素を用いて、一過的に発生し得る。これらの酵素はポリヌクレオチドを一回または２回以上切断する。Ｓ１ヌクレアーゼは、通常ランダムな様式で二本鎖または一本鎖ポリヌクレオチドを切断するのに使用され得る。好ましい実施形態では、環状の二本鎖ＤＮＡについて、Ｓ１ヌクレアーゼがポリヌクレオチドを１回だけ切断し、２つのＤＮＡ末端を生じる（図４）。
【００９９】
高い頻度で（すなわち、ポリヌクレオチド内のいくつかの位置で）ＤＮＡを切断する１つ以上の制限酵素を用いて、特定のポリヌクレオチドが１回だけ切断され、得られる集団が、１回だけ切断されたが、異なる位置で切断された異なるポリヌクレオチドを有するポリヌクレオチドを含有するように、核酸も部分的に消化され得ることもまた意図される。制限酵素を用いた切断は、完全にランダムではないかもしれないが、目的の遺伝的要素が異なった位置に十分に特異的な制限部位を有さない場合には、切断パターンは、実質的な多様性を生成するのに十分有用であり得る。
【０１００】
ポリヌクレオチドの一回の切断は、通常ポリヌクレオチドを数回切断する他の代替的機構を介して達成され得ることが意図される。ポリヌクレオチドは、超音波処理法により、または、小型のオリフィスを有するチューブに通すことにより、ランダムに剪断され得る。照射（例えば、γ線照射または紫外線照射）の使用もまた、ポリヌクレオチドを切断可能である。これらの様式のいずれかが注意深く滴定され、精製手段が使用される場合、一回切断された分子を、実質的に純粋な形態で得ることができる（すなわち、一回切断された分子は、切断されていないかまたは複数に切断された分子から分離させて精製することができる）。
【０１０１】
さらに、ＤＮＡを切断しかつ再結合させるよう作用する酵素（例えば、トポイソメラーゼ、トランスポゾンおよびインテグラーゼ）は、ポリヌクレオチドを効果的に切断するために用いられ得る［Ｓｉｎｇｈら、Ｐｒｏｃ　Ｎａｔｌ　Ａｃａｄ　Ｓｃｉ　９４：１３０４−９（１９９７）］。これらの場合、切断工程および再結合工程はあわせられ得る。好ましくは、ＤＮＡ末端が連結されるか、または切断の後、互いに物理的に接近している。これは、欠失事象または挿入事象の後に、間違った末端が互いに再連結することを防ぐためである。結合された末端を維持する１つの機構は、出発材料としての環状ポリヌクレオチドの使用によるものである。この場合、末端は、介在するポリヌクレオチド鎖により連結される。このため、再連結は、分子間に対して、分子内事象であり、そしてより高い効率で進行する。末端を接近状態に保つ他の機構は、タンパク質の架橋（例えば、クロマチン（すなわち、ヒストンまたは他のＤＮＡ結合タンパク質）を介するか、または再連結と切断とを一緒にする酵素（例えば、トランスポゾン、インテグラーゼまたはトポイソメラーゼ）を介する）である。あるいは、末端は、固体支持体に反対の末端（非切断末端）の連結を介して、互いに接近状態のままであると考えられ得る。
【０１０２】
スーパーコイルプラスミドＤＮＡから構成される環状ポリペプチドの切断は、０．１〜１００μｇ、好ましくは１〜１０μｇで、Ｓ１ヌクレアーゼのようなヌクレアーゼとともにインキュベートすることにより達成され得る。ヌクレアーゼは、１０μｌの反応物中で、０．１〜１０００ユニット、好ましくは１〜１００ユニットの量で存在し得る。反応温度は、０℃と１００℃との間、好ましくは４℃と５０℃との間であってもよい。反応時間は、３０秒〜１時間で変化させることができるが、好ましくは約１分と３０分との間である。線状化の程度は、図４のような、アガロースゲル上でプラスミドＤＮＡを分析することにより測定することができる。線状ＤＮＡは、好ましくは、当業者に周知の多数の方法のいずれかにより、切断されていないＤＮＡから精製されるべきである。このような方法は、アガロースゲル精製キット（Ｑｉａｇｅｎ，Ｖａｌｅｎｃｉａ，ＣＡ）、ＨＰＬＣ、カラムクロマトグラフィーなどの利用を含む。
【０１０３】
（ヌクレオチドの欠失）
ヌクレオチドの欠失は、種々の方法により、ＤＮＡ末端で生成され得る。例えば、エキソヌクレアーゼ、例えば、エキソヌクレアーゼＩＩＩは、ＤＮＡ末端から３’から５’方向でヌクレオチドを除去するために用いられ得る。次いで、得られるＤＮＡ末端は、一本鎖エンドヌクレアーゼ、例えば、Ｐ１ヌクレアーゼ、Ｓ１ヌクレアーゼまたは大豆ヌクレアーゼを用いたＤＮＡの消化により除去され得る、５’オーバーハングを含有する。Ｂａｌ３１ヌクレアーゼは、５’から３’だけでなく３’から５’の核分解（ｎｕｃｌｅｏｌｙｔｉｃ）活性を有する酵素であり、ＤＮＡ末端からヌクレオチドを欠失させるために用いられ得る。さらに、いくつかのヌクレアーゼ、例えば、Ｅ．ｃｏｌｉ由来のＤＮＡポリメラーゼ、ＫｌｅｎｏｗフラグメントおよびＴａｑポリメラーゼは、エキソヌクレアーゼ活性を有し、ＤＮＡ末端からの欠失の作製に用いられ得ると考えられ得る。すべての生物からの細胞抽出物は、ヌクレオチドを欠失させるよう作用することができるＤＮＡ修復酵素を含有し、したがって、純粋ではない細胞抽出物が、エキソヌクレアーゼ活性の供給源として用いられ得ると考えられ得る。特定の条件下ではエキソヌクレアーゼ活性を有し得ない他のヌクレアーゼは、他の条件下ではＤＮＡ末端での欠失を生じ得る。例えば、Ｓ１ヌクレアーゼは、高い酵素濃度で用いられると、短い欠失を生じることができる。さらに、ＤＮＡ末端が「解ける（ｆｒａｙｅｄ）」ような、ＤＮＡ分子の穏やかな変性は、一本鎖ヌクレアーゼ、例えば、Ｓ１ヌクレアーゼ、Ｐ１ヌクレアーゼまたは大豆ヌクレアーゼの適用の際に欠失を発生させることが意図される。
【０１０４】
好ましい実施形態では、欠失反応の条件は、各ＤＮＡ末端で発生する個々の欠失の数が十分制御され得るように設定される。例えば、塩濃度を変え、ｐＨを変え、温度を変え、または反応の他の任意の生化学的パラメータを変えることにより、多少の欠失が研究者の意図に従って発生するように、ヌクレアーゼ酵素の活性を変化させることができる（例えば、温度を低下させるか、または塩を増大させることにより、エキソヌクレアーゼの処理能力（ｐｒｏｃｅｓｓｉｖｉｔｙ）を低下させ、より少ない欠失を発生させることができる）。図５は、異なる数の欠失をＤＮＡ末端に発生させることが可能な、条件の変更を示す。いくつかの場合、大きな欠失（すなわち、遺伝的要素中の大きなドメインが完全に除去される）が保証され得、他の場合、小さな欠失（すなわち、単一のアミノ酸、またはプロテアーゼ部位を含むもののような数個のアミノ酸が除去される）が好ましい。概して、欠失は、１〜１０００個の数で得ることができ、より好ましくはこれらは１〜１００個である。特定の場合には、記載されるように、欠失は、１〜１０個の数であってもよい。
【０１０５】
ポリヌクレオチド中のランダムな位置での切断のために、得られるポリヌクレオチド中の欠失の位置はまた、ランダムな位置に配置される。また、残基が分子の一方の末端から欠失されるので、欠失の総数は、５’末端および３’末端で発生する欠失の合計に等しい。
【０１０６】
（ヌクレオチドの付加）
ランダムな位置のポリヌクレオチドに付加を作製するため、ポリヌクレオチドは、上述のように、必然的にランダムな位置で切断される。挿入の前に、ヌクレオチドが切断事象の間に生産されるＤＮＡ末端から欠失されてもよい。また、切断反応により形成されるＤＮＡ末端は、新たなヌクレオチドまたはポリヌクレオチドが付加される基質として用いられててもよい。
【０１０７】
いくつかの異なる機構が、ポリヌクレオチドの末端にヌクレオチドを付加するために存在する。例えば、ヌクレオチドは、化学的カップリングにより付加され得る。ポリメラーゼ、例えば、末端デオキシヌクレオチジルトランスフェラーゼは、ＤＮＡ末端にヌクレオチドをセミランダムな様式で付加するために用いられ得る［Ｇａｕｓｓ＆Ｌｉｅｂｅｒ，Ｍｏｌ　Ｃｅｌｌ　Ｂｉｏｌ　１９９６　１６：２５８−６９（１９９６）］。また、切断工程は、トランスポゾンまたはインテグラーゼを挿入事象に用いる場合があり得るように、挿入事象と一緒にされ得る。
【０１０８】
Ｅ．ｃｏｌｉリガーゼまたはファージＴ４リガーゼのようなリガーゼが、新たなポリヌクレオチドを親ポリヌクレオチドに共有結合させるために用いられ得る。好ましい実施形態では、ポリヌクレオチドは、遺伝的要素または遺伝的要素のフラグメントである。遺伝的要素は本質的にいくつかの方法で機能的であるので、遺伝的要素によって、得られるポリヌクレオチドが機能を有しやすくなる。遺伝的要素は、遺伝子、遺伝子の調節要素、または有用なドメインをコードする遺伝的要素であり得る。遺伝的要素は、ｃＤＮＡライブラリーまたはゲノムＤＮＡライブラリーなどの遺伝的要素のライブラリーであり得る。遺伝的要素のフラグメントは、ポリヌクレオチドをヌクレアーゼ、例えば、ＤＮＡｓｅＩ、Ｓ１ヌクレアーゼ、Ｐ１または大豆ヌクレアーゼ、あるいはＲＮＡｓｅを用いて消化することにより生産され得る。他の酵素、例えば、制限酵素およびトポイソメラーゼもまた、ポリヌクレオチドをフラグメントに切断し得る。ポリヌクレオチドは、超音波処理法により、または小型のオリフィスを有するチューブに通すことにより、ランダムに剪断され得る。照射（例えば、γ線照射または紫外線照射）の使用もまた、ポリヌクレオチドをフラグメントに切断し得る。化学薬剤（例えば、ブレオマイシンまたはＭＭＳ）もまた、ポリヌクレオチドをフラグメントに切断し得る。
【０１０９】
遺伝的要素の集団または遺伝的要素のフラグメントを有するランダムな位置で切断された親ポリヌクレオチドと、Ｔ４　ＤＮＡリガーゼのようなリガーゼとを、適当な塩、緩衝液および温度条件下で混合することにより、遺伝的要素が親ポリヌクレオチドと元の切断事象の位置で共有結合することができることが意図される。したがって、親ポリヌクレオチド内のランダムな位置での挿入を含むポリヌクレオチドの混合物が生産される。各挿入の内容（すなわち、配列）は、遺伝的要素または遺伝的要素のフラグメントが同一である場合には同一であり得、遺伝的要素のフラグメントが非同一である場合には異なる。
【０１１０】
（ＤＮＡ末端の再結合）
ＤＮＡ末端は、ＤＮＡ末端を、ＤＮＡ末端でヌクレオチド間にホスホジエステル結合を形成させる、ＤＮＡリガーゼのような酵素とともにインキュベートすることにより、共有結合的に再結合され得る。リガーゼの例には、Ｅ．ｃｏｌｉ　ＤＮＡリガーゼ、ファージＴ４　ＤＮＡリガーゼまたはヒトＤＮＡリガーゼが含まれる。これらの酵素は、当業者に周知の条件下で、ＤＮＡの連結に用いられ得る。他の酵素もまた、ＤＮＡ末端でヌクレオチド間に共有結合（ホスホジエステル結合のような）を作製することができる。このような酵素は、トポイソメラーゼ、トランスポゾン、インテグラーゼ、および他の再結合酵素である。他の機構が、ＤＮＡ末端の結合に用いられ得、例えば、いずれの末端（すなわち、５’および３’末端の両方）の配列にハイブリダイズして、これらの末端を水素結合で「架橋」し得る配列のオリゴヌクレオチドの利用が用いられ得る。反対側の鎖上の介在配列は、ポリメラーゼ、例えば、Ｅ．ｃｏｌｉポリメラーゼ、Ｋｌｅｎｏｗフラグメント、ファージＴ４ポリメラーゼまたはＴａｑポリメラーゼで満たされ得る。次いで、ニックは、上述にように、ＤＮＡリガーゼにより修復され得る。細胞抽出物もまた、リガーゼ活性を有し、細胞または核抽出物はＤＮＡ末端の再結合に用いられ得る。あるいは、ＤＮＡ分子は、無傷細胞中に導入され得、細胞の機構がＤＮＡ末端を相同的または非相同的に手段により再結合させ得る。
【０１１１】
（ライブラリー組成物）
本発明は、以下の組成物を例とする新規なライブラリーを提供する。
【０１１２】
（欠失）
本発明は、ポリヌクレオチドの集団を提供し、この集団のメンバーは、単一のランダムな位置での欠失の存在により互いに異なる。このような単一の欠失のライブラリーは、少なくとも２個の分子、好ましくは１００個の分子、最も好ましくは少なくとも約１０００個の分子を含み得る。欠失ライブラリーは、１つのランダムな位置での少なくとも１個のヌクレオチドの欠失により少なくとも１個の他の分子と異なる、少なくとも１個の分子を含むべきである。各位置での欠失の数は、１〜１０００個であり得るが、少なくとも１個であるべきである。欠失が、遺伝的要素の有害または不要な機能の除去を可能にすることが意図される。これらの機能には、プロテアーゼ部位、イオン結合ドメイン、阻害的転写因子のためのＤＮＡ結合配列、タンパク質の免疫原性ドメインなどが含まれ得る。
【０１１３】
さらに、本発明は、１つより多い位置での欠失を含有するポリヌクレオチドの集団を提供する。このようなライブラリーは、少なくとも２個の分子、好ましくは１００個の分子、最も好ましくは少なくとも約１０００個の分子を含むべきである。これらの複数の欠失ライブラリーは、１つより多いランダムな位置での少なくとも１個のヌクレオチドの欠失により少なくとも１個の他の分子と異なる、少なくとも１個の分子を含むべきである。複数の位置での欠失が、遺伝的要素の複数の有害または不要な機能の除去を可能にすることが意図される。これらの機能には、複数のプロテアーゼ部位、イオン結合ドメイン、阻害的転写因子のためのＤＮＡ結合配列、タンパク質の免疫原性ドメインなどの任意の組合せが含まれ得る。
【０１１４】
（挿入）
本発明は、ポリヌクレオチドの集団を提供し、この集団のメンバーは、単一のランダムな位置での挿入の存在により互いに異なる。挿入ライブラリーは、少なくとも２個の分子、好ましくは１００個の分子、最も好ましくは少なくとも約１０００個の分子を含み得る。挿入ライブラリーは、１つのランダムな位置での少なくとも１個のヌクレオチドの挿入により少なくとも１個の他の分子と異なる、少なくとも１個の分子を含むべきである。各位置での挿入の数は、１〜１０，０００個であってもよいが、好ましくは少なくとも１個である。例えば、毒素は、標的化された分子（例えば、抗体）に融合され得、重要な代謝経路の酵素モジュール（例えば、ポリケチドシンダーゼ）は、新たな方法で融合され得、または、結合ドメイン（すなわち、核酸結合ドメイン、イオン結合ドメイン、プロテアーゼ部位または他の翻訳後修飾モジュール）のような新たな機能は、既存の遺伝的要素中に組み込まれ得る。
【０１１５】
さらに、本発明は、１つより多い位置での挿入を含有するポリヌクレオチドの集団を提供する。このようなライブラリーは、少なくとも２個の分子、好ましくは１００個の分子、最も好ましくは少なくとも約１０００個の分子を含むべきである。これらの複数の挿入ライブラリーは、１つより多いランダムな位置での少なくとも１個のヌクレオチドの挿入により少なくとも他の１個の分子と異なる少なくとも１個の分子を含むべきである。本発明のこの実施形態により、遺伝的要素の新規な融合が発生可能となることが意図される。本発明のこの実施形態により、遺伝的要素の複数の新たな融合が発生可能となることが意図される。例えば、以下のものは、コンビナトリアル様式で、目的の遺伝子に融合され得る：毒素は、標的化された分子（例えば、抗体）に融合され得、重要な代謝経路の酵素モジュール（例えば、ポリケチドシンダーゼ）は、新たな方法で融合され得、または、結合ドメイン（すなわち、核酸結合ドメイン、イオン結合ドメイン、プロテアーゼ部位または他の翻訳後修飾モジュール）は、既存の遺伝的要素中に組み込まれ得る。
【０１１６】
（挿入および欠失の組合せ）
本発明は、ポリヌクレオチドの集団を提供し、そのメンバーは、単一のランダムな位置での欠失および挿入の組合せによって互いに異なる。このようなライブラリーは、少なくとも２個の分子、好ましくは１００個の分子、最も好ましくは少なくとも約１０００個の分子を含むべきである。これらの組合せライブラリーは、１つのランダムな位置での１個のヌクレオチドの挿入および少なくとも１個のヌクレオチドの欠失によって少なくとも１個の他の分子と異なる、少なくとも１個の分子を含むべきである。本実施形態により、異種ドメインを、目的の遺伝子中のドメインと置き換えることが可能となることが意図される。これに関して、新たな機能（例えば、リガンド結合または酵素触媒）が遺伝的要素に付与され得る。また、ネイティブな機能が、本実施形態を利用して強化され得る。
【０１１７】
さらに、本発明は、１つより多い位置での挿入および欠失を含有するポリヌクレオチドの集団を提供する。このようなライブラリーは、少なくとも２個の分子、好ましくは１００個の分子、最も好ましくは少なくとも約１０００個の分子を含むべきである。これらの組合せライブラリーは、１つのランダムな位置での少なくとも１個のヌクレオチドの挿入、および、１つのランダムな位置での少なくとも１個のヌクレオチドの欠失により、少なくとも１個の他の分子と異なる少なくとも１個の分子を含むべきである。本発明のこの実施形態により、古典的な指向された進化が可能となり、この進化では、ランダムな位置での複数回の挿入、ランダムな位置での欠失、および挿入と欠失の組合せからが生じ、各回の間で目的の遺伝子は、必要に応じて選択に供される。本実施形態により、遺伝的要素の機能の改善または変更が可能となる。
【０１１８】
（組成物の分析）
このようなライブラリーの組成物は、当業者に周知の機構により決定され得る。ライブラリーが挿入または欠失を含むか否かを判定するため、このライブラリーは、アガロースまたはアクリルアミドゲルの電気泳動によって分析されることが可能であり、サイズは、親配列と比較可能である。他の方法、例えば、ＨＰＬＣ、質量分析、カラムクロマトグラフィーは、ポリヌクレオチド間のサイズの差を同定するために使用され得る。本発明は、ランダムな位置の挿入または欠失に関するので、ライブラリーの組成物を決定するための最も明確な方法は、組成物内の典型的なポリヌクレオチドを配列決定に供することであり、この方法は当業者に周知である。典型的なクローンの配列の比較により、欠失または挿入が、ライブラリーの異なった分子中のランダムな位置で発生したかどうかを判定することができる。
【０１１９】
得られるライブラリーは、ライブラリー内に含まれる、得られた変異体を発現するためのビヒクルとして用いるための発現ベクター内に連結することができる。発現ベクターの性質は、「スクリーニング」の項において後述する。
【０１２０】
（目的の機能に関するスクリーニング）
目的の機能に関するポリヌクレオチドのライブラリーの試験では、ライブラリーは、適当な発現ベクター中に挿入されるべきである。あるいは、ライブラリーは、発現ベクター中に構築され得る（すなわち、ライブラリーが発現ベクターを含む）。クローニングに用いられるベクターは、所望のサイズのＤＮＡフラグメントを受容する限り、重要ではない。ＤＮＡフラグメントの発現が所望される場合には、クローニングビヒクルは、宿主細胞中のＤＮＡフラグメントの発現を可能にするために、ＤＮＡフラグメントの挿入部位の隣に転写シグナルおよび翻訳シグナルをさらに含むべきである。細菌細胞でのスクリーニングのために好ましいベクターには、プラスミドのｐＵＣシリーズおよびｐＢＲシリーズが含まれる。
【０１２１】
得られる細菌集団は、ランダム変異を有する、多くの組換えＤＮＡフラグメントを含む。この混合された集団を試験して、所望の組換え核酸フラグメントを同定し得る。選択方法は、所望のＤＮＡフラグメントに依存する。
【０１２２】
ベクターの選択は、本発明の方法に用いられるべきポリヌクレオチド配列のサイズおよび宿主細胞に依存する。鋳型は、プラスミド、ファージ、コスミド、ファージミド、ウイルス（例えば、レトロウイルス、パラインフルエンザウイルス、ヘルペスウイルス、レオウイルス、パラミクソウイルスなど）またはこれらの選択された部分（例えば、コートタンパク質、スパイク糖タンパク質、キャプシドタンパク質）であってもよい。特定の核酸配列が比較的大きい場合、これらのベクターは、より大きな核酸フラグメントを安定に遺伝させるので、例えば、コスミド、ファージミド、ＹＡＣおよびＢＡＣが好ましい。
【０１２３】
リガンドに対して増加された結合効率を有するタンパク質をコードするＤＮＡフラグメントが所望される場合、集団またはライブラリー中のＤＮＡフラグメントの各々により発現されるタンパク質を、当該分野において公知の方法（すなわち、パンニング、アフィニティクロマトグラフィー）により、リガンドに対する結合能力に関して試験することができる。増加された薬剤耐性を有するタンパク質をコードするＤＮＡフラグメントが所望される場合、集団またはライブラリー中のＤＮＡフラグメントの各々により発現されるタンパク質を、宿主生物に薬剤耐性を付与する能力に関して試験することができる。所望のタンパク質についての知識が与えられた当業者は、容易に集団を試験し、タンパク質に所望の特性を有するＤＮＡフラグメントを同定できる。
【０１２４】
本発明の状況において、用語「陽性のポリペプチド改変体」は、対応する導入（ｉｎｐｕｔ）ＤＮＡ配列から生産可能なポリペプチドと比較して改善された機能特性を有する、得られたポリペプチド改変体を意味する。このような改善された特性の例は、例えば、強められるか、または弱められた生物学的活性、増大された洗浄性能、熱安定性、酸化安定性、基質特異性、抗生物質耐性あるいは目的であり得る他の特性と同様に異なってもよい。
【０１２５】
したがって、陽性改変体の同定のために用いられるべきスクリーニング方法は、変化が望まれる問題のポリペプチドの特性、および、その変化が望まれる方向にあるポリペプチドの特性に依存する。
【０１２６】
所望の生物学的活性について選択するための、多くの適したスクリーニング系または選択系が、当該分野において記載されている。例えば、Ｓｔｒａｕｓｂｅｒｇら［Ｓｔｒａｕｓｂｅｒｇら、Ｂｉｏｔｅｃｈｎｏｌｏｇｙ（ＮＹ）１３：６６９−７３（１９９５）］は、カルシウム依存的安定性を有するサブチリシン改変体に対するスクリーニング系を記載している。Ｂｒｙａｎら［Ｂｒｙａｎら、Ｐｒｏｔｅｉｎｓ　１：３２６−３４（１９８６）］は、強められた熱安定性を有するプロテアーゼに関するスクリーニングアッセイを記載している。
【０１２７】
当業者であれば、タンパク質のフラグメントがファージ表面上に融合タンパク質として発現される、ファージディスプレイ系（Ｐｈａｒｍａｃｉａ，Ｍｉｌｗａｕｋｅｅ，Ｗｉｓ．）を使用できることが意図される。組換えＤＮＡ分子は、その一部が組換えＤＮＡ分子によりコードされる、融合タンパク質の転写をもたらす部位でファージＤＮＡにクローニングされる。組換え核酸分子を含有するファージは、細胞での複製および転写を受ける。融合タンパク質のリーダー配列は、融合タンパク質の、ファージ粒子の先端への輸送を指向する。このため、組換えＤＮＡ分子により部分的にコードされる融合タンパク質は、ファージ粒子上に表示され、上述の方法により検出および選択される。
【０１２８】
（核酸中の標的化された短い欠失に影響する方法）
ポリヌクレオチドに短い欠失を作る能力は、通常、ＤＮＡ末端で作用するエキソヌクレアーゼの高い活性および処理能力により阻害される。ＤＮＡ末端における大きな（すなわち、１００塩基より多い）欠失を作るためのいくつかの方法が存在する［Ｓａｍｂｒｏｏｋら、（１９８９）］。しかし、１〜１００塩基などの短い欠失、または、１〜１０塩基のような非常に短い欠失を制御された様式で作る方法は、可能ではない。特定の部位にこのような欠失を作る能力は、タンパク質工学の分野において重要であり［Ａｌｔａｍｉｒａｎｏら、Ｎａｔｕｒｅ　４０３：６１７−２２（２０００）］、Ｖ（Ｄ）Ｊ組換え法の末端結合機構において強調されており、この方法は、抗体遺伝子に実質的多様性をもたらす［Ｓｍｉｄｅｒ＆Ｃｈｕ，Ｓｅｍ．Ｉｍｍｕｎ．９：１８９−９７（１９９７）］。
【０１２９】
（出発材料）
この欠失生成機構は、研究者にとって目的の、任意のポリペプチドに適用され得る。ポリヌクレオチドは、核酸、すなわち、ＲＮＡまたはＤＮＡであってもよい。ポリヌクレオチドは、遺伝的要素、あるいは１つまたは複数の目的の遺伝子からなるＤＮＡである場合が多い。出発材料は、天然の供給源から得てもよく、または、研究室で合成（例えば、遺伝子合成）されたポリヌクレオチドであっても、研究室で操作された天然の供給源由来のポリヌクレオチドであってもよい。ポリヌクレオチドのいくつかの供給源は、Ｇｅｎｂａｎｋ（ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ：８０／Ｇｅｎｂａｎｋ／ｉｎｄｅｘ．ｈｔｍｌ）などの公共のデータバンクを介して入手可能であるか、または、市販されている（Ｃｅｌｅｒａ，Ｒｏｃｋｖｉｌｌｅ，ＭＤ；Ｉｎｃｙｔｅ，Ｐａｌｏ　Ａｌｔｏ，ＣＡ；Ｃｌｏｎｔｅｃｈ，Ｐａｌｏ　Ａｌｔｏ，ＣＡ；Ｉｎｖｉｔｒｏｇｅｎ，Ｃａｒｌｓｂａｄ，ＣＡ）。
【０１３０】
核酸は、任意の供給源から、例えば、ｐＢＲ３２２などのプラスミドから、クローニングしたＤＮＡまたはＲＮＡから、あるいは、細菌、酵母、ウイルスおよび植物または動物などの高等生物を含む任意の供給源由来の天然のＤＮＡまたはＲＮＡから得ることができる。ＤＮＡまたはＲＮＡは、血液材料または組織材料から抽出され得る。鋳型ポリヌクレオチドは、ポリヌクレオチド連鎖反応（ＰＣＲ）を用いた増幅によって得られ得る［Ｍｕｌｌｉｓ、米国特許第４，６８３，２０２号（１９８７年）；Ｍｕｌｌｉｓら、米国特許第４，６８３，１９５号（１９８７年）］。また、ポリヌクレオチドは、細胞中に存在するベクター中に存在してもよく、この細胞を培養し、当該分野において公知の方法によって、細胞から核酸を抽出することにより、十分な核酸が得られ得る。
【０１３１】
（ヌクレオチドの欠失）
ヌクレオチドの欠失は、種々の手段によりＤＮＡ末端において生成され得る。例えば、エキソヌクレアーゼＩＩＩなどのエキソヌクレアーゼを用いて、ＤＮＡ末端から３’から５’方向にヌクレオチドを除去することができる。得られるＤＮＡ末端は、Ｐ１ヌクレアーゼ、Ｓ１ヌクレアーゼ、または大豆ヌクレアーゼなどの一本鎖エンドヌクレアーゼを用いるＤＮＡの消化により除去され得る５’オーバーハングを含有する場合が多い。他のエキソヌクレアーゼもまた、本発明において用いられ得る。Ｂａｌ３１ヌクレアーゼは、５’から３’の核分解活性ならびに３’から５’の核分解活性を有する酵素であり、ＤＮＡ末端からヌクレオチドを欠失させるために用いられ得る。エキソヌクレアーゼＴは、３’から５’の方向にヌクレオチドを除去し得る。エキソヌクレアーゼ７は、５’から３’方向のヌクレオチドを除去し得、ニックまたはギャップのように一本鎖末端で作用し得る。エキソヌクレアーゼＩは、３’から５’方向での一本鎖ＤＮＡからのヌクレオチドの除去を触媒する。λエキソヌクレアーゼは、５’から３’方向に作用し、二重鎖ＤＮＡからの５’モノヌクレオチドの除去を触媒する、非常に進行性の酵素である。ＲｅｃＪは、５’から３’方向にＤＮＡからのデオキシヌクレオチドモノリン酸の除去を触媒する、一本鎖ＤＮＡ特異的エキソヌクレアーゼである。さらに、いくつかのポリメラーゼ、例えば、Ｅ．ｃｏｌｉ由来のＤＮＡポリメラーゼＩ、Ｋｌｅｎｏｗフラグメント、およびＴａｑポリメラーゼは、エキソヌクレアーゼ活性を有し、ＤＮＡ末端から欠失を作るのに使用可能であると考えられ得る。すべての生物由来の細胞抽出物は、ヌクレオチドを欠失させるように作用し得るＤＮＡ修復酵素を含有し、したがって、不純な細胞抽出物が、エキソヌクレアーゼ活性の源として使用可能であると考えられ得る。特定の条件下ではエキソヌクレアーゼ活性を有し得る他のヌクレアーゼは、他の条件下ではＤＮＡ末端での欠失を生産し得る。例えば、Ｓ１ヌクレアーゼは、高い酵素濃度で使用されると、短い欠失を生産し得る。さらに、ＤＮＡ末端が「解ける」ような、ＤＮＡ分子の穏やかな変性により、一本鎖エンドヌクレアーゼ、例えば、Ｓ１ヌクレアーゼ、Ｐ１ヌクレアーゼまたは大豆ヌクレアーゼの適用の際に、欠失の発生が可能になる。
【０１３２】
好ましい実施形態では、欠失反応の条件は、各ＤＮＡ末端で発生する個々の欠失の数が、十分制御され得るように設定される。例えば、塩濃度および温度を変え、ｐＨを変え、または、反応の他の任意の生物学的パラメータを変えることにより、多少の欠失が研究者の目的に依存して発生するように、ヌクレアーゼの酵素活性を変えることができる。最も際立って、かつ驚くべきことに、本発明者らは、温度を低下させること、および／または、塩を増大させることにより、エキソヌクレアーゼの処理能力を低下させ、より制御された小さい欠失が得られることを見出した。反応に用いられる塩は、いかなる塩であってもよい。塩の例としては、塩化ナトリウム、酢酸ナトリウム、塩化カリウムまたは酢酸カリウムが挙げられる。好ましくは、塩は、塩化ナトリウムまたは塩化カリウムのいずれかである。塩濃度は、１０ｍＭ〜１．０Ｍの範囲であり得るが、好ましくは５０ｍＭと５００ｍＭとの間である。反応温度も、本発明では、変化し得る。温度は、０℃〜３０℃の範囲であり得るが、好ましくは０℃と２４℃との間である。図５は、異なった数の欠失をＤＮＡ末端上に発生させ得る、条件の変更を示す。いくつかの場合、大きな欠失（すなわち、遺伝的要素中の大きなドメインを完全に除去すること）が保証され得、他の場合、小さな欠失（すなわち、単一のアミノ酸、または、プロテアーゼ部位を含むものなどの数個のアミノ酸を除去すること）が好ましくあり得る。得られるポリヌクレオチドの集団は、開始配列の末端に、種々の量の欠失を含む。概して、欠失は、１〜１０００個の数で得ることができ、より好ましくはその数は１〜１００個である。好ましい実施形態では、欠失は、１〜３０個、または、ひいては１〜１０個の数であり得る。
【０１３３】
（ＤＮＡ末端の再結合）
いくつかの場合、欠失を含有する分子のＤＮＡ末端を、第２のＤＮＡ末端と結合させて、これにより、今度は欠失が内部位置で発生させることが有用であり得る。連結されるべき２つの末端が同一のＤＮＡ分子に存在することが多く、その結果、得られる接続産物は環状ポリヌクレオチドである。ＤＮＡ末端でヌクレオチド間にホスホジエステル結合を形成させるＤＮＡリガーゼのような酵素とともにＤＮＡ末端をインキュベートすることにより、ＤＮＡ末端は、再結合され得る。リガーゼの例としては、Ｅ．ｃｏｌｉ　ＤＮＡリガーゼ、ファージＴ４　ＤＮＡリガーゼ、またはヒトＤＮＡリガーゼが挙げられる。これらの酵素は、ＤＮＡを連結するための当該分野において周知の条件下で用いられ得る。他の酵素もまた、ＤＮＡ末端でヌクレオチド間に共有結合（ホスホジエステル結合のような）を作ることができる。このような酵素は、トポイソメラーゼ、トランスポゾン、インテグラーゼ、および他の組換え酵素である。他の機構（例えば、その配列がいずれかの末端（すなわち、５’および３’末端の両方）の配列とハイブリダイズして、末端同士を水素結合で「架橋」することのできるオリゴヌクレオチドの使用）が、ＤＮＡ末端の結合に使用可能である。対向する鎖上の介在配列は、ポリメラーゼ、例えば、Ｅ．ｃｏｌｉポリメラーゼ、Ｋｌｅｎｏｗフラグメント、ファージＴ４ポリメラーゼ、またはＴａｑポリメラーゼで満たされ得る。次いで、ニックは、上記のようにＤＮＡリガーゼにより修復され得る。細胞抽出物も、リガーゼ活性を含有し、細胞または核の抽出物は、ＤＮＡ末端の再結合に用いられ得る。あるいは、ＤＮＡ分子は、インタクトな細胞内に導入することができ、細胞の機構部分が相同的または非相同的手段によりＤＮＡを再結合させ得る。
【０１３４】
（欠失組成物）
１つの実施形態では、本発明は、ポリヌクレオチドの組成物を提供し、この集団のメンバーがポリヌクレオチドの一方または両方の末端での欠失の存在により互いに異なる。欠失の数は、各末端で１〜１００個の範囲であるが、より好ましくは１〜３０個である。
【０１３５】
さらに、本発明は、特定の内部位置（すなわち、末端ではない）での短い欠失により互いに異なるポリヌクレオチドの組成物を提供する。この組成物は、欠失を有するポリヌクレオチドの組成物を、その末端において他のＤＮＡ末端と結合させることにより得られ、その結果、今度は欠失が内部に発生する。連結されるべき２つの末端が同一のＤＮＡ分子にしばしば存在し、その結果、得られる連結産物は、環状ポリヌクレオチドである。欠失の数は、各末端で１〜１００個の範囲であり得るが、より好ましくは１〜３０個である。
【０１３６】
本明細書中において参照される全ての参考文献および特許公開は、本明細書中に参考として援用される。
【０１３７】
上記開示から理解されるように、本発明は、広範な種々の用途を有する。したがって、以下の実施例は、例示を目的として呈示されるものであり、決して本発明についての限定として解釈されることを意図するものではない。
（実施例）
（実施例１：プラスミドのランダムな切断）
挿入または欠失を利用する分子進化技術では、遺伝子が、少なくとも一時的に、少数回切断される必要がある。必要に応じて、混合物内の各分子は、異なるランダムな位置で一回切断される。一回切断されたＤＮＡを調製することはかなり困難であり、切断はランダムな位置で発生する。Ｂｉｏｎｄｉらは、ＤＮａｓｅＩおよびＤＮＡポリメラーゼを用いてニックを誘発し、次いでこれらのニックをさらに切断して、二本鎖の分解を生成する、面倒な方法を記載している［Ｂｉｏｎｄｉら、Ｎｕｃｌｅｉｃ　Ａｃｉｄｓ　Ｒｅｓ　２６：４９４６−５２（１９９８）］。このプロセスは、冗長かつ時間がかかる塩化セシウムの勾配精製およびリンカーの連結工程を必要とし、分子進化のような、ハイスループット分子生物学的技術に一般的に適用できない。
【０１３８】
一本鎖エンドヌクレアーゼを用いてＤＮＡのランダムな位置での二本鎖の分解を誘発する戦略は、これまで用いられてはいなかった。これは、Ｓ１、Ｐ１または大豆ヌクレアーゼのような一本鎖ヌクレアーゼが、緊密なスーパーコイルＤＮＡの一本鎖領域を特異的に切断し、これによりニックを生成することを理由としていた。ニックは、これらの酵素についての自然の基質であり、次いで、二本鎖の分解を作り出す切断は、同じ反応で発生し得る。切断に続いて、プラスミドはもはやスーパーコイル状態ではないので、一本鎖領域はもはや存在せず、このためＤＮＡは、もはや酵素にとっての基質ではない。それゆえ、切断は生じ、一度のみしか発生しない。本実施例は、この仮説の利用性を例示するものである。
【０１３９】
ポリヌクレオチドをランダムな位置で切断できる機構を例示するため、プラスミドｐＬａｃＺｉ（Ｃｌｏｎｅｔｅｃｈ，Ｐａｌｏ　Ａｌｔｏ，ＣＡ）を用いた。このプラスミドを、ＤＨ１０Ｂ　Ｅ．ｃｏｌｉ細胞（Ｉｎｖｉｔｒｏｇｅｎ，Ｃａｒｌｓｂａｄ，ＣＡ）中で増殖させ、プラスミドを、Ｑｉａｇｅｎマキシプレップカラム（Ｑｉａｇｅｎ　ｍａｘｉｐｒｅｐ　ｃｏｌｕｍｎ）（Ｑｉａｇｅｎ，Ｖａｌｅｎｃｉａ，ＣＡ）により調製した。２００ｎｇ／μｌのプラスミドＤＮＡを、０．４、２．０、１０または５０ユニットのＳ１ヌクレアーゼ（Ｐｒｏｍｅｇａ，Ｍａｄｉｓｏｎ，ＷＩ）とともに、１×Ｓ１緩衝液（５０ｍＭ酢酸ナトリウム、ｐＨ４．５、２８０ｍＭ　ＮａＣｌ、４．５ｍＭ　ＺｎＳＯ_４）中で１０分間、室温でインキュベートした。ＥＤＴＡを０．０２５Ｍまで添加して、７０℃で１０分間加熱することにより、反応を停止させた。タンパク質を、等量のフェノール：クロロホルム：イソアミルアルコール（２５：２４：１）で２度、等量のエーテルで一度抽出して除去し、酢酸ナトリウムで沈殿させ、水に再懸濁させた。
【０１４０】
切断したｐＬａｃＺｉを、１．５％アガロースゲル電気泳動により分析した（図４、パネルＡ）。Ｓ１ヌクレアーゼで切断されたプラスミドをｐＬａｃＺｉを一度切断するＣｌａＩで切断されたｐＬａｃＺｉとともに移動することを、観察した。これにより、Ｓ１ヌクレアーゼは環状ＤＮＡ分子を線状化させることができる。Ｓ１ヌクレアーゼが配列特異的な様式でＤＮＡを切断することは知られていないが、Ｓ１によるプラスミドの切断は部位特異的でないと決定することは重要であった。このために、Ｓ１切断により生成された線状プラスミドをゲル精製するか（図４、パネルＢ、レーン５）、または精製してさらにＣｌａＩで切断した（レーン６）。コントロールは、スーパーコイルプラスミド（レーン２）、ＣｌａＩで線状化されたプラスミド（レーン３）またはＳ１ヌクレアーゼで線状化したが精製していないプラスミド（レーン４）を含んでいた。Ｓ１／ＣｌａＩ切断プラスミドを、１つのスメアとして観察し、これはＳ１がプラスミドのいくつかの異なる位置で切断していることを示す。Ｓ１が１つの位置しか切断しない場合、Ｓ１／ＣｌａＩ切断プラスミドは、２本のバンドとして移動する；Ｓ１が２つの位置で切断する場合、Ｓ１／ＣｌａＩプラスミドは３本のバンドなどとして移動する。本実施例の重要性は、ポリヌクレオチドが一度（すなわち、環の線状化）、しかも一度だけ、異なった複数の位置で切断されることが可能である。
【０１４１】
（実施例２：ＬａｃＺ中の部位での欠失）
ヌクレオチド欠失が、遺伝子の構造分析を目的として、かつ、ヌクレオチド配列分析を目的としてなされている。一般にこれらの欠失は、１００個のヌクレオチドをはるかに超える範囲の大きさである。通常の条件下では、例えば、エキソヌクレアーゼＩＩＩは、１分間当り１００個より多い塩基を除去する［Ｓａｍｂｒｏｏｋら、（１９８９）］。しかし、小型の欠失を作製する能力は、タンパク質中の小型のドメインを変化させるか、または、有害な機能を除去するのに有用である。ポリヌクレオチドの末端に小型の欠失を作るため、エキソヌクレアーゼＩＩＩを、種々の塩（図５）および温度の条件下で用いた。ｐＬａｃＺｉ由来の、蛍光標識した２３２塩基対のＰＣＲ産物を、１００ｍＭ、１５０ｍＭおよび２００ｍＭのＮａＣｌに、１０μｌの６６ｍＭ　Ｔｒｉｓ−Ｃｌ（ｐＨ７．４）、０．６６ｍＭのＭｇＣｌ_２中の１０ＵのエキソヌクレアーゼＩＩＩ（Ｎｅｗ　Ｅｎｇｌａｎｄ　Ｂｉｏｌａｂｓ，Ｂｅｖｅｒｌｙ，ＭＡ）の存在下で、１５℃で５分間の反応中に暴露した。ＥＤＴＡを０．０２５Ｍまで添加することにより反応を停止させ、等量のフェノール：クロロホルム：イソアミルアルコール（２５：２４：１）で一度、等量のエーテルで一度抽出し、酢酸ナトリウムで沈殿させた。ＤＮＡを、２０μｌの脱イオン化したホルムアミドに再び懸濁させ、０．５μｌを、製造者の推薦に従い遺伝子スキャン（ｇｅｎｅｓｃａｎ）の設定にセットしたＡＢＩ　３７３シーケンサー（Ｐｅｒｋｉｎ−Ｅｌｍｅｒ，Ｆｏｓｔｅｒ　Ｃｉｔｙ，ＣＡ）中の６％ポリアクリルアミド変性ゲルに流した。
【０１４２】
約２５個のヌクレオチドを、１００ｍＭ　ＮａＣｌの条件下（図５、第２パネル）で、１５個までのヌクレオチドを１５０ｍＭ　ＮａＣｌで、数個のヌクレオチドを２００ｍＭ　ＮａＣｌ（下のパネル）で除去することができた。
【０１４３】
ｐＬａｃＺｉ中のＣｌａＩ部位はＬａｃＺ遺伝子のコード領域に存在している。この部位は、遺伝子自体内に短い欠失を作るのに用いられ、次いでさらにＰＣＲにより分析して、欠失が作られた程度を決定した。さらに、欠失を含むプラスミドを、４０μｇ／ｍｌのＸ−Ｇａｌを含むＬＢ寒天プレート上で選択し、ＬａｃＺ遺伝子の機能性を決定した。ｐＬａｃＺｉプラスミド（１０μｇ）を、２００μｌのＣｌａＩ中で線状化し、次いで、２０ＵのＳ１ヌクレアーゼ４００μｌ中でインキュベートして、２ｂｐの５’オーバーハングを除去した。さらに、線状化したプラスミドを濃縮し、ウルトラフリーＭＣ膜（ｕｌｔｒａｆｒｅｅ　ＭＣ　ｍｅｍｂｒａｎｅ）（３０ｋＤ除去用、Ｍｉｌｌｉｐｏｒｅ，Ｂｅｄｆｏｒｄ，ＭＡ）を通して濾過し、１００Ｕの仔ウシ腸ホスファターゼ（Ｎｅｗ　Ｅｎｇｌａｎｄ　Ｂｉｏｌａｂｓ，Ｂｅｖｅｒｌｙ，ＭＡ）を含む容量４００μｌの１×仔ウシ腸ホスファターゼ緩衝液中に入れ、室温で４５分間インキュベートした。プラスミドを、等量のフェノール：クロロホルム：イソアミルアルコール（２５：２４：１）で、等量のエーテルで一度抽出し、酢酸ナトリウムで沈殿させ、水に再懸濁させた。次いで、このプラスミドを、実施例１に記載したのと同様に、エキソヌクレアーゼＩＩＩとともに、１００ｍＭ、１５０ｍＭまたは２００ｍＭのＮａＣｌの存在下で１５℃で５分間、１０μｌ反応物でインキュベートした。対照アームでは、プラスミドは、エキソヌクレアーゼＩＩＩとともにインキュベートせず、欠失の無い状態での脱リン酸化プラスミドの再連結の発生頻度について調べた。エキソヌクレアーゼＩＩＩ反応の５分後、Ｓ１ヌクレアーゼ５０Ｕを１×Ｓ１緩衝液中に含む混合物を添加した。この混合物を、室温で１５分間さらにインキュベートした。ＥＤＴＡを０．０２５Ｍまで添加し、７０℃で１０分間加熱することにより、この反応を停止させた。次いで、ＤＮＡを等量のフェノール：クロロホルム：イソアミルアルコール（２５：２４：１）で一度、等量のエーテルで一度抽出し、酢酸ナトリウムで沈殿させ、１．０ＵのＴ４　ＤＮＡリガーゼ（Ｉｎｖｉｔｒｏｇｅｎ，Ｃａｒｌｓｂａｄ，ＣＡ）を含む１０μｌの１×リガーゼ緩衝液中に再び懸濁させた。連結反応物は１５℃で１２時間インキュベーションした。Ｅ．ｃｏｌｉ株ＤＨ１０Ｂ（Ｉｎｖｉｔｒｏｇｅｎ，Ｃａｒｌｓｂａｄ，ＣＡ）の電気泳動を、１．０μｌの連結混合物とともに行った。細胞を、４０μｇ／ｍｌのＸ−Ｇａｌおよび１００μｇ／ｍｌのアンピシリンを含むＬＢ寒天プレート上で平板培養し、３０℃で一晩インキュベートした。表１に平板培養実験の結果を示す。
（表１．部位特異的欠失後のコロニー特性）
【０１４４】
【表１】

脱リン酸化プラスミドがエキソヌクレアーゼＩＩＩに暴露されない場合（第１行、表１）、バックグラウンドが見られないことに、注意すべきである。いくつかの青色および白色のコロニーが、種々の塩濃度でのエキソヌクレアーゼＩＩＩ処理で見出されている。興味深いことに、少なくとも２／３の再連結がフレーム外（ｏｕｔ　ｏｆ　ｆｒａｍｅ）にあるべきであるので、青色／白色の比率の理論的最大値は０．３３である。しかし、本実験での青色／白色比率は０．３３をわずかに超えており、塩濃度が増大するにつれ増大するように思われる。この傾向は、一端からの１塩基対の欠失がインフレームでの再連結の発生を可能にし、塩が増大するにつれ欠失がより容易でなくなる事実に起因し得る。この結果の統計的有意性は分析されておらず、本当の発生頻度は０．３３により近いものであるかもしれない。
【０１４５】
６つのコロニーを、ＣｌａＩ部位に隣接するプライマーを用いてＰＣＲにより分析した。図６にこれらの結果を示す。上側のパネルに、ｐＬａｃＺｉ由来の野生型の３１２塩基対のフラグメントを示す。クローン１は、２９１塩基のインフレーム欠失（２９１塩基のＰＣＲ産物）を含有し、青色の表現型を維持する。クローン２は、４塩基対のフレーム外の欠失（３０８塩基のＰＣＲ産物）を含有し、白色の表現型を有する。クローン３は、９塩基対のインフレーム欠失（３０３塩基のＰＣＲ産物）を含有し、白色の表現型を有する。クローン４は、６塩基対のインフレーム欠失（３０６塩基のＰＣＲ産物）を含有し、白色の表現型有する。クローン５は、７塩基対のフレーム外欠失（３０５塩基のＰＣＲ産物）を含有し、白色の表現型を有する。クローン６は、３塩基対の欠失（３０９塩基のＰＣＲ産物）を含有し、青色の表現型を有する。より短い欠失はより厳密性の低い表現型をもたらすと思われ得るが、本実験はこのことが必ずしも当てはまらないことを示す。クローン１は、７個のアミノ酸を含む欠失を含有するが機能を維持する。一方で、クローン３および４は、インフレームでのより短い欠失を含有するが機能を維持しない。さらに、本実施例は、機能的配列空間を探索するための欠失技術（ｄｅｌｅｔｉｏｎａｌ　ｔｅｃｈｎｏｌｏｇｙ）の能力を示す。
【０１４６】
（実施例３：ＬａｃＺへの挿入）
ＬａｃＺ遺伝子へのランダムＤＮＡの挿入は、ＤＮａｓｅＩを用いてＣＨＯ細胞由来ｃＤＮＡをフラグメント化し、続いてこれらのフラグメントを線状化ｐＬａｃＺｉ中に連結することにより達成された。ｃＤＮＡは自明ながら機能的であるので、ｃＤＮＡの使用が機能性タンパク質の獲得可能性を最適化するであろうことが意図される。ＣＨＯ細胞のｃＤＮＡ（５μｇ）を、０．００１ユニットのＤＮａｓｅＩを用いて、４０ｍＭ　Ｔｒｉｓ−Ｃｌ（ｐＨ７．４）および１０．０ｍＭ　ＭｇＣｌ_２を含む緩衝液中で、室温で５分間フラグメント化させた。ＥＤＴＡを０．０２５Ｍまで添加し、１０μｇのプロテアーゼＫの存在下で７０℃まで加熱することにより、反応を停止させた。ＤＮＡを、等量のフェノール：クロロホルム：イソアミルアルコール（２５：２４：１）で、等量のエーテルで一度抽出し、酢酸ナトリウムで沈殿させた。ＣｌａＩおよびＳ１ヌクレアーゼで線状化したプラスミドを上記のように脱リン酸化し、次いで、再び等量のフェノール：クロロホルム：イソアミルアルコール（２５：２４：１）で、等量のエーテルで一度抽出し、酢酸ナトリウムで沈殿させた。ランダムｃＤＮＡフラグメントをプラスミドＤＮＡに挿入するために、線状化し脱リン酸化したプラスミド０．２ｍｇをｃＤＮＡフラグメント１ｎｇとともに、Ｔ４ＤＮＡリガーゼ（１．０Ｕ）の存在下で、１０ｍｌの反応量で１５℃１２時間インキュベートした。コントロールとして、線状化プラスミドを、リガーゼとともにｃＤＮＡフラグメントの非存在下でインキュベートし、ｃＤＮＡフラグメントを、リガーゼとともに線状化ベクター非存在下でインキュベートした。次いで、ＤＨ１０Ｂ　Ｅ．ｃｏｌｉを、１０μｌの各連結反応混合物とともに電気泳動させた。
【０１４７】
いくつかのＥ．ｃｏｌｉコロニーを、Ｘ−Ｇａｌプレート上で白色、中間または青色の表現型のいずれかを示す実験のベクター＋挿入物アームにおいて同定した。ｃＤＮＡフラグメントに連結されたＣｌａＩで線状化されたベクターから発生したコロニーのＣｌａＩ部位についてのＰＣＲから、１００〜３００塩基対のサイズの挿入を含有するいくつかのクローンが明らかとなった。これらのうちの３つを図７に示す。このように、ｃＤＮＡフラグメントの遺伝的要素への挿入が、本発明で達成可能である。
【０１４８】
（実施例４：ランダムな位置での機能的変化）
ｌａｃオペロンは、遺伝的要素が容易に研究されるモデル系である。酵素β−ガラクトシダーゼは、ＬａｃＺ遺伝子によりコードされるが、通常、環境中にラクトースが存在している場合にのみ産生される。酵素レベルの制御は、転写レベルで達成される。ｌａｃリプレッサータンパク質は、ＬａｃＺのＡＴＧ開始部位の上流のオペレーター配列に結合し、ＲＮＡポリメラーゼによる転写を阻害する。しかし、ラクトースの存在下では、リプレッサーはオペレーターから除去され、転写が進行し得る。プロモーター活性化の機構は、インデューサーであるラクトースのｌａｃリプレッサーへの結合、および、そのオペレーターに対する親和性を劇的に低下させるアロステリック変化の発生によるものである。研究室での設定では、Ｅ．ｃｏｌｉを比色分析用基質Ｘ−Ｇａｌ上で平板培養することにより、ＬａｃＺ転写を評価することができ、この基質は、β−ガラクトシダーゼにより加水分解された場合にはコロニーを青変させる。オペレーターは、ラクトースのアナログであるＩＰＴＧを用いて抑制解除可能であり、このＩＰＴＧは加水分解されず、かつ、ｌａｃリプレッサーに結合することによりＬａｃＺの転写を強力に誘導する。
【０１４９】
ランダム欠失が遺伝子機能に影響を与える能力を調べるため、ｐＢｌｕｅｓｃｒｉｐｔＩＩ　ＫＳ＋プラスミドを、実施例１および２に記載したように、Ｓ１ヌクレアーゼで線状化し、ゲル精製し、脱リン酸化し、エキソヌクレアーゼＩＩＩで消化させた。２０ｎｇ／μｌの線状化プラスミドを、１０ＵのエキソヌクレアーゼＩＩＩとともに、６６ｍＭ　Ｔｒｉｓ−Ｃｌ（ｐＨ７．４）、０．６６ｍＭ　ＭｇＣｌ_２緩衝液中で、１５℃にて５分間インキュベートし、次いで、５０ｍＭ酢酸ナトリウム（ｐＨ４．５）、２８０ｍＭ　ＮａＣｌ、４．５ｍＭ　ＺｎＳＯ_４および１０ＵのＳ１ヌクレアーゼを含む１×Ｓ１溶液を添加し、室温で１５分間インキュベートした。ＥＤＴＡを０．０２５Ｍまで添加して、等量のフェノール：クロロホルム：イソアミルアルコール（２５：２４：１）で、等量のエーテルで一度抽出することにより、反応を停止させ、酢酸ナトリウムで沈殿させた。ＤＮＡを、１．０ＵのＴ４ＤＮＡリガーゼを含む１×Ｔ４ＤＮＡリガーゼ緩衝液中に再懸濁させ、１５℃で１２時間インキュベートした。次いで、連結反応物（１μｌ）を用いて、ｌａｃリプレッサータンパク質を産生するＥ．ｃｏｌｉ株ＴＯＰ１０Ｆ’（Ｉｎｖｉｔｒｏｇｅｎ，Ｃａｒｌｓｂａｄ，ＣＡ）をエレクトロポレーションした。Ｅ．ｃｏｌｉを、インデューサーとしてのＩＰＴＧを含むかまたは含まずに、かつＸ−Ｇａｌが存在するＬＢプレート上でインキュベートし、β−ガラクトシダーゼ活性を測定した。さらに、ｐＢｌｕｅｓｃｒｉｐｔプラスミドを、ＩＰＴＧの存在下または非存在下で、Ｘ−Ｇａｌを含むプレート上で平板培養した。表２に実験の結果を示す。
（表２．β−ガラクトシダーゼの転写における機能性変化）
【０１５０】
【表２】

いくつかのコロニーは、欠失がランダムな位置で作られた実験アームにおける、インデューサーであるＩＰＴＧの非存在下で、ＬａｃＺを転写する能力を獲得した。さらに、いくつかのコロニーは、ＩＰＴＧの存在下で機能性β−ガラクトシダーゼを産生する能力を失った。ｐＢｌｕｅｓｃｒｉｐｔ／欠失アームからのＩＰＴＧの存在下における１つの白色のコロニーについて配列決定し、翻訳開始部位に８個の塩基対の欠失を有することがわかった。この配列を以下に示し、ここで、メチオニンのコドンをコードする翻訳開始部位（ＡＴＧ）に下線を付している。
【０１５１】
【化１】

（それぞれ配列番号１および配列番号２）
このように、プラスミドのランダムな切断、その後のエキソヌクレアーゼＩＩＩにより作製される短い欠失により、遺伝的要素の調節領域およびタンパク質コード領域における機能性変化を引き起こすことができる。次いで、これらの変化は、その後機能性アッセイで検出可能である。
【０１５２】
【表３】

【図面の簡単な説明】
【図１】図１は、分子進化を選抜するための従来法である、ＤＮＡシャッフリングプロセスの図である。目的の遺伝子のホモログをフラグメント化して、このホモログからの一本鎖フラグメントが伸長反応において互いにプライム（ｐｒｉｍｅ）することができるように、変性および再アニーリングに供する。次いで、完全長遺伝子の増幅により、ハイブリッド遺伝子ライブラリーが生成される。次いで、遺伝子スクリーニングを適用して、変化した遺伝子または改善した遺伝子を選択する。
【図２】図２は、コンビナトリアル多様性を生成するＶ（Ｄ）Ｊ組換え、および結合部多様性を生成するＤＮＡ末端結合のプロセスを示す、免疫グロブリン重鎖遺伝子座の図である。
【図３】図３は、ポリヌクレオチドにおいてランダムな位置でヌクレオチド欠失およびヌクレオチド挿入を生じる方法の例を示す図である。標的遺伝子を切断して、各々がこの遺伝子中のランダムな位置でフラグメント化される遺伝子プールを生産する。残基は、ＤＮＡ末端で欠失される（左）か、または挿入されて（右）、ランダムな位置で欠失、挿入、またはその両方を含むライブラリーを生産し得る。
【図４】図４は、ポリヌクレオチドのランダムな切断を示す図である。パネルＡ（図４Ａ）では、ＤＮＡプラスミドｐＬａｃＺｉ（Ｃｌｏｎｔｅｃｈ，Ｐａｌｏ　Ａｌｔｏ，ＣＡ）を、切断しなかった（レーン２）か、単一切断制限酵素ＣｌａＩで切断した（レーン３）か、または漸増濃度のＳ１ヌクレアーゼで切断した（レーン４〜７）。レーン１および８は、λ／ＨｉｎｄＩＩＩ　ＤＮＡマーカーである。パネルＢ（図４Ｂ）では、ｐＬａｃＺｉプラスミドを、切断しなかった（レーン２）か、ＣｌａＩで切断した（レーン３）か、またはＳ１ヌクレアーゼで切断した（レーン４）。Ｓ１で切断したｐＬａｃＺｉ試料をゲル精製し、レーン５に泳動したか、またはＣｌａＩで切断してレーン６で泳動した。等量のＤＮＡを、レーン２〜４（１μｇ）、およびレーン５〜６（１００ｎｇ）で泳動した。レーン６のスメアは、Ｓ１による切断が、部位特異的ではないことを示す。レーン１および７は、λ／ＨｉｎｄＩＩＩ　ＤＮＡマーカーを含有する。
【図５】図５は、ＤＮＡ末端に短ヌクレオチド欠失を生じる方法の例を示す図である。エキソヌクレアーゼＩＩＩは、塩依存性反応で、蛍光標識した２３２ｂｐのＤＮＡフラグメントの末端からヌクレオチドを欠失させる。塩が増加するにつれ、欠失数が減少する。
【図６】図６は、ＬａｃＺ遺伝子中のヌクレオチドの欠失を示す図である。プラスミドｐＬａｃＺｉをＣｌａＩで切断し、図５に記載するようにエキソヌクレアーゼＩＩＩで処理して、再連結させて、Ｅ．ｃｏｌｉにエレクトロポレーションして、比色ラクトースアナログＸ−Ｇａｌを含有するプレート上で平板培養した。青色または白色を有するクローンを取り出し、ＬＢ中で増殖させて、ＤＮＡを調製した。ＣｌａＩ部位に隣接するプライマーを用いて、プラスミドをＰＣＲに供した。ここで１つのプライマーを蛍光標識した。ＰＣＲ産物を、ＡＢＩ　３７３ＤＮＡシーケンサーで、６％変性アクリルアミドゲル上で泳動し、Ｇａｎｅｓｃａｎソフトウェア（Ｐｅｒｋｉｎ　Ｅｌｍｅｒ，Ｆｏｓｔｅｒ　Ｃｉｔｙ，ＣＡ）で分析した。最上部パネルは、３１２ｂｐフラグメントを生産する野生型ＬａｃＺ遺伝子を用いたＰＣＲを示す。クローン１〜６には、多様な短い欠失が存在していた。クローン１および６は、青色表現型を有し、２〜５は、白色表現型を有した。
【図７】図７は、ｐＬａｃＺｉ中に挿入を含有する３個のクローンを示す１．５％アガロースゲルである。ＣＨＯ細胞のｃＤＮＡを、ＤＮａｓｅＩでフラグメント化して、ｐＬａｃＺｉのＣｌａＩ部位に連結させて、Ｅ．ｃｏｌｉにエレクトロポレーションし、Ｘ−Ｇａｌプレート上で平板培養した。ＣｌａＩ部位に隣接するプライマーを用いたプラスミドＤＮＡのＰＣＲにより、３個のクローンを分析した。１〜３と表示したレーンは、異なるサイズの挿入を含有するクローンであり、レーン４は、ｐＬａｃＺｉである。最初のレーンおよび最後のレーン中のＤＮＡは、ΦＸ１７４／Ｈａｅ　ＩＩＩ　ＤＮＡマーカーであり、右側に示した塩基対のサイズを有する。

Claims

遺伝的要素の配列中の異なる位置にヌクレオチド欠失を有するポリヌクレオチド配列のライブラリーを生成するための方法であって、該方法は、以下の工程：
（ａ）該遺伝的要素を含む複数コピーの環状ポリヌクレオチドを、ランダムな切断に供して、複数の線状ポリヌクレオチドを獲得する工程であって、該ポリヌクレオチドの各々は、少なくとも１つの３’末端および５’末端を有する、工程；および
（ｂ）工程（ａ）由来の該ポリヌクレオチドを、該ポリヌクレチドの該末端の１つから少なくとも１つのヌクレオチドを取り除くプロセスに供して、欠失ポリヌクレオチド配列のライブラリーを生成する工程であって、該ライブラリーは、異なるランダムな位置に欠失を有する複数の欠失ポリヌクレオチド配列を含む、工程、
を包含する、方法。
工程（ｂ）由来の前記ポリヌクレオチドが、前記３’末端および５’末端を互いに共有結合するプロセスに供される、請求項１に記載の方法。
前記ポリヌクレオチドのライブラリーが、目的の機能について選択するプロセスにさらに供される、請求項１に記載の方法。
前記切断がエンドヌクレアーゼで生じる、請求項１に記載の方法。
前記エンドヌクレアーゼがＳ１である、請求項４に記載の方法。
前記欠失ポリヌクレオチドのライブラリーが、少なくとも５個の個々のポリヌクレオチドを含み、該ポリヌクレオチドの各々は、他のポリヌクレオチドとは異なる位置にランダムな欠失を有する請求項１に記載の方法。
前記欠失ポリヌクレオチドのライブラリーが、少なくとも１０個の個々のポリヌクレオチドを含み、該ポリヌクレオチドの各々は、他のポリヌクレオチドとは異なる位置にランダムな欠失を有する請求項１に記載の方法。
前記欠失ポリヌクレオチドのライブラリーが、少なくとも３０個の個々のポリヌクレオチドを含み、該ポリヌクレオチドの各々は、他のポリヌクレオチドとは異なる位置にランダムな欠失を有する請求項１に記載の方法。
前記複数コピーの環状ポリヌクレオチドの組成物が、前記遺伝的要素に対する天然に存在するホモログを含まない、請求項１に記載の方法。
工程（ａ）および（ｂ）が繰り返される、請求項１に記載の方法。
工程（ｂ）が欠失の位置にヌクレオチドを挿入するためのプロセスをさらに含む、請求項１に記載の方法。
工程（ｂ）で１〜３個のヌクレオチドが欠失されている、請求項１に記載の方法。
工程（ｂ）で５０〜１００個のヌクレオチドが欠失されている、請求項１に記載の方法。
実質的に純粋な組成物であって、該組成物は、異なる３’末端および５’末端を各々有する複数の線状ポリヌクレオチドのライブラリーを含むが、該線状ポリヌクレオチドの各々は、環状にされる場合、他のポリヌクレオチドと同一である、組成物。
前記ライブラリーが、異なる３’末端および５’末端を有する少なくとも５個のポリヌクレオチドを含む、請求項１４に記載の組成物。
少なくとも２個の欠失ポリヌクレオチドのライブラリーを含む実質的に純粋な組成物であって、該ポリヌクレオチドは、異なるランダムな欠失を有することによってのみ各々他と異なる、組成物。
前記欠失ポリヌクレオチドが、欠失の位置に挿入された少なくとも１個のヌクレオチドを更に含む、請求項１６に記載の実質的に純粋な組成物。
前記ライブラリーが、少なくとも５個のポリヌクレオチドを有する、請求項１６に記載の組成物であって、該ポリヌクレオチドは、異なるランダムな欠失を有することによってのみ各々他と異なる、組成物。
遺伝的要素中のランダムな位置にヌクレオチド付加を有するポリヌクレオチド配列のライブラリーを生成するための方法であって、該方法は、以下の工程：
（ａ）該遺伝的要素を含む複数コピーの環状ポリヌクレオチドの組成物を、ランダムな切断に供して、複数の線状ポリヌクレオチドを獲得する工程であって、該ポリヌクレオチドの各々は、少なくとも１つの３’末端および５’末端を有する、工程；および
（ｂ）工程（ａ）由来の該ポリヌクレオチドを、該ポリヌクレチドの該末端の１つに少なくとも１つのヌクレオチドを付加するプロセスに供して、付加ポリヌクレオチド配列のライブラリーを生成する工程であって、該ライブラリーは、異なるランダムな位置に付加を有する複数の付加配列を含む、工程、
を包含する、方法。
工程（ｂ）由来の前記付加ポリヌクレオチドが、前記３’末端および５’末端を互いに共有結合するプロセスに供される、請求項１９に記載の方法。
前記ポリヌクレオチドのライブラリーを、目的の機能について選択するプロセスに供する工程をさらに包含する、請求項１９に記載の方法。
前記切断がエンドヌクレアーゼで生じる、請求項１９に記載の方法。
前記エンドヌクレアーゼがＳ１である、請求項２２に記載の方法。
前記付加ポリヌクレオチドのライブラリーが、少なくとも５個の個々のポリヌクレオチドを含み、該ポリヌクレオチドの各々は、他のポリヌクレオチドとは異なる位置にランダムな付加を有する、請求項１９に記載の方法。
前記付加ポリヌクレオチドのライブラリーが、少なくとも１０個の個々のポリヌクレオチドを含み、該ポリヌクレオチドの各々は、他のポリヌクレオチドとは異なる位置にランダムな付加を有する、請求項１９に記載の方法。
前記付加ポリヌクレオチドのライブラリーが、少なくとも３０個の個々のポリヌクレオチドを含み、該ポリヌクレオチドの各々は、他のポリヌクレオチドとは異なる位置にランダムな付加を有する、請求項１９に記載の方法。
前記複数コピーの環状ポリヌクレオチドの組成物が、前記遺伝的要素に対する天然に存在するホモログを含まない、請求項１９に記載の方法。
工程（ａ）および（ｂ）が繰り返される、請求項１９に記載の方法。
工程（ｂ）が付加の位置でヌクレオチドを欠失させるためのプロセスを含む、請求項１９に記載の方法。
工程（ｂ）で１〜３個のヌクレオチドが付加されている、請求項１９に記載の方法。
工程（ｂ）で３〜５０個のヌクレオチドが付加されている、請求項１９に記載の方法。
工程（ｂ）で５０〜１００個のヌクレオチドが付加されている、請求項１９に記載の方法。
少なくとも２個の付加ポリヌクレオチドのライブラリーを含む実質的に純粋な組成物であって、該ポリヌクレオチドは、異なるランダムな付加を有することによってのみ各々他と異なる、組成物。
少なくとも５個の付加ポリヌクレオチドのライブラリーを含む実質的に純粋な組成物であって、該ポリヌクレオチドは、異なるランダムな付加を有することによってのみ各々他と異なる、組成物。
ポリヌクレオチドの末端から短い欠失を生成するための方法であって、該方法は、１０〜５００ｍＭ塩の存在下で０℃〜２４℃の温度にて、エキソヌクレアーゼと共に該ポリヌクレオチドの集団をインキュベートし、それにより、該ポリヌクレオチドの少なくとも１つの末端からの１〜１００残基の欠失を含むポリヌクレオチドの集団を生成することによる、方法。
前記ポリヌクレオチドが二本鎖である、請求項３５に記載の方法。
前記エキソヌクレアーゼがエキソヌクレアーゼＩＩＩである、請求項３５に記載の方法。
前記二本鎖核酸が、平滑末端を生成するために一本鎖エンドヌクレアーゼと共にインキュベートされる、請求項３６に記載の方法。
請求項３５に記載の方法であって、さらに、前記末端に欠失を含む前記得られたポリヌクレオチドの集団が、少なくとも第２の末端に共有結合され、内部位置に欠失を含むポリヌクレオチドの集団を生成する、方法。
前記一本鎖エンドヌクレアーゼがＳ１ヌクレアーゼである、請求項３８に記載の方法。
共有結合から生じた前記ポリヌクレオチドが、環状ポリヌクレオチドである、請求項３９に記載の方法。
前記ポリヌクレオチドの集団が、該ポリヌクレオチドの少なくとも１つの末端からの１〜５０残基の欠失を含む、請求項３５に記載の方法。
前記ポリヌクレオチドの集団が、該ポリヌクレオチドの少なくとも１つの末端からの１〜３０残基の欠失を含む、請求項３５に記載の方法。
少なくとも２個のポリヌクレオチドの実質的に純粋な組成物であって、該ポリヌクレオチドは、各々２つの末端を有し、そして１つの末端または両方の末端で１〜１００残基の異なる欠失を有することによってのみ各々互いに異なる、組成物。
前記ポリヌクレオチドの組成物が、１つの末端または両方の末端で１〜５０残基の欠失によって互いに異なる、請求項４４に記載の組成物。
前記ポリヌクレオチドの組成物が、１つの末端または両方の末端で１〜３０残基の欠失によって互いに異なる、請求項４４に記載の組成物。
前記ポリヌクレオチドの組成物が、１つの末端または両方の末端で１〜１０残基の欠失によって互いに異なる、請求項４４に記載の組成物。
少なくとも２つのポリヌクレオチドの実質的に純粋な組成物であって、該組成物の各々は、該ポリヌクレオチド内の特定の内部位置での１〜１００残基の欠失によってのみ互いに異なる、組成物。
前記ポリヌクレオチドが、前記特定の内部位置での１〜５０残基の欠失によって互いに異なる、請求項４８に記載の実質的に純粋な組成物。
前記ポリヌクレオチドが、前記特定の内部位置での１〜３０残基の欠失によって互いに異なる、請求項４８に記載の実質的に純粋な組成物。
前記ポリヌクレオチドが、前記特定の内部位置での１〜１０残基の欠失によって互いに異なる、請求項４８に記載の実質的に純粋な組成物。