WO1994016081A1

WO1994016081A1 - Verfahren zur gewinnung nativer domänen viraler membranproteine, deren verwendung, insbesondere als impfstoff gegen hiv

Info

Publication number: WO1994016081A1
Application number: PCT/DE1994/000022
Authority: WO
Inventors: Manfred Schawaller
Original assignee: Individual
Current assignee: Individual
Priority date: 1993-01-16
Filing date: 1994-01-12
Publication date: 1994-07-21
Anticipated expiration: 1995-07-16
Also published as: DE59402827D1; DE4400659C2; JPH08505769A; ES2102815T3; GR3023717T3; DK0679187T4; EP0679187B2; DK0679187T3; DE4400659A1; ATE153380T1; US6140059A; ES2102815T5; EP0679187B1; JP3658690B2; EP0679187A1

Abstract

Die vorliegende Erfindung betrifft ein Verfahren zur Gewinnung von nativen Domänen viraler Membranproteine, insbesondere nativer, d.h. oligomerer und glycosylierter Ektodomänen des Oberflächenproteins gp 160 des menschlichen Immunschwächevirus HIV (Human Immunodeficiency Virus), dem Erreger von AIDS (Aquired Immune Deficiency Syndrome), weiterhin die durch dieses Verfahren gewonnenen nativen Proteindomänen selbst, insbesondere native Ektodomänen des env Glykoproteins von HIV, deren Monomere eine elektrophoretische Mobilität von ca. 140 kD aufweisen, sowie deren Verwendung als Impfstoff, insbesondere als Impfstoff gegen HIV. In das Gen, das für das Vorläuferprotein der zu gewinnenden Proteindomäne codiert, wird an geeigneter Stelle eine Nukleotidsequenz insertiert, die für eine Erkennungssequenz für proteinspaltende Enzyme codiert. Nach Expression der Genmutante in eukaryontischen Zellen wird ein Verdau mit einem geeigneten Enzym durchgeführt und anschließend die zu gewinnende Proteindomäne gereinigt.

Description

VERFAHREN ZUR GEWINNUNG NATIVER DOMÄNEN VIRALER MEMBRANPROTEINE, DEREN VERWENDUNG , INSBESONDERE ALS IMPFSTOFF GEGEN HIV .

Beschreibung

Die vorliegende Erfindung betrifft ein Verfahren zur Gewinnung von nativen Domänen viraler Membranproteine, insbesondere von nativen Ektodomänen des Oberflächenproteins gpl60 des menschlichen Immunschwächevirus HIV (Human Immunodeficiency Virus), dem Erreger von AIDS (Aquired Immune Deficiency Syndrome), weiterhin die durch dieses Verfahren gewonnenen nativen Proteindomänen selbst sowie deren Verwendung als Impfstoff, insbesondere die Verwendung nativer Ektodomänen des Oberflächenproteins gplόO des menschlichen Immunschwächevirus HIV als Impfstoff gegen HIV. Bestandteil dieses Verfahrens zur Gewinnung von nativen Domänen viraler Membranproteine ist auch ein Verfahren zur Ermittlung geeigneter Stellen für den Einbau von Erkennungssequenzen in die zu gewinnende Proteindomänen, die als enzymatische Spaltstellen dienen, insbesondere als Collagenasespaltstellen, sowie Erkennungssequenzen für Collagenasen selbst.

Allgemeiner Hintergrund der Erfindung:

Ein probates Mittel zur Prophylaxe von Viruserkrankungen ist die Immunisierung, die Impfung des Körpers gegen die Viren. Durch Impfung konnten viele in früheren Zeiten oft epidemieartig verlaufende Viruserkrankungen wie z.B. die Pocken und Polio eingedämmt werden. Zur Erlangung einer solchen aktiven Immunisierung gegen ein Virus setzt man den Körper, genauer gesagt das Immunsystem, einem viralen Antigen aus. Dies kann geschehen beispielsweise durch Injektion von inaktivierten bzw. attenuierten Viren oder auch von Teilen, z.B. von Proteinen des Virus. Grundsätzlich setzt sich das Immunsystem des Menschen aus zwei verschiedenen Teilsystemen zusammen. Die zelluläre Immunantwort (T-Zellen) und die humorale Immunantwort (B-Zellen, Antikörper). Bei der Neuinfektion mit einem Virus stellt die humorale Immunantwort, durch B-Zellen vermittelt, den wichtigsten Abwehrmechanismus dar.

Das Immunsystem des Körpers reagiert auf das Antigen mit der Bildung von spezifischen Antikörpern, die das Antigen und damit das Virus erkennen und binden und dadurch dessen Inaktivierung in die Wege leiten. Darüberhinaus werden sogenannte "Gedächtniszellen" gebildet, das sind spezielle Lymphozyten, die bei einer späteren Infektion mit "ihrem" Virus bzw. "ihrem" Antigen aktiviert werden und das Immunsystem sehr rasch zur Synthese von großen Mengen der antigenspezifischen Antikörper stimulieren. Dadurch kann das Immunsystem wesentlich schneller auf einen Virusbefall reagieren, als wenn es vorher noch nicht mit dem entsprechenden Antigen konfrontiert worden ist.

Die Verwendung von attenuierten Viren zur Impfung kann allerdings insofern problematisch sein, als nicht ausgeschlossen werden kann, daß die verwendeten Viren im Körper wieder virulent werden und es zum Ausbruch der Viruserkrankung kommt. Aus diesem Grund ist es vorzuziehen, ein isoliertes Protein des Virus als Immunogen zu verwenden. Hierzu verwendet man am besten ein Oberflächenprotein des Virus, da dieses normalerweise der humoralen Immunantwort gut zugänglich ist. Idealerweise verwendet man nur einen Teil eines Oberflächenproteins, und zwar denjenigen Teil, der sich außen auf der Virusoberfläche befindet, die sogenannte Ektodomäne, da beim intakten Virus nur dieser Teil für Antikörper zugänglich ist. Bei der Herstellung einer Proteindomäne, die zur Impfung gegen ein Virus eingesetzt werden soll, ist allerdings zu beachten, daß sie möglichst die native Form haben sollte, da anderenfalls die Gefahr besteht, daß Antikörper gebildet werden, die das native Protein, und damit das Virus nicht erkennen und somit bei der NeutraHsation wirkungslos sind. Solche Moleküle oder Molekülteile, die aufgrund Ihrer dreidimensionalen Struktur von Antikörpern erkannt werden, nennt man konformationelle bzw. strukturelle Epitope, diejenigen, die an ihrer Aminosäuresequenz erkannt werden, sequentielle Epitope. Es zeigt sich immer mehr, daß es nur sehr wenige sequentielle Epitope gibt, die meisten antigenen Epitope sind strukturell, d.h. sie müssen die korrekte dreidimensionale Faltung der Polypeptidkette aufweisen, um von entsprechenden Antikörpern erkannt zu werden. Nativ bedeutet in diesem Zusammenhang, daß die räumliche Struktur der verwendeten Proteindomäne identisch oder nahezu identisch ist mit der Struktur des entsprechenden, natürlicherweise auf oder in dem Virus vorkommenden

Proteinbereiches. Dies schließt gegebenenfalls das Vorhandensein von Oligomerie und / oder Glykosylierung der Proteindomäne ein. Ein wichtiges Kriterium hierfür ist, daß Antikörper, die gegen eine isolierte native, virale Proteindomäne gebildet worden sind, auch den Virus bzw. das entsprechende native Protein im Virus erkennen und binden.

Große Probleme bereitet heutzutage das menschliche Immunschwächevirus HIV, ein Retrovirus. Seit es im Jahre 1984 als Ursache von AIDS identifiziert worden ist, werden große Anstrengungen unternommen, auch gegen dieses Virus einen Impfstoff herzustellen. In jüngerer Zeit ist es gelungen, Affen mit abgeschwächten SIV- Viren (Simian Immunodeficiency Virus), nahen Verwandten des HIV, erfolgreich zu immunisieren, was vermuten läßt, daß auch Menschen erfolgreich gegen HIV immunisiert werden könnten mittels abgeschwächten HIV. Die Problematik, die abgeschwächte Viren als Impfstoffe mit sich bringen, wurde schon angesprochen. Bei einer tödlich verlaufenden Krankheit wie AIDS kann dieses Risiko, daß der abgeschwächte Virus wieder virulent wird, nicht in Kauf genommen werden, auch wenn es sehr klein ist. Siehe hierzu auch: Koff, W.C. und Hoth, D.F. in der Zeitschrift "Science", 241, 426-432 (1988). Aus diesem Grund konzentriert sich ein großer Teil der Forschung über HIV- Impfstoffe darauf, einzelne Proteine, insbesondere das Oberflächenprotein des Virus, das sogenannte gpl60, auch env-Glykoprotein genannt, oder Fragmente davon als Antigen zu verwenden. [Eine allgemeine Übersicht gibt der Artikel "AIDS- Impfstoffe" von T.H. Matthews et al. in der Zeitschrift "Spektrum der Wissenschaft" 12, 134-142 (1988)].

Das env-Glykoprotein von HIV, dessen Aminosäuresequenz bekannt ist [Ratner et al, "Nature" 313, 277-284 (1985)] wird in der Wirtszelle zunächst als stark glykosyliertes Vorläuferprotein gplόO synthetisiert und anschließend im Golgi- Apparat zu den beiden Domänen gpl20 und gp41 prozessiert. Die gpl20-Domäne, die sich außen auf der Virusmembran befindet, ist für die Bindung an den zellulären Rezeptor CD4 verantwortlich und sowohl gpl20 als auch das Vorläuferprotein gplόO binden mit hoher Affinität an diesen CD4-Rezeptor. Gp41, das eine Transmembrandomäne aufweist, ist beteiligt an der Fusion von viraler und zellulärer Membran während des Eindringens des Virus in die Zelle, wahrscheinlich durch Interaktion eines "Fusionspeptids", das am Ammoterminus von gp41 hegt, mit der Iipiddoppelschicht der Wirtszellmembran.

Vielversprechend erscheint der Ansatz, für die Entwicklung eines HIV-Impfstoffs lediglich den äußeren Teil des env-Glykoproteins zu verwenden. Dem liegt die bereits erwähnte Überlegung zugrunde, daß der nach außen exponierte Teil des

Glykoproteins am leichtesten der humoralen Immunantwort zugänglich ist und daher eine Immunisierung gegen diese Ektodomäne am erfolgversprechendsten ist.

Die Gewinnung der Ektodomäne des HTV-Oberflächenproteins kann auf unterschiedhche Art und Weise erfolgen. Sie kann beispielsweise durch mechanische, chemische oder enzymatische Methoden von der Virushülle "abgeschnitten" werden. Dabei ist die Gefahr groß, daß das Protein denaturiert wird und zur Bildung von Antikörpern führt, die das native Oberflächenprotein und damit den Virus nur schlecht oder gar nicht erkennen.

Robey et al. ["Proc. Natl. Acad. Sei. USA", 83, 7023-7027 (1986)] gewinnen gpl20 beispielsweise durch Ablösen des Proteins von der Oberfläche HlV-infizierter Zellen mittels des recht starken Detergenz Triton X100. Auch wenn die Autoren ihre Präparation "natives gpl20" nennen, ist in Anbetracht des verwendeten Detergenz und der verwendeten Reinigungsmethoden zu bezweifeln, daß das so gewonnene gpl20 tatsächlich in nativer und oligomerer Form vorliegt.

In der europäischen Patentanmeldung EP 0328 403 ist vorgeschlagen, lediglich Peptide aus HIV-gpl20 mit einer Länge zwischen 28 und 33 Aminosäuren als Impfstoff gegen HIV zu verwenden. Diese Peptide liegen aber nicht in nativer, insbesondere oligomerer Form vor.

Ein gentechnologischer Ansatz besteht darin, ein Stopcodon quasi als

"Sollbruchstelle" knapp vor Beginn des gp41-Gens einzubauen. Bei der Expression des Gens in geeigneten Zellen bestimmt die Lage des Stopcodons dann die Lage des carboxyterminalen Endes der Ektodomäne des Oberflächenproteins, das heißt, es wird nur der äußere Teil des Oberflächenproteins, die Domäne gpl20 synthetisiert. Auf diese Art synthetisiert, hegt gpl20 aber als Monomer vor, was nicht den natürlichen Verhältnissen am Virus entspricht, da das env-Glykoprotein wie die meisten viralen Glykoproteine in nativer Form als Oligomer vorliegt. Häufig sind diese Proteine Trimere, für das HTV-l env-Glykoprotein konnte kürzlich gezeigt werden, daß es in nativer Form ein Tetramer ist [Schawaller M. et al., "Virology", 172, 367-369 (1989)]. Dies erklärt, weshalb monomeres gpl20 nicht zu geeigneten Antikörpern führt und somit als Impfstoff wenig brauchbar ist. Auch eigene Experimente des Erfinders, bei denen gpl20 von Zellen synthetisiert wurde, die mit einem recombinanten Vaccinia— Virus, durch den env exprimiert wird, infiziert worden waren, zeigten, daß gpl20 nicht stabil in oligomerer Form gebildet wird. Die Versuchsergebnisse deuten darauf hin, daß gp41 während der Biosynthese des env- Glykoproteins anwesend sein muß, um die Oligomerisierung zu gewährleisten. Wahrscheinlich Hegt diejenige Domäne von gp41, die für diese OHgomerisierung verantwortUch ist, innerhalb der 129 aminoterminalen Aminosäuren von gp41 [Earl, P.L. et al. "Proc. Natl. Acad. Sei. USA", 87, 648-652 (1990)].

Da gp41 offensichtlich eine wichtige Bedeutung bei der Synthese von nativem gpl60 hat, wurden auch Versuche unternommen, das komplette gplόO in stabiler Form herzusteüen. Barret et al. ["AIDS Research and Human Retroviruses" 5 (2), 159-170 (1989)] gewinnen gplόO beispielsweise durch Expression des env-Gens in eukaryontischen Zellen und anschließender Reinigung, wobei sie allerdings neben Detergentien auch das stark chaotrop wirkende Kaliumthiocyanat verwenden, welches Proteine denaturiert. Eigene Arbeiten des Autors haben gezeigt, daß die Reindarstellung von gplόO große Schwierigkeiten bereitet, und zwar aus folgenden Gründen:

GplόO ist, wie oben beschrieben, ein Membranprotein. Zur Herauslösung dieses Proteins aus der Membran sind Detergentien notwendig. Diese sind auch deshalb nötig, da isolierte gplόO Moleküle bei Abwesenheit von Detergentien aggregieren. Detergentien führen aber zu einer Veränderung des Moleküls. Es wurde festgestellt, daß gplόO mit Detergentien eine Veränderung des Proteaseverdaumusters im Vergleich zum unbehandelten Protein zeigt. Beim Entfernen des Detergenz aus der Lösung, was spätestens dann nötig wird, wenn das Protein beispielsweise zum Zwecke der Impfung einem Patienten injiziert werden soll, zerfällt das OHgomer zum Monomer. Aus den genannten Gründen erscheinen die Chancen, reines gplόO in nativer Form herstellen zu können, sehr gering zu sein.

Der wesentliche Nachteil, den alle bisherigen Ansätze zur Entwicklung eines Impfstoffes gegen HIV auf der Basis der isoHerten Ektodomäne des env- Glykoproteins gemeinsam haben, ist also höchstwahrscheinHch der, daß das als Immunogen verwendete Protein nicht in nativer und oligomerer Form vorhanden war. Dies wird dadurch deutHch, daß die von den Autoren angegebenen Titer, die mittels ELISA ermittelt wurden, sehr hoch (um 1/100 000), die im NeutraHsierungstest gemessenen Titer dagegen extrem niedrig sind (oft weit weniger als 1/1000). Dies deutet darauf hin, daß die jeweils verwendeten Antigene zwar starke immunogene Wirkung besitzen, also eine große Menge Antikörper dagegen gebildet werden, daß diese Antikörper aber das native Protein, und damit, auch den Virus kaum oder gar nicht erkennen.

Die niedrigen Titer im NeutraHsierungstest zeigen, daß das native Antigen erkennende Antikörper nur in sehr niedrigen Titern vorhanden sind. Niedertitrige Antikörper aber führen häufig zu einer Erhöhung der Virusinfektivität [Prabhakar et al., Nature 290, 590 (1981)]. Mit anderen Worten, anstatt den Wirt vor der Infektion zu schützen, wird durch virusspezifische Immunglobuline die Infektivität erhöht. In diesem Fall hat die Vaccine das Gegenteil des gewünschten Effektes zur Folge. Die geschilderte Problematik ergibt sich auch bei aUen anderen Viren, die eine Oberflächenmembran mit membrangebundenen Proteinen besitzen. Neben der Verwendung als Impfstoff werden native Proteine bzw. Proteindomänen auch als Immuntherapeutikum oder für diagnostische Zwecke verwendet. Für die Diagnose werden sowohl Antigene, als auch die dagegen gerichteten Antikörper eingesetzt.

Aufgabe der vorliegenden Erfindung ist es, ein Verfahren zur Gewinnung von nativen Domänen viraler Membranproteine, insbesondere nativer Ektodomänen des env- Glykoproteins gplόO des menschlichen Immunschwächevirus HIV zur Verfügung zu stellen, die beispielsweise als Impfstoff, zur Immuntherapie oder für diagnostische Zwecke verwendet werden können. Diese Aufgabe umfaßt auch die

Zurverfügungstellung eines Verfahrens zur Identifikation einer geeigneten Stelle zum Einbau einer Erkennungssequenz für proteinspaltende Enzyme, insbesondere CoUagenasen, in virale Membranproteine, beispielsweise in das HlV-env Glykoprotein gplόO, sowie die Zurverfügungstellung einer geeigneten CoUagenasespaltstelle.

Diese Aufgabe wird dadurch gelöst, daß ein Verfahren zur Gewinnung von Domänen viraler Membranproteine in nativer Form zur Verfügung gestellt wird, das dadurch gekennzeichnet ist, daß - in das Gen, das für das Protein codiert, das die gewünschte Proteindomäne enthält, an geeigneter SteUe eine Nukleotidsequenz insertiert wird, die für eine Aminosäuresequenz codiert, welche eine Erkennungssequenz darsteUt, insbesondere für Proteasen oder Glycolipidanker, und die so erhaltene Gen-Mutante in eukaryontischen ZeUen exprirniert wird, und diese eukaryontischen Zellen oder Teile hiervon, die die gewünschte Proteindomäne enthalten, einem enzymatischen Verdau, bevorzugt durch eine Protease, die die insertierte Erkennungssequenz spezifisch erkennt und spaltet, unterzogen wird und die gewünschte Proteindomäne aus dem Gemisch gewonnen wird.

Ganz allgemein gesprochen bedeutet dies, daß zunächst an geeigneter Stelle in das Gen, das für die Ausgangsform (z.B. gpl60), das Vorläuferprotein der zu gewinnenden Proteindomäne, codiert, eine für eine Aminosäuresequenz codierende Nukleotidsequenz eingebaut wird, welche eine Erkennungssequenz für proteinspaltende Enzyme, insbesondere Proteasen, oder GlycoUpidanker darstellt. Nach erfolgter Synthese des Proteins durch geeignete eukaryontische ZeUen wird es an der insertierten Erkennungssequenz mit den entsprechenden Enzymen gespalten und anschHeßend die gewünschte Proteindomäne aufgereinigt. Bei Verwendung des HIV env-Glykoproteins gplόO als Vorläuferprotein resultieren aus diesem Verfahren oligomere, insbesondere tetramere Glykoproteine, deren Monomere eine elektrophoretische Mobilität von ca. 140 kD aufweisen und die im folgenden g l40 genannt werden.

Der Erfindung liegt also die Idee zugrunde, zunächst das komplette Protein zu synthetisieren, da es nur auf diese Weise in nativer und oligomerer Form synthetisierbar ist, und nach erfolgter Synthese die gewünschte Proteindomäne an spezifischer Stelle enzymatisch abzuspalten. Zuvor wird das korrespondierende Gen derart manipuliert, daß das fertige Protein eine zusätzliche Aminosäuresequenz beinhaltet, die als Erkennungssequenz für proteinspaltende Enzyme oder für Glycolipidanker dient. Diese zusätzliche Sequenz ändert nicht die native Proteinstruktur. Durch enzymatische Spaltung des Gesamtproteins an dieser Erkennungssequenz erhält man die gewünschte Proteindomäne in nativer und oligomerer Struktur. Ihrer Natur nach ist diese Erkennungssequenz eine

Aminosäuresequenz, die von Proteasen erkannt und gespalten wird, es kann aber auch eine Erkennungssequenz für Lipidanker sein, wobei mittels Lipasen ebenfalls eine gezielte Spaltung möghch ist [siehe hierzu: Ferguson, M.A.J.; An. Rev. Biochem. 57, 285-320 (1988)]

Im ersten Schritt des erfindungsgemäßen Verfahrens muß zunächst der für den Einbau einer Erkennungssequenz geeignete Bereich im Protein identifiziert werden. Dies erfolgt mittels einer "Pepscan" genannten Methode. Dann wird in der dem identifizierten Proteinbereich entsprechenden Gensequenz eine Erkennungssequenz für eine Endonuklease, z.B. EcoR I erzeugt, in die hinein dann die Sequenz, die für die gewünschte Aminosäuresequenz - die Erkennungssequenz im Protein - codiert, eingebaut wird. Es kann anstatt EcoR I auch jede andere Endonuklease verwendet werden, es sollten aUerdings in der näheren Umgebung der Erkennungssequenz dieser Endonuklease keine weiteren gleichartigen Erkennungssequenzen vorhanden sein, da ansonsten die Klonierungseffizienz abnehmen kann. Das so erhaltene Gen wird in einen Vektor, beispielsweise ein Plasmid, eingebaut, der in geeignete eukaryontische ZeUen transfiziert wird, welche dann das gesamte Protein inclusive der insertierten Erkennungssequenz synthetisieren. Auf diese Weise erhält man das gesamte Protein in nativer, oHgomerer und glycosilierter Form. Daraufhin wird mit einem geeigneten Enzym, das das Protein an der eingebauten Erkennungssequenz schneidet, die gewünschte Domäne vom Rest des Proteins abgetrennt. Mittels geeigneter Reinigungsmethoden wie z.B. Affinitätschromatographie, Ionenaustauschchromatographie oder Gradientenzentrifugation wird die gewünschte Proteindomäne anschließend aufgereinigt. Was das verwendete spaltende Enzym betrifft, so ist das wesentliche Kriterium für dessen Eignung, daß es die Spaltstelle an deren Aminosäuresequenz erkennt. Diese Bedingung erfüllen bakterielle Collagenasen, auch vereinzelt pflanzliche Collagenasen sowie z.B. der Blutgerinnungsfaktor Xa.

In einer bevorzugten Ausführungsform der Erfindung wird zur Erhöhung der Ausbeute die natürliche Prozessierungssequenz des Vorläuferproteins zerstört. Dies erfolgt beispielsweise durch Austausch einer oder mehrerer Aminosäuren in der Prozessierungssequenz. Dies hat zur Folge, daß das Vorläuferprotein, im Falle von HIV das gplόO, nicht in die einzelnen Domänen (bei HIV also gp41 und gpl20) aufgespalten wird.

Das Vorläuferprotein wird im rauhen endoplasmatischen Retikulum (RER) der Zelle synthetisiert. Erst im Golgi-Apparat, also während des Transports zur Zelloberfläche, wird das Protein prozessiert, d.h. in die einzelnen Domänen aufgespalten. Wird die Prozessierungssequenz des Vorläuferproteins zerstört, gewinnt man nicht nur den Anteil an Vorläuferprotein, der zum Zeitpunkt der Membranpräparation noch im RER vorhanden ist, sondern zusätzlich auch das bereits zur ZeUoberfläche transportierte unprozessierte Vorläuferprotein.

In einer weiteren bevorzugten Ausführungsform der Erfindung erfolgt die Einschleusung des mutanten Gens in die eukaryontische Zelle nicht mittels eines Plasmids, sondern mittels eines rekombinanten Virus, insbesondere mittels eines rekombinanten Vaccinia Virus. Besonders für die Herstellung größerer Mengen der gewünschten viralen Proteindomänen ist die Verwendung eines rekombinanten

Vaccinia Virus als Vektor vorteilhaft. Die jeweilige Genmutante kann beispielsweise in das Thymidinkinase-Gen des Vaccinia Virus insertiert werden. Da die Wahrscheinlichkeit für eine solche Rekombination bei ca. 1/1000 bis 1/10 000 liegt, ist es vorteilhaft, nach der Rekombination auf den rekombinaten Virus zu selektionieren. Dies kann beispielsweise durch Einsatz des Mutagens

Bromodesoxyuridin in HTK'-ZeUen erfolgen. Nur der Wildtyp- Vaccinia Virus (TK⁺ ) baut dieses mutagene Nukleotidderivat in die DNA ein und schon nach zweimaliger Selektion Hegt der Anteil der rekombinanten Viren (TK") bei ca. 90%. Hohe Proteinausbeuten erhält man bei Verwendung eines Late-Promotors, beispielsweise des Cowpox-160K-Promotors, der ein starker Vaccinia— Promotor ist [Patel, D. D. et al., "Proc. Natl. Acad. Sei. USA" 85, 9431-9435 (1988)]. Eine Übersicht über die Verwendung des Vaccinia Virus als Vektor für die Expression von Genen im Cytoplasma eukaryotischer Zellen gibt Moss, B., ["Science" 252, 1662-1667 (1988)]. Weitere Spezifikationen im Hinblick auf das erfindungsgemäße Verfahren, eine erfindungsgemäße Erkennungssequenz sowie die erfindungsgemäßen nativen Proteindomänen und deren Verwendung sind Gegenstand der Unteransprüche.

Die Erfindung, die oben ganz allgemein skizziert ist, wurde gemacht bei der Untersuchung der Struktur des env-Glykoproteins von HIV, sie kann aber prinzipiell bei allen Viren angewandt werden, die eine Envelope-Membran besitzen. Für Kristallisationsversuche mit der Ektodomäne des env-Glykoproteins war es nötig, diese Ektodomäne in der nativen oligomeren Form ohne die hydrophobe transmembrane Domäne herzustellen. Der Oligomerisierungsprozeß von viralen Glykoproteinen vom Typ I ist aber wahrscheinlich abhängig von der Anwesenheit dieser hydrophoben transmembranen Domäne während der Biosynthese. Darüberhinaus scheint die Faltung der Polypeptidkette dadurch beeinflußt zu werden, daß die Polypeptidkette während der Synthese membrangebunden ist. Um die Ektodomäne des env-Glykoproteins in nativer Form zu erhalten, wurde nach dem Einbau einer für eine CollagenasespaltsteUe codierenden Sequenz in das env-Gen zunächst das gesamte, mutante env-Glykoprotein in COS-Zellen synthetisiert, danach die gewünschte Ektodomäne mittels einer bakterieUen CoUagenase vom synthetisierten Gesamtprotein abgespalten und anschließend aufgereinigt.

Als großes Problem erwies sich dabei, eine geeignete SteUe im Protein für den Einbau der CoUagenasespaltstelle - der Erkennungssequenz - zu identifizieren. Es hat sich nämlich gezeigt, daß es nur einen sehr kleinen Bereich im Protein gibt, an der die Erkennungssequenz eingebaut und das Protein dann auch erfolgreich gespalten werden kann. Bei rein empirischer Ermittlung einer solchen geeigneten SteUe mußten mehr als 30 verschiedene env-Gen-Mutanten hergestellt werden, bei denen an unterschiedHchen Stellen in der gewünschten Region von gp41 die Erkennungssequenz eingebaut wurde, um eine Stelle zu finden, an der die gewünschte proteolytische Spaltung ögUch war.

Die im folgenden verwendete Numerierung der Aminosäuren des HTV env- Glykoproteins bzw. der Basen des HTV env-Gens bezieht sich auf die von Ratner verwendete Numerierung [Ratner et al., "Nature" 313, 277-284 (1985)].

Die genaue räumHche Struktur des env-Glykoproteins ist nicht bekannt, die Struktur des Bereichs des Proteins, in dem die ProteasespaltsteUe sinnvollerweise eingebaut werden kann, stellt sich folgendermaßen dar (siehe auch Fig. 1): Geht man von Hydrophobizitätsprofilen von gp41 aus, ist die erste Aminosäure des transmembranen Bereichs nach Ansicht des Erfinders Trp 678. Über die genaue Lage des transmembranen Bereichs von gp41 ist sich die Fachwelt allerdings nicht einig. Bolognesi, P.D. ["Mol. Biol. Med." 7, 1-15 (1990)] nimmt beispielsweise an, daß der transmembrane Bereich des gplόO von Aminosäure 691 bis Aminosäure 712 reicht. Klar ist, daß die vier konservierten Glykosylierungsstellen von gp41, die an den Positionen 611, 616, 624 und 637 lokalisiert sind, aminoterminal zur transmembranen Domäne, also in der Ektodomäne liegen müssen. Weiterhin kann man aus UV- Circulardichroismus-Messungen an gereinigten gpl20- und gpl60-Präparationen auf die Sekundärstruktur von gp41 schließen. Diese Messungen haben ergeben, daß gpl20 fast ausschUeßlich aus ß-Faltblattstrukturen besteht, während gplόO ca. 30% — helicale Bereiche aufweist. Dies deutet darauf hin, daß die Sekundärstruktur von gp41 im wesentlichen eine a — Helix ist. Darüberhinaus kann man aus Sequenzanalysen des env-Gens verschiedener HIV-Stämme schließen, daß die Region in gp41 zwischen Pro 609 und dem Transmembranbereich (Trp 678) ebenfalls α— heHcale Struktur besitzt. Diese Annahme wird noch dadurch unterstützt, daß keiner der untersuchten HIV-Stämme zwischen Pro 609 und Trp 678 ein Prolin besitzt, welches wahrscheinHch die α— heHcale Struktur unterbrechen würde. Unter weiterer Einbeziehung der Ergebnisse des Erfinders und anderer, daß es sich bei dem HTV-env-Glykoprotein um ein Tetramer handelt, kann man sich vorsteUen, daß vier lange amphiphatische a— HeHces eine umeinandergewundene Schraubenstruktur (coüed-coü) büden, wobei jeweüs die hydrophoben Regionen der Untereinheiten miteinander interagieren und dabei die ohgomere Struktur von gp41 stabüisieren. In diesem ModeU Hegen die hydrophüen Aminosäureseitenketten außen an einer tetrameren Schraube, wobei bei verschiedenen Stämmen verschiedene Aminosäuren vorliegen können.

Aufbauend auf den vorgenannten Hypothesen wurde für den Einbau der Erkennungssequenz die Region zwischen der letzten GlykosyHerungssteUe bei der Aminosäure 637 und dem Beginn der transmembranen Domäne ausgewählt, ein immerhin 40 bis 53 Aminosäuren langes Stück, je nachdem, wo man den Beginn des transmembranen Bereichs annimmt. Wesentlich für die Funktionalität der Erkennungssequenz ist, daß sie gut zugängHch sein muß für das entsprechende spaltende Enzym.

Auf der Basis dieser Erkenntnis, daß die LokaHsierung einer geeigneten Stelle für den Einbau einer Erkennungssequenz im wesenthchen von der Zugänglichkeit des entsprechenden Proteinbereichs für das spaltende Enzym abhängig ist, wurde ein neues Verfahren entwickelt zur Identifizierung einer geeigneten Einbaustelle für eine Erkennungssequenz, welches Gegenstand der Patentansprüche 4-7 ist.

Da Antikörper gegen ein Protein nur gegen diejenigen Strukturen gebildet werden können, die außen an dem Protein liegen, die also den Zellen des Immunsystems zugänglich sind, und die Zugänglichkeit auch ein wesentliches Kriterium für eine funktionsfähige Erkennungssequenz ist, können geeignete Bereiche im Protein für den Einbau von Erkennungssequenzen dadurch identifiziert werden, daß man diejenigen Epitope identifiziert, gegen die nach Immunisierung mit dem jeweiligen Protein Antikörper gebüdet werden. Horal P. und Mitarbeiter haben zur

Untersuchung, gegen welche Bereiche des HIV-1 env-Glykoproteins gp41 überhaupt Antikörper gebildet werden, die sogenannte "Pepscan"-Methode angewandt [siehe Horal P. et al. in der Zeitschrift "J. Virol", 65, 2718-2723 (1991)]. Diese Methode wird bei der vorliegenden Erfindung, anders als bei Horal et al. zur Identifikation des geeigneten Bereichs im Protein für die Erkennungssequenz eingesetzt. Hierzu werden im Prinzip kleine Bruchstücke des Proteins mit Antikörpern gemischt, die durch Immunisierung eines Säugetieres mit dem gesamten Protein gewonnen wurden. In der Praxis wird nicht das Protein in Bruchstücke zerlegt, sondern der Einfachheit halber entsprechend der Proteinsequenz überlappende Peptide mit einer Länge von 5 bis 30, insbesondere von 12 bis 16 Aminosäuren synthetisiert. Diese Peptide werden mit Serum von HTV-1-positiven Patienten versetzt. Die in diesem Serum vorhandenen Antikörper reagieren mit denjenigen Peptiden, die beim nativen Protein zugängHch an der Oberfläche Hegen und die damit potentieUe EinbausteUen für Erkennungssequenzen darsteUen. Mit dieser Methode kann der am besten geeignete Abschnitt im Protein für den Einbau einer Erkennungssequenz je nach Länge der verwendeten Peptide bis auf einen Bereich weniger Aminosäuren identifiziert werden. Um die genaue, optimale SteUe zu finden, werden soviele Proteinmutanten hergesteUt und getestet, wie nötig sind, um in dem zuvor identifizierten Bereich exakt die optimale Stelle für die Erkennungssequenz zu lokaHsieren. Beim env-Glykoprotein von HTV-l Hegt die am besten geeignete SteUe für den Einbau einer CollagenasespaltsteUe zwischen den Aminosäuren Leu 659 und Leu 660 (siehe Fig. 2). Aufgrund der KoHnearität von Gen- und Proteinsequenz entspricht dies den Nukleotiden A 7778 und T 7779 des env-Gens. Ausgehend von dieser SteUe ist in einem Bereich von jeweils 17 Aminosäuren Richtung C-Terminus bzw. N-Terminus der Einbau einer CoUagenasespaltstelle ebenfaUs möglich, wobei mit zunehmendem Abstand mit geringeren Ausbeuten an Spaltprodukten und damit der gewünschten Proteindomäne zu rechnen ist. Eine weitere Schwierigkeit stellte die Ermittlung der Struktur einer geeigneten Spaltstelle dar. Es gibt recht wenige Proteasen, die Polypeptide sequenzspezifisch spalten. Beispiele für hochspezifische Proteasen sind bakterielle, vereinzelt auch pflanzliche Collagenasen, oder der Blutgerinnungsfaktor Xa. Auch Erkennungssequenzen für Glycolipidanker sind prinzipiell geeignet. Erschwerend kommt hinzu, daß die meisten Endoproteasen, anders als beispielsweise DNA Restriktionsendonukleasen, für die Erkennung der Spaltstelle nicht nur auf die Sequenz, sondern auch auf bestimmte Sekundär- oder Tertiärstrukturen des Substrates angewiesen sind, welche aber nicht bekannt sind. Weiterhin darf die Erkennungssequenz nicht zu groß. sein, um ausschließen zu können, daß durch ihre Größe die Struktur des Gesamtproteins wesentlich beeinflußt wird.

Am besten geeignet als Erkennungssequenz hat sich eine kurze collagenähnliche Sequenz der allgemeinen Form: - (G - P - X)_n - wobei n > 1, insbesondere 3 und X eine der 20 durch den genetischen Code festgelegten Aminosäuren ist (Anspruch 4).

Eine ähnHche Sequenz wird in der deutschen Patentanmeldung DE 3731 874 vorgeschlagen, aUerdings als Teü eines Fusionsproteins. Im Gegensatz zur vorHegenden Erfindung ist das Ziel, das in der Patentanmeldung DE 3731 874 verfolgt wird, besonders kleine Proteine bzw. Peptide in Fermentationsverfahren herzusteUen. Da aber gerade derartige Peptide verstärkt einem proteolytischen Abbau in der ZeUe ausgesetzt sind, wird vorgeschlagen, das Peptid als Teü eines größeren Fusionsproteins zusammen mit einer bakterieUen Aminosäuresequenz und einer coUagenähnHchen Sequenz in einer bakterieUen Wirtszelle zu synthetisieren und anschHeßend mit einer bakterieUen Collagenase zu spalten.

Unter Verwendung der genannten coUagenähnHchen Sequenz wurden drei verschiedene HTV-l env-Gen Mutanten (E3CA, E3CB, E3CC) hergestellt, deren

Expressionsprodukt mittels einer bakteriellen CoUagenase in der gewünschten Weise spezifisch gespalten werden kann. Unter Verwendung dieser Mutanten lassen sich Ektodomänen des env-Glykoproteins als wasserlösHche oHgomere, insbesondere tetramere Glykoproteine gewinnen, deren Monomere eine elektrische Mobüität von ca. 140 kD aufweisen und daher gpl40 genannt werden. Diese Proteine bestehen aus der Domäne gpl20 und einem Teü der Domäne gp41 (Ansprüche 11 bis 14). Da sie keine Transmembrandomäne mehr aufweisen, sind anders als bei der Reinigung von komplettem gplόO keine starken Detergentien, welche die native Struktur der Glykoproteine verändern könnten, zur Aufreinigung dieser Glykoproteine notwendig.

Klare Evidenzen dafür, daß gpl40 oligomere Struktur besitzt, ergeben sich zum einen aus Sedimentationsanalysen [Fig. 4; siehe hierzu auch Earl, P.L. et al. "Proc. Natl.

Acad. Sei. USA", 87, 648-652 (1990)], zum anderen aus Crosslinking-Experimenten [zu dieser Methodik siehe Schawaller, M. et al, "Virology" 172, 367-369 (1989)]. Die

Gewinnung des oligomeren gpl40 unter Verwendung der env-Gen Mutante E3CA wird im folgenden Ausführungsbeispiel in Verbindung mit den Figuren 1 bis 4 näher erläutert. Es zeigen:

Fig.l: Schema des HIV-env-Glykoproteins mit der Transmembrandomäne in der Oberflächenmembran des Virus. Die Zahlen geben die Position der

Aminosäuren an nach der Nomenklatur von Ratner et al., "Nature" 313, 277-284 (1985). Die Domäne gp41 beginnt bei Aminosäure 512, die aber in einem solchen Schema schlecht lokalisiert werden kann.

Fig.2: Ausschnitte aus den Aminosäuresequenzen der Produkte von Wildtyp-env- Gen (El(WT)) des BHIO-Klons und verschiedenen Mutanten. Die

Veränderungen bei den Mutanten gegenüber dem Wildtyp-env-Produkt sind jeweils unterstrichen.

Fig.3: Spezifische Spaltung des Wildtyp-env- und des E3CA-env- Proteins durch unterschiedliche Konzentrationen an bakterieUer Collagenase. Die erhaltenen Produkte wurden analysiert durch Immunoblotting nach gelelektrophoretischer

Trennung auf 6% SDS Polyacrylamidgel und anschheßende Detektion mit polyklonalem Kaninchenserum gegen gpl20. Danach erfolgte eine Autoradiographie unter Einsatz eines radioaktiv markierten sekundären Antikörpers, der gegen Kaninchen-Immunoglobuline gerichtet ist (Amersham IM 134).

Fig.4: Sedimentationsanalyse der Produkte des CoUagenaseverdaus von Wüdtyp- und E3CA— Mutanten-Membranen. Collagenasekonzentration: 200 mU/ml, 37°C, 3h. Die erhaltenen Produkte wurden geschichtet auf einen vorgeformten 5 bis 20 % Sucrosegradienten in 10 mM HEPES, pH 7.8, 150 mM NaCl und in einem SW41 Rotor (Beckmann) für 16 h bei 35 000 UpM und 5°C zentrifugiert.

Zehn Fraktionen wurden, vom Boden des Gefäßes angefangen, geerntet und durch Immunoblotting analysiert.

Die Konstruktion der env-Gen-Mutanten E3CA, E3CB, E3CC ist in Fig.2 illustriert, in der die Sequenz des Wildtyp env-Gens (El) in der Transmembrandomäne und der aminoterminal zur Transmembrandomäne gelegenen Region dargestellt ist. An der für Leu 659 codierenden Position wurde durch eine Punktmutation eine einzelne Schnittstelle für die Endonuklease EcoRl erzeugt, wodurch im Protein Leu gegen Phe ausgetauscht wird. Das daraus entstehende Produkt ist die env-Gen-Mutante E3. In diese neue EcoRl Schnittstelle wurde eine Basensequenz insertiert, die für folgende Aminosäuresequenz codiert (zur Abkürzung von Aminosäuren siehe z.B. A.L. Lehninger, Biochemie, VCH- Verlag Weinheim, 1987):

V P A G P R G P R G P K F

Diese 13 Aminosäuren lange Sequenz stellt eine Collagenase Erkennungs- und Spaltstelle dar. Das Produkt mit diesem Insert wurde E3CA genannt. Das für diese Sequenz kodierende 39 Basenpaare lange Oligonukleotid wurde mit einem DNA- Synthesegerät der Firma Applied Biosysteins synthetisiert. Zur Herstellung der env- Gen Mutanten sowie deren Klonierung in einen Expressionsvektor siehe auch T. Maniatis et al., Molecular Cloning, Cold Spring Harbor, N.Y., USA (1982).

Konstruktion der env-Gen Mutanten

a: Zerstörung der Prozessierungssequenz:

Zur Ausbeutensteigerung wurde zunächst die natüriiche Prozessierungssequenz des env-Gen Produktes zerstört. In dem Plasmid pVB4 [Bosch, V. und PawUta, M., "J. Virol. 64, 2337-2344 (1990)] wurde Adenosin 7334 gegen Cytosin ausgetauscht (A

7334 C), was beim Protein einen Austausch von Arginin 511 gegen Serin (Arg 511

Ser) bewirkt.

Das so abgeänderte Plasmid pVB4 wurde danach kombiniert mit dem die

ProteasespaltsteUe enthaltenden E3CA— Plasmid (siehe unter c:). Hierzu wurde das 5 -Ende von pVB4 (Sall/HinαTTI-Fragment) mit dem 3 -Ende des E3CA -Plasmids

(Hindiπ/Xhol-Fragment) ligiert und in den p-Bluescript Kloniert.

b: Site-directed Mutagenese:

Gen von BH10 env (Sall/Xhol Fragment) wurde in einen M13 Vektor kloniert. Zum BHIO-Klon siehe Ratner et al. "Nature" 313, 277-284 (1985). Die Mutagenese zur Erzeugung der EcoR I - Erkennungssequenz erfolgte nach T. Kunkel et al. ["Meth. Enzymol."154, 367-382 (1987)] mit dem OHgonukleotid MAN 59:

5^{^} GAA CAA GAA TTC* TTG GAA TTA GAT AAA TGG 3 659 660 Die mutagenisierte Base A 778 IC ist mit einem Stern markiert, die EcoR I- Erkennungsstelle ist fett markiert. Die Zahlen geben die Position der entsprechenden Aminosäuren im env-Gen Produkt an.

Die Verifizierung erfolgte mittels Sequenzierung. Die so erhaltene env-Gen Mutante wird bezeichnet als E3 (BH10, A7781C).

c: Insertion von komplementären Oligonukleotiden:

Die im Blueskript pks + enthaltene EcoR I Erkennungssequenz wurde zerstört durch Öffnen mittels EcoR I, Auffüllen mittels DNA Polymerase I (Klenow Fragment) und

Verbinden der Enden mittels Ligase. Danach wurde env E3 in Blueskript pks + subkloniert. Dann wurde E3 mit EcoR I linearisiert und über ein Agarosegel gereinigt.

Nun erfolgte die Insertion der 39 Nukleotide langen für die CoUagenasespaltstelle codierenden Sequenz in diese EcoR I Erkennungsstelle von E3:

- Man81

^3' Man82 5^'

Die so erhaltene Mutante wird E3CA genannt. Zwei weitere Mutanten wurden erzeugt unter Verwendung der komplementären OHgonukleotidsequenzen Man83 und Man84 (E3CB) sowie Man85 und Man86 (E3CC). Diese OHgonukleotidsequenzen sind im folgenden dargestellt:

Man81 :

5 - AATTAGTTCCTGCCGGTCCAAGAGGTCCAAGGGGACCGA -3'

Man82:

5^{^}- AATTTCGGTCCCCTTGGACCTCTTGGACCGGCAGGAACT -3' an83: 5^{^}- AATTAGCCGTACCTGCCGGACCGCGTGGACCACGCGGACCTA -3^V

Man84:

5'- AATTTAG6TCCGCGTGGTCCACGCGGTCCGGCAGGTACGGCT -3~ Man85:

5^{^}_ AATTAGCAGCTGGTCCCGCAGGACCTCGCGGTCCTAGAGGTCCTA -3^' Man86:

5^ AATTTAGGACCTCTAGGACCGCGAGGTCCTGCGGGACCAGCTGCT -3~ Zur Insertion der komplementären Oligonukleotide in die EcoR I-Erkennungsstelle in E3 wurden die Oligonukleotide in 150 mM NaCl, TE (lOmM Tris, 0,lmM EDTA, pH 8) gemischt (1:1, mohmol). Anschließend wurde 2 h bei 95°C erhitzt und dann über 30 min auf Raumtemperatur abkühlen gelassen. Danach erfolgte die Ligase- Reaktion zusammen mit linearisiertem E3 (pks + ) bei hohem Überschuß an dem jeweiligen Oligonukleotidpaar. Die so hergestellten Plasmide wurden in Echerichia coli DH5 transformiert und durch Sequenzierung analysiert. Die Ausbeute an neu rekombinanten Plasmiden beträgt über 90%.

d: Klonierung in den Expressionsvektor pSVL:

Zur Expression der env-Gene wurden diese in den Expressionsvektor pSVL (Pharmacia, Uppsala, Schweden) kloniert (in pSVL wurde vorher die unique BamHI Erkennungsstelle deletiert). pSVL wurde mit Xhol linearisiert und die env-Gene als Sall/Xhol-Fragment (BH 10 Klon) subkloniert. Die env-Gene wurden unter die Kontrolle des SV40 Late Promotors gestellt.

Eine weitere Möglichkeit, einen die verschiedenen Gene enthaltenden Expressionsvektor herzustellen, besteht im sogenannten PCR (Polymerase Chain Reaction) -constructing. Eine Übersicht über diese Methodik ist zu finden bei Jones, D.H. et al, "Nature", 344, 793-794 (1990).

Die env-Gen Mutanten E3CB und E3CC wurden aus folgendem Grand hergesteüt: Es bestand durchaus die MögUchkeit, daß die Ausrichtung der CoUagenasespaltstelle innerhalb der a— Helix Einfluß auf die Funktionsfähigkeit haben könnte. Da in einer a —Helix drei Aminosäuren ungefähr eine voUe Umdrehung der Helix ausmachen, wurde durch Einfügen einer Aminosäure Alanin (E3CB) bzw. zweier Aminosäuren Alanin (E3CC) die Ausrichtung der CoUagenasespaltsteUe innerhalb der a— Helix um ca. 120° bzw. um ca. 240° verschoben. Die dadurch erhaltenen Mutanten E3CB und E3CC führten aber zum gleichen positiven Ergebnis wie die Mutante E3CA.

Die Expression der verschiedenen env-Gene wurde in COS 7-ZeUen durchgeführt. COS 7-ZeUen sind Fibroblasten, es können stattdessen aber im Prinzip aUe eukaryontischen ZeUen verwendet werden wie z.B. CVl-ZeUen, HefezeUen, InsektenzeUen [Summers, M.D. und Smith, G.E. : A Manual of Methods for Baculovirus Vectors and Insect CeU Culture Procedures. Texas Agricultural

Experiment Station; BuUetin No. 1555, (1988)] etc. Die COS 7-Zellen wurden mit den pSVL Plasmiden durch Elektroporation transformiert und anschließend für 48h in voUständigem Wachstumsmedium [Gluzma Y. et al.; "CeU" 23, 175-182 (1981)] inkubiert. Danach wurden die Zellen geerntet und die env-Proteine analysiert. Für die Transformation der Zellen mit dem Expressionsvektor können alle gängigen Verfahren angewandt werden, die Elektroporation ergibt aber im vorliegenden Fall besonders gute Erfolgsraten zwischen 10 und 50%.

Elektroporation:

Ca. 10⁷ (2 x 10° - 5 x 10⁷) COS 7 Zellen in logarithmischer Wachstumsphase wurden trypsiniert und mit DMEM (Dulbecco Modified Eagles" Medium) gewaschen. Zur Elektroporation wurden die Zellen mit 5 - 30 μg pSVL in DMEM versetzt und in einem BioRad Gene Pulser elektroporiert (Raumtemperatur; 800 μ\; 250V; 500 μF; 0,4 cm Küvette).

Zur Analyse, ob die Collagenasespaltung zum gewünschten Erfolg führt, also ob nach Collagenasebehandlung der Mutante E3CA eine native Ektodomäne des env- Glykoproteins (gpl40) extrahiert werden kann, wurden nach hypotonischer Zellyse mittels Sucrose-Dichtezentrifugation Membranpräparationen hergestellt [SchawaUer, M. et al., "Virology" 172, 367-369 (1989)].

Reinigung der Membranpräparation:

Membranpräparation mehrfach waschen, in HEPES buffered sahne (HBS: 10 mM HEPES 7,8; 150 mM NaCl) aufnehmen: + 1/10 Vol. 10 x HBS, + 1/100 Vol. 1 M CaCl₂, + 1/5 Vol. 20 % ß-D-Octylglucosid bei 37°C. Danach Behandlung mit Potter. Mehrere Stunden bei 37°C inkubieren. AnschHeßend zentrifugieren für 30 min. bei 100 000 x g und 37°C. Der erhaltene Überstand wurde dann einem Proteaseverdau unterzogen mit gereinigter Collagenase (EC 3.4.24.3.) von Clostridium histolyticum (Sigma C0773, Deisenhofen) in Konzentrationen zwischen 1,2 und 333 mU/ml.

CoUagenaseverdau: Der CoUagenaseverdau wurde in folgendem Puffer für 3 h bei 37°C durchgeführt:

300 mM NaCl

20 mM HEPES (Hydroxyethylpiperazinethansulfonsäure), pH 7,8 10 mM CaCl₂ 50/zM ZnCl₂

4% ß-D-Oktylglucosid Diesem Puffer können folgende Proteaseinhibitoren zugefügt werden, um unspezifische Proteolyse zu minimieren:

1 μM E64 (Cystein-Proteaseinhibitor)

1 μM Pepstatin A (Aspartyl-Proteaseinhibitor) ImM PMSF (Phenylmethylsulfonylfluorid) (Serin-Proteaseinhibitor)

Statt ß-D-Oktylglucosid können auch andere milde Detergentien wie CHAPS oder DOC (Desoxycholat) verwendet werden. Zur Wirkung verschiedener Detergentien auf Membranproteine siehe auch Womack, M.D. et al. "Biochim. Biophys. Acta" 733, 210-215 (1983).

Die optimale CoUagenasekonzentration liegt zwischen 50 und 250 mU/ml (3h, 37°C), bei höheren Konzentrationen treten verstärkt unspezifische Verdauprodukte auf und die Ausbeute an gewünschtem Produkt, einem 140 kD Glykoprotein, wird geringer.

Aufreinigung eines 140 kD env-Glykoproteins (gpl40): a: Lentil lectin-Affinitätschromatographie: Die proteolysierte Fraktion wurde 1:1 verdünnt mit destilliertem Wasser und aufgegeben auf eine Lentü Lectin Sepharose 4B - Säule (Pharmacia 17-0444-0 "). Anschließend wurde gewaschen mit 5 Säulenvolumen FIBS, 2% ß-D-Oktylglucosid, danach mit 5 Säulenvolumen HBS und dann mit 5 Säulenvolumen 10 mM HEPES (pH 7,8), 50 mM NaCl. Anschließend wurde eluiert mit 500 - 1000 mM α-D-Methyl-Mannosid in 10 mM HEPES, 50 mM NaCl (evtl. erwärmen auf 37°C). Zur Lentil lectin- Affinitätschromatographie siehe auch Hayman, MJ. et al., "FEBS letters" 29 (2), 185-188 (1973). Das Eluat wurde anschHeßend aufkonzentriert. Gpl40 Hegt jetzt in einer Reinheit von ca. 50 - 70% vor.

b: Mono O FPLC: Das Eluat aus a: wurde aufgenommen in 10 mM BTP (Bis- Trispropane), 50mM H₃B0₄, pH 8,2 und auf eine Mono Q HR 5/5 Säule (Pharmacia) aufgegeben, wobei die Proteinkonzentration bei etwa 1 mg/ml lag. Die Säule wurde eluiert mit einem NaCl-Gradienten von 30 - 600 mM über 40 min, 0,5 - 1 ml/min, UV-Monitor bei 280 nm. Analyse durch SDS PAGE Coomassie und/oder Western Blot. Das gpl40 env-Protein eluiert bei ca. 400 mM NaCl. Gpl40 liegt jetzt in einer Reinheit von ca. 80-90% vor. Die Zugabe von H₃B0₄ (Borat) zum Puffer bringt den Vorteü, daß dadurch das Aggregieren der Glykoproteine verhindert wird. Diese Verhinderung der Aggregation der Glykoproteine durch H₃B0₄ beruht wahrscheinHch auf einer Komplexierung der in Glykoproteinen häufigen vincinalen Hydroxylgruppen (Anspruch 8). c: Sucrosedichtezentrifugation: Auf einen vorgeformten Sucrosegradienten 5-20% in HBS (10 mM HEPES, pH 7,8; 150 mM NaCl) wurde oben ca. 1 ml Eluat aus b: aufgeladen und in einem SW41-Rotor (Beckmann) zentrifugiert bei 35 000 UpM, 16h, 5°C. Anschließend Entnahme von 10 Fraktionen (von unten nach oben). In Fraktion 5 hat gpl40 eine Reinheit von 90 - 95%. Analyse erfolgte durch SDS PAGE und/oder Western Blot. Da während der Zentrifugation keine Ca— Ionen im Puffer enthalten sind, kann statt HEPES-Puffer beispielsweise auch Phosphatpuffer verwendet werden.

Die Proteolyseprodukte wurden analysiert mittels SDS-PAGE (Natriumlaurylsulfat- Polyacrylamidgelelektrophorese) und anschließendem Immunoblotting unter Verwendung eines polyklonalen Kaninchenserums, gerichtet gegen gpl20, das sowohl gpl20, als auch gplόO erkennt.

Der Immunoblot (Western-Blot) in Fig. 3 zeigt, daß das Wüdtyp env-Gen (Klon BH10) und die Mutante E3CA etwa gleiche Mengen an gplόO exprimieren. Offensichtlich verläuft auch die proteolytische Prozessierung von gpl60 zu gpl20 und gp41, welche im Golgi-Apparat abläuft, bei Wüdtyp-env- und Mutanten-env-Protein gleich, wenn die Prozessierungssequenz intakt ist. Nach Behandlung mit bakterieller CoUagenase ergab das E3CA— env-Protein ein neues Verdauprodukt, dessen monomere Form eine elektrophoretische MobiHtät von ca. 140 kD aufweist, welches beim Verdau des Wüdtyp-env-Proteins nicht gefunden wurde. Dieses Verdauprodukt ist die gewünschte native Ektodomäne des env-Glykoproteins. Die mit 140 kD etwas geringere elektrophoretische MobiHtät des neuen Verdauprodukts als die von gpl20 ergibt sich daraus, daß die CoUagenasespaltsteUe bei Aminosäure 659 des

Gesamtproteins gpl60 im Bereich der Domäne gp41 eingebaut wurde. Die Domäne gpl20 endet bei Aminosäure Arginin 511 (siehe auch Fig. 1). Die neu hergesteUte native Ektodomäne des HIV-1 env-Glykoproteins, gpl40, besteht also aus der gesamten Domäne gpl20, einem 148 Aminosäuren langen Teüstück der Domäne gp41 sowie dem nach CoUagenaseverdau verbleibenden Stück der coUagenähnHchen Sequenz. Dieses letztgenannte Stück, das das C-terminale Ende des Glykoproteins büdet, ist zwar eine Art Fremdkörper in dem erfindungsgemäßen Glykoprotein, stört aber dessen Funktion nicht. Es kann, braucht aber nicht unbedingt entfernt zu werden. Die elektrophoretische MobiHtät von gpl20 vom Wüdtyp-env- und vom E3CA-env- Protein wird durch die Collagenasebehandlung nicht verändert. Das zeigt, daß die in der Mutante E3CA insertierte CoUagenasespaltsteUe von der bakteriellen Collagenase spezifisch erkannt und gespalten wird. Ein weiterer Nachweis dafür, daß die in der Mutante E3CA insertierte CoUagenasespaltstelle von der bakteriellen Collagenase spezifisch erkannt und gespalten wird, ergibt sich aus den Ergebnissen der Sedimentationsanalyse der Collagenasespaltprodukte (Fig. 4). Membranpräparationen von COS 7-Zellen, die das Wildtyp- oder das E3CA— env-Gen exprimieren, wurden mit 4% ß-D- Oktylglycosid extrahiert und wie oben beschrieben mit Collagenase verdaut. Die erhaltenen Verdauprodukte wurden mittels Sucrose-Dichtezentrifugation über einen vorgeformten 5% - 20% Sucrosegradienten in 10 mM HEPES, pH 7.8, 150 mM NaCl in Abwesenheit von Detergentien zentrifugiert für 16 h bei 35 000 UpM in einem SW41 Rotor (Beckmann). Danach wurden insgesamt zehn Fraktionen entnommen und mittels SDS-PAGE und Immunoblotting auf ihren Gehalt an env-Proteinen untersucht. gpl20 wurde in beiden Fällen in den Fraktionen 7 und 8 wiedergefunden, was dem monomeren gpl20 mit einem Sedimentationskoeffizienten von 7S entspricht. Das Verdauprodukt von 140kD, das nur bei der E3CA- Mutante und nicht beim Wildtyp auftrat, wurde dagegen in Fraktion 5 wiedergefunden, was einem Sedimentationskoeffizienten von HS entspricht.

In einer bevorzugten Ausführungsform wird ein rekombinantes Vaccinia Virus (W) als Expressionsvektor verwendet. Die Konstruktion dieses rekombinanten Vaccinia Virus wird im folgenden Ausführungsbeispiel näher beschrieben.

Als Ausgangsmaterial wurde das Vaccinia Shuttle plasmid p2100 verwendet [Patel, D. D. et al., "Proc. Natl. Acad. Sei. USA" 85, 9431-9435 (1988)]. Dieses enthält neben bakterieUem Origin und Resistenzgen folgendes Genfragment:

Tk-L Cowρox l60K MCS Tk-R

— ι f 1 \ C= — E=3-

Tk-L = Linker Arm des Thymidinkinase-Gens Tk-R = Rechter Arm des Thymidinkinase-Gens Cowpox 160K = Promotor/Enhancer Sequenzen MCS = Multiple cloning site

Durch Klonieren von doppelsträngigen Oligonukleotiden wurde 3 " zum Promotor eine Lac O Sequenz, 24 bp paHndrom, insertiert und die MCS um mehrere unique Endonuklease-Erkennungsstellen erweitert. Die Lac O Sequenz ist nötig, um die Transkription in E. coli auf ein Minimum zu unterdrücken. In die neuen Restriktionsstellen wurde das jeweilige env-Gen (Wildtyp oder Mutante: aus pks Plasmid) cloniert (z.B. E3CA) [zur Methodik siehe Chakrabarti, S. et al., "Molec. Cell Biol." 5, 3403-3409 (1985)].

Man erhält folgendes Konstrukt:

Tk-L Cowpox lόOK env Tk-R

-CZ C

Lac O

Für die Herstellung rekombinanter Vaccinia Viren wurden die Plasmide analysiert durch Restriktionsanalyse und partielle Sequenzierung. Die Plasmide wurden in CV 1 Zellen transfiziert durch Elektroporation (Bedingungen wie bei COS-7 Zellen, siehe erstes Ausführungsbeispiel) und mit Wüdtyp W (Stamm Copenhagen) infiziert ( Multiplicity of Infection (M O I) < 1). Es entstehen durch homologe Rekombination im Thymidinkinase-Gen des Plasmids mit dem Thymidinkinase-Gen des W mit einer Wahrscheinlichkeit von etwa 1/1000 - 1/10000 rekombinante W, durch die das env-Gen exprimiert werden kann. Da diese phänotypisch TK" sind, können sie durch 5 '-Bromodeoxyuridin (BdUR)- Selektion in HTK" ZeUen positiv selektioniert werden. Zwei Runden BdUR/HTK- Selektion und anschUeßendes "Plaquen"

(identifizieren von Plaques und entnehmen von rekombinanten W) aus CV 1 ZeUen ergibt ca. 50-90% env exprimierende Plaques (W env), die durch Western Blot einer 1 ml Kultur identifiziert werden können. Nochmahges Plaquen führt zu dem gewünschten rekombinanten Vaccinia Virus, durch den env exprimiert werden kann.

Verwendung der viralen Membranproteindomänen:

Die erfindungsgemäßen nativen Domänen viraler Membranproteine können als Impfstoff gegen Viren eingesetzt werden. Hierzu werden sie dem Patienten vorzugsweise in Kombination mit geeigneten Adjuvantien verabreicht. Vorher müssen allerdings eventueU noch enthaltene Pufferbestandteile, wie beispielsweise HEPES, entfernt werden. Dies kann erfolgen z.B. durch Dialyse gegen physiologische Kochsalzlösung in Phosphatpuffer.

Weiterhin können die nativen Domänen der viralen Membranproteine zur Immuntherapie verwendet werden. Auch für diagnostische Zwecke sind die nativen viralen Proteindomänen geeignet. Zum einen können sie als Antigen beispielsweise in Immunoassays zum Nachweis spezifischer Antikörper dienen, zum anderen können sie auch eingesetzt werden zur Gewinnung von Antikörpern, sowohl monoklonalen als auch polyklonalen Antikörpern, die dann wiederum zum direkten Nachweis des Virus dienen können.

Ein weiterer wichtiger Verwendungszweck der aufgereinigten nativen Domänen viraler Membranproteine ist ihre Verwendung zur Kristallisation. Ist das Protein in kristalliner Form vorhanden, kann die dreidimensionale Struktur ermittelt werden. Dies ist insbesondere dahingehend interessant, als dadurch möglich wird, die genaue Struktur der Bindungstasche aufzuklären. Kennt man diese Struktur, ist es eventuell möglich, Inhibitoren zu konstruieren, das heißt, kleinere Moleküle, die genau in diese Bindungstasche hineinpassen und damit die Bindung des Proteins, also des Virus, an das CD4-Molekül, den Rezeptor der Wirtszelle, zu blockieren.

Claims

Patentansprüche

1. Verfahren zur Gewinnung von Domänen viraler Membranproteine in nativer Form, dadurch gekennzeichnet, daß in das Gen, das für das Protein kodiert, das die gewünschte Proteindomäne enthält, an geeigneter Stelle eine Nukleotidsequenz insertiert wird, die für eine

Aminosäuresequenz kodiert, welche eine Erkennungssequenz darstellt, insbesondere für Proteasen oder Glycolipidanker, und die so erhaltene Gen-Mutante in eukaryontischen Zellen exprimiert wird, und diese eukaryontischen Zellen oder Teile hiervon, die die gewünschte

Proteindomäne enthalten, einem enzymatischen Verdau, bevorzugt durch eine

Protease, die die insertierte Erkennungssequenz spezifisch erkennt und spaltet, unterzogen wird und die gewünschte Proteindomäne aus dem Gemisch isoliert wird.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die zu gewinnenden viralen Membranproteindomänen Ektodomänen des env- Glycoproteins von HIV sind.

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die natürHche Prozessierungssequenz in dem Protein, das die gewünschte Proteindomäne enthält, durch Austausch mindestens einer Aminosäure zerstört wird.

4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß

- die Erkennungssequenz die folgende aUgemeine Form besitzt:

- (G - P - X)_n- wobei n eine ganze Zahl größer 1, insbesondere 3 und X eine der 20 durch den genetischen Code festgelegten Aminosäuren ist, und das für den Verdau verwendete Enzym eine Collagenase, insbesondere eine bakterieUe CoUagenase ist.

5. Verfahren nach einem der Ansprüche 1 bis 4 , dadurch gekennzeichnet, daß die Erkennungssequenz in einen Bereich eines viralen Membranproteins eingebaut wird, der begrenzt wird durch die erste und fünfzigste Aminosäure vor Beginn des transmembranen Bereiches.

6. Verfahren nach einem der Ansprüche 2 bis 4 , dadurch gekennzeichnet, daß die Erkennungssequenz in einen Bereich des env-Glycoproteins von HIV eingebaut wird, der begrenzt wird durch die Aminosäuren 645 und 673, insbesondere durch die Aminosäuren 656 und 663.

7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß die Erkennungssequenz zwischen den Aminosäuren 659 und 660 in das env- Glycoprotein von HIV eingebaut wird.

8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß der Puffer, der bei der Reinigung der gewünschten Proteindomäne aus dem Gemisch nach dem enzymatischen Verdau verwendet wird, Borat enthält in einer Konzentration zwischen 1 und 200 mM, insbesondere zwischen 30 und 100 mM.

9. Verfahren nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, daß ein für den Einbau einer Erkennungssequenz in Proteine geeigneter Bereich dadurch identifiziert wird, daß entsprechend der Sequenz des untersuchten Proteins synthetisierte kurze, überlappende Peptide mit Serum eines gegen dieses Protein immunisierten Säugetieres, insbesondere mit Serum HTV positiver Menschen, gemischt werden, wobei diejenigen Peptide, die mit den in diesem Serum enthaltenen Antikörpern reagieren, für den Einbau einer Erkennungssequenz geeignete Bereiche in dem untersuchten Protein darsteUen.

10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, daß die synthetisierten Peptide eine Länge zwischen 5 und 30 Aminosäuren, insbesondere zwischen 12 und 16 Aminosäuren aufweisen.

11. Isolierte Domänen viraler Membranproteine, insbesondere isolierte Ektodomänen des env-Glycoproteins von HIV, insbesondere hergestellt nach dem Verfahren gemäß einem oder mehreren der Ansprüche 1 bis 10, dadurch gekennzeichnet, daß sie in nativer Form, insbesondere in oligomerer und glycosylierter Form vorliegen.

12. Isolierte Domänen viraler Membranproteine nach Anspruch 11, dadurch gekennzeichnet, daß sie in tetramerer Form vorliegen.

13. Isolierte Domänen viraler Membranproteine nach einem der Ansprüche 11 oder 12, dadurch gekennzeichnet, daß ihre monomere Form eine elektrophoretische MobiHtät von etwa 140 kD besitzt.

14. IsoHerte Domänen viraler Membranproteine nach einem der Ansprüche 11 bis 13, dadurch gekennzeichnet, daß sie zusammengesetzt sind aus der Domäne gpl20 des HTV -env-Glycoproteins, dem 131 bis 165, insbesondere 148 Aminosäuren langen aminoterrninalen Stück der Domäne gp41 des HTV env-Glycoproteins sowie gegebenenfalls dem nach enzymatischem Verdau gemäß Anspruch 4 verbleibenden Stück der Erkennungssequenz.

15. Isolierte Domänen viraler Membranproteine nach einem der Ansprüche 11 bis

14, gekennzeichnet durch ihre Verwendung als Impfstoff gegen Viren, insbesondere gegen HTV.

16. Isolierte Domänen viraler Membranproteine nach einem der Ansprüche 11 bis

14, gekennzeichnet durch ihre Verwendung zur Diagnose von entsprechenden viralen Infektionen, insbesondere von HIV.

17. Isolierte Domänen viraler Membranproteine nach einem der Ansprüche 11 bis 14, gekennzeichnet durch ihre Verwendung zur Gewinnung von polyklonalen oder monoklonalen Antikörpern, die gegen diese Proteindomänen gerichtet sind.

18. Isolierte Domänen viraler Membranproteine nach einem der Ansprüche 11 bis 14, gekennzeichnet durch ihre Verwendung zur Immuntherapie, insbesondere bei HIV-positiven Patienten.

19. IsoHerte Domänen viraler Membranproteine nach einem der Ansprüche 11 bis 14, gekennzeichnet durch ihre Verwendung zur KristaUisation dieser Proteindomänen.