IDENTIFICATION DE GENES DE BACTERIES LACTIQUES DANS LA BIOSYNTHESE DES EXOPOLYSACCHARIDES
nγ ή at. de 1 ' invention
La présente invention se rapporte à de nouvelles fonctions enzymatigues de bactéries lactiques alimentaires, ainsi que de nouveaux enzymes et gènes, impliqués dans la biosynthèse d ' exopolysaccharides .
τ;t-af. de la technicrue
Il est connu que les bactéries lactiques sont susceptibles de produire dans leur milieu de culture deux classes de polysaccharides, à savoir les homopolysaccharides comme les dextranes ou les levanes gui sont constitués par l'assemblage répété d'un seul saccharide, et les hétéropolysaccharides appelés communément exopolysaccharides ou EPS (EPS est l'abréviation du terme "exopolysaccharide") constitués par l'assemblage de plusieurs saccharides différents formant une unité répétitive (Cerning J. , Bactéries lactiques, Vol I, de Rossart H et Luquet F. M., Lorica, 309-329, 1994).
Une bactérie lactique alimentaire produisant un EPS peut conférer un caractère filant et/ou une texture lisse et crémeuse à un lait acidifié (Cerning et al . , FEMS Microbioi., JLZ, 113-130, 19/90). Les EPS peuvent aussi présenter des activités biologiques particulièrement intéressantes pour la santé humaine ou animale, comme des
activités anti-tumeurs ou probiotiques , par exemple (Oda M. et al . , Agric. Biol . Chem. , 47, 1623-1625, 1983; EP-94870139.6)
Par ailleurs, l'industrie alimentaire est confrontée à une instabilité génétique de la biosynthèse des EPS dans les bactéries lactiques. Ceci se traduit généralement au cours d'une fermentation par la perte de la production d ' EPS par tout ou partie des bactéries lactiques
(voir "Cerning J." ci-dessus). Les produits fermentes industriels sont ainsi sujets à des variations dans leur contenu en EPS, ce qui n'est pas toujours acceptable. Pour remédier à ces problèmes, l'industrie recourt actuellement à l'isolement et la caractérisation périodique de ses bactéries de manière à séparer celles qui ont perdu leur caractère originel .
On connaît des gènes de bactéries lactiques alimentaires impliqués dans la biosynthèse d ' EPS .
Le document O92/02142 révèle ainsi l'existence du plasmide pHV67 qui produit dans Lactococcus lactis subsp. lactis (mésophile) une substance capable d'augmenter la viscosité d'un lait fermenté. La structure saccharidique de cette substance n'étant pas connue, les différentes fonctions des enzymes codées par pHV67 sont également inconnues. Le document US-5,066,588 décrit deux plasmides provenant d'une souche de Streptococcus cremoris
(mésophile) capable de conférer un caractère épaississant à un Streptococcus lactis . La structure saccharidique de cet épaississant n'étant pas connue, les différentes fonctions des enzymes codées par ces plasmides sont également inconnues .
Vescovo et al . ont mis en évidence un plasmide d'une souche Lactobacillus casei subsp. casei (mésophile) codant pour un phénotype Muc+, c'est à dire
pour des fonctions liées à la production d'épaississants exocellulaires (Vescovo et al . , Biotechnology Letters, Vol II, 709-712, 1989). La structure saccharidique de cet épaississant n'étant pas connue, les différentes fonctions des enzymes codées par ce plasmide sont également inconnues .
Le document EP-A-0750043 (Société des Produits Nestlé) décrit un opéron de gènes de la souche Streptococcus thermophllus CNCM 1-1590 impliqué dans la synthèse d'un EPS ayant la structure répétitive suivante :
→3)-β-D-Glcp(l→3)-α-D-Ga^NAc(l→3)-β-D-Galp(l→
6 t 1 α -D-Galp
Van Kranenburg et al . ont aussi décrit un opéron de gènes, présent sur un plasmide d'une souche
Lactococcuε lactis, impliqué dans la synthèse d'un EPS ayant la structure répétitive suivante (Mol. Microbiology, 24, 387-397, 1997) :
→4 β-D-G (l→4)-β-D-Glcp(l→4)-β-D-Glcp(l→
2 3 t î 1 P04 α-L-Rap t 1 α-D-Galp
Bien que les enzymes codant pour cet EPS soient maintenant connues, il reste encore à élucider leur spécificité. A ce jour, il existe toujours un besoin de disposer également de nouvelles enzymes impliquées dans la synthèse d'EPS; notamment des enzymes catalysant les liaisons spécifiques entre des saccharides pour améliorer les propriétés des produits alimentaires, en particulier des produits lactés tels que des yoghourts ou des fromages, en y incorporant de tels saccharides. La présente invention vise à remplir ces besoins.
Un autre but de la présente invention vise à fournir de nouveaux saccharides dont certaines ramifications ou certains éléments peuvent être avantageusement utilisés ou traités pour améliorer les propriétés organoleptiques et la saveur (stabilité des arômes des produits alimentaires incorporant éventuellement de tels saccharides) .
Résumé de 1 ' invention La présente invention est relative à toute enzyme recombinée, que l'on peut purifier et qui est susceptible d'être impliquée dans la biosynthèse des EPS par une liaison sous forme d'un isomère α ou β entre le carbone 1 portant la fonction réductrice aldéhyde d'un D-Galp activé et un phosphate d'une amorce lipophile, en particulier du genre undecaprénol, ou protéique, notamment du genre ACP (Acyl Carrier Protein) ; par exemple, de manière à assurer de façon progressive la formation de ces exopolysaccharides avec à chaque étape, l'addition d'une nouvelle unité de saccharide qui vient s'attacher par sa fonction semi-acétalique à un hydroxyle alcoolique d'une autre unité de saccharide, laquelle est à l'extrémité d'une chaîne de saccharides liée à cette amorce.
De préférence, ladite enzyme recombinée est choisie parmi le groupe constitué par : l)les enzymes recombinées et/ou purifiables impliquées dans la biosynthèse de 1 ' exopolysaccharide ayant l'unité saccharidique répétitive suivante : β-D-Galpl i
6 →3)-β-D-Glcp-(l→3)-β-D-Gal/-(l→3)-α-D-Glcp-(l→
catalysant spécifiquement l'une des liaisons suivantes entre saccharides :
- la liaison osidique β-1,3 entre le carbone 1 d'un D- Galf activé et le carbone 3 du Glcp présent à l'extrémité non-réductrice d'une chaîne saccharidique en formation, notamment la chaîne α/β-D-Glcp-amorce ; - la liaison osidique β-1,3 entre le carbone 1 d'un D- Glcp activé et le carbone 3 du Galf" présent à l'extrémité non-réductrice d'une chaîne saccharidique en formation, notamment la chaîne β-D-Galf" (l—»3) -α/β-D- Gl cp-amorce; - la liaison osidique β-1,6 entre le carbone 1 d'un D- Galp activé et le carbone 6 du Glcp présent à l'extrémité non-réductrice d'une chaîne saccharidique en formation, notamment la chaîne β-D-Glcp(l→3) β-D- Galf (l-»3) - /β-D-Glcp-amorce; et - la liaison osidique α-1,3 entre les unités saccharidiques répétitives de l 'EPS ci-dessus ; 2) les enzymes recombinées et/ou purifiables qui sont susceptibles d'être impliquées dans la synthèse des EPS ayant l'unité saccharidique répétitive suivante : β-D-Galp-(l→4)-β-D-Glc/71 3 →5)-β-D-Gal/-(l→3)-α-D-Galp-(l→3)-α-D-Glcp-(l→3)-β-D-Glςp-(l→ catalysant spécifiquement l'une des liaisons suivantes entre saccharides :
- la liaison osidique α-1,3 entre le carbone 1 d'un D- Glcp activé et le carbone 3 d'un Glcp appartenant à l'extrémité non-réductrice d'une chaîne saccharidique en formation, notamment la chaîne suivante : α/β-D- Glcp-amorce;
- la liaison osidique α-1,3 entre le carbone 1 d'un D- Galp activé et le carbone 3 d'un Glcp présent à l'extrémité non-réductrice d'une chaîne saccharidique
en formation, notamment la chaîne suivante : α-D-Glcp- (l-»3) -β/α-D-Glcp-amorce;
- la liaison osidique β-1,3 entre le carbone 1 d'un D- Galf activé et le carbone 3 d'un Galp présent à l'extrémité non-réductrice d'une chaîne saccharidique en formation, notamment la chaîne suivante : α-D-Galp- (1→3) -α-D-Glcp- (l->3) -β/α-D-Glcp-amorce;
- la liaison osidique β-1,3 entre le carbone 1 d'un D- Glcp activé et le carbone 3 d'un Galf présent à l'extrémité non-réductrice d'une chaîne saccharidique en formation, notamment la chaîne suivante : β-D-Galf- (l->3) -α-D-Galp- (l-3) -α-D-Glcp- (l-»3) -β-D-Glcp-amorce ;
- la liaison osidique β-1,4 entre le carbone 1 d'un D- Galp activé et le carbone 4 du Glcp présent à l'extrémité non-réductrice d'une chaîne saccharidique en formation, notamment la chaîne suivante : β-D-Glcp- (l-»3) -β-D-Galf- (1→3) -α-D-Galp- (1→3) -α-D-Glcp- (1→3) - β-D-Glcp-amorce; et
- la liaison osidique β-1,5 entre les unités saccharidiques répétitives de 1 ' EPS ci-dessus; et
3) les enzymes recombinées et/ou purifiables qui sont susceptibles d'être impliquées dans la synthèse des EPS ayant l'unité saccharidique répétitive suivante : β-D-Galp α-L-Rha/. β-D-Gal/.
1 1 1
4 3 3
→3)-β-D-Gal/>(1→4)-α-D-Galp(1→2)-α-D-Gal/.(1→3)-β-D-Glcp(1 → et catalysant spécifiquement l'une des liaisons suivantes entre saccharides :
- la liaison osidique β-1,3 entre le carbone 1 d'un D- Galp activé et le carbone 3 du saccharide présent à
l'extrémité non-réductrice d'une chaîne saccharidique en formation, ladite chaîne étant composée notamment d'une chaîne principale de 1 à 4 D-Galp et/ou D-Glcp liés entre-eux par des liaisons osidiques α-1,2, α-1,3, β-1/4 et/ou β-1,3, et ledit saccharide présent à l'extrémité non-réductrice étant lié à un seul autre saccharide par son carbone 1;
- la liaison osidique β-1,4 entre le carbone 1 d'un D- Galp activé et le carbone 4 du saccharide présent à l'extrémité non-réductrice d'une chaîne saccharidique en formation, ladite chaîne étant composée notamment d'une chaîne principale de 1 à 4 D-Galp et/ou D-Glcp liés entre-eux par des liaisons osidiques α-1,2, α-1,3, β-1,4 et/ou β-1,3, et ledit saccharide présent à l'extrémité non-réductrice étant lié à un seul autre saccharide par son carbone 1; et
- la liaison osidique α-1,3 entre le carbone 1 d'un L- Rhap activé et le carbone 3 du saccharide présent à l'extrémité non-réductrice d'une chaîne saccharidique en formation, ladite chaîne étant composée notamment d'une chaîne principale de 1 à 4 D-Galp et/ou D-Glcp liés entre-eux par des liaisons osidiques α-1,2, α-1,3, β-1,4 et/ou β-1,3, et ledit saccharide présent à l'extrémité non-réductrice étant lié à un seul autre saccharide par son carbone 1.
Un autre objet de l'invention concerne toute séquence nucléotidique recombinée codant pour la ou les enzyme (s) de l'invention, notamment tout vecteur (y compris tout vecteur de type navette et susceptible de s'exprimer dans différentes lignées cellulaires) , et/ou toute cellule incorporant lesdites séquences nucléotidiques et exprimant la ou les enzyme (s) recombinée (s) fonctionnelle (s) de 1 ' invention.
Un autre aspect de l'invention concerne le procédé d'obtention d'un tel EPS dans lequel :
(1) on clone dans un vecteur la séquence nucléotidique de l'invention, en particulier un fragment d'ADN codant pour au moins l'une des enzymes de l'invention, ledit vecteur comprenant en outre une séquence permettant la réplication autonome ou l'intégration dans une ou plusieurs (vecteur navette) cellule (s) hôte (s),
(2) on transforme la cellule hôte par ledit vecteur, ladite cellule hôte utilisant la ou les enzyme (s) codée (s) par le vecteur, le cas échéant en combinaison avec d'autres enzymes produites par la cellule hôte, pour la biosynthèse dudit exopolysaccharide,
(3) on cultive ensuite la cellule hôte transformée dans des conditions appropriées pour l'obtention dudit exopolysaccharide .
Un autre objet de l'invention concerne un procédé de synthèse d'un exopolysaccharide qui est constitué par l'assemblage répété d'une seule unité saccharidique, elle-même formée d'une chaîne principale de saccharides dont les extrémités sont impliquées dans la polymérisation des unités, dans lequel on utilise plusieurs enzymes ou plusieurs séquences nucléotidiques recombinées selon l'invention permettant la création sur la chaîne principale de l'unité saccharidique d'au moins une ramification lactose liée à un saccharide de la chaîne principale par son glucose.
Un autre objet de l'invention concerne un nouveau polysaccharide ramifié (branché) , constitué par l'assemblage répété d'une seule unité saccharidique, elle- même formée d'une chaîne principale de saccharides dont les extrémités sont impliquées dans la polymérisation des unités, caractérisé en ce que la chaîne principale comprend au moins une ramification lactose liée à un saccharide de
la chaîne principale par son glucose, le galactose de cette ramification étant en outre lié à un N-acétyl- galactosamine, pour autant que ce polysaccharide ne consiste pas en la répétition de l'unité saccharidique suivante :
β-D-Gal/.Nac-(l→4)-β-D-Gal/>(l→4)-β-D-Glc/.
1 71
3
>5)-β-D-Gal/-(l→3)-α-D-Galp-(l→3)-α-D-Glςp-(l→3)-β-D-Glcp(l→
Les enzymes et les séquences de l'invention sont de préférence des enzymes ou des séquences isolées, purifiées ou recombinées à partir de souches de microorganismes alimentaires tels que des Lactobacillus, des Streptococcus, etc., en particulier des souches non pathogènes .
La présente invention concerne également les produits alimentaires tels que des yoghourts ou des fromages incorporant les cellules transformées de l'invention et/ou les saccharides obtenus de telles cellules .
Un dernier aspect de la présente invention concerne l'utilisation d'une des enzymes ou d'une des séquences nucléotidiques recombinées de l'invention pour la synthèse d'un exopolysaccharide.
La présente invention sera décrite en détails dans les exemples d'exécution non limitatifs présentés ci- dessous en référence aux figures annexées.
Brève description des figures
Les figures 1 à 3 représentent la carte physique de 1 Opéron impliqué dans la synthèse d'un exopolysaccharide respectivement des souches S . thermophilus CNCM 1-1879, CNCM 1-1449 et
CNCM 1-800. Les flèches horizontales indiquent la présence de cadres de lecture (ORF) potentiels. Les noms des gènes correspondants aux ORFs sont indiqués en dessous des flèches .
Description détaillée de l' invention
Dans la suite de la description, les séquences nucléotidiques des gènes et des amorces utilisés ainsi que les séquences en acides aminés des enzymes recombinées de l'invention sont représentées dans la liste de séquences fournie ci-après.
Le terme "EPS" désigne un polymère formé par la condensation d'un grand nombre de molécules de saccharides (=oses) de types différents. Cet EPS est plus particulièrement constitué par l'assemblage répété d'une seule unité saccharidique, elle-même formée d'une chaîne principale de saccharides dont les extrémités sont impliquées dans la polymérisation des unités. Cette chaîne principale peut comprendre en outre des ramifications (ou branchements) de saccharides qui ne sont pas impliquées dans la polymérisation des unités, lesdites ramifications étant greffées par des liaisons osidiques sur un ou plusieurs saccharides de cette chaîne. On représente une unité saccharidique en indiquant :
(1) les sigles usuels des saccharides (Glc: glucose; Gai: galactose; Rha : rhamnose; etc.);
(2) le type de chaque liaison osidique sous la forme d'une flèche entre les numéros de carbone de deux saccharides adjacents (les numéros de carbone attribués sur le cycle d'un saccharide sont ceux reconnus par la nomenclature internationale des saccharides: IUPAC) ;
(3) l'anomérie de chaque liaison osidique sous la forme du sigle α ou β, ledit sigle étant positionné à gauche d'un saccharide pour indiquer l'anomérie de la liaison osidique présente à la droite de ce saccharide; (4) la nature pyranose ou furanose de chaque saccharide en adjoignant la lettre p ou f juste après le sigle de chaque saccharide; et (5) la série D ou L de chaque saccharide, en positionnant la lettre à gauche du saccharide concerné. Dans une chaîne saccharidique en formation, la réaction directe entre une fonction semi-acétalique d'une nouvelle unité de saccharide et un hydroxyle alcoolique du saccharide présent à l'extrémité non- réductrice de la chaîne ne se fait pas spontanément, et c'est pourquoi le groupement semi-acétalique doit au préalable être activé, c'est-à-dire rendu plus réactif en vue de la formation de la liaison osidique. Cette activation est catalysée par des enzymes bactériennes formant un saccharide nucléotidique, et plus particulièrement un uridine-diphosphate de D-Glcp (UDP- Glcp) , D-Galp (UDP-Galp) ou D-Galf (UDP-Galf) dans le contexte de la présente invention. Pour initier la formation d'un chaîne saccharidique, un premier saccharide activé doit d'abord être lié sur le phosphate d'une amorce lipophilique ou protéique. L'addition d'une nouvelle unité de saccharide activé sur la chaîne se fera ensuite par sa fonction semi-acétalique au niveau d'un hydroxyle alcoolique du saccharide présent à l'extrémité non- réductrice de cette chaîne, c'est-à-dire à l'extrémité opposée de celle où l'amorce est fixée.
Des travaux menés sur les enzymes de l'invention ont permis de montrer que la biosynthèse des exopolysaccharides se fait de manière progressive avec, à
chaque étape, l'addition d'une nouvelle unité de saccharide qui vient s'attacher par sa fonction semi-acétalique à un hydroxyle alcoolique d'une autre unité de saccharide, laquelle est à l'extrémité d'une chaîne de saccharides liée à une amorce . Ces enzymes catalysent ou contrôlent ainsi spécifiquement les fonctions suivantes :
(1) La liaison sous forme d'un isomère α ou β entre le carbone 1 (qui porte la fonction réductrice aldéhyde) d'un D-Galp activé et un phosphate d'une amorce lipophilique notamment du genre undecaprénol, ou protéique notamment du genre ACP (Acyl Carrier Protein) , par exemple.
(2) La liaison osidique α-1,3 entre le carbone 1 d'un GalpNAc activé (UDP-GalpNAc) et le carbone 3 du D-Galp lié à son amorce.
(3) La liaison osidique β-1,3 entre le carbone 1 d'un D- Glcp activé (UDP-D-Glcp) et le carbone 3 du saccharide présent à l'extrémité non-réductrice de la chaîne β-D- Galp(l→3) -α/β-D-Galp-amorce. (4) La liaison osidique α-1,6 entre le carbone 1 d'un D- Galp activé et le carbone 6 du saccharide présent à l'extrémité non-réductrice de la chaîne β-D- Glcp(l→3) β-D-Galp(l→3) -α/β-D-Galp-amorce .
(5) Le transport des unités saccharidiques répétitives de 1 'EPS décrit ci-dessus à l'extérieur de la cellule bactérienne.
(6) La liaison osidique β-1,3 entre les unités saccharidiques répétitives de l'EPS ci -dessus.
(7) La régulation du nombre d'unités saccharidiques dans l'EPS, et donc de son poids moléculaire final.
Dans la suite de la description, on représente une chaîne saccharidique en formation, en
indiquant les sigles usuels des saccharides, les types de liaisons osidiques, la position de l'amorce sur la chaîne, la nature du cycle et de la série D ou L de chaque saccharide. Enfin, du fait que l'on ne sait pas encore quel isomère est formé lorsque le premier saccharide d'une chaîne est lié à une amorce, par commodité d'écriture, on utilise ainsi le sigle "α/β" afin d'indiquer que l'un des deux isomères est formé.
Au sens de la présente invention, on entend par "séquence homologue" toute séquence nucleotidique ou d'acides aminés, conduisant ou donnant un variant d'enzyme qui catalyse l'assemblage des saccharides, ne différant des séquences selon 1 ' invention que par la substitution, la délétion ou l'addition d'un petit nombre de bases nucléotidiques ou d'acides aminés, par exemple 1 à 150 paires de bases (pb) ou 1 à 50 acides aminés. Ces variants d'enzyme peuvent conserver la même spécificité d'assemblage de saccharides que les enzymes dont ils dérivent. La substitution, la délétion ou l'addition d'un petit nombre d'acides aminés peut cependant aussi conduire à changer la spécificité enzymatique. Par exemple, les protéines codées par les gènes de l'invention epsl à eps5, bien qu'étant très proches des enzymes EpsA-D de la souche S . ther ophilus Sfi6 (EP-A- 0750043) et de l'enzyme EpsE de S . salivarius, présentent des spécificités enzymatiques différentes des protéines EpsA-D et EpsE (voir ci-après) .
La sélection d'une séquence homologue est à la portée de l'homme du métier, en mettant en œuvre des méthodes de mutagénèse classiques, et notamment en adaptant les méthodes décrites par Adams et al . (EP-A-0402450 ; Genencor) , par Dunn et al . (Protein Engineering, 2 , 283- 291, 1988), par Greener et al . (Stratégies, 7, 32-34, 1994)
et/ou par Deng et al . (Anal. Biochem, 200, 81, 1992), par exemple .
Dans ce cadre, on considérera en particulier comme homologues deux séquences nucléotidiques qui, du fait de la dégénérescence du code génétique, codent pour un même polypeptide. De même, on peut aussi considérer comme homologue deux séquences nucléotidiques s'hybridant dans des conditions stringentes, c'est-à-dire s'hybridant toujours après une étape d'hybridation à 65 °C pendant 15h dans un tampon d'hybridation (SSPE l,5x: 0,225 M de NaCl, 0,0015 M d'EPTA, 0,015 M de NaH2P04, pH7 ; 1% de SDS et 1% de lait déshydraté) , suivie de 6 étapes successives de lavage à 65 °C dans un tampon comprenant différentes dilutions de SSC lOx (1,5 M de NaCl , 0,15 M de citrate de sodium, pH7) et 0,1% SDS, respectivement pendant 2 fois 10 min avec du SSC 2x, pendant 2 fois 10 min avec du SSC lx, et pendant 2 fois 5 min avec du SSC 0 , lx ou telles que décrites par Sambrook et al. (§§ 9.47-9.51 in Molecular Cloning : A Laboratory Manual , Cold Spring Harbor, Laboratory Press, Cold Spring Harbor, New York (1989)).
On peut aussi considérer comme homologues les séquences nucléotidiques présentant plus de 50% d'identité avec les séquences selon 1 ' invention, en particulier plus de 70%, l'identité étant déterminée par le rapport entre le nombre de bases nucléotidiques d'une séquence homologue qui sont identiques à celles d'une séquence selon l'invention, et le nombre total de bases nucléotidiques de ladite séquence selon l'invention, par exemple.
De même, on considérera comme homologues deux protéines fonctionnelles qui sont reconnues par un même anticorps, le rapport des valeurs d'intensité de reconnaissance des deux protéines par l'anticorps n'excédant pas 1000 dans un test ELISA, de préférence 100,
par exemple. On considérera plus particulièrement comme homologues les séquences en acides aminés qui présentent plus de 70% d'identité avec les séquences selon l'invention, en particulier plus de 80%, de 85%, de 90% ou plus particulièrement plus de 95%. Dans ce dernier cas, l'identité est déterminée par le rapport entre le nombre d'acides aminés d'une séquence homologue qui sont identiques à celles d'une séquence selon l'invention, et le nombre total d'acides aminés de ladite séquence selon 1 ' invention.
Pour isoler une séquence nucleotidique de l'invention, en particulier un ADN recombiné, il est possible de constituer une banque de grands fragments d'ADN d'une bactérie lactique produisant un EPS dans une bactérie lactique ne produisant pas d'EPS, puis de sélectionner le ou les clone (s) produisant un EPS. Pour cela, on digère l'ADN génomique d'une bactérie lactique produisant un EPS par une enzyme de restriction qui est spécifique d'un site de restriction relativement rare (BaHI, Sali, PstI) ou par une digestion partielle avec Sau3A, par exemple. On clone le produit de digestion dans un plasmide d'expression ou d'intégration qui accepte de grands fragments (plasmide pSA3, Dao et al . , Appl . Environ. Microbiol . , 19., 115-119, 1985) , on introduit les plasmides recombinants dans la même espèce de bactérie lactique ne produisant pas d'EPS, on sélectionne au moins un clone transformé produisant un EPS, puis on identifie, on isole et on séquence classiquement le fragment d'ADN responsable de la production d'EPS.
Vu que les séquences nucléotidiques de l'invention, en particulier les ADNs, sont susceptibles d'être de grande taille, et qu'elles peuvent contenir un groupe de gènes impliqués dans la biosynthèse d'EPS, on peut préférer introduire les plasmides recombinants dans la même souche de bactérie lactique dont proviennent les
fragments, à la différence près que cette souche a perdu la capacité de produire des EPS suite à un traitement mutagénique (traitement U.V. , chimique ou par transposon) . Une alternative consiste à constituer une banque plasmidique de fragments d'ADN d'une souche de bactérie lactique produisant un EPS, à transformer la même souche de bactérie lactique par les plasmides incapables de s'y répliquer, à sélectionner les transformants ayant intégré un plasmide dans leur génome par recombinaison homologue (sélection par une résistance à un antibiotique, par exemple) , à sélectionner les transformants ne produisant plus d'EPS, puis à isoler et séquencer les fragments d'ADN génomique des transformants sélectionnés qui sont adjacents au plasmide intégré. Pour cela, on peut digérer le chromosome des transformants, le liguer, puis effectuer une PCR-inverse à l'aide de sondes spécifiques du plasmide intégré ou introduire le produit de ligation dans une souche dans laquelle le plasmide recircularisé est capable de se répliquer, par exemple. Une autre alternative consiste à transformer des bactéries lactiques produisant un EPS par un plasmide comprenant un transposon, à soumettre les bactéries à des conditions dans lesquelles le transposon s'excise du vecteur et s'intègre au hasard dans le génome, à sélectionner les clones de bactéries ayant perdu la capacité de produire des EPS, à isoler les fragments d'ADN génomique desdits clones dans lesquels un transposon s'est intégré. Cette méthode est décrite plus en détail par Stingele et al . , Dev. Biol . Stand., In Genetics of Streptococci, Enterococci and Lactococci, 85., 487-493, 1995 (ISSN:0301-5149) .
Une dernière alternative consiste à préparer des amorces nucléotidiques dérivées de gènes connus impliqués dans la biosynthèse d'un EPS, puis à réaliser une
PCR sur l'ADN génomique d'une bactérie lactique produisant un EPS et pour laquelle on désire identifier les gènes impliqués dans la biosynthèse de cet EPS. Cette technique est cependant excessivement difficile à mettre en œuvre, car le choix de la séquence nucleotidique des amorces sera déterminante dans l'isolement d'un gène. Puisque l'on ne connaît pas d'avance les homologies entre les gènes recherchés et les gènes connus, ce choix procède d'une démarche inventive, de par la nécessaire sélection opérée parmi une multiplicité d'amorces possibles.
Quelques critères peuvent cependant être retenus, tels que:
(1) la sélection d'une fonction enzymatique retrouvée souvent lors de la biosynthèse d'un EPS; (2) la sélection de séquences nucléotidiques conservées en comparant des gènes de diverses bactéries codant pour cette fonction enzymatique;
(3) la sélection de séquences conservées dont le contenu en nucléotides GC se rapproche le plus possible de l'organisme cible, même si pour cela on doit prendre comme point de départ de la sélection des séquences nucléotidiques retrouvées dans des organismes éloignés phylogéniquement de l'organisme cible (E. coli ) ;
(4) l'identification d'une partie dans les séquences conservées qui est naturellement plus riche en nucléotides GC;
(5) l'identification d'une partie dans les séquences conservées qui est peu dégénérée, c'est-à-dire codant pour des acides aminés qui sont eux-mêmes codées naturellement par 1 ou 2 codons, tel que la méthionine, le tryptophane, la glutamine ou l'acide glutamique, par exemple; etc.
Il faut remarquer que les méthodes de sélection décrites brièvement ci-dessus peuvent être
appliquées à toutes les bactéries lactiques connues, notamment aux bactéries lactiques mésophiles comme par exemple Streptococcus cre oris, Streptococcus lactis, Lactobacillus casei subsp. casei et Lactobacillus sake, et les bactéries lactiques thermophiles comme par exemple Streptococcus thermophilus et Lactobacillus helveticus . A cet effet, l'homme du métier dispose de techniques de transformation pour chaque espèce de bactérie lactique.
De plus, ces méthodes de sélection permettent le plus souvent d'isoler seulement une partie d'un gène ou d'un groupe de gènes impliqués dans la biosynthèse d'un EPS. Néanmoins, l'homme du métier peut facilement identifier la partie restante du gène ou du groupe de gènes en sélectionnant dans une banque génomique, à l'aide de sondes nucléotidiques basées sur un fragment isolé, un ou plusieurs clones renfermant la partie restante, par exemple .
De préférence, l'objet de l'invention concerne la séquence nucleotidique SEQ ID NO : 1 ou son brin complémentaire, obtenue de la souche Streptococcus thermophilus déposée le 20 juin 1997 selon le traité de Budapest auprès de la Collection Nationale de Culture de Microorganisme (C.N.C.M.), 28 rue du Docteur Roux, 75724 Paris cedex 15, France (numéro de dépôt CNCM 1-1897) . Cette souche Gram-positif présente au microscope un aspect de coques non flagellées formant des chaînettes, ne fait pas de spores et est anaéorobe facultative.
Cette séquence SEQ ID NO : 1 comprend des gènes codant pour de nouvelles enzymes impliquées dans la synthèse de l'EPS ayant la structure répétée suivante :
β-D-Galσl
6 →3)-β-D-Glc/.-(l-3)-β-D-Gal-(l→3)-α-D-Glc/.-(l→
Grâce aux connaissances acquises sur la biosynthèse des EPS décrits dans la littérature, notamment de l'EPS décrit dans EP-A-0750043 , on a pu identifier les nouvelles fonctions enzymatiques impliquées dans la biosynthèse de l'EPS ci-dessus. Les nouvelles enzymes impliquées dans la synthèse de cet EPS peuvent catalyser spécifiquement l'une des nouvelles liaisons suivantes entre saccharides :
- la liaison osidique β-1,3 entre le carbone 1 d'un D-Galf activé et le carbone 3 du Glcp présent à l'extrémité non-réductrice d'une chaîne saccharidique en formation, notamment la chaîne α/β-D-Glcp-amorce;
- la liaison osidique β-1,3 entre le carbone 1 d'un D-Glcp activé et le carbone 3 du Galf présent à l'extrémité non-réductrice d'une chaîne saccharidique en formation, notamment la chaîne β-D-Galf (l-»3) -α/β-D-Glcp-amorce;
- la liaison osidique β-1,6 entre le carbone 1 d'un D-Galp activé et le carbone 6 du Glcp présent à l'extrémité non- réductrice d'une chaîne saccharidique en formation, notamment la chaîne β-D-Glcp(l->3 ) β-D-Galf(l-»3) -α/β-D- Glcp-amorce; et,
- la liaison osidique α-1,3 entre les unités saccharidiques répétitives de l'EPS ci-dessus.
Les nouvelles enzymes recombinées présentent une faible homologie avec des enzymes connues. Ces nouvelles enzymes, identifiées à partir de la séquence SEQ ID NO : 1 , ont l'une des séquences en acides aminés choisie dans le groupe de séquences SEQ ID NO: 7, SEQ ID NO : 8 , SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11 et les séquences qui leur sont homologues.
Cette séquence SEQ ID NO : 1 contient des gènes impliqués dans la synthèse de cet EPS ( epsl -5) , codant pour des protéines ayant de très fortes homologies avec les
protéines EpsA-D de S . thermophilus Sfi6 (EP-A-0750043) et de la protéine EpsE de S. salivarius (GenBank: N°X94980) . Ces hauts degrés d'homologie sont inattendus compte tenu du fait que la structure de l'EPS produit par la souche CNCM 1-1897 est suffisamment différent de celui de la souche Sfi6, pour que l'on puisse s'attendre à ce que les enzymes de la souche CNCM 1-1897 soient différentes de celles de la souche Sfi6.
Les protéines codées par ces gènes présentent des spécificités enzymatiques nouvelles les rendant particulièrement attractives pour la création de nouvelles liaisons entre saccharides, ou pour faire varier la longueur de la chaîne d'EPS, ou même pour réguler différemment la production de l'EPS. Une de ces nouvelles enzymes est une glycosyltransférase ayant spécifiquement la séquence en acides aminés SEQ ID NO : 6 , les séquences homologues étant bien entendu exclues pour des raisons de nouveauté. Les autres nouvelles enzymes sont impliquées dans la régulation de la production de l'EPS et de la longueur de la chaîne, et ont spécifiquement l'une des séquences en acides aminés choisie dans le groupe de séquences SEQ ID NO : 2 , SEQ ID NO: 3, SEQ ID NO: 4 et SEQ ID NO:5, les séquences homologues étant bien entendu exclues pour des raisons de nouveauté. La présente invention vise également toute séquence nucleotidique, en particulier un ADN recombiné, codant pour une enzyme selon l'invention, c'est à dire l'une des enzymes choisies dans le groupe de séquences SEQ ID NO:2, SEQ ID NO : 3 , SEQ ID NO : 4 , SEQ ID NO : 5 , SEQ ID NO: 6, SEQ ID NO : 7 , SEQ ID NO : 8 , SEQ ID NO : 9 , SEQ ID NO: 10 et SEQ ID NO: 11. En particulier, cet ADN peut comprendre au moins un gène ayant l'une des séquences nucléotidiques choisie parmi les séquences délimitées dans la séquence SEQ ID NO:l par les nucléotides 1-687, 690-1418, 1429-2119,
2131-2870, 2929-4244, 5933-7978, 8003-8969, 10138-11086, 11438-12852, 14220-15315 et les séquences qui sont homologues aux séquences délimitées dans la séquence SEQ ID NO:l par les nucléotides 5933-7978, 8003-8969, 10138-11086, 11438-12852 et 14220-15315.
Selon une deuxième forme d'exécution préférée de l'invention, la séquence nucleotidique de l'invention est la séquence nucleotidique SEQ ID NO: 12 ou son brin complémentaire, obtenue de la souche Lactobacillus helveticus LH59 qui a été déposée le 27 juillet 1994 selon le traité de Budapest auprès de la Collection Nationale de Culture de Microorganisme (C.N.C.M.), 28 rue du Docteur Roux, 75724 Paris cedex 15, France (numéro de dépôt CNCM 1-1449) . Cette souche Gram-positif présente au microscope un aspect de bâtonnets non flagellées, ne fait pas de spores et est anaéorobe facultative.
Cette séquence SEQ ID NO: 12 comprend des gènes codant pour de nouvelles enzymes impliquées dans la synthèse de 1 ' EPS ayant la structure répétée suivante :
β-D-Gal/ (l→4)-β-D-Glc/.1 i
→5)-β-D-Gal/-(l→3)-α-D-Gal/7-(l→3)-α-D-Glc/j-(l→3)-β-D-Glcp-(l-
Ces nouvelles enzymes impliquées dans la synthèse de cet EPS peuvent ainsi catalyser spécifiquement l'une des nouvelles liaisons suivantes entre saccharides :
- la liaison osidique α-1,3 entre le carbone 1 d'un D-Glcp activé et le carbone 3 d'un Glcp appartenant à l'extrémité non-réductrice d'une chaîne saccharidique en formation, notamment la chaîne suivante : α/β-D-Glcp- amorce ;
- la liaison osidique α-1,3 entre le carbone 1 d'un D-Galp activé et le carbone 3 d'un Glcp présent à l'extrémité
non-réductrice d'une chaîne saccharidique en formation, notamment la chaîne suivante : α-D-Glcp- (l-»3) -β/α-D- Glcp-amorce;
- la liaison osidique β-1,3 entre le carbone 1 d'un D-Galf activé et le carbone 3 d'un Galp présent à l'extrémité non-réductrice d'une chaîne saccharidique en formation, notamment la chaîne suivante : α-D-Galp- (1—>3) -α-D-Glcp- (l-»3) -β/α-D-Glcp-amorce;
- la liaison osidique β-1,3 entre le carbone 1 d'un D-Glcp activé et le carbone 3 d'un Galf présent à l'extrémité non-réductrice d'une chaîne saccharidique en formation, notamment la chaîne suivante : β-D-Galf- (l-*3) -α-D-Galp- (1→3) -α-D-Glcp- (1-.3) -β-D-Glcp-amorce;
- la liaison osidique β-1,4 entre le carbone 1 d'un D-Galp activé et le carbone 4 du Glcp présent à l'extrémité non- réductrice d'une chaîne saccharidique en formation, notamment la chaîne suivante : β-D-Glcp- (1—»3) -β-D-Gal - (1→3) -α-D-Galp- (l-3) -α-D-Glcp- (l-»3) -β-D-Glcp-amorce; et, - la liaison osidique β-1,5 entre les unités saccharidiques répétitives de l'EPS ci-dessus.
Les nouvelles enzymes recombinées, identifiées à partir de la séquence SEQ ID NO: 12, ont l'une des séquences en acides aminés choisie dans le groupe de séquences SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, et les séquences qui leur sont homologues.
La présente invention vise également toute séquence nucleotidique, en particulier tout ADN, recombinée codant pour une enzyme selon l'invention, c'est à dire les enzymes choisies dans le groupe de séquences SEQ ID NO: 13,
SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ
ID NO: 18, SEQ ID NO: 19. En particulier, cet ADN peut comprendre au moins un gène ayant 1 ' une des séquences nucléotidiques choisies parmi les séquences délimitées dans la séquence SEQ ID NO: 12 par les nucléotides 1053-1730, 1734-2849, 2852-3943, 3930-5084, 5077-6096, 6099-7091, 7096-8259, 8284-8910 et les séquences qui leur sont homologues .
Selon une troisième forme d'exécution préférée de l'invention, la séquence nucleotidique de l'invention est la séquence nucleotidique SEQ ID NO:20 ou son brin complmentaire, obtenue de la souche Lactobacillus delbrueckii bulgaricus Sfi5 déposée le 4 octobre 1988 selon le traité de Budapest, auprès de la Collection Nationale de Culture de Microorganisme (C.N.C.M.), 28 rue du Docteur Roux, 75724 Paris cedex 15, France (numéro de dépôt CNCM 1-800) . Par ailleurs, cette souche Gram-positif présente au microscope un aspect de bâtonnets non-flagellés, est non- sporulante et anaéorobe facultative.
Cette séquence SEQ ID NO: 20 comprend des gènes codant pour de nouvelles enzymes impliquées dans la synthèse de l'EPS ayant la structure répétée suivante :
β-D-Galp α-L-Rhap β-D-Galp
1 1 1
>3)-β-D-Gal/7(1→4)-α-D-Galp(1→2)-α-D-Galp(1→3)-β-D-Glcp(1-
Ces nouvelles enzymes impliquées dans la synthèse de cet EPS peuvent ainsi catalyser spécifiquement l'une des nouvelles liaisons suivantes entre saccharides :
- la liaison osidique β-1,3 entre le carbone 1 d'un D-Galp activé et le carbone 3 du saccharide présent à l'extrémité non-réductrice d'une chaîne saccharidique en formation, ladite chaîne étant composée notamment d'une chaîne principale de 1 à 4 D-Galp et/ou D-Glcp liés
entre-eux par des liaisons osidiques α-1,2, α-1,3, β-1,4 et/ou β-1,3, et ledit saccharide présent à l'extrémité non-réductrice étant lié à un seul autre saccharide par son carbone 1 ; - la liaison osidique β-1,4 entre le carbone 1 d'un D-Galp activé et le carbone 4 du saccharide présent à l'extrémité non-réductrice d'une chaîne saccharidique en formation, ladite chaîne étant composée notamment d'une chaîne principale de 1 à 4 D-Galp et/ou D-Glcp liés entre-eux par des liaisons osidiques α-1,2, α-1,3, β-1,4 et/ou β-1,3, et ledit saccharide présent à l'extrémité non-réductrice étant lié à un seul autre saccharide par son carbone 1 ; - la liaison osidique α-1,3 entre le carbone 1 d'un L-Rhap activé et le carbone 3 du saccharide présent à l'extrémité non-réductrice d'une chaîne saccharidique en formation, ladite chaîne étant composée notamment d'une chaîne principale de 1 à 4 D-Galp et/ou D-Glcp liés entre-eux par des liaisons osidiques α-1,2, α-1,3, β-1,4 et/ou β-1,3, et ledit saccharide présent à l'extrémité non-réductrice étant lié à un seul autre saccharide par son carbone 1.
La chaîne saccharidique en formation peut être composée simplement d'une chaîne principale sans ramification de 1 à 4 D-Galp et/ou D-Glcp liés entre-eux par des liaisons osidiques α-1,2, α-1,3, β-1,4 et/ou β-1-3.
A titre d'exemple, cette chaîne peut être choisie parmi les chaînes tetra-sacchridiques suivantes, ainsi que leurs précurseurs mono-, di- ou tri- saccharidique (s) : α-D-Galp(l→3)-β-D-Glc/.(l-3)-β-D-Gal(l→4)-α/β-D-Galp-amorce; α-D-Galp(l→2)-α-D-Galp(l->3)-β-D-Glc/7(l→-3)-β/α-D-Galp-amorce;
β-D-Gal/?(l→'4)-α-D-Galp(l→2)-α-D-Galp(l→3)-β/α-D-Glc/7-amorce ; et β-D-Glcp(1→3)-β-D-Gφ(l→4)-α-D-Gφ(l→2)-β/α-D-Gal/.-amorce.
La chaîne saccharidique en formation peut être aussi composée d'une chaîne principale comprennant en outre 1 ou 2 saccharides ramifiés, tels que D-Galp et/ou L-
Rhap. Ces saccharides ramifiés peuvent être • liés sur la chaîne principale en β-1,3, β-1,4 ou α-1,3, par exemple.
A titre d'exemple, cette chaîne peut être choisie parmi les chaînes principales tetra-sacchridiques suivantes, ainsi que leurs précurseurs mono-, di- ou tri- saccharidique (s) : α-D-Gal/ 1→3)-β-D-Gl (1→3)-[β-D-Galp(1→4)]-β-D-Gal/>(1→4)-[α-LRhap(1→3)]-α/β-D-Gal/>-amorce ; α-D-Gal/.(1→2)-[β-D-Galp(1→3)]-α-D-Gal/>(l→3)-β-D-Glçp(1→3)-[β-D-Gal/.(1→4)]-β/α-D-Gal/>-amorce ; β-D-Galp(l→4)-[α-Rhap(l→3)]-α-D-Gal^(l→2) β-D-Galp(l→3)]-α-D-Galp(l→3)-β/α-D-Glcp-amorce;et β-D-Glc/>(1→3)-[β-D-Gal/>(1→4)]-β-D-Galp(l→4)-[α-LRhap(1→3)]-α-D-Gal/.(1→2)-[β-D-Gal/>(1→3)]- β/α-D-Gal -amorce.
De préférence, une des nouvelles enzymes selon l'invention catalyse la liaison osidique α-1,3 entre le carbone 1 d'un L-Rhap activé et le carbone 3 du galactose présent à l'extrémité non-réductrice d'une des chaînes saccharidiques ci-dessus.
De préférence, une des nouvelles enzymes selon l'invention catalyse la liaison osidique β-1,3 entre le carbone 1 d'un D-Galp activé et le carbone 3 du galactose présent à l'extrémité non-réductrice d'une des chaînes saccharidiques ci-dessus.
De préférence aussi, une des nouvelles enzymes selon l'invention catalyse la liaison osidique β- 1,4 entre le carbone 1 d'un D-Galp activé et le carbone 4 du galactose présent à l'extrémité non-réductrice d'une des chaînes saccharidiques ci -dessus.
Les nouvelles enzymes recombinées, identifiées à partir de la séquence d'ADN SEQ ID NO: 20, ont l'une des séquences en acides aminés choisie dans le groupe de séquences SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24, SEQ ID NO: 25, SEQ ID NO: 26, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 29, et les séquences qui leur sont homologues .
La présente invention vise également toute séquence nucleotidique, en particulier tout ADN, recombinée codant pour une enzyme selon l'invention, c'est à dire l'une des enzymes choisie dans le groupe de séquences SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24, SEQ ID NO: 25, SEQ ID NO: 26, SEQ ID NO: 27, SEQ ID NO: 28 et SEQ ID NO: 29. En particulier, cet ADN peut comprendre au moins un gène ayant l'une des séquences nucléotidiques choisie parmi les séquences délimitées dans la séquence SEQ ID NO: 20 par les nucléotides 9-353, 516-1292, 1323-1982, 2074-3174, 3246-4373, 4511-5317. 5335-6204, 6709-7692, 7723-8784, et les séquences qui leur sont homologues. De manière inattendue, les inventeurs ont identifié sur certaines séquences de 1 ' invention, en particulier sur la séquence SEQ ID NO : 1 , des portions IS disposées respectivement en amont et en aval des séquences codant pour les enzymes de l'invention. Ces séquences IS permettent de manière avantageuse d'utiliser directement la séquence de l'invention comme un "transposon" et de pratiquer éventuellement une coculture de microorganismes sans vecteur et d'obtenir l'expression de ces enzymes dans les cellules ayant perdu le caractère filant initial, ce qui permet la synthèse d' exopolysaccharides par lesdites cellules transformées.
La présente invention vise aussi tout vecteur recombinant comprenant la séquence nucleotidique de l'invention. Ce vecteur recombinant peut être tout fragment
d'acide nucléique, tel qu'un ADN simple brin ou double brin, linéaire ou circulaire, d'expression ou d'intégration, et comprenant une séquence nucleotidique de l'invention, notamment tout ou partie de la séquence SEQ ID N0:1, SEQ ID NO: 12 ou SEQ ID NO: 20. Dans le cas où le procédé décrit dans EP564966 ne serait pas utilisé (voir ci -après) , il faut veiller à ce que le vecteur exprime l'ADN selon l'invention par des séquences nucléotidiques adaptées (promoteur; site d'attachement du ribosome; codon préféré par l'organisme hôte, etc.), et le cas échéant à ce qu'il comprenne une ou plusieurs origines de réplication cellulaire, notamment d' Escherichia coli et/ou d'un Streptococcus, pour former le vecteur navette de 1 ' invention. Ainsi, pour opérer la biosynthèse d'un EPS, on peut intégrer tout ou partie de la séquence nucleotidique de l'invention comprenant au moins un des gènes précités dans une cellule hôte au moyen du procédé décrit dans EP-A-0564966, ledit procédé étant incorporé par référence dans l'enseignement de la présente invention. En résumé, ce procédé permet de pouvoir :
(1) transformer la cellule hôte avec un plasmide donneur qui ne s'y réplique pas, ledit plasmide comprenant ledit fragment placé fonctionnellement (le cadre de lecture est conservé) dans une partie d'un opéron issu de la cellule hôte;
(2) identifier les transformants ayant intégré la totalité du plasmide;
(3) sélectionner des transformants ayant uniquement intégré dans le chromosome le fragment selon l'invention, les autres séquences du plasmide s 'étant excisées du chromosome ; et
(4) cultiver les transformants sélectionnés dans des conditions appropriées pour la production d'un EPS.
On peut noter que ce procédé permet de ne pas utiliser des séquences promotrice et d'activation traductionnelle fonctionnelles. De plus, les conditions de culture appropriées pour la production d'EPS sont à la portée de l'homme du métier, qui peut utiliser des milieux de culture standards, et choisir le pH, la température et l'agitation du milieu optimum selon la souche utilisée.
On peut aussi choisir de cloner tout ou partie de la séquence SEQ ID N0:1, SEQ ID NO: 12 ou SEQ ID NO: 20, comprenant au moins un des gènes précités dans un plasmide d'expression auto-réplicatif en aval de séquences promotrice et d'activation traductionnelle fonctionnelles, et le cas échéant en amont d'un terminateur, puis de transformer une cellule hôte par le plasmide recombinant. On peut aussi utiliser les enzymes recombinées pour modifier ou synthétiser in-vi tro un oligosaccharide ou un polysaccharide comme un EPS, par exemple. Pour cela, il est préférable de purifier au moins une de ces enzymes, en sur-exprimant classiquement leur gène dans une cellule, et en les isolant classiquement, par précipitation et/ou chromatographie (du milieu de culture et/ou de la partie membranaire des cellules), par exemple.
Un autre objet de la présente invention concerne une cellule comprenant, intégré dans son génome ou par le moyen d'un plasmide réplicable, une séquence nucleotidique de l'invention, et exprimant une enzyme recombinée fonctionnelle selon l'invention. Cette cellule peut faire partie du groupe des moisissures, des levures, des bactéries et des plantes, par exemple. De préférence, les levures appartiennent aux genres Saccharomyces, Kluyveromyces , Hansenula et Pichia ; les bactéries sont Gram-négative ou positive appartenant au genre Escherichia , Bacillus, Lactobacillus , Lactococcus, Streptococcus et Staphylococcus ; les cellules de plantes appartiennent aux
légumineuses, et aux espèces céréalières et ligneuses ; tandis que les moisissures sont les cellules traditionnellement utilisées pour préparer un koji comme les Aspergillus, Rhizopus et/ou Mucor. Un autre objet de la présente invention concerne un procédé de production d'un EPS, dans lequel :
(1) on clone dans un vecteur un fragment d'une séquence nucleotidique codant pour au moins l'une des enzymes selon l'invention, ledit vecteur comprenant en outre une séquence permettant la réplication autonome ou l'intégration dans une cellule hôte;
(2) on transforme une cellule hôte par ledit vecteur, ladite cellule hôte utilisant les enzymes codées par le vecteur, le cas échéant en combinaison avec d'autres enzymes produites par la cellule hôte si le vecteur n'apporte pas tous les enzymes nécessaires à la biosynthèse d'un EPS, pour la biosynthèse d'un EPS; et
(3) on cultive ensuite la cellule hôte transformée dans des conditions appropriées pour la production d'un EPS. Si l'on ne met pas en œuvre le procédé décrit dans EP-A-0564966, le vecteur doit alors comprendre en outre au moins une séquence promotrice fonctionnelle et au moins une séquence d'activation traductionnelle fonctionnelle, permettant l'expression des gènes codant pour au moins l'une des enzymes selon l'invention.
La présente invention a aussi pour objet un nouveau procédé de synthèse d'un EPS, qui est constitué par l'assemblage répété d'une seule unité saccharidique, elle- même formée d'une chaîne principale de saccharides dont les extrémités sont impliquées dans la polymérisation des unités, dans lequel on utilise plusieurs enzymes recombinées ou plusieurs gènes recombinants susceptibles d'être impliqués dans la biosynthèse de l'EPS ayant l'unité saccharidique répétitive :
β-D-Gal/.-(l→4)-β-D-Glcp 1
3 →5)-β-D-Gal/-(l->3)-α-D-Gal/7-(l→3)-α-D-Glc/j-(l→3)-β-D-Gl -(l→ caractérisé en ce que ces enzymes ou ces gènes, notamment choisis parmi les enzymes ou les gènes selon l'invention, permettent la création sur la chaîne principale de l'unité saccharidique d'une ou plusieurs ramifications lactose (β- D-Galp- (1—>4) -β-D-Glcp) liées à un saccharide de la chaîne principale par leur glucose.
De préférence, la chaîne principale de l'unité saccharidique est constituée d'au moins 2 saccharides choisis parmi D-Galp, D-Galf et/ou D-Glcp. De plus, le carbone 1 du glucose de la ramifications lactose peut être lié par une liaison osidique β à l'un des carbones 2-6 d'un des saccharides de la chaîne principale, par exemple, de préférence le carbone 3 ou 6 d'un D-Galf.
Lors de la mise oeuvre de ce procédé, on peut utiliser en outre une enzyme ou un gène qui permet la liaison entre un N-acétyl-galactosamine et le galactose de la ramification lactose. On peut aussi utiliser en outre une enzyme ou un gène qui permet la liaison entre l'acide N-acétyl-neuraminique et le galactose de la ramification lactose, par exemple.
Ce procédé de synthèse peut être mis en oeuvre in vi tro, en utilisant les enzymes recombinantes et leurs substrats appropriés. On peut aussi le mettre en oeuvre in vivo, en clonant les gènes appropriés et en les faisant s'exprimer de sorte que les enzymes recombinées ainsi produites biosynthétisent un EPS en présence de leurs substrats, par exemple.
La présente invention a également pour objet un nouveau polysaccharide branché, constitué par l'assemblage répété d'une seule unité saccharidique, elle-
même formée d'une chaîne principale de saccharides dont les extrémités sont impliquées dans la polymérisation des unités, caractérisé en ce que la chaîne principale comprend au moins une ramification lactose liée à un saccharide de la chaîne principale par son glucose, le galactose de cette ramification étant en outre lié à un N-acétyl- galactosamine .
Le carbone 1 du glucose de la ramifications lactose peut être lié par une liaison osidique β à l'un des carbones 2-6 d'un des saccharides de la chaîne principale, de préférence le carbone 3 ou 6 d'un D-Galf, par exemple.
Pour des raisons de nouveauté, ce polysaccharide ne peut pas être constitué par la répétition de l'unité saccharidique suivante :
β-D-Gal/>Nac-(l→4)-β-D-Galp-(l→4)-β-D-Glc/>
1 71 3
→5)-β-D-Gal/-(l->3)-α-D-Galp-(l→3)-α-D-Glcp-(l-3)-β-D-Glcp(l- En effet, le brevet NZ-272795 (Société des
Produits Nestlé) préconise déjà d'ajouter par voie enzymatique un N-acétylgalactosamine sur le galactose des ramifications contenues dans l'EPS de la souche LH59.
Pour obtenir- ce nouveau polysaccharide, il suffit par exemple de mettre en oeuvre le procédé de synthèse décrit ci-dessus de sorte à obtenir un EPS différent de celui produit par la souche LH59, puis d'utiliser une β-1, 4-N-acétylgalactosaminyltransférase en présence de son substrat, notamment celle décrite par Lutz et al . et Yamashiro et al . (J. of Biol . Chem. , 269, 29227- 29231, 1994; J. of Biol. Chem., 220, 6149-6155, 1995). On peut aussi purifier d'un milieu de culture un EPS différent de celui produit par la souche LH59, puis de lui adjoindre un N-acétylgalactosamine sur le galactose des ramifications
lactose. L'EPS produit par la souche L. helveticus TY1-2 peut ainsi représenter une cible de choix (Y. Yamamoto et al . , Carbohydrate Research, 261 , 67-78, 1994), par exemple. Cet EPS est constitué par la répétition de l'unité saccharidique suivante :
β-D-Gal/.-(l→4)-β-D-Glcp 1 6
-6)-β-D-Glc/>(1→3)-β-D-Glc/?-(1→6)-α-D-GlçpNac-(1→3)-β-D-Gal/.(l→
1 .__
4 β-D-Gφ
Le nouveau polysaccharide selon 1 ' invention peut également comprendre un acide N-acétyl-neuraminique lié sur le galactose de la ramification lactose. Pour cela, on peut utiliser une α-2 , 6-sialyltransférase, notamment celles décrites par Simth et al . , Sjoberg et al . et/ou Yamamoto et al . , (J. of Biol. Chem., 269, 15162-15171, 1994; J. Biochem. , 271, 7450-7459, 1996; Biosci . Biotech. Biochem. , £2, 210-214, 1998), ou une α-2,3- sialyltransférase, notamment celle commercialisée par Calbiochem® (Cat No.566218-M, USA), par exemple.
La présente invention est décrite plus en détail ci-après à l'aide du complément de description qui va suivre, qui se réfère à des exemples d'obtention de fragments d'ADN, de plasmides recombinants et de bactéries transformées selon l'invention. Ces exemples sont précédés d'une description des milieux de culture. Il va de soi, toutefois, que ces exemples sont donnés à titre d'illustration de l'objet de l'invention dont ils ne constituent en aucune manière une limitation. La manipulation de l'ADN, le clonage et la transformation de cellules bactériennes sont, en l'absence de précisions
contraires, effectués selon les protocoles décrits dans l'ouvrage de Sambrook et al . (Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, U.S. ., 1989). Les pourcentages sont donnés en poids/poids, sauf indication contraire.
Milieux : (rajouter 1,5% de Bacto-agar pour un milieu solide)
- M17 (Difco,USA) : tryptone 0,5%, soytone 0,5%, viande hydrolysée 0,5%, extrait de levure 0,25%, acide ascorbique 0,05%, sulphate de magnésium 0,025%, disodium- beta-glycérophosphate 1,9% et de l'eau.
- LM17: milieu M17 comprenant 1% de lactose. - GM17: milieu M17 comprenant 1% de glucose.
- MSK: lait écrémé (poudre reconstituée à 10%) comprenant 0,1% d'extrait de levure.
- HJL: tryptone 3%, extrait de boeuf 0,2%, extrait de levure 1%, lactose 1% et KH P04 pH 6,5 0,5%. - Rouge de Ruthénium: extrait de levure 0,5%, lait en poudre écrémé 10%, sucrose 1%, agar 1,5% et 0,08g/l de rouge de ruthénium (voir FR-2632968) .
- MRS: protêose peptone 1%, extrait de bœuf 1%, extrait de levure 0,5%, dextrose 2%, tween 80 0,1%, citrate d'ammonium 0,2%, acétate d'ammonium 0,5%, phosphate de di-potassium 0,2%, sulfate de magnésium 0,lg/l, et sulfate de manganèse 0,05 g/1.
- LB: tryptone 0,5%, extrait de levure 0,25%, et NaCl 1%.
Exemples
Exemple I : clonage de 1 ' opéron de S . thermophilus CNCM 1-1897 impliqué dans la synthèse d'un EPS
1 . Sélection d ' une souche S. thermophilus productrice d 'EPS
On cultive les souches de bactéries lactiques de la collection Nestlé dans un milieu liquide HJL et on en étale des dilutions sur un milieu solide Rouge de Ruthénium. Les souches productrices d'EPS demeurent de couleur blanche car les EPS empêchent le colorant de teinter leur paroi cellulaire. Par contre, les souches non- productrices se colorent en rouge du fait de l'affinité du colorant pour le peptidoglycane de leur paroi cellulaire. On a ainsi sélectionné parmi les bactéries lactiques productrices d'EPS la souche S . thermophilus Sfi39, qui a reçu le numéro de dépôt CNCM 1-1897 et que l'on désignera dans la suite des exemples par l'expression "souche Sfi39".
2 . Structure répétée de l 'EPS La structure de l'EPS produit par la souche
Sfi39 a déjà été présentée dans la demande de brevet EP-97111381.6, dont le contenu technique est incorporé par référence dans la description.
3. Clonage
L'approche tentée afin d'isoler les gènes eps de la souche Sfi39 est basée sur la comparaison de gènes eps connus (ceux de S . thermophilus) et de leurs homologues (gènes cap, eps, rfb) d'espèces variées, et même d'espèces non-apparentées phylogeniquement, comme des espèces Gram- négatif. Ces comparaisons permettent ainsi de définir des régions conservées entre les espèces, et d'utiliser des amorces nucléotidiques dérivées de ces régions conservées afin d'amplifier par PCR une partie interne de 1 ' opéron eps
de la souche Sfi39. Cette approche s'est malheureusement heurtée à une impossibilité d'amplifier un gène eps, quelles que soient les amorces choisies. Les raisons ayant conduit à ces échecs peuvent être multiples, par exemple liées à une faible homologie entre les gènes eps de la souche Sfi39 et ceux des régions conservées, ou à des conditions de PCR inadéquates, etc.
Face à ces échecs, on a décidé de sélectionner, puis d'utiliser dans une PCR, des amorces nucléotidiques particulièrement dégénérées. Le choix de ces amorces spécifiques a en fait été déterminant pour l'amplification d'un gène eps de la souche Sfi39, et a été motivé par les considérations suivantes :
(1) la sélection d'une fonction enzymatique retrouvée souvent lors de la biosynthèse d'un EPS;
(2) la sélection de séquences nucléotidiques conservées en comparant des gènes de diverses bactéries codant pour cette fonction enzymatique;
(3) la sélection de séquences conservées dont le contenu en nucléotides GC se rapproche le plus possible de l'organisme cible, même si pour cela on doit prendre comme point de départ de la sélection des séquences nucléotidiques retrouvées dans des organismes éloignés phylogeniquement de l'organisme cible (E. coli) ; (4) l'identification d'une partie dans les séquences conservées qui est naturellement plus riche en nucléotides GC;
(5) l'identification d'une partie dans les séquences conservées qui est peu dégénérée, c'est-à-dire codant pour des acides aminés qui sont eux-mêmes codés naturellement par 1 ou 2 codons, tel que la méthionine, le tryptophane, la glutamine ou l'acide glutamique, par exemple; etc.
Parmi les amorces testées, celles ayant les séquences nucléotidiques SEQ ID NO: 39 et SEQ ID NO: 40, ont permis d'amplifier un fragment de gène eps dans les conditions de PCR suivantes : successivement 2 min à 95°C, 1 min à 42°C, 20 s à 72°C, puis 35 fois de suite le cycle de 30 s à 94°C, 1 min à 42°C et 20 s à 72°C. Pour cela, l'ADN génomique de la souche Sfi39 a été au préalable isolée selon la technique de Slos et al . (Appl . Environ. Microbiol., 57, 1333-1339, 1991). On utilise environ 100 ng d'TADN génomique et la Taq polymérase.
Un fragment de PCR de 143 pb a ainsi pu être isolé, puis clone dans le plasmide linéarisé pGEMT (Promega, USA) . Le séquencage de ce fragment par la méthode des didéoxynucléotides (kit f-mol® DNA Sequencing System, Promega) indique une séquence correspondant aux nucléotides 4006 à 4149 de la séquence SEQ ID NO:l.
Ce fragment de PCR a été utilisé pour cribler une banque λ-ZAP Express (Stratagene, USA) renfermant des fragments d'ADN de la souche Sfi39. Pour cela, selon les recommandations du fournisseur on digère partiellement une préparation d'ADN dudit mutant par Sau3A, on sépare les fragments par une électrophorèse sur gel d'agarose, on coupe du gel les bandes correspondant à des fragments de 5 à 12kb, on élue l'ADN, puis on le ligue au vecteur λ-ZAP Express préalablement digéré par BamHI. On encapside in- vi tro le produit de ligation à l'aide du système GigagoldlII (Stratagene) , on mélange ensuite les phages avec des Escherichia coli XLIBlue (Stratagene) selon les recommandations du fournisseur, puis on étale le mélange sur boîte de Pétri. On analyse ensuite les plaques recombinantes par hybridation de leur ADN transféré sur une membrane Hybond-N (Amersham Life Sciences, UK) avec le
fragment de PCR préalablement rendu radioactif (kit Random Primed DNA Labeling, Boehringer-Manheim) .
Parmi les nombreuses plaques recombinantes, on a pu sélectionner par hybridation plusieurs plaques positives, desquelles on a ensuite isolé les vecteurs λ-ZAP Express, puis excisé les vecteurs pBK-PCMV (pCMV) renfermant 1 ' insert génomique (voir les recommandations du fournisseur Stratagene) . On a ensuite séquence les inserts génomiques de ces vecteurs pCMV (kit f-mol® DNA Sequencing System) . En recoupant les séquences nucléotidiques des différents inserts génomiques, on a pu ainsi caractériser la séquence SEQ ID NO:l correspondant à 1 'opéron de la souche Sfi39 impliqué dans la synthèse d'un EPS (voir la figure 1) . Cette séquence comprend également en amont et en aval de ses séquences codantes, des séquences IS permettant l'utilisation directe des séquences de l'invention en transfection par coculture sans vecteur.
4. Analyse de la séquence SEQ ID NO: l La séquence SEQ ID NO : 1 présente 1 Opéron eps de la souche Sfi39 et comprend 10 ORFs complets, dans la même orientation, que l'on appelle epsl, eps2, eps3 , eps4, eps5, epsβ, eps7 , eps8, eps9 et epεl O (voir figure 1) . La comparaison des séquences en acides aminés codées par les ORFs avec celles de protéines présentes dans la banque de donnée Swiss-Prot, à l'aide des logiciels FASTA, PEPPLOT et PILEUP de GCG-soft ear, isconsin, USA, permet de déduire la fonction de ces protéines. Les résultats sont présentés ci-après . Les ORFs epsl (nucléotides 2703-3389), eps2
(nucléotides 3390-4118) , eps3 (nucléotides 4130-4819) , eps4
(nucléotides 4832-5527) et eps5 (nucléotides 5629-6993) ont plus de 80% d'identité avec les gènes epsA, epsB, epsC et
epsD de la souche S . thermophilus Sfi6 décrits dans EP750043 (Genbank, n°U40830) , et avec le gène epsE de S. salvarius (GenBank, n°X94980) . Ces ORFs codent respectivement pour des protéines ayant plus de 90% d'identité avec les protéines EpsA, EpsB, EpsC, EpsD et EpsE de S. thermophilus et S. salivarius . Ces hauts degrés d'identité sont inattendus compte tenu du fait que la structure de l'EPS produit par la souche Sfi39 est suffisamment différent de celui de la souche Sfi6, pour que l'on puisse supposer que les enzymes de la souche Sfi39 soient différentes de celles de la souche Sfi6. Les protéines codées par les gènes epsl -5, bien que très proches des protéines EpsA-D et EpsE, présentent cependant des spécificités enzymatiques nouvelles (voir ci-dessus) les rendant particulièrement attractives pour la création de nouvelles liaisons entre saccharides ( eps5) , ou pour faire varier la longueur de la chaîne d'EPS ou même pour réguler différemment la production de l'EPS ( epsl -4) . Les ORF epsl , eps2 , eps3 , eps4 et eps5 codent respectivement pour des protéines ayant les séquences en acides aminés SEQ ID NO:2, SEQ ID NO : 3 , SEQ ID NO : 4 , SEQ ID NO : 5 et SEQ ID NO: 6.
L'ORF epsβ (nucléotides 8633-10678) code pour une protéine (SEQ ID NO: 7) ayant environ 20% d'identité avec la protéine RfbC de Klebsiella pneumaniae (Genbank, n°L41518) . Cette homologie confirme son rôle dans la biosynthèse de l'EPS.
L'ORF eps7 (nucléotides 10703-11668) code pour une protéine (SEQ ID NO: 8) ayant environ 33% d'identité avec la protéine Epsl de S . thermophilus Sfi6. Cette homologie indique que la protéine est de toute évidence une beta-glycosyltransférase .
L'ORF epsδ (nucléotides 12838-13785) code pour une protéine (SEQ ID NO: 9) ayant environ 30%
d'identité avec la protéine Epsl de S . thermophilus Sfi6. Cette homologie indique que la protéine est de toute évidence une beta-glycosyltransférase .
L'ORF eps9 (nucléotides 14138-15553) code pour une protéine (SEQ ID NO: 10) ayant environ 40% d'identité avec la protéine EpsK de Lactococcus lactis
(GenBank n°U93364) . Cette homologie indique que la protéine est probablement le transporteur de l'unité répétitive dans le milieu extérieur. L'ORF epsl O (nucléotides 16919-18013) code pour une protéine (SEQ ID NO: 11) ayant environ 62% d'identité avec la protéine Galf d' Escherichia coli
(GenBank n°U03041) . Cette homologie confirme son rôle dans la biosynthèse de l'EPS, en catalysant la conversion de la forme pyranose à la forme furanose d'un β-D-Gal.
En conclusion, les inserts génomiques isolés des vecteurs pCMV couvrent une région génomique de la souche S . thermophilus Sfi39 qui est manifestement impliquée dans la biosynthèse de l'EPS.
Exemple II : inactivation des gènes eps
On inactive par recombinaison homologue les gène epsl -10 de 1 ' opéron pour confirmer leur importance dans la biosynthèse de l'EPS. Pour cela, on amplifie par PCR un fragment de chaque ORF provenant d'un des vecteurs pCMV décrits à l'exemple I ci -dessus, on ligue le produit de PCR dans le plasmide thermo-sensible pSA3 préalablement digéré, on transforme la souche E. coli XLl-blue par le produit de ligation, on sélectionne des transformants, on isole un plasmide recombinant, puis on transforme par électroporation la souche S . thermophilus Sfi39 avec le plasmide recombinant au moyen d'une méthode adaptée de celle décrite par Slos et al . (1991) . On resuspend les
cellules soumises à une décharge de 2,lkV, 25μF et 400Ω dans 1 ml de milieu HJL que l'on incube 4h à 37°C
(température permissive) , on étale les cellules sur un milieu solide LM17 supplémenté de 2 , 5μg/ml d' erythromycine que l'on incube 16 h à 37°C, puis on sélectionne les colonies transformées qui survivent. On incube ensuite les colonies sélectionnées dans 2 ml de milieu HJL supplémenté de 2,5 μg/ml d ' erythromycin jusqu'à ce que la densité optique à 600 nm (DOgoo) de ^a culture atteigne 0,2, on soumet la culture à 45°C jusqu'à ce que la DOgoo atteigne 1,0 (le plasmide ne se réplique plus), puis on étale des dilutions de la culture sur un milieu LM17 solide supplémenté de 2,5 μg/ml d ' erythromycine que l'on incube 12 h à 45°C. Les colonies qui survivent ont intégré dans un des 10 gènes eps le plasmide pSA3 recombinant. Ceci peut être vérifié par Southern-Blot d'une préparation d'ADN génomique des colonies survivantes digérée par EcoRI (coupe une seule fois dans pSA3), et hybridation du filtre de Southern-Blot avec le produit de PCR rendu radioactif. Les colonies ayant intégré le plasmide pSA3 présentent des bandes différentes que celles obtenues dans les mêmes conditions avec la souche sauvage. De plus, les colonies ayant intégré dans un des 10 gènes eps le plasmide pSA3 recombinant présentent un phénotype EPS(-) sur un milieu solide Rouge de Ruthénium, et ont perdu leur caractère filant dans un lait MSK.
Exemple III : Biosynthèse d'un EPS On prépare un plasmide à partir du plasmide pSA3 (Dao et al . , Appl . Environ. Microbiol . , 49. , 115-119, 1985) , en ajoutant un fragment d'ADN de la souche Sfi39 contenant la séquence de 17,2 kb décrite à l'exemple I
(voir la liste de séquence), et en ajoutant les parties régulatrices de 1 ' opéron eps de la souche S . thermophilus Sfi6 (EP750043), de sorte que l'expression (la transcription et la traduction) des gènes eps de la souche Sfi39 puisse être correctement effectuée dans S . thermophilus . On transforme ensuite par electroporation, avec ce plasmide, la souche S. thermophilus CNCM 1-1422 qui a été déposée le 18 mai 1994 selon le traité de Budapest. N'importe quelle autre souche filante de S . thermophilus aurait pu aussi être utilisée. Cette souche présente au microscope un aspect de coques non flagellées formant des chaînettes, elle ne fait pas de spores, elle est anaéorobe facultative, et elle produit un EPS ayant la composition Glc:Gal=2:2.
Exemple IV : Biosynthèse d'un EPS
On prépare un plasmide à partir du plasmide pSA3 en ajoutant un fragment d'ADN de la souche Sfi39 contenant la séquence SEQ ID NO : 1 décrite à l'exemple I (voir la liste de séquence) , et en ajoutant les parties régulatrices de 1 ' opéron eps de la souche S . thermophilus Sfi6 (EP750043) , de sorte que l'expression (la transcription et la traduction) des gênes eps de la souche Sfi39 puisse être effectuée dans S. thermophilus . On transforme ensuite par electroporation, avec ce plasmide, la souche S . thermophilus CNCM 1-1351 qui a été déposée le 5 août 1993 selon le traité de Budapest. N'importe quelle autre souche filante de S . thermophilus aurait pu aussi être utilisée. Cette souche présente au microscope un aspect de coques non flagellées formant des chaînettes, elle ne fait pas de spores, elle est anaéorobe facultative, et elle produit un EPS ayant la composition Glc:Gal:Rha=l:3 :2
Exemple V : Biosynthèse d'un EPS
On isole de l'ADN génomique de la souche CNCM 1-1897 par le méthode de Slos et al . (1991) . On digère la préparation d'ADN par PstI et BamHI , on sépare les fragments d'ADN par électrophorese sur gel d'agarose 0,7%, on élue les fragments supérieurs à 20 kb, on ligue l'ADN extrait au vecteur pJIM2279 (obtenu de P. Renault, INRA, Jouy-en-Josas, Paris, France) préalablement digéré par PstI et BarriHI puis déphosphorylé . On transforme la souche Lactococcus lactis MG1363 (J. Bacteriol . , 154 , 1-9, 1983), cultivée sur milieu GM17 à 30°C, par la méthode de De Vos et al . (Gène, , 169-176, 1989). On sélectionne les clones transformés par hybridation du DNA génomique des clones avec l'une des sondes dérivées de la séquence SEQ ID NO:l. Parmi les transformants, on sélectionne les clones positifs .
Exemple VI : Préparation de gènes fonctionnels homologues aux gènes eps 6 , eps7, eps 8. esp9 et eps 10 On prépare des dérivés fonctionnels des gènes epsβ , eps7, eps8, esp9 et epslO en mettant en oeuvre une méthode adaptée de celle décrite par Adams et al . (EP402450; Genencor) . Pour cela, on isole chacun des gènes eps par PCR à partir de l'ADN génomique de la souche Sfi39. Les amorces utilisées sont choisies à partir de la séquence SEQ ID NO:l, de sorte à amplifier uniquement chaque gène. On clone chaque produit de PCR dans le vecteur pFGl dérivé du vecteur pSA3 (Dao et al . , Appl . Environ. Microbiol . , 49 , 115-119, 1985) qui contient, en plus du gène de sélection erythromycine, le gène de sélection chloramphenicol et le promoteur régulant la transcription et la traduction de l'opéron eps de la souche Sfi6 (EP750043) . On clone chaque produit de PCR fonctionnellement en aval de ce promoteur de sorte que le gène eps puisse être normallement exprimé dans
S . thermophilus . On soumet enfin chaque vecteur à une mutagenèse chimique in -vi tro avec de 1 'hydroxylamine, comme décrit par Adams et al .
On transforme la souche E . coli XLl-blue par les plasmides pFGl traités avec l'agent mutagène, on sélectionne des transformants, on isole un plasmide recombinant, puis on incorpore le plasmide recombinant par electroporation dans un mutant de la souche S . thermophilus Sfi39 dont le gène eps qui est aussi porté par le plasmide pFGl a été au préalable inactivé comme décrit à l'exemple II. La transformation est réalisée par une méthode adaptée de celle décrite par Slos et al . (Appl . Environ. Microbiol., 57, 1333-1339, 1991), au cours de laquelle, on soumet les cellules à une décharge de 2,1 kV, 25 μF et 400 Ω, on les resuspend dans 1 ml de milieu HJL que l'on incube 4 h à 37°C, on étale les cellules sur un milieu solide LM17 supplémenté de 2,5 μg/ml d' erythromycine et de 3 μg/ml de chloramphenicol que l'on incube 16 h à 37°C, puis on sélectionne les colonies transformées qui survivent. Pour sélectionner des dérivés fonctionnels des gènes eps6 , eps7 , eps8, esp9 et epsl O, on cultive les souches de bactéries lactiques transformées dans un milieu liquide HJL, on en étale des dilutions sur un milieu solide Rouge de Ruthénium, on sélectionne les souches productrices d'EPS qui demeurent de couleur blanche, et on compare les propriétés rhéologiques des EPS produits par chaque clone à celle de l'EPS produit par la souche Sfi39. En observant notamment la viscosité et la force normale des EPS de chaque clone, on a pu ainsi identifier certains clones produisant un EPS ayant une propriété différente. L'analyse des gêne eps portés sur les plasmide pFGl des clones sélectionnés montre que ceux-ci ne différent du gène eps original que par la substitution, la délétion ou l'addition
d'un petit nombre de bases nucléotidiques conduisant à des modifications de la séquence en acides aminés de la glycosyltransférase .
Exemple VII : Synthèse de polysaccharides avec les glycosyltransférases Eps6, Eps7. Eps8, Eps9 et EpslO
On isole chacun des gènes eps par PCR à partir de l'ADN génomique de la souche Sfi39. Les amorces utilisées sont choisies à partir de la séquence SEQ ID
NO : 1 , de sorte à amplifier uniquement chaque gène. On clone chaque produit de PCR dans un vecteur d'expression pQE60
(Qiagen, US) . Les vecteurs ainsi traités sont ensuite introduits dans la souche E. coli DH5α (Stratagen, US) qui ne possède pas naturellement d'activité glycosyltransférase. On cultive les souches DH5α transformées dans du milieu LB contenant de 1 ' ampicilline jusqu'à une DO oo de ° 8' on ajoute au milieu de culture 1 mM d'IPTG, on incube les cellules pendant 2 h, on centrifuge les cellules à 6000 g pendant 10 min à 4°C, on les lave dans le tampon A (50 mM de Tris-acétate pH8 , ImM de DTT, 1 mM d ' EDTA et 10% de glycérol) , on les centrifuge à nouveau, on resuspend les cellules dans le tampon A contenant en outre 1 mM de PMSF (fluorure de phénylméthane sulfonyle) et on soumet la suspension à 15000 psi. On élimine les cellules entières par centrifugation à 6000 g pendant 15 min à 4°C, on récupère les membranes cellulaires du surnageant par ultracentrifugation à 100000 g pendant 1 h, et resuspend l'aliquot dans le tampon A. Ce protocole permet ainsi généralement d'obtenir environ 10 mg/ml de protéines .
Parallèlement, on cultive la souche Sfi39 dans un milieu contenant du D-Glcp, D-Galp et D-Galf, on
soumet les cellules de cette culture à 20000 psi, on extrait des membranes les chaînes saccharidiques en formation (liées à une amorce) en traitant les débris cellulaires avec du chloroforme/méthanol (2:1), en évaporant l'extrait. A titre de témoin dans les essais qui vont suivre, on procède de la même manière avec la souche Sfi39 cultivée en présence de saccharides radioactifs.
On détermine ensuite la spécificité des glycosyltransférases présentes dans les membranes par un procédé similaire à celui décrit par Kolkman et al . (Mol. Microbiol., 2£, 197-208, 1997). Pour cela, on fait réagir pendant 2 h, dans un volume réactionnel de 150 μl, 100 μl (environ 1 mg) de membranes, 50 mM de Tris-acétate pH8 , 10 mM de MgCl2, ImM d'EDTA, 1 μl (environ 25 nCi) d'UDp[14C]_ Glcp, d'UDP[14C] -Qalp ou d'UDP [14C] -Galf selon la glycosyltransférase considérée, et le dépôt contenant les chaînes saccharidiques en formation non-marquées isolées de la souche Sfi39 (voir le paragraphe ci-dessus) . Pour arrêter la réaction, on ajoute au volume réactionnel 2 ml de chloroforme :méthanol (2:1), on agite vigoureusement le mélange, et on le laisse reposer pendant 30 min. On élimine les saccharides nucléotidiques en extrayant la phase organique 3 fois de suite dans 0,4 ml de PSUP (pour 1 litre: 15 ml de chloroforme, 250 ml de méthanol, 1,83 g de KCl et 235 ml d'eau) . La phase inférieure contenant toutes les chaînes saccharidiques liées à une amorce est ensuite séchée sous vide, resuspendue dans 200 μl de 1-butanol et séparée dans deux tubes .
Dans la première série de tubes, on détache les oligosaccharides de leur amorce en effectuant une hydrolyse douce dans 50 mM de TFA (ac. trifluoroacétique) à 90°C pendant 20 min.
Dans la deuxième série de tubes, on soumet les oligosaccharides à une hydrolyse poussée dans une solution de 4M TFA pendant 1 h à 125°C
On sèche ensuite les hydrolysats et on les resuspend dans 5 ml de saccharides transporteurs dans 40% d' isopropanol (5 mg/ml de chaque saccharide suivant: Glc,
Gai, GalN, maltose, maltotriose, maltotetraose) . Les saccharides hydrolysées de chaque série de tubes sont alors déposés sur une plaque HPTLC silicagel 60 (Merck) que l'on soumet à un éluant composé de chloroforme, d'acide acétique et d'eau (respectivement 6:7:1). On autoradiographie ensuite la plaque pendant 16 à 24 h avec un film Biomax MS
(Kodak) . On visualise les saccharides transporteurs en diffusant sur la plaque une solution d'éthanol comprenant 5% d'H2S04, et en chauffant la plaque à 100°C pendant 15 min. L'analyse des plaques permet ensuite l'identification précise des fonctions enzymatiques codées par les gènes eps de la souche Sfi39.
Exemple VIII : Clonage de 1 ' opéron de Lactobacillus helveticus CNCM 1-1449 impliqué dans la synthèse d'un EPS
1 . Structure répétée de l 'EPS
La structure de l'EPS produit par la souche Lactobacillus helveticus LH59 (CNCM 1-1449) a déjà été présentée par Stingele et al . (Carbohydrate Research, 302, 197-202, 1997), et dans la demande de brevet EP-A-0699689, le contenu technique de ces documents étant incorporé par référence. Cette souche est notamment utilisée pour la fermentation de produits lactés tels que le fromage.
2 . Clonage
Parmi les amorces testés, celles ayant les séquences nucléotidiques SEQ ID NO: 41 et SEQ ID NO: 42, ont
permis d'amplifier un fragment de gène eps dans les mêmes conditions que celles de l'exemple I. Pour cela, l'ADN génomique de la souche LH59 a été au préalable isolé selon la technique de Slos et al . (1991) . Un fragment de PCR de 140 pb a ainsi pu être isolé, puis clone dans le plasmide linéarisé pGEMT (Promega, USA) . Le séquençage de ce fragment par la méthode des didéoxynucléotides (kit f-mol® DNA Sequencing System, Promega) indique une séquence correspondant aux nucléotides 1385 à 1526 de la séquence SEQ ID NO: 12.
Ce fragment de PCR a été utilisé pour cribler une banque λ-ZAP Express (Stratagene, USA) renfermant des fragments d'ADN de la souche LH59 selon le procédé décrit dans 1 ' exemple 1. En recoupant les séquences nucléotidiques des différents inserts génomiques, on a pu ainsi caractériser la séquence nucleotidique SEQ ID NO: 12 correspondant à l 'opéron de la souche LH59 impliqué dans la synthèse d'un EPS (voir la figure 2) .
3 . Analyse de la séquence SEQ ID NO : 12
La séquence SEQ ID NO: 12 contient 1 ' opéron eps de la souche LH59 et comprend un élément de transposition orienté dans la direction opposée à 11 ORFs complets présentés dans la même orientation, que l'on appelle epsl à epsll . Cet élément de transposition est un fragment de plasmide cryptique de L. helveticus pLH3 (Pridmore et al., FEMS Microbiological Letters, 124, pp. 301-306 (1994)) (voir figure 2). La comparaison des séquences en acides aminés codées par les ORFs avec celles de protéines présentes dans la banque de donnée Swiss-Prot, à l'aide des logiciels FASTA, PEPPLOT et PILEUP de GCG-
softwear, isconsin, USA, permet de déduire la fonction de ces protéines. Les résultats sont présentés ci-après.
L'ORF epsl (nucléotides 1052 - 1729) code pour une protéine (SEQ ID NO: 13) ayant environ 59% d'identité avec des undecaprenyl-phosphate-glycosyl-1-phosphate- transferases, en particulier de S. salivarius (Genbank, n°P72577) . Cette homologie confirme son rôle dans la biosynthèse de l'EPS.
L'ORF eps2 (nucléotides 1733 - 2848) code pour une protéine (SEQ ID NO: 14) ayant environ 36% d'identité avec une α-glycosyltransférase de S. thermophilus (Genbank, n°Q56044) , en particulier au niveau du motif SX2EX7E présent dans toutes ces enzymes . Cette homologie confirme son rôle dans la biosynthèse de l'EPS. L'ORF eps3 (nucléotides 2851 -3942) code pour une protéine (SEQ ID NO: 15) ayant environ 32% d'identité avec des glycosyltransferases, en particulier de Bacillus subtilis (Genbank, n°P71055) . Cet ORF code ainsi probablement pour une α-glycosyltransférase. L'ORF eps4 (nucléotides 3929 -5083) code pour une protéine (SEQ ID NO: 16) ayant environ 28% d'identité avec des glycosyltransferases, en particulier de Bacillus subtilis (Genbank, n°P71055) . Cet ORF code probablement pour une α-glycosyltransférase. L'ORF eps5 (nucléotides 5076 -6095) code pour une protéine (SEQ ID NO: 17) ayant environ 29% d'identité avec des β-glycosyltransferases, en particulier de S . thermophilus (GenBank n°O07339) . Cette homologie confirme son rôle dans la biosynthèse de l'EPS. L'ORF eps6 (nucléotides 6098 _7090) code pour une protéine (SEQ ID NO: 18) ayant environ 29% d'identité avec des β-glycosyltransferases, en particulier de S.
thermophilus (GenBank n°O07339) . Cette homologie confirme son rôle dans la biosynthèse de l'EPS.
L'ORF eps7 (nucléotides 7095 -8258) code pour une protéine (SEQ ID NO: 19) ayant environ 27% d'identité avec une polymerase d'EPS de S. pneumaniae (GenBank n°O07867) . Cette homologie confirme son rôle dans la biosynthèse de l'EPS.
L'ORF eps8 (nucléotides 8283 -9122) code pour une protéine (SEQ ID NO:20) ayant environ 27% d'identité avec des glycogenines (GenBank n°Q22997; P46976; P132780) . Ces homologies confirment son rôle dans la biosynthèse de l'EPS probablement en tant que glycosyltransférase .
L'ORF eps9 (nucléotides 9125 -10263) code pour une protéine (SEQ ID NO:21) similaire au UDP-galactosyl- pyranose-mutase de E. coli K-12 impliquée dans la conversion de 1 'UDP-galactopyranose en UDP-galactofuranose . L'ORF eps9 doit jouer un rôle central dans la synthèse des exopolysaccharides, puisqu'il permet le transfert de phosphofuranose sur l'unité répétitive suivante. L'ORF epslO (nucléotides 10250-11662) code pour une protéine (SEQ ID NO: 22) présentant des similarités avec l'EpsK de Lactococcus lactis, le CpsL de Streptococcus pneumoneia, le TrsA de Hiersina enterocol tica et le RfbX de E. Coli (Yao et Valvano, Journal of Bacteriology, 176, pp. 4133-4143 (1994)). Ces homologies confirment son rôle en tant qu'unité de transport des polysaccharides formés.
L'ORF epsll (nucléotides 1166413181) code pour une protéine (SEQ ID NO: 23) présentant des similarités avec la protéine 0331 de E. Coli et IcaC de Staphylococcus epidermidis (Elmann et al., Molecular Microbiology, 20 (5), pp. 1083-1091 (1996)). Ces homologies confirment son rôle en tant qu'unité pour la synthèse ou l'exportation des exopolysaccharides .
En conclusion, les inserts génomiques isolés des vecteurs pCMV couvrent une région génomique de la souche L. helveticus LH59 qui est manifestement impliquée dans la biosynthèse de l'EPS.
Exemple IX : Inactivation des gènes eps
On inactive par recombinaison homologue les gène epsl -8 de 1 Opéron pour confirmer leur importance dans la biosynthèse de l'EPS. Pour cela, on amplifie par PCR un fragment de chaque ORF provenant d'un des vecteurs pCMV décrits à l'exemple I ci-dessus, on ligue le produit de PCR dans le plasmide pSA3 préalablement digéré convenablement, on transforme la souche E. coli XLl-blue par le produit de ligation, on sélectionne des transformants, on isole un plasmide recombinant, puis on transforme la souche L. helveticus LH59 avec le plasmide recombinant au moyen de la méthode décrite par Thompson et al . (Appl . Micob. Biotec . , 35, 334-338, 1991). On étale les cellules transformées sur un milieu solide MRS supplémenté de 2,5 μg/ml d' erythromycine, que l'on incube ensuite 16 h à 45°C, puis on sélectionne les colonies transformées qui survivent.
Les colonies qui survivent ont intégré dans un des 8 gènes eps le plasmide pSA3 recombinant . Ceci peut être vérifié par Southern-Blot d'une préparation d'ADN génomique des colonies survivantes digérée, et hybridation du filtre de Southern-Blot avec le produit de PCR rendu radioactif. Les colonies ayant intégré le plasmide présentent des bandes différentes que celles obtenues dans les mêmes conditions avec la souche sauvage. De plus, les colonies ayant intégré dans un des 8 gènes eps le plasmide recombinant présentent ont perdu leur caractère filant dans un lait MSK.
Exemple X : Biosynthèse d'un EPS
On prépare un plasmide à partir du plasmide pSA3 (Dao et al . (1985)), en ajoutant un fragment d'ADN de la souche LH59 contenant la séquence nucleotidique SEQ ID NO: 12 décrite à l'exemple VIII et en ajoutant les parties régulatrices de 1 ' opéron eps de la souche S . thermophilus Sfi6 (EP750043), de sorte que l'expression (la transcription et la traduction) des gènes eps de la souche LH59 puisse être effectuée dans S . thermophilus . On transforme ensuite par electroporation, avec ce plasmide, la souche S . thermophilus CNCM 1-1422 qui a été déposée le 18 mai 1994 selon le traité de Budapest. N'importe qu'elle autre souche filante S . thermophilus aurait pu aussi être utilisée. Cette souche présente au microscope un aspect de coques non flagellées formant des chaînettes, elle ne fait pas de spores, elle est anaéorobe facultative, et elle produit un EPS ayant la composition Glc:Gal=2:2.
Exemple XI : Biosynthèse d'un EPS On prépare un plasmide à partir du plasmide pSA3 en ajoutant un fragment d'ADN de la souche LH59 contenant la séquence nucleotidique SEQ ID NO: 12 décrite à l'exemple I et en ajoutant les parties régulatrices de l'opéron eps de la souche S . thermophilus Sfi6 (EP750043) , de sorte que l'expression (la transcription et la traduction) des gènes eps de la souche LH59 puisse être effectuée dans S. thermophilus . On transforme ensuite par electroporation, avec ce plasmide, la souche S . thermophilus CNCM 1-1351 qui a été déposée le 5 août 1993 selon le traité de Budapest. N'importe qu'elle autre souche filante S . thermophilus aurait pu aussi être utilisée. Cette souche présente au microscope un aspect de coques non flagellées formant des chaînettes, elle ne fait pas de
spores, elle est anaéorobe facultative, et elle produit un EPS ayant la composition Glc :Gal :Rha=l : 3 : 2
Exemple XII : Biosynthèse d'un EPS On isole de l'ADN génomique de la souche LH59 par la méthode de Slos et al . (1991) . On digère la préparation d'ADN par Sali et BamHI, on sépare les fragments d'ADN par électrophorese sur gel d'agarose 0,7%, on élue les fragments supérieurs à 5 kb, on ligue l'ADN extrait au vecteur pJIM2279 préalablement digéré par Sali et BamHI puis déphosphorylé . On transforme la souche Lactococcus lactis MG1363 (1983) comme décrit dans l'exemple V. On sélectionne les clones transformés par hybridation du DNA génomique des clones avec l'une des sondes dérivées de la séquence SEQ ID NO: 12. Parmi les transformants, on sélectionne les clones positifs.
Exemple XIII : Préparation ςj_S gènes fonctionnels homologues aux gènes eps On prépare des dérivés fonctionnels des gènes epsl - 8 en mettant en oeuvre une méthode adaptée de celle décrite par Adams et al . (EP-A-0402450 ; Genencor) . Pour cela, on isole chacun des gènes eps par PCR à partir de l'ADN génomique de la souche LH59. Les amorces utilisées sont choisies à partir de la séquence SEQ ID NO: 12, de sorte à amplifier uniquement chaque gène. On clone chaque produit de PCR dans le vecteur d'expression pQE60 (Qiagen, US) fonctionnellement en aval d'un promoteur E. coli régulant la transcription et la traduction du gène eps . On soumet enfin chaque vecteur à une mutagénèse chimique in- vi tro avec de 1 ' hydroxylamine, comme décrit par Adams et al .
On transforme la souche E. coli DH5α (Stratagen, US) qui ne possède pas naturellement d'activité glycosyltransférase, par les plasmides pQE60 traités avec l'agent mutagène, puis on sélectionne des transformants. Pour identifier parmi les transformants des gènes eps codant pour des variants d'enzymes, on analyse la spécificité enzymatique des enzymes exprimées dans chaque clone d1 S. coli, au moyen de la méthode décrite à l'exemple VII. L'analyse des gènes eps portés sur les plasmide pQE60 des clones ainsi sélectionnés montre que ceux-ci ne différent du gène eps original que par la substitution, la délétion ou l'addition d'un petit nombre de bases nucléotidiques conduisant à des modifications de la séquence en acides aminés de la glycosyltransférase .
Exemple XIV : Synthèse de polysaccharides avec les lycosyltransférases de LH59
On isole chacun des gènes eps codant pour une glycosyltransférase par PCR à partir de l'ADN génomique de la souche LH59. Les amorces utilisées sont choisies à partir de la séquence SEQ ID NO: 12, de sorte à amplifier uniquement chaque gène selon le procédé décrit dans 1 'xemple VII .
Parallèlement, on cultive la souche LH59 dans un milieu contenant du D-Glcp, D-Galp et D-Galf, on soumet les cellules de cette culture à 20000 psi, on extrait des membranes les chaînes saccharidiques en formation (liées à une amorce) en traitant les débris cellulaires avec du chloroforme/méthanol puis en évaporant l'extrait. A titre de témoin dans les essais qui vont suivre, on procède de la même manière avec la souche LH59 cultivée en présence de saccharides radioactifs.
On détermine ensuite la spécificité des glycosyltransférases présentes dans les membranes par un procédé similaire à celui décrit dans l'exemple VII.
L'analyse des plaques permet de confirmer la fonction en tant que glucosyltransferase des opérons epsl à eps4 par l'analyse fonctionnelle de leur activité en présence d'un substrat.
Exemple XV : Synthèse d'un nouveau polysaccharide On purifie l'EPS d'un milieu de culture de la souche Lactobacillus helveticus TY1-2 (Y. Yamamoto et al . , Carbohydrate Research, 261, 67-78, 1994) . Cet EPS est constitué par la répétition de l'unité saccharidique suivante :
β-D-Gal/.-(l→4)-β-D-Glc/. 1 i 6 →6)-β-D-Glc/.-(1→3)-β-D-Glc/.-(1→6)-α-D-Glc/?Nac-(1→3)-β-D-Gal.(1 →
1
:__
4 β-D-Gal/. Pour cela, on ajoute un volume d'acide trichloroacétique (40%) au milieu de culture, on centrifuge
(17000 g, 20 min), on récupère le surnageant, on ajoute un volume d'acétone, on centrifuge à nouveau (17000 g, 20 min), on récupère la partie précipitée que l'on dissout dans de l'eau distillée à pH 7, on la dialyse dans de l'eau (12 h) , puis on élimine les insolubles par ultracentrifugation (110000 g, 1 h) .
Ensuite, on greffe un N-acétylgalactosamine sur le galactose des ramifications lactose de l'EPS, en utilisant une β-1 , 4-N-acétylgalactosaminyl-transférase et son substrat approprié, par exemple celles décrites par Lutz et al . et Yamashiro et al . (J. of Biol. Chem., 269 ,
29227-29231, 1994; J. of Biol. Chem., 270. 6149-6155, 1995) .
Exemple XVI : Synthèse d'un nouveau polysaccharide 5 On soumet l'EPS de l'exemple XV à l'α-2,3- sialyltransférase commercialisée par Calbiochem® (Cat No.566218 -M, USA) en présence de son substrat approprié.
Exemple XVII : Synthèse d'un nouveau polysaccharide 0 On soumet l'EPS de l'exemple XV à l'α-2,6- sialyltransférase décrite par Sjoberg et al., ou à l'α-2,6- sialyltransférase décrite par Yamamoto et al . , en présence de leurs substrats appropriés (J. Biochem., 271, 7450-7459, 1996; Biosci. Biotech. Biochem., £2, 210-214, 1998). 5
Exemple XVIII : clonage de 1 ' opéron de L. bul aricus CNCM
1-800 impliqué dans la synthèse d'un EPS 1. Structure répétée de l 'EPS
La structure de 1 ' EPS produit par la souche 0 L. bulgaricus Lfi5 (CNCM 1-800) a été déterminée par résonance magnétique, selon une technique similaire à celles décrites dans EP 97111379.0 et EP 97111381.6. Les résultats montrent que l'EPS est constitué de l'unité répétitive suivante : 5 β-D-Gal/? α-L-R ap β-D-Gal/.
1 1 1
4 3 3 o →3)-β-D-Gal/?(l→4)-α-D-Gal/.(l→2)-α-D-Gal/.(l→3)-β-D-Glc/7(l→
2 . Clonage
Parmi les amorces testées, celles ayant les séquences nucléotidiques SEQ ID NO: 43 et SEQ ID NO: 44, ont 5 permis d'amplifier un fragment de gène eps dans les mêmes
conditions que celles de l'exemple I. Pour cela, l'ADN génomique de la souche Sfi39 a été au préalable isolée selon la technique de Slos et al . (1991) .
Un fragment de PCR a ainsi pu être isolé, puis clone dans le plasmide linéarisé pGEMT (Promega, USA) . Le séquençage de ce fragment par la méthode des didéoxynucléotides (kit f-mol® DNA Sequencing System, Promega) indique une séquence correspondant aux nucléotides 1698 à 1841 de la séquence SEQ ID NO: 24. Ce fragment de PCR a été utilisé pour cribler une banque λ-ZAP Express (Stratagene, USA) renfermant des fragments d'ADN de la souche Lfi5 selon le protocole de 1 ' exemple I .
On a pu ainsi caractériser une séquence correspondant à 1 ' opéron de la souche Lfi5 impliqué dans la synthèse d'un EPS.
Afin de récupérer les séquences bordant le fragment initial, d'autres criblages de la banque Lambda Zap ont été effectués mais aucun n'a permis d'isoler de nouveaux fragments. Certaines séquences de Lb . bulgaricus contenant par exemple des promoteurs sont connues pour être toxiques et donc instables chez E. coli . Cela explique sûrement les difficultés à isoler les fragments d'ADN adjacents. Afin de contourner cet obstacle et de cloner les régions d'ADN bordant ce clone, les techniques de PCR reverse et de SSP-PCR (Single Spécifie Primer PCR) ont été utilisées. Cela a permis d'amplifier plusieurs fragments correspondant aux extrémités 5' et 3' de l' opéron eps . En recoupant les séquences nucléiques des différents fragments chromosomiques isolés, on a pu ainsi caractériser la séquence SEQ ID NO: 24 (voir la figure 3) .
3 . Analyse de la séquence SEQ ID NO: 24
La séquence SEQ ID NO: 24 présente 1 ' opéron eps de la souche Lfi5 et comprend 14 ORFs complets, dans la même orientation, que l'on appelle epsA à epsN (voir la figure 3) . La comparaison des séquences en acides aminés codées par les ORFs avec celles de protéines présentes dans la banque de donnée Swiss-Prot, à l'aide des logiciels FASTA, PEPPLOT et PILEUP de GCG-softwear, isconsin, USA, permet de déduire la fonction de ces protéines . Les résultats sont présentés ci-après.
L'ORF epsA (nucléotides 295 - 1326; code pour une protéine (SEQ ID NO:24) ayant 32% d'identité avec la protéine LytR de Synechocytis sp Pcc 6803 (Genbank n°
P74136) . Cet ORF code de toute évidence pour un atténuateur de transcription influençant la régulation.
L'ORF epsB (nucléotides 1326 -2225 ) code pour une protéine (SEQ ID NO:25) ayant environ 26% d'identité avec la protéine CapA de Staphylococcus aureus (Genbank n°
P39850) . Cet ORF intervient de toute évidence dans la détermination de la longueur des chaînes de saccharides.
L'ORF epsC (nucléotides 2514-2858) code pour une protéine (SEQ ID NO: 27) ayant environ 38% d'identité avec la protéine EpsB Lactococcus lactis (GenBank n°O06030) . Cet ORF code ainsi probablement pour une protéine de régulation impliquée dans le contrôle du poids moléculaire et/ou la longueur de la chaîne polysaccharidique .
L'ORF epsD (nucléotides 3020-3796) code pour une protéine (SEQ ID NO:28) ayant environ 41% d'identité avec la protéine EpsC Lactococcus lactis (GenBank n°O06031) . Cette homologie confirme le rôle de cet ORF dans la synthèse d'un EPS.
L'ORF epsE (nucléotides 3827-4483) code pour une protéine (SEQ ID NO: 29) ayant environ 44% d'identité
avec la protéine Cpsl4E de Streptococcus pneumoniae
(Genbank, n°P72513) . Cet ORF code ainsi de toute évidence pour une galactosyl- ou glucosyl-phospho-transférase catalysant le transfert du premier saccharide sur le transporteur lipidique ou protéique.
L'ORF epsF (nucléotides 4878-5678) code pour une protéine (SEQ ID NO: 30) ayant environ 30% d'identité avec la protéine EpsF de Streptococcus thermophilus
(Genbank, n°Q56043) . Cet ORF code ainsi de toute évidence pour une α-glycosyltransférase.
L'ORF epsG (nucléotides 5750-6877) code pour une protéine (SEQ ID NO: 31) ayant environ 34% d'identité avec la protéine EpsG de Streptococcus thermophilus (Genbank, n°Q56044) . Cet ORF code ainsi de toute évidence pour une α-glycosyltransférase.
L'ORF epsH (nucléotides 7015-7821) code pour une protéine (SEQ ID NO: 32) ayant environ 37% d'identité avec la protéine YveO de Bacillus subtilis (Genbank, n°P71054) . Cet ORF code ainsi de toute évidence pour une β-glycosyltransférase.
L'ORF epsl (nucléotides 7839-8708) code pour une protéine (SEQ ID NO: 33) ayant environ 23% d'identité avec la protéine Cpsl4K de S. pneumaniae (Genbank, n°O07341) . Cet ORF code ainsi de toute évidence pour une glycosyltransférase.
L'ORF epsJ (nucléotides 9213-10196) code pour une protéine (SEQ ID NO: 34) ayant environ 33% d'identité avec la protéine Eps I de S. thermophilus (GenBank n°Q56046) . Cet ORF code ainsi de toute évidence pour une β-glycosyltransférase .
L'ORF epsK (nucléotides 10227-11288) code pour une protéine (SEQ ID NO: 35) ayant environ 24% d'identité avec la protéine YveQ Bacillus subtilus (GenBank
n°P71056) . Cet ORF code ainsi probablement pour une protéine responsable de la polymérisation des unités répétées .
L'ORF epsL (nucléotides 11358 -12284) code pour une protéine (SEQ ID NO: 36) ayant environ 20% d'identité avec la protéine RfaS de E. coli (GenBank n°P27126) . Cette homologie démontre que cet ORF est impliqué dans la biosynthèse d'un EPS.
L'ORF epsM (nucléotides 12372- 13382) code pour une protéine (SEQ ID NO: 37) ayant environ 38% d'identité avec la protéine CpsH de Streptococcus agaloctiae (GenBank n°087183) . Cette homologie montre que cet ORF est impliqué dans la biosynthèse d'un EPS.
L'ORF eps_V (nucléotides14269 - 1572b code pour une protéine (SEQ ID NO: 38) ayant environ 35% d'identité avec la protéine Cpsl9BJ de Streptococcus pneumonoiae
(GenBank n°O07342) . Cet ORF code probablement pour une protéine responsable de l'exportation de l'EPS.
En conclusion, les homologies observées indiquent que les différents ORFs identifiés dans les inserts chromosomiques sont impliqués dans la biosynthèse de l'EPS.
Exemple XIX : Biosynthèse d'un EPS On prépare un plasmide à partir du plasmide pSA3 (Dao et al . (1985)), en ajoutant un fragment d'ADN de la souche Lfi5 contenant la séquence SEQ ID NO:24 et en ajoutant les parties régulatrices de 1 ' opéron eps de la souche S. thermophilus Sfi6 (EP750043) , de sorte que l'expression (la transcription et la traduction) des gènes eps de la souche Lfi5 puisse être effectuée dans S . thermophilus comme proposé à l'exemple X.
Exemple XX : Biosynthèse d'un EPS
On prépare un plasmide à partir du plasmide pSA3 , en ajoutant un fragment d'ADN de la souche Lfi5 contenant la séquence SEQ ID NO: 24 et en ajoutant les parties régulatrices de 1 ' opéron eps de la souche S. thermophilus Sfi6 (EP750043), de sorte que l'expression (la transcription et la traduction) des gènes eps de la souche Lfi5 puisse être effectuée dans S. thermophilus comme proposé à l'exemple XI.
Exemple XXI : Biosynthèse d'un EPS
On isole de l'ADN chromosomique de la souche CNCM 1-800, on digère la préparation d'ADN par Xbal , on sépare les fragments d'ADN par électrophorese sur gel d'agarose 0,7%, on élue les fragments de plus de 9 kb, on ligue l'ADN extrait au vecteur pJIM2279 (obtenu de P. Renault, INRA, Jouy-en-Josas, Paris, France) préalablement digéré par Xbal puis déphosphorylé . On transforme la souche Lactococcus lactis MG1363 comme décrit à l'exemple V. On sélectionne les clones transformés par hybridation de l'DNA génomique des clones avec l'une des sondes dérivées de la séquence SEQ ID NO: 24.
Exemple XXII : Préparation de σènes fonctionnels homologues aux gènes epsl -9
On prépare des dérivés fonctionnels des gènes epsl -9 en mettant en oeuvre une méthode adaptée de celle décrite par Adams et al . (EP402450; Genencor) . Pour cela, on isole chacun des gènes eps par PCR à partir de l'ADN génomique de la souche Lfi5 (CNCM 1-800) . Les amorces utilisées sont choisies à partir de la séquence SEQ ID NO: 24, de sorte à amplifier uniquement chaque gène. On clone chaque produit de PCR selon le procédé décrit à 1 'exemple XIII .
Pour identifier parmi les transformants des gènes eps codant pour des variants d'enzymes, on analyse la spécificité enzymatique des enzymes exprimées dans chaque clone d' E. coli , au moyen de la méthode décrite à l'exemple XVII. L'analyse des gènes eps portés sur les plasmides pQE60 des clones ainsi sélectionnés montre que ceux-ci ne différent du gène eps original que par la substitution, la délétion ou l'addition d'un petit nombre de bases nucléotidiques conduisant à des modifications de la séquence en acides aminés de la glycosyltransférase.
Exemple XXIII : Synthèse de polysaccharides avec les αlycosyltransférases de Lfi5 On isole chacun des gènes eps codant pour une glycosyltransférase par PCR à partir de l'ADN génomique de la souche Lfi5 (CNCM 1-800) . Les amorces utilisées sont choisies à partir de la séquence SEQ ID NO: 24, de sorte à amplifier uniquement chaque gène selon le protocole décrit à l'exemple VII en utilisant le vecteur d'expression pBAD (Invitrogen, USA) .
Parallèlement, on cultive la souche Lfi5 dans un milieu contenant du D-Glcp, D-Galp et L-Rhap, on soumet les cellules de cette culture à 20000 psi, on extrait des membranes les chaînes saccharidiques en formation (liées à une amorce) en traitant les débris cellulaires avec du chloroforme/méthanol (2:1) et en évaporant l'extrait. A titre de témoin dans les essais qui vont suivre, on procède de la même manière avec la souche Lfi5 cultivée en présence de saccharides radioactifs. On détermine ensuite la spécificité des glycosyltransferases présentes dans les membranes par un procédé similaire à celui décrit dans l'exemple VII.
L'analyse des plaques permet ensuite l'identification précise de différentes fonctions
enzymatiques codées par les gènes eps de la souche Lfi5. Ces constructions ayant incorporé notamment les gènes epsE à espJ ont permis de confirmer 1 ' activité de glucosyltransferase du gène epsE par une analyse fonctionnelle de leur activité en présence de leur substrat de glucose.
Exemple XXIV Construction d'un vecteur navette
Les gènes epsA à epsM ont été amplifiés par PCR et insérés dans le vecteur navette pTRKH2 (O' Sullivan et al., Gène, 137, pp. 227-231 (1993)) et clones dans des hôtes hétérologues Lactococcus lactis MG1363 de manière à déterminer si un tel fragment permet la production d'EPS par cette souche. Après analyse de restriction des différents amplicons de PCR, il a été montré qu'aucune délétion détectable ou réarrangement n'a eu lieu durant les étapes de clonage. Les transformants analysés sur les plaques au moyen d'un test par cure-dent montrent un phénotype filant par les souches ne présentant pas ce phénotype à l'origine. Ceci prouve que les gènes esp introduits sont responsables de la synthèse d'EPS par ces souches transformées.