ES2905103T3

ES2905103T3 - Polipéptidos con especificidad de transporte de arabinosa mejorada

Info

Publication number: ES2905103T3
Application number: ES18803387T
Authority: ES
Inventors: Maris Antonius Jeroen Adriaan Van; Jacobus Thomas Pronk; Maarten Dirk Verhoeven
Original assignee: DSM IP Assets BV
Current assignee: DSM IP Assets BV
Priority date: 2017-11-14
Filing date: 2018-11-12
Publication date: 2022-04-07
Anticipated expiration: 2038-11-12
Also published as: US20210002651A1; US11326172B2; EP3710469A1; CN111344299A; PL3710469T3; BR112020007140A2; WO2019096718A1; EP3710469B1; CA3079778A1; DK3710469T3

Abstract

Una variante de un polipéptido parental que es preferiblemente un transportador de hexosa, en la que el polipéptido parental comprende la secuencia de aminoácidos de SEQ ID NO: 1, y en la que la variante comprende una secuencia de aminoácidos que, cuando se alinea con la secuencia de aminoácidos de SEQ ID NO: 1, comprende una sustitución de los aminoácidos N376 y T89, definiéndose las posiciones de dichos aminoácidos con referencia a la secuencia de aminoácidos de SEQ ID NO: 1, en la que la sustitución del aminoácido T89 comprende una cualquiera de T89I, T89V, T89L, T89S, T89M o T89F.

Description

DESCRIPCIÓN

Polipéptidos con especificidad de transporte de arabinosa mejorada

Campo

La invención se refiere a polipéptidos variantes con especificidad de transporte de arabinosa mejorada y actividad de transporte de glucosa reducida, a una levadura recombinante que comprende una secuencia de ácido nucleico que codifica dichos polipéptidos, y a su uso para producir un producto de fermentación tal como etanol.

Antecedentes

Al reemplazar funcionalmente los compuestos derivados de combustibles fósiles, la producción microbiana de productos químicos y combustibles para el transporte puede contribuir a una transición hacia una economía mundial sostenible y con bajas emisiones de carbono. La producción industrial total de etanol combustible, que alcanzó aprox.

100 mil millones de litros en 2015, se prevé que aumente aún más. La levadura Saccharomyces cerevisiaees la fábrica de células microbianas establecida para la conversión de unidades de hexosa derivadas de almidón y sacarosa en etanol, ya que combina un alto rendimiento y productividad de etanol con robustez en las condiciones del procedimiento. Los esfuerzos en la mejora de la cepa de levadura y la optimización del procedimiento de producción de bioetanol a base de almidón de maíz y azúcar de caña han mejorado aún más el rendimiento y la productividad del producto. Además, estudios intensivos de ingeniería metabólica y evolutiva han producido cepas de levadura capaces de fermentar eficientemente los azúcares de pentosa xilosa y arabinosa, allanando así el camino para la producción de bioetanol de “segunda generación” a base de levadura a partir de hidrolizados lignocelulósicos.

El documento WO 2014/195520 se refiere a nuevos polipéptidos de permeasa con especificidad de azúcar alterada y/o actividad de transporte de azúcar, y describe un polipéptido que tiene una o más sustituciones correspondientes a F85T/A/C/H/M/N, T89H/D/C/A/N, V187T/C/D/E/F/G/H/K/M/Q/R/S/W/Y, A191N/G/P/C/D/F/H/l/K/Q/V/W/Y, Y214V/Q/G/L/M/N/P/R/S, Q215L/M/I/A/C/D/F/S, 1218K/N/A/C/ D/E/H/L, T219G/F/D/N, I222D/C/H/E/G/P/S/V/Y, Y226D/M/R/C/G/H/I/L/P/Q/T/W, Q338C/E/F/D/G/ l/P/R/S/T/V/W/Y, M339N/V/D/E/H/K/P/Q/R/Y, Q341T/M/N/S/Y, Q342Y/S/C/A/D/F/G/H/I/K/L/N/P /R/T/V/W, L343K/R/P/C/D/E/G/H/I/M/N/Q/S/T/Y, N346W/Y/F/G/H/K/L/M/R/T, N347A/I/E/H/L, Y350R/L/T/D/K/M/N/V, G373L/E/N/F/K/M/R/V/W/Y, N376I/T/M/A/C/E/F/H/K/L/P/Q/R/V/W/Y, T380M/F/H/N/P/Q/R/S/V, S383Q/T/C/D/E/F/I/K/L/M/R/V/W/Y, F444Y/D/E/H/K/N/P/Q/R/W, F446Q/L/H/D/E/I/M/N, T448M/H/D/E/F/K/R/W/Y, T449F/M/N/S/D/E/G/H/I/K/L/P/Q/R/V/W/Y, T451I/E/C/D/F/H/K/L/M/N/Q/R/S/T/V/W/Y, W455T/N/A/C/E/L/P/Q/T, N478P/F/V/G/I/K/R/W, o W479T/S/Q/D/E/F/G/H/I/M/N/P/R/V/Y de SEQ ID NO:59, en el que el polipéptido es un miembro de la Superfamilia de Facilitadores Principales (MFS).

Wang et al, “ Identification of Important Amino Acids in Gal2p for improving the L-arabinose Transport and Metabolism in Saccharomyces cerevisiae”, Frontiers in Microbiology, Vol. 8, (julio de 2017), páginas 1-11, estudian restos de aminoácidos cruciales para el transporte de L-arabinosa. Los restos de aminoácidos polares o aromáticos en diferentes secuencias transmembránicas (TMS) de Gal2p se escogieron para un estudio más en profundidad, incluyendo F85, T89, F223, N346, N347, F350, Y351, N376, y Y446. Wang et al concluyen que el sitio F85 es un resto clave para mejorar la actividad de transporte de L-arabinosa de Gal2p.

Se sabe que el transportador de hexosa Gal2 media el transporte de arabinosa (Becker J, Boles E. 2003, A modified Saccharomyces cerevisiae strain that consumes L-Arabinose and produces ethanol, Appl Environ Microbiol. 69: 4144 4150). Sin embargo, la afinidad por los respectivos azúcares de pentosa es aproximadamente 10 a 100 veces menor que por los respectivos azúcares de hexosa. La falta de un transportador dedicado de xilosa o arabinosa en las células de levadura recombinantes limita así la capacidad de coutilización de hexosas y pentosas en mezclas de azúcares, y prohíbe un alto flujo catabólico de pentosas. Como consecuencia, la conversión de azúcares de biomasa puede considerarse bifásica: en la primera fase, tiene lugar una conversión relativamente rápida de hexosas (glucosa), mientras que en la segunda fase, que comienza cuando las hexosas se han agotado del medio, comienza la fermentación de pentosas, pero a una velocidad mucho menor en comparación con la velocidad de conversión de hexosas.

Por lo tanto, es un deseo sentido desde hace mucho tiempo expresar transportadores de azúcares específicos de arabinosa, es decir, sin interferencia de glucosa (especificidad de arabinosa) y alta afinidad por la arabinosa, para mantener la capacidad de convertir hexosas aproximadamente al mismo nivel.

Breve descripción de los dibujos

Figura 1. Experimentos de absorción usando [14C-]L-arabinosa 50 mM en presencia de un intervalo de concentraciones de D-glucosa usando la cepa DS68625 que expresa variantes de Gal2: N376T+T89I (círculos en blanco), N376T (círculos en negro), T89I (cuadrados en blanco) y Gal2 de tipo salvaje (cuadrados en negro).

Figura 2. Experimentos de absorción usando [14C-]L-arabinosa 50 mM en presencia de un intervalo de concentraciones de D-glucosa usando la cepa DS68625 que expresa variantes de Gal2: N376T+T89I (círculos en blanco), N376T (círculos en negro), T89I (cuadrados en blanco) y Gal2 de tipo salvaje (cuadrados en negro).

Figura 3. Experimentos de absorción usando diversas concentraciones de [14C-]L-arabinosa (arriba) o [14C-]D-glucosa (abajo) para determinar Km y Vmax de la cepa DS68625 que expresa variantes de Gal2: T89I (círculos en blanco), N376T+T89I (círculos en negro), N376T (cuadrados en blanco), Gal2 de tipo salvaje (cuadrados en negro), N376S (diamantes en negro), y N376I (diamantes en blanco).

Descripción detallada

Un objeto de la invención es proporcionar nuevos polipéptidos de transporte de hexosa variantes que tienen una afinidad reducida por la glucosa. Otro objeto de la invención es proporcionar nuevos polipéptidos de transporte de hexosa variantes que tienen alta afinidad por la arabinosa. Uno o más de estos objetos se logran según la invención.

A lo largo de la presente memoria descriptiva y las reivindicaciones adjuntas, las palabras “comprender” e “incluir”, y variaciones tales como “comprende”, “que comprende”, “incluye” y “que incluye” deben interpretarse de manera inclusiva. Es decir, estas palabras están destinadas a transmitir la posible inclusión de otros elementos o números enteros no citados específicamente, cuando el contexto lo permita. Los artículos “un” y “una” se usan aquí para hacer referencia a uno o más de uno (es decir, uno o al menos uno) del objeto gramatical del artículo. A modo de ejemplo, “un aminoácido” puede significar un aminoácido o más de un aminoácido.

La secuencia de aminoácidos alineada con la secuencia de aminoácidos expuesta en la SEC ID NO: X (cuando se refiere a un polipéptido variante) significa que la secuencia de aminoácidos variante y la secuencia de aminoácidos expuesta en la SEC ID NO: X están alineadas por un método adecuado que permite la comparación de las secuencias entre sí e identificaciones de las posiciones en la secuencia de aminoácidos de la variante en la que está presente el mismo aminoácido (posición idéntica), o está presente otro aminoácido (sustitución), o están presentes uno o más aminoácidos adicionales (inserción o extensión), o no hay aminoácidos presentes (supresión o truncamiento), si se compara con la secuencia de aminoácidos expuesta en SEQ ID NO: X.

Un método adecuado que permite la comparación de dos secuencias de aminoácidos puede ser cualquier método de alineación de secuencias por pares adecuado conocido por los expertos en la técnica, preferiblemente un método de alineación de secuencias por pares global. Un método preferido de alineación de secuencias por pares global es el método EMBOSS Needle basado en el algoritmo de alineación de Needleman-Wunsch (con el objetivo de encontrar la alineación óptima (incluyendo los espacios) de las dos secuencias a lo largo de toda su longitud) (Needleman, S. B. y Wunsch, C. D. (1970) J. Mol. Biol. 48, 443-453) como se describe aquí. En una realización, la secuencia de aminoácidos se alinea con la secuencia de aminoácidos expuesta en SEQ ID NO: x usando el programa NEEDLE del paquete EMBOSS, usando EBLOSUM62 como matriz de sustitución, con una penalización por apertura de espacio de 10 y una penalización de extensión de espacio de 0,5.

Una “levadura” o “célula de levadura”, como se define aquí, es una levadura adecuada para manipulación genética, y que puede cultivarse a densidades celulares útiles para la producción industrial de un producto diana. Una levadura o una célula de levadura se puede encontrar en la naturaleza o una célula derivada de una célula parental después de la manipulación genética o mutagénesis clásica.

La expresión “secuencia de control”, como se usa aquí, se refiere a componentes implicados en la regulación de la expresión de una secuencia codificante en un organismo específico o in vitro. Ejemplos de secuencias de control son secuencias de inicio de la transcripción, secuencias de terminación, promotores, líderes, péptidos señal, propéptidos, prepropéptidos, o secuencias potenciadoras; secuencias de Shine-Delgarno, secuencias represoras o activadoras; señales de procesamiento de ARN eficientes, tales como señales de ayuste y poliadenilación; secuencias que estabilizan el ARNm citoplásmico; secuencias que mejoran la eficacia de la traducción (por ejemplo, sitios de unión a ribosomas); secuencias que mejoran la estabilidad de las proteínas; y cuando se desee, secuencias que potencian la secreción de proteínas.

El término “cultivo” se refiere a un método de multiplicación de microorganismos en un medio nutritivo y en condiciones adecuadas para el crecimiento y/o propagación de dicho microorganismo y/o la producción de un compuesto de interés por el microorganismo. Estos métodos son conocidos en la técnica. Cuando el microorganismo es capaz de expresar/producir un compuesto de interés, por ejemplo, los microorganismos pueden cultivarse mediante cultivo en matraz agitado, fermentación a pequeña o gran escala (incluyendo fermentaciones continuas, por lotes, por lotes alimentados, o en estado sólido) en fermentadores de laboratorio o industriales realizada en un medio adecuado y en condiciones que permitan expresar y/o aislar el compuesto de interés. Normalmente, el cultivo comprenderá una fase de crecimiento dirigida principalmente a la formación de biomasa, y una fase de producción dirigida principalmente a la producción del compuesto de interés. La fase de crecimiento y la fase de producción pueden superponerse hasta cierto punto. Un medio nutriente adecuado comprende fuentes de carbono, fuentes de nitrógeno, y compuestos adicionales (tales como sales inorgánicas (por ejemplo, fosfato), oligoelementos, y/o vitaminas) (véase, por ejemplo, Bennett, J. W. y LaSure, L., eds., More Gene Manipulations in Fungi, Academic Press, CA, 1991), y se puede realizar en condiciones aeróbicas o anaeróbicas.

La expresión “derivado de” también incluye las expresiones “procede de”, “obtenido de”, “obtenible de”, “aislado de”, y “creado a partir de”, y normalmente indica que un material especificado encuentra su origen en otro material especificado, o tiene características que pueden describirse con referencia al otro material especificado. Como se usa aquí, una sustancia (por ejemplo, una molécula de ácido nucleico o polipéptido) “derivada de” un microorganismo significa preferiblemente que la sustancia es nativa de ese microorganismo.

El término “expresión” incluye cualquier etapa implicada en la producción de (a) polipéptido o polipéptidos, que incluye, pero no se limita a, transcripción, modificación postranscripcional, traducción, modificación postraduccional, y secreción. Una reducción o supresión de la producción de B significa una limitación a x% o menos de B producido mediante la conversión enzimática de A. Esto se puede lograr con una enzima/proteína/célula/gen como se describe aquí. Un aumento en la producción de B significa un aumento de al menos un x% de B producido a través de la conversión enzimática de A en comparación con la cantidad de B obtenida en un procedimiento que usa una célula no modificada/proteína de tipo salvaje/enzima/gen. La reducción o el aumento de la expresión génica se puede medir mediante diversos métodos, tales como, por ejemplo, tecnología de transferencia Northern, Southern o Western, como se conoce en la técnica. Las expresiones “aumento de actividad” o “sobreexpresión” se usan indistintamente aquí.

Un casete de expresión comprende un polinucleótido que codifica un polipéptido, unido operativamente a las secuencias de control apropiadas que permiten la expresión del polinucleótido en una célula o in vitro.

El casete de expresión puede ser un vector de replicación autónoma (por ejemplo, un plásmido), es decir, por ejemplo, un vector cuya replicación es independiente de la replicación del genoma. Alternativamente, el casete puede ser aquel que, cuando se introduce en la célula, se integra total o parcialmente en el genoma de la célula. En los últimos casos, puede comprender una o más secuencias de direccionamiento para dirigir la integración en el genoma.

El casete de expresión puede contener o no uno o más marcadores seleccionables, que permiten una fácil selección de células transformadas.

La expresión “fragmento polipeptídico” se define aquí como un polipéptido que tiene uno o más aminoácidos suprimidos del término amino y/o carboxilo del polipéptido parental.

La expresión “polipéptido maduro” se define aquí como un polipéptido en su forma o formas finales, y se obtiene después de la traducción de un ARNm en polipéptido, modificaciones postraduccionales de dicho polipéptido dentro o fuera de la célula. La modificación postraduccional incluye procesamiento N-terminal, truncamiento C-terminal, glicosilación, fosforilación, y eliminación de secuencias líder tales como péptidos señal, propéptidos y/o prepropéptidos, como se define aquí, por escisión.

La expresión “de origen natural”, como se usa aquí, se refiere a procedimientos, eventos o productos que ocurren en su forma relevante en la naturaleza. Por el contrario, “de origen no natural” se refiere a procedimientos, eventos o productos cuya existencia o forma implica la mano del hombre. La expresión “de origen no natural” es aquí sinónimo de “hecho por el hombre”. Generalmente, la expresión “de origen natural”, con respecto a polipéptidos o ácidos nucleicos, se puede usar de manera intercambiable con la expresión “de tipo salvaje” o “nativo”. Se refiere a polipéptidos o ácidos nucleicos que codifican un polipéptido, que tienen una secuencia de aminoácidos o una secuencia polinucleotídica, respectivamente, idéntica a la que se encuentra en la naturaleza. Los polipéptidos de origen natural incluyen polipéptidos nativos, tales como los polipéptidos expresados de forma natural o encontrados en una célula particular. Los polinucleótidos de origen natural incluyen polinucleótidos nativos tales como los polinucleótidos que se encuentran naturalmente en el genoma de una célula particular. Además, una secuencia que es de tipo salvaje o de origen natural puede referirse a una secuencia de la que deriva una secuencia variante o sintética.

La expresión “construcción de ácido nucleico” se denomina aquí una molécula de ácido nucleico, ya sea monocatenaria o bicatenaria, que deriva de un gen de origen natural o que se ha modificado para contener segmentos de ácido nucleico que se combinan y yuxtaponen de una manera que de otro modo no existiría en la naturaleza. Las construcciones de ácido nucleico pueden aislarse, obtenerse sintéticamente o mutagenizarse. La expresión construcción de ácido nucleico es sinónimo de la expresión “casete de expresión” cuando la construcción de ácido nucleico contiene todas las secuencias de control requeridas para la expresión de una secuencia codificante, en el que dichas secuencias de control están unidas operativamente a dicha secuencia codificante.

La expresión “unido operativamente”, como se usa aquí, se refiere a dos o más componentes tales como secuencias de ácido nucleico o secuencias polipeptídicas que están unidas físicamente y están en una relación funcional entre sí que les permite funcionar de la manera deseada. Por ejemplo, un promotor está operativamente unido a una secuencia codificante si el promotor puede regular la transcripción o expresión de una secuencia codificante, en cuyo caso la secuencia codificante debe entenderse como que está “bajo el control” del promotor.

La expresión “polipéptido parental” se refiere al polipéptido con respecto al cual otro polipéptido difiere al sustituir, añadir o suprimir uno o más aminoácidos.

Posición definida con referencia a SEQ ID NO: x significa que la posición en la secuencia de aminoácidos según la descripción en la que ha tenido lugar una modificación se da con respecto a la posición del aminoácido correspondiente en la secuencia de aminoácidos según SEQ ID NO: x cuando las dos secuencias se alinean usando un método de alineación como se describe aquí.

El término “recombinante”, cuando se usa en referencia a un ácido nucleico o proteína, indica que el ácido nucleico o proteína se ha modificado en su secuencia, si se compara con su forma nativa, por intervención humana. El término “recombinante”, cuando se refiere a una célula, indica que el genoma de la célula se ha modificado en su secuencia, si se compara con su forma nativa, por intervención humana. El término “recombinante” es sinónimo de “modificado genéticamente”.

Un marcador seleccionable es un gen que permite la selección de células transformadas con dicho gen y que proporciona resistencia a biocidas o virus, resistencia a metales pesados, prototrofia a auxótrofos, y similares.

Los marcadores seleccionables preferidos incluyen, pero no se limitan a, aquellos que confieren resistencia a fármacos o que complementan un defecto en la célula. Incluyen, por ejemplo, genes marcadores versátiles que se pueden usar para la transformación de la mayoría de hongos filamentosos y levaduras, tales como genes de acetamidasa o ADNc, o genes que proporcionan resistencia a antibióticos.

Alternativamente, se pueden usar marcadores de selección específicos, tales como marcadores auxotróficos, que requieren cepas mutantes correspondientes. Preferiblemente, el marcador de selección se suprime de la célula transformada después de la introducción de la construcción de expresión, para obtener células transformadas que están libres de genes marcadores de selección.

La expresión marcador seleccionable se extiende a un gen marcador usado para el cribado, es decir, un gen marcador que, una vez introducido en una célula, confiere a la célula un fenotipo visible y hace que la célula se vea diferente. Un ejemplo de marcador para cribado es un gen que codifica una proteína fluorescente que hace que las células emitan fluorescencia bajo una fuente de luz apropiada.

Para los fines de esta descripción, se define aquí que para determinar el porcentaje de homología de secuencia o identidad de secuencia de dos secuencias de aminoácidos o de dos secuencias de ácido nucleico, las secuencias se alinean para fines de comparación óptimos. Con el fin de optimizar el alineamiento entre las dos secuencias, se pueden introducir espacios en cualquiera de las dos secuencias que se comparan. Tal alineación se puede llevar a cabo en toda la longitud de las secuencias que se comparan. Alternativamente, la alineación se puede llevar a cabo en una longitud más corta, por ejemplo en alrededor de 20, alrededor de 50, alrededor de 100 o más ácidos nucleicos/basados en aminoácidos. La identidad de secuencia es el porcentaje de coincidencias idénticas entre las dos secuencias sobre la región alineada dada a conocer.

Una comparación de secuencias y la determinación del porcentaje de identidad de secuencia entre dos secuencias se pueden realizar usando un algoritmo matemático. La persona experta será consciente del hecho de que están disponibles varios programas informáticos diferentes para alinear dos secuencias y determinar la identidad entre dos secuencias (Kruskal, J. B. (1983) An overview of sequence comparison en D. Sankoff and J. B. Kruskal, (ed.), Time warps, string edits and macromolecules: the theory and practice of sequence comparison, p. 1 -44 Addison Wesley). El porcentaje de identidad de secuencia entre dos secuencias de aminoácidos o entre dos secuencias nucleotídicas puede determinarse usando el algoritmo de Needleman y Wunsch para el alineamiento de dos secuencias. (Needleman, S. B. y Wunsch, C. D. (1970) J. Mol. Biol. 48, 443-453). El algoritmo puede alinear tanto las secuencias de aminoácidos como las secuencias nucleotídicas. El algoritmo de Needleman-Wunsch se ha implementado en el programa informático NEEDLE. Para los fines de esta descripción, se utilizó el programa NEEDLE del paquete EMBOSS (versión 2.8.0 o superior, EMBOSS: The European Molecular Biology Open Software Suite (2000) Rice, P. Longden, I. y Bleasby, A. Trends in Genetics 16, (6) p.276—277, http://emboss.bioinformatics.nl/). Para las secuencias proteicas, se usa EBLOSUM62 para la matriz de sustitución. Para la secuencia nucleotídica, se usa EDNAFULL. Los parámetros opcionales usados son una penalización por apertura de espacio de 10 y una penalización por extensión de espacio de 0,5. La persona experta apreciará que todos estos parámetros diferentes producirán resultados ligeramente diferentes, pero que el porcentaje de identidad global de dos secuencias no se altera significativamente cuando se usan algoritmos diferentes.

Después de la alineación por el programa NEEDLE como se describió anteriormente, el porcentaje de identidad de secuencia entre una secuencia de consulta y una secuencia de la descripción se calcula de la siguiente manera: Número de posiciones correspondientes en la alineación que muestran un aminoácido idéntico o un nucleótido idéntico en ambas secuencias dividido entre la longitud total de la alineación después de restar el número total de espacios en la alineación. La identidad, definida según el presente documento, se puede obtener de NEEDLE usando la opción NOBRIEF, y se etiqueta en el resultado del programa como “identidad más larga”.

Las secuencias de ácidos nucleicos y proteínas de la presente descripción pueden usarse además como una “secuencia de consulta” para realizar una búsqueda en bases de datos públicas para, por ejemplo, identificar otros miembros de la familia o secuencias relacionadas. Estas búsquedas se pueden realizar usando los programas BLASTN y BLASTX (versión 2.0) de Altschul, et al. (1990) J. Mol. Biol. 215:403— 10. Las búsquedas de nucleótidos BLAST se pueden realizar con el programa BLASTN, puntuación = 100, longitud de palabra = 12, para obtener secuencias nucleotídicas homólogas a las moléculas de ácido nucleico de la descripción. Las búsquedas de proteínas BLAST se pueden realizar con el programa BLASTX, puntuación = 50, longitud de palabra = 3, para obtener secuencias de aminoácidos homólogas a las moléculas proteicas de la descripción. Para obtener alineaciones con espacios con fines de comparación, se puede usar Gapped BLAST, como se describe en Altschul et al., (1997) Nucleic Acids Res. 25(17): 3389-3402. Cuando se usan los programas BLAST y Gapped BLAST, se pueden usar los parámetros predeterminados de los programas respectivos (por ejemplo, BLASTX y BLASTN). Véase la página de inicio del National Center for Biotechnology Information en http://www.ncbi.nlm.nih.gov/.

Como se usa aquí, los términos “variante”, “derivado”, “mutante”, u “homólogo” se pueden usar indistintamente. Pueden referirse a polipéptidos o ácidos nucleicos. Las variantes incluyen sustituciones, inserciones, supresiones, truncamientos, transversiones, y/o inversiones, en una o más localizaciones con respecto a una secuencia de referencia. Las variantes se pueden obtener, por ejemplo, mediante mutagénesis de saturación de sitio, mutagénesis de barrido, mutagénesis de inserción, mutagénesis aleatoria, mutagénesis dirigida de sitio, y evolución dirigida, así como otros enfoques diversos de recombinación. Los polipéptidos variantes pueden diferir de un polipéptido de referencia por un pequeño número de restos de aminoácidos, y pueden definirse por su nivel de homología/identidad de secuencia de aminoácidos primaria con un polipéptido de referencia. Preferiblemente, los polipéptidos variantes tienen al menos 70%, al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98%, o incluso al menos 99% de identidad de secuencia de aminoácidos con un polipéptido de referencia. Los métodos para determinar el porcentaje de identidad se conocen en la técnica y se describen aquí. Generalmente, las variantes conservan la naturaleza característica del polipéptido de referencia, pero tienen propiedades alteradas en algunos aspectos específicos. Por ejemplo, una variante puede tener un óptimo de pH modificado, una capacidad de unión de sustrato modificada, una resistencia modificada a la degradación enzimática u otra degradación, una mayor o menor actividad, una estabilidad modificada a temperatura u oxidativa, pero conserva su funcionalidad característica. Las variantes incluyen además polipéptidos con modificaciones químicas que cambian las características de un polipéptido de referencia.

Con respecto a los ácidos nucleicos, los términos se refieren a un ácido nucleico que codifica un polipéptido variante, que tiene un grado especificado de homología/identidad con un ácido nucleico de referencia, o que se hibrida en condiciones rigurosas con un ácido nucleico de referencia o el complemento del mismo. Preferiblemente, un ácido nucleico variante tiene al menos 70%, al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98%, o incluso al menos 99% de identidad de secuencia de ácido nucleico con un ácido nucleico de referencia. Los métodos para determinar el porcentaje de identidad se conocen en la técnica y se describen aquí.

Los términos permeasa, facilitador, transportador, o proteína de transporte, o términos relacionados, describen proteínas con múltiples dominios que atraviesan la membrana que exhiben una función en el transporte de moléculas a través de una membrana. Este transporte puede ser provocado por diferentes mecanismos: unipuerto (transporte de una molécula), simpuerto (cotransporte simultáneo de dos moléculas diferentes en la misma dirección), antipuerto (transporte simultáneo de dos moléculas en direcciones opuestas), difusión facilitada, translocación de grupo (por ejemplo, sistemas de fosfotransferasa), y transporte primario (por ejemplo, transporte impulsado por hidrólisis de trifosfato de adenosina o por luz).

La familia de transportadores de azúcar en la levadura se puede dividir en cinco grupos: permeasas de hexosa (genes HXT, GAL2), permeasas de disacáridos, permeasas de mioinositol, receptores de azúcar, y un grupo adicional de transportadores cuyo sustrato se ha determinado (Nelissen et al., 1997, FEMS Yeast Rev, 21, p. 113-134).

En un primer aspecto, la invención proporciona una variante de un polipéptido parental que es preferiblemente un transportador de hexosa, en la que el polipéptido parental comprende la secuencia de aminoácidos de SEQ ID NO: 1, y en la que la variante comprende una secuencia de aminoácidos que, cuando se alinea con la secuencia de aminoácidos expuesta en SEQ ID NO: 1, comprende una sustitución de aminoácidos N376 y T89, definiéndose las posiciones de dichos aminoácidos con referencia a la secuencia de aminoácidos expuesta en SEQ ID NO: 1, en la que la sustitución de aminoácido T89 comprende una cualquiera de T89I, T89V, T89L, T89S, T89M, o T89F.

El documento WO2014/195376 describe variantes de polipéptidos transportadores de hexosa que pertenecen a la Superfamilia de Facilitadores Principales (MFS), incluyendo Gal2 que tiene sustituciones en la posición N376 con mayor preferencia por xilosa. Sin embargo, el documento WO2014/195376 no dice nada sobre las propiedades de transporte de arabinosa de las variantes N376 de Gal2, y no describe o sugiere que la sustitución de la treonina en la posición 89 por isoleucina da como resultado un transportador de hexosa que tiene mayor afinidad por L-arabinosa y que ha perdido toda afinidad por glucosa (véase Tabla 3).

El polipéptido parental es un miembro de la Superfamilia de Facilitadores Principales (MFS). Dos familias de transportadores principales cuyas proteínas se encuentran en todos los organismos vivos son la superfamilia del casete de unión de ATP (ABC) y la superfamilia de facilitadores principales (MFS), también conocida como familia uniportador-simportador-antiportador. Mientras que las permeasas de la familia ABC consisten en múltiples componentes y son transportadores activos primarios, capaces de transportar tanto moléculas pequeñas como macromoléculas solo después de generar energía a través de la hidrólisis de ATP, los transportadores MFS consisten en un único polipéptido de un portador secundario que facilita el transporte de pequeños solutos en respuesta a un gradiente iónico quimiosmótico. La superfamilia ABC y las proteínas MFS representan casi la mitad de los transportadores de solutos codificados dentro de los genomas microbianos (revisado por Pao et al, 1998, Microbiol Mol Biol Rev.; 62 pp.1-34, y Saier et al, 1999, J Mol Microbiol Biotechnol, 1 p. 257-279).

El polipéptido según SEQ ID NO: 1 es Gal2, que es un transportador de difusión facilitado. Pertenece a la superfamilia de facilitadores principales, la familia de los transportadores de azúcar (TC 2.A.1.1). El “polipéptido de permeasa” también se designa aquí como “permeasa polipeptídica” o “polipéptido”. “Polinucleótido de polipéptido de permeasa” es aquí un polinucleótido que codifica el polipéptido de permeasa.

En una realización, el polipéptido variante tiene actividad de transporte de xilosa y/o actividad de transporte de arabinosa, y/o actividad de transporte de galactosa.

El polipéptido variante de la invención puede tener una o más actividades alternativas y/o adicionales distintas de la actividad de permeasa de azúcar.

Como se expuso anteriormente, un polipéptido variante de la invención típicamente tendrá actividad de permeasa de azúcar. Sin embargo, un polipéptido variante de la invención puede tener una o más de las actividades expuestas anteriormente, además de o como alternativa a esa actividad.

El polipéptido variante no es necesariamente un polipéptido según SEQ ID NO: 1. Más bien, el polipéptido variante comprende aminoácidos sustituidos, que, en SEQ ID NO: 1, están en las posiciones 89 y 376. Sin embargo, en un polipéptido de permeasa de hexosa que tiene otra secuencia de aminoácidos que SEQ ID NO: 1, tales posiciones pueden tener una numeración diferente, pero aún corresponden a las posiciones 89 o 376 de SEQ ID NO: 1.

Las posiciones 89 y 376, para (otros) polipéptidos de permeasa de hexosa, pueden identificarse comparando estructuras cristalinas en 3D, o alineando las secuencias de aminoácidos, como se explica, entre otros, en el documento WO2014/195376, en particular en la página 17, línea 22 y siguientes. Por ejemplo, en el polipéptido transportador de hexosa Hxt11 (SEQ ID NO: 10), la posición N376 del polipéptido de SEQ ID NO: 1 corresponde a N366, y la posición T89 corresponde a T79.

En una realización, el polipéptido variante comprende la secuencia de aminoácidos expuesta en SEQ ID NO: 1.

En otra realización, la sustitución del aminoácido N376 comprende una cualquiera de N376T, N376C, N376V, N376M, N376L, N376I, o N376F. Es decir, el polipéptido variante tiene un aminoácido en la posición 376 que es una treonina, una cisteína, una valina, una metionina, una leucina, una isoleucina, o una fenilalanina. Preferiblemente, la posición 376 es T, S, o I.

La sustitución de aminoácido T89 comprende una cualquiera de T89I, T89V, T89L, T89S, T89M, o T89F.

Es decir, el polipéptido variante tiene un aminoácido en la posición 89 que es una isoleucina, una valina, una leucina, una serina, una metionina, o una fenilalanina. Preferiblemente, la posición 89 es una isoleucina.

En una realización preferida, la sustitución del aminoácido N376 comprende una cualquiera de N376T, N376S, o N376I, y la sustitución de aminoácido T89 comprende T89I.

En una realización, el polipéptido variante tiene al menos 70% de identidad de secuencia con la secuencia de aminoácidos del polipéptido parental, o tiene al menos 70% de identidad de secuencia de un polipéptido con una secuencia de aminoácidos correspondiente a SEQ ID NO: 1. La variante puede tener al menos 80% u 85% de identidad de secuencia con la secuencia de aminoácidos del polipéptido parental, o al menos 80% u 85% de identidad de secuencia de un polipéptido con una secuencia de aminoácidos correspondiente a SEQ ID NO: 1. La variante puede tener al menos 90% de identidad de secuencia con la secuencia de aminoácidos del polipéptido parental, o al menos 90% de identidad de secuencia de un polipéptido con una secuencia de aminoácidos correspondiente a SEQ ID NO: 1. La variante puede tener al menos 95% de identidad de secuencia con la secuencia de aminoácidos del polipéptido parental, o al menos 95% de identidad de secuencia de un polipéptido con una secuencia de aminoácidos correspondiente a SEQ ID NO: 1. La variante puede tener al menos 98% de identidad de secuencia con la secuencia de aminoácidos del polipéptido parental, o al menos 98% de identidad de secuencia de un polipéptido con una secuencia de aminoácidos correspondiente a SEQ ID NO: 1. La variante puede tener al menos 99% de identidad de secuencia con la secuencia de aminoácidos del polipéptido parental, o al menos 99% de identidad de secuencia de un polipéptido con una secuencia de aminoácidos correspondiente a SEQ ID NO: 1. El polipéptido variante es preferiblemente un polipéptido hecho por el hombre.

La invención proporciona además una secuencia de ácido nucleico que codifica el polipéptido variante de la invención, preferiblemente en la que dicha secuencia de ácido nucleico está hecha por el hombre.

La invención también proporciona una construcción de ácido nucleico que comprende la secuencia de ácido nucleico de la invención unida operativamente a una o más secuencias de control capaces de dirigir la expresión de la variante polipeptídica en una célula adecuada.

La invención también proporciona un casete de expresión recombinante que comprende la construcción de ácido nucleico de la invención.

La invención también proporciona una levadura recombinante que comprende el ácido nucleico de la invención, la construcción de ácido nucleico de la invención, y/o el casete de expresión de la invención. La levadura se transforma con una secuencia de ácido nucleico, una construcción de ácido nucleico que comprende dicha secuencia de ácido nucleico, o un casete de expresión recombinante que comprende dicha construcción de ácido nucleico. En una realización, tal secuencia de ácido nucleico codifica un polipéptido variante que es un mutante de un polipéptido que es nativo en la célula hospedante no transformada. En una realización, el polipéptido que es nativo en la célula hospedante no transformada es un polipéptido transportador escogido de la lista que consiste en Gal2, Hxt1, Hxt2, Hxt3, Hxt4, Hxt5, Hxt6, Hxt7, Hxt8, Hxt9, Hxt10, Hxt11, Hxt12, Hxt13, Hxt14, Hxt15, Hxt16 y Hxt17.

La levadura recombinante puede seleccionarse de Saccharomycetaceae, en particular del grupo de Saccharomyces cerevisiae; Kluyveromyces, tal como Kluyveromyces marxianus; Pichia, tal como Pichia/Scheffersomyces stipitis o Pichia angusta; Zygosaccharomyces, tal como Zygosaccharomyces bailii; y Brettanomyces, tal como Brettanomyces intermedius, Issatchenkia, tal como Issatchenkia orientalis y Hansenula/Ogateae.

La levadura recombinante puede someterse a ingeniería evolutiva para mejorar sus propiedades. Los procedimientos de ingeniería evolutiva son procedimientos conocidos. La ingeniería evolutiva es un procedimiento en el que los fenotipos industrialmente relevantes de un microorganismo, en este caso la levadura recombinante, se pueden acoplar a la tasa de crecimiento específica y/o la afinidad por un nutriente, mediante un procedimiento de selección natural establecida racionalmente. La ingeniería evolutiva se describe con detalle, por ejemplo, en Kuijper, M, et al, FEMS, Eukaryotic cell Research 5(2005) 925-934, documentos WO2008/041840 y WO2009/112472. Después de la ingeniería evolutiva, se aísla la célula recombinante resultante. El aislamiento se puede ejecutar de cualquier manera conocida, por ejemplo por separación de células de un caldo de células recombinantes usado en la ingeniería evolutiva, por ejemplo tomando una muestra de células, o por filtración o centrifugación.

En una realización, la levadura recombinante comprende uno o más genes que codifican una L-arabinosa isomerasa (E.C. 5.3.1.4; araA); uno o más genes que codifican una L-ribulocinasa (E.C. 2.7.1.16; araB); y uno o más genes que codifican una L-ribulosa-5-P4-epimerasa (E.C. 5.1.3.4; araD); genes los cuales permiten que dicha levadura fermente arabinosa. Los genes para araA, araB y araD pueden ser de Lactobacillus plantarum, como se describe, por ejemplo, en el documento WO2008/041840. Alternativamente, se puede usar un gen araA de Bacillus subtilis y genes araB y araD de Escherichia coli como se describe, por ejemplo, en el documento EP1499708. Alternativamente, los genes araA, araB y araD pueden derivar de al menos uno del género Clavibacter, Arthrobactery/o Gramella, en particular uno de Clavibacter michiganensis, Arthrobacter aurescens, y/o Gramella forsetii, como se describe, por ejemplo, en el documento WO2009/011591.

En una realización, la levadura recombinante comprende un gen que codifica una L-arabinosa isomerasa que tiene una secuencia de aminoácidos según SEQ ID NO: 5, o un homólogo funcional de la misma que tiene al menos 60%, preferiblemente al menos 65%, al menos 70%, al menos al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 95%, al menos 98%, al menos 99% de identidad con SEQ ID NO: 5.

En una realización, la levadura recombinante comprende un gen que codifica una L-ribulocinasa que tiene una secuencia de aminoácidos según SEQ ID NO: 6, o un homólogo funcional de la misma que tiene al menos 60%, preferiblemente al menos 65%, al menos 70%, al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 95%, al menos 98%, al menos 99% de identidad con SEQ ID NO: 6.

En una realización, la levadura recombinante comprende un gen que codifica una L-ribulosa-5-P4-epimerasa que tiene una secuencia de aminoácidos según SEQ ID NO: 7, o un homólogo funcional de la misma que tiene al menos 60%, preferiblemente al menos 65%, al menos 70%, al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 95%, al menos 98%, al menos 99% de identidad con SEQ ID NO: 7.

En una realización, la levadura recombinante comprende uno o más genes que codifican una xilosa isomerasa (EC 5.3.1.5; tal como xylA) y uno o más genes que codifican una xilulosa cinasa (E.C. 2.7.1.17; tal como XKS1); o uno o más genes que codifican una xilosa reductasa (E.C. 1.1.1.307; tal como XYL1 de Pichia/Scheffersomyces stipitis) y uno o más genes que codifican una xilitol deshidrogenasa (E.C. 1.1.1.B19; tal como XYL2 de Scheffersomyces stipitis) para permitir que la levadura recombinante fermente xilosa.

En una realización, la levadura recombinante comprende un gen que codifica una xilosa isomerasa que tiene una secuencia de aminoácidos según SEQ ID NO: 8, o un homólogo funcional de la misma que tiene al menos 60%, preferiblemente al menos 65%, al menos 70%, al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 95%, al menos 98%, al menos 99% de identidad con SEQ ID NO: 8.

En una realización, la levadura recombinante comprende un gen que codifica una xilulosa cinasa que tiene una secuencia de aminoácidos según SEQ ID NO: 9, o un homólogo funcional de la misma que tiene al menos 60%, preferiblemente al menos 65%, al menos 70%, al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 95%, al menos 98%, al menos 99% de identidad con SEQ ID NO: 9.

Una “xilosa isomerasa” (EC 5.3.1.5) se define aquí como una enzima que cataliza la isomerización directa de D-xilosa en D-xilulosa y/o viceversa. La enzima también se conoce como una D-xilosa cetoisomerasa. Una xilosa isomerasa aquí también puede ser capaz de catalizar la conversión entre D-glucosa y D-fructosa (y en consecuencia, por lo tanto puede denominarse como una glucosa isomerasa). Una xilosa isomerasa aquí puede requerir un catión bivalente, tal como magnesio, manganeso o cobalto, como cofactor. Los ensayos para medir la actividad de la xilosa isomerasa y la xilulosa cinasa se describen, entre otros, en el documento WO2003/062430.

En una realización, la levadura recombinante comprende además la sobreexpresión de uno o más genes de la rama no oxidativa de la ruta de las pentosas fosfatos.

En una realización, el uno o más genes de la ruta de las pentosas fosfatos que se sobreexpresan codifican una enzima seleccionada de la lista de una transaldolasa (EC 2.2.1.2), una transcetolasa (EC 2.2.1.1), una ribosa-5-fosfato isomerasa (EC 5.3.1.6), y una D-ribulosa-5-fosfato 3-epimerasa (EC 5.1.3.1).

En otra realización, el uno o más genes de la ruta de las pentosas fosfatos que se sobreexpresan se seleccionan de la lista de TAL1, TAL2, NQM1, TKL1, TKL2, RPE1 y RKI1.

También se describe un método para diseñar una secuencia variante de una secuencia polipeptídica parental, método el cual comprende:

a) seleccionar una secuencia polipeptídica parental, preferiblemente un polipéptido parental con una secuencia de aminoácidos según SEQ ID NO: 1;

b) sustituir en dicha secuencia polipeptídica los aminoácidos N376 y T89, estando definida la posición de dichos aminoácidos con referencia a la SEQ ID NO: 1.

En una realización, en la etapa b), las sustituciones de los aminoácidos N376 dan como resultado una cualquiera de N376T, N376C, N376V, N376M, N376L, N376I, o N376F, y la sustitución del aminoácido T89 da como resultado una cualquiera de T89I, T89V, T89L, T89S, T89M, o T89F.

Preferiblemente, la sustitución del aminoácido N376 da como resultado una cualquiera de N376T, N376S o N376I, y la sustitución del aminoácido T89 da como resultado T89I.

Las técnicas para diseñar construcciones de ácidos nucleicos que codifican polipéptidos variantes, casetes de expresión de recombinación, para transformar células de levadura con ellos, se describen, entre otros, en el documento WO2014/195376.

La invención también proporciona un procedimiento para la producción de un producto de fermentación, preferiblemente etanol, que comprende:

- fermentar una composición que comprende una biomasa lignocelulósica, en particular que comprende glucosa y arabinosa, preferiblemente que comprende también galactosa, en condiciones anaeróbicas en presencia de una levadura recombinante según la invención; y

- recuperar el producto de fermentación.

El producto de fermentación puede ser cualquiera de etanol, butanol, ácido láctico, di-terpeno, di-terpeno glicosilado, ácido 3-hidroxipropiónico, ácido acrílico, ácido acético, ácido succínico, ácido cítrico, ácido fumárico, ácido málico, ácido itacónico, un aminoácido, 1,3-propanodiol, etileno, glicerol, un antibiótico p-lactámico, o una cefalosporina. El etanol es un producto de fermentación preferido.

Las condiciones anaeróbicas se definen aquí como condiciones sin oxígeno, o en las que la levadura recombinante esencialmente no consume oxígeno, y normalmente corresponden a un consumo de oxígeno de menos de 5 mmol/l.h, en particular a un consumo de oxígeno de menos de 2,5 mmol/l.h, o menos de 1 mmol/l.h. Más preferiblemente, se consume 0 mmol/l/h (es decir, el consumo de oxígeno no es detectable. Esto generalmente corresponde a una concentración de oxígeno disuelto en el caldo de cultivo de menos del 5% de saturación de aire, en particular a una concentración de oxígeno disuelto de menos de 1% de saturación de aire, o menos del 0,2% de saturación de aire. El procedimiento también se puede realizar en condiciones microaeróbicas.

En una realización, la biomasa lignocelulósica comprende lignocelulosa y/o hemicelulosa. La composición puede ser un hidrolizado de biomasa. Dicho hidrolizado de biomasa puede ser un hidrolizado de biomasa lignocelulósica. Aquí, lignocelulosa incluye hemicelulosa y partes de hemicelulosa de biomasa. La lignocelulosa también puede incluir fracciones lignocelulósicas de biomasa. Los materiales lignocelulósicos adecuados se pueden encontrar en la siguiente lista: podas de huertos, chaparral, desechos de molinos, desechos de madera urbana, desechos municipales, desechos de tala, aclareos forestales, cultivos leñosos de rotación corta, desechos industriales, paja de trigo, paja de avena, paja de arroz, paja de cebada, paja de centeno, paja de lino, cáscaras de soja, cáscaras de arroz, paja de arroz, pienso de gluten de maíz, cáscaras de avena, caña de azúcar, rastrojo de maíz, tallos de maíz, mazorcas de maíz, cáscaras de maíz, pasto varilla, miscanthus, sorgo dulce, tallos de cánola, tallos de soja, hierba de la pradera, hierba gama, cola de zorro; pulpa de remolacha azucarera, pulpa de cítricos, cáscaras de semillas, desechos animales celulósicos, recortes de césped, algodón, algas marinas, árboles, madera blanda, madera dura, álamo, pino, arbustos, hierbas, trigo, paja de trigo, bagazo de caña de azúcar, maíz, cáscaras de maíz, hojuelas de maíz, grano de maíz, fibra de granos, productos y subproductos de la molienda húmeda o seca de granos, residuos sólidos urbanos, papel de desecho, residuos de jardín, material herbáceo, residuos agrícolas, residuos forestales, residuos sólidos urbanos, papel de desecho, pulpa, residuos de molino de papel, ramas, arbustos, cañas, maíz, hojas de maíz, un cultivo energético, bosque, una fruta, una flor, un grano, una hierba, un cultivo herbáceo, una hoja, corteza, una aguja, un tronco, una raíz, un árbol joven, un arbusto, pasto varilla, un árbol, una verdura, cáscara de fruta, una vid, pulpa de remolacha azucarera, harinillas de trigo, cáscaras de avena, madera dura o blanda, material de desecho orgánico generado a partir de un procedimiento agrícola, desechos de madera forestal, o una combinación de dos o más de los mismos. La lignocelulosa, que puede considerarse como una materia prima renovable potencial, generalmente comprende los polisacáridos celulosa (glucanos) y hemicelulosas (xilanos, heteroxilanos y xiloglucanos). Además, algo de hemicelulosa puede estar presente como glucomananos, por ejemplo en materias primas derivadas de la madera. La hidrólisis enzimática de estos polisacáridos a azúcares solubles, incluyendo tanto monómeros como multímeros, por ejemplo glucosa, celobiosa, xilosa, arabinosa, galactosa, fructosa, manosa, ramnosa, ribosa, ácido galacturónico, ácido glucurónico, y otras hexosas y pentosas, se produce bajo la acción de diferentes enzimas que actúan en concierto.

La biomasa lignocelulósica puede comprender pectina y/u otras sustancias pécticas tales como arabinanos, que pueden constituir una proporción considerable de la masa seca de las paredes celulares típicas de los tejidos vegetales no leñosos (alrededor de un cuarto a la mitad de la masa seca pueden ser pectinas). El material lignocelulósico puede pretratarse. El pretratamiento puede comprender exponer el material lignocelulósico a un ácido, una base, un disolvente, calor, un peróxido, ozono, corte mecánico en tiras, trituración, molienda, o despresurización rápida, o una combinación de dos o más de los mismos. Este pretratamiento químico a menudo se combina con un pretratamiento térmico, por ejemplo entre 150-220°C durante 1 a 30 minutos.

En otra realización, dicha composición es un hidrolizado de rastrojo de maíz pretratado. Otra composición preferida es un hidrolizado de fibra de maíz, que opcionalmente se trata previamente.

La composición comprende preferiblemente glucosa y arabinosa, preferiblemente también galactosa. En una realización, se consume al menos parte de la glucosa y al menos parte de la arabinosa, preferiblemente se consume al menos parte de la glucosa y al menos parte de la arabinosa y al menos parte de la galactosa.

La invención también proporciona el uso de la célula de levadura recombinante de la invención para la producción de un producto de fermentación, preferiblemente etanol, a partir de una composición que comprende glucosa, arabinosa, y preferiblemente también que comprende galactosa.

Ejemplo

Materiales y métodos

Cepas y mantenimiento

La construcción de la cepa DS68625 de S. cerevisiae de supresión del transportador de hexosa usada para experimentos de absorción de azúcar en el ejemplo siguiente se describió previamente en Shin et al., 2015 (An engineered cryptic Hxt11 sugar transporter facilitates glucose-xylose co-consumption in Saccharomyces cerevisiae, Biotechnology for Biofuels, volumen 8, p. 176). El genotipo de DS68625 se describe como:

Mat a, ura3-52, leu2-112, gre3::IoxP, IoxP-Ptpi:TAL1, IoxP-Ptpi::RKI1, loxP-Ptpi-TKLI, loxP-Ptpi-RPEI, delta::Padh1XKS1Tcyc1-LEU2, delta::üRA3-Ptpi-xylA-Tcyc1, his3::IoxP, hxt2::IoxP-kanMX-IoxP, hxt367::IoxP-hphMX-IoxP, hxt145::IoxP-natMx-IoxP, gal2::IoxP-zeoMX-IoxP

Los cultivos madre se cultivaron en matraces de agitación en medio de extracto de levadura/peptona (YP) (10 g/l de extracto de levadura Bacto, Becton Dickinson, Franklin Lakes, NJ, y 20 g/l de Bacto Peptona, Becton Dickinson). Este medio se suplementó con 20 g/l de maltosa. Los cultivos madre congelados se prepararon añadiendo glicerol (30% vol/vol) a cultivos madre, después de lo cual se almacenaron alícuotas de 1 ml a -80°C.

Cultivo y medios

Los estudios de caracterización de cepas se realizaron en medio sintético (SM) preparado como se describió anteriormente (Verduyn C, Postma E, Scheffers WA, Van Dijken JP: Effect of benzoic acid on metabolic fluxes in yeasts: a continuous-culture study on the regulation of respiration and alcoholic fermentation. Yeast 1992, 8:501 -517). La fuente de carbono y las disoluciones de vitamina se añadieron después de esterilizar en autoclave el medio durante 20 min a 121 °C. La disolución de D-xilosa al 50% p/v se esterilizó en autoclave por separado a 110°C durante 20 min. Antes de la inoculación, se añadieron 20 g/l de D-xilosa (SMX) o 20 g/l de maltosa (SMM) a SM como fuente de carbono. El medio SMX se usó para propagar transformantes derivados de DS68625 para ensayos de absorción de azúcar. El medio SMM se usó en placas para la selección después de la transformación.

Cultivos aeróbicos en matraces de agitación se hicieron crecer en un agitador orbital a 200 rpm ajustado a 30°C, usando matraces de 500 ml que contenían 100 ml de medio. Para las placas, se añadió agar (BD) 20 g/l antes de esterilizar en autoclave a 121 °C durante 20 min.

La secuencia de proteínas para Gal2 que se origina a partir de CEN.PK113-7D se proporciona como SEQ ID NO: 1. La secuencia de ADN codificante para GAL2 (YLR081W) que se encuentra en CEN.PK113-7D se proporciona como SEQ ID NO: 2. SEQ ID NO: 2 se puede sintetizar artificialmente en una empresa de síntesis de ADN, y se puede usar como molde para mutagénesis dirigida al sitio para generar variantes de Gal2 específicas. Las variantes de Gal2 ensayadas en el ejemplo siguiente se dan en la Tabla 1.

Tabla 1: Cambios de aminoácidos en variantes de Gal2

Los plásmidos construidos y usados en este estudio se muestran en la Tabla 2. El ADN plasmídico se aisló de cultivos de E. coli usando un kit GenElute Plasmid (Sigma-Aldrich, St. Louis, MO). La amplificación por PCR de casetes de expresión y fragmentos plasmídicos se realizó usando ADN polimerasa Phusion High Fidelity (Thermo Scientific, Waltham, MA, USA).

Tabla 2. Plásmidos de expresión de GAL2

Para construir plásmidos de expresión, GAL2 de tipo salvaje y las variantes de GAL2 mencionadas anteriormente se usaron como molde y se amplificaron usando los cebadores F_Gal2_Xbal (SEQ ID NO: 3) y R_Gal2_Cfr9l (SEQ ID NO: 4). Los fragmentos de PCR resultantes se clonaron posteriormente en el plásmido pRS313-P7T7 de manera similar a como se describe en Nijland et al., 2014 (Biotechnology for Biofuels, vol. 7, p. 168). Todos los genes se clonaron en pRS313-P7T7, y posteriormente se confirmaron mediante secuenciación de Sanger (Baseclear, Leiden, Países Bajos).

Las cepas de S. cerevisiae se transformaron como se describió por Gietz y Woods (Gietz RD, Schiestl RH, Willems AR, Woods RA: Studies on the transformation of intact yeast cells by the LiAc/SS-DNA/PEG procedure. Yeast 1995, 11). Las variantes de Gal2 y el plásmido pRS313-P7T7-mcs (como plásmido vacío/control) se transformaron en la cepa DS68625 de supresión del transportador de hexosa. Los transformantes se seleccionaron en placas de agar SMM en base a la complementación mediante los plásmidos de expresión de GAL2 (que portan el marcador HIS3) de la auxotrofia de histidina de DS68625. Las colonias positivas resultantes se seleccionaron para cada construcción, y se denominaron DS68625-Gal2, DS68625-Gal2 N376I, DS68625-Gal2 N376S, DS68625-Gal2 N376T, DS68625-Gal2 N376T / T89I, DS68625-Gal2 T89I y DS68625-mcs.

Claims

REIVINDICACIONES

1. Una variante de un polipéptido parental que es preferiblemente un transportador de hexosa,

en la que el polipéptido parental comprende la secuencia de aminoácidos de SEQ ID NO: 1, y

en la que la variante comprende una secuencia de aminoácidos que, cuando se alinea con la secuencia de aminoácidos de SEQ ID NO: 1, comprende una sustitución de los aminoácidos N376 y T89, definiéndose las posiciones de dichos aminoácidos con referencia a la secuencia de aminoácidos de SEQ ID NO: 1, en la que la sustitución del aminoácido T89 comprende una cualquiera de T89I, T89V, T89L, T89S, T89M o T89F.

2. Una variante según la reivindicación 1, en la que la sustitución del aminoácido N376 comprende una cualquiera de N376T, N376C, N376V, N376M, N376L, N376I o N376F.

3. Una variante según una cualquiera de las reivindicaciones anteriores, en la que la sustitución del aminoácido N376 comprende una cualquiera de N376T, N376S o N376I, y en la que la sustitución del aminoácido T89 comprende T89I.

4. Una variante según una cualquiera de las reivindicaciones anteriores, que tiene al menos 80% de identidad de secuencia con la secuencia de aminoácidos del polipéptido parental.

5. Una variante según una cualquiera de las reivindicaciones anteriores, que es un polipéptido hecho por el hombre.

6. Una secuencia de ácido nucleico que codifica la variante según una cualquiera de las reivindicaciones 1 a 5, preferiblemente en la que dicha secuencia de ácido nucleico está hecha por el hombre.

7. Una construcción de ácido nucleico que comprende la secuencia de ácido nucleico de la reivindicación 6 unida operativamente a una o más secuencias de control capaces de dirigir la expresión de la variante polipeptídica en una célula adecuada.

8. Un casete de expresión recombinante que comprende la construcción de ácido nucleico de la reivindicación 7.

9. Una levadura recombinante que comprende la secuencia de ácido nucleico de la reivindicación 6, la construcción de ácido nucleico de la reivindicación 7, y/o el casete de expresión de la reivindicación 8.

10. Una levadura recombinante según la reivindicación 9, que comprende además uno o más genes que codifican una L-arabinosa isomerasa (E.C. 5.3.1.4; araA); uno o más genes que codifican una L-ribulocinasa (E.C. 2.7.1.16; araB); y uno o más genes que codifican una L-ribulosa-5-P-4-epimerasa (E.C. 5.1.3.4; araD).

11. Una levadura recombinante según la reivindicación 9 o 10, que comprende además uno o más genes que codifican una xilosa isomerasa (EC 5.3.1.5), tal como xylA, y uno o más genes que codifican una xilulosa cinasa (E.C. 2.7.1.17), tal como XKS1.

12. Una levadura recombinante según una cualquiera de las reivindicaciones 9-11, que comprende además la sobreexpresión de uno o más genes de la rama no oxidativa de la ruta de las pentosas fosfatos.

13. Una levadura recombinante según la reivindicación 12, en la que el uno o más genes de la ruta de las pentosas fosfatos que se sobreexpresan codifican una enzima seleccionada de la lista de una transaldolasa (EC 2.2.1.2), una transcetolasa (EC 2.2.1.1), una ribosa-5-fosfato isomerasa (EC 5.3.1.6), y una D-ribulosa-5-fosfato 3-epimerasa (EC 5.1.3.1).

14. Una levadura recombinante según una cualquiera de las reivindicaciones 12 a 13, en la que el uno o más genes de la ruta de las pentosas fosfatos que se sobreexpresan se seleccionan de la lista de TAL1, NQM1, TKL1, TKL2, RPE1, y RKI1.

15. Procedimiento para la producción de etanol, que comprende:

- fermentar una composición que comprende una biomasa lignocelulósica, en particular que comprende glucosa y arabinosa, preferiblemente que también comprende galactosa, en condiciones anaeróbicas en presencia de una levadura recombinante según una cualquiera de las reivindicaciones 9-14; y

- recuperar el etanol.

16. Procedimiento según la reivindicación 15, en el que la biomasa lignocelulósica comprende lignocelulosa y/o hemicelulosa y/o pectina.