ES2394708T3

ES2394708T3 - Xilanasas, ácidos nucleicos que las codifican y métodos para elaborarlas y purificarlas

Info

Publication number: ES2394708T3
Application number: ES03760440T
Authority: ES
Inventors: Brian Steer; Walter Callen; Shaun Healey; Geoff Hazlewood; Di Wu; David Blum; Alireza Esteghlalian
Original assignee: BP Corp North America Inc; Verenium Corp
Current assignee: BASF Enzymes LLC; BP Corp North America Inc
Priority date: 2002-06-14
Filing date: 2003-06-16
Publication date: 2013-02-05
Anticipated expiration: 2023-06-16
Also published as: US8728769B2; EP2305820A1; EA200500019A1; CA2488916A1; EP2298904A1; US9765319B2; CN101967490B; KR20050010053A; CN1675365A; US20130337507A1; US20090221051A1; US7504120B2; NZ537597A; EP1516053A4; DK1516053T3; MXPA04012614A; CA2488916C; DK2298904T3; CN101967490A; BRPI0312121B1

Abstract

Un ácido nucleico, sintético o recombinante, aislado que comprende: (a) un ácido nucleico que codifica al menos un polipéptido que tiene una actividad xilanasa, donde el ácido nucleico comprende una secuencia que tiene al menos 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, o más, o tiene 100% de identidad de secuencia con el SEQ ID NO: 159, o que codifica un fragmento enzimáticamente activo del polipéptido; (b) un ácido nucleico que codifica al menos un polipéptido que tiene una actividad xilanasa, donde el ácido nucleico comprende una secuencia que hibrida en condiciones restrictivas con un ácido nucleico que comprende la secuencia del SEQ ID NO: 159; donde las condiciones restrictivas comprenden una etapa de lavado que comprende un lavado en 0,2X SSC a una temperatura de alrededor de 65°C durante alrededor de 15 minutos; (c) un ácido nucleico que codifica un polipéptido que tiene actividad xilanasa, donde el polipéptido comprende la secuencia de aminoácidos del SEQ ID NO: 160; o (d) un ácido nucleico que comprende una secuencia completamente complementaria a cualquiera de (a) a (c); donde la actividad xilanasa comprende una capacidad para reducir la demanda ClO2 cuando se utiliza para pretratar pasta Kraft.

Description

Xilanasas, Ácidos Nucleicos que las Codifican y Métodos para Elaborarlas y Purificarlas

Referencia Cruzada a Publicaciones Relacionadas 5

Esta solicitud reclama el beneficio de prioridad bajo 35 U.S.C. § 119(e) de la Solicitud Provisional de los Estados Unidos Núm. 60/389,299, presentada el 14 de Junio de 2002. La solicitud anteriormente mencionada se incorpora a la presente memoria explícitamente como referencia en su totalidad y para todos los fines.

Campo de la Invención

Esta invención se refiere generalmente a enzimas, polinucleótidos que codifican las enzimas, el uso de tales polinucleótidos y polipéptidos y más específicamente a enzimas que tienen actividad xilanasa, p. ej., que catalizan la hidrólisis de enlaces xiloxídicos β-1,4 internos o enlaces endo-β-1,4-glucanasa. 15

Antecedentes

Las xilanasas (p. ej., endo-1,4-beta-xilanasa, EC 3.2.1.8) hidrolizan enlaces β-1,4-xilosídicos internos en el xilano para producir oligómeros de xilosa y xilo de peso molecular más bajo. Los xilanos son polisacáridos formados a 20 partir de D-xilopiranosas unidas por 1,4-β-glicósidos. Las xilanasas tienen un valor comercial considerable, utilizándose en la industria alimentaria, para panificación y tratamiento de frutas y vegetales, descomposición de residuos agrícolas, en la fabricación de piensos para animales y en la producción de pasta y papel. Las xilanasas son formadas por hongos y bacterias.

Las arabinoxilanasas son los polisacáridos principales de los cereales aparte del almidón representando 2,5 – 7,1% p/p dependiendo de la variedad y las condiciones de crecimiento. Las propiedades fisicoquímicas de este polisacárido son tales que dan lugar a soluciones viscosas o incluso geles en condiciones oxidativas. Además, los arabinoxilanos tienen una alta capacidad de unirse a agua y pueden tener un papel en la estabilidad de la espuma de proteína. Todas estas características presentan problemas para varias industrias incluyendo la elaboración de 30 cerveza, panificación, nutrición animal y fabricación de papel. En las aplicaciones para la elaboración de cerveza, la presencia de xilano da como resultado problemas en la filtrabilidad de la malta y la formación de turbidez. En las aplicaciones para panificación (especialmente para galletas y galletas saladas), estos arabinoxilanos crean masas pegajosas y son difíciles de trabajar y reducen el tamaño de la galleta. Además, este carbohidrato está implicado en la rehidratación rápida del producto horneado dando como resultado la pérdida del carácter crujiente y la reducción 35 de vida útil. Para aplicaciones de alimentación de animales monogástricos con dietas de cereales, el arabinoxilano es el factor que más contribuye a la viscosidad del contenido de los intestinos y por lo tanto afecta adversamente a la digestibilidad del alimento y al ritmo de crecimiento del animal. Para animales rumiantes, estos polisacáridos representan componentes sustanciales de la ingesta de fibra y la digestión más completa de los arabinoxilanos facilitaría eficiencias de conversión de alimentos superiores. 40

Las xilanasas se utilizan en la actualidad como aditivos (acondicionadores de masas) en el procesamiento de masas para la hidrólisis del arabinoxilano soluble en agua. En aplicaciones para panificación (especialmente para galletas y galletas saladas), el arabinoxilano crea masas pegajosas que son difíciles de trabajar y reduce el tamaño de la galleta. Además, este carbohidrato está implicado en la rehidratación rápida del producto horneado dando como 45 resultado la pérdida del carácter crujiente y la reducción de la vida útil.

La potenciación de la digestión del xilano en los piensos para animales puede mejorar la disponibilidad y la digestibilidad de los valiosos nutrientes carbohidratados y proteicos del alimento. Para aplicaciones en alimentos para animales monogástricos con dietas de cereales, el arabinoxilano es el factor que más contribuye a la viscosidad 50 del contenido del intestino y de ese modo afecta adversamente a la digestibilidad del alimento y la tasa de crecimiento del animal. Para animales rumiantes, estos polisacáridos representan los componentes esenciales de la ingesta de fibra y una digestión más completa facilitaría mayores eficiencias de conversión de alimento. Es deseable que las xilanasas de los piensos para animales sean activas en el estómago del animal. Esto requiere una enzima alimentaria que tenga alta actividad a 37°C y a pH bajo para animales monogástricos (pH 2-4) y casi pH neutro para 55 rumiantes (pH 6,5-7). La enzima debe poseer también resistencia a las xilanasas del intestino del animal y estabilidad a las temperaturas más altas implicadas en la peletización del alimento. En esencia, existe la necesidad en la técnica de aditivos alimentarios con xilanasa para alimento monogástrico con alta actividad específica, actividad a 35-40°C y pH 2-4, vida media superior a 30 minutos en SGF y una vida media > 5 minutos a 85°C en estado formulado. Para alimento de rumiantes, existe la necesidad de aditivos para alimento con xilanasa que 60 tengan una alta actividad específica, actividad a 35-40°C y pH de 6,5-7,0, vida media superior a 30 minutos en SRF y estabilidad en forma de polvo seco concentrado.

Las xilanasas se utilizan también en muchas otras aplicaciones. Por ejemplo, las xilanasas se utilizan para mejorar la calidad y cantidad de proteína láctea en vacas en período de lactación (véase, por ejemplo, Kung, L., et al, J. Dairy Science, 2000 Jan 83:115-122), incrementando la cantidad de sacáridos solubles en el estómago y el intestino delgado de cerdos (véase, por ejemplo, van der Meulen, J. et al, Arch. Tieremahr, 2001 54:101-115), mejorando la eficacia de la producción tardía de huevos y la producción de huevos en gallinas (véase, por ejemplo, Jaroni, D., et 5 al, Poult. Sci., 1999 June 78:841-847). Adicionalmente, se ha demostrado que las xilanasas son útiles en el blanqueo biológico y el tratamiento de las pastas de papel (véase, por ejemplo, la Patente de los Estados Unidos Núm. 5.202.249), el blanqueo biológico y el tratamiento de las pastas de madera y papel (véanse, por ejemplo, las Patentes de los Estados Unidos Núms. 5.179.021, 5.116.746, 5.407.827, 5.405.769, 5.395.765, 5.369.024, 5.457.045, 5.434.071, 5.498.534, 5.591.304, 5.645.686, 5.725.732, 5.759.840, 5.834.301, 5.871.730 y 6.057.438) 10 para reducir el contenido de lignina de la madera y modificar la madera (véanse, por ejemplo, las Patentes de los Estados Unidos Núms. 5.486.468 y 5.770.012) como mejoradores de harinas, masas y pan (véanse, por ejemplo, las Patentes de los Estados Unidos Núms. 5.108.765 y 5.306.633) como aditivos y/o suplementos alimentarios, como se ha mostrado anteriormente (véanse, por ejemplo, las Patentes de los Estados Unidos Núms. 5.432.074, 5.429.828, 5.612.055, 5.720.971, 5.981.233, 5.948.667, 6.099.844, 6.132.727 y 6.132.716), en la fabricación de soluciones de 15 celulosa (véase, por ejemplo, la Patente de los Estados Unidos Núm. 5.760.211). Las composiciones detergentes que tienen actividad xilanasa se utilizan para compuestos de frutas, hortalizas y/o barro y arcilla (véase, por ejemplo, la Patente de los Estados Unidos Núm. 5.786.316).

Las xilanasas también son útiles en un método de uso y composición de una carbohidrasa y/o una xilanasa para la 20 fabricación de un agente para los tratamientos y/o profilaxis de la coccidiosis. El agente manufacturado puede estar en forma de un pienso para animales basado en cereales (véase, por ejemplo, la Patente de los Estados Unidos Núm. 5.624.678). Los usos adicionales de las xilanasas incluyen el uso en la producción de fibra dietética soluble en agua (véase, por ejemplo, la Patente de los Estados Unidos Núm. 5.622.738), para mejorar la filtrabilidad, la separación y la producción de almidón (véanse, por ejemplo, las Patentes de los Estados Unidos Núms. 4.960.705 y 25 5.023.176), en el sector de las bebidas para mejorar filtrabilidad del mosto o la cerveza (véase, por ejemplo, la Patente de los Estados Unidos Núm. 4.746.517), en una composición enzimática para promover la secreción de leche de ganaderías y mejorar la calidad de la leche (véase, por ejemplo, la Patente de los Estados Unidos Núm. 4.144.354), para reducir la viscosidad de material vegetal (véase, por ejemplo, la Patente de los Estados Unidos Núm. 5.874.274), para incrementar la viscosidad o la capacidad de gelificación de productos alimenticios tales como 30 confituras, mermeladas, jaleas, zumos, pastas, sopas, salsas, etc. (véase, por ejemplo, la Patente de los Estados Unidos Núm. 6.036.981). Las xilanasas se pueden utilizar también en la hidrólisis de hemicelulosa para la cual es selectiva, particularmente en presencia de celulosa. Adicionalmente, el producto retenido rico en celulasa es adecuado para la hidrólisis de celulosa (véase, por ejemplo, la Patente de los Estados Unidos Núm. 4.725.544).

Los diversos usos de las xilanasas incluyen la producción de etanol (véanse, por ejemplo, las Solicitudes PCT Núms. WO 0043496 y WO 8100857), en la transformación de un microbio que produce etanol (véase, por ejemplo, la Solicitud PCT Núm. WO 99/46362), en la producción de taninos enológicos y composiciones enzimáticas (véase, por ejemplo, la Solicitud PCT Núm. WO 0164830), en la estimulación de las defensas naturales de las plantas (véase, por ejemplo, la Solicitud PCT Núm. WO 0130161), en la producción de azúcares a partir de sustratos de 40 hemicelulosa (véase, por ejemplo, la Solicitud PCT Núm. WO 9203541), en la limpieza de manchas que contienen fruta, hortalizas, barro o arcilla (véase, por ejemplo, la Solicitud PCT Núm. WO 9613568), en la limpieza de membranas de filtración de cerveza (véase, por ejemplo, la Solicitud PCT Núm. WO 9623579), en un método para eliminar o inhibir células microbianas (véase, por ejemplo, la Solicitud PCT Núm. WO 9732480) y en la determinación de las características de las aguas de tratamiento del blanqueo de pasta de madera mediante la 45 utilización de proporciones de dos mediciones de absorción UV y comparación de los espectros (véase, por ejemplo, la Solicitud PCT Núm. WO 9840721).

Con respecto a las xilanasas utilizadas en la industria del papel y la pasta, se han aislado xilanasas a partir de muchas fuentes. En particular, véanse las Patentes de los Estados Unidos Núms. 6.083.733 y 6.140.095 y 50 6.346.407. En particular, se observa que la Patente de los Estados Unidos Núm. 6.140.095 trata sobre xilanasas tolerantes a los álcalis. Sin embargo, se observa que persiste una necesidad en la técnica de xilanasas para su utilización en la industria del papel y la pasta donde la enzima es activa en el intervalo de temperatura de 65°C a 75°C y a un pH de aproximadamente 10. Adicionalmente, una enzima de la invención útil en la industria del papel y la pasta podría reducir la necesidad de productos químicos de blanqueo, tales como el dióxido de cloro. 55

Las publicaciones comentadas en la presente memoria se proporcionan únicamente para su descripción antes de la fecha de presentación de la presente solicitud. Nada en la presente memoria debe ser considerado como una admisión de que la invención no está titulada antes de tal descripción en virtud de la invención anterior.

Compendio de la Invención

La invención proporciona ácidos nucleicos aislados, sintéticos o recombinantes que comprenden: un ácido nucleico que comprende una secuencia que tiene una secuencia que tiene al menos 90%, 91%, 92%, 93%, 94%, 95%, 96%,

97%, 98%, 99%, o más, o tiene 100% de identidad de secuencia con el SEQ ID NO: 159, donde el ácido nucleico codifica al menos un polipéptido que tiene una actividad xilanasa o codifica un fragmento enzimáticamente activo del polipéptido.

Los ácidos nucleicos de la invención también incluyen ácidos nucleicos aislados, sintéticos o recombinantes que 5 codifican un polipéptido que tiene actividad xilanasa, donde el polipéptido comprende la secuencia de aminoácidos del SEQ ID NO: 160.

La invención proporciona ácidos nucleicos aislados, sintéticos o recombinantes que codifican al menos un polipéptido que tiene una actividad xilanasa, donde los ácidos nucleicos comprenden una secuencia que hibrida en 10 condiciones restrictivas con un ácido nucleico que comprende la secuencia del SEQ ID NO: 159;

donde las condiciones restrictivas comprenden una etapa de lavado que comprende un lavado en 0,2X SSC a una temperatura de alrededor de 65°C durante alrededor de 15 minutos.

La invención también proporciona ácidos nucleicos que comprenden secuencias completamente complementarias a 15 cualquiera de las secuencias de ácido nucleico de la invención.

La actividad xilanasa comprende la capacidad de reducir la demanda de ClO2 cuando se utiliza para pretratar pasta Kraft.

La invención proporciona ácidos nucleicos aislados, sintéticos o recombinantes que comprenden un ácido nucleico del SEQ ID NO: 159.

Las secuencias de ácido nucleico adicionales de la invención se muestran en las reivindicaciones adjuntas.

La invención proporciona una sonda de ácido nucleico para identificar, detectar o aislar un ácido nucleico que codifica un polipéptido con una actividad xilanasa, donde la sonda comprende la secuencia de un ácido nucleico de la invención, donde la sonda identifica, detecta o aísla el ácido nucleico mediante unión o hibridación.

La invención proporciona un par de cebadores de amplificación para amplificar un ácido nucleico que codifica un 30 polipéptido que tiene actividad xilanasa, donde el par de cebadores es capaz de amplificar un ácido nucleico que comprende una secuencia de la invención, o fragmentos o subsecuencias del mismo. El primer miembro tiene una secuencia como la mostrada mediante al menos alrededor de 10 a 50 bases consecutivas de, o alrededor de los primeros (los 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 o más residuos de una secuencia de ácido nucleico de la invención. El segundo miembro tiene una secuencia como la mostrada mediante 35 al menos alrededor de 10 a 50 bases de la hebra complementaria consecutivas del primer miembro, o alrededor de los primeros (los 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 o más residuos de la hebra complementaria del primer miembro.

La invención proporciona ácidos nucleicos que codifican xilanasa generados mediante amplificación, p. ej., reacción 40 en cadena de la polimerasa (PCR), utilizando un par de cebadores de amplificación de la invención. La invención proporciona xilanasas generadas mediante amplificación, p. ej. reacción en cadena de la polimerasa (PCR), utilizando un par de cebadores de amplificación de la invención.

Los métodos de elaboración de una xilanasa mediante amplificación incluyen reacción en cadena de la polimerasa 45 (PCR), utilizando un par de cebadores de amplificación de la invención. El par de cebadores de amplificación puede amplificar un ácido nucleico a partir de una biblioteca, p. ej., una genoteca, tal como una biblioteca ambiental.

La invención proporciona métodos para amplificar un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa que comprende la amplificación de un ácido nucleico molde con un par de secuencias cebadoras 50 de amplificación capaces de amplificar una secuencia de ácido nucleico de la invención, o fragmentos o subsecuencias de la misma.

La invención proporciona casetes de expresión que comprenden un ácido nucleico de la invención o una subsecuencia del mismo. En un aspecto, el casete de expresión puede comprender el ácido nucleico que está unido 55 operablemente a un promotor. El promotor puede ser un promotor viral, bacteriano, de mamífero o vegetal. En un aspecto, el promotor vegetal puede ser un promotor de patata, arroz, maíz, trigo, tabaco o cebada. El promotor puede ser un promotor constitutivo. El promotor constitutivo puede comprender CaMV35S. En otro aspecto, el promotor puede ser un promotor inducible. En un aspecto, el promotor puede ser un promotor específico de tejido o un promotor regulado ambientalmente o regulado evolutivamente. De este modo, el promotor puede ser, p. ej., un 60 promotor específico de semilla, específico de hoja, específico de raíz, específico de tallo o inducido por abscisión. En un aspecto, el casete de expresión puede comprender adicionalmente un vector de expresión vegetal o de virus vegetal.

La invención proporciona vehículos de clonación que comprenden un casete de expresión (p. ej., un vector) de la invención o un ácido nucleico de la invención. El vehículo de clonación puede ser un vector viral, un plásmido, un fago, un fagémido, un cósmido, un fósmido, un bacteriófago o un cromosoma artificial. El vector viral puede comprender un vector de adenovirus, un vector retroviral o un vector viral adenoasociado. El vehículo de clonación puede comprender un cromosoma artificial bacteriano (BAC), un plásmido, un vector derivado del bacteriófago P1- 5 (PAC), un cromosoma artificial de levadura (YAC), o un cromosoma artificial de mamífero (MAC).

La invención proporciona una célula transformada que comprende un ácido nucleico de la invención o un casete de expresión (p. ej., un vector) de la invención, o un vehículo de clonación de la invención. En un aspecto, la célula transformada puede ser una célula bacteriana, una célula de mamífero, una célula fúngica, una célula de levadura, 10 una célula de insecto o una célula vegetal. En un aspecto, la célula vegetal puede ser una célula de cereal, patata, trigo, arroz, maíz, tabaco o cebada.

La invención proporciona animales no humanos transgénicos que comprenden un ácido nucleico de la invención o un casete de expresión (p. ej., un vector) de la invención. En un aspecto, el animal es un ratón. 15

La invención proporciona planta s transgénicas que comprenden un ácido nucleico de la invención o un casete de expresión (p. ej., un vector) de la invención. La planta transgénica puede ser una planta de cereal, una planta de maíz, una planta de patata, una planta de tomate, una planta de trigo, una planta de semillas oleaginosas, un planta de colza, una planta de soja, una planta de arroz, una planta de cebada o una planta de tabaco. 20

La invención proporciona semillas transgénicas que comprenden un ácido nucleico de la invención o un casete de expresión (p. ej., un vector) de la invención. La semilla transgénica puede ser una planta de cereal, una semilla de maíz, un grano de trigo, una semilla oleaginosa, una semilla de colza, una semilla de soja, una semilla carnosa de palma, una semilla de girasol, una semilla de sésamo, un cacahuete o una semilla de planta de tabaco. 25

Un oligonucleótido antisentido comprende una secuencia de ácido nucleico complementaria a o susceptible de hibridación en condiciones restrictivas con un ácido nucleico de la invención. Los métodos para inhibir la traducción de un mensaje de xilanasa en una célula comprenden administrar a la célula o expresar en la célula un oligonucleótido antisentido que comprende una secuencia de ácido nucleico complementaria a o susceptible de 30 hibridación en condiciones restrictivas con un ácido nucleico de la invención. El oligonucleótido antisentido puede tener entre alrededor de 10 a 50, alrededor de 20 a 60, alrededor de 30 a 70, alrededor de 40 a 80, o alrededor de 60 a 100 bases de longitud.

Las moléculas de ARN (ARNi) de doble hebra comprenden a subsecuencia de una secuencia de la invención. En un 35 aspecto, el ARNi tiene alrededor de 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 o más nucleótidos dúplex de longitud. Los métodos para inhibir la expresión de una xilanasa en una célula comprenden administra a la célula o expresar en la célula un ARN inhibidor de doble hebra (ARNi), donde el ARN comprende una subsecuencia de una secuencia de la invención.

La invención proporciona un polipéptido aislado o recombinante que tiene actividad xilanasa, y que comprende una secuencia de aminoácidos que tiene al menos 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, o más, o completa (100%) de identidad de secuencia con el SEQ ID NO: 160, o un fragmento enzimáticamente activo del mismo. La actividad xilanasa comprende la capacidad de reducir la demanda de ClO2 cuando se utiliza para tratar pasta Kraft. 45

Los fragmentos pueden tener al menos alrededor de 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600 o más residuos de longitud, o más de la longitud total de una enzima. Los polipéptidos de la invención incluyen secuencias codificadas por un ácido nucleico de la invención. Las secuencias de polipéptido ilustrativas de la invención incluyen polipéptidos o péptidos unidos específicamente por un anticuerpo de la 50 invención. Los aspectos adicionales de los polipéptidos de la invención se muestran en las reivindicaciones adjuntas.

La invención proporciona un polipéptido sintético o recombinante, aislado que comprende una secuencia de aminoácidos del SEQ ID NO: 160.

La invención proporciona ácidos nucleicos recombinantes o aislados que comprenden una secuencia que codifica un polipéptido que tiene una actividad xilanasa y una secuencia señal, donde el ácido nucleico comprende una secuencia de la invención. La secuencia señal puede estar derivada de otra enzima xilanasa o no xilanasa (una heteróloga). La invención proporciona ácidos nucleicos recombinantes o aislados que comprenden una secuencia que codifica un polipéptido que tiene una actividad xilanasa, donde la secuencia no contiene una secuencia señal y 60 el ácido nucleico comprende una secuencia de la invención.

En un aspecto, el polipéptido aislado o recombinante puede comprender el polipéptido de la invención que carece de una secuencia señal. En un aspecto, el polipéptido aislado o recombinante puede comprender el polipéptido de la

invención que comprende una secuencia señal heteróloga, tal como una secuencia señal heteróloga xilanasa o no xilanasa.

En un aspecto, la invención proporciona proteínas quiméricas que comprenden un primer dominio que comprende una secuencia señal de la invención y al menos un segundo dominio. La proteína puede ser una proteína de fusión. 5 El segundo dominio puede comprender una enzima. La enzima puede ser una xilanasa.

La invención proporciona polipéptidos quiméricos que comprenden al menos un primer dominio que comprende un péptido señal (SP), una secuencia prepro y/o un dominio catalítico (CD) de la invención y al menos un segundo dominio que comprende un polipéptido o péptido heterólogo, donde el polipéptido o péptido heterólogo no está 10 asociado naturalmente con el péptido señal (SP), la secuencia prepro y/o el dominio catalítico (CD). En un aspecto, el polipéptido o péptido heterólogo no es una xilanasa. El polipéptido o péptido heterólogo puede ser amino terminal con respecto al extremo carboxi o con respecto a ambos extremos del péptido señal (SP), la secuencia prepro y/o el dominio catalítico (CD).

La invención proporciona ácidos nucleicos recombinantes o aislados que codifican un polipéptido quimérico, donde el polipéptido quimérico comprende al menos un primer dominio que comprende un péptido señal (SP), un dominio prepro y/o un dominio catalítico (CD) de la invención y al menos un segundo dominio que comprende un polipéptido o péptido heterólogo, donde el polipéptido o péptido heterólogo no está asociado naturalmente con el péptido señal (SP), el dominio prepro y/o el dominio catalítico (CD). 20

Las secuencias señal (p. ej., péptidos señal) consisten en una secuencia mostrada en los residuos 1 a 14, 1 a 15, 1 a 16, 1 a 17, 1 a 18, 1 a 19, 1 a 20, 1 a 21, 1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a 26, 1 a 27, 1 a 28, 1 a 28, 1 a 30, 1 a 31, 1 a 32, 1 a 33, 1 a 34, 1 a 35, 1 a 36, 1 a 37, 1 a 38, 1 a 40, 1 a 41, 1 a 42, 1 a 43 o 1 a 44, de un polipéptido de la invención. 25

La actividad xilanasa puede comprender una actividad específica a alrededor de 37°C en el intervalo de alrededor de 1 a alrededor de 1200 unidades por miligramo de proteína, o, alrededor de 100 a alrededor de 1000 unidades por miligramo de proteína. En otro aspecto, la actividad xilanasa comprende una actividad específica de alrededor de 100 a alrededor de 1000 unidades por miligramo de proteína, o, de alrededor de 500 a alrededor de 750 unidades 30 por miligramo de proteína. Alternativamente, la actividad xilanasa comprende una actividad específica a 37°C en el intervalo de alrededor de 1 a alrededor de 750 unidades por miligramo de proteína, o, de alrededor de 500 a alrededor de 1200 unidades por miligramo de proteína. En un aspecto, la actividad xilanasa comprende una actividad específica a 37°C en el intervalo de alrededor de 1 a alrededor de 500 unidades por miligramo de proteína, o, de alrededor de 750 a alrededor de 1000 unidades por miligramo de proteína. O la actividad xilanasa puede 35 comprender una actividad específica a 37°C en el intervalo de alrededor de 1 a alrededor de 250 unidades por miligramo de proteína. Alternativamente, la actividad xilanasa comprende una actividad específica a 37°C en el intervalo de alrededor de 1 a alrededor de 100 unidades por miligramo de proteína. La termotolerancia puede comprender la retención de al menos la mitad de la actividad específica de la xilanasa a 37°C después de ser calentada a la temperatura elevada. Alternativamente, la termotolerancia puede comprender retención de actividad 40 específica a 37°C en el intervalo de alrededor de 1 a alrededor de 1200 unidades por miligramo de proteína, o, de alrededor de 500 a alrededor de 1000 unidades por miligramo de proteína, después de ser calentada a la temperatura elevada. La termotolerancia puede comprender retención de actividad específica a 37°C en el intervalo de alrededor de 1 a alrededor de 500 unidades por miligramo de proteína después de ser calentada a la temperatura elevada. 45

La invención proporciona el polipéptido aislado o recombinante de la invención, donde el polipéptido comprende al menos un sitio de glicosilación. En un aspecto, la glicosilación puede ser una glicosilación ligada a N. En un aspecto, el polipéptido puede ser glicosilado después de ser expresado en P. pastoris o S. pombe.

En un aspecto, el polipéptido puede conservar una actividad xilanasa en condiciones que comprenden un pH de alrededor de 6,5, pH 6, pH 5,5, pH 5, pH 4,5 o pH 4. En otro aspecto, el polipéptido puede conservar una actividad xilanasa en condiciones que comprenden un pH de alrededor de 7, pH 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH 10,5 o pH 11. En un aspecto, el polipéptido puede conservar una actividad xilanasa después de exposición a condiciones que comprenden un pH de alrededor de 6,5, pH 6, pH 5,5, pH 5, pH 4,5 o pH 4. En otro aspecto, el 55 polipéptido puede conservar una actividad xilanasa después de exposición a condiciones que comprenden un pH de alrededor de 7, pH 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH 10,5 o pH 11.

La invención proporciona preparaciones de proteína que comprenden un polipéptido de la invención, donde la preparación de proteína comprende un líquido, un sólido o un gel. 60

La invención proporciona heterodímeros que comprenden un polipéptido de la invención y una segunda proteína o dominio. El segundo miembro del heterodímero puede ser una fosfolipasa diferente, una enzima diferente u otra proteína. En un aspecto, el segundo dominio puede ser un polipéptido y el heterodímero puede ser una proteína de

fusión. En un aspecto, el segundo dominio puede ser un epítopo o una etiqueta. En un aspecto, la invención proporciona homodímeros que comprenden un polipéptido de la invención.

La invención proporciona polipéptidos inmovilizados que tienen una actividad xilanasa, donde el polipéptido comprende un polipéptido de la invención, un polipéptido codificado por un ácido nucleico de la invención, o un 5 polipéptido que comprende un polipéptido de la invención y un segundo dominio. En un aspecto, el polipéptido puede ser inmovilizado sobre una célula, un metal, una resina, un polímero, una cerámica, un vidrio, un microelectrodo, una partícula grafítica, una cuenta, un gel, una placa, una matriz o un tubo capilar.

La invención proporciona matrices que comprenden un ácido nucleico inmovilizado de la invención. La invención 10 proporciona matrices que comprenden un anticuerpo de la invención.

La invención proporciona anticuerpos aislados o recombinantes que se unen específicamente a un polipéptido de la invención o a un polipéptido codificado por un ácido nucleico de la invención. El anticuerpo puede ser el anticuerpo puede ser monoclonal o policlonal. La invención proporciona hibridomas que comprenden un anticuerpo de la 15 invención, p. ej., un anticuerpo que se une específicamente a un polipéptido de la invención o a un polipéptido codificado por un ácido nucleico de la invención.

La invención proporciona método para aislar o identificar un polipéptido que tiene una actividad xilanasa que comprende las etapas de: (a) proporcionar un anticuerpo de la invención; (b) proporcionar una muestra que 20 comprende polipéptidos; y (c) poner en contacto la muestra de la etapa (b) con el anticuerpo de la etapa (a) en condiciones en las que el anticuerpo se puede unir específicamente al polipéptido, aislando o identificando de ese modo un polipéptido que tiene una actividad xilanasa.

La invención proporciona métodos para elaborar un anticuerpo anti-xilanasa que comprende administrar a un animal 25 no humano un ácido nucleico de la invención o un polipéptido de la invención o subsecuencias del mismo en una cantidad suficiente para generar una respuesta inmunitaria humoral, elaborando de ese modo un anticuerpo anti-xilanasa. La invención proporciona métodos para elaborar una respuesta inmunitaria anti-xilanasa que comprende administrar a un animal no humano un ácido nucleico de la invención o un polipéptido de la invención o subsecuencias del mismo en una cantidad suficiente para generar una respuesta inmunitaria. 30

La invención proporciona métodos para producir un polipéptido recombinante que comprende las etapas de: (a) proporcionar un ácido nucleico de la invención conectado operablemente a un promotor; y (b) expresar el ácido nucleico de la etapa (a) en condiciones que permitan la expresión del polipéptido, produciendo de ese modo un polipéptido recombinante. En un aspecto, el método puede comprender adicionalmente transformar una célula 35 anfitriona con el ácido nucleico de la etapa (a) seguido de la expresión del ácido nucleico de la etapa (a), produciendo de ese modo un polipéptido recombinante en una célula transformada.

La invención proporciona métodos para identificar un polipéptido que tiene una actividad xilanasa que comprende las siguientes etapas: (a) proporcionar un polipéptido de la invención; o un polipéptido codificado por un ácido nucleico 40 de la invención; (b) proporcionar un sustrato de xilanasa; y (c) poner en contacto el polipéptido o un fragmento o variante del mismo de la etapa (a) con el sustrato de la etapa (b) y detectar un descenso en la cantidad de sustrato o un incremento en la cantidad de un producto de reacción, donde un descenso en la cantidad del sustrato o un incremento en la cantidad del producto de reacción detecta un polipéptido que tiene actividad xilanasa.

La invención proporciona métodos para identificar un sustrato de xilanasa que comprende las siguientes etapas: (a) proporcionar un polipéptido de la invención; o un polipéptido codificado por un ácido nucleico de la invención; (b) proporcionar un sustrato de ensayo; y (c) poner en contacto el polipéptido de la etapa (a) con el sustrato de ensayo de la etapa (b) y detectar un descenso en la cantidad de sustrato o un incremento en la cantidad de producto de reacción, donde un descenso en la cantidad de sustrato o un incremento en la cantidad de un producto de reacción 50 identifica el sustrato de ensayo como un sustrato de xilanasa.

La invención proporciona métodos para determinar si un compuesto de ensayo se une específicamente a un polipéptido que comprende las siguientes etapas: (a) expresar un ácido nucleico o un vector que comprende el ácido nucleico en condiciones permisivas para la traducción del ácido nucleico a un polipéptido, donde el ácido nucleico 55 comprende un ácido nucleico de la invención, o, proporcionar un polipéptido de la invención; (b) proporcionar un compuesto de ensayo; (c) poner en contacto el polipéptido con el compuesto de ensayo; y (d) determinar si el compuesto de ensayo de la etapa (b) se une específicamente al polipéptido.

La invención proporciona métodos para identificar un modulador de una actividad xilanasa que comprende las 60 siguientes etapas: (a) proporcionar un polipéptido de la invención o un polipéptido codificado por un ácido nucleico de la invención; (b) proporcionar un compuesto de ensayo; (c) poner en contacto el polipéptido de la etapa (a) con el compuesto de ensayo de la etapa (b) y medir una actividad de la xilanasa, donde un cambio en la actividad xilanasa medida en presencia del compuesto de ensayo en comparación con la actividad en ausencia del compuesto de

ensayo proporciona una determinación de que el compuesto de ensayo modula la actividad xilanasa. En un aspecto, se puede medir la actividad xilanasa proporcionando un sustrato de xilanasa y detectando un descenso en la cantidad del sustrato o un incremento en la cantidad de un producto de reacción, o, un incremento en la cantidad del sustrato o un descenso en la cantidad de un producto de reacción. Un descenso en la cantidad del sustrato o un incremento en la cantidad del producto de reacción con el compuesto de ensayo en comparación con la cantidad de 5 sustrato o producto de reacción sin el compuesto de ensayo identifican el compuesto de ensayo como un activador de la actividad xilanasa. Un incremento en la cantidad del sustrato o un descenso en la cantidad del producto de reacción con el compuesto de ensayo en comparación con la cantidad de sustrato o producto de reacción sin el compuesto de ensayo identifican el compuesto de ensayo como un inhibidor de la actividad xilanasa.

La invención proporciona métodos para aislar, detectar o recuperar un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa a partir de una muestra ambiental que comprende las etapas de: (a) proporcionar un par de secuencias cebadoras de amplificación para amplificar un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa, donde el par de cebadores es capaz para amplificar un ácido nucleico de la invención; (b) aislar un ácido nucleico a partir de la muestra ambiental o tratar la muestra ambiental de manera que el ácido 15 nucleico en la muestra sea accesible para la hibridación al par de cebadores de amplificación; y, (c) combinar el ácido nucleico de la etapa (b) con el par de cebadores de amplificación de la etapa (a) y amplificar el ácido nucleico a partir de la muestra ambiental, aislando o recuperando de ese modo un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa a partir de una muestra ambiental. Uno o cada miembro del par de secuencias cebadoras de amplificación puede comprender un oligonucleótido que comprende al menos alrededor de 10 a 50 20 bases consecutivas de una secuencia de la invención. En un aspecto, el par de secuencias cebadoras de amplificación es un par de amplificación de la invención.

La invención proporciona métodos para aislar o recuperar un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa a partir de una muestra ambiental que comprende las etapas de: (a) proporcionar un sonda 25 de polinucleótido que comprende un ácido nucleico de la invención o una subsecuencia del mismo; (b) aislar un ácido nucleico a partir de la muestra ambiental o tratar la muestra ambiental de manera que el ácido nucleico en la muestra sea accesible para la hibridación a una sonda de polinucleótido de la etapa (a); (c) combinar el ácido nucleico aislado o la muestra ambiental tratada de la etapa (b) con la sonda de polinucleótido de la etapa (a); y (d) aislar un ácido nucleico que hibrida específicamente con la sonda de polinucleótido de la etapa (a), aislando o 30 recuperando de ese modo un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa a partir de una muestra ambiental. La muestra ambiental puede comprender una muestra de agua, una muestra líquida, una muestra de suelo, una muestra de aire o una muestra biológica. En un aspecto, la muestra biológica se puede obtener de una célula bacteriana, una célula de protozoo, una célula de insecto, una célula de levadura, una célula vegetal, una célula fúngica o una célula de mamífero. 35

Una variante de un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa se puede generar mediante un método que comprende las etapas de: (a) proporcionar un ácido nucleico molde que comprende un ácido nucleico de la invención; y (b) modificar, suprimir o añadir uno o más nucleótidos en la secuencia molde, o una de sus combinaciones, para generar una variante del ácido nucleico molde. El método puede comprender 40 adicionalmente expresar el ácido nucleico variante para generar una polipéptido de xilanasa variante. Las modificaciones, adiciones o deleciones se pueden introducir mediante un método que comprende PCR propensa a error, barajado, mutagénesis dirigida a oligonucleótidos, PCR de ensamblaje, mutagénesis por PCR sexual, mutagenésis in vivo, mutagenésis por inserción de casetes, mutagenésis de ensamblaje recursivo, mutagenésis de conjunto exponencial, mutagénesis de sitio específico, reensamblaje de genes (p. ej., GeneReassembly™, véase, p. 45 ej., La Patente de los Estados Unidos Núm. 6.537.776), mutagénesis por saturación de sitio de genes (GSSM™), reensamblaje de ligación sintética (SLR) o una de sus combinaciones. Las modificaciones, adiciones o supresiones también se pueden introducir por un procedimiento que comprende recombinación, recombinación de secuencia recursiva, mutagénesis de ADN modificada por fosfotioato, mutagénesis de molde que contiene uracilo, mutagénesis de dúplex discontinuo, mutagénesis por reparación de apareamiento erróneo, mutagénesis de cepa huésped de 50 reparación deficiente, mutagénesis química, mutagénesis radiogénica, mutagénesis por supresión, mutagénesis por restricción-selección, mutagénesis por restricción-purificación, síntesis artificial de genes, mutagénesis de ensamblaje, creación de multímeros de ácidos nucleicos quiméricos y una de sus combinaciones.

El método puede ser repetido iterativamente hasta que se produzca una xilanasa que tenga una actividad alterada o 55 diferente o una estabilidad alterada o diferente de la de un polipéptido codificado por el ácido nucleico molde. El polipéptido de xilanasa variante puede ser termotolerante, y conservar cierta actividad después de ser expuesto a una temperatura elevada. En otro aspecto, el polipéptido de xilanasa variante tiene un aumento de glicosilación en comparación con la xilanasa codificada por un ácido nucleico molde. Alternativamente, el polipéptido de xilanasa variante tiene actividad xilanasa a alta temperatura, donde la xilanasa codificada por el ácido nucleico molde no es 60 activa a la alta temperatura. El método puede ser repetido iterativamente hasta que se produzca una xilanasa que codifique una secuencia que tenga un uso de codón alterado a partir de la del ácido nucleico molde. O, el método puede ser repetido iterativamente hasta que se produzca un gen de xilanasa que tenga un nivel mayor o menor de expresión del mensaje o estabilidad que el del ácido nucleico molde.

Los ácidos nucleicos aislados o recombinantes pueden comprender una secuencia mostrada en el SEQ ID NO: 189, donde el SEQ ID NO: 189 contiene una o más de las siguientes mutaciones: los nucleótidos de las posiciones 22 a 24 son TTC, los nucleótidos de las posiciones 31 a 33 son CAC, los nucleótidos de las posiciones 34 a 36 son TTG, los nucleótidos de las posiciones 49 a 51 son ATA, los nucleótidos de las posiciones 31 a 33 son CAT, los nucleótidos de las posiciones 67 a 69 son ACG, los nucleótidos de las posiciones 178 a 180 son CAC, los 5 nucleótidos de las posiciones 190 a 192 son TGT, los nucleótidos de las posiciones 190 a 192 son GTA, los nucleótidos de las posiciones 190 a 192 son GTT, los nucleótidos de las posiciones 193 a 195 son GTG, los nucleótidos de las posiciones 202 a 204 son GCT, los nucleótidos de las posiciones 235 a 237 son CCA, o los nucleótidos de las posiciones 235 a 237 son CCC. Los métodos para elaborar un ácido nucleico que comprende esta secuencia son aquellos en los que las mutaciones en el SEQ ID NO: 189 se obtienen mediante mutagénesis 10 por saturación de sitio de genes (GSSM™).

Los ácidos nucleicos aislados o recombinantes pueden comprender el SEQ ID NO: 190, donde el SEQ ID NO: 190 contiene una o más de las siguientes mutaciones: el ácido aspártico en la posición de aminoácido 8 es fenilalanina, la glutamina en la posición de aminoácido 11 es histidina, la asparragina en la posición de aminoácido 12 es leucina, 15 la glicina en la posición de aminoácido 17 es isoleucina, la treonina en la posición de aminoácido 23 es treonina codificada por un codón distinto del codón de tipo salvaje, la glicina en la posición de aminoácido 60 es histidina, la prolina en la posición de aminoácido 64 es cisteína, la prolina en la posición de aminoácido 64 es valina, la serina en la posición de aminoácido 65 es valina, la glicina en la posición de aminoácido 68 es isoleucina, la glicina en la posición de aminoácido 68 es alanina, o la valina en la posición de aminoácido 79 es prolina. 20

Los métodos para modificar codones en un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa para incrementar su expresión en una célula anfitriona, puede comprender las siguientes etapas: (a) proporcionar un ácido nucleico de la invención que codifica un polipéptido que tiene una actividad xilanasa; y, (b) identificar un codón no preferido o menos preferido en el ácido nucleico de la etapa (a) y remplazarlo con un codón 25 preferido o utilizado neutramente que codifica el mismo aminoácido que el codón remplazado, donde un codón preferido es un codón representado en exceso en secuencias codificantes en genes en la célula anfitriona y un codón no preferido o menos preferido es un codón infrarrepresentado en secuencias codificantes en genes en la célula anfitriona, modificando de ese modo el ácido nucleico para incrementar su expresión en una célula anfitriona.

Los métodos para modificar codones en un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa puede comprender las siguientes etapas: (a) proporcionar un ácido nucleico de la invención; y, (b) identificar un codón en el ácido nucleico de la etapa (a) y remplazarlo por un codón diferente que codifica el mismo aminoácido que el codón remplazado, modificando de ese modo codones en un ácido nucleico que codifica una xilanasa. 35

Los métodos para modificar codones en un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa para incrementar su expresión en una célula anfitriona puede comprender las siguientes etapas: (a) proporcionar un ácido nucleico de la invención que codifica un polipéptido de xilanasa; y, (b) identificar un codón no preferido o menos preferido en el ácido nucleico de la etapa (a) y remplazarlo por un codón preferido o utilizado 40 neutramente que codifica el mismo aminoácido que el codón remplazado, donde un codón preferido es un codón representado en exceso en secuencias codificantes en genes en la célula anfitriona y un codón no preferido o menos preferido es un codón infrarrepresentado en secuencias codificantes en genes en la célula anfitriona, modificando de ese modo el ácido nucleico para incrementar su expresión en una célula anfitriona.

Los métodos para modificar un codón en un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa para disminuir su expresión en una célula anfitriona puede comprender las siguientes etapas: (a) proporcionar un ácido nucleico de la invención; y (b) identificar al menos un codón preferido en el ácido nucleico de la etapa (a) y remplazarlo por un codón no preferido o menos preferido que codifica el mismo aminoácido que el codón remplazado, donde un codón preferido es un codón representado en exceso en secuencias codificantes en 50 genes en una célula anfitriona y un codón no preferido o menos preferido es un codón infrarrepresentado en secuencias codificantes en genes en la célula anfitriona, modificando de ese modo el ácido nucleico para disminuir su expresión en una célula anfitriona. En un aspecto, la célula anfitriona puede ser una célula bacteriana, una célula fúngica, una célula de insecto, una célula de levadura, una célula vegetal o una célula de mamífero.

La invención proporciona métodos para producir una biblioteca de ácidos nucleicos que codifican una pluralidad de sitios activos de xilanasa modificados o sitios de unión al sustrato, donde los sitios activos modificados o los sitios de unión al sustrato se obtienen de un a primer ácido nucleico que comprende una secuencia que codifica un primer sitio activo o un primer sitio de unión al sustrato comprendiendo el método las siguientes etapas: (a) proporcionar un primer ácido nucleico que codifica un primer sitio activo o el primer sitio de unión al sustrato, donde la primera 60 secuencia de ácido nucleico comprende una secuencia que hibrida en condiciones restrictivas con un ácido nucleico de la invención, y el ácido nucleico codifica un sitio activo de xilanasa o un sitio de unión al sustrato de xilanasa; (b) proporcionar un conjunto de oligonucleótidos mutagénicos que codifican variantes de aminoácidos de origen natural en una pluralidad de codones elegidos como diana en el primer ácido nucleico; y, (c) utilizar el conjunto de

oligonucleótidos mutagénicos para generar un conjunto de ácidos nucleicos variantes que codifican el sitio activo o codifican el sitio de unión al sustrato que codifican una variedad de variaciones de aminoácido en cada codón de aminoácido que fue mutagenizado, produciendo de ese modo una biblioteca de ácidos nucleicos que codifican una pluralidad de sitios activos de xilanasa modificados o sitios de unión al sustrato. En un aspecto, el método comprende mutagenizar el primer ácido nucleico de la etapa (a) por medio de un método que comprende un sistema 5 de evolución directa optimizada, mutagénesis por saturación del sitio de genes (GSSM™), reensamblaje de ligación sintética (SLR), PCR propensa a error, barajado, mutagénesis dirigida a oligonucleótidos, PCR de ensamblaje, mutagénesis por PCR sexual, mutagenésis in vivo, mutagenésis por inserción de casetes, mutagenésis de ensamblaje recursivo, mutagenésis de conjunto exponencial, mutagénesis de sitio específico, reensamblaje de genes (GeneReassembly™, Patente de los Estados Unidos Núm. 6.537.776), mutagénesis por saturación de sitio de 10 genes (GSSM™), reensamblaje de ligación sintética (SLR) y una de sus combinaciones. En otro aspecto, el método comprende mutagenizar el primer ácido nucleico de la etapa (a) o variantes por medio de un método que comprende recombinación, recombinación de secuencia recursiva, mutagénesis de ADN modificada por fosfotioato, mutagénesis de molde que contiene uracilo, mutagénesis de dúplex discontinuo, mutagénesis por reparación de apareamiento erróneo, mutagénesis de cepa huésped de reparación deficiente, mutagénesis química, mutagénesis 15 radiogénica, mutagénesis por supresión, mutagénesis por restricción-selección, mutagénesis por restricción-purificación, síntesis artificial de genes, mutagénesis de ensamblaje, creación de multímeros de ácidos nucleicos quiméricos y una de sus combinaciones.

La invención proporciona métodos para elaborar una molécula pequeña que comprenden las siguientes etapas: (a) 20 proporcionar un pluralidad de enzimas biosintéticas capaces de sintetizar o modificar una molécula pequeña, donde una de las enzimas comprende una enzima xilanasa codificada por un ácido nucleico de la invención; (b) proporcionar un sustrato para al menos una de las enzimas de la etapa (a); y (c) hacer reaccionar el sustrato de la etapa (b) con las enzimas en condiciones que faciliten una pluralidad de reacciones biocatalíticas para generar una molécula pequeña mediante una serie de reacciones biocatalíticas. La invención proporciona métodos para 25 modificar una molécula pequeña que comprende las siguientes etapas: (a) proporcionar una enzima xilanasa, donde la enzima comprende un polipéptido de la invención, o, un polipéptido codificado por un ácido nucleico de la invención, o una subsecuencia del mismo; (b) proporcionar un molécula pequeña; y (c) hacer reaccionar la enzima de la etapa (a) con la molécula pequeña de la etapa (b) en condiciones que faciliten una reacción enzimática catalizada por la enzima xilanasa, modificando de ese modo una molécula pequeña por una reacción enzimática de 30 xilanasa. En un aspecto, el método puede comprender una pluralidad de sustratos de molécula pequeña para la enzima de la etapa (a), generándose de ese modo una biblioteca de moléculas pequeñas modificadas producidas por al menos una reacción enzimática catalizada por la enzima xilanasa. En un aspecto, el método puede comprender una pluralidad de enzimas adicionales en condiciones que faciliten una pluralidad de reacciones biocatalíticas por las enzimas para formar una biblioteca de moléculas pequeñas modificadas producidas por la 35 pluralidad de reacciones enzimáticas. En otro aspecto, el método puede comprender adicionalmente la etapa de someter a ensayo la biblioteca para determinar si una molécula pequeña modificada concreta que muestra una actividad deseada está presente en la biblioteca. La etapa de someter a ensayo la biblioteca puede comprender adicionalmente las etapas de eliminación sistemáticas de todas menos una de las reacciones biocatalíticas utilizadas para producir una porción de la pluralidad de las moléculas pequeñas modificadas en la biblioteca sometiendo a 40 ensayo la porción de la molécula pequeña modificada por la presencia o ausencia de la molécula pequeña modificada concreta con una actividad deseada, e identificación de al menos una reacción biocatalítica específica que produce la molécula pequeña modificada concreta de actividad deseada.

La invención proporciona métodos para determinar un fragmento funcional de una enzima xilanasa que comprenden 45 las etapas de: (a) proporcionar una enzima xilanasa, donde la enzima comprende un polipéptido de la invención, o un polipéptido codificado por un ácido nucleico de la invención, o una subsecuencia del mismo; y (b) suprimir una pluralidad de residuos de aminoácidos de la secuencia de la etapa (a) y someter a ensayo la subsecuencia restante para determinar una actividad xilanasa, determinando de ese modo un fragmento funcional de una enzima xilanasa. En un aspecto, la actividad xilanasa se mide proporcionando un sustrato de xilanasa y detectando un descenso en la 50 cantidad del sustrato o un incremento en la cantidad de un producto de reacción.

La invención proporciona métodos para construir células completas de fenotipos nuevos o modificados utilizando análisis de flujo metabólico en tiempo real, comprendiendo el método las siguientes etapas: (a) elaborar una célula modificada modificando la composición genética de una célula, donde la composición genética es modificada 55 mediante la adición a la célula de un ácido nucleico de la invención; (b) cultivar la célula modificada para generar una pluralidad de células modificadas; (c) medir al menos un parámetro metabólico de la célula controlando el cultivo celular de la etapa (b) en tiempo real; y, (d) analizar los datos de la etapa (c) determinar si el parámetro medido difiere de una medición comparable en una célula no modificada en condiciones similares, identificando de ese modo un fenotipo construido en la célula utilizando análisis de flujo metabólico en tiempo real. En un aspecto, la 60 composición genética de la célula se puede modificar por medio de un método que comprende deleción de una secuencia o modificación de una secuencia en la célula, o, desactivar la expresión de un gen. En un aspecto, el método puede comprender adicionalmente seleccionar una célula que comprende un fenotipo construido

recientemente. En otro aspecto, el método puede comprender cultivar la célula seleccionada, generándose de ese modo un nueva cepa celular que comprende un fenotipo construido recientemente.

La invención proporciona métodos para aumentar la termotolerancia o la termoestabilidad de un polipéptido de xilanasa, comprendiendo el método la glicosilación de un polipéptido de xilanasa, donde el polipéptido comprende al 5 menos treinta aminoácidos contiguos de un polipéptido de la invención; o un polipéptido codificado por una secuencia de ácido nucleico de la invención, incrementando de ese modo la termotolerancia o la termoestabilidad del polipéptido de xilanasa. En un aspecto, la actividad especifica de la xilanasa puede ser termoestable o termotolerante a una temperatura en el intervalo de más de alrededor de 37°C a alrededor de 95°C.

La invención proporciona métodos para expresar en exceso un polipéptido de xilanasa recombinante en una célula que comprenden expresar un vector que comprende un ácido nucleico que comprende un ácido nucleico de la invención o una secuencia de ácido nucleico de la invención, donde las identidades de secuencia se determinan mediante análisis con un algoritmo de comparación de secuencia o mediante inspección visual, donde la expresión en exceso se efectúa mediante el uso de un promotor de alta actividad, un vector dicistrónico o mediante 15 amplificación génica del vector.

La invención proporciona métodos para elaborar una planta transgénica que comprenden las siguientes etapas: (a) introducir una secuencia de ácido nucleico heteróloga en la célula, donde la secuencia de ácido nucleico heteróloga comprende una secuencia de ácido nucleico de la invención, produciendo de ese modo una célula vegetal 20 transformada; y (b) producir una planta transgénica a partir de la célula transformada. En un aspecto, la etapa (a) puede comprender adicionalmente introducir la secuencia de ácido nucleico heteróloga mediante electroporación o microinyección de protoplastos de células vegetales. En otro aspecto, la etapa (a) puede comprender adicionalmente introducir la secuencia de ácido nucleico heteróloga directamente en tejido vegetal por medio de bombardeo de partículas de ADN. Alternativamente, la etapa (a) puede comprender adicionalmente introducir la secuencia de ácido 25 nucleico heteróloga en el ADN de la célula vegetal utilizando un anfitrión Agrobacterium tumefaciens. En un aspecto, la célula vegetal puede ser una célula de patata, maíz, arroz, trigo, tabaco, o cebada.

La invención proporciona métodos para expresar una secuencia de ácido nucleico heteróloga en una célula vegetal que comprenden las siguientes etapas: (a) transformar la célula vegetal con una secuencia de ácido nucleico 30 heteróloga conectado operablemente a un promotor, donde la secuencia de ácido nucleico heteróloga comprende un ácido nucleico de la invención; (b) cultivar la planta en condiciones en las que la secuencia de ácido nucleico heteróloga se exprese en la célula vegetal. La invención proporciona métodos para expresar una secuencia de ácido nucleico heteróloga en una célula vegetal que comprenden las siguientes etapas: (a) transformar la célula vegetal con una secuencia de ácido nucleico heteróloga conectada operablemente a un promotor, donde la secuencia de 35 ácido nucleico heteróloga comprende una secuencia de la invención; (b) cultivar la planta en condiciones en las que la secuencia de ácido nucleico heteróloga se exprese en la célula vegetal.

La invención proporciona métodos para hidrolizar, romper o desorganizar una composición que comprende xilano que comprenden las siguientes etapas: (a) proporcionar un polipéptido de la invención que tiene una actividad 40 xilanasa, o un polipéptido codificado por un ácido nucleico de la invención; (b) proporcionar un composición que comprende a xilano; y (c) poner en contacto el polipéptido de la etapa (a) con la composición de la etapa (b) en condiciones en las que la xilanasa hidroliza, rompe o desorganiza la composición que comprende xilano. En un aspecto, la composición comprende una célula vegetal, una célula bacteriana, una célula de levadura, una célula de insecto, o una célula animal. De este modo, la composición puede comprender cualquier planta o parte de planta, 45 cualquier alimento o pienso, un producto de desecho y similares. La invención proporciona métodos para licuar o separar una composición que comprende xilano que comprenden las siguientes etapas: (a) proporcionar un polipéptido de la invención que tiene una actividad xilanasa, o un polipéptido codificado por un ácido nucleico de la invención; (b) proporcionar un composición que comprende un xilano; y (c) poner en contacto el polipéptido de la etapa (a) con la composición de la etapa (b) en condiciones en las que la xilanasa separa, reblandece o licua la 50 composición que comprende xilano.

Las composiciones detergentes pueden comprender un polipéptido de la invención, o un polipéptido codificado por un ácido nucleico de la invención, donde el polipéptido tiene una actividad xilanasa. La xilanasa puede ser una xilanasa no tensioactiva o una xilanasa tensioactiva. La xilanasa se puede formular en una composición líquida no 55 acuosa, un sólido moldeado, una forma granular, una forma particulada, una tableta comprimida, una forma de gel, una pasta o una forma en suspensión. Los métodos para lavar un objeto comprenden las siguientes etapas: (a) proporcionar un composición que comprende un polipéptido de la invención que tiene una actividad xilanasa, o un polipéptido codificado por un ácido nucleico de la invención; (b) proporcionar un objeto; y (c) poner en contacto el polipéptido de la etapa (a) y el objeto de la etapa (b) en condiciones en las que la composición pueda lavar el objeto. 60

Los productos textiles o tejidos, que incluyen, p. ej., fibras, pueden comprender un polipéptido de la invención, o un polipéptido codificado por un ácido nucleico de la invención. En un aspecto, los productos textiles o tejidos comprenden fibras que contienen xilano. Los métodos para tratar un producto textil o tejido (p. ej., eliminando una

mancha de una composición) comprenden las siguientes etapas: (a) proporcionar un composición que comprende un polipéptido de la invención que tiene una actividad xilanasa, o un polipéptido codificado por un ácido nucleico de la invención; (b) proporcionar un producto textil o tejido que comprende un xilano; y (c) poner en contacto el polipéptido de la etapa (a) y la composición de la etapa (b) en condiciones en las que la xilanasa pueda tratar el producto textil o tejido (p. ej., eliminación de la mancha). Los métodos para mejorar el acabado de un tejido 5 comprenden las siguientes etapas: (a) proporcionar un composición que comprende un polipéptido de la invención que tiene una actividad xilanasa, o un polipéptido codificado por un ácido nucleico de la invención; (b) proporcionar un tejido; y (c) poner en contacto el polipéptido de la etapa (a) y el tejido de la etapa (b) en condiciones en las que el polipéptido pueda tratar el tejido mejorando de ese modo el acabado del tejido. En un aspecto, el tejido es una lana o una seda. 10

Los piensos o alimentos pueden comprender un polipéptido de la invención, o un polipéptido codificado por un ácido nucleico de la invención. Los métodos para hidrolizar xilanos en un pienso o un alimento antes de su consumo por un animal comprenden las siguientes etapas: (a) obtener un material para pienso que comprende una xilanasa de la invención, o una xilanasa codificada por un ácido nucleico de la invención; y (b) añadir el polipéptido de la etapa (a) 15 al material para pienso o alimento en una cantidad suficiente durante un período de tiempo suficiente para ocasionar la hidrólisis del xilano y la formación de un alimento o pienso tratado, hidrolizando de ese modo los xilanos del alimento o el pienso antes de su consumo por el animal. Los métodos para hidrolizar xilanos en un pienso o un alimento después de su consumo por un animal comprenden las siguientes etapas: (a) obtener un material para pienso que comprende una xilanasa de la invención, o una xilanasa codificada por un ácido nucleico de la invención; 20 (b) añadir el polipéptido de la etapa (a) al material para pienso o alimento; y (c) administrar el material para pienso o alimento al animal, donde después de su consumo, la xilanasa causa la hidrólisis de los xilanos en el pienso o alimento en el tracto digestivo del animal. El alimento o el pienso pueden ser, p. ej., un cereal, un grano, un maíz y similares.

Los alimentos o suplementos nutricionales para un animal pueden comprender un polipéptido de la invención, p. ej., un polipéptido codificado por el ácido nucleico de la invención. El polipéptido en el alimento o suplemento nutricional puede ser glicosilado. Las matrices de liberación de enzimas comestibles pueden comprender un polipéptido de la invención, p. ej., un polipéptido codificado por el ácido nucleico de la invención. En un aspecto, la matriz de liberación comprende un pelete. En un aspecto, el polipéptido puede ser glicosilado. En un aspecto, la actividad 30 xilanasa es termotolerante. En otro aspecto, la actividad xilanasa es termoestable.

Un alimento, un pienso o un suplemento nutricional pueden comprender un polipéptido de la invención. Los métodos para utilizar una xilanasa como suplemento nutricional en una dieta para animales comprenden: preparar un suplemento nutricional que contiene una enzima xilanasa que comprende al menos treinta aminoácidos contiguos de 35 un polipéptido de la invención; y administrar el suplemento nutricional a un animal para incrementar la utilización de un xilano contenido en un pienso o un alimento ingerido por el animal. El animal puede ser un ser humano, un rumiante o un animal monogástrico. La enzima xilanasa se puede preparar mediante la expresión de un polinucleótido que codifica la xilanasa en un organismo seleccionado del grupo que consiste en una bacteria, una levadura, una planta, un insecto, un hongo y un animal. El organismo se puede seleccionar del grupo que consiste 40 en S. pombe, S. cerevisiae, Pichia pastoris, Pseudomonas sp., E. coli, Streptomyces sp., Bacillus sp. y Lactobacillus sp.

Las matrices de liberación de enzimas comestibles pueden comprender una enzima xilanasa recombinante termoestable, p. ej., un polipéptido de la invención. Los métodos para liberar un suplemento de xilanasa a un animal 45 comprenden preparar una matriz de liberación de enzimas comestible en forma de peletes que comprende un portador comestible granulado y una enzima xilanasa recombinante termoestable, donde los peletes dispersan fácilmente la enzima xilanasa contenida en los mismos en medios acuosos, y administrar la matriz de liberación de enzimas comestible al animal. La enzima xilanasa recombinante puede comprender un polipéptido de la invención. El portador comestible granulado puede comprender un portador seleccionado del grupo que consiste en un germen 50 de grano, un germen de grano residuo de la extracción de aceite, un forraje, una alfalfa, un heno, una cáscara de soja, una harina de semilla de giralsol y un salvado de trigo. El portador comestible puede comprender germen de grano usado para aceite. La enzima xilanasa puede ser glicosilada para proporcionar termoestabilidad en condiciones de peletización. La matriz de liberación se puede formar peletizando una mezcla que comprende un germen de grano y una xilanasa. Las condiciones de peletización pueden incluir la aplicación de vapor de agua. Las 55 condiciones de peletización pueden comprender la aplicación de una temperatura en exceso de alrededor de 80°C durante alrededor de 5 minutos y la enzima conserva una actividad específica de al menos 350 a alrededor de 900 unidades por miligramo de enzima.

Los métodos para mejorar la textura y el sabor de un producto lácteo comprenden las siguientes etapas: (a) 60 proporcionar un polipéptido de la invención que tiene una actividad xilanasa, o una xilanasa codificada por un ácido nucleico de la invención; (b) proporcionar un producto lácteo; y (c) poner en contacto el polipéptido de la etapa (a) y el producto lácteo de la etapa (b) en condiciones en las que la xilanasa pueda mejorar la textura o el sabor del

producto lácteo. En un aspecto, el producto lácteo comprende un queso o un yogurt. Los productos lácteos comprenden una xilanasa de la invención, o son codificados por un ácido nucleico de la invención.

Los métodos para mejorar la extracción de aceite de un material vegetal rico en aceite comprenden las siguientes etapas: (a) proporcionar un polipéptido de la invención que tiene una actividad xilanasa, o una xilanasa codificada 5 por un ácido nucleico de la invención; (b) proporcionar un material vegetal rico en aceite; y (c) poner en contacto el polipéptido de la etapa (a) y el material vegetal rico en aceite. En un aspecto, el material vegetal rico en aceite comprende una semilla rica en aceite. El aceite puede ser un aceite de soja, un aceite de oliva, un aceite de colza (canola) o un aceite de girasol.

Los métodos para preparar un zumo, jarabe, puré o extracto de fruta u hortalizas comprenden las siguientes etapas: (a) proporcionar un polipéptido de la invención que tiene una actividad xilanasa, o una xilanasa codificada por un ácido nucleico de la invención; (b) proporcionar un composición o un líquido que comprende un material de frutas u hortalizas; y (c) poner en contacto el polipéptido de la etapa (a) y la composición, preparando de ese modo el zumo, jarabe, puré o extracto de fruta u hortalizas. 15

Los papeles o productos de papel o la pasta de papel pueden comprender una xilanasa de la invención, o un polipéptido codificado por un ácido nucleico de la invención. La invención proporciona métodos para tratar un papel o una pasta de papel o madera que comprende las siguientes etapas: (a) proporcionar un polipéptido de la invención que tiene una actividad xilanasa, o una xilanasa codificada por un ácido nucleico de la invención; (b) proporcionar un 20 composición que comprende a papel o una pasta de papel o madera ; y (c) poner en contacto el polipéptido de la etapa (a) y la composición de la etapa (b) en condiciones en las que la xilanasa pueda tratar papel o pasta de papel o madera. Las composiciones farmacéuticas pueden actuar como coadyuvante digestivo o antimicrobiano (p. ej., contra Salmonella). En un aspecto, el tratamiento es profiláctico. Los productos para la higiene bucal pueden comprender un polipéptido de la invención que tiene una actividad xilanasa, o una xilanasa codificada por un ácido 25 nucleico de la invención. El producto para la higiene bucal puede comprender una pasta dentífrica, una crema dental, un gel o un polvo dentífrico, una preparación odóntica, un colutorio, una de enjuagado pre- o postcepillado, un chicle, una gragea o un caramelo. Las composiciones para limpieza de lentes de contacto pueden comprender un polipéptido de la invención que tiene una actividad xilanasa, o una xilanasa codificada por un ácido nucleico de la invención. 30

Los métodos para eliminar o proteger animales de un microorganismo que comprende un xilano comprenden administrar un polipéptido de la invención. El microorganismo puede ser una bacteria que comprende un xilano, p. ej., Salmonella.

Un ácido nucleico aislado tiene una secuencia mostrada en el SEQ ID NO: 189 y las variantes de la misma tienen al menos 50% de identidad de secuencia con el SEQ ID NO: 189 y codifican polipéptidos que tienen actividad xilanasa. En un aspecto, el polipéptido tiene una actividad xilanasa, p. ej., una actividad xilanasa termoestable.

Los ácidos nucleicos aislados o recombinantes comprenden el SEQ ID NO: 189, donde el SEQ ID NO: 189 40 comprende una o más o todas las siguientes variaciones de secuencia: los nucleótidos de las posiciones 22 a 24 son TTC, los nucleótidos de las posiciones 22 a 24 son TTT, los nucleótidos de las posiciones 31 a 33 are CAC, los nucleótidos de las posiciones 31 a 33 son CAT, los nucleótidos de las posiciones 34 a 36 son TTG, los nucleótidos de las posiciones 34 a 36 son TTA, los nucleótidos de las posiciones 34 a 36 son CTC, los nucleótidos de las posiciones 34 a 36 son CTT, los nucleótidos de las posiciones 34 a 36 son CTA, los nucleótidos de las posiciones 34 45 a 36 son CTG, los nucleótidos de las posiciones 49 a 51 son ATA, los nucleótidos de las posiciones 49 a 51 son ATT, los nucleótidos de las posiciones 49 a 51 son ATC, los nucleótidos de las posiciones 178 a 180 son CAC, los nucleótidos de las posiciones 178 a 180 son CAT, los nucleótidos de las posiciones 190 a 192 son TGT, los nucleótidos de las posiciones 190 a 192 son TGC, los nucleótidos de las posiciones 190 a 192 son GTA, los nucleótidos de las posiciones 190 a 192 son GTT, los nucleótidos de las posiciones 190 a 192 son GTC, los 50 nucleótidos de las posiciones 190 a 192 son GTG, los nucleótidos de las posiciones 193 a 195 son GTG, los nucleótidos de las posiciones 193 a 195 son GTC, los nucleótidos de las posiciones 193 a 195 son GTA, los nucleótidos de las posiciones 193 a 195 son GTT, los nucleótidos de las posiciones 202 a 204 son ATA, los nucleótidos de las posiciones 202 a 204 son ATT, los nucleótidos de las posiciones 202 a 204 son ATC, los nucleótidos de las posiciones 202 a 204 son GCT, los nucleótidos de las posiciones 202 a 204 son GCG, los 55 nucleótidos de las posiciones 202 a 204 son GCC, los nucleótidos de las posiciones 202 a 204 son GCA, los nucleótidos de las posiciones 235 a 237 son CCA, los nucleótidos de las posiciones 235 a 237 son CCC, o los nucleótidos de las posiciones 235 a 237 son CCG.

Los polipéptidos aislados o recombinantes comprenden una secuencia de aminoácidos que comprende el SEQ ID 60 NO: 190, donde el SEQ ID NO: 190 comprende una o más o todas las siguientes variaciones de secuencia: el ácido aspártico en la posición de aminoácido 8 es fenilalanina, la glutamina en la posición de aminoácido 11 es histidina, la asparragina en la posición de aminoácido 12 es leucina, la glicina en la posición de aminoácido 17 es isoleucina, la treonina en la posición de aminoácido 23 es treonina codificada por un codón distinto del codón de tipo salvaje, la

glicina en la posición de aminoácido 60 es histidina, la prolina en la posición de aminoácido 64 es cisteína, la prolina en la posición de aminoácido 64 es valina, la serina en la posición de aminoácido 65 es valina, la glicina en la posición de aminoácido 68 es isoleucina, la glicina en la posición de aminoácido 68 es alanina, o la serina en la posición de aminoácido 79 es prolina. En un aspecto, el polipéptido tiene una actividad xilanasa, p. ej., una actividad xilanasa termoestable. 5

Los ácidos nucleicos aislados o recombinantes comprenden el SEQ ID NO: 189, donde el SEQ ID NO: 189 comprende una o más o todas las variaciones de secuencia mostradas en la Tabla 1 o la Tabla 2. Los polipéptidos aislados o recombinantes son codificados por ácidos nucleicos que comprenden el SEQ ID NO: 189, donde el SEQ ID NO: 189 comprende una o más o todas las variaciones de secuencia mostradas en la Tabla 1 o la Tabla 2. En un 10 aspecto, el polipéptido tiene una actividad xilanasa, p. ej., una actividad xilanasa termoestable.

Los ácidos nucleicos aislados o recombinantes comprenden el SEQ ID NO: 379, donde el SEQ ID NO: 379 comprende una o más o todas las siguientes variaciones de secuencia: los nucleótidos de las posiciones 22 a 24 are TTC, los nucleótidos de las posiciones 31 a 33 are CAC, los nucleótidos de las posiciones 49 a 51 are ATA, los 15 nucleótidos de las posiciones 178 a 180 are CAC, los nucleótidos de las posiciones 193 a 195 are GTG, los nucleótidos de las posiciones 202 a 204 are GCT.

Los polipéptidos aislados o recombinantes comprenden el SEQ ID NO: 380, donde el SEQ ID NO: 380 comprende una o más o todas las siguientes variaciones de secuencia: D8F, Q11H, G17I, G60H, S65V y/o G68A. En un 20 aspecto, el polipéptido tiene una actividad xilanasa, p. ej., una actividad xilanasa termoestable.

Los ácidos nucleicos recombinantes o aislados en la presente memoria son referidos también como "secuencias de ácido nucleico del Grupo A". Un ácido nucleico aislado incluye al menos 10 bases consecutivas de una secuencia como la mostrada en las secuencias de ácido nucleico del Grupo A, secuencias esencialmente idénticas a éstas y 25 las secuencias complementarias a éstas.

Los polipéptidos aislados o recombinantes de la presente memoria, que incluyen fragmentos funcionales de las secuencias ilustrativas de la invención, son referidos también como "secuencias de aminoácidos del Grupo B". Un ácido nucleico aislado o recombinante codifica un polipéptido que tiene al menos 10 aminoácidos consecutivos de 30 una secuencia como la mostrada en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas. Un polipéptido purificado tiene una secuencia como la mostrada en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas. Un anticuerpo aislado o purificado se une específicamente a un polipéptido que tiene una secuencia como la mostrada en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas. 35

Un anticuerpo aislado o purificado o fragmento de unión del mismo, se une específicamente a un polipéptido que tiene al menos 10 aminoácidos consecutivos de uno de los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas.

Un método para elaborar un polipéptido que tiene una secuencia como la mostrada en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas incluye introducir un ácido nucleico que codifica el polipéptido en una célula anfitriona, donde el ácido nucleico está conectado operablemente a un promotor y cultivar la célula anfitriona en condiciones que permitan la expresión del ácido nucleico. Un método para elaborar un polipéptido que tiene al menos 10 aminoácidos de una secuencia como la mostrada en las secuencias de 45 aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas incluye introducir un ácido nucleico que codifica el polipéptido en una célula anfitriona, donde el ácido nucleico está conectado operablemente a un promotor y cultivar la célula anfitriona en condiciones que permitan la expresión del ácido nucleico, produciendo de ese modo el polipéptido.

Un método para generar una variante incluye obtener un ácido nucleico que tiene una secuencia como la mostrada en las secuencias de ácido nucleico del Grupo A, secuencias esencialmente idénticas a éstas, secuencias complementarias a las secuencias de las secuencias de ácido nucleico del Grupo A, fragmentos que comprenden al menos 30 nucleótidos consecutivos de las secuencias precedentes y cambiar uno o más nucleótidos en la secuencia por otro nucleótido, suprimir uno o más nucleótidos en la secuencia, o añadir uno o más nucleótidos a la secuencia. 55

Un medio legible por ordenador puede tener almacenada una secuencia como la mostrada en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas.

Un sistema informático puede incluir un procesador y un dispositivo de almacenamiento de datos donde el dispositivo de almacenamiento de datos tiene almacenada una secuencia como la mostrada en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o un polipéptido que tiene una secuencia como la mostrada en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas.

Un método para comparar una primera secuencia con una secuencia de referencia donde la primera secuencia es un ácido nucleico que tiene una secuencia como la mostrada en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o un código de polipéptido de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas incluye leer la primera secuencia y la secuencia de referencia a través del uso de un programa informático que compara secuencias; y determinar las diferencias entre la primera 5 secuencia y la secuencia de referencia con el programa informático.

Un método para identificar una característica en una secuencia como la mostrada en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o un polipéptido que tiene una secuencia como la mostrada en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, incluye 10 leer la secuencia a través del uso de un programa informático que identifica características en las secuencias; e identificar características en la secuencia con el programa informático.

Un método para catalizar la rotura de xilano o uno de sus derivados, comprende la etapa de poner en contacto una muestra que contiene xilano o su derivado con un polipéptido de las secuencias de aminoácidos del Grupo B y 15 secuencias esencialmente idénticas a éstas en condiciones que faciliten la rotura del xilano.

Un análisis, para identificar fragmentos o variantes de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, que conservan la función enzimática de los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, incluye poner en contacto el polipéptido de 20 las secuencias de aminoácidos del Grupo B, secuencias esencialmente idénticas a éstas, o un fragmento de polipéptido o variante con una molécula sustrato en condiciones que permitan que el fragmento de polipéptido o variante funcionen y detectar un descenso en el nivel de sustrato o un incremento en el nivel del producto de reacción específico de la reacción entre el polipéptido y sustrato identificando de ese modo un fragmento o variante de tales secuencias. 25

Una sonda de ácido nucleico de un oligonucleótido tiene de alrededor de 10 a 50 nucleótidos de longitud y tiene un segmento de al menos 10 nucleótidos contiguos que es complementario al menos en 50% a una región diana de ácido nucleico de una secuencia de ácido nucleico seleccionada del grupo que consiste en las secuencias de ácido nucleico del Grupo A; y que hibrida con la región diana de ácido nucleico en condiciones de moderada a altamente 30 restrictivas para formar un dúplex de diana:sonda detectable.

Una sonda de polinucleótido es para el aislamiento o la identificación de genes de xilanasa que tienen una secuencia que es la misma que, o completamente complementaria a al menos un fragmento de una de las secuencias de ácido nucleico del Grupo A. 35

Una preparación de proteína comprende un polipéptido que tiene una secuencia de aminoácidos seleccionada entre las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas donde la preparación de proteína es un líquido.

Una preparación de proteína comprende un polipéptido que tiene una secuencia de aminoácidos seleccionada entre las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas donde el polipéptido es un sólido.

Un método para modificar moléculas pequeñas comprende la etapa de mezclar al menos un polipéptido codificado 45 por un polinucleótido seleccionado entre las secuencias de ácido nucleico del Grupo A, secuencias esencialmente idénticas a éstas y las secuencias complementarias a éstas con al menos una molécula pequeña, para producir al menos una molécula pequeña modificada a través de al menos una reacción biocatalítica, donde el al menos un polipéptido tiene actividad xilanasa.

Un vector de clonación puede tener una secuencia que codifica un polipéptido que tiene actividad xilanasa, seleccionándose dicha secuencia de las secuencias de ácido nucleico del Grupo A, secuencias esencialmente idénticas a éstas y las secuencias complementarias a éstas.

Una célula anfitriona puede comprender una secuencia que codifica un polipéptido que tiene actividad xilanasa, 55 seleccionándose dicha secuencia de las secuencias de ácido nucleico del Grupo A, secuencias esencialmente idénticas a éstas y las secuencias complementarias a éstas.

Un vector de expresión susceptible de replicación en una célula anfitriona comprende un polinucleótido que tiene una secuencia seleccionada entre las secuencias de ácido nucleico del Grupo A, secuencias esencialmente 60 idénticas a éstas, secuencias complementarias a éstas y ácidos nucleicos aislados que hibridan con ácidos nucleicos que tienen cualquiera de las secuencias precedentes en condiciones de restricción baja, moderada y alta.

Un método de acondicionamiento de la masa comprende poner en contacto masa con al menos un polipéptido de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas en condiciones suficiente para acondicionar la masa.

Un método de producción de bebidas comprende la administración de al menos un polipéptido de las secuencias de 5 aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas en condiciones suficiente para disminuir la viscosidad del mosto o la cerveza.

Las xilanasas de la invención se pueden utilizar para romper los arabinoxilanos de alto peso molecular en piensos para animales. La adición de las xilanasas de la invención estimula las velocidades de crecimiento mejorando la 10 digestibilidad, lo que también mejora la calidad de la deposición del animal. La xilanasa funciona a través del tracto gastrointestinal reduciendo la viscosidad intestinal e incrementando la difusión de enzimas pancreáticas. Adicionalmente, las xilanasas de la invención se pueden utilizar en el tratamiento de las paredes de las células del endospermo de los cereales forrajeros y las proteínas vegetales. Las xilanasas novedosas de la invención se administran a un animal con el fin de incrementar la utilización del xilano en el alimento. Esta actividad de las 15 xilanasas de la invención se puede utilizar para romper el material insoluble de las paredes celulares, liberando nutrientes de las paredes celulares, que a continuación se hacen asequibles para el animal. También cambia la hemicelulosa a azúcares nutritivos de manera que se liberan los nutrientes atrapados anteriormente en las paredes celulares. La xilanasa también produce compuestos que pueden ser una fuente nutritiva para la microflora ruminal.

Un método para la utilización de xilanasa como suplemento nutricional en las dietas de los animales, comprende la preparación de un suplemento nutricional que contiene una enzima xilanasa recombinante que comprende al menos treinta aminoácidos contiguos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas y la administración del suplemento nutricional a un animal para incrementar la utilización del xilano contenido en el alimento ingerido por el animal. 25

Un método la liberación de un suplemento de xilanasa a un animal comprende la preparación de una matriz comestible de liberación de enzimas en forma de peletes que comprenden un portador comestible granulado y una enzima xilanasa recombinante termoestable, donde las partículas dispersan rápidamente la enzima xilanasa contenida en la misma en medios acuosos, y la administración de la matriz de liberación de enzimas comestible al 30 animal. El portador comestible granulado puede comprender un portador seleccionado del grupo que consiste en germen de grano usado para aceite, forraje, alfalfa, heno, cáscara de soja, harina de semilla de giralsol y salvado de trigo. La enzima xilanasa puede tener una secuencia de aminoácidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas.

Un ácido nucleico aislado comprende una secuencia que codifica un polipéptido que tiene actividad xilanasa, donde la secuencia se selecciona de las secuencias de ácido nucleico del Grupo A, secuencias esencialmente idénticas a éstas y las secuencias complementarias a éstas, donde la secuencia contiene una secuencia señal. Un ácido nucleico aislado comprende una secuencia que codifica un polipéptido que tiene actividad xilanasa, donde la secuencia se selecciona de las secuencias de ácido nucleico del Grupo A, secuencias esencialmente idénticas a 40 éstas y las secuencias complementarias a éstas, donde la secuencia contiene una secuencia señal de otra xilanasa. Un ácido nucleico aislado comprende una secuencia que codifica un polipéptido que tiene actividad xilanasa, donde la secuencia se selecciona de las secuencias de ácido nucleico del Grupo A, secuencias esencialmente idénticas a éstas y las secuencias complementarias a éstas donde la secuencia no contiene una secuencia señal.

Un ácido nucleico aislado es a mutación del SEQ ID NO: 189. Una secuencia de aminoácidos es a mutación del SEQ ID NO: 190.

Los aspectos adicionales de la invención se muestran en las reivindicaciones adjuntas.

Los detalles de una o más realizaciones de la invención se muestran en los dibujos adjuntos y la descripción de más abajo. Otras características, objetos, y ventajas de la invención resultarán evidentes de la descripción y los dibujos, y de las reivindicaciones.

Todas las publicaciones, patentes, solicitudes de patente, secuencias GenBank y depósitos ATCC, citados en la 55 presente memoria se incorporan a la presente expresamente como referencia para todos los fines.

Breve Descripción de los Dibujos

Los siguientes dibujos son ilustrativos de aspectos de la invención y no limitan de ningún modo el alcance de la 60 invención abarcada por las reivindicaciones.

El expediente de patente o solicitud contiene al menos un dibujo realizado en color. Las copias de esta publicación de patente o solicitud de patente con dibujos en color serán proporcionadas por la Oficina tras la solicitud y pago de las tasas pertinentes.

La Figura 1 es un diagrama de bloques de un sistema informático.

La Figura 2 es un diagrama de flujo que ilustra un aspecto de un procedimiento para comparar una nueva secuencia 5 de nucleótidos o proteínas con una base de datos de secuencias con el fin de determinar los niveles de homología entre la nueva secuencia y las secuencias en la base de datos.

La Figura 3 es un diagrama de flujo que ilustra un aspecto de un procedimiento en un ordenador para determinar si dos secuencias son homólogas.

La Figura 4 es un diagrama de flujo que ilustra un aspecto de un procedimiento identificador 300 para detectar la 10 presencia de una característica en una secuencia.

La Figura 5 es un gráfico que compara la actividad de la secuencia de tipo salvaje (SEQ ID NOS: 189 y 190) con la del mutante 8x (SEQ ID NOS: 375, 376), una combinación de mutantes D, F, H, I, S, V, X y AA en la Tabla 1.

La Figura 6A ilustra los nueve mutantes de un solo sitio de aminoácido del SEQ ID NO: 378 (codificado por el SEQ ID NO: 377) generados por Mutagénesis por Saturación de Sitio de Genes (GSSM™ por "Gene Site Saturation 15 Mutagenesis") del SEQ ID NO: 190 (codificado por el SEQ ID NO: 189), como se describe en detalle en el Ejemplo 5, más abajo.

La Figura 6B ilustra el desplegamiento del SEQ ID NO: 190 y el SEQ ID NO: 378 en experimentos del punto medio de transición de la temperatura de fusión (Tm) según se determina mediante DSC para cada enzima, como se describe en detalle en el Ejemplo 5, más abajo. 20

La Figura 7A ilustra los perfiles de actividad de pH y temperatura para las enzimas del SEQ ID NO: 190 y SEQ ID NO: 378, como se describe en detalle en el Ejemplo 5, más abajo.

La Figura 7B ilustra la actividad optima de velocidad/temperatura para las enzimas del SEQ ID NO: 190 y SEQ ID NO: 378, como se describe en detalle en el Ejemplo 5, más abajo.

La Figura 7C ilustra la tolerancia térmica/actividad residual para las enzimas del SEQ ID NO: 190 y SEQ ID NO: 378, 25 como se describe en detalle en el Ejemplo 5, más abajo.

La Figura 8A ilustra la biblioteca GeneReassembly™ de todas las combinaciones posibles de las 9 mutaciones puntuales GSSM™ que se construyó y escrutó para determinar las variantes con tolerancia térmica y actividad mejoradas, como se describe en detalle en el Ejemplo 5, más abajo.

La Figura 8B ilustra la actividad relativa de la variante "6X-2" y la variante "9X" (SEQ ID NO: 378) en comparación 30 con el SEQ ID NO: 190 ("tipo salvaje") a un óptimo de temperatura y pH 6,0, como se describe en detalle en el Ejemplo 5, más abajo.

La Figura 9A ilustra las huellas dactilares obtenidas después de la hidrólisis de los oligoxilanos (Xyl)3, (Xyl)4, (Xyl)5 y (Xyl)6 mediante el SEQ ID NO: 190 ("tipo salvaje") y las enzimas variantes "9X" (SEQ ID NO: 378), como se describe en detalle en el Ejemplo 5, más abajo. 35

La Figura 9B ilustra las huellas dactilares obtenidas después de la hidrólisis de xilano Beechwood por el SEQ ID NO: 190 ("tipo salvaje") y las enzimas variantes "9X" (SEQ ID NO: 378), como se describe en detalle en el Ejemplo 5, más abajo.

La Figura 10A es un diagrama esquemático que ilustra la mejora del nivel de estabilidad térmica (representada por Tm) sobre el SEQ ID NO: 190 ("tipo salvaje") obtenido mediante evolución GSSM™, como se describe en detalle en 40 el Ejemplo 5, más abajo.

La Figura 10B ilustra un "diagrama de adecuación" de la mejora enzimática en forma del SEQ ID NO: 378 y SEQ ID NO: 380, obtenida combinando las tecnologías GSSM™ y GeneReassembly™, como se describe en detalle en el Ejemplo 5, más abajo.

La Figura 11 es un diagrama de flujo esquemático de un protocolo de escrutinio rutinario ilustrativo para determinar 45 si una xilanasa de la invención es útil para el pretratamiento de pasta de papel, como se describe en detalle en el Ejemplo 6, más abajo.

Símbolos de referencia parecidos en los diferentes dibujos indican elementos parecidos.

Descripción Detallada de la Invención

La presente invención se refiere a xilanasas y polinucleótidos que los codifican y a métodos para elaborarlos y utilizarlos. La actividad xilanasa de los polipéptidos de la invención abarca enzimas que tienen actividad hidrolasa, por ejemplo, enzimas capaces de hidrolizar los enlaces glicosídicos presentes en el xilano, p. ej., catalizando la 55 hidrólisis de los enlaces β-1,4-xilosídicos internos. Las xilanasas de la invención se pueden utilizar para elaborar y/o procesar alimentos, piensos, suplementos nutricionales, productos textiles, detergentes y similares. Las xilanasas de la invención se pueden utilizar en composiciones farmacéuticas y complementos dietéticos. Las xilanasas de la invención son particularmente útiles en procedimientos de panificación, piensos para animales, bebidas y papel.

Definiciones

El término "anticuerpo" incluye un péptido o polipéptido derivado de, modelado después o codificado sustancialmente por un gen de inmunoglobulina o genes de inmunoglobulina, o fragmentos de los mismos, capaces

de unirse específicamente a un antígeno o epítopo, véase, p. ej. Fundamental Immunology, Tercera Edición, W.E. Paul, ed., Raven Press, N.Y. (1993); Wilson (1994) J. Immunol. Methods 175:267-273; Yarmush (1992) J. Biochem. Biophys. Methods 25:85-97. El término anticuerpo incluye porciones de unión al antígeno, es decir, "sitios de unión al antígeno", (p. ej., fragmentos, subsecuencias, regiones determinantes de la complementariedad (CDR)) que conservan la capacidad de unirse al antígeno, incluyendo (i) un fragmento Fab, un fragmento monovalente que 5 consiste en los dominios VL, VH, CL y CH1; (ii) un fragmento F(ab')2, un fragmento bivalente que comprende dos fragmentos Fab unidos por un puente disulfuro en la región bisagra; (iii) un fragmento Fd que consiste en los dominios VH y CH1; (iv) un fragmento Fv que consiste en los dominios VL y VH de un solo brazo de un anticuerpo, (v) un fragmento dAb (Ward et al., (1989) Nature 341:544-546), que consiste en un dominio VH; y (vi) una región determinante de la complementariedad (CDR) aislada. Los anticuerpos de cadena sencilla también están incluidos 10 como referencia en el término "anticuerpo".

Los términos "matriz" o "micromatriz" o "biochip" o "chip" según se utilizan en la presente memoria son una pluralidad de elementos diana, comprendiendo cada elemento diana una cantidad definida de uno o más polipéptidos (incluyendo anticuerpos) o ácidos nucleicos inmovilizados sobre una zona definida de una superficie 15 sustrato, como se comenta con más detalle, más abajo.

Según se utiliza en la presente memoria, los términos "ordenador", "programa informático" y "procesador" se utilizan en sus contextos generales más amplios e incorporan todos estos dispositivos, como se describe detalladamente más abajo. Una "secuencia codificante de" o una "secuencia que codifica" un polipéptido o proteína concretos, es 20 una secuencia de ácido nucleico que es transcrita y traducida a un polipéptido o proteína cuando se coloca bajo el control de secuencias reguladoras apropiadas.

Las frases "ácido nucleico" o "secuencia de ácido nucleico" según se utilizan en la presente memoria hacen referencia a un oligonucleótido, nucleótido, polinucleótido, o a un fragmento de cualquiera de estos, a ADN o ARN 25 de origen genómico o sintético que pueden ser monocatenarios o bicatenarios y pueden representar una hebra directa o antisentido, a ácido peptidonucleico (PNA), o a cualquier material de tipo ADN o de tipo ARN, de origen natural o sintético. Las frases "ácido nucleico" o "secuencia de ácido nucleico" incluye oligonucleótido, nucleótido, polinucleótido, o a un fragmento de cualquiera de estos, a ADN o ARN (p. ej., ARNm, ARNr, ARNt, ARNi) de origen genómico o sintético que puede ser monocatenario o bicatenario y pueden representar una cadena directa o 30 antisentido, a ácido peptidonucleico (PNA), o a cualquier material de tipo ADN o de tipo ARN, de origen natural o sintético, incluyendo, p. ej., ARNi, ribonucleoproteínas (p. ej., p. ej., ARNi bicatenarios, p. ej.,RNPi). El término abarca ácidos nucleicos, es decir, oligonucleótidos, que contienen análogos conocidos de nucleótidos naturales. El término también abarca estructuras de tipo ácido nucleico con esqueletos sintéticos, véanse p. ej., Mata (1997) Toxicol. Appl. Pharmacol. 144:189-197; Strauss-Soukup (1997) Biochemistry 36:8692-8698; Samstag (1996) 35 Antisense Nucleic Acid Drug Dev 6:153-156. "Oligonucleótido" incluye un polidesoxinucleótido monocatenario o dos cadenas complementarias de polidesoxinucleótidos que se pueden sintetizar químicamente. Tales oligonucleótidos sintéticos no tienen fosfato 5' y por tanto no se ligaran a otro oligonucleótido sin añadir un fosfato con un ATP en presencia de una quinasa. Un oligonucleótido sintético se puede ligar a un fragmento que no haya sido desfosforilado. 40

Una "secuencia codificante de" o una "secuencia de nucleótido que codifica" un polipéptido o proteína concreto, es una secuencia de ácido nucleico que es transcrita y traducida a un polipéptido o proteína cuando se coloca bajo el control de secuencias reguladoras apropiadas.

El término "gen" significa el segmento de ADN implicado en la producción de una cadena polipeptídica; incluye las regiones anteriores y posteriores a la región codificante (líder y trailer) así como, cuando sea aplicable, las secuencias interpuestas (intrones) entre segmentos codificantes individuales (exones). "Conectado operablemente" según se utilizan en la presente memoria hace referencia a una relación funcional entre dos o más segmentos de ácido nucleico (p. ej., ADN). Típicamente, hace referencia a la relación funcional de secuencias reguladoras 50 transcripcionales con una secuencia transcrita. Por ejemplo, un promotor esta conectado operablemente a una secuencia codificante, tal como un ácido nucleico de la invención, si estimula o modula la transcripción de la secuencia codificante en una célula anfitriona u otro sistema de expresión apropiado. Generalmente, las secuencias reguladoras de la transcripción promotoras que están conectadas operablemente a una secuencia transcrita son contiguas físicamente a la secuencia transcrita, es decir, actúan en cis. Sin embargo, algunas secuencias 55 reguladoras de la transcripción, tales como los intensificadores, no necesitan estar contiguos físicamente o localizados en íntima proximidad a las secuencias codificantes cuya transcripción intensifican.

El término "casete de expresión" según se utiliza en la presente memoria hace referencia a una secuencia de nucleótidos que es capaz de afectar a la expresión de un gen estructural (es decir, una secuencia de proteínas 60 codificante, tal como una xilanasa de la invención) en un anfitrión compatible con tales secuencias. Los casetes de expresión incluyen al menos un promotor conectado operablemente con la secuencia codificante del polipéptido; y, opcionalmente, con otras secuencias, p. ej., señales de terminación de la transcripción. También se pueden utilizar factores necesarios o útiles para efectuar la expresión, p. ej., intensificadores. De este modo, los casetes de

expresión también incluyen plásmidos, vectores de expresión, virus recombinantes, cualquier forma de vector de "ADN desnudo" recombinante, y similares. Un "vector" comprende un ácido nucleico que puede infectar, transfectar, transducir transitoriamente o permanentemente una célula. Se advertirá que un vector puede ser un ácido nucleico desnudo, o un ácido nucleico que forma complejo con proteínas o lípidos. El vector comprende opcionalmente ácidos nucleicos y/o proteínas, y/o membranas virales o bacterianas (p. ej., una membrana celular, una envoltura 5 lipídica viral, etc.). Los vectores incluyen, pero no están limitados a replicones (p. ej., replicones de ARN, bacteriófagos) a los que se pueden anclar los fragmentos de ADN y replicarlos. Los vectores incluyen así, pero no están limitados a ARN, ADN o ARN circulares o lineales autoreplicantes autónomos (p. ej., plásmidos, virus, y similares, véase, p. ej., la Patente de los Estados Unidos Núm. 5.217.879), e incluyen plásmidos con expresión y sin expresión. Cuando se describe que un microorganismo recombinante o cultivo celular alberga un "vector de 10 expresión" esto incluye tanto ADN circular y linear extracromosómico como ADN que ha sido incorporado al cromosoma o a los cromosomas del anfitrión. Cuando un vector está siendo mantenido por una célula anfitriona, el vector puede ser replicado establemente por las células durante la mitosis en forma de una estructura autónoma, o es incorporado al genoma de anfitrión.

Según se utiliza en la presente memoria, el término "promotor" incluye todas las secuencias capaces de dirigir la transcripción de una secuencia codificante en una célula, p. ej., una célula vegetal. De este modo, los promotores utilizados en los constructos de la invención incluyen elementos de control de la transcripción que actúan en cis y secuencias reguladoras que están implicadas en la regulación o la modulación de la duración y/o la velocidad de la transcripción de un gen. Por ejemplo, un promotor puede ser un elemento de control de la transcripción que actúa en 20 cis, incluyendo un intensificador, un promotor, un terminador de la transcripción, un origen de replicación, una secuencia de integración cromosómica, regiones no traducidas 5' y 3', o una secuencia intrónica, que están implicados en la regulación de la transcripción. Estas secuencias que actúan en cis interactúan típicamente con proteínas u otras biomoléculas para llevar a cabo (activar/desactivar, regular, modular, etc.) la transcripción. Los promotores "constitutivos" son aquellos que dirigen la expresión continuamente en la mayoría de las condiciones 25 ambientales y estados de desarrollo o diferenciación celular. Los promotores "inducibles" o "regulables" dirigen la expresión del ácido nucleico de la invención bajo la influencia de las condiciones ambientales o condiciones de desarrollo. Los ejemplos de las condiciones ambientales que puede afectar a la transcripción por promotores inducibles incluyen condiciones anaeróbicas, temperatura elevada, sequía, o la presencia de luz.

Los promotores "específicos de tejido" son elementos de control de la transcripción que únicamente son activos en células o tejidos o órganos concretos, p. ej., en plantas o animales. La regulación específica del tejido se puede lograr por medio de ciertos factores intrínsecos que aseguran que los genes que codifican proteínas específicas para un tejido dado se expresen. Se sabe que tales factores existen en mamíferos y plantas de manera que permiten que se desarrollen tejidos específicos. 35

El término "planta" incluye plantas completas, partes de plantas (p. ej., hojas, tallos, flores, raíces, etc.), protoplastos vegetales, semillas y células vegetales y sus progenies. La clase de plantas que se pueden utilizar en el método de la invención es generalmente tan amplio como la clase de plantas superiores susceptibles de técnicas de transformación, incluyendo angiospermas (plantas monocotiledóneas y dicotiledóneas), así como gimnospermas. 40 Ésta incluye plantas de una variedad de niveles de ploidía, incluyendo los estados poliploide, diploide, haploide y hemizigoto. Según se utiliza en la presente memoria, el término "planta transgénica" incluye plantas o células vegetales en las que se ha insertado una secuencia de ácido nucleico heteróloga, p. ej., los ácidos nucleicos y diversos constructos recombinantes (p. ej., casetes de expresión) de la invención.

Los "plásmidos" pueden ser asequibles comercialmente, accesibles al público en una base no restringida, o se pueden construir a partir de plásmidos asequibles de acuerdo con procedimientos publicados. Plásmidos equivalentes a los descritos en la presente memoria son conocidos en la técnica y resultarán evidentes para los expertos normales en la técnica.

"Aminoácido" o "secuencia de aminoácidos" según se utilizan en la presente memoria hacen referencia a un oligopéptido, péptido, polipéptido, o secuencia de proteínas, o a un fragmento, porción, o subunidad de cualquiera de estos y a moléculas de origen natural o sintéticas.

"Aminoácido" o "secuencia de aminoácidos" incluyen un oligopéptido, péptido, polipéptido, o secuencia de proteínas, 55 o a un fragmento, porción, o subunidad de cualquiera de éstos, y a moléculas de origen natural o sintéticas. El término "polipéptido" según se utiliza de la presente memoria, hace referencia a aminoácidos unidos entre sí por enlaces peptídicos o enlaces peptídicos modificados, es decir, isoésteres peptídicos y pueden contener aminoácidos modificados distintos de los 20 aminoácidos codificados por genes. Los polipéptidos se pueden modificar por medio de procedimientos naturales, tales como procesamiento post-traduccional, o mediante técnicas de modificación 60 química que son bien conocidos en la técnica. Las modificaciones se pueden producir en cualquier parte del polipéptido, incluyendo el esqueleto peptídico, las cadenas laterales de aminoácidos y los extremos amino o carboxilo. Se apreciará que puede estar presente el mismo tipo de modificación en el mismo grado o en grados variables en diferentes sitios en un polipéptido dado. Asimismo un polipéptido dado puede tener muchos tipos de

modificaciones. Las modificaciones incluyen acetilación, acilación, ribosilación de ADP, amidación, unión covalente de flavina, unión covalente de un radical hemo, unión covalente de un nucleótido o derivado de nucleótido, unión covalente de un lípido o derivado de lípido, unión covalente de un fosfatidilinositol, ciclación de entrecruzamiento, formación de enlace disulfuro, desmetilación, formación de entrecruzamientos covalentes, formación de cisteína, formación de piroglutamato, formilación, gamma-carboxilación, glicosilación, formación del ancla de GPI, 5 hidroxilación, yodación, metilación, miristoilación, oxidación, pegilación, procesamiento de xilano hidrolasa, fosforilación, prenilación, racemización, selenoilación, sulfatación y adición mediada por ARN de transferencia de aminoácidos a proteínas por ejemplo arginilación. (Véanse Creighton, T.E., Proteins - Structure and Molecular Properties 2a Ed., W.H. Freeman y Company, New York (1993); Posttraductional Covalent Modification of Proteins, B.C. Johnson, Ed., Academic Press, New York, págs. 1-12 (1983)). Los péptidos y polipéptidos de la invención 10 también incluyen todas las formas "miméticas" y "peptidomiméticas", como se describe con más detalle, más abajo.

Según se utiliza en la presente memoria, el término "aislado" significa que el material es separado de su entorno original (p. ej., el entorno natural si es de origen natural). Por ejemplo, polinucleótido o polipéptido de origen natural presente en un animal vivo no está aislado, pero el mismo polinucleótido o polipéptido, separado de alguno o de 15 todos los materiales coexistentes en el sistema natural, está aislado. Tales polinucleótidos podían ser parte de un vector y/o tales polinucleótidos o polipéptidos podían ser parte de una composición y todavía estar aislados ya que tal vector o composición no es parte de su entorno natural. Según se utiliza en la presente memoria, el término "purificado" no requiere pureza absoluta; más bien, se pretende que sea una definición relativa. Los ácidos nucleicos individuales obtenidos de una biblioteca se han purificado convencionalmente hasta la homogeneidad 20 electroforética. Las secuencias obtenidas de uno de estos clones no se pudieron obtener directamente a partir de la biblioteca o a partir del ADN humano total. Los ácidos nucleicos purificados de la invención han sido purificados a partir del resto del ADN genómico en el organismo en al menos 104-106 veces. Sin embargo, el término "purificado" también incluye ácidos nucleicos que han sido purificados a partir del resto del ADN genómico o a partir de otras secuencias en una biblioteca u otro entorno en al menos un orden de magnitud, típicamente dos o tres órdenes y 25 más típicamente cuatro o cinco órdenes de magnitud.

Según se utiliza en la presente memoria, el término "recombinante" significa que el ácido nucleico es adyacente a un "esqueleto" del ácido nucleico al que no es adyacente en su entorno natural. Adicionalmente, para estar "enriquecidos" los ácidos nucleicos representarán 5% o más del número de insertos de ácido nucleico en una 30 población de moléculas troncales de ácido nucleico. Las moléculas troncales de acuerdo con la invención incluyen ácidos nucleicos tales como vectores de expresión, ácidos nucleicos autoreplicantes, virus, ácidos nucleicos integrantes y otros vectores o ácidos nucleicos utilizados para mantener o manipular un inserto de ácido nucleico de interés. Típicamente, los ácidos nucleicos enriquecidos representan 15% o más del número de insertos de ácido nucleico en la población de moléculas troncales recombinantes. Más típicamente, los ácidos nucleicos enriquecidos 35 representan 50% o más del número de insertos de ácido nucleico en la población de moléculas troncales recombinantes. En un aspecto, los ácidos nucleicos enriquecidos representan 90% o más del número de insertos de ácido nucleico en la población de moléculas troncales recombinantes.

Los polipéptidos o proteínas "recombinantes" hacen referencia a polipéptidos o proteínas producidos mediante 40 técnicas de ADN recombinante; es decir, producidos a partir de células transformadas por un constructo de ADN exógeno que codifica el polipéptido o proteína deseados. Los polipéptidos o proteínas "sintéticos" son aquellos preparados por medio de síntesis química. Los métodos de síntesis peptídica química en fase sólida también se pueden utilizar para sintetizar el polipéptido o fragmentos de la invención. Tal método se conoce en la técnica desde los comienzos de 1960 (Merrifield, R. B., J. Am. Chem. Soc., 85:2149-2154, 1963) (Véase también Stewart, J. M. y 45 Young, J. D., Solid Phase Peptide Synthesis, 2a Ed., Pierce Chemical Co., Rockford, Ill., págs. 11-12)) y ha sido empleado recientemente en kits de diseño y síntesis peptídica de laboratorio asequibles comercialmente (Cambridge Research Biochemicals). Tales kits de laboratorio asequibles comercialmente han utilizado generalmente las enseñanzas de H. M. Geysen et al, Proc. Natl. Acad. Sci., USA, 81:3998 (1984) y proporcionan la síntesis de péptidos sobre las puntas de una multitud de "varillas" o "clavijas" todas las cuales están conectadas a una sola 50 placa. Cuando se utiliza tal sistema, una placa de varillas o clavijas se invierte y se inserta en una segunda placa de pocillos o reservorios correspondientes, que contienen soluciones para la unión o el anclaje de un aminoácido apropiado a las puntas de las clavijas o varillas. Repitiendo tal etapa procedimiental, es decir, invirtiendo e insertando las puntas de las varillas y clavijas en las soluciones apropiadas, los aminoácidos se arman para dar los péptidos deseados. Además, están disponibles varios sistemas de síntesis peptídica FMOC asequible. Por ejemplo, 55 el ensamblaje de un polipéptido o fragmento se puede llevar a cabo sobre un soporte sólido utilizando un sintetizador peptídico automático Applied Biosystems, Inc. Modelo 431A. Tal equipo proporciona acceso fácil a los péptidos de la invención, mediante síntesis directa o mediante síntesis de una serie de fragmentos que se pueden acoplar utilizando otras técnicas conocidas.

Una secuencia promotora está "conectada operablemente a" una secuencia codificante cuando la ARN polimerasa que inicia la transcripción hacia el promotor transcribirá la secuencia codificante a ARNm.

Los "plásmidos" se nombran por una "p" minúscula precedida y/o seguida de letras mayúsculas y/o números. Los plásmidos de partida en la presente memoria son asequibles comercialmente, accesibles al público en una base no restringida, o pueden ser construidos a partir de plásmidos disponibles de acuerdo con procedimientos publicados. Además, los plásmidos equivalentes a los descritos en la presente memoria son conocidos en la técnica y resultarán evidentes para los expertos normales en la técnica. 5

"Digestión" de ADN hace referencia a la escisión catalítica del ADN con una enzima de restricción que actúa únicamente en ciertas secuencias en el ADN. Las diversas enzimas de restricción utilizadas en la presente memoria están disponibles en el mercado y sus condiciones de reacción, cofactores y otros requerimientos se utilizarían como conocen los expertos normales en la técnica. Con fines analíticos, típicamente se utiliza 1 µg de plásmido o 10 fragmento de ADN con alrededor de 2 unidades de enzima en alrededor de 20 µl de solución tampón. Con el fin de aislar fragmentos de ADN para la construcción del plásmido, e digieren típicamente de 5 a 50 µg de ADN con 20 a 250 unidades de enzima en un gran volumen. Los tampones y las cantidades de sustrato apropiados para las enzimas de restricción concretas son especificados por el fabricante. Normalmente se utilizan tiempos de incubación de alrededor de 1 hora a 37°C, pero pueden variar de acuerdo con las instrucciones del fabricante. Después de la 15 digestión, se puede realizar la electroforesis en gel para aislar el fragmento deseado.

La frase "sustancialmente idéntico" en el contexto de dos ácidos nucleicos o polipéptidos, hace referencia a dos o más secuencias que tienen, p. ej., al menos alrededor de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 20 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, o más identidad de nucleótidos o residuos de aminoácidos (secuencia), cuando se comparan y alinean para una correspondencia máxima, según se mide utilizando uno de los algoritmo de comparación de secuencias conocidos o mediante inspección visual. Típicamente, existe identidad sustancial a lo largo de una región de al menos alrededor de 100 residuos y muy comúnmente las secuencias son sustancialmente idénticas a lo largo de al menos alrededor 25 de 150-200 residuos. En algunos aspectos, las secuencias son sustancialmente idénticas a lo largo de la longitud completa de las regiones codificantes.

Adicionalmente una secuencia de aminoácidos "sustancialmente idéntica" es una secuencia que difiere de una secuencia de referencia en una o más sustituciones, deleciones, o inserciones de aminoácidos conservativas o no 30 conservativas, particularmente cuando tal sustitución se produce en un sitio que no es el sitio activo de la molécula y siempre que el polipéptido conserve esencialmente sus propiedades funcionales. Una sustitución de aminoácido conservativa, por ejemplo, sustituye un aminoácido por otro de la misma clase (p. ej., sustitución de un aminoácido hidrófobo, tal como isoleucina, valina, leucina, o metionina, por otro, o sustitución de un aminoácido polar por otro, tal como la sustitución de arginina por lisina, ácido glutámico por ácido aspártico o glutamina por asparragina). Se 35 pueden suprimir uno o más aminoácidos, por ejemplo, de un polipéptido de xilanasa, dando como resultado la modificación de la estructura del polipéptido, sin alterar significativamente su actividad biológica. Por ejemplo, los aminoácidos amino- o carboxilo terminales que no son requeridos para la actividad biológica de la xilanasa se pueden eliminar. Las secuencias de polipéptidos modificadas de la invención se pueden someter a ensayo para determinar la actividad biológica de la xilanasa mediante cualquier número de métodos, incluyendo poner en 40 contacto la secuencia de polipéptidos modificada con un sustrato de xilanasa y determinar si el polipéptido modificado disminuye la cantidad de sustrato específico en el análisis o aumenta los bioproductos de la reacción enzimática de un polipéptido de xilanasa funcional con el sustrato.

Los "fragmentos" según se utiliza en la presente memoria son una porción de una proteína de origen natural que 45 puede existir en al menos dos conformaciones diferentes. Los fragmentos pueden tener la misma o sustancialmente la misma secuencia de aminoácidos que la proteína de origen natural. "Sustancialmente la misma" significa que una secuencia de aminoácidos en su mayo parte, pero no completamente, la misma, pero conserva al menos una actividad funcional de la secuencia con la que está relacionada. En general dos secuencias de aminoácidos son "sustancialmente las mismas" o "sustancialmente homólogas" si son idénticas en al menos alrededor de 85%. 50 También están incluidos los fragmentos que tienen estructuras tridimensionales diferentes a la de la proteína de origen natural. Un ejemplo de esto, es una molécula "pro-forma", tal como una proproteína de baja actividad que se puede modificar mediante escisión para producir una enzima madura con una actividad significativamente mayor.

"Hibridación" hace referencia al procedimiento mediante el cual una hebra de ácido nucleico se une a una hebra 55 complementaria a través de emparejamiento de bases. Las reacciones de hibridación pueden ser sensibles y selectivas de manera que una secuencia de interés concreta se puede identificar incluso en muestras en las que está presente a bajas concentraciones. Las condiciones adecuadamente restrictivas pueden estar definidas, por ejemplo, por las concentraciones de sal o formamida en las soluciones de prehibridación e hibridación, o por la temperatura de hibridación y son bien conocidas en la técnica. En particular, la restricción se puede incrementar 60 reduciendo la concentración de sal, incrementando la concentración de formamida, o subiendo la temperatura de hibridación. En aspectos alternativos, los ácidos nucleicos de la invención se definen por su capacidad de hibridar en diversas condiciones restrictivas (p. ej., altas, medias, y bajas), como se muestra en la presente memoria.

Por ejemplo, la hibridación en condiciones altamente restrictivas se podría producir en formamida a alrededor de 50% a alrededor de 37°C a 42°C. La hibridación se podría producir en condiciones poco restrictivas en formamida de alrededor de 35% a 25% a alrededor de 30°C a 35°C. En particular, hibridación se podría producir en condiciones altamente restrictivas a 42°C en formamida al 50%, 5X SSPE, SDS al 0,3% y 200 n/ml de ADN de esperma de salmón desnaturalizado y sometido a cizalla. La hibridación se podría producir condiciones poco restrictivas como se 5 ha descrito anteriormente, pero en formamida al 35% a una temperatura reducida de 35°C. El intervalo de temperatura correspondiente a un nivel de restricción concreto se puede estrechar adicionalmente calculando la proporción de purina a pirimidina del ácido nucleico de interés y ajustando en consecuencia la temperatura. Las variaciones de los intervalos y condiciones anteriores son bien conocidas en la técnica.

El término "variante" hace referencia a polinucleótidos o polipéptidos de la invención modificados en uno o más pares de bases, codones, intrones, exones, o residuos de aminoácidos (respectivamente) conservando aún la actividad biológica de una xilanasa de la invención. Las variantes se pueden producir por cualquier número de medios incluyendo métodos tales como, por ejemplo, PCR propensa a error, barajado, mutagénesis dirigida a oligonucleótidos, PCR de ensamblaje, mutagénesis por PCR sexual, mutagénesis in vivo, mutagenésis por inserción 15 de casetes, mutagenésis de ensamblaje recursivo, mutagenésis de conjunto exponencial, mutagénesis de sitio específico, reensamblaje de genes (p. ej., GeneReassembly™, véase, p. ej., la Patente de los Estados Unidos Núm. 6.537.776), GSSM™ y cualquiera de sus combinaciones.

La Tabla 1 y la Tabla 2 enumera las variantes obtenidas mutando el SEQ ID NO: 189 (que codifica el SEQ ID NO: 20 190) mediante GSSM™.

Estas variantes GSSM™ (mostradas en las Tablas 1 y 2) se sometieron a ensayo para determinar la tolerancia térmica (véanse los Ejemplos, más abajo). Se encontró que los mutantes D, F, G, H, I, J, K, S, T, U, V, W, X, Y, Z, AA, DD y EE tenían la mayor tolerancia térmica entre los mutantes de la Tabla 1. Los mutantes también se pueden 25 combinar para formar un mutante mayor. Por ejemplo, los mutantes D, F, H, I, S, V, X y AA de la Tabla 1 se combinaron para formar un mutante mayor denominado "8x" con una secuencia como la mostrada en el SEQ ID NO: 375 (ácido nucleico que codifica polipéptido) y el SEQ ID NO: 376 (secuencia de aminoácidos). La Figura 5 es un gráfico que compara la actividad de la secuencia de tipo salvaje (SEQ ID NOS: 189 y 190) con el mutante 8x (SEQ ID NOS: 259 y 260). Al comparar el tipo salvaje y el mutante 8x, se descubrió que la temperatura óptima para ambos 30 era de 65°C y que el pH óptimo para ambos era de 5,5. Se encontró que la secuencia de tipo salvaje mantenía su estabilidad durante menos de 1 minuto a 65°C, mientras que se encontró que el mutante 8x (SEQ ID NOS: 375, 376) mantenía su estabilidad durante más de 10 minutos a 85°C. El sustrato utilizado fue AZO-AZO-xilano. En un aspecto, el mutante 8x (SEQ ID NOS: 375, 376) se desarrolló mediante GSSM™. En otro aspecto, el tipo salvaje es un progenitor de GSSM™ para la evolución de la tolerancia térmica. 35

Tabla 1

Mutante: Mutación Sec. de Tipo salvaje Sec. GSSM™

A: A2F GCC TTT

B: A2D GCC GAC

C: A5H GCT CAC

D: D8F GAC TTC

E: Q11L CAA CTC

F: Q11H CAA CAC

G: N12L AAT TTG

H: N12L AAT TTG

I: G171 GGT ATA

J: Q11H, T23T CAA, ACC CAT, ACG

K: Q11H CAA CAT

L: S26P TCT CCG

M: S26P TCT CCA

N: S35F TCA TTT

O: Sin Cambio GTT GTA

Mutante: Mutación Sec. de Tipo salvaje Sec. GSSM™

P: A51 P GCA CCG

Q: A51P GCA CCG

R: G60R GGA CGC

S: G60H GGA CAC

T: G60H GGA CAC

U: P64C CCG TGT

V: P64V CCG GTA

W: P64V CCG GTT

X: S65V TCC GTG

Y: Q11H CAA CAT

Z: G68I GGA ATA

AA: G68A GGA GCT

BB: A71G GCT GGA

CC: Sin Cambio AAT AAC

DD: S79P TCA CCA

EE: S79P TCA CCC

FF: T95S ACT TCT

GG: Y98P TAT CCG

HH: T114S ACT AGC

II: Sin Cambio AAC AAC

JJ: Sin Cambio AGG AGA

KK: I142L ATT CTG

LL: S151I AGC ATC

MM: S138T, S151A TCG, AGC ACG, GCG

NN: K158R AAG CGG

OO: K160V, V1721 AAA, GTA GTT, ATA

Se destacan las variantes codónicas como se muestra en la Tabla 2 que produjeron variantes (del SEQ ID NO: 189) como la mejor variación o "mejora" sobre el "tipo salvaje" (SEQ ID NO: 189) en tolerancia térmica.

Tabla 2

En un aspecto la secuencia de aminoácidos de una secuencia de aminoácidos (SEQ ID NO: 208) de las secuencias 5 de aminoácidos del Grupo B se modifica mediante una mutación de un solo aminoácido. En un aspecto específico, esa mutación es una mutación de asparragina a ácido aspártico. La secuencia de aminoácidos resultante y la secuencia de ácido nucleico correspondiente se muestran como el SEQ ID NO: 252 y el SEQ ID NO: 251, respectivamente. Se han mostrado en la técnica mutaciones de un solo aminoácido con una mejora en el pH óptimo de la enzima, tal como la mutación del SEQ ID NO: 208, con respecto a las xilanasas. (Véase, por ejemplo, Joshi, 10 M., Sidhu, G., Pot, I., Brayer, G., Withers, S., McIntosh, L., J. Mol. Bio. 299, 255-279 (2000).) También se observa que en tales mutaciones de un solo aminoácido, se pueden eliminar porciones de las secuencias en el procedimiento de subclonación. Por ejemplo, el SEQ ID NO: 207 y el SEQ ID NO: 251 difieren en solo un nucleótido, a lo largo de la zona en la que se alinean las secuencias. Sin embargo, se observa que se eliminó una zona de 78 nucleótido en el extremo N del SEQ ID NO: 207 del extremo N del SEQ ID NO: 251 en la subclonación. 15 Adicionalmente, los tres primeros nucleótidos en el SEQ ID NO: 251 se cambiaron a ATG y a continuación se realizó la mutación puntual en el sexto nucleótido en el SEQ ID NO: 251.

El término "mutagénesis por saturación", "mutagénesis por saturación de sitio de genes" o "GSSM™" incluye un método que utiliza cebadores oligonucleotídicos degenerados para introducir mutaciones puntuales en un 20 polinucleótido, como se describe en detalle, más abajo.

El término "sistema de evolución dirigida optimizada" o "evolución dirigida optimizada" incluye un método para reensamblar fragmentos de secuencias de ácido nucleico relacionadas, p. ej., genes relacionados, y se explica en detalle, más abajo.

El término "reensamblaje de ligación sintética" o "SLR" incluye un método para ligar fragmentos de oligonucleótidos 5 de un modo no estocástico, y se explica en detalle, más abajo.

Generación y Manipulación de Ácidos Nucleicos

La invención proporciona ácidos nucleicos con una identidad de al menos 90% con el SEQ ID NO: 159; con ácidos 10 nucleicos que codifican polipéptidos con secuencias de aminoácidos con una identidad de al menos 90% con el SEQ ID NO: 160, incluyendo casetes de expresión tales como vectores de expresión, que codifican los polipéptidos de la invención. La invención también incluye métodos para descubrir nuevas secuencias de xilanasa utilizando los ácidos nucleicos de la invención. La invención también incluye métodos para inhibir la expresión de genes de xilanasa, transcritos y polipéptidos utilizando los ácidos nucleicos de la invención. 15

Los ácidos nucleicos de la invención se pueden elaborar, aislar y/o manipular, p. ej., mediante clonación y expresión de bibliotecas de ADNc, amplificación de mensaje o ADN genómico mediante PCR, y similares. Por ejemplo, las siguientes secuencias ilustrativas de la invención se obtuvieron inicialmente de las siguientes fuentes:

Tabla 3

SEQ ID: FUENTE

1, 2: Bacteria

101, 102: Ambiental

103, 104: Bacteria

105, 106: Ambiental

107, 108: Bacteria

109, 110: Ambiental

11, 12: Ambiental

111, 112: Ambiental

113, 114: Ambiental

115, 116: Ambiental

117, 118: Ambiental

119, 120: Ambiental

121, 122: Ambiental

123, 124: Ambiental

125, 126: Ambiental

127, 128: Ambiental

129, 130: Bacteria

13, 14: Ambiental

131, 132: Ambiental

133, 134: Ambiental

135, 136: Ambiental

137, 138: Ambiental

139, 140: Ambiental

141, 142: Ambiental

143, 144: Bacteria

145, 146: Eucariota

SEQ ID: FUENTE

147, 148: Ambiental

149, 150: Ambiental

15, 16: Ambiental

151, 152: Ambiental

153, 154: Ambiental

155, 156: Ambiental

157, 158: Ambiental

159, 160: Ambiental

161, 162: Ambiental

163, 164: Ambiental

165, 166: Ambiental

167, 168: Ambiental

169, 170: Ambiental

17, 18: Bacteria

171, 172: Ambiental

173, 174: Ambiental

175, 176: Ambiental

177, 178: Ambiental

179, 180: Ambiental

181, 182: Ambiental

183, 184: Ambiental

185, 186: Ambiental

187, 188: Ambiental

189, 190: Ambiental

19,20: Ambiental

191, 192: Ambiental

193, 194: Ambiental

195, 196: Ambiental

197, 198: Ambiental

199, 200: Ambiental

201, 202: Ambiental

203,204: Ambiental

205, 206: Ambiental

207, 208: Ambiental

209, 210: Ambiental

21, 22: Ambiental

211, 212: Ambiental

213,214: Ambiental

215,216: Ambiental

SEQ ID: FUENTE

217, 218: Ambiental

219, 220: Ambiental

221, 222: Ambiental

223,224: Ambiental

225, 226: Ambiental

227,228: Ambiental

229,230: Ambiental

23, 24: Ambiental

231,232: Bacteria

233, 234: Ambiental

235, 236: Ambiental

237,238: Ambiental

239,240: Ambiental

241, 242: Ambiental

243,244: Ambiental

245,246: Ambiental

247,248: Ambiental

249,250: Ambiental

25,26: Ambiental

251, 252: Ambiental

253,254: Ambiental

255, 256: Ambiental

257,258: Ambiental

259,260: Ambiental

261, 262: Ambiental

263,264: Ambiental

265,266: Ambiental

267, 268: Bacteria

269, 270: Ambiental

27, 28: Ambiental

271,272: Ambiental

273,274: Ambiental

275,276: Ambiental

277, 278: Ambiental

279,280: Ambiental

281, 282: Ambiental

283, 284: Ambiental

285,286: Ambiental

287, 288: Ambiental

SEQ ID: FUENTE

289, 290: Ambiental

29,30: Archaea

291,292: Ambiental

293, 294: Ambiental

295, 296: Ambiental

297, 298: Ambiental

299, 300: Ambiental

3, 4: Ambiental

301,302: Ambiental

303, 304: Ambiental

305, 306: Bacteria

307,308: Ambiental

309, 310: Ambiental

31, 32: Ambiental

311, 312: Ambiental

313,314: Bacteria

315,316: Ambiental

317, 318: Ambiental

319,320: Ambiental

321,322: Ambiental

323, 324: Ambiental

325, 326: Ambiental

327, 328: Ambiental

329, 330: Ambiental

33, 34: Ambiental

331,332: Ambiental

333, 334: Ambiental

335, 336: Ambiental

337, 338: Ambiental

339, 340: Ambiental

341, 342: Ambiental

343, 344: Ambiental

345,346: Ambiental

347,348: Ambiental

349, 350: Ambiental

35, 36: Ambiental

351, 352: Ambiental

353, 354: Ambiental

355, 356: Ambiental

SEQ ID: FUENTE

357, 358: Ambiental

359, 360: Ambiental

361, 362: Ambiental

363, 364: Ambiental

365, 366: Ambiental

367,368: Ambiental

369,370: Ambiental

37,38: Ambiental

371, 372: Ambiental

373,374: Ambiental

375,376: Artificial

377,378: Artificial

39,40: Ambiental

41, 42: Ambiental

43,44: Ambiental

45, 46: Ambiental

47,48: Ambiental

49, 50: Ambiental

5,6: Ambiental

51, 52: Ambiental

53, 54: Bacteria

55, 56: Ambiental

57,58: Ambiental

59,60: Ambiental

61, 62: Ambiental

63,64: Ambiental

65,66: Ambiental

67, 68: Ambiental

69, 70: Ambiental

7, 8: Ambiental

71, 72: Ambiental

73, 74: Ambiental

75, 76: Ambiental

77, 78: Ambiental

79,80: Ambiental

81, 82: Ambiental

83,84: Ambiental

85, 86: Bacteria

87,88: Ambiental

SEQ ID: FUENTE

89,90: Bacteria

9, 10: Ambiental

91, 92: Ambiental

93, 94: Ambiental

95,96: Ambiental

97,98: Ambiental

99, 100: Ambiental

Al poner en práctica los métodos de la invención, los genes homólogos se puede modificar mediante manipulación de un ácido nucleico molde, como se describe en la presente memoria. La invención se puede poner en práctica junto con cualquier método o protocolo o dispositivo conocido en la técnica, que son bien descritos en la bibliografía científica y de patentes. 5

Un aspecto de la invención es un ácido nucleico aislado que comprende una de las secuencias de las secuencias de ácido nucleico del Grupo A: SEQ ID NO: 159 y secuencias esencialmente idénticas a éstas, las secuencias complementarias a éstas, o un fragmento que comprende al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, o 500 bases consecutivas de dicha secuencia del Grupo A (o las secuencias complementarias a éstas). 10 Los ácidos nucleicos, aislados pueden comprender ADN, incluyendo ADNc, ADN genómico y ADN sintético. El ADN puede ser bicatenario o monocatenario y si es monocatenario puede ser la cadena codificante o la cadena no codificante (anti-sentido). Alternativamente, los ácidos nucleicos aislados pueden comprender ARN.

Como se comenta con más detalle más abajo, los ácidos nucleicos aislados de una de las secuencias de ácido 15 nucleico del Grupo A y secuencias esencialmente idénticas a éstas, se pueden utilizar para preparar uno de los polipéptidos de una secuencia de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de uno de los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas. 20

Por lo tanto, otro aspecto de la invención es un ácido nucleico aislado que codifica uno de los polipéptidos de las secuencias de aminoácidos del Grupo B: SEQ ID NO: 160 y secuencias esencialmente idénticas a éstas, o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de dicho polipéptido del Grupo B. Las secuencias codificantes de estos ácidos nucleicos pueden ser idénticas a las de 25 la secuencia de ácido nucleico del Grupo A, o uno de sus fragmentos o pueden ser secuencias codificantes diferentes que codifican dicho polipéptido del Grupo B, secuencias esencialmente idénticas a éstas y fragmentos que tienen al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de dicha secuencia de aminoácidos del Grupo B, como resultado de la redundancia o la degeneración del código genético. El código genético es bien conocido por los expertos en la técnica y se puede obtener, por ejemplo, en la página 214 de B. 30 Lewin, Genes VI, Oxford University Press, 1997.

El ácido nucleico aislado que codifica uno de los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, puede incluir, pero no está limitado a: solo la secuencia codificante de una de las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas y secuencias 35 codificantes adicionales, tales como secuencias líder o secuencias de proproteínas y secuencias no codificantes, tales como intrones o secuencias no codificantes 5' y/o 3' de la secuencia codificante. De este modo, según se utiliza de la presente memoria, el término "polinucleótido que codifica un polipéptido" abarca un polinucleótido que incluye solo la secuencia codificante para el polipéptido así como un polinucleótido que incluye una secuencia codificante y/o secuencia no codificante. 40

Alternativamente, las secuencias de ácido nucleico de las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, se pueden mutagenizar utilizando técnicas convencionales, tales como mutagénesis dirigida al sitio, u otras técnicas familiares para los expertos en la técnica, para introducir cambios silenciosos en los polinucleótidos de las secuencias de ácido nucleico del Grupo A y secuencias esencialmente 45 idénticas a éstas. Según se utiliza en la presente memoria, los "cambios silenciosos" incluyen, por ejemplo, cambios que no alteran la secuencia de aminoácidos codificada por el polinucleótido. Tales cambios pueden ser deseables con el fin de incrementar el nivel del polipéptido producido por las células anfitrionas que contienen un vector que codifica el polipéptido mediante la introducción de codones o pares de codones que aparecen frecuentemente en el organismo anfitrión. 50

Los polinucleótidos pueden tener cambios de nucleótido que dan como resultado sustituciones, adiciones, deleciones, fusiones y truncamientos de aminoácido en los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas. Tales cambios de nucleótido se puede introducir utilizando técnicas tales como mutagénesis dirigida al sitio, mutagénesis química al azar, deleción mediante exonucleasa III y otras técnicas de ADN recombinante. Alternativamente, tales cambios de nucleótido pueden ser variantes alélicas de 5 origen natural que son aisladas identificando los ácidos nucleicos que hibridan específicamente con sondas que comprenden al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, o 500 bases consecutivas de una de las secuencias de las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas (o las secuencias complementarias a éstas) en condiciones de restricción alta, moderada, o baja como se proporciona en la presente memoria. 10

Técnicas Generales

Los ácidos nucleicos utilizados para poner en práctica esta invención, ya sean ARN, ARNi, ácido nucleico antisentido, ADNc, ADN genómico, vectores, virus o híbridos de los mismos, se pueden aislar de una variedad de 15 fuentes, construir mediante ingeniería genética, amplificar, y/o expresar/generar recombinantemente. Los polipéptidos recombinantes (p. ej., xilanasas) generados a partir de estos ácidos nucleicos se pueden aislar o clonar individualmente y someter a ensayo para determinar una actividad deseada. Se puede utilizar cualquier sistema de expresión recombinante, incluyendo sistemas de expresión bacterianos, de mamíferos, de levadura, de insecto o de células vegetales. 20

Alternativamente, estos ácidos nucleicos se pueden sintetizar in vitro por medio de técnica de síntesis química bien conocidas, como describen, p. ej.,Adams (1983) J. Am. Chem. Soc. 105:661; Belousov (1997) Nucleic Acids Res. 25:3440-3444; Frenkel (1995) Free Radic. Biol. Med. 19:373-380; Blommers (1994) Biochemistry 33:7886-7896; Narang (1979) Meth. Enzymol. 68:90; Brown (1979) Meth. Enzymol. 68:109; Beaucage (1981) Tetra. Lett. 22:1859; 25 Patente de los Estados Unidos Núm. 4.458.066.

Las técnicas para la manipulación de ácidos nucleicos, tales como, p. ej., subclonación, sondas de marcaje (p. ej., marcaje del cebador al azar utilizando polimerasa de Klenow, translación de muescas, amplificación), secuenciación, hibridación y similares están bien descritas en la bibliografía científica y de patentes, véase, p. ej., Sambrook, ed., 30 MOLECULAR CLONING: A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Ausubel, ed. John Wiley & Sons, Inc., New York (1997); LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES, Part I. Theory y Nucleic Acid Preparation, Tijssen, ed. Elsevier, N.Y. (1993).

Otro medio útil para obtener y manipular los ácidos nucleicos utilizados para poner en práctica los métodos de la invención es la clonación en muestras genómicas, y, si se desea, escrutar y re-clonar los insertos aislados o amplificados en, p. ej., clones genómicos o clones de ADNc. Las fuentes de ácido nucleico utilizadas en los métodos de la invención incluyen bibliotecas genómicas o de ADNc contenidas, p. ej., en cromosomas artificiales de mamífero (MAC), véanse, p. ej., las Patentes de los Estados Unidos Núms. 5.721.118; 6.025.155; cromosomas artificiales 40 humanos, véase, p. ej., Rosenfeld (1997) Nat. Genet. 15:333-335; cromosomas artificiales de levadura (YAC); cromosomas artificiales bacterianos (BAC); cromosomas artificiales P1, véase, p. ej.,Woon (1998) Genomics 50:306-316; vectores derivados de P1 (PAC), véase, p. ej., Kern (1997) Biotechniques 23:120-124; cósmidos, virus recombinantes, fagos o plásmidos.

En un aspecto, un ácido nucleico que codifica un polipéptido de la invención se ensambla en una fase apropiada con una secuencia líder capaz de dirigir secreción del polipéptido traducido o un fragmento del mismo.

La invención proporciona proteínas de fusión y ácidos nucleicos que las codifican. Un polipéptido de la invención se puede fusionar a un péptido o polipéptido heterólogo, tal como péptidos de identificación N-terminal que confieren 50 las características deseadas, tales como aumento de estabilidad o purificación simplificada. Los péptidos y polipéptidos de la invención se pueden sintetizar y expresar también en forma de proteínas de fusión con uno o más dominios adicionales conectados a los mismos para, p. ej., producir un péptido más immunogénico, para aislar más fácilmente un péptido sintetizado recombinantemente, para identificar y aislar anticuerpos y células B que expresan anticuerpos, y similares. Los dominios que facilitan la detección y purificación incluyen, p. ej., péptidos queladores de 55 metal tales como tractos de polihistidina, y módulos de histidina-triptófano que permiten la puriﬁcación en metales inmovilizados, dominios de proteína A que permiten la puriﬁcación en inmunoglobulinas inmovilizadas, y el dominio utilizado el sistema de puriﬁcación extensión/aﬁnidad FLAGS (Immunex Corp, Seattle WA). La inclusión de un conector de secuencias que se puede dividir tal como el Factor Xa o enteroquinasa (Invitrogen, San Diego CA) entre un dominio de puriﬁcación y el péptido que contiene el motivo o el polipéptido para facilitar la puriﬁcación. Por 60 ejemplo, un vector de expresión puede incluir una secuencia de ácidos nucleicos que codiﬁque el epítopo conectado a seis residuos de histidina seguidos por una tioredoxina y un sitio de escisión para la enteroquinasa (ver p.ej., Williams (1995) Biochemistry 34:1787-1797; Dobeli (1998) Protein Expr. Purif. 12:404-14). Los residuos de histidina facilitan la detección y la puriﬁcación mientras que el sitio de escisión de la enteroquinasa proporciona una manera

para puriﬁcar el epítopo del resto de proteínas de fusión. La tecnología relativa a los vectores que codiﬁcan las proteínas de fusión y la aplicación de proteínas de fusión están bien descritas en la bibliografía científica y de patentes, véase p. ej., Kroll (1993) ADN Cell. Biol., 12:441-53.

Secuencias de Control de la Transcripción y la Traducción 5

La invención proporciona secuencias de ácido nucleico (p. ej., ADN) de la invención conectadas operativamente a una o varias secuencias de control de la expresión (p. ej., transcripcional o traduccional), p. ej., promotores o intensificadores, para dirigir o modular la síntesis/expresión del ARN. La secuencia de control de la expresión puede estar en un vector de expresión. Los promotores bacterianos ilustrativos incluyen lacI, lacZ, T3, T7, gpt, lambda PR, 10 PL y trp. Los promotores eucarióticos ilustrativos incluyen temprano inmediato de CMV, timidina quinasa de HSV, temprano y tardío de SV40, LTR de retrovirus, y metalotioneína I de ratón.

Los promotores adecuados para expresar un polipéptido en bacterias incluyen los promotores lac o trp de E. coli, el promotor lacI, el promotor lacZ, el promotor T3, el promotor T7, el promotor gpt, el promotor PR de lambda, el 15 promotor PL de lambda, promotores de operones que codifican enzimas glicolíticas tales como 3-fosfoglicerato quinasa (PGK), y el promotor de la fosfatasa ácida. Los promotores eucarióticos incluyen el promotor temprano inmediato de CMV, el promotor de la timidina quinasa de HSV, promotores de choque térmico, el promotor temprano y tardío de SV40, las LTR de retrovirus, y el promotor de la metalotioneína I de ratón. También se pueden utilizar otros promotores conocidos por controlar la expresión de genes en células procarióticas o eucarióticas o sus virus. 20 Los promotores adecuados para expresar el polipéptido o fragmento del mismo en bacterias incluyen los promotores lac o trp de E. coli, el promotor lacI, el promotor lacZ, el promotor T3, el promotor T7, el promotor gpt, el promotor PR de Lambda, el promotor PL de lambda, promotores de operones que codifican enzimas glicolíticas tales como 3-fosfoglicerato quinasa (PGK) y el promotor de la fosfatas ácida. Los promotores fúngicos incluyen el promotor del factor α. Los promotores eucarióticos incluyen el promotor temprano inmediato de CMV, el promotor de la timidina 25 quinasa de HSV, promotores de choque térmico, el promotor temprano y tardío de SV40, las LTR de retrovirus, y el promotor de la metalotioneína I de ratón. También se pueden utilizar otros promotores conocidos por controlar la expresión de genes en células procarióticas o eucarióticas o sus virus.

Promotores Vegetales Específicos de Tejidos 30

La invención proporciona casetes de expresión que se pueden expresar de una manera específica del tejido, p. ej., que puede expresar una xilanasa de la invención de una manera específica del tejido. La invención también proporciona plantas o semillas que expresan una xilanasa de la invención de una manera específica del tejido. La especificidad del tejido puede ser específico de la semilla, específico del tallo, específico de la hoja, específico de la 35 raíz, específico del fruto y similares.

En un aspecto, se puede utilizar un promotor constitutivo tal como el promotor 35S de CaMV para su expresión en partes específicas de la planta o semilla o en toda la planta. Por ejemplo, para la expresión en exceso, se puede emplear un fragmento de promotor vegetal que dirigirá la expresión de un ácido nucleico en algunos o todos los 40 tejidos de una planta, p. ej., una planta regenerada. Tales promotores son referidos en la presente memoria como promotores "constitutivos" y son activos en la mayoría de las condiciones ambientales y estados de desarrollo o diferenciación celular. Los ejemplos de los promotores constitutivos incluyen la región de iniciación de la transcripción 35S del virus del mosaico de la coliflor (CaMV) 35S, el promotor 1' o 2' derivado de ADN-T de Agrobacterium tumefaciens, y otras regiones de iniciación de la transcripción de diversos genes vegetales conocidos 45 por los expertos en la técnica. Tales genes incluyen, p. ej., ACT11 de Arabidopsis (Huang (1996) Plant Mol. Biol. 33:125-139); Cat3 de Arabidopsis (GenBank No. U43147, Zhong (1996) Mol. Gen. Genet. 251:196-203); el gen codificante de la desaturasa de la proteína portadora de estearoilo-acilo de Brassica napus (Genbank No. X74782, Solocombe (1994) Plant Physiol. 104:1167-1176); GPc1 del maíz (GenBank No. X15596; Martínez (1989) J. Mol. Biol 208:551-565); Gpc2 del maíz (GenBank No. U45855, Manjunath (1997) Plant Mol. Biol. 33:97-112); los 50 promotores vegetales descritos en las Patentes de los Estados Unidos Núms. 4.962.028; 5.633.440.

La invención utiliza promotores específicos de tejido o constitutivos derivados de virus que pueden incluir, p. ej., el promotor subgenómico de tobamovirus (Kumagai (1995) Proc. Natl. Acad. Sci. USA 92:1679-1683; el virus baciliforme tungro del arroz (RTBV), que replica solo en células de floema en plantas de arroz infectadas, con su 55 promotor que dirige la expresión del gen informador específico del floema fuerte; el promotor del virus del mosaico de la nervadura de la yuca (CVMV), con la actividad más alta en los elementos vasculares, en células del mesófilo de las hojas, y en las puntas de las raíces (Verdaguer (1996) Plant Mol. Biol. 31:1129-1139).

Alternativamente, el promotor vegetal puede dirigir la expresión del ácido nucleico que expresa xilanasa en un tejido 60 específico, órgano o tipo celular (es decir promotores específicos de tejido) o puede estar por el contrario bajo un control ambiental o de desarrollo más preciso o bajo el control de un promotor inducible. Los ejemplos de las condiciones ambientales que pueden afectar a la transcripción incluyen condiciones anaeróbicas, temperatura elevada, la presencia de luz, o pulverización con productos químicos/hormonas. Por ejemplo, la invención incorpora

el promotor inducible por sequía del maíz (Busk (1997) supra); el promotor inducible por frío, sequía, y alta concentración de sal de la patata (Kirch (1997) Plant Mol. Biol. 33:897 909).

Los promotores específicos de tejido pueden promover la transcripción solo en un cierto marco temporal del estado de desarrollo de ese tejido. Véase, p. ej., Blázquez (1998) Plant Cell 10:791-800, que caracteriza el promotor del gen 5 LEAFY de Arabidopsis. Véase también Cardon (1997) Plant J 12:367-77, que describe el factor de transcripción SPL3, que reconoce un motivo de secuencia conservado en la región promotora del gen AP1 de identidad del meristemo floral de A. thaliana; y Mandel (1995) Plant Molecular Biology, Vol. 29, págs. 995-1004, que describe el promotor del meristemo eIF4. Se pueden utilizar los promotores específicos de tejidos que son activos a lo largo del ciclo de vida de un tejido concreto. En un aspecto, los ácidos nucleicos de la invención están conectados 10 operablemente a un promotor activo principalmente solo en células de fibra de algodón. En un aspecto, los ácidos nucleicos de la invención están conectados operablemente a un promotor activo principalmente durante las fases de elongación de las células de la fibras de algodón, p. ej., como describe Rinehart (1996) supra. Los ácidos nucleicos pueden estar conectados operablemente al promotor del gen Fb12A para ser expresados preferentemente en células de fibra de algodón (Ídem). Véase también, John (1997) Proc. Natl. Acad. Sci. USA 89:5769-5773; John, et 15 al., Patentes de los Estados Unidos Núms. 5.608.148 y 5.602.321, que describen promotores específicos de fibra de algodón y métodos para la construcción de plantas de algodón transgénicas. También se pueden utilizar promotores específicos de raíces para expresar los ácidos nucleicos de la invención. Los ejemplos de los promotores específicos de raíces incluyen el promotor del gen de la alcohol deshidrogenasa (DeLisle (1990) Int. Rev. Cytol. 123:39-60). Otros promotores que se pueden utilizar para expresar los ácidos nucleicos de la invención incluyen, p. ej., 20 promotores específicos de ovulo, específicos de embrión, específicos de endospermo, específicos de integumento, específicos del revestimiento de la semilla, o alguna de sus combinaciones; un promotor específico de hoja (véase, p. ej., Busk (1997) Plant J. 11:1285 1295, que describe un promotor específico de hoja en el maíz); el promotor ORF13 de Agrobacterium rhizogenes (que muestra alta actividad en raíces, véase, p. ej., Hansen (1997) supra); un promotor específico de polen de maíz (véase, p. ej., Guerrero (1990) Mol. Gen. Genet. 224:161 168); se puede 25 utilizar un promotor de tomate activo durante la maduración del fruto, la senescencia y la abscisión de las hojas y, en menor grado, de las flores (véase, p. ej., Blume (1997) Plant J. 12:731 746); un promotor específico del pistilo del gen SK2 de la patata (véase, p. ej., Ficker (1997) Plant Mol. Biol. 35:425 431); el gen Blec4 del guisante, que es activo en tejido epidérmico de ápices de brotes vegetativos y florales de alfalfa transgénica que lo hacen una herramienta útil para dirigir la expresión de genes foráneos a la capa epidérmica de brotes o fibras que crecen 30 activamente; el gen BEL1 específico de óvulos (véase, p. ej., Reiser (1995) Cell 83:735-742, GenBank Núm. U39944); y/o, el promotor de Klee, Patente de los Estados Unidos Núm. 5.589.583, que describe una región promotora vegetal que es capaz de convertir elevados niveles de transcripción en tejido meristemático y/o células que se dividen rápidamente.

Alternativamente, los promotores vegetales que son inducibles después de su exposición a hormonas vegetales, tales como las auxinas, se utilizan para expresar los ácidos nucleicos de la invención. Por ejemplo, la invención puede utilizar el fragmento promotor E1 de los elementos de respuesta a auxinas (AuxREs) en la soja (Glycine max L.) (Liu (1997) Plant Physiol. 115:397-407); el promotor GST6 de Arabidopsis sensible a auxinas (también sensible a ácido salicílico y peróxido de hidrógeno) (Chen (1996) Plant J. 10: 955-966); el promotor parC inducible por auxinas 40 del tabaco (Sakai (1996) 37:906-913); un elemento de respuesta a biotina vegetal (Streit (1997) Mol. Plant Microbe Interact. 10:933-937); y, el promotor sensible a la hormona del estrés ácido abscísico (Sheen (1996) Science 274:1900-1902).

Los ácidos nucleicos de la invención se pueden conectar también operablemente a promotores vegetales que son 45 inducibles después de la exposición a reactivos químicos que se pueden aplicar a la planta, tales como herbicidas o antibióticos. Por ejemplo, se puede utilizar el promotor In2-2 de maíz, activado por protectores contra herbicidas de bencenosulfonamida, (De Veylder (1997) Plant Cell Physiol. 38:568-577); la aplicación de diferentes protectores contra herbicidas induce distintos patrones de expresión génica, incluyendo expresión en la raíz, hidatodos, y el meristemo apical de los brotes. La secuencia codificante puede estar bajo el control de, p. ej., un promotor inducible 50 de tetraciclina, p. ej., como se ha descrito con las plantas de tabaco transgénicas que contienen el gen de la arginina descarboxilasa de Avena sativa L. (avena) (Masgrau (1997) Plant J. 11:465-473); o, un elemento sensible al ácido salicílico (Stange (1997) Plant J. 11:1315-1324). Utilizando promotores inducidos químicamente (p. ej., hormona o plaguicida), es decir, un promotor sensible a un agente químico que se puede aplicar a la planta transgénica en el campo, la expresión de un polipéptido de la invención se puede inducir en una fase concreta de desarrollo de la 55 planta. De este modo, la invención también proporciona plantas transgénicas que contienen un gen inducible codificante de polipéptidos de la invención cuya gama de anfitriones está limitada a especies de plantas objetivo, tales como maíz, arroz, cebada, trigo, patata u otros cultivos, inducible en cualquier estado de desarrollo del cultivo.

Un experto en la técnica advertirá que un promotor específico de tejido vegetal puede dirigir la expresión de 60 secuencias conectadas operablemente en tejidos distintos del tejido diana. De este modo, un promotor específico de tejido es el que dirige la expresión preferentemente en el tejido diana o tipo celular, pero puede además conducir a cierta expresión también en otros tejidos.

Los ácidos nucleicos de la invención pueden estar también conectados operablemente a promotores vegetales que son inducibles tras la exposición a reactivos químicos. Estos reactivos incluyen, p. ej., herbicidas, auxinas sintéticas, o antibióticos que se pueden aplicar, p. ej., pulverizar, sobre las plantas transgénicas. La expresión inducible de los ácidos nucleicos que producen xilanasa de la invención permitirá al productor seleccionar plantas con expresión y/o actividad de xilanasa óptima. De este modo se puede controlar el desarrollo de partes de las plantas. De este modo 5 la invención proporciona el medio para facilitar la cosecha de plantas y partes de plantas. Por ejemplo, en diversas realizaciones, se utiliza el promotor In2-2 de maíz, activado por protectores contra herbicidas de bencenosulfonamida (De Veylder (1997) Plant Cell Physiol. 38:568-577); la aplicación de diferentes protectores contra herbicidas induce distintos patrones de expresión génica, incluyendo expresión en la raíz, hidatodos, y el meristemo apical del brote. Las secuencias codificantes de la invención también están bajo el control de un promotor 10 de tetraciclina inducible, p. ej., como los descritos con plantas de tabaco transgénica que contienen el gen de la arginina descarboxilasa de Avena sativa L. (avena) (Masgrau (1997) Plant J. 11:465-473); o, un elemento sensible al ácido salicílico (Stange (1997) Plant J. 11:1315-1324).

En algunos aspectos, expresión apropiada del polipéptido puede requerir una región de poliadenilación en el 15 extremo 3' de la región codificante. La región de poliadenilación se puede obtener del gen natural, a partir de una variedad de genes de otra planta (o animal u otro), o a partir de genes en el ADN-T Agrobacterial.

Vectores de expresión y vehículos de clonación

La invención proporciona vectores de expresión y vehículos de clonación que comprenden ácidos nucleicos de la invención, p. ej., secuencias que codifican las xilanasas de la invención. Los vectores de expresión y los vehículos de clonación de la invención pueden comprender partículas virales, baculovirus, fagos, plásmidos, fagémidos, cósmidos, fósmidos, cromosomas artificiales bacterianos, ADN viral (p. ej., vaccinia, adenovirus, virus de la viruela aviar, pseudorrabia y derivados de SV40), cromosomas artificiales basados en P1, plásmidos de levadura, 25 cromosomas artificiales de levadura, y otros vectores cualesquiera específicos para anfitriones de interés específicos (tales como bacillus, Aspergillus y levadura). Los vectores de la invención pueden incluir secuencias de ADN cromosómico, no cromosómico y sintético. Es conocido un gran número de vectores adecuados por los expertos en la técnica, y están disponibles en el mercado. Los vectores ilustrativos incluyen: vectores bacterianos: pQE (Qiagen), plásmidos pBluescript, vectores pNH, (vectores lambda-ZAP (Stratagene); ptrc99a, pKK223-3, pDR540, pRIT2T 30 (Pharmacia); eucarióticos: pXT1, pSG5 (Stratagene), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia). Sin embargo, se puede utilizar cualquier otro plásmido u otro vector con tal que sean replicables y viables en el anfitrión. Se pueden emplear vectores con bajo número de copias o alto número de copias con la presente invención.

El vector de expresión puede comprender un promotor, un sitio de unión al ribosoma para el comienzo de la 35 traducción y un terminador de la transcripción. El vector puede incluir también las secuencias apropiadas para amplificar la expresión. Los vectores de expresión de mamíferos pueden comprender un origen de replicación, sitios de unión al ribosoma necesarios cualesquiera, un sitio de poliadenilación, un donadores y aceptores de empalme, secuencias de terminación de la transcripción, secuencias no transcritas flanqueantes 5'. En algunos aspectos, se pueden utilizar secuencias de ADN derivadas de los sitios de empalme y poliadenilación de SV40 para proporcionar 40 los elementos genéticos no transcritos requeridos.

En un aspecto, la vectores de expresión contienen uno o más genes marcadores seleccionables para permitir la selección de células anfitrionas que contienen el vector. Tales marcadores seleccionables incluyen genes que codifican la dihidrofolato reductasa o genes que confieren resistencia a la neomicina para el cultivo de células 45 eucarióticas, genes que confieren resistencia a tetraciclina o ampicilina en E. coli, y el gen TRP1 de S. cerevisiae. Las regiones promotoras se pueden seleccionar a partir de cualquier gen deseado utilizando vectores de cloranfenicol transferasa (CAT) u otros vectores con marcadores seleccionables.

Los vectores para expresar el polipéptido o fragmento del mismo en células eucarióticas pueden contener también 50 intensificadores para incrementar los niveles de expresión. Los intensificadores son elementos que actúan en cis de ADN, usualmente de alrededor de 10 a alrededor de 300 pb de longitud que actúan sobre un promotor para incrementar su transcripción. Los ejemplos incluyen intensificador de SV40 en el lado tardío del origen de replicación pb 100 a 270, el intensificador del promotor temprano de citomegalovirus, el intensificador del polioma en el lado tardío del origen de replicación, y los intensificadores de adenovirus. 55

Una secuencia de ácido nucleico se puede insertar en un vector por medio de una variedad de procedimientos. En general, la secuencia se liga a la posición deseada en el vector después de la digestión del inserto y el vector con endonucleasas de restricción apropiadas. Alternativamente, los extremos romos en el inserto y en el vector se pueden ligar. Una variedad de mecanismos de clonación con conocidas en la técnica, p. ej., como describen 60 Ausubel y Sambrook. Se considera que tales procedimientos y otros se encuentran al alcance de los expertos en la técnica.

El vector puede estar en forma de un plásmido, una partícula viral, o un fago. Otros vectores incluyen secuencias de ADN cromosómico, no cromosómico y sintético, derivados de SV40; plásmidos bacterianos, ADN de fagos, baculovirus, plásmidos de levadura, vectores derivados de combinaciones de plásmidos y ADN de fago, ADN viral tal como vaccinia, adenovirus, virus de la viruela aviar, y pseudorrabia. Una variedad de vectores de clonación y expresión para su uso con anfitriones procarióticos y eucarióticos son descritos, p. ej., por Sambrook. 5

Los vectores bacterianos concretos que se pueden utilizar incluyen los plásmidos asequibles comercialmente comprenden elementos genéticos de vectores de clonación bien conocidos pBR322 (ATCC 37017), pKK223-3 (Pharmacia Fine Chemicals, Uppsala, Suecia), GEM1 (Promega Biotec, Madison, WI, USA) pQE70, pQE60, pQE-9 (Qiagen), pD10, psiX174 pBluescript II KS, pNH8A, pNH16a, pNH18A, pNH46A (Stratagene), ptrc99a, pKK223-3, 10 pKK233-3, DR540, pRIT5 (Pharmacia), pKK232-8 y pCM7. Los vectores eucarióticos concretos incluyen pSV2CAT, pOG44, pXT1, pSG (Stratagene) pSVK3, pBPV, pMSG, y pSVL (Pharmacia). Sin embargo, se puede utilizar cualquier otro vector con tal que sea replicable y viable en la célula anfitriona.

Los ácidos nucleicos de la invención se pueden expresar en casetes de expresión, vectores o virus y expresar 15 transitoriamente o establemente en células vegetales y semillas. Un sistema de expresión transitorio ilustrativo utiliza sistemas de expresión episómicos, p. ej., ARNB viral del virus del mosaico de la coliflor (CaMV) generado en el núcleo mediante transcripción de un mini-cromosoma episómico que contiene ADN superenrollado, véase, p. ej., Covey (1990) Proc. Natl. Acad. Sci. USA 87:1633-1637. Alternativamente, se pueden insertar secuencias codificantes, es decir, todas o sub-fragmentos de secuencias de la invención en un genoma de una célula anfitriona 20 vegetal correspondiente a una parte integrante del ADN cromosómico del anfitrión. Se pueden expresar de esta manera transcritos directos o antisentido. Un vector que comprende las secuencias (p. ej., regiones promotoras o codificantes) de ácidos nucleicos de la invención puede comprender un gen marcador que confiere un fenotipo seleccionable en una célula vegetal o una semilla. Por ejemplo, el marcador puede codificar resistencia a biocidas, particularmente resistencia a antibióticos, tal como resistencia a kanamicina, G418, bleomicina, higromicina, o 25 resistencia a herbicidas, tal como resistencia a clorosulfurón o Basta.

Los vectores de expresión capaces de expresar ácidos nucleicos y proteínas en plantas son bien conocidos en la técnica, y pueden incluir, p. ej., vectores de Agrobacterium spp., virus X de la patata (véase, p. ej., Angell (1997) EMBO J. 16:3675-3684), virus del mosaico del tabaco (véase, p. ej., Casper (1996) Gene 173:69-73), virus del 30 enanismo arbustivo del tomate (véase, p. ej., Hillman (1989) Virology 169:42-50), virus del grabado del tabaco (véase, p. ej., Dolja (1997) Virology 234:243-252), virus del mosaico amarillo de la judía (véase, p. ej., Morinaga (1993) Microbiol Immunol. 37:471-476), virus del mosaico de la coliflor (véase, p. ej., Cecchini (1997) Mol. Plant Microbe Interact. 10:1094-1101), elemento transponible del maíz Ac/Ds (véase, p. ej., Rubin (1997) Mol. Cell. Biol. 17:6294-6302; Kunze (1996) Curr. Top. Microbiol. Immunol. 204:161-194), y elemento transponible supresor-35 mutador (Spm) del maíz (véase, p. ej., Schlappi (1996) Plant Mol. Biol. 32:717-725); y derivados de los mismos.

En un aspecto, el vector de expresión puede tener dos sistemas de replicación para permitirle mantenerse en dos organismos, por ejemplo en células de mamífero o insecto para su expresión y en un anfitrión procariótico para su clonación y amplificación. Además, para los vectores de expresión integrantes, el vector de expresión puede 40 contener al menos una secuencia homóloga al genoma de la célula anfitriona. Puede contener dos secuencias homólogas que flanquean el constructo de expresión. El vector integrante puede dirigirse a un locus específico en la célula anfitriona seleccionando la secuencia homóloga apropiada para la inclusión en el vector. Los constructos para los vectores integrantes son bien conocidos en la técnica.

Los vectores de expresión de la invención pueden incluir también un gen marcador seleccionable para permitir la selección de cepas bacterianas que han sido transformadas, p. ej., genes que vuelven la bacteria resistente a fármacos tales como ampicilina, cloramfenicol, eritromicina, kanamicina, neomicina y tetraciclina. Los marcadores seleccionables pueden incluir también genes biosintéticos, tales como los de las rutas biosintéticas de la histidina, el triptófano y la leucina. 50

La secuencia de ADN en el vector de expresión está conectada operativamente a una o varias secuencias de control de la expresión (promotor) apropiadas para dirigir la síntesis de ARN. Los promotores bacterianos designados concretos incluyen lacI, lacZ, T3, T7, gpt, PR, PL de lambda y trp. Los promotores eucarióticos incluyen el temprano inmediato de CMV, timidina quinasa de HSV, temprano y tardío de ate SV40, las LTR de retrovirus y metalotioneína I 55 de ratón. La selección del vector y el promotor apropiados está al nivel de conocimiento práctico normal en la técnica. El vector de expresión también contiene un sitio de unión al ribosoma para el comienzo de la traducción y un terminador de la transcripción. El vector puede incluir también secuencias apropiadas para amplificar la expresión. Las regiones promotoras se pueden seleccionar entre cualquier gen deseado utilizando vectores de la cloranfenicol transferasa (CAT) u otros vectores con marcadores seleccionables. Además, los vectores de expresión contienen 60 preferiblemente uno o más genes marcadores seleccionables para proporcionar un rasgo fenotípico para la selección de células anfitrionas transformadas tal como dihidrofolato reductasa o resistencia a la neomicina para un cultivo celular eucariótico, o tal como resistencia a tetraciclina o ampicilina en E. coli.

Los vectores de expresión de mamíferos puede comprender también un origen de replicación, sitios de unión al ribosoma necesarios cualesquiera, un sitio de poliadenilación, sitios donadores o aceptores de empalme, secuencias de terminación de la transcripción y secuencias no transcritas flanqueantes 5'. En algunos aspectos, se pueden utilizar secuencias ADN derivadas de los sitios de empalme y poliadenilación de SV40 para proporcionar los elementos genéticos no transcritos requeridos. 5

Los vectores para expresar el polipéptido o fragmento del mismo en células eucarióticas pueden contener también intensificadores para incrementar los niveles de expresión. Los intensificadores son elementos de ADN que actúan en cis, usualmente de alrededor de 10 a alrededor de 300 pb de longitud que actúan sobre un promotor para incrementar su transcripción. Sus ejemplos incluyen el intensificador de SV40 en el lado tardío del origen de 10 replicación pb 100 a 270, el intensificador del promotor temprano de citomegalovirus, el intensificador del polioma en el lado tardío del origen de replicación y los intensificadores de adenovirus.

Además, la vectores de expresión contienen típicamente uno o más genes marcadores seleccionables para permitir la selección de células anfitrionas que contienen el vector. Tales marcadores seleccionables incluyen genes que 15 codifican genes de la dihidrofolato reductasa o genes que confieren resistencia a la neomicina para el cultivo de células eucarióticas, genes que confieren resistencia a tetraciclina o ampicilina en E. coli y el gen TRP1 de S. cerevisiae.

En algunos aspectos, el ácido nucleico que codifica uno de los polipéptidos de las secuencias de aminoácidos del 20 Grupo B y secuencias esencialmente idénticas a éstas, o fragmentos que comprenden al menos alrededor de 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos del mismo se ensambla en la fase apropiada con una secuencia líder capaz de dirigir la secreción del polipéptido traducido o un fragmento del mismo. Opcionalmente, el ácido nucleico puede codificar un polipéptido de fusión en el que uno de los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, o fragmentos que 25 comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos del mismo se fusiona a péptidos o polipéptidos heterólogos, tales como péptidos de identificación N-terminal que confieren las características deseadas, tales como el aumento de estabilidad o la simplificación de la purificación.

La secuencia de ADN apropiada se puede insertar en el vector por medio de una variedad de procedimientos. En 30 general, la secuencia de ADN se liga a la posición deseada en el vector después de la digestión del inserto y el vector con endonucleasas de restricción apropiadas. Alternativamente, se pueden ligar los extremos romos del inserto y del vector. Una variedad de técnicas de clonación son descritas por Ausubel et al. Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc. 1997 y Sambrook et al., Molecular Cloning: A Laboratory Manual 2a Ed., Cold Spring Harbor Laboratory Press (1989. Se considera que tales procedimientos y otros están al alcance de 35 de los expertos en la técnica.

El vector puede estar, por ejemplo, en forma de un plásmido, una partícula viral, o un fago. Otros vectores incluyen secuencias de ADN cromosómico, no cromosómico y sintético, derivados de SV40; plásmidos bacterianos, ADN de fagos, baculovirus, plásmidos de levadura, vectores derivados de combinaciones de plásmidos y ADN de fagos, 40 ADN viral tal como vaccinia, adenovirus, virus de la viruela aviar y pseudorabia. Una variedad de vectores de clonación y expresión para su uso con anfitriones procarióticos y eucarióticos son descritos por Sambrook, et al., Molecular Cloning: A Laboratory Manual, 2a Ed., Cold Spring Harbor, N.Y., (1989).

Células anfitrionas y célula transformadas 45

La invención también proporciona una célula transformada que comprende una secuencia de ácido nucleico de la invención, p. ej., una secuencia que codifica una xilanasa de la invención, o un vector de la invención. La célula anfitriona puede ser cualquiera de las células anfitrionas familiares para los expertos en la técnica, incluyendo células procarióticas, células eucarióticas, tales como células bacterianas, célula fúngicas, células de levadura, 50 células de mamífero, células de insecto, o células vegetales. Las células bacterianas ilustrativas incluyen E. coli, Streptomyces, Bacillus subtilis, Salmonella typhimurium y diversas especies dentro de los géneros Pseudomonas, Streptomyces, y Staphylococcus. Las células de insecto ilustrativas incluyen S2 de Drosophila y Sf9 de Spodoptera. Las células animales ilustrativas incluyen CHO, COS o melanoma de Bowes o cualquier línea celular de ratón o humana. La selección de un anfitrión apropiado se encuentra dentro de las capacidades de los expertos en la 55 técnica. Las técnicas para la transformación de una amplia variedad de especies de plantas supriores son bien conocidas y se describen en la bibliografía técnica y científica. Véase, p. ej., Weising (1988) Ann. Rev. Genet. 22:421-477; Patente de los Estados Unidos Núm. 5.750.870.

El vector se puede introducir en las células anfitrionas utilizando cualquiera de una variedad de técnicas, incluyendo 60 transformación, transfección, transducción, infección viral, pistolas génicas, o transferencia génica mediada por plásmidos Ti. Los métodos concretos incluyen transfección con fosfato de calcio, transfección mediada por DEAE-Dextrano, lipofección, o electroporación (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology, (1986)).

En un aspecto, los ácidos nucleicos o vectores de la invención se introducen en las células para escrutar, de ese modo, los ácidos nucleicos que entran en las células de una manera adecuada para la posterior expresión del ácido nucleico. El método de introducción está dictado en gran parte por el tipo de célula diana. Los métodos ilustrativos incluyen precipitación con CaPO4, fusión de liposomas, lipofección (p. ej., LIPOFECTIN™), electroporación, infección 5 viral, etc. Los ácidos nucleicos candidato se pueden integrar establemente en el genoma de la célula anfitriona (por ejemplo, con introducción retroviral) o pueden existir transitoriamente o establemente en el citoplasma (es decir a través del uso de plásmidos tradicionales, utilizando secuencias reguladoras convencionales, marcadores de selección, etc.). Puesto que muchos escrutinios farmacéuticamente importantes requieren dianas celulares humanas o de mamíferos modelo, vectores retrovirales capaces de transfectar tales dianas. 10

Cuando sea apropiado, las células anfitrionas construidas se pueden cultivar en medios nutrientes convencionales según sea apropiado para activar los promotores, seleccionar los transformantes o amplificar los genes de la invención. Después de la transformación de una cepa anfitriona adecuada y el crecimiento de la cepa anfitriona hasta una densidad celular apropiada, se puede introducir el promotor seleccionado mediante métodos apropiados 15 (p. ej., desplazamiento de temperatura o inducción química) y las células se pueden cultivar durante un período adicional para permitirlas producir el polipéptido deseado o fragmento del mismo.

Las células se pueden cosechar mediante centrifugación, romper mediante métodos físicos o químicos, y el extracto bruto resultante conservar para su purificación adicional. Las células microbianas empleadas para la expresión de 20 las proteínas se pueden romper mediante cualquier método conveniente, incluyendo ciclos de congelación-descongelación, sonicación, rotura mecánica, o uso de agentes de lisis celular. Tales métodos son bien conocidos por los expertos en la técnica. El polipéptido expresado o fragmentos del mismo se pueden recuperar y purificar a partir de cultivos celulares recombinantes mediante métodos que incluyen precipitación con sulfato de amonio o etanol, extracción con ácido, cromatografía de intercambio aniónico o catiónico, cromatografía sobre fosfocelulosa, 25 cromatografía de interacción hidrófoba, cromatografía de afinidad, cromatografía en hidroxilapatita y cromatografía en lectinas. Se pueden utilizar etapas de replegamiento de proteínas, según sea necesario, al completar la configuración del polipéptido. Si se desea, se puede emplear cromatografía líquida de alta resolución (HPLC) para las etapas de purificación finales.

Los constructos en las células anfitrionas se pueden utilizar de una manera convencional para producir el producto génico codificado por la secuencia recombinante. Dependiendo del anfitrión empleado en un procedimiento de producción recombinante, los polipéptidos producidos por las células anfitrionas que contienen el vector pueden estar glicosilados o pueden estar no glicosilados. Los polipéptidos de la invención pueden también incluir o no incluir un residuo de aminoácido de metionina inicial. 35

También se pueden emplear sistemas de traducción sin células para producir un polipéptido de la invención. Los sistemas de traducción sin células pueden utilizar ARNm transcritos a partir de un constructo de ADN que comprende un promotor conectado operablemente a un ácido nucleico que codifica el polipéptido o fragmento del mismo. En algunos aspectos, el constructo de ADN se puede linealizar antes de llevar a cabo una reacción de 40 transcripción in vitro. El ARNm transcrito se incuba a continuación con un extracto de traducción sin células apropiado, tal como un extracto de reticulocito de conejo, para producir el polipéptido deseado o un fragmento del mismo.

Los vectores de expresión pueden contener uno o más genes marcadores seleccionables para proporcionar un 45 rasgo fenotípico para la selección de células anfitrionas transformadas tal como dihidrofolato reductasa o resistencia a la neomicina para un cultivo celular eucariótico, o tal como resistencia a tetraciclina o ampicilina en E. coli.

Las células anfitrionas que contienen los polinucleótidos de interés, p. ej., los ácidos nucleicos de la invención, se pueden cultivar en medios nutrientes convencionales modificados según sea apropiado para activar promotores, 50 seleccionar transformantes o amplificar genes. Las condiciones de cultivo, tales como temperatura, pH y similares, son las que se han utilizado previamente con la célula anfitriona seleccionada para la expresión y resultarán evidentes para los expertos normales en la técnica. Los clones que se identifica que tienen la actividad enzimática especificada se pueden secuenciar a continuación para identificar la secuencia de polinucleótidos que codifica una enzima que tiene la actividad intensificada. 55

La invención proporciona un método para expresar en exceso una xilanasa recombinante en una célula que comprende expresar un vector que comprende un ácido nucleico de la invención, donde las identidades de secuencia se determinan mediante análisis con un algoritmo de comparación de secuencia o mediante inspección visual, o, un ácido nucleico que hibrida en condiciones restrictivas con dicha secuencia de ácido nucleico. La 60 expresión en exceso se puede efectuar por medio de cualquier método, p. ej., uso de un promotor con alta actividad, un vector dicistrónico o mediante amplificación génica del vector.

Los ácidos nucleicos de la invención se pueden expresar, o expresar en exceso, en cualquier sistema de expresión in vitro o in vivo. Se puede emplear cualquier sistema de cultivo celular para expresar, o expresar en exceso, proteína recombinante, incluyendo cultivos bacterianos, de insecto, de levadura, fúngicos o de mamíferos. La expresión en exceso se puede efectuar por medio de la elección apropiada de promotores, intensificadores, vectores (p. ej., uso de vectores de replicón, vectores dicistrónicos (véase, p. ej., Gurtu (1996) Biochem. Biophys. Res. 5 Commun. 229:295-8), medios, sistemas de cultivo y similares. En un aspecto, la amplificación de genes utilizando marcadores de selección, p. ej., glutamina sintetasa (véase, p. ej., Sanders (1987) Dev. Biol. Stand. 66:55-63), en sistemas celulares se utiliza para expresar en exceso los polipéptidos de la invención.

Los detalles adicionales concernientes a este enfoque se encuentran en la bibliografía pública y/o son conocidos por 10 los expertos en la técnica. En una ilustración no limitante concreta, tal bibliografía disponible al público incluye el documento EP 0659215 (W0 9403612 A1) (Nevalainen et al.); Lapidot, A., Mechaly, A., Shoham, Y., "Overexpression and single-step purification of a thermostable xilanase from Bacillus stearotermophilus T-6", J. Biotechnol. Nov 51:259-64 (1996); Lüthi, E., Jasmat, N.B., Bergquist, P.L., "Xylanase from the extremely termophilic bacterium Caldocellum saccharolyticum: overexpression of the gen in Escherichia coli y characterization of the gen 15 product", Appl. Environ. Microbiol. Sep 56:2677-83 (1990); y Sung, W.L., Luk, C.K., Zahab, D.M., Wakarchuk, W., "Overexpression of the Bacillus subtilis and circulans xylanases in Escherichia coli", Protein Expr. Purif. Jun 4:200-6 (1993), aunque estas referencias no ilustran las enzimas de la invención de la presente solicitud.

La célula anfitriona puede ser cualquiera de las células anfitrionas familiares para los expertos en la técnica, 20 incluyendo células procarióticas, células eucarióticas, células de mamífero, células de insecto, o células vegetales. Como ejemplos representativos de los anfitriones apropiados, se pueden mencionar: células bacterianas, tales como E. coli, Streptomyces, Bacillus subtilis, Salmonella typhimurium y diversas especies de los géneros Pseudomonas, Streptomyces y Staphylococcus, célula fúngicas, tales como levadura, células de insecto tales como S2 de Drosophila y Sf9 de Spodoptera, células animales tales como CHO, COS o melanoma de Bowes y adenovirus. La 25 selección de un anfitrión apropiado se encuentra dentro de las capacidades de los expertos en la técnica.

El vector se puede introducir en las células anfitrionas utilizando cualquiera de una variedad de técnicas, incluyendo transformación, transfección, transducción, infección viral, pistolas génicas, o transferencia génica mediada por plásmidos Ti. Los métodos concretos incluyen transfección con fosfato de calcio, transfección mediada por DEAE-30 Dextrano, lipofección, o electroporación (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology, (1986)).

Cuando sea apropiado, las células anfitrionas diseñadas se pueden cultivar en medios nutrientes convencionales según sea apropiado para activar los promotores, seleccionar los transformantes o amplificar los genes de la 35 invención. Después de la transformación de una cepa anfitriona adecuada y el crecimiento de la cepa anfitriona hasta una densidad celular apropiada, se puede introducir el promotor seleccionado mediante métodos apropiados (p. ej., desplazamiento de temperatura o inducción química) y las células se pueden cultivar durante un período adicional para permitirlas producir el polipéptido deseado o fragmento del mismo.

Las células se pueden cosechar mediante centrifugación, romper mediante métodos físicos o químicos, y el extracto bruto resultante conservar para su purificación adicional. Las células microbianas empleadas para la expresión de las proteínas se pueden romper mediante cualquier método conveniente, incluyendo ciclos de congelación-descongelación, sonicación, rotura mecánica, o uso de agentes de lisis celular. Tales métodos son bien conocidos por los expertos en la técnica. El polipéptido expresado o fragmentos del mismo se pueden recuperar y purificar a 45 partir de cultivos celulares recombinantes mediante métodos que incluyen precipitación con sulfato de amonio o etanol, extracción con ácido, cromatografía de intercambio aniónico o catiónico, cromatografía sobre fosfocelulosa, cromatografía de interacción hidrófoba, cromatografía de afinidad, cromatografía en hidroxilapatita y cromatografía en lectinas. Se pueden utilizar etapas de replegamiento de proteínas, según sea necesario, al completar la configuración del polipéptido. Si se desea, se puede emplear cromatografía líquida de alta resolución (HPLC) para 50 las etapas de purificación finales.

También se pueden emplear diversos sistemas de cultivo de células de mamífero para expresar proteínas recombinantes. Los ejemplos de los sistemas de expresión de mamíferos incluyen las líneas COS-7 fibroblastos de riñón de mono (descritas por Gluzman, Cell, 23:175, 1981) y otras líneas celulares capaces de expresar proteínas a 55 partir de un vector compatible, tales como las líneas celulares C127, 3T3, CHO, HeLa y BHK.

Los constructos en las células anfitrionas se pueden utilizar de una manera convencional para producir el producto génico codificado por la secuencia recombinante. Dependiendo del anfitrión empleado en un procedimiento de producción recombinante, los polipéptidos producidos por las células anfitrionas que contienen el vector pueden 60 estar glicosilados o pueden estar no glicosilados. Los polipéptidos de la invención pueden también incluir o no incluir un residuo de aminoácido de metionina inicial.

Alternativamente, los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de los mismos se pueden producir sintéticamente por medio de sintetizadores peptídicos convencionales. En otros aspectos, se pueden emplear fragmentos o porciones de los polipéptidos para producir el polipéptido completo correspondiente mediante síntesis peptídica; por lo tanto, los fragmentos se pueden emplear 5 como intermedios para la producción de polipéptidos completos.

También se pueden emplear sistemas de traducción sin células para producir uno de los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de los mismos 10 utilizando los ARNm transcritos a partir de un constructo de ADN que comprende un promotor conectado operablemente a un ácido nucleico que codifica el polipéptido o fragmento del mismo. En algunos aspectos, el constructo de ADN se puede linealizar antes de llevar a cabo una reacción de transcripción in vitro. El ARNm transcrito se incuba a continuación con un extracto de traducción sin células apropiado, tal como un extracto de reticulocito de conejo, para producir el polipéptido deseado o un fragmento del mismo. 15

Amplificación de Ácidos Nucleicos

Al poner en practica la invención, los ácidos nucleicos de la invención y los ácidos nucleicos que codifican las xilanasas de la invención, o los ácidos nucleicos modificados de la invención, se pueden reproducir mediante 20 amplificación. La amplificación también se puede usar para clonar o modificar los ácidos nucleicos de la invención. De este modo, la invención proporciona pares de secuencias cebadoras de amplificación para amplificar ácidos nucleicos de la invención. Un experto en la técnica puede diseñar pares de secuencias cebadoras de amplificación para cualquier parte de o para toda la longitud de estas secuencias.

En un aspecto, la invención proporciona un ácido nucleico amplificado con un par de cebadores de la invención, p. ej., un par de cebadores como se muestra mediante alrededor de los primeros (los 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, o 25 residuos de un ácido nucleico de la invención, y alrededor de los primeros (los 5') 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, o 25 residuos de la hebra complementaria.

La invención proporciona un par de secuencias cebadoras de amplificación para amplificar un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa, donde el par de cebadores es capaz para amplificar un ácido nucleico que comprende una secuencia de la invención, o fragmentos o subsecuencias del mismo. Uno o cada miembro del par de secuencias cebadoras de amplificación pueden comprender un oligonucleótido que comprende al menos alrededor de 10 a 50 bases consecutivas de la secuencia, o alrededor de 12, 13, 14, 15, 16, 17, 18, 19, 20, 35 21, 22, 23, 24, o 25 bases consecutivas de la secuencia. La invención proporciona pares de cebadores de amplificación, donde el par de cebadores comprende un primer miembro que tiene una secuencia como la mostrada mediante alrededor de los primeros (los 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, o 25 residuos de un ácido nucleico de la invención, y a segundo miembro que tiene una secuencia como la mostrada mediante alrededor de los primeros (los 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, o 25 residuos de la hebra complementaria 40 del primer miembro. La invención proporciona xilanasas generadas mediante amplificación, p. ej., reacción en cadena de la polimerasa (PCR), utilizando un par de cebadores de amplificación de la invención. La invención proporciona métodos para elaborar una xilanasa mediante amplificación, p. ej., reacción en cadena de la polimerasa (PCR), utilizando un par de cebadores de amplificación de la invención. En un aspecto, el par de cebadores de amplificación amplifica un ácido nucleico de una biblioteca, p. ej., una genoteca, tal como una biblioteca ambiental. 45

Las reacciones de amplificación se pueden utilizar también para cuantificar la cantidad de ácido nucleico en una muestra (tal como la cantidad de mensaje en una muestra celular), marcar el ácido nucleico (p. ej., aplicarlo a una matriz o una transferencia), detectar el ácido nucleico, o cuantificar la cantidad de un ácido nucleico específico en una muestra. En un aspecto de la invención, se amplifican el mensaje aislado de una célula o una biblioteca de 50 ADNc.

El experto en la técnica puede seleccionar y diseñar cebadores de amplificación oligonucleotídicos adecuados. Los métodos de amplificación son también bien conocidos en la técnica, e incluyen, p. ej., reacción en cadena de la polimerasa, PCR (véase, p. ej., PCR PROTOCOLS, A GUIDE TO METHODS AND APPLICATIONS, ed. Innis, 55 Academic Press, N.Y. (1990) y PCR STRATEGIES (1995), ed. Innis, Academic Press, Inc., N.Y., reacción en cadena de la ligasa (LCR) (véase, p. ej., Wu (1989) Genomics 4:560; Landegren (1988) Science 241:1077; Barringer (1990) Gene 89:117); amplificación basada en la transcripción (véase, p. ej., Kwoh (1989) Proc. Natl. Acad. Sci. USA 86:1173); y, replicación de secuencias autosostenida (véase, p. ej., Guatelli (1990) Proc. Natl. Acad. Sci. USA 87:1874); amplificación de la replicasa Q Beta (véase, p. ej., Smith (1997) J. Clin. Microbiol. 35:1477-1491), análisis 60 de amplificación de la replicasa Q Beta automático (véase, p. ej., Burg (1996) Mol. Cell. Probes 10:257-271) y otras técnicas mediadas por ARN polimerasa (p. ej., NASBA, Cangene, Mississauga, Ontario); véase también Berger (1987) Methods Enzymol. 152:307-316; Sambrook; Ausubel; Patentes de los Estados Unidos Núms. 4.683.195 y 4.683.202; Sooknanan (1995) Biotechnology 13:563-564.

Determinación del grado de identidad de secuencia

La invención proporciona ácidos nucleicos que comprenden las secuencias que tienen al menos alrededor de 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, o más, o identidad de secuencia completa (100%) con una 5 secuencia de ácido nucleico del SEQ ID NO: 159.

La invención proporciona polipéptidos que comprenden las secuencias que tienen al menos 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, o más, o identidad de secuencia completa (100%) con la secuencia de aminoácidos del SEQ ID NO: 160. El grado de identidad de secuencia (homología) se puede determinar utilizando 10 cualquier programa informático y parámetros asociados, incluyendo los descritos de la presente memoria, tales como BLAST 2.2.2. o FASTA versión 3.0t78, con los parámetros por defecto.

Las secuencias de ácido nucleico son referidas también como secuencias de ácido nucleico de "Grupo A", que incluyen secuencias esencialmente idénticas a éstas, así como secuencias homólogas a las secuencias de ácido 15 nucleico del Grupo A y fragmentos de las mismas y secuencias complementarias a todas las secuencias precedentes. Las secuencias de ácido nucleico pueden comprender al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, o 500 nucleótidos consecutivos de una secuencia de la invención ilustrativa (p. ej., secuencias de ácido nucleico del Grupo A) y secuencias esencialmente idénticas a éstas. Las secuencias homólogas y los fragmentos de las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, hacen 20 referencia a una secuencia que tiene una homología de al menos 99%, 98%, 97%, 96%, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, o 50% con estas secuencias. La homología se puede determinar utilizando cualquiera de los programas informáticos y los parámetros descritos de la presente memoria, incluyendo FASTA versión 3.0t78 con los parámetros por defecto. Las secuencias homólogas también incluyen secuencias de ARN en las que las uridinas remplazan a las timinas en las secuencias de ácido nucleico como se muestra en las secuencias de ácido 25 nucleico del Grupo A. Las secuencias homólogas se pueden obtener utilizando cualquiera de los procedimientos descritos en la presente memoria o pueden resultar de la corrección de un error de secuenciación. Se apreciará que las secuencias de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, se pueden representar en el formato de un solo carácter tradicional (Véase la contraportada de Stryer, Lubert. Biochemistry, 3a Ed., W. H Freeman & Co., New York.) o en cualquier otro formato 30 que registre la identidad de los nucleótidos en una secuencia.

Se contemplan particularmente para su uso en este aspecto diversos programas de comparación de secuencias identificados en otra parte en esta solicitud de patente. Las homologías de las secuencias de proteínas y/o ácidos nucleicos se pueden evaluar utilizando cualquiera de la variedad de algoritmos de comparación de secuencias y 35 programas conocidos en la técnica. Tales algoritmos y programas incluyen, pero no están limitados de ningún modo a, TBLASTN, BLASTP, FASTA, TFASTA y CLUSTALW (Pearson y Lipman, Proc. Natl. Acad. Sci. USA 85(8):2444-2448, 1988; Altschul et al., J. Mol. Biol. 215(3):403-410, 1990; Thompson et al., Nucleic Acids Res. 22(2):4673-4680, 1994; Higgins et al., Methods Enzymol. 266:383-402, 1996; Altschul et al., J. Mol. Biol. 215(3):403-410, 1990; Altschul et al., Nature Genetics 3:266-272, 1993). 40

La homología o la identidad se miden con frecuencia utilizando programas de análisis de secuencias (p. ej., Sequence Analysis Software Package de the Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, WI 53705). Tales programas emparejan secuencias similares mediante la asignación de grados de homología a diversas deleciones, sustituciones u otras modificaciones. Los términos 45 "homología" e "identidad" en el contexto de dos o más ácidos nucleicos o secuencias de polipéptidos, hacen referencia a dos o más secuencias o subsecuencias que son la misma o tienen un porcentaje especificado de residuos de aminoácidos o nucleótidos que son los mismos cuando se comparan y alinean para una correspondencia máxima a lo largo de una ventana de comparación o región designada según se mide utilizando cualquier número de algoritmos de comparación de secuencias o mediante alineamiento manual e inspección visual. 50

Para la comparación de secuencias, típicamente una secuencia actúa como una secuencia de referencia, con la que se comparan las secuencias de ensayo. Cuando se utiliza un algoritmo de comparación de secuencias, las secuencias de ensayo y de referencia se introducen en un ordenador, se diseñan las coordenadas de la subsecuencia, si fuera necesario y se diseñan los parámetros del programa de algoritmo de secuencia. Se pueden 55 utilizar parámetros del programa por defecto, o se pueden diseñar parámetros alternativos. El algoritmo de comparación de secuencia calcula a continuación el porcentaje de identidades de secuencia para las secuencias de ensayo con respecto a la secuencia de referencia, basándose en los parámetros del programa.

Una "ventana de comparación", según se utiliza de la presente memoria, incluye la referencia a un segmento de una 60 cualquiera de las varias posiciones contiguas seleccionadas del grupo que consiste en 20 a 600, usualmente alrededor de 50 a alrededor de 200, más usualmente alrededor de 100 a alrededor de 150 en las que una secuencia se puede comparar con una secuencia de referencia del mismo número de posiciones contiguas después de haber alineado óptimamente las dos secuencias. Los métodos para el alineamiento de de secuencias para su comparación

son bien conocidos en la técnica. El alineamiento óptimo de secuencias para su comparación se puede llevar a cabo, p. ej., por medio del algoritmo de homología local de Smith & Waterman, Adv. Appl. Math. 2:482, 1981, mediante el algoritmo de alineamiento de homología de Needleman & Wunsch, J. Mol. Biol 48:443, 1970, por medio de la búsqueda para el método de similitud de Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444, 1988, por medio de implementaciones computarizadas de estos algoritmos (GAP, BESTFIT, FASTA y TFASTA en The 5 Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI), o por medio de alineamiento manual e inspección visual. Otros algoritmos para determinar la homología o identidad incluyen, por ejemplo, además del programa BLAST (Basic Local Alignment Search Tool at the National Center for Biological Information "Herramienta de Búsqueda de Alineamiento Local Básico"), ALIGN, AMAS (Analysis of Multiply Aligned Sequences "Análisis de Secuencias Alineadas Multiplicadas"), AMSP (Protein Multiple Sequence Alignment 10 "Alineamiento Múltiple de Secuencias de Proteínas"), ASSET (Aligned Segment Statistical Evaluation Tool "Herramienta de Evaluación Estadística de Segmentos Alineados"), BANDS, BESTSCOR, BIOSCAN (Biological Sequence Comparative Analysis Node "Nodo de Análisis Comparativo de Secuencias Biológicas"), BLIMSP (BLocks IMProved Searcher "Búsqueda de Similitud Contra una Base de Datos de Bloques"), FASTA, Intervals & Points, BMB, CLUSTAL V, CLUSTAL W, CONSENSUS, LCONSENSUS, WCONSENSUS, algoritmo de Smith-Waterman, 15 DARWIN, algoritmo Las Vegas, FNAT (Forced Nucleotide Alignment Tool "Herramienta de Alineamiento de Nucleótidos Forzada"), Framealign, Framesearch, DYNAMIC, FILTER, FSAP (Fristensky Sequence Analysis Package "Paquete de Análisis de Secuencia de Fristensky"), GAP (Global Alignment Program "Programa de Alineamiento Global), GENAL, GIBBS, GenQuest, ISSC (Sensitive Sequence Comparison "Comparación de Secuencias Sensibles"), LALIGN (Local Sequence Alignment "Alineamiento de Secuencia Local"), LCP (Local 20 Content Program "Programa de Contenido Local"), MACAW (Multiple Alignment Construction & Analysis Workbench "Construcción de Alineamiento Múltiple y Análisis Workbench"), MAP (Multiple Alignment Program "Programa de Alineamiento Múltiple"), MBLKP, MBLKN, PIMA (Pattern-Induced Multi-secuencia Alignment "Alineamiento Multisecuencia de Patrón Inducido"), SAGA (Sequence Alignment by Genetic Algorithm "Alineamiento de Secuencia mediante Algoritmo Genético") y WHAT-IF. Tales programas de alineamiento se pueden utilizar también para 25 escrutar bases de datos genómicas para identificar secuencias de polinucleótidos que tienen secuencias sustancialmente idénticas. Están disponibles varias bases de datos genómicas, por ejemplo, una porción sustancial del genoma humano está disponibles como parte del Proyecto de Secuenciación del Genoma Humano "Human Genome Sequencing Project" (J. Roach, http://weber.u.Washington.edu/∼roach/human_genome_progress 2.html) (Gibbs,1995). Ya se han secuenciado al menos veintiún genomas distintos, incluyendo, por ejemplo, M genitalium 30 (Fraser et al., 1995), M. jannaschii (Bult et al., 1996), H. influenzae (Fleischmann et al., 1995), E. coli (Blattner et al., 1997) y levadura (S. cerevisiae) (Mewes et al., 1997) y D. melanogaster (Adams et al., 2000). También se han realizado progresos significativos en la secuenciación de genomas de organismos modelo, tales como ratón, C. elegans y Arabadopsis sp. Diversas bases de datos que contienen información genómica anotada con cierta información funcional son mantenidas por diferentes organizaciones y son accesibles a través de Internet. 35

Un ejemplo de un algoritmo útil son los algoritmos BLAST y BLAST 2.0, que son descritos por Altschul et al., en Nuc. Acids Res. 25:3389-3402, 1977 y Altschul et al., J. Mol. Biol. 215:403-410, 1990, respectivamente. Los programas para realizar los análisis BLAST están disponibles al publico a través del National Center for Biotechnology Información. Este algoritmo implica identificar en primer lugar pares de secuencia de alta puntuación (HSP) 40 identificando palabras cortas de longitud W en la secuencia problema, que coinciden o satisfacen cierta puntuación T umbral con valor positivo cuando se alinean con una palabra de la misma longitud en una secuencia de la base de datos. T es referido como el umbral de puntuación de la palabra vecina (Altschul et al., supra). Estos éxitos con la palabra vecina inicial actúan como semillas para iniciar búsquedas para encontrar HSP más largos que las contienen. Los éxitos con las palabras se prolongan en ambas direcciones a lo largo de cada secuencia tanto como 45 aumente la puntuación de alineamiento cumulativa. Las puntuaciones cumulativas se calculan utilizando, para las secuencias de nucleótidos, los parámetros M (la puntuación de recompensa para un par de residuos emparejados; siempre >0). Para las secuencias de aminoácidos, se utiliza una matriz de puntuación para calcular la puntuación cumulativa. La prolongación de los éxitos con las palabras en cada dirección se detiene cuando: la puntuación de alineamiento cumulativa disminuye en la cantidad X de su valor máximo alcanzado; la puntuación cumulativa tiende 50 a cero o menos, debido a la acumulación de uno o más alineamientos de residuos de puntuación negativa; o se alcanza el final de cualquier secuencia. Los parámetros del algoritmo BLAST W, T y X determinan la sensibilidad y la velocidad del alineamiento. El programa BLASTN (para secuencias de nucleótidos) utiliza como parámetros por defecto una longitud de palabra (W) de 11, una expectativa (E) de 10, M=5, N=-4 y una comparación de ambas hebras. Para las secuencias de aminoácidos, el programa BLASTP utiliza como parámetros por defecto una longitud 55 de palabra de 3 y expectativas (E) de 10 y la matriz de puntuación BLOSUM62 (véase Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915, 1989) alineamientos (B) de 50, expectativa (E) de 10, M=5, N= -4 y una comparación de ambas hebras.

El algoritmo BLAST también realiza un análisis estadístico de la similitud entre dos secuencias (véase, p. ej., Karlin & 60 Altschul, Proc. Natl. Acad. Sci. USA 90:5873, 1993). Una medida de similitud proporcionada por el algoritmo BLAST es la probabilidad de la suma mínima (P(N)), que proporciona una indicación de la probabilidad por la cual ocurriría por casualidad un emparejamiento entre dos secuencias de nucleótidos o de aminoácidos. Por ejemplo, un ácido nucleico se considera similar a una secuencia de referencia si la probabilidad de la suma mínima en una

comparación del ácido nucleico de ensayo con respecto al ácido nucleico de referencia es menor de alrededor de 0,2, más preferiblemente menor de alrededor de 0,01 y muy preferiblemente menor de alrededor de 0,001.

En un aspecto, se evalúan las homologías de las secuencias de proteínas y de ácidos nucleicos utilizando la Herramienta de Búsqueda de Alineamiento Local Básico ("BLAST"). En particular, se utilizan cinco programas 5 BLAST específicos para realizar la siguiente tarea:

1. (1) BLASTP y BLAST3 comparan una secuencia problema de aminoácidos frente a una base de datos de secuencias de proteínas;

2. (2) BLASTN compara una secuencia problema de nucleótidos frente a una base de datos de secuencias de 10 nucleótidos;

3. (3) BLASTX compara los productos de traducción conceptual de seis marcos de una secuencia de nucleótidos problema (ambas hebras) frente a una base de datos de secuencias de proteínas;

4. (4) TBLASTN compara una secuencia problema de proteínas frente a una base de datos de secuencias de nucleótidos traducidas en los seis marcos de lectura (ambas hebras); y 15

5. (5) TBLASTX compara las traducciones de seis marcos de una secuencia problema de nucleótidos frente a las traducciones de seis marcos de una base de datos de secuencias de nucleótidos.

Los programas BLAST identifican secuencias homólogas identificando segmentos similares, que son referidos en la presente memoria como "pares de segmentos de alta puntuación", entre una secuencia de aminoácidos o de ácido 20 nucleico y una secuencia de ensayo que se obtiene preferiblemente a partir de una base de datos de secuencias de proteínas o de ácido nucleico. Los pares de segmentos de alta puntuación se identifican preferiblemente (es decir, se alinean) por medio de una matriz de puntuación, muchas de las cuales son conocidas en la técnica. Preferiblemente, la matriz de puntuación utilizada es la matriz BLOSUM62 (Gonnet et al., Science 256:1443-1445, 1992; Henikoff y Henikoff, Proteins 17:49-61, 1993). Menos preferiblemente, también se pueden utilizar las matrices 25 PAM o PAM250 (véase, p. ej., Schwartz y Dayhoff, eds., 1978, Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure, Washington: National Biomedical Research Foundation). Los programas BLAST son accesibles a través de la U.S. National Library of Medicine.

Los parámetros utilizados con los algoritmos anteriores se pueden adaptar dependiendo de la longitud de la 30 secuencia y el grado de homología estudiado. En algunos aspectos, los parámetros pueden ser los parámetros por defecto utilizados por los algoritmos en ausencia de instrucciones para el usuario.

Sistemas informáticos y productos de programas informáticos

Para determinar e identificar identidades de secuencia, homologías estructurales, motivos y similares vía simulación computacional, una secuencia de ácido nucleico o polipéptido de la invención se puede almacenar, registrar, y manipular sobre cualquier medio que pueda ser leído y al que se pueda acceder mediante un ordenador.

Los ordenadores, los sistemas informáticos, los medios legibles por ordenador, los productos de programas 40 informáticos y similares han registrado o almacenado el ácido nucleico y las secuencias de polipéptidos de la invención. Según se utiliza en la presente memoria, las palabras "registrado" y "almacenado" hacen referencia a un procedimiento para almacenar información en un medio informático. Un experto en la técnica pueda adoptar fácilmente cualquier método conocido para registrar información en un medio legible por ordenador para generar construcciones que comprenden una o más de las secuencias ácido nucleico y/o de polipéptidos de la invención. 45

Las secuencias de polipéptidos sustancialmente idénticas, u homologas, hacen referencia a una secuencia de polipéptidos que tiene al menos una identidad de secuencia de 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, o más, o completa (100%) con la secuencia de aminoácidos de la invención SEQ ID NO: 160, una secuencia de polipéptidos de las secuencias de aminoácidos del Grupo B. 50

La homología se puede determinar utilizando cualquiera de los programas informáticos y los parámetros descritos de la presente memoria, incluyendo FASTA versión 3.0t78 con los parámetros por defecto o con parámetros modificados cualesquiera. Las secuencias homólogas se pueden obtener utilizando cualquiera de los procedimientos descritos en la presente memoria o pueden resultar de la corrección de un error de secuenciación. Los fragmentos 55 polipeptídicos comprenden al menos alrededor de 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500 o más aminoácidos consecutivos de los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas. Se apreciará que los códigos del polipéptido como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, se pueden representar en el formato de un solo carácter o en el formato de tres letras tradicional (Véase la contraportada de 60 Stryer, Lubert. Biochemistry, 3a Ed., W. H Freeman & Co., New York.) o en cualquier otro formato que refiera la identidad de los polipéptidos en una secuencia.

Una secuencia de ácido nucleico o polipéptido de la invención se puede almacenar, registrar, y manipular sobre cualquier medio que pueda ser leído y al que se pueda acceder mediante un ordenador. Según se utiliza en la presente memoria, las palabras "registrar" y "almacenar" hacen referencia a un procedimiento para almacenar información en un medio informático. Un experto en la técnica puede adoptar fácilmente cualquiera de los métodos conocidos en la actualidad para registrar información en un medio legible por ordenador para generar construcciones 5 que comprenden una o más de las secuencias de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, una o más de las secuencias de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas. Un medio legible por ordenador puede tener registradas al menos 2, 5, 10, 15, o 20 o más secuencias de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas. 10

Un medio legible por ordenador pueden tener registradas una o más de las secuencias de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas. Un medio legible por ordenador pueden tener registradas una o más de las secuencias de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas. Un medio legible por 15 ordenador puede tener registradas al menos 2, 5, 10, 15, o 20 o más de las secuencias como se ha mostrado anteriormente.

Los medios legibles por ordenador incluyen medios legibles magnéticamente, medios legibles ópticamente, medios legibles electrónicamente y medios magnéticos/ópticos. Por ejemplo, el los medios legibles por ordenador pueden 20 ser un disco duro, un disco flexible, una cinta magnética, un CD-ROM, un Disco Versátil Digital (DVD por "Digital Versatile Disk"), una Memoria de Acceso Aleatorio (RAM por "Random Access Memory"), o una Memoria de Solo Lectura Read Only Memory (ROM por " Read Only Memory") así como otros tipos de otros medios conocidos por los expertos en la técnica.

Los sistemas (p. ej., sistemas basados en Internet) incluyen sistemas informáticos que almacenan y manipulan la información de la secuencia descrita en la presente memoria. Un ejemplo de un sistema informático 100 se ilustra en forma de diagrama de bloques en la Figura 1. Según se utiliza en la presente memoria, "un sistema informático" hace referencia a los componentes del equipo físico, los componentes de soporte lógico y los componentes de almacenamiento de datos utilizados para analizar una secuencia de nucleótidos de una secuencia de ácido nucleico 30 como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B. El sistema informático 100 incluye típicamente un procesador para procesar, acceder y manipular los datos de secuencia. El procesador 105 puede ser cualquier unidad centras de proceso, tal como, por ejemplo, Pentium III de Intel Corporación, o un procesador similar de Sun, Motorola, Compaq, AMD o International Business Machines. 35

Típicamente el sistema informático 100 es un sistema de finalidad general que comprende el procesador 105 y uno o más componentes de almacenamiento de datos interno 110 para el almacenamiento de datos y uno o más dispositivos de recuperación de datos para recuperar los datos almacenados en los componentes de almacenamiento de datos. Un experto en la técnica apreciará fácilmente que son adecuados cualquiera de los 40 sistemas informáticos disponibles en la actualidad.

En un aspecto concreto, el sistema informático 100 incluye un procesador 105 conectado a un bus que está conectado a una memoria principal 115 (preferiblemente implementada como RAM) y uno o más dispositivos de almacenamiento de datos internos 110, tal como un disco duro y/u otros medios legibles por ordenador que tienen 45 datos registrados en el mismo. En algunos aspectos, el sistema informático 100 incluye adicionalmente uno o más dispositivos de recuperación de datos 118 para leer los datos almacenados en los dispositivos de almacenamiento de datos internos 110.

El dispositivo de recuperación de datos 118 puede representar, por ejemplo, una unidad para disco flexible, una 50 unidad para disco compacto, una unidad para cinta magnética, o un módem susceptible de conexión a un sistema de almacenamiento de datos remoto (p. ej., vía Internet) etc. En algunos aspectos, el dispositivo de almacenamiento de datos interno 110 es un medio legible por ordenador extraíble tal como un disco flexible, un disco compacto, una cinta magnética, etc. que contiene registrados lógica de control y/o datos. El sistema informático 100 puede incluir ventajosamente o ser programado por el soporte lógico apropiado para leer la lógica de control y/o los datos del 55 componente de almacenamiento de datos una vez insertados en el dispositivo de recuperación de datos.

El sistema informático 100 incluye una pantalla 120 que se utiliza para la visualización por un usuario del ordenador. También se debe observar que el sistema informático 100 puede estar conectado a otros sistemas informáticos 125a-c en una red o red de área extendida para proporcionar acceso centralizado al sistema informático 100. 60

El soporte lógico para acceder a, y procesar, las secuencias de nucleótidos de una secuencia de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias

esencialmente idénticas a éstas, (tales como las herramientas de búsqueda, las herramientas de comparación y las herramientas de modelado etc.) puede residir en la memoria principal 115 durante la ejecución.

En algunos aspectos, el sistema informático 100 puede comprender adicionalmente un algoritmo de comparación de secuencia para comparar una secuencia de ácido nucleico como se muestra en las secuencias de ácido nucleico del 5 Grupo A y secuencias esencialmente idénticas a éstas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, almacenado en un medio legible por ordenador con una o varias secuencias de nucleótidos o polipéptidos de referencia almacenadas en un medio legible por ordenador. Un "algoritmo de comparación de secuencia" hace referencia a uno o más programas que son implementados (localmente o remotamente) en el sistema informático 100 para comparar una secuencia de 10 nucleótidos con otras secuencias de nucleótidos y/o compuestos almacenados en los medios de almacenamiento de datos. Por ejemplo, el algoritmo de comparación de secuencia puede comparar las secuencias de nucleótidos de una secuencia de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, almacenada en un medio legible por 15 ordenador con secuencias de referencia almacenadas en un medio legible por ordenador para identificar homologías o motivos estructurales.

La Figura 2 es un diagrama de flujo que ilustra un aspecto de un procedimiento 200 para comparar un nuevo nucleótido o secuencia de proteínas con una base de datos de secuencias con el fin de determinar los niveles de 20 homología entre la nueva secuencia y las secuencias de la base de datos. La base de datos de secuencias puede se una base de datos privada almacenada en el sistema informático 100, o una base de datos pública GENBANK que está disponible a través de Internet.

El procedimiento 200 comienza en un estado de inicio 201 y a continuación se mueve a un estado 202 donde la 25 nueva secuencia que se va a comparar se almacena en una memoria en un sistema informático 100. Como se ha comentado anteriormente, la memoria podría ser cualquier tipo de memoria, incluyendo RAM o un dispositivo de almacenamiento interno.

El procedimiento 200 se mueve a continuación a un estado 204 donde una base de datos de secuencias se abre 30 para el análisis y la comparación. El procedimiento 200 se mueve a continuación a un estado 206 donde la primera secuencia almacenada en la base de datos se lee en una memoria en el ordenador. A continuación se realiza una comparación en un estado 210 para determinar si la primera secuencia es la misma que la segunda secuencia. Es importante observar que esta etapa no está limitada a la realización de una comparación exacta entre la nueva secuencia y la primera secuencia en la base de datos. Los métodos bien conocidos son conocidos por los expertos 35 en la técnica para comparar dos secuencias de nucleótidos o proteínas, incluso si no son idénticas. Por ejemplo, se pueden introducir espacios en una secuencia con el fin de aumentar el nivel de homología entre las dos secuencias sometidas a ensayo. Los parámetros que controlan si se introducen espacios u otras características en una secuencia durante la comparación son insertados normalmente por el usuario del sistema informático.

Una vez que se ha realizado una comparación de las dos secuencias en el estado 210, se realiza una determinación en un estado de decisión 210 si las dos secuencias son iguales. Por supuesto, el término "igual" no está limitado a secuencias que son absolutamente idénticas. Las secuencias que se encuentran dentro de los parámetros de homología introducidos por el usuario se marcarán como "igual" en el procedimiento 200.

Si se realiza una determinación de que las dos secuencias son iguales, el procedimiento 200 se mueve a un estado 214 donde se presenta al usuario el nombre de la secuencia de la base de datos. este estado notifica al usuario que la secuencia con el nombre presentado cumple las restricciones de homología que se habían introducido. Una vez que el nombre de la secuencia almacenada es presentado al usuario, el procedimiento 200 se mueve a un estado de decisión 218 donde se toma una determinación si existen más secuencias en la base de datos. Si no existen más 50 secuencias en la base de datos, el procedimiento 200 termina en un estado final 220. Sin embargo, si existen más secuencias en la base de datos, el procedimiento 200 se mueve a un estado 224 donde se mueve un puntero hasta la siguiente secuencia en la base de datos de manera que ésta se puede comparar con la nueva secuencia. De esta manera, la nueva secuencia se alinea y compara con cada secuencia de la base de datos.

Se debe observar que si se ha tomado la determinación en el estado de decisión 212 de que las secuencias no eran homólogas, el procedimiento 200 se movería inmediatamente al estado de decisión 218 con el fin de determinar si estarían disponibles otras secuencias cualesquiera en la base de datos para su comparación.

Por lo tanto, un sistema informático puede comprender un procesador, un dispositivo de almacenamiento de datos 60 que tiene almacenada una secuencia de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, un dispositivo de almacenamiento de datos que tiene almacenadas recuperablemente secuencias de nucleótidos o secuencias de

polipéptidos de referencia que se van a comparar con una secuencia de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas y una secuencia de comparación para llevar a cabo la comparación. La secuencia de comparación puede indicar un nivel de homología entre las secuencias comparadas o identificar motivos estructurales en el código de 5 ácido nucleico descrito anteriormente de las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, o puede identificar motivos estructurales en las secuencias que son comparadas con estos códigos de ácidos nucleicos y códigos de polipéptidos. En algunos aspectos, el dispositivo de almacenamiento de datos pueden tener almacenadas las secuencias de al menos 2, 5, 10, 15, 20, 25, 30 o 40 o más 10 de las secuencias de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o las secuencias de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas.

Un método para determinar el nivel de homología entre una secuencia de ácido nucleico como se muestra en las 15 secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, y una secuencia de nucleótidos de referencia incluye leer el código de ácido nucleico o el código de polipéptido y la secuencia de nucleótidos o polipéptidos de referencia a través del uso de un programa informático que determina los niveles de homología y determinar la homología entre el código de ácido nucleico o el código del 20 polipéptido y la secuencia de nucleótidos o polipéptidos de referencia con el programa informático. El programa informático puede ser cualquiera de varios programas informáticos para determinar niveles de homología, incluyendo los enumerados específicamente de la presente memoria, (p. ej., BLAST2N con los parámetros por defecto o con parámetros modificados cualesquiera). El método se puede implementar utilizando los sistemas informáticos descritos anteriormente. El método se puede realizar también leyendo al menos 2, 5, 10, 15, 20, 25, 30 o 40 o más 25 de la secuencias de ácido nucleico descritas anteriormente como se muestra en las secuencias de ácido nucleico del Grupo A, o las secuencias de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B a través del uso del programa informático y determinar homología entre el código de ácido nucleico o el código de polipéptidos y las secuencias de nucleótidos o las secuencias de polipéptidos de referencia.

La Figura 3 es un diagrama de flujo que ilustra un aspecto de un procedimiento 250 en un ordenador para determinar si dos secuencias son homólogas. El procedimiento 250 comienza en un estado de inicio 252 y se mueve a continuación a un estado 254 donde una primera secuencia que se va a comparar se almacena en una memoria. La segunda secuencia que se va a comparar se almacena a continuación en una memoria en un estado 256. El procedimiento 250 se mueve a continuación a un estado 260 donde el primer carácter en la primera secuencia se 35 lee y a continuación a un estado 262 donde se lee el primer carácter de la segunda secuencia. Se debe entender que si la secuencia es una secuencia de nucleótidos, el carácter sería normalmente A, T, C, G o U. Si la secuencia es una secuencia de proteínas, ésta está preferiblemente en el código de aminoácidos de una sola letra de manera que se pueden comprar fácilmente la primera y la segunda secuencias.

A continuación se realiza una determinación en un estado de decisión 264 si los dos caracteres son iguales. Si son iguales, el procedimiento 250 se mueve a un estado 268 donde se leen los siguientes caracteres en la primera y segunda secuencias. A continuación se realiza una determinación si los siguientes caracteres son iguales. Si lo son, el procedimiento 250 continúa este bucle hasta que dos caracteres no son iguales. Si se toma la determinación de que los dos caracteres siguientes no son iguales, el procedimiento 250 se mueve a un estado de decisión 274 para 45 determinar si hay algún otro carácter que cualquier secuencia lea.

Si no hay ningún carácter más para leer, el procedimiento 250 se mueve a un estado 276 donde el nivel de homología entre la primera y la segunda secuencias se presenta al usuario. El nivel de homología se determina calculando la proporción de caracteres entre las secuencias que fueron iguales del número total de secuencias en la 50 primera secuencia. De este modo, si cada carácter en una primera secuencia de 100 nucleótido se alineó con cada carácter en una segunda secuencia, el nivel de homología sería 100%.

Alternativamente, el programa informático puede ser un programa informático que compara las secuencias de nucleótidos de una secuencia de ácido nucleico como se muestra de la presente memoria, con una o más 55 secuencias de nucleótidos de referencia con el fin de determinar si el código de ácido nucleico de las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, difiere de una secuencia de ácido nucleico de referencia en una o más posiciones. Opcionalmente tal programa registra la longitud e identidad de los nucleótidos insertados, suprimidos o sustituidos con respecto a una secuencia del polinucleótido de referencia o a una secuencia de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias 60 esencialmente idénticas a éstas. El programa informático puede ser un programa que determina si una secuencia de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, contiene un polimorfismo de un solo nucleótido (SNP) con respecto a una secuencia de nucleótidos de referencia.

Un método para determinar si una secuencia de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, difiere en uno o más nucleótidos de una secuencia de nucleótidos de referencia comprende las etapas de leer el código de ácido nucleico y la secuencia de nucleótidos de referencia a través del uso de un programa informático que identifica diferencias entre secuencias de 5 ácido nucleico e identificar diferencias entre el código de ácido nucleico y la secuencia de nucleótidos de referencia con el programa informático. En algunos aspectos, el programa informático es un programa que identifica polimorfismos de un solo nucleótido. El método se puede implementar mediante los sistemas informáticos descritos anteriormente y el método ilustrado en la Figura 3. El método se puede realizar también leyendo al menos 2, 5, 10, 15, 20, 25, 30, o 40 o más de las secuencias de ácido nucleico como se muestra en las secuencias de ácido 10 nucleico del Grupo A y secuencias esencialmente idénticas a éstas y las secuencias de nucleótidos de referencia a través del uso del programa informático e identificar diferencias entre el código de ácido nucleicos y las secuencias de nucleótidos de referencia con el programa informático.

En otros aspectos el sistema informatizado puede comprender adicionalmente un identificador para identificar 15 características dentro de una secuencia de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas.

Un "identificador" hace referencia a uno o más programas que identifica ciertas características dentro de una 20 secuencia de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas. En un aspecto, el identificador puede comprender un programa que identifica un marco de lectura abierto en una secuencia de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas. 25

La Figura 4 es un diagrama de flujo que ilustra un aspecto de un procedimiento identificador 300 para detectar la presencia de una característica en una secuencia. El procedimiento 300 comienza en un estado de inicio 302 y se mueve a continuación a un estado 304 donde una primera secuencia que se va a verificar para determinar sus características se almacena en una memoria 115 en el sistema informático 100. El procedimiento 300 se mueve a 30 continuación a un estado 306 donde se abre una base de datos de características de secuencia. Tal base de datos incluiría una lista de cada uno de los atributos de las características junto con el nombre de la característica. Por ejemplo, una nombre de característica podría ser "Codón de Inicio" y el atributo sería "ATG". Otro ejemplo sería el nombre de la característica "Caja TAATAA" y el atributo de la característica sería "TAATAA". Un ejemplo de tal base de datos es producido por el University of Wisconsin Genetics Computer Group. Alternativamente, las características 35 pueden ser motivos polipeptídicos estructurales tales como hélices alfa, láminas beta, o motivos polipeptídicos funcionales tales como sitios activos enzimáticos, motivos hélice-giro-hélice o otros motivos conocidos por los expertos en la técnica.

Una vez que la base de datos de características se abre en el estado 306, el procedimiento 300 se mueve a un 40 estado 308 donde la primera característica se lee a partir de la base de datos. A continuación se realiza una comparación del atributo de la primera característica con la primera secuencia en un estado 310. Después se realiza una determinación en un estado de decisión 316 si se encontró el atributo de la característica en la primera secuencia. Si se encontró el atributo, el procedimiento 300 se mueve a un estado 318 donde se presenta al usuario el nombre de la característica encontrada. 45

El procedimiento 300 se mueve a continuación a un estado de decisión 320 donde se realiza una determinación de si existen características de desplazamiento en la base de datos. Si no existen más características, el procedimiento 300 termina en un estado final 324. Sin embargo, si existen más características en la base de datos, el procedimiento 300 lee la siguiente característica de la secuencia en un estado 326 y vuelve al estado 310 donde el 50 atributo de la siguiente característica se compara frente a la primera secuencia. Se debe observar que si no se encuentra el atributo de la característica en la primera secuencia en el estado de decisión 316, el procedimiento 300 se mueve directamente al estado de decisión 320 con el fin de determinar si existe cualquier otra característica en la base de datos.

Un método de identificación de una característica dentro de una secuencia de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, comprende leer el código del ácido o los ácidos nucleicos o el código del polipéptido o los polipéptidos a través del uso de un programa informático que identifica características e identificar características en el código del 60 ácido o los ácidos nucleicos con el programa informático. El programa informático puede comprender un programa informático que identifica marcos de lectura abiertos. El método se puede realizar leyendo una sola secuencia o al menos 2, 5, 10, 15, 20, 25, 30, o 40 de las secuencias de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o las secuencias de polipéptidos como se

muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, a través del uso del programa informático e identificar características dentro del código de ácido nucleicos o el código de polipéptidos con el programa informático.

Una secuencia de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias 5 esencialmente idénticas a éstas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, se puede almacenar y manipular en una variedad de programas de tratamiento de datos en una variedad de formatos. Por ejemplo, una secuencia de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y 10 secuencias esencialmente idénticas a éstas, se pueden almacenar en forma de texto en un archivo de tratamiento de texto, tal como Microsoft WORD™ o WORDPERFECT™ o en forma de un archivo ASCII en una variedad de programas de base de datos familiares para los expertos en la técnica, tales como DB2™, SYBASE™, o ORACLE™. Además, muchos programas informáticos y bases de datos se pueden utilizar como algoritmo de comparación de secuencias, identificadores, o fuentes de secuencias de nucleótidos o secuencias de polipéptidos 15 de referencia que se van a comparar con una secuencia de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas. Se pretende que la siguiente lista no limite la invención pero proporcione apoyo a los programas y bases de datos que son útiles con las secuencias de ácido nucleico como se muestra en las secuencias de ácido nucleico del Grupo A y 20 secuencias esencialmente idénticas a éstas, o las secuencias de polipéptidos como se muestra en las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas.

Los programas y bases de datos que se pueden utilizar incluyen, pero no están limitados a: MacPattem (EMBL), DiscoveryBase (Molecular Applications Group), GeneMine (Molecular Applications Group), Look (Molecular 25 Applications Group), MacLook (Molecular Applications Group), BLAST y BLAST2 (NCBI), BLASTN y BLASTX (Altschul et al, J. Mol. Biol. 215: 403, 1990), FASTA (Pearson y Lipman, Proc. Natl. Acad. Sci. USA, 85: 2444, 1988), FASTDB (Brutlag et al. Comp. Apágs. Biosci. 6:237-245, 1990), Catalyst (Molecular Simulations Inc.), Catalyst/SHAPE (Molecular Simulations Inc.), Cerius2. DBAccess (Molecular Simulations Inc.), HypoGen (Molecular Simulations Inc.), Insight II, (Molecular Simulations Inc.), Discover (Molecular Simulations Inc.), CHARMm (Molecular 30 Simulations Inc.), Felix (Molecular Simulations Inc.), DelPhi, (Molecular Simulations Inc.), QuanteMM, (Molecular Simulations Inc.), Homology (Molecular Simulations Inc.), Modeler (Molecular Simulations Inc.), ISIS (Molecular Simulations Inc.), Quanta/Protein Design (Molecular Simulations Inc.), WebLab (Molecular Simulations Inc.), WebLab Diversity Explorer (Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.), SeqFold (Molecular Simulations Inc.), la base de datos MDL Available Chemicals Directory, la base de datos MDL Drug Data Report, la 35 base de datos Comprehensive Medicinal Chemistry, la base de datos Derwents's World Drug Index, la base de datos BioByteMasterFile, la base de datos Genbank y la base de datos Genseqn. Muchos otros programas y bases de datos resultarían evidentes para los expertos en la técnica dada la presente descripción.

Los motivos que se pueden detectar utilizando los programas anteriores incluyen las secuencias que codifican 40 cremalleras de leucina, motivos hélice-giro-hélice, sitios de glicosilación, sitios de ubicuitinación, hélices alfa y láminas beta, secuencias señal que codifican péptidos señal que dirigen la secreción de las proteínas codificadas, secuencias implicadas en la regulación de la transcripción tales como secuencias homeobox, tramos ácidos, sitios activos enzimáticos, sitios de unión al sustrato y sitios de escisión enzimática.

Hibridación de ácidos nucleicos

La invención proporciona ácidos nucleicos recombinantes o aislados que hibridan en condiciones restrictivas con los ácidos nucleicos de la invención.

Las condiciones restrictivas pueden ser condiciones altamente restrictivas, condiciones restrictivas intermedias y/o 50 condiciones poco restrictivas, incluyendo las condiciones altamente restrictivas y poco restrictivas descritas en la presente memoria. En un aspecto, es el rigor de las condiciones de lavado el que establece las condiciones que determinan si un ácido nucleico se encuentra dentro del alcance de la invención, como se comenta más abajo.

En aspectos alternativos, los ácidos nucleicos de la invención definidos por su capacidad para hibridar en 55 condiciones restrictivas pueden estar entre alrededor de cinco residuos y la longitud completa del ácido nucleico de la invención; p. ej., pueden tener al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 55, 60, 65, 70, 75, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, o más, residuos de longitud. También se incluyen los ácidos nucleicos más cortos que la longitud completa. Estos ácidos nucleicos pueden se útiles, p. ej., como sondas de hibridación, sondas de marcaje, sondas oligonucleotídicas para PCR, ARNi (de hebra 60 sencilla o doble), secuencias antisentido o secuencias que codifican péptidos de unión a anticuerpos (epítopos), motivos, sitios activos y similares.

En un aspecto, los ácidos nucleicos de la invención se definen por su capacidad para hibridar en condiciones altamente restrictivas que comprenden condiciones en formamida de alrededor de 50% a alrededor de 37°C a 42°C. En un aspecto, los ácidos nucleicos de la invención se definen por su capacidad para hibridar en condiciones poco restrictivas que comprende condiciones en formamida de alrededor de 35% a 25% a alrededor de 30°C a 35°C.

Alternativamente, ácidos nucleicos de la invención se definen por su capacidad para hibridar en condiciones altamente restrictivas que comprende condiciones a 42°C en formamida al 50%, 5X SSPE, SDS al 0,3%, y una secuencia repetitiva que bloquea el ácido nucleico, tal como cot-1 o ADN de esperma de salmón (p. ej., 200 n/ml ADN de esperma de salmón sometido a cizalladura y desnaturalizado). En un aspecto, ácidos nucleicos de la invención se definen por su capacidad para hibridar en condiciones poco restrictivas que comprenden formamida al 10 35% a una temperatura reducida de 35°C.

En las reacciones de hibridación de ácido nucleico, las condiciones utilizadas para lograr un nivel de rigor concreto variarán, dependiendo de la naturaleza de los ácidos nucleicos que estén hibridando. Por ejemplo, la longitud, el grado de complementariedad, la composición de la secuencia de nucleótidos (p. ej., contenido de GC vs. AT) y el 15 tipo de ácido nucleico (p. ej., ARN vs. ADN) de las regiones hibridantes de los ácidos nucleicos se pueden considerar al seleccionar las condiciones de hibridación. Una consideración adicional es si uno de los ácidos nucleicos está inmovilizado, por ejemplo, sobre un filtro.

La hibridación se puede llevar a cabo en condiciones poco restrictivas, moderadamente restrictivas o altamente 20 restrictivas. Como ejemplo de una hibridación de ácido nucleico, una membrana polimérica que contiene ácidos nucleicos desnaturalizados inmovilizados se prehibrida en primer lugar durante 30 minutos a 45°C en una solución que consiste en NaCl 0,9 M, NaH2PO4 50 mM, pH 7,0, Na2EDTA 5,0 mM, SDS al 0,5%, 10X Denhardt y ácido polirriboadenílico de 0,5 mg/ml. Después se añaden a la solución aproximadamente 2X107 cpm (actividad específica 4-9 X108 cpm/ug) de sonda oligonucleotídica marcada en el extremo con P32. Al cabo de 12-16 horas de incubación, 25 la membrana se lava durante 30 minutos a temperatura ambiente en 1X SET (NaCl 150 mM, Tris-hidrocloruro 20 mM, pH 7,8, Na2EDTA 1 mM) que contiene SDS al 0,5%, seguido de un lavado de 30 minutos en 1X SET de nueva aportación a Tm-10°C para la sonda oligonucleotídica. La membrana se expone a continuación a una película autorradiográfica para la detección de las señales de hibridación.

Se podría considerar que todas las hibridaciones precedentes fueron en condiciones altamente restrictivas.

Después de la hibridación, se puede lavar un filtro para eliminar cualquier sonda detectable no unida específicamente. Las condiciones restrictivas utilizadas para lavar los filtros se pueden variar dependiendo de la naturaleza de los ácidos nucleicos que estén siendo hibridados, la longitud de los ácidos nucleicos que estén siendo 35 hibridados, el grado de complementariedad, la composición de la secuencia de nucleótidos (p. ej., contenido de GC vs. AT) y el tipo de ácido nucleico (p. ej., ARN vs. DNA). Los ejemplos de los lavados con condiciones restrictivas progresivamente altas son los siguientes: 2X SSC, SDS al 0,1% a temperatura ambiente durante 15 minutos (condiciones poco restrictivas); 0,1X SSC, SDS al 0,5% a temperatura ambiente durante 30 minutos a 1 hora (condiciones moderadamente restrictivas); 0,1X SSC, SDS al 0,5% durante 15 a 30 minutos entre la temperatura de 40 hibridación y 68°C (condiciones altamente restrictivas); y NaCl 0,15 M durante 15 minutos a 72°C (condiciones muy restrictivas). Se puede llevar a cabo un lavado final en condiciones restrictivas en 0,1X SSC a temperatura ambiente. Los Ejemplos anteriores son meramente ilustrativos de un conjunto de condiciones que se pueden utilizar para lavar filtros. Un experto en la técnica conocerá que existen numerosas fórmulas para los lavados en diferentes condiciones restrictivas. Algunos otros Ejemplos se proporcionan más abajo. 45

Los ácidos nucleicos que han hibridado con la sonda se identifican mediante autorradiografía u otras técnicas convencionales.

El procedimiento anterior se puede modificar para identificar ácidos nucleicos que tienen niveles decrecientes de 50 homología con la secuencia de la sonda. Por ejemplo, para obtener ácidos nucleicos de homología decreciente con la sonda detectable, se pueden utilizar condiciones menos restrictivas. Por ejemplo, la temperatura de hibridación puede disminuir en incrementos de 5°C de 68°C a 42°C en un tampón de hibridación que tiene una concentración de Na+ de aproximadamente 1M. Después de la hibridación, el filtro se puede lavar con 2X SSC, SDS al 0,5% a la temperatura de hibridación. Se considera que estas condiciones son condiciones "moderadas" por encima de 50°C y 55 condiciones "bajas" por debajo de 50°C. Un ejemplo específico de condiciones de hibridación "moderadas" se produce cuando la hibridación anterior se lleva a cabo a 55°C. Un ejemplo específico de condiciones de hibridación "poco restrictivas" se produce cuando la hibridación anterior se lleva a cabo a 45°C.

Alternativamente, la hibridación se puede llevar a cabo en tampones, tales como 6X SSC, que contienen formamida 60 a una temperatura de 42°C. En este caso, la concentración de formamida en el tampón de hibridación se puede reducir en incrementos de 5% de 50% a 0% para identificar los clones que tienen niveles decrecientes de homología con la sonda. Después de la hibridación, el filtro se puede lavar con 6X SSC, SDS al 0,5% a 50°C. Se considera que estas condiciones son condiciones "moderadas" por encima de formamida al 25% y condiciones "bajas" por debajo

de formamida al 25%. Un ejemplo específico de condiciones de hibridación "moderadas" se produce cuando la hibridación anterior se lleva a cabo en formamida al 30%. Un ejemplo específico de condiciones de hibridación "poco restrictivas" se produce cuando la hibridación anterior se lleva a cabo en formamida al 10%.

Sin embargo, la selección de un formato de hibridación no escrítico – es el rigor de las condiciones de lavado el que 5 establece las condiciones que determinan si un ácido nucleico se encuentra dentro del alcance de la invención. Las condiciones de lavado utilizadas para identificar los ácidos nucleicos dentro del alcance de la invención incluyen, p. ej.: una concentración de sal de alrededor de 0,02 molar a pH 7 y a una temperatura de al menos alrededor de 50°C o alrededor de 55°C a alrededor de 60°C; o, una concentración de sal de alrededor de NaCl 0,15 M a 72°C durante alrededor de 15 minutos; o, una concentración de sal de alrededor de 0,2X SSC a una temperatura de al menos 10 alrededor de 50°C o alrededor de 55°C a alrededor de 60°C durante alrededor de 15 a alrededor de 20 minutos; o, el complejo de hibridación se lava dos veces con una solución con una concentración de sal de alrededor de 2X SSC que contiene SDS al 0,1% a temperatura ambiente durante 15 minutos y a continuación se lava dos veces con 0,1X SSC que contiene SDS al 0,1% at 68ºC durante 15 minutos; o, condiciones equivalentes. Véase Sambrook, Tijssen y Ausubel para una descripción de un tampón SSC y condiciones equivalentes. 15

Estos métodos se pueden utilizar para aislar los ácidos nucleicos de la invención. Por ejemplo, los métodos precedentes se pueden utilizar para aislar ácidos nucleicos que tienen una secuencia con una homología de al menos alrededor de 97%, al menos 95%, al menos 90%, al menos 85%, al menos 80%, al menos 75%, al menos 70%, al menos 65%, al menos 60%, al menos 55%, o al menos 50% con una secuencia de ácido nucleico 20 seleccionada del grupo que consiste en una de las secuencias de las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o fragmentos que comprenden al menos alrededor de 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, o 500 bases consecutivas de las mismas y las secuencias complementarias a éstas. La homología se puede medir utilizando el algoritmo de alineamiento. Por ejemplo, los polinucleótidos homólogos pueden tener una secuencia codificante que es una variante alélica de origen natural de 25 una de las secuencias codificantes descritas en la presente memoria. Tales variantes alélicas pueden tener una sustitución, deleción o adición de uno o más nucleótidos cuando se comparan con los ácidos nucleicos de las secuencias de ácido nucleico del Grupo A o las secuencias complementarias a éstas.

Adicionalmente, los procedimientos anteriores se pueden utilizar para aislar ácidos nucleicos que codifican 30 polipéptidos que tienen una homología de al menos alrededor de 99%, 95%, al menos 90%, al menos 85%, al menos 80%, al menos 75%, al menos 70%, al menos 65%, al menos 60%, al menos 55%, o al menos 50% con un polipéptido que tiene la secuencia de una de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de las mismos según se determina utilizando un algoritmo de alineamiento de 35 secuencias (p. ej., tal como el algoritmo FASTA versión 3.0t78 con los parámetros por defecto).

Sondas Oligonucleotídicas y métodos para su utilización

La invención también proporciona sondas de ácidos nucleicos que se pueden usar, p. ej., para identificar ácidos 40 nucleicos que codifican un polipéptido con una actividad xilanasa o fragmentos del mismo o para identificar genes de xilanasa. En un aspecto, la sonda comprende al menos 10 bases consecutivas de un ácido nucleico de la invención. Alternativamente, una sonda de la invención puede tener al menos alrededor de 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 150 o alrededor de 10 a 50, alrededor de 20 a 60 alrededor de 30 a 70, bases consecutivas de una secuencia como la mostrada en un ácido 45 nucleico de la invención. Las sondas identifican un ácido nucleico mediante unión y/o hibridación. Las sondas se pueden utilizar en matrices de la invención, véase la discusión de más abajo, incluyendo, p. ej., matrices capilares. Las sondas de la invención también se pueden utilizar para aislar otros ácidos nucleicos o polipéptidos.

Los ácidos nucleicos aislados de las secuencias de ácido nucleico del Grupo A y secuencias esencialmente 50 idénticas a éstas, las secuencias complementarias a éstas, o un fragmento que comprende al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, o 500 bases consecutivas de una de las secuencias de las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o las secuencias complementarias a éstas también se pueden utilizar como sondas para determinar si una muestra biológica, tal como una muestra de suelo, contiene un organismo que tiene una secuencia de ácido nucleico de la invención o un organismo del que se 55 obtuvo el ácido nucleico. En tales procedimientos, se obtiene la muestra biológica que alberga potencialmente el organismo a partir del cual se aisló el ácido nucleico y se obtienen los ácidos nucleicos de la muestra. Los ácidos nucleicos se ponen en contacto con la sonda en condiciones que permiten que la sonda hibride específicamente con secuencias complementarias cualesquiera de las que están presentes.

Cuando sea necesario, las condiciones que permiten que la sonda hibride específicamente con secuencias complementarias se pueden determinar colocando la sonda en contacto con secuencias complementarias de muestras que se sabe que contienen la secuencia complementaria así como secuencias de control que no contienen la secuencia complementaria. Las condiciones de hibridación, tales como la concentración de las del tampón de

hibridación, la concentración de formamida del tampón de hibridación, o la temperatura de hibridación, pueden variarse para identificar las condiciones que permitan que la sonda hibride específicamente con los ácidos nucleicos complementarios.

Si la muestra contiene el organismo del cual se aisló el ácido nucleico, a continuación se detecta la hibridación 5 específica de la sonda. La hibridación se puede detectar marcando la sonda con un agente detectable tal como un isótopo radiactivo, un colorante fluorescente o una enzima capaz de catalizar la formación de un producto detectable.

Muchos métodos de utilización de sondas marcadas para detectar la presencia de ácidos nucleicos 10 complementarios en una muestra son familiares para los expertos en la técnica. Estos incluyen Transferencias de Southern, Transferencias Northern, procedimientos de hibridación de colonias y transferencias puntuales. Los protocolos para cada uno de estos procedimientos son proporcionados por Ausubel et al. en Current Protocols en Molecular Biology, John Wiley 503 Sons, Inc. (1997) y Sambrook et al., Molecular Cloning: A Laboratory Manual 2a Ed., Cold Spring Harbor Laboratory Press (1989. 15

Alternativamente, se puede utilizar más de una sonda (al menos una que sea capaz de hibridar específicamente con secuencias complementarias cualesquiera que estén presentes en la muestra de ácido nucleico), en una reacción de amplificación para determinar si la muestra contiene un organismo que contiene una secuencia de ácido nucleico de la invención (p. ej., un organismo del cual se aisló el ácido nucleico). Típicamente, las sondas comprenden 20 oligonucleótidos. En un aspecto, la reacción de amplificación puede comprender una reacción PCR. Los protocolos de PCR son descritos por Ausubel y Sambrook, supra. Alternativamente, la amplificación puede comprender una reacción en cadena de la ligasa, 3SR, o una reacción de desplazamiento de la hebra. (Véanse Barany, F., "The Ligase Chain Reaction in a PCR World", PCR Methods and Applications 1:5-16,1991; E. Fahy et al., "Self-sustained Sequence Replication (3SR): An Isothermal Transcription-based Amplification System Alternative to PCR", PCR 25 Methods and Applications 1:25-33, 1991; y Walker G.T. et al., "Strand Displacement Amplification-an Isothermal in vitro ADN Amplification Technique", Nucleic Acid Research 20:1691-1696, 1992). En tales procedimientos, los ácidos nucleicos de la muestra se ponen en contacto con las sondas, se realiza la reacción de amplificación y se detecta cualquier producto de amplificación resultante. El producto de amplificación se puede detectar realizando la electroforesis en gel de los productos de reacción y tiñendo el gel con un intercalador tal como bromuro de etidio.. 30 Alternativamente, una o más de las sondas se pueden aislar con un isótopo radioactivo y se puede detectar la presencia de un producto de amplificación radiactivo mediante autorradiografía después de la electroforesis en gel.

Las sondas derivadas de las secuencias próximas a los extremos de las secuencias de las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, se pueden utilizar también en procedimientos de 35 paseo cromosómico para identificar clones que contienen secuencias genómicas localizadas adyacentes a las secuencias de las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas. Tales métodos permiten el aislamiento de genes que codifican proteínas adicionales del organismo anfitrión.

Los ácidos nucleicos aislados de las secuencias de ácido nucleico del Grupo A y secuencias esencialmente 40 idénticas a éstas, las secuencias complementarias a éstas, o un fragmento que comprende al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, o 500 bases consecutivas de una de las secuencias de las secuencias de ácido nucleico del Grupo A y secuencias esencialmente idénticas a éstas, o las secuencias complementarias a éstas se pueden utilizar como sondas para identificar y aislar ácidos nucleicos relacionados. En algunos aspectos, los ácidos nucleicos relacionados pueden ser ADNc o ADN genómicos de organismos distintos del que se aislado el 45 ácido nucleico. Por ejemplo, los otros organismos pueden ser organismos relacionados. En tales procedimientos, un ácido nucleico muestra se pone en contacto con la sonda en condiciones que permitan a la sonda hibridar específicamente con secuencias relacionadas. La hibridación de la sonda con ácidos nucleicos del organismo relacionado se detecta a continuación utilizando cualquiera de los métodos descritos anteriormente.

Variando el rigor de las condiciones de hibridación utilizadas para identificar ácidos nucleicos, tales como ADNc o ADN genómicos, que hibridan con la sonda detectable, se pueden identificar y aislar ácidos nucleicos que tienen diferentes niveles de homología con la sonda. Las condiciones restrictivas se pueden variar llevando a cabo la hibridación a temperaturas variables por debajo de las temperaturas de fusión de las sondas. La las sondas, Tm, es la temperatura (a una fuerza iónica y pH definidos) a la que 50% de la secuencia diana hibrida con una sonda 55 perfectamente complementaria. Se seleccionan condiciones muy restrictivas que sean iguales o alrededor de 5°C inferiores que la Tm de una sonda concreta. La las sondas de la sonda se puede calcular utilizando las siguientes formulas:

Para sondas entre 14 y 70 nucleótidos de longitud la temperatura de fusión (Tm) se calcula utilizando la 60 formula: Tm=81,5+16,6(log [Na+])+0,41(fracción G+C)-(600/N) donde N es la longitud de la sonda.

Si la hibridación se lleva a cabo en una solución que contiene formamida, la temperatura de fusión se puede calcular utilizando la ecuación: Tm=81,5+16,6(log[Na+])+0,41(fracción G+C)-(0,63% formamida)-(600/N) donde N es la longitud de la sonda.

La prehibridación se puede llevar a cabo en 6X SSC, 5X reactivo de Denhardt, SDS al 0,5%, 100 µg de ADN de esperma de salmón fragmentado desnaturalizado o 6X SSC, 5X reactivo de Denhardt, SDS al 0,5%, 100 µg de ADN de esperma de salmón fragmentado desnaturalizado, formamida al 50%. Las fórmulas para las soluciones de SSC y Denhardt son enumeradas por Sambrook et al., supra. 5

La hibridación se lleva a cabo añadiendo la sonda detectable a las soluciones de prehibridación enumeradas anteriormente. Cuando la sonda comprende ADN de doble hebra, este se desnaturaliza antes de su adición a la solución de hibridación. El filtro se pone en contacto con la solución de hibridación durante un período de tiempo suficiente para permitir que la sonda hibride con los ADNc o los ADN genómicos que contienen secuencias 10 complementarias a estas y homólogas a estas. Para sondas de más de 200 nucleótidos de longitud, la hibridación se puede llevar a cabo a 15-25°C por debajo de la Tm. Para sondas más cortas, tales como las sondas oligonucleotídicas, la hibridación se puede llevar a cabo a 5-10°C por debajo de la Tm. Típicamente, para las hibridaciones en 6X SSC, la hibridación se lleva a cabo a aproximadamente 68°C. Usualmente, para las hibridaciones en soluciones que contienen formamida al 50%, la hibridación se lleva a cabo a aproximadamente 15 42°C.

Inhibición de la Expresión de las Xilanasas

La invención proporciona ácidos nucleicos complementarios a (p. ej., secuencias antisentido a) los ácidos nucleicos 20 de la invención, p. ej., ácidos nucleicos que codifican xilanasa. Las secuencias antisentido son capaces de inhibir el transporte, el empalme o la transcripción de genes que codifican xilanasa. La inhibición se puede efectuar a través de la elección como diana de ADN genómico o ARN mensajero. La transcripción o la función del ácido nucleico elegido como diana se puede inhibir, por ejemplo, mediante hibridación y/o escisión. Un grupo particularmente útil de inhibidores proporcionado por la presente invención incluye oligonucleótidos que son capaces de unirse al gen de la 25 xilanasa o a su mensaje, evitando o inhibiendo en cualquier caso la producción o la función de la xilanasa. La asociación puede ser a través de hibridación específica de la secuencia. Otra clase útil de inhibidores incluye oligonucleótidos que ocasionan la inactivación o la escisión del mensaje de la xilanasa. El oligonucleótido puede tener una actividad enzimática que causa tal escisión, tal como ribozimas. El oligonucleótido puede ser modificado químicamente o conjugado con una enzima o composición capaz de escindir el ácido nucleico complementario. Se 30 puede escrutar una asociación de muchos de estos oligonucleótidos diferentes para determinar los que tienen la actividad deseada. De este modo, la invención proporciona diversas composiciones para la inhibición de la expresión de la xilanasa en un nivel de ácido nucleico y/o proteína, p. ej., secuencias antisentido, ARNi y ribozimas que comprenden secuencias de xilanasa de la invención y los anticuerpos anti-xilanasa de la invención.

La inhibición de la expresión de la xilanasa puede tener una variedad de aplicaciones industriales. Por ejemplo, la inhibición de expresión de la xilanasa puede ralentizar o evitar la descomposición. La descomposición puede ocurrir cuando se degradan enzimáticamente polisacáridos, p. ej., polisacáridos estructurales. Esto puede conducir al deterioro, o podredumbre, de frutos y hortalizas. En un aspecto, las composiciones de la invención que inhiben la expresión y/o la actividad de las xilanasas, p. ej., anticuerpos, oligonucleótidos antisentido, ribozimas y ARNi, se 40 utilizan para ralentizar o evitar la descomposición. La aplicación sobre una planta o producto vegetal (p. ej., un cereal, un grano, un fruto, semilla, raíz, hoja, etc.) de anticuerpos, oligonucleótidos antisentido, ribozimas y ARNi de la invención puede ralentizar o evitar la descomposición. Estas composiciones también puede ser expresadas por la planta (p. ej., una planta transgénica) u otro organismo (p. ej., una bacteria u otro microorganismo transformado con un gen de xilanasa de la invención). 45

Las composiciones de la invención para la inhibición de la expresión de la xilanasa (p. ej., secuencias antisentido, ARNi, ribozimas, anticuerpos) se pueden utilizar como composiciones farmacéuticas, p. ej., como agentes antipatógenos o en otras terapias, p. ej., como anti-microbianos para, p. ej., Salmonella.

Oligonucleótidos Antisentido

Los oligonucleótidos antisentido capaces de unirse al mensaje de la xilanasa pueden inhibir la actividad xilano hidrolasa (p. ej., catalizando la hidrólisis de enlaces β-1,4-xilosídicos internos) eligiendo como diana el ARNm. Las estrategias para el diseño de oligonucleótidos antisentido están bien descritas en la bibliografía científica y de 55 patentes, y el experto en la técnica puede diseñar tales oligonucleótidos de xilanasa utilizando los reactivos de la invención novedosos. Por ejemplo, los protocolos de paseo cromosómico/cartografiado de ARN para escrutar los oligonucleótidos antisentido eficaces son bien conocidos en la técnica, véase, p. ej., Ho (2000) Methods Enzymol. 314:168-183, que describe una prueba de cartografiado de ARN, que está basado en técnicas moleculares convencionales para proporcionar un método fácil y fiable para la selección potente de secuencias antisentido. 60 Véase también Smith (2000) Eur. J. Pharm. Sci. 11:191-198.

Los ácidos nucleicos de origen natural se utilizan como oligonucleótidos antisentido. Los oligonucleótidos antisentido pueden ser de cualquier longitud; por ejemplo, en aspectos alternativos, los oligonucleótidos antisentido tienen entre

alrededor de 5 a 100, alrededor de 10 a 80, alrededor de 15 a 60, alrededor de 18 a 40. La longitud óptima se puede determinar mediante escrutinio rutinario. Los oligonucleótidos antisentido pueden estar presentes a cualquier concentración. La concentración óptima se puede determinar mediante escrutinio rutinario. Se conoce una amplia gama de análogos de nucleótidos y ácidos nucleicos de origen no natural, sintéticos que pueden abordar este problema potencial. Por ejemplo, se pueden utilizar ácidos peptidonucleicos (PNA) que contiene cadenas principales 5 no iónicas, tales como unidades de N-(2-aminoetil)glicina. También se pueden utilizar oligonucleótidos antisentido que tienen conexiones fosforotioato, como se describe en los documentos WO 97/03211; WO 96/39154; Mata (1997) Toxicol Appl Pharmacol 144:189-197; Antisense Therapeutics, ed. Agrawal (Humana Press, Totowa, N.J., 1996). Los oligonucleótidos antisentido que tienen análogos de la cadena principal de ADN sintéticos proporcionados por la invención también pueden incluir fosforo-ditioato, metilfosfonato, fosforamidato, 10 alquilfosfotriésteres, sulfamato, 3'-tioacetal, metileno(metilimino), 3'-N-carbamato, y ácidos morfolinocarbamato- nucleicos, como se ha descrito anteriormente.

Se puede utilizar metodología química combinatoria para crear un enorme número de oligonucleótidos que se pueden escrutar rápidamente para determinar los oligonucleótidos específicos que tienen afinidades y 15 especificidades de unión apropiadas hacia cualquier diana, tal como the secuencias de xilanasa directa y antisentido de la invención (véase, p. ej., Gold (1995) J. de Biol. Chem. 270:13581-13584).

Ribozimas Inhibidoras

La invención proporciona ribozimas capaces de unirse al mensaje de la xilanasa. Estas ribozimas pueden inhibir la actividad xilanasa, p. ej., eligiendo como diana el ARNm. Las estrategias diseñar ribozimas y seleccionar la secuencia antisentido específica de xilanasa para elegirla como diana están bien descritas en la bibliografía científica y de patentes, y el experto en la técnica puede diseñar tales ribozimas utilizando los reactivos novedosos de la invención. Las ribozimas actúan uniéndose a un ARN diana a través de la porción de unión al ARN diana de 25 una ribozima que es mantenida en íntima proximidad con una porción enzimática del ARN que escinde el ARN diana. De este modo, la ribozima reconoce y se une a una diana de ARN a través de los pares de bases complementarios, y una vez unida en el sitio correcto, actúa enzimáticamente para escindir e inactivar el ARN diana. La escisión de un ARN diana de esta manera destruirá su capacidad para dirigir la síntesis de una proteína codificada si la escisión ocurre en la secuencia codificante. Después de que se ha unido una ribozima y escindido su 30 diana de ARN, ésta se puede liberar de ese ARN para unirse y escindir nuevas dianas repetidamente.

En ciertas circunstancias, la naturaleza enzimática de una ribozima puede ser ventajosa sobre otras tecnologías, tales como la tecnología antisentido (donde una molécula de ácido nucleico se une simplemente a un ácido nucleico diana para bloquear su transcripción, translación o asociación con otra molécula) puesto que la concentración eficaz 35 de ribozima necesaria para efectuar un tratamiento terapéutico puede se inferior que la de un oligonucleótido antisentido. Esta ventaja potencial refleja la capacidad de la ribozima para actuar enzimáticamente. De este modo, una sola molécula de ribozima es capaz de escindir muchas moléculas de ARN diana. Además, una ribozima es típicamente un inhibidor altamente específico, dependiendo la especificidad de inhibición no solo de mecanismo de emparejamiento de bases, sino también del mecanismo por medio del cual la molécula inhibe la expresión del ARN 40 al que se une. Esto es, la inhibición está causada por la escisión de la diana de ARN y de ese modo la especificidad se define como la proporción de la velocidad de escisión del ARN elegido como diana sobre la velocidad de escisión del ARN no elegido como diana. Este mecanismo de escisión depende de factores adicionales a aquellos implicados en el emparejamiento de bases. De este modo, la especificidad de acción de una ribozima puede ser mayor que la de yb oligonucleótido antisentido que se une al mismo sitio del ARN. 45

La ribozima de la invención, p. ej., una molécula de ARN ribozima enzimática, se puede formar en un motivo cabeza de martillo, un motivo en horquilla, como un motivo del virus delta de la hepatitis, un motivo de intrón del grupo I y/o un ARN de tipo RNasaP asociado con una secuencia guía de ARN. Los ejemplos de los motivos cabeza de martillo son descritos, p. ej., por Rossi (1992) Aids Research and Human Retrovirus 8:183; los motivos en horquilla por 50 Hampel (1989) Biochemistry 28:4929, y Hampel (1990) Nuc. Acids Res. 18:299; el motivo del virus delta de la hepatitis por Perrotta (1992) Biochemistry 31:16; el motivo RNasaP por Guerrier-Takada (1983) Cell 35:849; y el intrón del grupo I por Cech Patente de los Estados Unidos Núm. 4.987.071. No se pretende que la enumeración de estos motivos específicos sea limitante. Los expertos en la técnica advertirán que una ribozima de la invención, p. ej., una molécula de ARN enzimática de esta invención, puede tener un sitio de unión al sustrato específico 55 complementario a uno o más de las regiones de ARN del gen diana. A ribozima de la invención puede tener una secuencia de nucleótidos en o rodeando a ese sitio de unión al sustrato que confiere una actividad de escisión de ARN a la molécula.

Interferencia por ARN (ARNi) 60

En un aspecto, la invención proporciona una molécula inhibidora de ARN, denominada moléculas de "ARNi", que comprende una secuencia de xilanasa de la invención. La molécula de ARNi comprende una molécula de ARN de doble hebra (ARNdh). El ARNi puede inhibir la expresión de un gen de xilanasa. En un aspecto, el ARNi tiene

alrededor de 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 o más nucleótidos dúplex de longitud. Mientras que la invención no está limitada por cualquier mecanismo de acción concreto, el ARNi pueden entrar en una célula y causar la degradación de un ARN de hebra sencilla (ARNhs) de secuencias similares o idénticos, incluyendo ARNm endógenos. Cuando una célula se expone a ARN de doble hebra (ARNdh), el ARNm del gen homólogo es degradado selectivamente por un procedimiento denominado interferencia por ARN (RNAi). Un posible mecanismo 5 básico detrás del ARNi es la rotura de un ARN de doble hebra (ARNdh) emparejando una secuencia de genes específica en piezas cortas denominado ARN interferente corto, que desencadena la degradación del ARNm que empareja su secuencia. En un aspecto, los ARNi de la invención se utilizan en agentes terapéuticos silenciadores de genes, véase, p. ej., Shuey (2002) Drug Discov. Today 7:1040-1046. En un aspecto, la invención proporciona métodos para degradas selectivamente ARN utilizando los ARNi de la invención. El procedimiento se puede poner 10 en práctica in vitro, ex vivo o in vivo. En un aspecto, las moléculas de ARNi moléculas de la invención se pueden utilizar para generar una mutación de pérdida de función en una célula, un órgano o un animal. Los métodos para elaborar y utilizar las moléculas ARNi para degradar selectivamente ARN son bien conocidos en la técnica, véase, p. ej., las Patentes de los Estados Unidos Núms. 6.506.559; 6.511.824; 6.515.109; 6.489.127.

Modificación de Ácidos Nucleicos

Los métodos para generar variantes de los ácidos nucleicos de la invención que codifican una xilanasa se pueden repetir o utilizar diversas combinaciones para generar xilanasas que tienen una actividad alterada o diferente o una estabilidad alterada o diferente de la de una xilanasa codificada por el ácido nucleico molde. Estos métodos también 20 se pueden repetir o utilizar en diversas combinaciones, p. ej., para generar variaciones en la expresión del gen/mensaje, la traducción del mensaje o la estabilidad del mensaje. En otro aspecto, la composición genética de una célula se altera, p. ej., mediante modificación de un gen homólogo ex vivo, seguido de su reinserción en la célula.

Un ácido nucleico de la invención se puede alterar mediante cualquier método. Por ejemplo, métodos aleatorios o estocásticos, o, métodos no estocásticos, o "evolución dirigida", véase, p. ej., la Patente de los Estados Unidos Núm. 6.361.974. Los métodos para la mutación de genes aleatoria son bien conocidos en la técnica, véase, p. ej., la Patente de los Estados Unidos Núm. 5.830.696. Por ejemplo, los mutágenos se pueden utilizar para mutar aleatoriamente un gen. Los mutágenos incluyen, p. ej., irradiación con luz ultravioleta o gamma, o un mutágeno 30 químico, p. ej., mitomicina, ácido nitroso, psoralenos fotoactivados, solos o combinados, para inducir roturas de ADN susceptibles de reparación mediante recombinación. Otros mutágenos químicos incluyen, por ejemplo, bisulfito de sodio, ácido nitroso, hidroxilamina, hidrazina o ácido fórmico. Otros mutágenos son análogos de precursores de nucleótidos, p. ej., nitrosoguanidina, 5-bromouracilo, 2-aminopurina, o acridina. Estos agentes se pueden añadir a una reacción PCR en lugar del precursor de nucleótido mutando de este modo la secuencia. También se pueden 35 utilizar agentes intercalantes tales como proflavina, acriflavina, quinacrina y similares.

Se puede utilizar cualquier técnica de biología molecular, p. ej., mutagénesis aleatoria por PCR, véase, p. ej., Rice (1992) Proc. Natl. Acad. Sci. USA 89:5467-5471; o, mutagenésis múltiple combinatoria por inserción de casetes, véase, p. ej., Crameri (1995) Biotécnicas 18:194-196. Alternativamente, los ácidos nucleicos, p. ej., los genes, se 40 pueden reensamblar después de la fragmentación aleatoria, "estocástica", véanse, p. ej., las Patentes de los Estados Unidos Núms. 6.291.242; 6.287.862; 6.287.861; 5.955.358; 5.830.721; 5.824.514; 5.811.238; 5.605.793. En aspectos alternativos, se introducen modificaciones, adiciones o deleciones mediante PCR propensa a error, barajado, mutagénesis dirigida a oligonucleótidos, PCR de ensamblaje, mutagénesis por PCR sexual, mutagenésis in vivo, mutagenésis por inserción de casetes, mutagenésis de ensamblaje recursivo, mutagenésis de conjunto 45 exponencial, mutagénesis de sitio específico, reensamblaje de genes (p. ej., GeneReassembly™, véase, p. ej., la Patente de los Estados Unidos Núm. 6.537.776), mutagénesis de saturación de sitios de genes (GSSM™), reensamblaje por ligación sintética (SLR), recombinación, recombinación de secuencia recursiva, mutagénesis de ADN modificada por fosfotioato, mutagénesis del molde que contiene uracilo, mutagénesis del dúplex con huecos, mutagénesis de reparación puntual de emparejamientos erróneos, mutagénesis de la cepa anfitriona de reparación 50 deficiente, mutagénesis química, mutagénesis radiogénica, mutagénesis por deleción, mutagénesis de restricción-selección, mutagénesis de restricción-purificación, síntesis de genes artificiales, mutagénesis de ensamblaje, creación de multímeros de ácido nucleico quimérico, y/o una combinación de estas y otros métodos.

Las siguientes publicaciones describen una variedad de procedimientos de recombinación recursiva y/o métodos 55 que se pueden incorporar a los métodos de la invención: Stemmer (1999) "Molecular breeding of virus for targeting and other clinical properties" Tumor Targeting 4:1-4; Ness (1999) Nature Biotechnology 17:893-896; Chang (1999) "Evolution of a cytokine using DNA family shuffling" Nature Biotechnology 17:793-797; Minshull (1999) "Protein evolution by molecular breeding" Current Opinion in Chemical Biology 3:284-290; Christians (1999) "Directed evolution of thymidine kinase for AZT fosforilation using DNA family shuffling" Nature Biotechnology 17:259-264; 60 Crameri (1998) "DNA shuffling of a family of genes from diverse species accelerates directed evolution" Nature 391:288-291; Crameri (1997) "Molecular evolution of an arsenate detoxification pathway by ADN shuffling", Nature Biotechnology 15:436-438; Zhang (1997) "Directed evolution of an effective fucosidase from a galactosidase by ADN shuffling and screening" Proc. Natl. Acad. Sci. USA 94:4504-4509; Patten et al. (1997) "Applications of ADN Shuffling

to Pharmaceuticals and Vaccines" Current Opinion in Biotechnology 8:724-733; Crameri et al. (1996) "Construction and evolution of antibody-phage libraries by ADN shuffling" Nature Medicine 2:100-103; Gates et al. (1996) "Affinity selective isolation of ligands from peptide libraries through display on a lac repressor 'headpiece dimer'" Journal of Molecular Biology 255:373-386; Stemmer (1996) "Sexual PCR and Assembly PCR" In: The Encyclopedia of Molecular Biology. VCH Publishers, New York. págs. 447-457; Crameri y Stemmer (1995) "Combinatorial multiple 5 mutagenésis by insertion of cassettes creates all the permutations of mutant and wildtype cassettes" BioTechniques 18:194-195; Stemmer et al. (1995) "Single-step assembly of a gen and entire plasmid form large numbers of oligodeoxyribonucleotides" Gene, 164:49-53; Stemmer (1995) "The Evolution of Molecular Computation" Science 270: 1510; Stemmer (1995) "Searching Sequence Space" Bio/Technology 13:549-553; Stemmer (1994) "Rapid evolution of a protein in vitro by ADN shuffling" Nature 370:389-391; y Stemmer (1994) "DNA shuffling by random 10 fragmentation and reassembly: In vitro recombination for molecular evolution." Proc. Natl. Acad. Sci. USA 91:10747-10751.

Los métodos mutacionales para generar diversidad incluyen, por ejemplo, mutagénesis dirigida al sitio (Ling et al. (1997) "Approaches to ADN mutagenesis: an overview" Anal Biochem. 254(2): 157-178; Dale et al. (1996) 15 "Oligonucleotide-directed random mutagenesis using the phosphorothioate method" Methods Mol. Biol. 57:369-374; Smith (1985) "In vitro mutagenesis" Ann. Rev. Genet. 19:423-462; Botstein & Shortle (1985) "Strategies and applications of in vitro mutagenesis" Science 229:1193-1201; Carter (1986) "Site-directed mutagenesis" Biochem. J. 237:1-7; y Kunkel (1987) "The efficiency of oligonucleotide directed mutagenesis" en Nucleic Acids & Molecular Biology (Eckstein, F. y Lilley, D. M. J. eds., Springer Verlag, Berlin)); mutagenesis utilizando moldes que contienen 20 uracilo (Kunkel (1985) "Rapid and efficient site-specific mutagenesis without phenotypic selection" Proc. Natl. Acad. Sci. USA 82:488-492; Kunkel et al. (1987) "Rapid and efficient site-specific mutagenesis without phenotypic selection" Methods en Enzymol. 154, 367-382; y Bass et al. (1988) "Mutant Trp repressors with new DNA-binding specificities" Science 242:240-245); mutagenesis dirigida a oligonucleótidos (Methods in Enzymol. 100: 468-500 (1983); Methods in Enzymol. 154: 329-350 (1987); Zoller (1982) "Oligonucleotide-directed mutagenesis using M13-25 derived vectors: an efficient and general procedure for the production of point mutations in any ADN fragment" Nucleic Acids Res. 10:6487-6500; Zoller & Smith (1983) "Oligonucleotide-directed mutagenesis of fragments of ADN cloned into M13 vectors" Methods en Enzymol. 100:468-500; y Zoller (1987) Oligonucleotide-directed mutagenesis: a simple method using two oligonucleotide primers and a single-stranded ADN template" Methods en Enzymol. 154:329-350); mutagenesis de ADN modificada con fosforotioato (Taylor (1985) "The use of phosphorothioate-30 modified ADN in restriction enzyme reactions to prepare nicked DNA" Nucl. Acids Res. 13: 8749-8764; Taylor (1985) "The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA" Nucl. Acids Res. 13: 8765-8787 (1985); Nakamaye (1986) "Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to mutagenesis directed to oligonucleotides" Nucl. Acids Res. 14: 9679-9698; Sayers (1988) "Y-T Exonucleases in phosphorothioate-based mutagenesis directed to oligonucleotides" Nucl. 35 Acids Res. 16:791-802; y Sayers et al. (1988) "Strand specific cleavage of phosphorothioate-containing ADN by reaction with restriction endonucleases in presence of ethidium bromide" Nucl. Acids Res. 16: 803-814); mutagenesis utilizando ADN dúplex con huecos (Kramer et al. (1984) "The gapped duplex ADN approach to oligonucleotide-directed mutation construction" Nucl. Acids Res. 12: 9441-9456; Kramer & Fritz (1987) Methods in Enzymol. "Oligonucleotide-directed construction of mutations via gapped duplex DNA" 154:350-367; Kramer (1988) "Improved 40 enzymatic in vitro reactions in the gapped duplex ADN approach to oligonucleotide-directed construction of mutations" Nucl. Acids Res. 16: 7207; y Fritz (1988) "Oligonucleotide-directed construction of mutations: a gapped duplex ADN procedure without enzymatic reactions in vitro" Nucl. Acids Res. 16: 6987-6999).

Los protocolos adicionales que se pueden utilizar para poner en práctica la invención incluyen reparación puntual de 45 emparejamientos erróneos (Kramer (1984) "Point Mismatch Repair" Cell 38:879-887), mutagénesis utilizando cepas anfitrionas de reparación deficiente (Carter et al. (1985) "Improved oligonucleotide site-directed mutagenesis using M13 vectors" Nucl. Acids Res. 13: 4431-4443; y Carter (1987) "Improved mutagenesis directed to oligonucleotides using M13 vectores" Methods in Enzymol. 154: 382-403), mutagénesis por deleción (Eghtedarzadeh (1986) "Use of oligonucleotides to generate large deletions" Nucl. Acids Res. 14: 5115), restricción-selección y restricción-selección 50 y restricción-purificación (Wells et al. (1986) "Importance of hydrogen-bond formation in stabilizing the transition stata of subtilisin" Phil. Trans. R. Soc. Lond. A 317: 415-423), mutagénesis mediante síntesis de genes total (Nambiar et al. (1984) "Total synthesis and cloning of a gen coding for the ribonuclease S protein" Science 223: 1299-1301; Sakamar y Khorana (1988) "Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein (transducin)" Nucl. Acids Res. 14: 6361-6372; Wells et al. (1985) "Cassette 55 mutagenesis: an efficient method for generation of multiple mutations at defined sites" Gene 34:315-323; y Grundstrom et al. (1985) "Oligonucleotide-directed mutagenesis by microscale 'shot-gun' gene synthesis" Nucl. Acids Res. 13: 3305-3316), double-strand break repair (Mandecki (1986); Arnold (1993) "Protein engineering for unusual environments" Current Opinion in Biotechnology 4:450-455. "Oligonucleótido-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific" Proc. Natl. Acad. Sci. USA, 83:7177-7181). Se pueden 60 encontrar detalles adicionales sobre muchos de los métodos anteriores en Methods in Enzymology Volumen 154, que también describe controles útiles para la solución de problemas con diversos métodos de mutagénesis.

Los protocolos que se pueden utilizar para poner en práctica la invención se describen, p. ej., en la Patente de los Estados Unidos Núms. 5.605.793 de Stemmer (Feb. 25, 1997), "Methods for In Vitro Recombination; "Patente de los Estados Unidos Núm. 5.811.238 de Stemmer et al. (Sep. 22, 1998) "Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination;" Patente de los Estados Unidos Núm. 5.830.721 de Stemmer et al. (Nov. 3, 1998), "DNA Mutagenesis by Random Fragmentation and Reassembly;" Patente de los 5 Estados Unidos Núm. 5.834.252 de Stemmer, et al. (Nov. 10, 1998) "End-Complementary Polymerase Reaction;" Patente de los Estados Unidos Núm. 5.837.458 de Minshull, et al. (Nov. 17, 1998), "Methods and Compositions for Cellular and Metabolic Engineering;" documento WO 95/22625, Stemmer and Crameri, "Mutagenesis by Random Fragmentation and Reassembly;" documento WO 96/33207 de Stemmer and Lipschutz "End Complementary Polymerase Chain Reaction;" documento WO 97/20078 de Stemmer and Crameri "Methods for Generating 10 Polynucleotides having Desired Characteristics by Iterative Selection and Recombination;" documento WO 97/35966 de Minshull and Stemmer, "Methods and Compositions for Cellular and Metabolic Engineering;" documento WO 99/41402 de Punnonen et al. "Targeting of Genetic Vaccine Vectors; "documento WO 99/41383 de Punnonen et al. "Antigen Library Immunization;" documento WO 99/41369 de Punnonen et al. "Genetic Vaccine Vector Engineering;" documento WO 99/41368 de Punnonen et al. "Optimization of Immunomodulatory Properties of Genetic Vaccines;" 15 EP 752008 de Stemmer and Crameri, "DNA Mutagenesis by Random Fragmentation and Reassembly"; EP 0932670 de Stemmer "Evolving Cellular DNA Uptake by Recursive Sequence Recombination;" documento WO 99/23107 de Stemmer et al., "Modification of Virus Tropism and Host Range by Viral Genome Shuffling;" documento WO 99/21979 de Apt et al., "Human Papillomavirus Vectors;" documento WO 98/31837 de Cardayre et al. "Evolution of Whole Cells and Organisms by Recursive Sequence Recombination;" documento WO 98/27230 de Patten and 20 Stemmer, "Methods and Compositions for Polypeptide Engineering;" documento WO 98/27230 de Stemmer et al., "Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection", documento WO 00/00632, "Methods for Generating Highly Diverse Libraries", documento WO 00/09679, "Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banks and Resulting Sequences", documento WO 98/42832 de Arnold et al., "Recombination of Polynucleotide Sequences Using Random or Defined Primers", documento WO 99/29902 25 de Arnold et al., "Method for Creating Polynucleotide and Polypeptide Sequences", documento WO 98/41653 de Vind, "An in Vitro Method for Construction of a DNA Library", documento WO 98/41622 de Borchert et al., "Method for Constructing a Library Using DNA Shuffling", y documento WO 98/42727 de Pati and Zarling, "Sequence Alterations using Homologous Recombination".

Los protocolos que se pueden utilizar para poner en práctica los métodos (proporcionando detalles concernientes a 30 diversos métodos generadores de diversidad) se describen, p. ej., en la Solicitud de Patente de los Estados Unidos con el Núm. de Serie (USSN) 09/407.800, "SHUFFLING OF CODON ALTERED GENES" de Patten et al. presentada el 28 de Sep. de 1999; "EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION" de Cardayre et al., Patente de los Estados Unidos Núm. 6.379.964; "OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION" de Crameri et al., Patentes de los Estados Unidos Núms. 35 6.319.714; 6.368.861; 6.376.246; 6.423.542; 6.426.224 y documento PCT/US00/01203; "USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING" de Welch et al., Patente de los Estados Unidos Núm. 6.436.675; "METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS" de Selifonov et al., presentada el 18 de Enero de 2000, (PCT/US00/01202) y, p. ej. "METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & 40 POLYPEPTIDES HAVING DESIRED CHARACTERISTICS" de Selifonov et al., presentada el 18 de Julio de 2000 (Documento U.S. Núm. Ser. 09/618,579); "METHODS OF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY STIMULATIONS" de Selifonov y Stemmer, presentada el 18 de Enero de 2000 (PCT/US00/01138); y "SINGLE-STRANDED NUCLEIC ACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION" de Affholter, presentada el 6 de Sep. de 2000 (Documento U.S. Núm. 45 Ser. 09/656,549); y Patentes de los Estados Unidos Núms. 6.177.263; 6.153.410.

Los métodos no estocásticos, o de "evolución dirigida" incluyen, p. ej., la mutagénesis por saturación (GSSM™), reensamblaje por ligación sintética (SLR), o una de sus combinaciones se utilizan para modificar los ácidos nucleicos de la invención para generar xilanasas con propiedades nuevas o alteradas (p. ej., actividad bajo condiciones 50 altamente ácidas o alcalinas, temperaturas altas o bajas, y similares). Los polipéptidos codificador por los ácidos nucleicos modificados se pueden escrutar para determinar una actividad antes de someter a ensayo la hidrólisis del xilano u otra actividad. Se puede utilizar cualquier modalidad o protocolo de ensayo, p. ej., utilizando una plataforma de matriz capilar. Véanse, p. ej., las Patentes de los Estados Unidos Núms. 6.361.974; 6.280.926; 5.939.250.

Mutagénesis por saturación, o, GSSM™

En un aspecto, se utilizan cebadores codónicos que contienen una secuencia N,N,G/T degenerada para introducir mutaciones puntuales en un polinucleótido, p. ej., una xilanasa o un anticuerpo de la invención, para generar un conjunto de polipéptidos progenie en el que en cada posición de aminoácidos está representada una gama completa 60 de sustituciones de un solo aminoácido, p. ej., un residuo de aminoácido en un sitio activo enzimático o un sitio de unión al ligando elegido como diana que se va a modificar. Estos oligonucleótidos pueden comprender una primera secuencia homóloga contigua, una secuencia N,N,G/T degenerada, y, opcionalmente, una segunda secuencia

homóloga. Los productos traduccionales de la progenie aguas abajo a partir del uso de tales oligonucleótidos incluyen todos los cambios de aminoácido posibles en cada sitio de aminoácido a lo largo del polipéptido, debido a que la degeneración de la secuencia N,N,G/T incluye codones para los 20 aminoácidos. En un aspecto, uno de tales oligonucleótidos degenerados (que comprende, p. ej., un casete N,N,G/T degenerado) se utiliza para someter cada codón original en un molde polinucleotídico parental a una gama completa de sustituciones codónicas. En otro 5 aspecto, se utilizan al menos dos casetes degenerados - en el mismo oligonucleótido o no, para someter al menos dos codones originales en un molde polinucleotídico parental a una gama completa de sustituciones codónicas. Por ejemplo, en un oligonucleótido puede estar contenida más de una secuencia N,N,G/T para introducir mutaciones de aminoácido en más de un sitio. Esta pluralidad de secuencias N,N,G/T pueden estar directamente contigua, o separada by una o más secuencias de nucleótidos adicionales. En otro aspecto, se pueden usar oligonucleótidos 10 prácticos para introducir adiciones y deleciones solos o combinados con los codones que contienen una secuencia N,N,G/T, para introducir cualquier combinación o permutación de adiciones, deleciones, y/o sustituciones de aminoácidos.

En un aspecto, la mutagénesis simultanea de dos o más posiciones de aminoácido contiguas se realiza utilizando un 15 oligonucleótido que contiene tripletes N,N,G/T contiguos, es decir una secuencia (N,N,G/T)n degenerada. En otro aspecto, se utilizan casetes degenerados que tienen menos degeneración que la secuencia N,N,G/T. Por ejemplo, puede ser deseable en algunos casos (p. ej. en un oligonucleótido) una secuencia de triplete degenerado que comprende solo un N, donde dicho N puede estar en la segunda o tercera posición del triplete. Se pueden utilizar otras bases cualesquiera incluyendo cualquiera de sus combinaciones y permutaciones en las dos posiciones 20 restantes del triplete. Alternativamente, puede ser deseable en algunos casos (p. ej. en un oligo) utilizar una secuencia de triplete N,N,N degenerado.

En un aspecto, el uso de tripletes degenerados (p. ej., tripletes N,N,G/T) permite la generación sistemática y fácil de una gama completa de aminoácidos naturales posibles (para un total de 20 aminoácidos) en todas y cada una de las 25 posiciones de aminoácidos en un polipéptido (en aspectos alternativos, los métodos también incluyen la generación de menos de todas las sustituciones posibles por posición de residuo de aminoácido, o codón,). Por ejemplo, para un polipéptido de 100 aminoácidos, se pueden generar 2000 especies distintas (es decir 20 aminoácidos posibles por posición X 100 posiciones de aminoácidos). A través del uso de un oligonucleótido o conjunto de oligonucleótidos que contienen un triplete N,N,G/T degenerado, 32 secuencias individuales pueden codificar los 20 30 aminoácidos naturales posibles. De este modo, en un recipiente de reacción en el que una secuencia parental de polinucleótidos se somete a mutagénesis por saturación utilizando al menos uno de tales oligonucleótidos, se generan 32 polinucleótidos progenie distintos que codifican 20 polipéptidos distintos. En contraste, el uso de un oligonucleótido no degenerado en la mutagénesis dirigida al sitio conduce solo a un producto polipeptídico progenie por recipiente de reacción. Los oligonucleótidos no degenerados se pueden utilizar opcionalmente combinados con 35 los cebadores degenerados descritos; por ejemplo, los oligonucleótidos no degenerados se pueden utilizar para generar mutaciones puntuales específicas en un polinucleótido de trabajo. Esto proporciona un medio para generar mutaciones puntuales silenciosas específicas, mutaciones puntuales que conducen a cambios de aminoácido correspondientes, y mutaciones puntuales que ocasionan la generación de codones de parada y la correspondiente expresión de fragmentos polipeptídicos. 40

En un aspecto, cada recipiente de reacción de mutagénesis por saturación contiene polinucleótidos que codifican al menos 20 moléculas de polipéptido progenie (p. ej., xilanasas) de manera que los 20 aminoácidos naturales están representados en una posición de aminoácido específica correspondiente a la posición del codón mutagenizada en el polinucleótido parental (otros aspectos utilizan menos de los 20 combinaciones naturales). La progenie de 45 polipéptidos degenerada 32 veces generada a partir de cada recipiente de reacción de mutagénesis por saturación se puede someter a amplificación clonal (p. ej. clonada en un anfitrión adecuado, p. ej., anfitrión E. coli, utilizando, p. ej., un vector de expresión) y someter a escrutinio de la expresión. Cuando una progenie de polipéptido individual se identifica para que presente un cambio de propiedades favorable (cuando se compara con el polipéptido parental, tal como el aumento de la actividad de hidrólisis del xilano en condiciones alcalinas o ácidas), ésta se puede secuenciar 50 para identificar la sustitución de aminoácido correspondientemente favorable contenida allí.

En un aspecto, después de mutagenizar todos y cada uno de las posiciones de aminoácido en un polipéptido parental utilizando mutagénesis por saturación como se describe en la presente memoria, se pueden identificar cambios de aminoácidos favorables en más de una posiciones de aminoácido. Se pueden generar una o más 55 moléculas progenie que contiene una combinación todas o parte de estas sustituciones de aminoácido favorables. Por ejemplo, si se identifican 2 cambios de aminoácido favorables específicos en cada una de 3 posiciones de aminoácidos en un polipéptido, las permutaciones incluyen 3 posibilidades en cada posición (sin cambio del aminoácido original, y cada uno de dos cambios favorables) y 3 posiciones. De este modo, hay 3 x 3 x 3 o 27 posibilidades totales, incluyendo 7 que se examinaron previamente - 6 mutaciones puntuales individuales (es decir 2 60 en cada una de las tres posiciones) y no hay cambio en ninguna posición.

En otro aspecto más, se puede utilizar mutagénesis de saturación de sitio junto con barajado, quimerización, recombinación y otros procedimientos mutagenizantes, junto con escrutinio. Se pueden utilizar procedimientos de

mutagenización cualesquiera, incluyendo mutagénesis por saturación, de una manera iterativa. En una ejemplificación, se utiliza el uso iterativo de procedimientos de mutagenización cualesquiera combinado con escrutinio.

Se pueden utilizar cebadores codónicos patentados (que contienen una secuencia N,N,N degenerada) para 5 introducir mutaciones puntuales en un polinucleótido, para generar un conjunto de polipéptidos progenie en el que está representada en cada posición de aminoácido una gama completa de sustituciones individuales de aminoácidos (mutagénesis de saturación de sitios de genes (GSSM™)). Los oligos utilizados están compuestos contiguamente de una primera secuencia homóloga, una secuencia N,N,N degenerada y preferiblemente pero no necesariamente una segunda secuencia homóloga. Los productos traduccionales de la progenie agua abajo a partir del uso de tales 10 oligos incluyen todos los cambios de aminoácidos posibles en cada sitio de aminoácido a lo largo del polipéptido, puesto que la degeneración de la secuencia N,N,N incluye codones para los 20 aminoácidos.

En un aspecto, uno de tales oligos degenerados (compuestos de un casete N,N,N degenerado) se utiliza para someter cada codón original en un molde polinucleotídico parental a una gama completa de sustituciones codónicas. 15 En otro aspecto, se utilizan al menos dos casetes N,N,N degenerados – en el mismo oligo o no, para someter al menos dos codones originales en un molde polinucleotídico parental a una gama completa de sustituciones codónicas. De este modo, puede estar contenida más de una secuencia N,N,N en un oligo para introducir mutaciones de aminoácido en más de un sitio. Esta pluralidad de secuencias N,N,N puede estar directamente contigua, o separada por una o más secuencias de nucleótidos adicionales. En otro aspecto, los oligos prácticos 20 para introducir adiciones y deleciones se pueden utilizar solos o combinados con los codones que contienen una secuencia N,N,N, para introducir cualquier combinación o permutación de adiciones, deleciones y/o sustituciones de aminoácidos.

En una ejemplificación concreta, es posible mutagenizar simultáneamente dos o más posiciones de aminoácidos 25 contiguas utilizando un oligo que contienen tripletes N,N,N contiguos, es decir una secuencia (N,N,N)n degenerada.

Se pueden utilizar casetes degenerados que tienen menos degeneración que la secuencia N,N,N. Por ejemplo, puede ser deseable en algunos casos utilizar (p. ej. en un oligo) una secuencia triplete degenerada que está compuesta de solo un N, donde el N puede estar en la primera, segunda o tercera posición del triplete. Se pueden 30 utilizar otras bases cualesquiera incluyendo combinaciones y permutaciones cualesquiera de las mismas en las dos posiciones restantes del triplete. Alternativamente, puede ser deseable en algunos casos utilizar (p. ej., en un oligo) una secuencia triplete N,N,N degenerada, N,N,G/T, o una secuencia triplete N,N,G/C.

Se aprecia, no obstante, que el uso de un triplete degenerado (tal como N,N,G/T o una secuencia triplete N,N,G/C) 35 como se describe en la presente memoria es ventajoso por diversas razones. En un aspecto, esta invención proporciona un medio para generar sistemáticamente y bastante fácilmente la sustitución de la gama completa de aminoácidos posibles (para un total de 20 aminoácidos) en todas y cada una de las posiciones de aminoácidos en un polipéptido. De este modo, para un polipéptido de 100 aminoácidos, la invención proporciona a una manera de generar sistemáticamente y bastante fácilmente 2000 especies distintas (es decir, 20 aminoácidos posibles por 40 posición en 100 posiciones de aminoácidos). Se aprecia que se proporcionan, a través del uso de un oligo que contiene una secuencia triplete N,N,G/T o N,N,G/C degenerada, 32 secuencias individuales que codifican 20 aminoácidos posibles. De este modo, en un recipiente de reacción en el que una secuencia parental de polinucleótidos se somete a mutagénesis por saturación utilizando uno de tales oligos, se generan 32 polinucleótidos progenie distintos que codifican 20 polipéptidos distintos. En contraste, el uso de un oligo no degenerado en la 45 mutagénesis dirigida al sitio conduce a solo un producto progenie de polipéptidos por recipiente de reacción.

Se pueden utilizar opcionalmente oligos neurodegenerados combinados con los cebadores degenerados descritos. Se aprecia que en algunas situaciones, es ventajoso utilizar oligos no degenerados para generar mutaciones puntuales específicas en un polinucleótido de trabajo. Esto proporciona un medio para generar mutaciones 50 puntuales silenciosas específicas, mutaciones puntuales que conducen a cambios aminoácido y mutaciones puntuales correspondientes que causan la generación de codones de parada y la expresión correspondiente de fragmentos peptídicos.

Cada recipiente de reacción de la mutagénesis por saturación puede contener polinucleótidos que codifican al 55 menos moléculas progenie de 20 polipéptidos de manera que los 20 aminoácidos están representados en una posición de aminoácido específica correspondiente a la posición codónica mutagenizada en el polinucleótido parental. La progenie de polipéptidos degenerada 32 veces generada a partir de cada recipiente de reacción de la mutagénesis por saturación se puede someter a amplificación clonal (p. ej., clonar en un anfitrión E. coli adecuado utilizando un vector de expresión) y someter a escrutinio de expresión. Cuando se identifica una progenie de 60 polipéptido individual mediante escrutinio para presentar un cambio de propiedades favorable (cuando se compara con el polipéptido parental), ésta se puede secuenciar para identificar sustitución de aminoácido correspondientemente favorable contenida allí.

Se aprecia que después de mutagenizar todas y cada una de las posiciones de aminoácido en un polipéptido parental utilizando mutagénesis por saturación como se describe en la presente memoria, se pueden identificar los cambios de aminoácido favorables en más de una posición de aminoácido. Se pueden generar una o más moléculas progenie nuevas que contienen una combinación de todas o parte de estas sustituciones de aminoácido favorables. Por ejemplo, si se identifican 2 cambios aminoácido favorables específicos en cada una de las 3 posiciones de 5 aminoácidos en un polipéptido, las permutaciones incluyen 3 posibilidades en cada posición (sin cambio del aminoácido original y cada uno de dos los cambios favorables) y 3 posiciones. De este modo, hay 3 x 3 x 3 o 27 posibilidades totales, incluyendo 7 que se examinaron previamente - 6 mutaciones puntuales individuales (es decir, 2 en cada una de las tres posiciones) y sin cambio en ninguna posición.

De este modo, en una ejemplificación no limitante, esta invención proporciona el uso de mutagénesis por saturación en combinación con procedimientos de mutagenización adicionales, tal como un procedimiento en el que se introducen dos o más polinucleótidos relacionados en una célula anfitriona adecuada de manera que se genera una polinucleótido híbrido mediante recombinación y reordenamiento reductivo.

Además para realizar la mutagénesis a lo largo de la secuencia completa de un gen, la presente invención proporciona que la mutagénesis se puede utilizar para remplazar cada una de cualquier número de bases en una secuencia de polinucleótidos, donde el número de bases que se va a mutagenizar es preferiblemente cada número entero de 15 a 100.000. De este modo, en lugar de mutagenizar cada posición a lo largo de una molécula, se puede someter cada base o un número discreto de bases (totalizando un subgrupo preferiblemente de 15 a 100.000) a 20 mutagénesis. Preferiblemente, se utiliza un nucleótido separado para mutagenizar cada posición o grupo de posiciones a lo largo de una secuencia de polinucleótidos. Un grupo de 3 posiciones que se vayan a mutagenizar puede ser un codón. Las mutaciones se introducen preferiblemente utilizando un cebador mutagénico, que contiene un casete heterólogo, también referido como casete mutagénico. Los casetes ilustrativos pueden tener de 1 a 500 bases. Cada posición de nucleótido en tales casetes heterólogos pueden ser N, A, C, G, T, A/C, A/G, A/T, C/G, C/T, 25 G/T, C/G/T, A/G/T, A/C/T, A/C/G, o E, donde E es cualquier base que no sea A, C, G, o T (E se puede referir como oligo diseñador).

En un sentido general, la mutagénesis por saturación comprende la mutagenización de un conjunto completo de casetes mutagénicos (donde cada casete tiene preferiblemente alrededor de 1-500 bases de longitud) en 30 secuencias de polinucleótidos definidas que se van a mutagenizar (donde la secuencia que se va a mutagenizar tiene preferiblemente de alrededor de 15 a 100.000 bases de longitud). De este modo, se introduce un grupo de mutaciones (que oscila de 1 a 100 mutaciones) en cada casete que se vaya a mutagenizar. Un agrupamiento de mutaciones que se va a introducir en un casete puede ser diferente o igual que un segundo agrupamiento de mutaciones que se va a introducir en un segundo casete durante la aplicación de una ronda de mutagénesis por 35 saturación. Tales agrupamientos se ilustran mediante deleciones, adiciones, agrupamientos de codones concretos y agrupamientos de casetes de nucleótidos concretos.

Las secuencias definidas que se van a mutagenizar incluyen un gen completo, una ruta, un ADNc, un marco de lectura abierto (ORF) completo y un promotor completo, un intensificador, un represor/transactivador, un origen de 40 replicación, un intrón, un operador, o cualquier grupo funcional polinucleotídico. Generalmente, las "secuencias definidas" para este fin pueden ser polinucleótidos cualesquiera que tienen una secuencia de polinucleótidos de 15 bases y secuencias de polinucleótidos de entre 15 bases y 15.000 bases de longitud (esta invención específicamente nombra cada número entero intermedio). Las consideraciones en la elección de los agrupamientos de codones incluyen los tipos de aminoácidos codificados por un casete mutagénico degenerado. 45

En una ejemplificación un agrupamiento de mutaciones que se pueden introducir en un casete mutagénico, esta invención proporciona específicamente sustituciones codónicas degeneradas (utilizando oligos degenerados) que codifican 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 y 20 aminoácidos en cada posición y una biblioteca de polipéptidos codificada de ese modo. 50

Reensamblaje por ligación sintética (SLR)

La invención proporciona un sistemas de modificación de genes no estocástico denominado "reensamblaje por ligación sintética", o simplemente "SLR", un "proceso de evolución dirigida", para generar polipéptidos, p. ej., 55 xilanasas o anticuerpos de la invención, con propiedades nuevas o alteradas.

El SLR es un método para ligar fragmentos de oligonucleótidos entre sí no estocásticamente. Este método difiere de barajado de oligonucleótidos estocástico en que los elementos fundamentales del ácido nucleico no se barajan, concatenan o quimerizan aleatoriamente, sino que en lugar de eso se ensamblan no estocásticamente. Véase, p. ej., 60 la Solicitud de Patente de los Estados Unidos con el Núm. de Serie (USSN)09/332,835 titulada "Synthetic Ligation Reensamblaje in Directed Evolution" y presentada el 14 de Juno de 1999 ("USSN 09/332,835"). En un aspecto, el SLR comprende las siguientes etapas: (a) proporcionar un polinucleótido molde, donde el polinucleótido molde comprende una secuencia que codifica un gen homólogo; (b) proporcionar una pluralidad de polinucleótidos

unidades fundamentales, donde los polinucleótidos unidades fundamentales se diseñan para su reensamblaje mediante entrecruzamiento con el polinucleótido molde en una secuencia predeterminada, y un polinucleótido unidad fundamental comprende una secuencia que es una variante del gen homólogo y una secuencia homóloga al polinucleotídico molde que flanquea la secuencia variante; (c) combinar un polinucleótido unidad fundamental con un polinucleótido molde de manera que el polinucleótido unidad fundamental se reensamble mediante entrecruzamiento 5 con el polinucleótido molde para generar polinucleótidos que comprenden variaciones de secuencia de genes homólogos.

El SLR no depende de la presencia de altos niveles de homología entre los polinucleótidos que se va a reordena. De este modo, este método se puede utilizar para generar no estocásticamente bibliotecas (o conjuntos) de moléculas 10 progenie que compenden más de 10100 quimeras diferentes. El SLR se puede utilizar para generar bibliotecas que comprenden más de 101000 quimeras progenie diferentes. De este modo, los aspectos de la presente invención incluyen métodos no estocásticos para producir un conjunto de molécula de ácido nucleico quiméricas finalizadas que tienen un orden de ensamblaje global que se elige mediante diseño. Este método incluye las etapas de generar mediante diseño una pluralidad de elementos fundamentales de ácido nucleico específicos que tienen extremos 15 ligables mutuamente compatibles prácticos, y ensamblar estos elementos fundamentales de ácido nucleico, de manera que se logre un orden de ensamblaje global diseñado.

Se considera que los extremos ligables mutuamente compatibles de los elementos fundamentales de ácido nucleico que se van a ensamblar son "prácticos" para este tipo de ensamblaje ordenado si posibilitan el acoplamiento de los 20 elementos fundamentales en los órdenes predeterminados. De este modo, el orden de ensamblaje global en el que el elementos fundamentales de ácido nucleico pueden estar acoplados se especifica mediante el diseño de los extremos ligables. Si se va a utilizar más de una etapa de ensamblaje, el orden de ensamblaje global en el que pueden estar acoplados los elementos fundamentales de ácido nucleico también está especificado por el orden sucesivo de la etapa o las etapas de ensamblaje. En un aspecto, las piezas fundamentales recocidas se tratan con 25 una enzima, tal como una ligasa (p. ej. ADN ligasa de T4), para lograr la unión covalente de las piezas fundamentales.

En un aspecto, el diseño de los elementos fundamentales del oligonucleótido se obtiene analizando un conjunto de secuencias progenitoras de moldes de ácido nucleico que sirven como una base para la producción de un conjunto 30 progenie de polinucleótidos quiméricos finalizados. Estos moldes de oligonucleótido parentales sirven así como fuente de información de secuencia que ayuda al diseño de los elementos fundamentales de ácido nucleico que se van a mutagenizar, p. ej., quimerizados o barajados. En un aspecto de éste método, las secuencias de una pluralidad de moldes de ácido nucleico parentales se alinean con el fin de seleccionar uno o más puntos de demarcación. Los puntos de demarcación pueden estar localizados en una zona de homología, y comprenden uno o 35 más nucleótidos. Estos puntos de demarcación con compartidos preferiblemente por al menos dos de los moldes progenitores. Los puntos de demarcación se pueden utilizar de ese modo para delinear los límites de elementos fundamentales de los oligonucleótidos que se van a generar con el fin de reordenar los polinucleótidos parentales. Los puntos de demarcación identificados y seleccionados en las moléculas progenitoras sirven como puntos de quimerización potenciales en el ensamblaje de las moléculas progenie quiméricas finales. Un punto de demarcación 40 puede ser una zona de homología (que comprende al menos un base nucleotídica homóloga) compartida por al menos dos secuencias de polinucleótidos parentales. Alternativamente, un punto de demarcación puede ser una zona de homología que es compartida por al menos la mitad de las secuencias de polinucleótidos parentales, o, puede ser una zona de homología que es compartida por al menos dos tercios de las secuencias de polinucleótidos parentales. Incluso más preferiblemente los puntos de demarcación prácticos son una zona de homología que es 45 compartida por al menos tres cuartas partes de las secuencias de polinucleótidos parentales, o, puede ser compartida por casi todas las secuencias de polinucleótidos parentales. En un aspecto, un punto de demarcación es una zona de homología que es compartida por todas las secuencias de polinucleótidos parentales.

En un aspecto, se realiza exhaustivamente un procedimiento de reensamblaje por ligación con el fin de generar una 50 biblioteca exhaustiva de polinucleótidos quiméricos progenie. En otras palabras, todas las combinaciones ordenadas posibles de los elementos fundamentales de ácido nucleico están representadas en el conjunto de moléculas de ácido nucleico quiméricas finalizadas. Al mismo tiempo, en otro aspecto, el orden de ensamblaje (es decir el orden de ensamblaje de cada elemento fundamental en secuencia 5' a 3' de cada ácido nucleico quimérico finalizado) en cada combinación es mediante diseño (o no estocástico) como se ha descrito anteriormente. Debido a la naturaleza 55 no estocástica de esta invención, se reduce enormemente la posibilidad productos secundarios no deseados.

En otro aspecto, el método de reensamblaje por ligación se realiza sistemáticamente. Por ejemplo, el método se realiza con el fin de generar una biblioteca compartimentalizada sistemáticamente de moléculas progenie, con compartimentos que pueden ser escrutados sistemáticamente, p. ej. de uno en uno. En otras palabras esta 60 invención proporciona que, a través del uso selectivo y juicioso de elementos específicos fundamentales de ácido nucleico, acoplado al uso selectivo y juicioso de reacciones de ensamblaje recorridas sucesivamente, se puede lograr un diseño en el que se elaboran conjuntos específicos de productos progenie en cada uno de los diversos recipientes de reacción. Esto permite la realización de un procedimiento sistemático de examen y escrutinio. De este

modo, estos métodos permiten examinar sistemáticamente un número potencialmente muy grande de moléculas progenie en grupos más pequeños. Debido a su capacidad para realizar quimerizaciones de una manera que es altamente flexible aunque también exhaustiva y sistemática, particularmente cuando hay un bajo nivel de homología entre las moléculas progenitoras, estos métodos proporcionan la generación de una biblioteca (o conjunto) que comprende un gran número de moléculas progenie. Debido a la naturaleza no estocástica del reensamblaje por 5 ligación de la presente invención, las moléculas progenie generadas comprenden preferiblemente una biblioteca de moléculas de ácido nucleico quiméricas finalizadas que tienen un orden de ensamblaje global que se elige mediante diseño. La mutagénesis por saturación y los métodos de evolución dirigida optimizados también se pueden utilizar para generar especies moleculares progenie diferentes. Se aprecia que esto proporciona libertad de elección y control con respecto a la selección de los puntos de demarcación, el tamaño y el número del elementos 10 fundamentales de ácido nucleico, y el tamaño y el diseño de los acoplamientos. Se aprecia además, que el requerimiento de homología intermolecular se encuentra muy relajado por la operabilidad. De hecho, los puntos de demarcación se pueden elegir incluso en zonas de poca o ninguna homología intermolecular. Por ejemplo, debido al balanceo codónico, es decir la degeneración de los codones, se pueden introducir sustituciones de nucleótidos en los elementos fundamentales de ácido nucleico sin alterar el aminoácido codificado originalmente en el molde 15 progenitor correspondiente. Alternativamente, se puede alterar un codón de manera que se altere la codificación para un aminoácido original. Esta invención proporciona que tales sustituciones se pueden introducir en el elemento fundamental del ácido nucleico con el fin de incrementar la incidencia de puntos de demarcación homólogos intermoleculares y permitir así un aumento del número de acoplamientos que se van a lograr entre los elementos fundamentales, lo que a su vez permite la generación de un mayor número de moléculas quiméricas progenie. 20

Reensamblaje de genes sintético

Un método no estocástico denominado reensamblaje sintético de genes (p. ej., GeneReassembly™, véase, p. ej., la Patente de los Estados Unidos Núm. 6.537.776), difiere del barajado estocástico en que los elementos 25 fundamentales del ácido nucleico no son barajados o concatenados o quimerizados aleatoriamente, sino que en vez de eso se ensamblan no estocásticamente.

El método de reensamblaje sintético de genes no depende de la presencia de un alto nivel de homología entre los polinucleótidos que se van a barajas. El método se puede utilizar para generar no estocásticamente bibliotecas (o 30 conjuntos) de moléculas progenie que comprenden más de 10100 quimeras diferentes. Posiblemente, el reensamblaje sintético de genes se puede utilizar incluso para generar bibliotecas que comprenden más de 101000 quimeras progenie diferentes.

De este modo el método proporciona un procedimiento no estocástico para producir un conjunto de moléculas de 35 ácido nucleico quiméricas finalizadas que tienen un orden de ensamblaje global que se elige mediante diseño, cuyo método comprende las etapas de generación mediante diseño de una pluralidad de elementos específicos fundamentales de ácidos nucleicos que tienen extremos ligables mutuamente compatibles prácticos y ensamblaje de estos elementos fundamentales de ácido nucleico, de manera que se logre un orden de ensamblaje global diseñado.

En un aspecto, el reensamblaje sintético de genes comprende un método para: 1) preparar una o varias generaciones de moléculas progenie (incluyendo una molécula que comprende una secuencia de polinucleótidos, p. ej., una molécula que comprende una secuencia de polipéptidos codificante), que es mutagenizada para lograr al menos una mutación, adición, deleción, y/o quimerización puntual, a partir de uno o varios moldes de generación ancestral o parental; 2) escrutar la molécula o moléculas de la generación progenie, p. ej., utilizando un método de 45 alto rendimiento, para al menos una propiedad de interés (tal como una mejora en una actividad enzimática); 3) opcionalmente obtener y/o catalogar información estructural y/o funcional concerniente a las moléculas de la generación parental y/o progenie; y 4) repetir opcionalmente cualquiera de las etapas 1) a 3). En un aspecto, se genera (p. ej., a partir de un molde polinucleotídico parental), en lo que se denomina "mutagénesis de saturación de sitio codónico", una generación progenie de polinucleótidos, que tienen cada uno al menos un conjunto de hasta tres 50 mutaciones puntuales contiguas (es decir diferente bases que comprenden un nuevo codón), de manera que cada codón (o cada familia de codones degenerados que codifican el mismo aminoácido) está representado en cada posición codónica. Correspondiente a, y codificado por, esta generación progenie de polinucleótidos, también se genera un conjunto de polipéptidos progenie, que tienen cada uno al menos una mutación puntual de un solo aminoácido. En un aspecto, se genera, en lo que se denomina " mutagénesis de saturación de sitio de aminoácido", 55 uno de tales polipéptidos mutantes para cada una de las 19 sustituciones de alfa-aminoácidos que forman el polipéptido codificado naturalmente en todas y cada una de las posiciones de aminoácidos a lo largo del polipéptido. Esto produce, para todas y cada una de las posiciones de aminoácidos a lo largo del polipéptido parental, un total de 20 polipéptidos progenie distintos incluyendo el aminoácido original, o potencialmente más de 21 polipéptidos progenie distintos si se utilizan aminoácidos adicionales en lugar o además de los 20 aminoácidos codificados 60 naturalmente.

De este modo, en otro aspecto, este enfoque es también práctico para generar mutantes que contienen, además de y/o combinados con los 20 alfa-aminoácidos que forman polipéptidos codificados naturalmente, otros aminoácidos y

derivados de aminoácidos raros y/o no codificados naturalmente. En otro aspecto más, este enfoque también es práctico para generar mutantes mediante el uso de, además de y/o combinados con sistemas de reconocimiento de codones naturales o no alterados, de sistemas de reconocimiento de codones alterados, mutagenizados, y/o diseñados en anfitriones adecuados (por ejemplo en una célula anfitriona con una o más moléculas de ARNt alteradas. 5

La recombinación proporciona un método para preparar polinucleótidos que codifican un polipéptido por medio de un método de reagrupamiento in vivo de secuencias de polinucleótidos que contienen regiones de homología parcial, ensamblar los polinucleótidos para formar al menos un polinucleótido y escrutar los polinucleótidos para la producción de uno o varios polipéptidos que tienen una propiedad útil. 10

Estos métodos son prácticos para analizar y catalogar, con respecto a cualquier propiedad molecular (p. ej. una actividad enzimática) o combinación de propiedades permitidas por la tecnología actual, los efectos de cualquier cambio mutacional (incluyendo particularmente la mutagénesis por saturación). De este modo, se proporciona un método integral para determinar el efecto del cambio de cada aminoácido en un polipéptido parental en cada una de 15 al menos 19 sustituciones posibles. Esto permite caracterizar y catalogar cada aminoácido en un polipéptido parental de acuerdo con su espectro de efectos potenciales sobre una propiedad medible del polipéptido.

En un aspecto, se puede introducir un intrón en una molécula progenie quimérica por medio de un elemento fundamental de ácido nucleico. Los intrones tienen a menudo secuencias consenso en ambos extremos con el fin de 20 hacerlos operativos. Además de permitir el empalme de genes, los intrones pueden servir para el propósito adicional de proporcionar sitios de homología a otros ácidos nucleicos para posibilitar la recombinación homóloga. Para este fin, y potencialmente otros, puede ser deseable a veces generar un elemento fundamental de ácido nucleico grande para introducir un intrón. Si el tamaño es demasiado grande para ser generado fácilmente mediante síntesis química directa de dos oligos de hebra sencilla, tal elemento fundamental de ácido nucleico especializado puede ser 25 generado también mediante síntesis química directa de más de dos oligos de hebra sencilla o utilizando una reacción de reacción amplificación basada en la polimerasa.

Se considera que los extremos ligables mutuamente compatibles de los elementos fundamentales de ácido nucleico que se van a ensamblar son "prácticos" para este tipo de ensamblaje ordenado si posibilitan que los elementos 30 fundamentales se acoplen en los órdenes predeterminados. De este modo, en un aspecto, el orden de ensamblaje global en el que el elementos fundamentales de ácido nucleico pueden estar acoplados se especifica mediante el diseño de los extremos ligables y, si se va a utilizar más de una etapa de ensamblaje, el orden de ensamblaje global en el que el elementos fundamentales de ácido nucleico pueden estar acoplados es especificado también por el orden sucesivo de la etapa o etapas de ensamblaje. Las piezas fundamentales recocidas se pueden tratar con una 35 enzima, tal como una ligasa (p. ej., ADN ligasa de T4) para lograr la unión covalente de las piezas fundamentales.

El acoplamiento se puede producir de manera que no haga uso de cada nucleótido en un saliente que participe. El acoplamiento es particularmente dinámico para sobrevivir (p. ej. en un anfitrión transformado) si el acoplamiento reforzado mediante tratamiento con una enzima ligasa forma lo que puede ser referido como una "ligación con 40 espacios" o una "ligación incompleta". Este tipo de acoplamiento puede contribuir a la generación de uno o varios productos secundarios no buscados, pero también se pueden utilizar para aumentar la diversidad de la biblioteca progenie generada por el reensamblaje ligación diseñado. Algunos salientes con susceptibles de experimentar autoacoplamiento para formar un acoplamiento palindrómico. Un acoplamiento se consolida sustancialmente si se refuerza mediante tratamiento con una enzima ligasa. Se puede utilizar ventajosamente la carencia de fosfatos 5' en 45 estos salientes para prevenir este tipo de autoligación palindrómica. Por lo tanto, se pueden elaborar químicamente (u ordenar) elementos fundamentales de ácido nucleico que carezcan de un grupos fosfato 5'. Alternativamente, éstos se pueden eliminar, p. ej. mediante tratamiento con una enzima fosfatasa, tal como una fosfatasa alcalina intestinal de ternera (CIAP), con el fin de prevenir autoligaciones palindrómicas en procedimientos de reensamblaje por ligación. 50

En otro aspecto, se obtiene el diseño de elementos fundamentales de ácido nucleico después del análisis de las secuencias de un conjunto de moldes de ácido nucleico progenitores que sirven como base para la producción de un conjunto progenie de moléculas de ácido nucleico quiméricas finalizadas. Estos moldes de ácido nucleico progenitores sirven de este modo como fuente de información de secuencia que ayuda al diseño del elementos 55 fundamentales de ácido nucleico que se van a mutagenizar, es decir quimerizar o barajar.

Una ilustración es la quimerización de una familia de genes relacionados y su familia codificada productos relacionados. Los productos codificados pueden ser enzimas. Las xilanasas de la presente invención se pueden mutagenizar de acuerdo con los métodos descritos en la presente memoria. 60

Las secuencias de una pluralidad de moldes de ácido nucleico progenitores (p. ej., polinucleótidos de las secuencias de ácido nucleico del Grupo A) se pueden alienar con el fin de seleccionar uno o más puntos de demarcación, cuyos puntos de demarcación pueden estar localizados en una zona de homología. Los puntos de demarcación se pueden

utilizar para delinear los límites de los elementos fundamentales del ácido nucleico que se vaya a generar. De este modo, los puntos de demarcación identificados y seleccionados en las moléculas progenitoras sirven como puntos de quimerización potenciales en el ensamblaje de las moléculas progenie.

Típicamente un punto de demarcación práctico es una zona de homología (que comprende al menos una base 5 nucleotídica homóloga) compartida por al menos dos moldes progenitores, pero el punto de demarcación puede ser una zona de homología que es compartida por al menos la mitad de los moldes progenitores, al menos dos terceras partes de los moldes progenitores, al menos tres cuartas partes de los moldes progenitores y preferiblemente casi todos los moldes progenitores. Incluso más preferiblemente un punto de demarcación aún más práctico es una zona de homología que es compartida por todos los moldes progenitores. 10

En un aspecto, el proceso de reensamblaje de genes se realiza exhaustivamente con el fin de generar una biblioteca exhaustiva. En otras palabras, todas las combinaciones ordenadas posibles de elementos fundamentales de ácido nucleico están representadas en el conjunto de moléculas de ácido nucleico quiméricas finalizadas. Al mismo tiempo, el orden de ensamblaje (es decir el orden de ensamblaje de cada elemento fundamental en la secuencia 5' a 15 3' de cada ácido nucleico quimérico finalizado) en cada combinación es mediante diseño (o no estocástico). Debido a la naturaleza no estocástica del método, se reduce enormemente la posibilidad de productos secundarios no deseados.

En otro aspecto, el método proporciona el que el proceso de reensamblaje de genes se realice sistemáticamente, 20 por ejemplo para generar una biblioteca compartimentalizada sistemáticamente, con compartimentos que pueden ser escrutados sistemáticamente, p. ej., de uno en uno. En otras palabras, a través del uso selectivo y juicioso de elementos específicos fundamentales de ácido nucleico, acoplado al uso selectivo y juicioso de reacciones de ensamblaje recorridas sucesivamente, se puede lograr un diseño experimental en el que se elaboran conjuntos específicos de productos progenie en cada uno de los diversos recipientes de reacción. Esto permite la realización 25 de un procedimiento sistemático de examen y escrutinio. De este modo, estos métodos permiten examinar sistemáticamente un número potencialmente muy grande de moléculas progenie en grupos más pequeños. Debido a su capacidad para realizar quimerizaciones de una manera que altamente flexible aunque también exhaustiva y sistemática, particularmente cuando hay un bajo nivel de homología entre las moléculas progenitoras es posible la generación de una biblioteca (o conjunto) que comprende un gran número de moléculas progenie. Debido a la 30 naturaleza no estocástica del presente reensamblaje de genes, las moléculas progenie generadas comprenden preferiblemente una biblioteca de moléculas de ácido nucleico quiméricas finalizadas que tienen un orden de ensamblaje global que se elige mediante diseño. En un aspecto concreto, tal biblioteca generada comprende más de 103 a más de 101000 especies moleculares progenie diferentes.

En un aspecto, un conjunto de moléculas de ácido nucleico quiméricas finalizadas, producidas como se ha descrito comprende un polinucleótido que codifica un polipéptido. De acuerdo con un aspecto, este polinucleótido es un gen, que puede ser un gen elaborado por el hombre. De acuerdo con otro aspecto, este polinucleótido forma parte de una ruta génica, que puede ser una ruta génica elaborada por el hombre. Uno o más genes elaborados por el hombre generados de este modo se pueden incorporar a una ruta génica elaborada por el hombre, tal como una ruta génica 40 operable en un organismo eucariótico (incluyendo una planta).

En otra ilustración, la naturaleza sintética de la etapa en la que se generan los elementos fundamentales permite el diseño e introducción de nucleótidos (p. ej., uno o más nucleótidos, que pueden ser, por ejemplo, codones o intrones o secuencias reguladoras) que se pueden eliminar después opcionalmente en un procedimiento in vitro (p. ej., 45 mediante mutagénesis) o en un procedimiento in vivo (p. ej., utilizando la capacidad de empalme del gen de un organismo anfitrión). Se aprecia que en muchos casos puede ser también deseable la introducción de estos nucleótidos por otras muchas razones además del beneficio potencial de la creación de un punto de demarcación práctico.

De este modo, se puede utilizar un elemento fundamental de ácido nucleico para introducir un intrón. Los intrones funcionales se pueden introducir en un gel elaborado por el hombre de la invención. Los intrones funcionales se pueden introducir en una ruta génica elaborada por el hombre. Por lo tanto, es posible la generación de un polinucleótido quimérico que es un gen elaborado por el hombre que contiene uno (o más) intrones introducidos artificialmente, así como la generación de un polinucleótido quimérico que forma parte de una ruta génica 55 elaboradas por el hombre que contiene uno (o más) intrones introducidos artificialmente. Preferiblemente, el intrón o los intrones introducidos artificialmente son funcionales en una o más células anfitrionas para el empalme de genes al igual que los intrones de origen natural sirven funcionalmente para el empalme de genes. El procedimiento puede producir polinucleótidos que contienen intrones elaborados por el hombre para introducirlos en organismos anfitriones para la recombinación y/o el empalme. 60

Un gen elaborado por el hombre producido de este modo puede servir también como sustrato para la recombinación con otros ácido nucleico. Asimismo, una ruta génica elaborada por el hombre producida de este modo puede servir también como sustrato para la recombinación con otro ácido nucleico. En un aspecto, la recombinación se facilita

mediante, o se produce en, zonas de homología entre el gene que contiene intrones elaborado por el hombre, y un ácido nucleico, que sirve como pareja de recombinación. En un aspecto, la pareja de recombinación puede ser también un ácido nucleico generado mediante estos métodos, incluyendo un gen elaborado por el hombre o una ruta génica elaborada por el hombre. La recombinación puede ser facilitada por, o se puede producir en zonas de homología que existen en uno (o más) intrones introducidos artificialmente en el gen elaborado por el hombre. 5

El método de reensamblaje sintético de genes utiliza una pluralidad de elementos fundamentales de ácido nucleico, cada uno de los cuales tiene preferiblemente dos extremos ligables. Los dos extremos ligables de cada elemento fundamental del ácido nucleico puede tener dos extremos romos (i. e. cada uno tiene un saliente de cero nucleótidos), o preferiblemente un extremo romo y un saliente, o aún más preferiblemente dos salientes. 10

Un saliente útil para este fin puede ser un saliente 3' o un saliente 5'. De este modo, un elemento fundamental del ácido nucleico puede tener un saliente 3' o alternativamente un saliente 5' o alternativamente dos salientes 3' o alternativamente dos salientes 5'. El orden general en el que se ensamblan los elementos fundamentales de ácido nucleico para formar una molécula de ácido nucleico quimérico finalizada se determina mediante diseño 15 experimental intencionado y no es aleatorio.

En un aspecto, un elemento fundamental del ácido nucleico se genera mediante síntesis química de dos ácidos nucleicos de hebra sencilla (también referidos como oligos de hebra sencilla) y poniéndolos en contacto de manera que se les permita recocerse para formar un elemento fundamental de ácido nucleico de doble hebra. 20

Un elemento fundamental de ácido nucleico de doble hebra puede tener un tamaño variable. Los tamaños de estos elementos fundamentales pueden ser pequeños o grandes. Los tamaños ilustrativos para el elemento fundamental oscilan de 1 par de bases (sin incluir ningún saliente) a 100.000 pares de bases (sin incluir ningún saliente). Se proporcionan también otros intervalos de tamaño ilustrativos, que tienen límites inferiores de 1 pb a 10.000 pb 25 (incluyendo cada valor entero intermedio) y límites superiores de 2 pb a 100.000 pb (incluyendo cada valor entero intermedio).

Existen muchos métodos por medio de los cuales se puede generar un elemento fundamental de ácido nucleico de doble hebra que sea práctico; y éstos son conocidos en la técnica y pueden ser realizados fácilmente por el experto 30 en la técnica.

De acuerdo con un aspecto, se genera un elemento fundamental de ácido nucleico de doble hebra generando en primer lugar dos ácidos nucleicos de hebra sencilla y permiténdoles recocerse para formar un elemento fundamental de ácido nucleico de doble hebra. Las dos hebras de un elemento fundamental de ácido nucleico de doble hebra 35 pueden ser complementarias a cada nucleótido aparte de cualquiera de los que forman un saliente; sin contener de este modo emparejamientos erróneos, aparte de cualquier saliente o salientes. De acuerdo con otro aspecto, las dos hebras de un elemento fundamental de ácido nucleico de doble hebra son complementarias en no todos los nucleótidos aparte de cualquiera de los que forman un saliente. De este modo, de acuerdo con este aspecto, se puede utilizar un elemento fundamental de ácido nucleico de hebra sencilla para introducir degeneración codónica. 40 Preferiblemente la degeneración codónica se introduce utilizando la mutagénesis de saturación de sitio descrita en la presente memoria, utilizando uno o más casetes N,N,G/T o alternativamente utilizando uno o más casetes N,N,N.

El método de recombinación in vivo se puede realizar a ciegas en un agrupamiento de híbridos o alelos desconocidos de un polinucleótido o secuencia específicos. Sin embargo, no es necesario conocer la secuencia de 45 ADN o ARN real del polinucleótido específico.

El enfoque en el que se utiliza la recombinación en una población mixta de genes puede ser útil para la generación de cualquier proteína útil, por ejemplo, interleuquina I, anticuerpos, tPA y hormona del crecimiento. Este enfoque se puede utilizar para generar proteínas que tienen especificidad o actividad alteradas. El enfoque puede ser útil 50 también para la generación de secuencias híbridas de ácido nucleico, por ejemplo, regiones promotoras, intrones, exones, secuencias intensificadoras, regiones no traducidas 3' o regiones no traducidas 5' de genes. De este modo este enfoque se puede utilizar para generar genes que tienen tasas de expresión incrementadas. Este enfoque puede ser útil también en el estudio de secuencias repetitivas ADN. Finalmente, este enfoque puede ser útil para mutar ribozimas o aptámeros. 55

El uso de ciclos repetidos de reordenamiento reductivo, recombinación y selección permite la evolución molecular dirigida de secuencias lineales altamente complejas, tales como ADN, ARN o proteínas a través de recombinación.

Sistema de Evolución Dirigida Optimizada 60

Un sistema de modificación de genes no estocástico denominado "sistema de evolución dirigida optimizada" genera polipéptidos, p. ej., xilanasas o anticuerpos de la invención, con propiedades nuevas o alteradas. La evolución directa optimizada está dirigida al uso de ciclos repetidos de reorganización reductiva, recombinación y selección

que permiten la evolución molecular dirigida de los ácidos nucleicos a través de recombinación. La evolución dirigida optimizada permite la generación de una gran población de secuencias quiméricas evolucionadas, donde la población generada está enriquecida significativamente en secuencias que tienen un número predeterminado de eventos de entrecruzamiento.

Un evento de entrecruzamiento es un punto en una secuencia quimérica en el que se produce un desplazamiento en la secuencia de una variante parental a otra variante parental. Tal punto se encuentra normalmente en la conexión en la que los oligonucleótidos de los dos orígenes se ligan entre sí para formar una sola secuencia. Este método permite el cálculo de las concentraciones correctas de las secuencias de oligonucleótidos de manera que la población final de secuencias quiméricas está enriquecida con el número elegido de eventos de entrecruzamiento. 10 Esto proporciona más control sobre las variantes quiméricas de elección que tienen un número predeterminado de eventos de entrecruzamiento.

Además, este método proporciona un medio conveniente para explorar una cantidad enorme del posible espacio variable de proteína en comparación con otros sistemas. Previamente, si se generaran, por ejemplo, 1013 moléculas 15 quiméricas durante un reacción, sería extremadamente difícil someter a ensayo este alto número de variantes quiméricas para una actividad concreta. Por otra parte, una porción significativa de la población progenie tendría un número muy alto de eventos de entrecruzamiento que darían como resultado proteínas que tendrían menos probabilidad de tener aumentos de los niveles de una actividad concreta. Utilizando estos métodos, la población de moléculas quiméricas puede estar enriquecida en esas variantes que tienen un número concreto de eventos de 20 entrecruzamiento. De este modo, aunque todavía se pudieran generar 1013 moléculas quiméricas durante una reacción, cada una de las moléculas elegidas para un análisis adicional tendría muy probablemente, por ejemplo, solo tres eventos de entrecruzamiento. Puesto que la población progenie resultante se podría desviar para que tuviera un número predeterminado de eventos de entrecruzamiento, los límites de variedad funcional entre las moléculas quiméricas son reducidos. Esto proporciona un número de variables más controlable cuando se calcula 25 qué oligonucleótido de los polinucleótidos parentales originales sería responsable de la influencia en un rasgo concreto .

Un método para crear una secuencia de polinucleótidos progenie quimérica es crear oligonucleótidos correspondientes a fragmentos o porciones de cada secuencia parental. Cada oligonucleótido incluye 30 preferiblemente una región de solapamiento única de manera que la mezcla de oligonucleótidos entre sí da como resultado una nueva variante que tiene fragmentos de oligonucleótidos ensamblados en el orden correcto. También se puede encontrar información adicional, p. ej., en el documento USSN 09/332.835; Patente de los Estados Unidos Núm. 6.361.974.

El número de oligonucleótidos generados para cada variante parental produce una relación con respecto al número total de entrecruzamientos resultantes en la molécula quimérica que se ha creado por último. Por ejemplo, se podrían proporcionar tres variantes de secuencias de nucleótidos parentales para que experimentaran una reacción de ligación con el fin de encontrar una variante quimérica que tuviera, por ejemplo, mayor actividad a alta temperatura. Como ejemplo, se puede generar un conjunto de 50 secuencias de oligonucleótidos correspondientes a 40 cada una de las porciones de cada variante parental. Por lo tanto, durante el procedimiento de reensamblaje por ligación podría haber hasta 50 eventos de entrecruzamiento en cada una de las secuencias quiméricas. La probabilidad de que cada uno de los polinucleótidos quiméricos generados contenga oligonucleótidos de cada variante parental en orden alterno es muy baja. Si cada fragmento de oligonucleótido está presente en la reacción de ligación en la misma cantidad molar es probable que en algunas posiciones se liguen oligonucleótidos del mismo 45 polinucleótido parental con otro contiguo y de este modo no se produzca un evento de entrecruzamiento. Si la concentración de cada oligonucleótido de cada progenitor se mantiene constante durante cualquier etapa de ligación en este Ejemplo, existe un tercio de probabilidades (suponiendo 3 progenitores) de que un oligonucleótido de la misma variante parental se ligue en la secuencia quimérica y no produzca entrecruzamiento.

Por lo tanto, se puede determinar la función de densidad de probabilidad (FDP) para pronosticar la población de eventos de entrecruzamiento que es probable que se produzcan durante cada etapa en una reacción de ligación dado un número establecido de variantes parentales, un número de oligonucleótidos correspondiente a cada variante, y las concentraciones de cada variante durante cada etapa en la reacción de ligación. Las estadísticas y matemáticas subyacentes a la determinación de la FPD se describen más abajo. Mediante la utilización de estos 55 métodos, se puede calcular tal función de densidad de probabilidad, y de este modo enriquecer la población progenie quimérica para un número predeterminado de eventos de entrecruzamiento resultantes de una reacción de ligación concreta. Por otra parte, puede estar predeterminado un número objetivo de eventos de entrecruzamiento, y el sistema programado a continuación para calcular las cantidades de partida de cada oligonucleótido parental durante cada etapa en la reacción de ligación para dar como resultado una función de densidad de probabilidad que 60 tiene como eje central el número predeterminado de eventos de entrecruzamiento. Estos métodos están dirigidos al uso de ciclos repetidos de reordenamiento reductivo, recombinación y selección que permite la evolución molecular dirigida de un ácido nucleico que codifica un polipéptido a través de recombinación. Este sistema permite la generación de una gran población de secuencias quiméricas evolucionadas, donde la población generada está

enriquecida significativamente en secuencias que tienen un número predeterminado de eventos de entrecruzamiento. Un evento de entrecruzamiento es un punto en una secuencia quimérica en el que se produce un desplazamiento en la secuencia de una variante parental a otra variante parental. Tal punto se encuentra normalmente en la conexión en la que los oligonucleótidos de los dos orígenes se ligan entre sí para formar una sola secuencia. Este método permite el cálculo de las concentraciones correctas de las secuencias de oligonucleótidos 5 de manera que la población final de secuencias quiméricas está enriquecida con el número elegido de eventos de entrecruzamiento. Esto proporciona más control sobre las variantes quiméricas de elección que tienen un número predeterminado de eventos de entrecruzamiento.

Además, estos métodos proporcionan un medio conveniente para explorar una cantidad enorme del posible espacio 10 variable de proteína en comparación con otros sistemas. Utilizando los métodos descritos de la presente memoria, la población de moléculas quiméricas puede estar enriquecida para esas variantes que tienen un número concreto de eventos de entrecruzamiento. De este modo, aunque todavía se pudieran generar 1013 moléculas quiméricas durante una reacción, cada una de las moléculas elegidas para un análisis adicional tendría muy probablemente, por ejemplo, solo tres eventos de entrecruzamiento. Puesto que la población progenie resultante se podría desviar para 15 que tuviera un número predeterminado de eventos de entrecruzamiento, los límites de variedad funcional entre las moléculas quiméricas son reducidos. Esto proporciona un número de variables más controlable cuando se calcula qué oligonucleótido de los polinucleótidos parentales originales sería responsable de la influencia en un rasgo concreto .

En un aspecto, el método crea una secuencia de polinucleótidos progenie quimérica creando oligonucleótidos correspondiente a fragmentos o porciones de cada secuencia parental. Cada oligonucleótido preferiblemente incluye una única región de solapamiento de manera que la mezcla de oligonucleótidos entre sí da como resultado una nueva variante que tiene cada fragmento de oligonucleótido ensamblado en el orden correcto. Véase también el documento USSN 09/332.835. 25

Determinación de los Eventos de Entrecruzamiento

Un sistema y soporte lógico reciben una función de densidad de probabilidad de entrecruzamiento (FDE), el número de genes parentales que se van a reensamblar, y el número de fragmentos en el reensamblaje como entradas. La 30 salida de este programa es un "fragmento FDE" que se puede que se puede utilizar para determinar una receta para producir genes reensamblados, y la FDE de entrecruzamiento estimada de esos genes. El procedimiento descrito en la presente memoria se realiza preferiblemente en MATLAB™ (The Mathworks, Natick, Massachusetts) un lenguaje de programación y entorno de desarrollo para cálculo técnico.

Procedimientos Iterativos

Estos procedimientos se pueden repetir iterativamente. Por ejemplo, un ácido nucleico (o, el ácido nucleico) responsable de un fenotipo de xilanasa nuevo o alterado se identifica, re-aísla, se modifica de nuevo, se vuelve a someter a ensayo para determinar su actividad. Este procedimiento se puede repetir iterativamente hasta que se 40 construya un fenotipo deseado. Por ejemplo, se puede construir una ruta bioquímica anabólica o catabólica completa en una célula, incluyendo, p. ej., actividad xilanasa.

De un modo similar, si se determina que un oligonucleótido concreto no afecta en absoluto al rasgo deseado (p. ej., un fenotipo de xilanasa), éste se puede eliminar como una variable sintetizando oligonucleótidos parentales más 45 grandes que incluyen la secuencia que se va a eliminar. Puesto que la incorporación de la secuencia en una secuencia más grande evita cualquier evento de entrecruzamiento, no habrá ninguna variación de esta secuencia en los polinucleótidos progenie. Esta práctica iterativa para determinar cuáles oligonucleótidos están más relacionados con el rasgo deseado, y cuáles no están relacionados, permite una exploración más eficaz de las variantes de proteínas posibles podrían proporcionar un rasgo o actividad concretos. 50

Barajado in vivo

El barajado in vivo de moléculas se utiliza en métodos que proporcionan variantes de polipéptidos de la invención, p. ej., anticuerpos, xilanasas, y similares. El barajado in vivo se puede realizar utilizando la propiedad natural de las 55 células para recombinar multímeros. Si bien la recombinación in vivo ha proporcionado la ruta natural principal para la diversidad molecular, la recombinación genética sigue siendo un procedimiento relativamente complejo que implica 1) el reconocimiento de homologías; 2) escisión de la hebra, invasión de la hebra, y etapas metabólicas que conducen a la producción de un quiasma recombinante; y finalmente 3) la resolución del quiasma a moléculas recombinadas discretas. La formación del quiasma requiere el reconocimiento de secuencias homólogas. 60

El polinucleótido híbrido se puede producir a partir de al menos un primer polinucleótido y un segundo polinucleótido. Un polinucleótido híbrido se puede elaborar introduciendo al menos un primer polinucleótido y un segundo polinucleótido que comparten al menos una región de homología de secuencia parcial (p. ej., SEQ ID NOS: 1, 3, 5,

7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163, 165, 167, 169, 171, 173, 175, 177, 179, 181, 183, 185, 187, 189, 191, 193, 195, 197, 199, 201, 203, 205, 207, 209, 211, 213, 215, 217, 219, 221, 223, 225, 227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247, 249, 251, 253, 255, 257 y 5 combinaciones de las mismas) en una célula anfitriona adecuada. Las regiones de homología de secuencia parcial promueven procedimientos que dan como resultado reorganización de secuencia produciendo un polinucleótido híbrido. El término "polinucleótido híbrido", según se utiliza de la presente memoria, es cualquier secuencia de nucleótidos que resulta de este método y contiene secuencias de al menos dos secuencias de polinucleótidos. Tales polinucleótido híbridos pueden resultar de eventos de recombinación intermoleculares que promueven la integración 10 de secuencias entre moléculas de ADN. Además, tales polinucleótidos híbridos pueden resultar de procedimientos de reordenamiento reductivo intramolecular que utilizan secuencias repetidas para alterar una secuencia de nucleótidos en una molécula de ADN.

El reordenamiento in vivo está centrado en procedimientos "inter-moleculares" referidos colectivamente como 15 "recombinación" que en bacterias, es considerado generalmente como un fenómeno "dependiente de RecA". La invención puede basarse en procedimientos de recombinación de una célula anfitriona para recombinar y reordenar secuencias, o la capacidad de las células para mediar procedimientos reductivos para reducir la complejidad de las secuencias cuasi repetidas en la célula mediante deleción. Este procedimiento de "reordenamiento reductivo" se produce mediante un procedimiento "intra-molecular", independiente de RecA. 20

Por lo tanto, se pueden generar polinucleótidos novedosos mediante el procedimiento de reordenamiento reductivo. El método implica la generación de constructos que contienen secuencias consecutivas (secuencias codificantes originales), su inserción en un vector apropiado y su posterior introducción en una célula anfitriona apropiada. El reordenamiento de las entidades moleculares individuales se produce mediante procedimientos combinatorios entre 25 las secuencias consecutivas en el constructo que posee regiones de homología, o entre unidades cuasi repetidas. El procedimiento de reordenamiento recombina y/o reduce la complejidad y la extensión de las secuencias repetidas y da como resultado la producción de especies moleculares novedosas. Se pueden aplicar diversos tratamientos para aumentar la velocidad de reordenamiento. Estos podrían incluir tratamiento con luz ultravioleta, o agentes químicos que dañan el ADN y/o el uso de líneas de células anfitrionas que despliegan niveles incrementados de "inestabilidad 30 genética". De este modo el procedimiento de reordenamiento puede implicar recombinación homóloga o la propiedad natural de las secuencias cuasi repetidas para dirigir su propia evolución.

Las secuencias repetidas o "cuasi repetidas" juegan un papel en la inestabilidad genética. Las "cuasi-repeticiones" son repeticiones que no están restringidas a su estructura unitaria original. Las unidades cuasi repetidas se pueden 35 presentar como una matriz de secuencias en un constructo; unidades consecutivas de secuencias similares. Una vez ligadas, las conexiones entre las secuencias consecutivas se hacen esencialmente invisibles y la naturaleza cuasi repetitiva del constructo resultante es ahora continua a nivel molecular. El procedimiento de deleción que realiza la célula para reducir la complejidad del constructo resultante funciona entre las secuencias cuasi repetidas. Las unidades cuasi repetidas proporcionas un repertorio prácticamente ilimitado sobre los cuales pueden ocurrir 40 eventos de deslizamiento. Los constructos que contienen las cuasi repeticiones proporcionan de este modo eficazmente suficiente elasticidad molecular como para que puedan ocurrir eventos de deleción (y potencialmente inserción) virtualmente en cualquier parte en las unidades cuasi repetitivas.

Cuando las secuencias cuasi repetidas están ligadas todas en la misma orientación, por ejemplo cabeza a cola o 45 viceversa, la célula no puede distinguir las unidades individuales. Por consiguiente, el procedimiento reductivo puede ocurrir por todas las secuencias. En contraste, cuando por ejemplo, las unidades se presentan cabeza a cabeza, en lugar de cabeza a cola, la inversión perfila los extremos de la unidad adyacente de manera que la formación de la deleción favorecerá la pérdida de unidades discretas. De este modo, es preferible con el presente método que las secuencias se encuentren en la misma orientación. La orientación aleatoria de secuencias cuasi repetidas dará 50 como resultado la pérdida de eficacia de reordenamiento, mientras que la orientación uniforme de las secuencias ofrecerá la mayor eficacia. Sin embargo, si bien la posesión de menos secuencias contiguas en la misma orientación reduce la eficacia, aún puede proporcionar suficiente elasticidad para la recuperación eficaz de las moléculas novedosas. Los constructos se pueden elaborar con las secuencias cuasi repetidas en la misma orientación para permitir una mayor eficacia. 55

Las secuencias se pueden ensamblar en una orientación cabeza a cola utilizando cualquiera de una variedad de métodos, incluyendo los siguientes:

a) Se pueden utilizar cebadores que incluyen una cabeza poli-A y una cola poli-T que cuando se elaboran de 60 hebra sencilla proporcionan orientación. Esto se logra elaborando a partir de ARN las primeras pocas bases de los cebadores y por tanto eliminándolas fácilmente con ARNasa H.

b) Se pueden utilizar cebadores que incluyen sitios de escisión por restricción únicos. Se requerirían sitios múltiples, una batería de secuencias únicas y etapas de ligación y síntesis repetidas.

c) Las pocas bases internas del cebador podrían estar tioladas y se utilizaría una exonucleasa para producir las moléculas apropiadamente dotadas de cola.

La recuperación de las secuencias se basa en la identificación de vectores de clonación con un índice repetitivo reducido (IR). Las secuencias codificantes reordenadas se pueden recuperar de este modo mediante amplificación. 5 Los productos se vuelven a clonar y a expresar. La recuperación de los vectores de clonación con IR reducido se puede efectuar mediante:

1) El uso de vectores solo mantenidos establemente cuando el constructo se reduce en complejidad.

2) La recuperación física de los vectores acortados mediante procedimientos físicos. En este caso, el vector de 10 clonación sería recuperado utilizando procedimientos de aislamiento de plásmidos convencionales y se fraccionaría su tamaño en gel de agarosa, o una columna con un bajo peso molecular de corte utilizando procedimientos convencionales.

3) La recuperación de vectores que contienen genes interrumpidos se puede seleccionar cuando el tamaño del inserto disminuye. 15

4) El uso de técnicas de selección directa con un vector de expresión y la selección apropiada.

Las secuencias codificantes (por ejemplo, genes) de organismos relacionados pueden mostrar un alto grado de homología y codifican productos proteicos bastante diversos. Estos tipos de secuencias son particularmente útiles en la presente invención en forma de cuasi repeticiones. Sin embargo, mientras que los Ejemplos ilustrados más 20 abajo demuestran el reordenamiento de secuencias codificantes originales casi idénticas (cuasi repeticiones), este procedimiento no está limitado a tales repeticiones idénticas.

El siguiente ejemplo muestra un método de la invención. Se describen las secuencias codificantes de ácido nucleico (cuasi repeticiones) derivadas de tres (3) especies únicas. Cada secuencia codifica una proteína con un conjunto de 25 propiedades distintas. Cada una de las secuencias difiere en uno o unos pocos pares de bases en una única posición de la secuencia. Las secuencias cuasi repetidas se amplifican y se ligan separadamente o colectivamente en ensamblajes aleatorios de manera que estén disponibles todas las permutaciones y combinaciones posibles en la población de moléculas ligadas. El número de unidades cuasi repetidas puede estar controlado por las condiciones de ensamblaje. El número medio de unidades cuasi repetidas en un constructo se define como el índice repetitivo 30 (IR).

Una vez formados, los constructos pueden ser fraccionados, o no, por tamaño en un gel de agarosa de acuerdo con los protocolos publicados, insertados en un vector de clonación y transfectados en una célula anfitriona apropiada. Las células se propagan a continuación y se efectúa el "reordenamiento reductivo". La velocidad del procedimiento 35 de reordenamiento reductivo se puede estimular mediante la introducción de desperfectos en el ADN si se desea. El que la reducción del IR esté mediada por la formación de deleción entre secuencias repetidas por medio de un mecanismo "intra-molecular", o mediada por eventos de tipo recombinación a través de mecanismos "intermoleculares" es irrelevante. El resultado final es un reordenamiento de las moléculas en todas las combinaciones posibles. 40

Opcionalmente, el método comprende la etapa adicional de escrutinio de los miembros de la biblioteca de la reserva barajada para identificar miembros de la biblioteca barajados individuales que tienen la capacidad de unirse o interactuar de otro modo, o catalizar una reacción concreta (p. ej., tal como el dominio catalítico de una enzima) con una macromolécula predeterminada, tal como por ejemplo un receptor proteinaceo, un oligosacárido, virión, u otro 45 compuesto o estructura predeterminados.

Los polipéptidos que se identifican a partir de tales bibliotecas se pueden utilizar para fines terapéuticos, diagnósticos, de investigación y propósitos relacionados (p. ej., catalizadores, solutos para incrementar la osmolaridad de una solución acuosa y similares) y/o se puede someter a uno o más ciclos de barajado y/o selección 50 adicionales.

En otro aspecto, se prevé que antes de o durante la recombinación o el reordenamiento, los polinucleótidos generados por estos métodos se puedan someter a agentes o procedimientos que promuevan la introducción de mutaciones en los polinucleótidos originales. La introducción de tales mutaciones aumentaría la diversidad de los 55 híbridos polinucleotídico resultantes y los polipéptidos codificados de allí. Los agentes o procedimientos que promueven la mutagénesis pueden incluir, pero no están limitados a: (+)-CC-1065, o un análogo sintético tal como (+)-CC-1065-(N3-Adenina) (Véase Sun y Hurley, (1992)); un aducto de 4'-fluro-4-aminobifenilo N-acetilado o desacetilado capaz de inhibir la síntesis de ADN (Véase, por ejemplo, van de Poll et al. (1992)); o un aducto de 4-aminobifenilo N-acetilado o desacetilado capaz de inhibir la síntesis de ADN (Véase también, van de Poll et al. 60 (1992), págs. 751-758); cromo trivalente, una sal de cromo trivalente, un hidrocarburo aromático policíclico (HAP) , un aducto de ADN capaz de inhibir la replicación de ADN, tal como 7-bromometilbenz[a]antraceno ("BMA"), tris(2,3-dibromopropil)fosfato ("Tris-BP"), 1,2-dibromo-3-cloropropano ("DBCP"), 2-bromoacroleína (2BA), benzo[a]pireno-7,8-dihidrodiol-9-10-epóxido ("BPDE"), una sal halogenada de platino(II), N-hidroxi-2-amino-3-metilimidazo[4,5-f]-

quinolina ("N-hidroxi-IQ") y N-hidroxi-2-amino-1-metil-6-fenilimidazo[4,5-f]-piridina ("N-hidroxi-PhIP"). Los medios ilustrativos para ralentizar o detener la amplificación mediante PCR consisten en luz UV (+)-CC-1065 y (+)-CC-1065-(N3-Adenina). Los medios incluidos particularmente son los aductos de ADN o polinucleótidos que comprenden los aductos de ADN de los polinucleótidos o reservas de polinucleótidos, que se pueden liberar o eliminar mediante un procedimiento que incluye calentar la solución que comprende los polinucleótidos antes de su procesamiento 5 adicional.

Un método para producir proteínas recombinantes que tienen actividad biológica es mediante tratamiento de una muestra que comprende polinucleótidos molde de doble hebra que codifican una proteína de tipo salvaje en condiciones de acuerdo con la invención que proporcionan la producción de polinucleótidos híbridos o reordenados. 10

Producción de secuencias variantes

Son posibles métodos adicionales para elaborar secuencia variantes de las secuencias de ácido nucleico (p. ej., xilanasa) de la invención, puesto que son métodos adicionales para el aislamiento de xilanasas utilizando los ácidos 15 nucleicos y polipéptidos de la invención. Las variantes de una secuencia codificante de xilanasa (p. ej., un gen, ADNc o mensaje) de la invención, que se pueden alterar mediante cualquier método, incluyendo, p. ej., métodos aleatorios o estocásticos, o, métodos no estocásticos, o de "evolución dirigida", se escriben más abajo.

Las variantes aisladas pueden ser origen natural. También se pueden crear variantes in vitro. Las variantes se 20 pueden crear utilizando técnicas de ingeniería genética tales como mutagénesis dirigida al sitio, mutagénesis química al azar, procedimientos de deleción con Exonucleasa III, y técnicas de clonación convencionales. Alternativamente, tales variantes, fragmentos, análogos, o derivados se pueden crear utilizando procedimientos de síntesis o modificación química. Otros métodos para elaborar variantes son también familiares para los expertos en la técnica. Estos incluyen procedimientos en los que se modifican secuencias de ácido nucleico obtenidas de 25 productos aislados naturales para generar ácidos nucleicos que codifican polipéptidos que tienen características que potencian su valor en aplicaciones industriales o de laboratorio. En tales procedimientos, se generan y caracterizan un gran número de secuencias variantes que tienen una o más diferencias de nucleótidos con respecto a la secuencia obtenida a partir del producto aislado natural. Estas diferencias de nucleótidos pueden dar como resultado cambios de aminoácidos con respecto a los polipéptidos codificados por los ácidos nucleicos de los productos 30 aislados naturales.

Por ejemplo, se pueden crear variantes utilizando PCT propensa a error. En la PCR propensa a error, la PCR se realiza en condiciones en las que la fidelidad de la copia de la ADN polimerasa es baja, de manera que se obtiene un alta tasa de mutaciones puntuales a lo largo de toda la longitud del producto de PCR. La PCR propensa a error 35 es descrita, p. ej., por Leung, D.W., et al., en Technique, 1:11-15, 1989) y Caldwell, R. C. & Joyce G.F., PCR Methods Applic., 2:28-33, 1992. En resumen, tales procedimientos, los ácidos nucleicos que se van a mutagenizar se mezclan con cebadores para PCR, tampón de reacción, MgCl2, MnCl2, polimerasa Taq y una concentración apropiada de dNTPs para lograr una alta la velocidad de mutación puntual a lo largo de la longitud completa del producto de PCR. Por ejemplo, la reacción se puede realizar utilizando 20 fmoles del ácido nucleico que se va a 40 mutagenizar, 30 pmoles de cada cebador de PCR, un tampón de reacción que comprende KCl 50 mM, Tris HCl 10 mM (pH 8.3) y gelatina al 0,01%, MgCl2 7 mM, MnCl2 0,5 mM, 5 unidades de polimerasa Taq, dGTP 0,2 mM, dATP 0,2 mM, dCTP 1 mM, y dTTP 1 mM. La PCR se puede realizar durante 30 ciclos de 94°C durante 1 min, 45°C durante 1 min, y 72°C durante 1 min. Sin embargo, se apreciará que estos parámetros pueden variarse según sea apropiado. Los ácidos nucleicos mutagenizados se clonan en un vector apropiado y se evalúan las actividades de 45 los polipéptidos codificados por los ácidos nucleicos mutagenizados.

También se pueden crear variantes utilizando mutagénesis dirigida a oligonucleótidos para generar mutaciones de sitio específico en cualquier ADN clonado de interés. La mutagénesis de oligonucleótidos la describen, p. ej., Reidhaar-Olson (1988) en Science 241:53-57. En resumen, en tales procedimientos se sintetiza una pluralidad de 50 oligonucleótidos de doble hebra que portan una o más mutaciones que se van a introducir en el ADN clonado y se inserta en el ADN clonado que se va a mutagenizar. Los clones que contienen el ADN mutagenizado se recuperan y se evalúan las actividades de los polipéptidos que codifican.

Otro método para generar variantes es la PCR de ensamblaje. La PCR de ensamblaje implica el ensamblaje de un 55 producto de PCR a partir de una mezcla de fragmentos pequeños de ADN. Se producen en paralelo un gran número de reacciones PCR diferentes en el mismo vial, primando los productos de una reacción sobre los productos de otra reacción. La PCR de ensamblaje se describe, p. ej., en la Patente de los Estados Unidos Núm. 5.965.408.

Otro método para generar variantes es la mutagénesis por PCR sexual. En la mutagénesis por PCR sexual, se 60 produce la recombinación homóloga forzada entre moléculas de ADN de secuencias de ADN diferentes pero íntimamente relacionadas in vitro, como resultado de la fragmentación al azar de la molécula de ADN basada en la homología de la secuencia, seguido de fijación del entrecruzamiento por extensión de cebador en una reacción PCR. La mutagénesis por PCR sexual la describe, p. ej., Stemmer (1994) en Proc. Natl. Acad. Sci. USA 91:10747-

10751. En resumen, en tales procedimientos se digiere con ADNasa una pluralidad de ácidos nucleicos que se van a recombinar para generar fragmentos que tienen un tamaño medio de 50-200 nucleótidos. Los fragmentos de tamaño medio deseado se purifican y resuspenden una mezcla para PCR. La PCR se lleva a cabo en condiciones que faciliten la recombinación entre los fragmentos de ácido nucleico. Por ejemplo, la PCR se puede realizar suspendiendo los fragmentos purificados a una concentración de 10-30 ng/µl en una solución 0,2mM de cada dNTP, 5 MgCl2 2,2 mM, KCl 50 mM, Tris HCl 10 mM, pH 9,0, y Triton X-100 al 0,1%. Se añaden 2,5 unidades de polimerasa Taq por 100:1 de mezcla de reacción y la PCR se realiza utilizando del siguiente régimen: 94°C durante 60 segundos, 94°C durante 30 segundos, 50-55°C durante 30 segundos, 72°C durante 30 segundos (30-45 veces) y 72°C durante 5 minutos. Sin embargo, se apreciará que estos parámetros se pueden variar según sea apropiado. En algunos aspectos, se pueden incluir oligonucleótidos en las reacciones PCR. En otros aspectos, se puede utilizar el 10 fragmento de Klenow de ADN polimerasa I en un primer grupo de reacciones PCR y se puede utilizar polimerasa Taq en un grupo de reacciones posterior. Las secuencias recombinantes se aíslan y se evalúan las actividades de los polipéptidos que codifican.

También se pueden crear variantes mediante mutagenésis in vivo. En algunos aspectos, se generan mutaciones al 15 azar en una secuencia de interés propagando la secuencia de interés en una cepa bacteriana, tal como una cepa de E. coli, que porta mutaciones en uno o más de las rutas de reparación del ADN. Tales cepas "mutadoras" tienen una tasa de mutación aleatoria más alta que un progenitor de tipo salvaje. La propagación del ADN en una de estas cepas generará finalmente mutaciones al azar en el ADN. Las cepas mutadoras adecuadas para su uso para la mutagenésis in vivo se describen en la Publicación PCT Núm. WO 91/16427, publicada el 31 de Octubre de 1991, 20 titulada "Methods for Phenotype Creation from Multiple Gene Populations".

También se pueden generar variantes utilizando mutagenésis por inserción de casetes. En la mutagenésis por inserción de casetes una pequeña región de una molécula de ADN de doble hebra se remplaza por un "casete" de oligonucleótido sintético que difiere de la secuencia nativa. El oligonucleótido contiene con frecuencia una secuencia 25 nativa completamente y/o parcialmente aleatorizada.

También se puede utilizar mutagénesis recursiva de conjunto para generar variantes. La mutagénesis recursiva de conjunto es un algoritmo para construir proteínas (mutagénesis de proteínas) desarrollado para producir poblaciones diversas de mutantes relacionados fenotípicamente cuyos miembros difieren en la secuencia de aminoácidos. Este 30 método utiliza un mecanismo de retroalimentación para controlar las rondas sucesivas de mutagenésis combinatoria por inserción de casetes. La mutagénesis recursiva de conjunto es descrita por Arkin, A.P. y Youvan, D.C., PNAS, USA, 89:7811-7815, 1992.

En algunos aspectos, la variantes se crean utilizando mutagenésis de conjunto exponencial. La mutagénesis de 35 conjunto exponencial es un procedimiento para generar bibliotecas combinatorias con un alto porcentage de mutantes únicos y funcionales, donde se asignan al azar en paralelo grupos de residuos para identificar, en cada posición alterada, los aminoácidos que conducen a proteínas funcionales. La mutagénesis de conjunto exponencial es descrita por Delegrave, S. y Youvan, D.C., en Biotechnology Research, 11:1548-1552, 1993. Las mutagénesis al azar y dirigida al sitio son descritas por Arnold, F.H., en Current Opinion in Biotechnology, 4:450-455, 1993. 40

En algunos aspectos, las variantes se crean utilizando procedimientos de barajado donde porciones de una pluralidad de ácidos nucleicos que codifican polipéptidos distintos se fusionan entre sí para crear secuencias de ácidos nucleicos quiméricas que codifican polipéptidos quiméricos como se describe en La Patente de los Estados Unidos Núm. 5.965.408, presentada el 9 de Julio de 1996, titulada, "Method of ADN Reassembly by Interrupting 45 Synthesis" y la Patente de los Estados Unidos Núm. 5.939.250, presentada el 22 de May de 1996, titulada, "Producción of Enzymes Having Desired Activities by Mutagénesis".

Las variantes de los polipéptidos de las secuencias de aminoácidos del Grupo B pueden ser variantes en las que uno o más de los residuos de aminoácidos de los polipéptidos de las secuencias de aminoácidos del Grupo B son 50 sustituidos por residuo de aminoácido conservado o no conservado (preferiblemente un residuo de aminoácido conservado) y tal residuo de aminoácido sustituido puede ser uno codificado o no por el código genético.

Las sustituciones conservativas son aquellas que sustituyen un aminoácido dado en un polipéptido por otro aminoácido de características parecidas. Las sustituciones consideradas generalmente como conservativas son los 55 siguientes remplazos: remplazos de un aminoácido alifático tal como Alanina, Valina, Leucina y Isoleucina por otro aminoácido alifático; remplazo de una Serina por una Treonina o vice versa; remplazo de un residuo ácido tal como ácido Aspártico y ácido Glutámico por otro residuo ácido; remplazo de un residuo que porta un grupo amida, tal como Asparragina y Glutamina, por otro residuo que porta un grupo amida; intercambio de un residuo alcalino tal como Lisina y Arginina por otro residuo alcalino; y remplazo de un residuo aromático tal como Fenilalanina, Tirosina 60 por otro residuo aromático.

Otras variantes son aquellas en las que uno o más de los residuos de aminoácidos de los polipéptidos de las secuencias de aminoácidos del Grupo B incluyen un grupo sustituyente.

Otras variantes más son aquellas en las que el polipéptido está asociado con otro compuesto, tal como un compuesto para incrementar la vida media del polipéptido (por ejemplo, polietilenglicol).

Son variantes adicionales aquellas en las que se fusionan al polipéptido aminoácidos adicionales, tal como una secuencia líder, una secuencia secretora, una secuencia de proproteína o una secuencia que facilita la purificación, 5 el enriquecimiento, o la estabilización del polipéptido.

En algunos aspectos, los fragmentos, derivados y análogos conservan la misma función o actividad biológica que los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas. En otros aspectos, el fragmento, derivado, o análogo incluye una proproteína, de manera que el fragmento, el derivado, o el 10 análogo se puedan activar mediante escisión de la porción proproteína para producir un polipéptido activo.

Optimización de codones para lograr altos niveles de expresión de proteínas en células anfitrionas

Los métodos pueden modificar los ácidos nucleicos que codifican la xilanasa para modificar el uso de los codones. 15 Los codones en un ácido nucleico que codifica una xilanasa se pueden modificar para incrementar o disminuir su expresión en una célula anfitriona. Los ácidos nucleicos pueden codificar una xilanasa modificada para incrementar su expresión en una célula anfitriona. El método comprende identificar un codón "no preferido" o "menos preferido" en el ácido nucleico codificante de la xilanasa y remplazar uno o más de esos codones no preferidos o menos preferidos por un "codón preferido" que codifica el mismo aminoácido que el codón remplazado y remplazar al 20 menos un codón no preferido o menos preferido en el ácido nucleico por un codón preferido que codifica el mismo aminoácido. un codón preferido es un codón representado en exceso en secuencias codificantes en genes en la célula anfitriona y un codón no preferido o menos preferido es un codón infrarrepresentado en secuencias codificantes en genes en la célula anfitriona.

Las anfitrionas para expresar células los ácidos nucleicos, casetes de expresión y vectores de la invención incluyen bacterias, levadura, hongos, células vegetales, células de insecto y células de mamífero. De este modo, los métodos para optimizar el uso de codones pueden estar en todas estas células. Las células anfitrionas ilustrativas incluyen bacterias gram negativas, tales como Escherichia coli y Pseudomonas fluorescens; bacterias gram positives, tales como Streptomyces diversa, Lactobacillus gasseri, Lactococcus lactis, Lactococcus cremoris, Bacillus subtilis. Las 30 células anfitrionas ilustrativas también incluyen organismos eucarióticos, p. ej., diversas levaduras, tales como Saccharomyces sp., incluyendo Saccharomyces cerevisiae, Schizosaccharomyces pombe, Pichia pastoris, y Kluyveromyces lactis, Hansenula polymorpha, Aspergillus niger, y células mamífero y células y líneas celulares de insecto.

Por ejemplo, los codones de un ácido nucleico que codifica una xilanasa aislado de una célula bacteriana se modifican de manera que el ácido nucleico sea expresado óptimamente en una célula bacteriana diferente de la bacteria de la que derivó la xilanasa, una levadura, un hongo, una célula vegetal, una célula de insecto o una célula de mamífero. Los métodos para optimizar codones son bien conocidos en la técnica, véase, p. ej., la Patente de los Estados Unidos Núm. 5.795.737; Baca (2000) Int. J. Parasitol. 30:113-118; Hale (1998) Protein Expr. Purif. 12:185-40 188; Narum (2001) Infect. Immun. 69:7250-7253. Véase también Narum (2001) Infect. Immun. 69:7250-7253, que describe codones de optimización en sistemas de ratón; Outchkourov (2002) Protein Expr. Purif. 24:18-24, que describe codones de optimización en levaduras; Feng (2000) Biochemistry 39:15399-15409, que describen codones de optimización en E. coli; Humphreys (2000) Protein Expr. Purif. 20:252-264, que describen el uso de un codón de optimización que afecta a la secreción en E. coli. 45

Animales no humanos transgénicos

La invención proporciona animales no humanos transgénicos que comprenden un ácido nucleico, un polipéptido (p. ej., una xilanasa), un casete de expresión o vector o una célula transfectada o transformada de la invención. La 50 invención también proporciona métodos para elaborar y utilizar estos animales no humanos transgénicos.

Los animales no humanos transgénicos pueden ser, p. ej., cabras, conejos, ovejas, cerdos, vacas, ratas y ratones, que comprenden los ácidos nucleicos de la invención. Estos animales se pueden utilizar, p. ej., como modelos in vivo para estudiar la actividad xilanasa, o, como modelos para escrutar agentes que cambian la actividad xilanasa in 55 vivo. Las secuencias codificantes de los polipéptidos que se van a expresar en los animales no humanos transgénicos se pueden diseñar para que sean constitutivas, o, estén bajo el control de factores reguladores transcripcionales específicos de tejido, específicos del desarrollo o inducibles. Los animales no humanos transgénicos se pueden diseñar y generar utilizando cualquier método conocido en la técnica; véanse, p. ej., las Patentes de los Estados Unidos Núms. 6.211.428; 6.187.992; 6.156.952; 6.118.044; 6.111.166; 6.107.541; 60 5.959.171; 5.922.854; 5.892.070; 5.880.327; 5.891.698; 5.639.940; 5.573.933; 5.387.742; 5.087.571, que describen elaboran y utilizan células transformadas y huevos y ratones, ratas, conejos, ovejas, cerdos y vacas transgénicos. Véase también, p. ej., Pollock (1999) J. Immunol. Methods 231:147-157, que describe la producción de proteínas recombinantes en la leche de animales productores de leche transgénicos; Baguisi (1999) Nat. Biotechnol. 17:456-

461, que demuestra la producción de cabras transgénicas. La Patente de los Estados Unidos Núm. 6.211.428, describes la realización y utilización de mamíferos no humanos transgénicos que expresan en sus cerebros un constructo de ácido nucleico que comprende una secuencia de ADN. La Patente de los Estados Unidos Núm. 5.387.742, describe la inyección de secuencias ADN recombinante o sintético clonadas en huevos de ratón fertilizados, la implantación de los huevos inyectados en hembras pseudo-preñadas, y el crecimiento a largo plazo 5 de ratones transgénicos cuyas células expresan proteínas relacionadas con la patología de la enfermedad de Alzheimer. La Patente de los Estados Unidos Núm. 6.187.992, describe la elaboración y utilización de un ratón transgénico cuyo genoma comprende una interrupción del gen codificante de la proteína precursora del amiloide (PPA).

También se pueden utilizar "animales que carecen de la expresión específica de un gen (knockout)" para poner en práctica los métodos de la invención. Por ejemplo, en un aspecto, los animales transgénicos o modificados de la invención comprenden un "animal knockout", p. ej., un "ratón knockout", construido para no expresar un gen endógeno, que es remplazado por un gen que expresa una xilanasa de la invención, o, una proteína de fusión que comprende una xilanasa de la invención. 15

Plantas y Semillas Transgénicas

La invención proporciona planta y semillas transgénicas que comprenden un ácido nucleico, un polipéptido (p. ej., una xilanasa), un casete de expresión o vector o una célula transfectada o transformada de la invención. La 20 invención también proporciona productos vegetales, p. ej., aceites, semillas, hojas, extractos y similares, que comprenden un ácido nucleico y/o un polipéptido (p. ej., una xilanasa) de la invención. La planta transgénica puede ser dicotiledónea (dos cotiledones) o monocotiledónea (un cotiledón). La invención también proporciona métodos para elaborar y utilizar estas plantas y semillas transgénicas. La planta o célula vegetal transgénicas que expresan un polipéptido de la presente invención se pueden construir de acuerdo con cualquier método conocido en la 25 técnica. Véase, por ejemplo, la Patente de los Estados Unidos Núm. 6.309.872.

Los ácidos nucleicos y constructos de expresión de la invención se pueden introducir en una célula vegetal por medio de cualquier método. Por ejemplo, los ácidos nucleicos o constructos de expresión se pueden introducir en el genoma de una planta anfitriona deseada, o, los ácidos nucleicos o constructos de expresión pueden ser episomas. 30 La introducción en el genoma de una planta deseada puede ser de manera que la producción de xilanasa por el anfitrión esté regulada por elementos de control de la transcripción o la traducción endógenos. La invención también proporciona "plantas knockout" donde la inserción de la secuencia génica, p. ej., mediante recombinación homóloga, ha interrumpido la expresión del gen endógeno. Los medios para generar plantas "knockout" son bien conocidos en la técnica, véase, p. ej., Strepp (1998) Proc Natl. Acad. Sci. USA 95:4368-4373; Miao (1995) Plant J 7:359-365. 35 Véase la discusión sobre plantas transgénicas, más abajo.

Los ácidos nucleicos de la invención se puede utilizar para conferir rasgo deseados a esencialmente cualquier planta, p. ej., a plantas que producen almidón, tales como la patata, el trigo, el arroz, la cebada, y similares. Los ácidos nucleicos de la invención se puede utilizar para manipular las rutas metabólicas de una planta con el fin de 40 optimizar o alterar la expresión en el anfitrión de la xilanasa. Estos pueden cambiar la actividad xilanasa en una planta. Alternativamente, una xilanasa de la invención se puede utilizar en la producción de una planta transgénica para producir un compuesto no producido naturalmente por esa planta. Esto puede reducir los costes de producción o crear un producto novedoso.

En un aspecto, la primera etapa en la producción de una planta transgénica implica elaborar un constructo de expresión para su expresión en una célula vegetal. Estos mecanismos son bien conocidos en la técnica. Pueden incluir seleccionar y clonar un promotor, una secuencia codificante para facilitar la unión eficaz de los ribosomas al ARNm y seleccionar las secuencias terminadoras de genes apropiadas. Un promotor constitutivo ilustrativo es CaMV35S, del virus del mosaico de la coliflor, que generalmente da como resultado un alto grado de expresión en 50 plantas. Otros promotores son más específicos y responden a indicaciones en el entorno interno o externo de la planta. Un promotor inducible por luz ilustrativo es el promotor del gen cab, codificante de la proteína de unión a clorofila a/b grande.

En un aspecto, el ácido nucleico se modifica para lograr una mayor expresión en una célula vegetal. Por ejemplo, es 55 probable que una secuencia de la invención tenga un mayor porcentaje de pares de nucleótidos A-T en comparación con el observado en una planta, algunas de las cuales prefieren pares de nucleótidos G-C. Por lo tanto, los nucleótidos A-T en la secuencia codificante pueden ser sustituidos por nucleótidos G-C sin cambiar significativamente la secuencia de aminoácidos para potenciar la producción del producto génico en las células vegetales. 60

Se pueden añadir genes con marcadores seleccionables al constructo génico con el fin de identificar células vegetales o tejidos que tengan integrado el transgen satisfactoriamente. Esto puede ser necesario puesto que lograr la incorporación y expresión de genes en células vegetales es un evento raro, que ocurre solo en un pequeño

percentaje de tejidos o células diana. Los genes marcadores seleccionables codifican proteínas que proporcionan resistencia a agentes que son normalmente tóxicos para las plantas, tales como antibióticos o herbicidas. Únicamente las células vegetales que tienen integrado el gen marcador seleccionable sobrevivirán cuando crezcan sobre un medio que contiene el antibiótico o herbicida apropiado. Como para los otros genes insertados, los genes marcadores también requieren secuencias promotoras y de terminación para su funcionamiento apropiado. 5

En un aspecto, la elaboración de plantas o semillas transgénicas comprende la incorporación de secuencias de la invención y, opcionalmente, genes marcadores a un constructo de expresión diana (p. ej., un plásmido), junto con la colocación de las secuencias promotoras y terminadoras. Esto puede implicar la transferencia del gen modificado a la planta a través de un método adecuado. Por ejemplo, se puede introducir un constructo directamente en el ADN 10 genómico de la célula vegetal utilizando técnicas tales como electroporación y microinyección de protoplastos de células vegetales, o los constructos se pueden introducir directamente en tejidos vegetales utilizando métodos balísticos, tales como bombardeo de partículas de ADN. Por ejemplo, véase, p. ej., Christou (1997) Plant Mol. Biol. 35:197-203; Pawlowski (1996) Mol. Biotechnol. 6:17-30; Klein (1987) Nature 327:70-73; Takumi (1997) Genes Genet. Syst. 72:63-69, que discute el uso de bombardeo de partículas para introducir transgenes en trigo; y Adam 15 (1997) supra, para el uso de bombardeo de partículas para introducir YAC en células vegetales. Por ejemplo, Rinehart (1997) supra, utilizó bombardeo de partículas para generar plantas de algodón transgénicas. El aparato para acelerar partículas se describe en la Patente de los Estados Unidos Núm. 5.015.580; y, aparato de aceleración de partículas BioRad (Biolistics) PDS-2000 asequible comercialmente; véanse también, John, Patente de los Estados Unidos Núm. 5.608.148; y Ellis, Patente de los Estados Unidos Núm. 5.681.730, que describe 20 transformación mediada por partículas de gimnospermas.

En un aspecto, los protoplastos se pueden inmovilizar y se les pueden inyectar ácidos nucleicos, p. ej., un constructo de expresión. Aunque la regeneración de plantas a partir de protoplastos no es fácil con cereales, es posible la regeneración de plantas en legumbres utilizando embriogénesis somática de callos derivados de 25 protoplastos. Los tejidos organizados se pueden transformar con ADN desnudo utilizando la técnica de la pistola génica, en la que el ADN se aplica como recubrimiento sobre microproyectiles de tungsteno, disparo 1/100a del tamaño de las células, que transporta el ADN profundamente a las células u organelos. Se induce a continuación la regeneración del tejido transformado, usualmente mediante embriogénesis somática. Esta técnica ha resultado satisfactoria en diversas especies de cereales incluyendo maíz y arroz. 30

También se pueden introducir ácidos nucleicos, p. ej., constructos de expresión, en células vegetales utilizando virus recombinantes. Se pueden transformar células vegetales utilizando vectores virales, tales como, p. ej., vectores derivados del virus del mosaico del tabaco (Rouwendal (1997) Plant Mol. Biol. 33:989-999), véase Porta (1996) "Use of viral replicons for the expresion of genes in plants", Mol. Biotechnol. 5:209-221. 35

Alternativamente, se pueden combinar ácidos nucleicos, p. ej., un constructo de expresión, con regiones flanqueantes de ADN-T adecuadas e introducir en un vector anfitrión de Agrobacterium tumefaciens convencional. Las funciones de virulencia del anfitrión Agrobacterium tumefaciens dirigirá la inserción del constructo y el marcador adyacente en el ADN de la célula vegetal cuando la célula es infectada por la bacteria. Las transfomaciones técnicas 40 mediadas por Agrobacterium tumefaciens, incluyendo el desarme y uso de vectores binarios, están bien descritas en la bibliografía científica. Véase, p. ej., Horsch (1984) Science 233:496-498; Fraley (1983) Proc. Natl. Acad. Sci. USA 80:4803 (1983); Gene Transfer to Plants, Potrykus, ed. (Springer-Verlag, Berlin 1995). El ADN en una célula de A tumefaciens están contenido en el cromosoma bacteriano así como en otra estructura conocida como plásmido Ti (inductor de tumor). El plásmido Ti contiene un tramo de ADN denominado ADN T (∼20 kb de longitud) que es 45 transferido a célula vegetal en el procedimiento de infección y una serie de genes vir (virulencia) que dirige el procedimiento de infección. A. tumefaciens puede infectar solo una planta a través de heridas: cuando una raíz o tallo de una planta se hiere produce ciertas señales químicas, en respuesta a la cual, los genes vir de A. tumefaciens se activan y dirigen una serie de eventos necesarios para la transferencia del ADN T desde el plásmido Ti al cromosoma de la planta. El ADN T entra a continuación en la célula vegetal a través de la herida. Se especula que el 50 ADN T espera hasta que el ADN de la planta se está replicando o transcribiendo, después se autoinserta en el ADN de la planta expuesto. Con el fin de utilizar A. tumefaciens como vector transgen, se tiene que eliminar la sección del ADN T que induce tumor, mientras que se conservan las regiones limítrofes del ADN T y los genes vir. El transgen se inserta a continuación entre las regiones limítrofes del ADN T, donde se transfiere a la célula vegetal y se integra en los cromosomas de las plantas. 55

La invención proporciona la transformación de plantas monocotiledoneas utilizando los ácidos nucleicos de la invención, incluyendo cereales importantes, véase Hiei (1997) Plant Mol. Biol. 35:205-218. Véanse también, p. ej., Horsch, Science (1984) 233:496; Fraley (1983) Proc. Natl. Acad. Sci USA 80:4803; Thykjaer (1997) supra; Park (1996) Plant Mol. Biol. 32:1135-1148, que comentan la integración de ADN T en ADN genómico. Véase también 60 D'Halluin, Patente de los Estados Unidos Núm. 5.712.135, que describe un procedimiento para la integración estable de un ADN que comprende un gen que es funcional en una célula de un cereal, u otra planta monocotiledónea.

En un aspecto, la tercera etapa puede implicar la selección y regeneración de plantas completas capaces de transmitir el gen diana incorporado a la siguiente generación. Tales técnicas de regeneración se basan en la manipulación de ciertas fitohormonas en un medio de crecimiento de cultivo de tejido, basándose típicamente en un marcador biocida y/o herbicida que ha sido introducido junto con la secuencia de nucleótidos deseada. La regeneración de plantas a partir de protoplastos cultivados es descrita por Evans et al., en Protoplasts Isolation and 5 Culture, Handbook of Plant Cell Culture, págs. 124-176, MacMillilan Publishing Company, New York, 1983; y Binding, Regeneration of Plants, Plant Protoplasts, págs. 21-73, CRC Press, Boca Raton, 1985. La regeneración se puede obtener también a partir de callos, explantes, órganos, o partes de los mismos de plantas. Tales técnicas de regeneración son descritas generalmente por Klee (1987) en Ann. Rev. of Plant Phys. 38:467-486. Para obtener plantas completas a partir de tejidos transgénicos tales como embriones inmaduros, estos se pueden cultivar en 10 condiciones ambientales controladas en una serie de medios que contienen nutrientes y hormonas, un procedimiento conocido como cultivo de tejidos. Una vez que se han generado plantas completas y producen semilla, comienza la evaluación de la progenie.

Después de incorporar establemente el casete de expresión en las plantas transgénicas, éste se puede introducir en 15 otras plantas mediante cruzamiento sexual. Se puede utilizar cualquiera de las diversas técnicas de cría convencionales, dependiendo de las especies que se vayan a cruzar. Puesto que la expresión transgénica de los ácidos nucleicos de la invención conduce a cambios fenotípicos, las plantas que comprenden los ácidos nucleicos recombinante de la invención se pueden cruzar sexualmente con una segunda planta para obtener un producto final. De este modo, la semilla de la invención se puede obtener de un cruce entre dos plantas transgénicas de la 20 invención, o un cruce entre una planta de la invención y otra planta. Los efectos deseados (p. ej., la expresión de los polipéptidos de la invención para producir una planta en la que se altera el comportamiento de floración) se pueden potenciar cuando ambas plantas progenitoras expresan los polipéptidos (p. ej., una xilanasa) de la invención. Los efectos deseados se pueden pasar a las generaciones de plantas futuras mediante métodos de propagación convencionales. 25

Los ácidos nucleicos y polipéptidos de la invención son expresados o insertados en cualquier planta o semilla. Las plantas transgénicas de la invención pueden ser dicotiledóneas o monocotiledoneas. Los ejemplos de las plantas transgénicas de un solo cotiledón de la invención son céspedes, tales como gramíneas pratenses (poa de los prados, Poa), hierbas forrajeras tales como festuca, lolium, hierbas de zonas templadas, tales como Agrostis, y 30 cereales, p. ej., trigo, avenas, centeno, cebada, arroz, sorgo, y maíz. Los ejemplos de plantas transgénicas de dos cotiledones de la invención son tabaco, legumbres, tal como altramuces, patata, remolacha azucarera, guisante, judías y soja, y plantas crucíferas (familia Brassicaceae), tales como coliflor, semilla de colza, y el organismo modelo íntimamente relacionado Arabidopsis thaliana. De este modo, las plantas y semillas transgénicas de la invención incluyen una amplia gama de plantas, incluyendo, pero no limitadas a, especies de los géneros Anacardium, 35 Arachis, Asparagus, Atropa, Avena, Brassica, Citrus, Citrullus, Capsicum, Carthamus, Cocos, Coffea, Cucumis, Cucurbita, Daucus, Elaeis, Fragaria, Glycine, Gossypium, Helianthus, Heterocallis, Hordeum, Hyoscyamus, Lactuca, Linum, Lolium, Lupinus, Lycopersicon, Malus, Manihot, Majorana, Medicago, Nicotiana, Olea, Oryza, Panieum, Pannisetum, Persea, Phaseolus, Pistachia, Pisum, Pyrus, Prunus, Raphanus, Ricinus, Secale, Senecio, Sinapis, Solanum, Sorghum, Theobromus, Trigonella, Triticum, Vicia, Vitis, Vigna, y Zea. 40

En realizaciones alternativas, los ácidos nucleicos de la invención son expresados en plantas que contienen células de fibras, incluyendo, p. ej., algodón, árbol del algodón (Kapok, Ceiba pentandra), sauce del desierto, arbusto de creosota, salsola, balsa, ramio, kenaf, hemp, rosa de Jamaica, yute, sisal, abacá y linaza. En realizaciones alternativas, las plantas transgénicas de la invención pueden ser miembros del género Gossypium, incluyendo 45 miembros de cualquier especie de Gossypium, tales como G. arboreum;. G. herbaceum, G. barbadense, y G. hirsutum.

La invención también proporciona plantas transgénicas que se van a utilizar para producir grandes cantidades de los polipéptidos (p. ej., una xilanasa o un anticuerpo) de la invención. Por ejemplo, véase Palmgren (1997) Trends 50 Genet. 13:348; Chong (1997) Transgenic Res. 6:289-296 (que producen proteína láctea humana beta-caseina en plantas de patata transgénicas utilizando un promotor de manopina sintasa (mas1',2') inducible por auxina, bidireccional con métodos de transformación del disco de la hoja mediados por Agrobacterium tumefaciens).

Utilizando procedimientos conocidos, un experto en la técnica puede escrutar plantas de la invención detectando el 55 aumento o disminución del ARNm transgen o la proteína en plantas transgénicas. Los medios para detectar y cuantificar los ARNm o proteínas son bien conocidos en la técnica.

Polipéptidos y péptidos

En un aspecto, la invención proporciona polipéptidos sintéticos o recombinantes que tienen actividad xilanasa y que comprenden una secuencia de aminoácidos que tiene una identidad de secuencia de al menos 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, o más, o identidad de secuencia completa (100%) con la secuencia de aminoácidos del SEQ ID NO: 160. La actividad xilanasa puede incluir la actividad: hidrolizar un enlace glicosídico en

un polisacárido, p. ej., un xilano; catalizar la hidrólisis de enlaces β-1,4-xilosídicos internos; una actividad endo-1,4-beta-xilanasa; o hidrolizar un xilano para producir una xilosa y xilo-oligómero de peso molecular más bajo; la actividad de arabinoxilano, tal como un arabinoxilano soluble en agua. Estos polipéptidos tienen la actividad de una capacidad para reducir la demanda de ClO2 cuando se utilizan para pretratar pasta Kraft. La invención proporciona un polipéptido sintético o recombinante, aislado que comprende una secuencia de aminoácidos del SEQ ID NO: 160. 5

Los polipéptidos de la invención incluyen xilanasas en una forma activa o inactiva. Por ejemplo, los polipéptidos de la invención incluyen proproteínas antes de la "maduración" o el procesamiento de las secuencias prepro, p. ej., por medio de una enzima de procesamiento de proproteínas, tal como una proproteína convertasa para generar una proteína mutante "activa". Los polipéptidos de la invención incluyen xilanasas inactivas por otras razones, p. ej., 10 antes de la "activación" mediante un evento de procesamiento post-traduccional, p. ej., una acción de endo- o exo-peptidasa o proteinasa, un evento de fosforilación, una amidación, una glicosilación o una sulfuración, un evento de dimerización, y similares. Los polipéptidos de la invención incluyen todas las formas activas, incluyendo subsecuencias activas, p. ej., dominios catalíticos o sitios activos, de la xilanasa.

Los métodos para identificar secuencias con dominio "prepro" y secuencias señal son bien conocidos en la técnica, véase, p. ej., Van de Ven (1993) Crit. Rev. Oncog. 4(2):115-136. Por ejemplo, para identificar una secuencia prepro, la proteína se purifica a partir del espacio extracelular y se determina la secuencia N-terminal de las proteínas y se compara con la forma no procesada.

La invención incluye polipéptidos con o sin una secuencia señal y/o una secuencia prepro. La invención incluye polipéptidos con secuencias señal heterólogas y/o secuencias prepro. La secuencia prepro (incluyendo una secuencia de la invención utilizada como dominio prepro heterólogo) se puede localizar sobre el extremo amino terminal o carboxi terminal de la proteína. La invención también incluye secuencias señal aisladas o recombinantes, secuencias prepro y dominios catalíticos (p. ej., "sitios activos") que comprenden secuencias de la invención. 25

El porcentaje de identidad de secuencia se puede encontrar a lo largo de toda la longitud del polipéptido, o, la identidad se puede encontrar a lo largo de una región de al menos alrededor de 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 o más residuos. Los polipéptidos de la invención puede ser también más cortos que los péptidos ilustrativos completos. En aspectos alternativos, la invención proporciona 30 polipéptidos (péptidos, fragmentos) que tienen un tamaño que oscila entre alrededor de 5 y la longitud total de un polipéptido, p. ej., una enzima, tal como una xilanasa; siendo los tamaños ilustrativos de alrededor de 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, o más residuos, p. ej., residuos contiguos de una xilanasa ilustrativa de la invención.

Los péptidos de la invención (p. ej., una subsecuencia de un polipéptido ilustrativo de la invención) pueden ser útiles, p. ej., como sondas de marcaje, antígenos, tolerágenos, motivos, sitios activos de xilanasas (p. ej., "dominios catalíticos"), secuencias señal y/o dominios prepro.

Los polipéptidos y péptidos de la invención se pueden aislar a partir de natural fuentes, ser sintéticos, o ser 40 polipéptidos generados recombinantemente. Los péptidos y proteínas se pueden expresar recombinantemente in vitro o in vivo. Los péptidos y polipéptidos de la invención se pueden elaborar y aislar utilizando cualquier método conocido en la técnica. Los polipéptidos y péptidos de la invención se pueden sintetizar también, completamente o en parte, utilizando métodos químicos bien conocidos en la técnica. Véanse p. ej., Caruthers (1980) Nucleic Acids Res. Symp. Ser. 215-223; Horn (1980) Nucleic Acids Res. Symp. Ser. 225-232; Banga, A.K., Therapeutic Peptides 45 and Proteins, Formulation, Processing y Delivery Systems (1995) Technomic Publishing Co., Lancaster, PA. Por ejemplo, la síntesis peptídica se puede realizar utilizando diversas técnicas en fase sólida (véanse p. ej., Roberge (1995) Science 269:202; Merrifield (1997) Methods Enzymol. 289:3-13) y la síntesis automática se puede lograr, p. ej., utilizando el Sintetizador de Péptidos ABI 431A (Perkin Elmer) de acuerdo con las instrucciones proporcionadas por el fabricante. 50

Los péptidos y polipéptidos de la invención pueden estar también glicosilados. La glicosilación se puede añadir post-traduccionalmente ya sea químicamente o mediante mecanismos biosintéticos celulares, donde el último incorpora el uso de motivos de glicosilación conocidos, que pueden ser nativos para la secuencia o se pueden añadir en forma de un péptido o añadir a la secuencia de ácido nucleico codificante. La glicosilación puede estar conectada a O o 55 conectada a N.

Los péptidos y polipéptidos de la invención, como se ha definido anteriormente, incluyen todas las formas "miméticas" y "peptidomiméticas". Los términos "mimético" y "peptidomimético" hacen referencia a un compuesto químico sintético que tiene esencialmente las mismas características estructurales y/o funcionales de los 60 polipéptidos de la invención. El mimético puede estar compuesto completamente de análogos de aminoácidos no naturales, sintéticos, o, es una molécula quimérica parcialmente de aminoácidos de péptidos naturales y parcialmente de análogos de aminoácidos no naturales. El mimético también puede incorporar cualquier cantidad de sustituciones conservativas de aminoácidos naturales con tal que tales sustituciones no alteren tampoco

sustancialmente la estructura y/o actividad del mimético. Como con los polipéptidos de la invención que son variantes conservativas, la experimentación rutinaria determinará cuándo un mimético se encuentra dentro del alcance de la invención, es decir, que su estructura y/o función no está sustancialmente alterada. De este modo, en un aspecto, una composición mimética se encuentra dentro del alcance de la invención si tiene una actividad xilanasa. 5

Las composiciones miméticas de polipéptidos de la invención pueden contener cualquier combinación de componentes estructurales no naturales. En un aspecto alternativo, las composiciones miméticas de la invención incluyen uno o todos los siguientes tres grupos estructurales: a) grupos de unión a residuos distintos de las uniones mediante enlace amida natural ("enlace peptídico"); b) residuos no naturales en lugar de residuos de aminoácido de 10 origen natural; o c) residuos que inducen mimetismo estructural secundario, es decir, que inducen o estabilizan una estructura secundaria, p. ej., un giro beta, un giro gamma, una lámina beta, una conformación en hélice alfa, y similares. Por ejemplo, un polipéptido de la invención puede ser caracterizado como mimético cuando todos o algunos de sus residuos se conectan mediante medios químicos distintos de los enlaces peptídicos naturales. Los residuos de peptidomiméticos individuales se pueden conectar mediante enlaces peptídicos, otros enlaces o medios 15 de acoplamiento químicos, tales como, p. ej., glutaraldehído, ésteres de N-hidroxisuccinimida, maleimidas bifuncionales, N,N'-diciclohexilcarbodiimida (DCC) o N,N'-diisopropilcarbodiimida (DIC). Los grupos conectores que pueden ser una alternativa a las uniones mediante enlace amida tradicional ("enlace peptídico") incluyen, p. ej., cetometileno (p. ej., -C(=O)-CH2- para -C(=O)-NH-), aminometileno (CH2-NH), etileno, olefina (CH=CH), éter (CH2-O), tioéter (CH2-S), tetrazol (CN4-), tiazol, retroamida, tioamida, o éster (véase, p. ej., Spatola (1983) en Chemistry 20 and Biochemistry of Amino Acids, Peptides and Proteins, Vol. 7, págs. 267-357, "Peptide Backbone Modifications", Marcell Dekker, NY).

Un polipéptido de la invención se puede caracterizar también como mimético por contener todos o algunos residuos no naturales en lugar de residuos de aminoácido de origen natural. Los residuos no naturales están bien descritos 25 en la bibliografía científica y de patentes; unas pocas composiciones no naturales ilustrativas útiles como miméticos de residuos de aminoácidos naturales y sus líneas de actuación se describen más abajo. Se pueden generar miméticos de aminoácidos aromáticos remplazando por, p. ej., D- o L- naftilalanina; D- o L- fenilglicina; D- o L-2 tienoilalanina; D- o L-1, -2, 3-, o 4- pirenoilalanina; D- o L-3 tienoilalanina; D- o L-(2-piridinil)-alanina; D- o L-(3-piridinil)-alanina; D- o L-(2-pirazinil)-alanina; D- o L-(4-isopropil)-fenilglicina; D-(trifluorometil)-fenilglicina; D-30 (trifluorometil)-fenilalanina; D-p-fluoro-fenilalanina; D- o L-p-bifenilfenilalanina; D- o L-p-metoxi-bifenilfenilalanina; D- o L-2-indol(alquil)alaninas; y, D- o L-alquilalaninas, donde el alquilo puede ser metilo, etilo, propilo, hexilo, butilo, pentilo, isopropilo, iso-butilo, sec-isotilo, iso-pentilo sustituidos o no sustituidos, o aminoácidos no ácidos. Los anillos aromáticos de un aminoácido no natural incluyen, p. ej., anillos aromáticos de tiazolilo, tiofenilo, pirazolilo, benzimidazolilo, naftilo, furanilo, pirrolilo, y piridilo. 35

Los miméticos de aminoácidos ácidos se pueden generar sustituyendo por, p. ej., aminoácidos no carboxilados mientras se mantenga una carga negativa; (fosfono)alanina; treonina sulfatada. Los grupos laterales carboxilados (p. ej., aspartilo o glutamilo) se pueden modificar también selectivamente mediante reacción con carbodiimidas (R'-N-C-N-R') tales como, p. ej., 1-ciclohexil-3(2-morfolinil-(4-etil)carbodiimida o 1-etil-3(4-azonio-4,4-40 dimetilpentil)carbodiimida. Aspartilo o glutamilo se pueden convertir también en residuos de asparraginilo y glutaminilo mediante reacción con iones amonio. Los miméticos de aminoácidos alcalinos se pueden generar mediante sustitución con, p. ej., (además de lisina y arginina) los aminoácidos ornitina, citrulina, o ácido (guanidino)-acético, o ácido (guanidino)alquil-acético, donde alquilo se ha definido anteriormente. Los derivados de nitrilo (p. ej., que contienen el radical CN en lugar de COOH) se pueden sustituir por asparragina o glutamina. Los residuos de 45 asparraginilo y glutaminilo pueden se pueden desaminar a los residuos de aspartilo o glutamilo correspondientes. Se pueden generar miméticos de residuos de arginina haciendo reaccionar arginilo, p. ej., con uno o más reactivos convencionales, incluyendo, p. ej., fenilglioxal, 2,3-butanodiona, 1,2-ciclo-hexanodiona, o ninhidrina, preferiblemente en condiciones alcalinas. Los miméticos de residuos de tirosina se pueden generar haciendo reaccionar tirosilo, p. ej., con compuestos de diazonio aromáticos o tetranitrometano. Se pueden utilizar N-acetilimidizol y tetranitrometano 50 para formar especies de O-acetiltirosilo y 3-nitroderivados, respectivamente. Los miméticos de residuos de cisteína se pueden generar haciendo reaccionar residuos de cisteinilo, p. ej., con alfa-haloacetates tales como ácido 2-cloroacético o cloroacetamida y las aminas correspondientes; para producir derivados de carboximetilo o carboxamidometilo. Los residuos de miméticos de cisteína se pueden generar también haciendo reaccionar residuos de cisteinilo, p. ej., con bromo-trifluoroacetona, ácido alfa-bromo-beta-(5-imidazoil)propiónico; fosfato de cloroacetilo, 55 N-alquilmaleimidas, disulfuro de 3-nitro-2-piridilo; disulfuro de metil-2-piridilo; p-cloromercuribenzoato; 2-cloromercuri- nitrofenol; o, cloro-7-nitrobenzo-oxa-1,3-diazol. Los miméticos de lisina se pueden generar (y los residuos amino terminales pueden ser alterados) haciendo reaccionar lisinilo, p. ej., con anhídrido de ácido succínico u otros anhídridos de ácidos carboxílicos. La lisina y otros miméticos de residuos que contienen alfa-amino se pueden generar también mediante reacción con imidoésteres, tales como picolinimidato de metilo, fosfato de piridoxal, 60 piridoxal, cloroborohidruro, ácido trinitro-bencenosulfónico, O-metilisourea, 2,4-pentanodiona, y reacciones catalizadas por transamidasa con glioxilato. Los miméticos de metionina se pueden generar mediante reacción, p. ej., con metioninsulfóxido. Los miméticos de prolina incluyen, p. ej., ácido pipecólico, ácido tiazolidinocarboxílico, 3- o 4-hidroxiprolina, deshidroprolina, 3- o 4-metilprolina, o 3,3-dimetilprolina. Los miméticos de residuos de histidina se

pueden generar haciendo reaccionar histidilo, p. ej., con dietilprocarbonato o bromuro de para-bromofenacilo. Otros miméticos incluyen, p. ej., los generado mediante hidroxilación de prolina y lisina; fosforilación de los grupos hidroxilo de residuos de serilo o treonilo; metilación de los grupos alfa-amino de lisina, arginina y histidina; acetilación de la amina N-terminal; metilación de residuos amida de la cadena principal o sustitución con N-metil aminoácidos; o amidación de grupos carboxilo C-terminal. 5

Un residuo, p. ej., u aminoácido, de un polipéptido de la invención se puede remplazar también por un aminoácido (o residuo de peptidomimético) de quiralidad opuesta. De este modo, cualquier aminoácido de origen natural en configuración L (que puede ser referida también como R o S, dependiendo de la estructura de la entidad química) se puede remplazar por el aminoácido del mismo tipo estructural químico o un peptidomimético, pero de quiralidad 10 opuesta, referido como D-aminoácido, pero también se puede referir como forma R o S.

La invención también proporciona métodos para modificar los polipéptidos de la invención mediante procedimientos naturales, tales como procesamiento post-traduccional (p. ej., fosforilación, acilación, etc), o mediante técnicas de modificación químicas, y los polipéptido modificados resultantes. Las modificaciones se pueden producir en 15 cualquier parte en el polipéptido, incluyendo el esqueleto peptídico, las cadenas laterales de aminoácidos y los extremos amino o carboxilo. Se apreciará que el mismo tipo de modificación puede estar presente en el mismo o en grados variables en diversos sitios en un polipéptido dado. Asimismo un polipéptido dado puede tener muchos tipos de modificaciones. Las modificaciones incluyen acetilación, acilación, ribosilación del ADP, amidación, unión covalente de flavina, unión covalente de un radical hemo, unión covalente de un nucleótido o derivado de nucleótido, 20 unión covalente de un lípido o derivado de lípido, unión covalente de un fosfatidilinositol, ciclación de entrecruzamiento, formación de enlaces disulfuro, desmetilación, formación de entrecruzamientos covalentes, formación de cisteína, formación de piroglutamato, formilación, gamma-carboxilación, glicosilación, formación de ancla de GPI, hidroxilación, yodación, metilación, miristoliación, oxidación, pegilación, procesamiento proteolítico, fosforilación, prenilación, racemización, selenoilación, sulfación, y adición de aminoácidos mediada por RNA de 25 transferencia a proteínas tal como arginilación. Véase, p. ej., Creighton, T.E., Proteins - Structure and Molecular Properties 2a Ed., W.H. Freeman y Company, New York (1993); Posttraductional Covalent Modification of Proteins, B.C. Johnson, Ed., Academic Press, New York, págs. 1-12 (1983).

Tales métodos de síntesis química de péptidos en fase sólida se pueden utilizar también para sintetizar el 30 polipéptido o fragmentos de la invención. Tal método se conoce en la técnica desde principios de la década de 1960 (Merrifield, R. B., J. Am. Chem. Soc., 85:2149-2154, 1963) (Véase también Stewart, J. M. y Young, J. D., Solid Phase Peptide Synthesis, 2a Ed., Pierce Chemical Co., Rockford, Ill., págs. 11-12)) y se han empleado recientemente en diseños de péptidos en laboratorio asequibles comercialmente y kits de síntesis (Cambridge Research Biochemicals). Tales kits de laboratorio asequibles comercialmente han utilizado generalmente las 35 enseñanzas de H. M. Geysen et al, Proc. Natl. Acad. Sci., USA, 81:3998 (1984) y proporcionan la síntesis de péptidos sobre las puntas de una multitud de "varillas" o "clavijas" todas las cuales se conectan a una sola placa. Cuando se utiliza tal sistema, una placa de varillas o clavijas se invierte y se inserta en una segunda placa de pocillos o reservorios correspondientes, que contienen soluciones para la unión o el anclaje de un aminoácido apropiado a las puntas de las clavijas o varillas. Repitiendo tal etapa procedimiental, es decir, invirtiendo e 40 insertando las puntas de las varillas y clavijas en las soluciones apropiadas, los aminoácidos se arman para dar los péptidos deseados. Además, están disponibles varios sistemas de síntesis peptídica FMOC asequible. Por ejemplo, el ensamblaje de un polipéptido o fragmento se puede llevar a cabo sobre un soporte sólido utilizando un sintetizador peptídico automático Applied Biosystems, Inc. Modelo 431ATM. Tal equipo proporciona acceso fácil a los péptidos de la invención, mediante síntesis directa o mediante síntesis de una serie de fragmentos que se pueden 45 acoplar utilizando otras técnicas conocidas.

La invención incluye xilanasas de la invención con y sin señal. El polipéptido que comprende una secuencia señal de la invención puede ser una xilanasa de la invención u otra xilanasa u otra enzima u otro polipéptido.

La invención incluye xilanasas inmovilizadas, anticuerpos anti-xilanasa y fragmentos de los mismos. La invención proporciona métodos para inhibir la actividad xilanasa, p. ej., utilizando mutantes negativos dominantes o anticuerpos anti-xilanasa de la invención. La invención incluye heterocomplejos, p. ej., proteínas de fusión, heterodímeros, etc., comprenden las xilanasas de la invención.

Los polipéptidos de la invención pueden tener actividad xilanasa en diversas condiciones, p. ej., extremas en pH y/o temperatura, agentes oxidantes, y similares. La invención proporciona métodos que conducen a preparaciones de xilanasa alternativas con diferentes eficacias y estabilidades catalíticas, p. ej., frente a temperatura, agentes oxidantes y condiciones de lavado variables. En un aspecto, las variantes de xilanasa se pueden producir utilizando técnicas de mutagénesis dirigida al sitio y/o mutagénesis al azar. En un aspecto, se puede utilizar la evolución 60 dirigida para producir una gran variedad de variantes de xilanasa con especificidades y estabilidad alternativa.

Las proteínas de la invención también son útiles como reactivos de investigación para identificar moduladores de xilanasa, p. ej., activadores o inhibidores de la actividad xilanasa. En resumen, se añaden muestras de ensayo

(compuestos, caldos, extractos, y similares) a análisis de xilanasa para determinar su capacidad para inhibir la escisión del sustrato. Los inhibidores identificados de este modo se pueden utilizar en industria e investigación para reducir o evitar la proteolisis no deseada. Como con las xilanasas, los inhibidores se pueden combinar para incrementar el espectro de actividad.

Las enzimas de la invención también son útiles como reactivos de investigación para digerir proteínas o para secuenciar proteínas. Por ejemplo, las xilanasas se pueden utilizar para romper polipéptidos en fragmentos más pequeños para su uso en secuenciación, p. ej. un secuenciador automático.

La invención también proporciona métodos para descubrir nuevas xilanasas utilizando los ácidos nucleicos, 10 polipéptidos y anticuerpos de la invención. En un aspecto, se escrutas bibliotecas de fegémidos para el descubrimiento de xilanasas basado en su expresión. En otro aspecto, se escrutas bibliotecas de fagos lambda para el descubrimiento de xilanasas basado en su expresión. El escrutinio de las bibliotecas de fagos o fegémidos puede permitir la detección de clones tóxicos; el acceso mejorado al sustrato; la reducción de la necesidad de construir un anfitrión, evitando el potencial de cualquier tendencia resultante de la escisión masiva de la biblioteca; y, un 15 crecimiento más rápido a bajas densidades de clones. El escrutinio de bibliotecas de fagos o fegémidos puede ser en fase líquida o en fase sólida. En un aspecto, la invención proporciona el escrutinio en fase líquida. Esto proporciona una mayor flexibilidad en condiciones de análisis; flexibilidad de sustrato adicional; mayor sensibilidad para clones débiles; y facilidad de automatización a lo largo del escrutinio en fase sólida.

La invención proporciona métodos de escrutinio que utilizan las proteínas y ácidos nucleicos de la invención y automatización robótica para posibilitar la ejecución de muchos miles de reacciones biocatalíticas y análisis de escrutinio en un corto período de tiempo, p. ej., por día, así como la garantía de un alto nivel de exactitud y reproducibilidad (véase la discusión de matrices, más abajo). Como resultado, se puede producir una biblioteca de compuestos derivados en cuestión de semanas. Para enseñanzas adicionales sobre modificación de moléculas, 25 incluyendo moléculas pequeñas, véase PCT/US94/09174.

Los polipéptidos pueden ser codificadas por secuencias de ácidos nucleicos del Grupo A y secuencias esencialmente idénticas a éstas, o fragmentos que comprenden al menos alrededor de 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 bases consecutivas de los mismos. Como se ha comentado anteriormente, tales polímeros se 30 pueden obtener insertando un ácido nucleico que codifica el polipéptido en un vector de manera que la secuencia codificante esté conectada operablemente a una secuencia capaz de dirigir la expresión del polipéptido codificado en una célula anfitriona adecuada. Por ejemplo, el vector de expresión puede comprender un promotor, un sitio de unión al ribosoma para el inicio de la traducción y un terminador de la transcripción. El vector puede incluir también secuencias apropiadas para amplificar la expresión. 35

Los polipéptidos o fragmentos de los mismos incluyen aquellos que tienen una homología de al menos alrededor de 50%, al menos alrededor de 55%, al menos alrededor de 60%, al menos alrededor de 65%, al menos alrededor de 70%, al menos alrededor de 75%, al menos alrededor de 80%, al menos alrededor de 85%, al menos alrededor de 90%, al menos alrededor de 95%, o más de alrededor de 95% con uno de los polipéptidos de las secuencias de 40 aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, o un fragmento que comprende al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de los mismos. La homología se puede determinar utilizando cualquiera de los programas descritos anteriormente que alinea los polipéptidos o fragmentos que se están comparando y determina el grado de identidad o similitud de aminoácidos entre ellos. Se apreciará que la "homología" aminoácido incluye sustituciones de aminoácidos conservativas tales como las descritas 45 anteriormente.

Los polipéptidos o fragmentos que tienen homología con uno de los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, o un fragmento que comprende al menos alrededor de 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de los mismos se pueden obtener mediante 50 aislamiento de los ácidos nucleicos que los codifican utilizando las técnicas descritas anteriormente.

Alternativamente, los polipéptidos o fragmentos homólogos se pueden obtener a través de procedimientos bioquímicos de enriquecimiento o purificación. La secuencia de polipéptidos o fragmentos potencialmente homólogos se puede determinar mediante digestión con xilano hidrolasa, electroforesis en gel y/o 55 microsecuenciación. La secuencia de polipéptido o fragmento homólogos probable se puede comparar con uno de los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, o un fragmento que comprende al menos alrededor de 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de los mismos utilizando cualquiera de los programas descritos anteriormente.

Otro aspecto de la invención es un análisis para identificar fragmentos o variantes de las secuencias de aminoácidos de la invención y secuencias esencialmente idénticas a éstas, que conservan la función enzimática. Por ejemplo los fragmentos o variantes de dichos polipéptidos, se pueden utilizar para catalizar reacciones bioquímicas, que indican

que el fragmento o variante conserva la actividad enzimática de los polipéptidos en las secuencias de aminoácidos del Grupo B.

El análisis para determinar si los fragmentos de variantes conservan la actividad enzimática de los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas incluye las etapas de: 5 poner en contacto el fragmento de polipéptido o variante con una molécula sustrato en condiciones que permitan al fragmento de polipéptido o variante funcionar y detectar cualquier descenso en el nivel de sustrato o un incremento en el nivel del producto de reacción específico de la reacción entre el polipéptido y sustrato.

Los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas o 10 fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de los mismos se pueden utilizar en una variedad de aplicaciones. Por ejemplo, los polipéptidos o fragmentos de los mismos se pueden utilizar para catalizar reacciones bioquímicas. De acuerdo con un aspecto de la invención, se proporciona un procedimiento para la utilización de los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas o polinucleótidos que codifican tales polipéptidos para hidrolizar los 15 enlaces glicosídicos. En tales procedimientos, una sustancia que contiene un enlace glicosídico (p. ej., un almidón) se pone en contacto con uno de los polipéptidos de las secuencias de aminoácidos del Grupo B, o secuencias esencialmente idénticas a éstas en condiciones que faciliten la hidrólisis del enlace glicosídico.

La presente invención explota las propiedades catalíticas únicas de las enzimas. Mientras que el uso de 20 biocatalizadores (es decir, enzimas purificadas o brutas, células no vivas o vivas) en transformaciones químicas requiere normalmente la identificación de un biocatalizador concreto que reacciona con un compuesto de partida específico, la presente invención utiliza biocatalizadores seleccionados y condiciones de reacción que son específicas para grupos funcionales que están presentes en muchos compuestos de partida, tale como moléculas pequeñas. Cada biocatalizador es específico para un grupo funcional, o varios grupos funcionales relacionados y 25 puede reaccionar con muchos compuestos de partida que contienen este grupo funcional.

Las reacciones biocatalíticas producen una población de derivados a partir de un solo compuesto de partida. Estos derivados se pueden someter a otra ronda de reacciones biocatalíticas para producir una segunda población de compuestos derivados. Se pueden producir miles de variaciones de la molécula pequeña o compuestos originales 30 con cada iteración de la derivatización biocatalítica.

Las enzimas reaccionan en sitios específicos de un compuesto de partida sin afectar al resto de la molécula, un procedimiento que es muy difícil de lograr utilizando métodos químicos tradicionales. Este alto grado de especificidad biocatalítica proporciona los medios para identificar un solo compuesto activo dentro de la biblioteca. 35 La biblioteca está caracterizada por la serie de reacciones biocatalíticas para producirla, una denominada "historia biosintética". El escrutinio de la biblioteca para determinar las actividades biológicas y el trazado de la historia biosintética identifica la secuencia de reacción específica que produce el compuesto activo. La secuencia de reacción se repite y se determina la estructura del compuesto sintetizado. Este modo de identificación, a diferencia de otros enfoques de síntesis y escrutinio, no requiere tecnologías de inmovilización y los compuestos se pueden 40 sintetizar y someter a ensayo libres en solución utilizando virtualmente cualquier tipo de análisis de escrutinio. Resulta importante observar, que el alto grado de especificidad de las reacciones enzimáticas sobre grupos funcionales permite el "seguimiento" de reacciones enzimáticas específicas que constituyen la biblioteca producida biocatalíticamente.

Muchas de las etapas procedimentales se realizan utilizando automatización robótica que posibilita la ejecución de muchos miles de reacciones biocatalíticas y análisis de escrutinio por día así como la garantía de un alto nivel de exactitud y reproducibilidad. Como resultado, se puede producir una biblioteca de compuestos derivados en cuestión de semanas que podría tardar años en producirse utilizando los métodos químicos actuales.

En un aspecto concreto, la invención proporciona un método para modificar moléculas pequeñas, que comprende poner en contacto un polipéptido codificado por un polinucleótido descrito en la presente memoria o fragmentos enzimáticamente activos del mismo con una molécula pequeña para producir una molécula pequeña modificada. Se somete a ensayo una biblioteca de moléculas pequeñas modificadas para determinar si una molécula pequeña modificada está presente en la biblioteca que exhibe una actividad deseada. Se identifica una reacción biocatalítica 55 específica que produces la molécula pequeña modificada de actividad deseada eliminando sistemáticamente cada una de las reacciones biocatalíticas utilizadas para producir una porción de la biblioteca y después sometiendo a ensayo las moléculas pequeñas producidas en la porción de la biblioteca para determinar la presencia o ausencia de la molécula pequeña modificada con la actividad deseada. Las reacciones biocatalíticas específicas producen la molécula pequeña modificada de actividad deseada se repite opcionalmente. Las reacciones biocatalíticas se llevan 60 a cabo con un grupo de biocatalizadores que reaccionan con radicales estructurales distintos encontrados en la estructura de una molécula pequeña, cada biocatalizador es específico para un radical estructural o un grupo de radicales estructurales relacionados; y cada biocatalizador reacciona con muchas moléculas pequeñas diferentes que contienen el radical estructural distinto.

Secuencias señal de Xilanasa, dominios prepro y catalíticos

Las secuencias señal (p. ej., péptidos señal (SP)), dominios prepro y dominios catalíticos (CD) pueden ser péptidos aislados o recombinantes o puede ser parte de una proteína de fusión, p. ej., en forma de un dominio heterólogo en una proteína quimérica. Los ácidos nucleicos codifican estos dominios catalíticos (CD), dominios prepro y 5 secuencias señal (SP, p. ej., un péptido que tiene una secuencia que comprende/consiste en residuos amino terminales de un polipéptido de la invención). Una secuencia señal comprende un péptido que comprende/consiste en una secuencia como la mostrada en los residuos 1 a 15, 1 a 16, 1 a 17, 1 a 18, 1 a 19, 1 a 20, 1 a 21, 1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a 26, 1 a 27, 1 a 28, 1 a 28, 1 a 30, 1 a 31, 1 a 32, 1 a 33, 1 a 34, 1 a 35, 1 a 36, 1 a 37, 1 a 38, 1 a 39, 1 a 40, 1 a 41, 1 a 42, 1 a 43, 1 a 44 de un polipéptido de la invención. 10

Una secuencia señal comprende un péptido que comprende/consiste en una secuencia como la mostrada en la Tabla 4 de más abajo. Por ejemplo, al leer la Tabla 4, una secuencia señal comprende/consiste en los residuos 1 a 23 del SEQ ID NO: 102 (codificado por el SEQ ID NO: 101), una secuencia señal comprende/consiste en los residuos 1 a 41 del SEQ ID NO: 104 (codificado por el SEQ ID NO: 103), etc. 15

Tabla 4: secuencias señal ilustrativas

SEQ ID NO:: Secuencia señal (posiciones de aminoácido)

101, 102: 1-23

103, 104: 1-41

105, 106: 1-22

109, 110: 1-26

11, 12: 1-28

113, 114: 1-28

119, 120: 1-33

121, 122: 1-20

123, 124: 1-20

131, 132: 1-26

135, 136: 1-25

139, 140: 1-24

141, 142: 1-25

143, 144: 1-32

147, 148: 1-28

149, 150: 1-18

15, 16: 1-20

151, 152: 1-21

153, 154: 1-16

155, 156: 1-21

157, 158: 1-29

159, 160: 1-23

161, 162: 1-32

163, 164: 1-26

165, 166: 1-23

167, 168: 1-36

169, 170: 1-24

17,18: 1-31

SEQ ID NO:: Secuencia señal (posiciones de aminoácido)

171,172: 1-29

173, 174: 1-22

175,176: 1-27

177,178: 1-26

179,180: 1-19

181,182: 1-25

183, 184: 1-32

185, 186: 1-27

187, 188: 1-28

19,20: 1-29

191, 192: 1-27

193, 194: 1-21

195, 196: 1-23

197, 198: 1-28

199,200: 1-30

203,204: 1-30

205,206: 1-29

207,208: 1-27

209,210: 1-25

21,22: 1-28

211,212: 1-29

215,216: 1-31

217,218: 1-29

219,220: 1-23

221,222: 1-24

223,224: 1-28

225, 226: 1-25

227, 228: 1-39

229,230: 1-28

23,24: 1-29

231,232: 1-41

233,234: 1-26

235,236: 1-28

237,238: 1-32

239, 240: 1-30

241,242: 1-28

243,244: 1-33

245,246: 1-32

249,250: 1-33

SEQ ID NO:: Secuencia señal (posiciones de aminoácido)

253,254: 1-24

255,256: 1-51

259,260: 1-24

261,262: 1-26

263,264: 1-29

267,268: 1-30

27, 28: 1-27

271,272: 1-22

273,274: 1-74

277,278: 1-19

279,280: 1-22

283,284: 1-28

287, 288: 1-23

289,290: 1-22

295,296: 1-26

299,300: 1-24

301,302: 1-28

303,304: 1-74

305,306: 1-32

309,310: 1-20

311,312: 1-33

313,314: 1-22

315,316: 1-28

319,320: 1-27

325,326: 1-27

327,328: 1-29

329,330: 1-35

33,34: 1-23

331,332: 1-28

333,334: 1-30

335,336: 1-50

339, 340: 1-23

341,342: 1-45

347,348: 1-20

349, 350: 1-20

351,352: 1-73

353,354: 1-18

355,356: 1-21

357,358: 1-25

SEQ ID NO:: Secuencia señal (posiciones de aminoácido)

359,360: 1-31

361,362: 1-26

365,366: 1-65

367,368: 1-23

369,370: 1-27

39,40: 1-24

41,42: 1-37

45,46: 1-25

47,48: 1-26

5,6: 1-47

51, 52: 1-30

53, 54: 1-37

55,56: 1-24

57,58: 1-22

59,60: 1-21

63,64: 1-20

65,66: 1-22

67,68: 1-28

69,70: 1-25

7, 8: 1-57

73,74: 1-21

75,76: 1-22

77,78: 1-27

79, 80: 1-36

83, 84: 1-30

87, 88: 1-29

89,90: 1-40

9, 10: 1-36

95,96: 1-24

99, 100: 1-33

Las secuencias señal de xilanasa (SP) y/o secuencias prepro de la invención pueden ser péptidos aislados, o, secuencias conectadas a otra xilanasa o polipéptido no xilanasa, p. ej., en forma de una proteína de fusión (quimérica). En un aspecto, la invención proporciona polipéptidos que comprenden secuencias señal de xilanasa de la invención. En un aspecto, los polipéptidos que comprenden secuencias señal de xilanasa SP y/o prepro de la 5 invención comprenden las secuencias heterólogas a una xilanasa de la invención (p. ej., una proteína de fusión que comprende SP y/o prepro de la invención y secuencias de otra xilanasa o una proteína no xilanasa). En un aspecto, la invención proporciona xilanasas de la invención con SP y/o secuencias prepro heterólogas, p. ej., secuencias con una secuencia señal levadura. Una xilanasa de la invención puede comprender una SP y/o prepro heteróloga en un vector, p. ej., un vector de la serie pPIC (Invitrogen, Carlsbad, CA). 10

En un aspecto, las secuencias SP y/o prepro de la invención se identifican después de la identificación de los polipéptidos de xilanasa novedosos. Las rutas por medio de las cuales las proteínas se clasifican y transportan a su localización celular apropiada son referidas con frecuencia como rutas de redireccionamiento de proteínas. Uno de

los elementos más importantes en todos estos sistemas de redireccionamiento es una secuencia de aminoácidos corta en el extremo amino de un polipéptido recién sintetizado denominado secuencia señal. Esta secuencia señal dirige una proteína a su localización apropiada en la célula y es eliminada durante el transporte o cuando la proteína alcanza su destino final. La mayoría de las proteínas lisosomales, de membrana, o secretadas tienen una secuencia señal amino terminal que las marca para la traslocación al lumen del retículo endoplásmico. Se han determinado 5 más de 100 secuencias señal para proteínas en este grupo. Las secuencias señal pueden variar en longitud de 13 a 36 residuos de aminoácidos. Los expertos en la técnica conocen diversos métodos de reconocimiento de secuencias señal. Por ejemplo, en un aspecto, se identifican péptidos señal de xilanasa novedosos por medio de un método referido como SignalP. SignalP utiliza una red neural combinada que reconoce ambos péptidos señal y sus sitios de escisión. (Nielsen, et al., "Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage 10 sites" Protein Engineering, vol. 10, núm. 1, págs. 1-6 (1997).

Se debe entender que en algunos aspectos las xilanasas de la invención pueden no tener secuencias o "dominios" SP y/o prepro. En un aspecto, la invención proporciona las xilanasas de la invención que carecen de todo o parte de un dominio SP y/o uno prepro. En un aspecto, la invención proporciona una secuencia de ácido nucleico que codifica 15 una secuencia señal (SP) y/o prepro de una xilanasa conectada operablemente a una secuencia de ácido nucleico de una xilanasa diferente u, opcionalmente, se puede desear una secuencia señal (SP) y/o dominio prepro de una proteína no xilanasa.

La invención también proporciona polipéptidos aislados o recombinantes que comprenden las secuencias señal 20 (SP), dominios prepro y/o dominios catalíticos (CD) de la invención y secuencias heterólogas. Las secuencias heterólogas son secuencias asociadas no naturalmente (p. ej., a una xilanasa) con una SP, dominio prepro y/o CD. La secuencia a la que están asociados no naturalmente la SP, el dominio prepro y/o el CD puede estar en el extremo amino terminal, el extremo carboxi terminal de la SP, el dominio prepro y/o el CD, y/o en ambos extremos de la SP y/o el CD. En un aspecto, la invención proporciona un polipéptido aislado o recombinante que comprende 25 (o consiste en) un polipéptido que comprende una secuencia señal (SP), un dominio prepro y/o un dominio catalítico (CD) de la invención con la condición de que no está asociado con cualquier secuencia a la que está asociado naturalmente (p. ej., una secuencia de xilanasa). De un modo similar en un aspecto, la invención proporciona ácidos nucleicos recombinantes o aislados que codifican estos polipéptidos. De este modo, en un aspecto, el ácido nucleico aislado o recombinante de la invención comprende una secuencia codificante para una secuencia señal (SP), 30 dominio prepro y/o dominio catalítico (CD) de la invención y una secuencia heteróloga (es decir, una secuencia asociada no naturalmente con la secuencia señal (SP), el dominio prepro y/o el dominio catalítico (CD) de la invención). La secuencia heteróloga puede estar en el extremo 3' terminal, el extremo 5'-terminal, y/o en ambos extremos de la secuencia codificante de SP, dominio prepro y/o CD.

Xilanasas híbridas (quiméricas) y bibliotecas de péptidos

En un aspecto, la invención proporciona xilanasas híbridas y proteínas de fusión, incluyendo bibliotecas de péptidos, que comprenden las secuencias de la invención. Las bibliotecas de péptidos de la invención se pueden utilizar para aislar moduladores peptídicos (p. ej., activadores o inhibidores) de dianas, tales como sustratos de xilanasa, 40 receptores, enzimas. Las bibliotecas de péptidos de la invención se pueden utilizar para identificar compañeros de unión formales de las dianas, tales como ligandos, p. ej., citoquinas, hormonas y similares. En un aspecto, la invención proporciona proteínas quiméricas que comprenden una secuencia señal (SP), un dominio prepro y/o un dominio catalítico (CD) de la invención o una de sus combinaciones y una secuencia heteróloga (véase más arriba).

En un aspecto, las proteínas de fusión de la invención (p. ej., el radical peptídico) son estabilizadas conformacionalmente (con respecto a los péptidos lineales) para permitir una mayor afinidad de unión a las dianas. La invención proporciona fusiones de xilanasas de la invención y otros péptidos, incluyendo péptidos conocidos y al azar. Se pueden fusionar de tal manera que la estructura de las xilanasas no resulta perturbada significativamente y el péptido es estabilizado conformacionalmente metabólicamente o estructuralmente. Esto permite la creación de 50 una biblioteca de péptidos cuya presencia en el interior de las células y cantidad es verificada fácilmente.

Las variantes de la secuencia de aminoácidos de la invención se pueden caracterizar por medio de una naturaleza predeterminada de la variación, una característica que las aparta de una forma de origen natural, p. ej., una variación alélica o interespecie de una secuencia de xilanasa. En un aspecto, las variantes de la invención exhiben 55 la misma actividad biológica cualitativa que el análogo de origen natural. Alternativamente, las variantes se pueden seleccionar por tener características modificadas. En un aspecto, mientras que el sitio o región para introducir una variación de la secuencia de aminoácidos está predeterminado, la mutación per se no necesita estar predeterminada. Por ejemplo, con el fin de optimizar en funcionamiento de una mutación en un sitio dado, se puede llevar a cabo la mutagénesis al azar en el codón o región diana y escrutar las variantes de xilanasa expresadas para 60 determinar la combinación óptima de actividad deseada. Las técnicas para elaborar las mutaciones de sustitución en sitios predeterminados en el ADN que tiene una secuencia conocida son bien conocidas, como se comenta en la presente memoria por ejemplo, mutagénesis con cebador M13 y mutagénesis por PCR. Se puede realizar el escrutinio de los mutantes utilizando, p. ej., análisis de hidrólisis de xilano. En aspectos alternativos, las

substituciones de aminoácido pueden ser residuos individuales; las inserciones pueden estar en el orden de alrededor de 1 a 20 aminoácidos, aunque se pueden realizar inserciones considerablemente mayores. Las deleciones pueden oscilar de alrededor de 1 a alrededor de 20, 30, 40, 50, 60, 70 residuos o más. Para obtener un derivado final con las propiedades óptimas, se pueden utilizar sustituciones, deleciones, inserciones o cualquier combinación de las mismas. Generalmente, estos cambios se realizan en unos pocos aminoácidos para minimizar la 5 alteración de la molécula. Sin embargo, se pueden tolerar cambios mayores en ciertas circunstancias.

La invención proporciona xilanasas en las que l estructura del esqueleto polipeptídico, la estructura secundaria y terciaria, p. ej., una estructura en hélice alfa o lámina beta, se ha modificado. En un aspecto, se han modificado la carga o el carácter hidrófobo. En un aspecto, se ha modificado el volumen de una cadena lateral. Se realizan 10 cambios sustanciales en la función o la identidad inmunológica seleccionando sustituciones que son menos conservativas. Por ejemplo, se pueden realizar sustituciones que afectan más significativamente a: la estructura de la cadena polipeptídica en la zona de alteración, por ejemplo una estructura en hélice alfa o lámina beta; una carga o sitio hidrófobo de la molécula, que puede ser un sitio activo; o una cadena lateral. La invención proporciona sustituciones en polipéptidos de la invención donde (a) un residuo hidrófilo, p. ej. serilo o treonilo, es sustituido por (o 15 mediante) un residuo hidrófobo, p. ej. leucilo, isoleucilo, fenilalanilo, valilo o alanilo; (b) una cisteína o prolina es sustituida por (o mediante) cualquier otro residuo; (c) un residuo que tiene una cadena lateral electropositiva, p. ej. lisilo, arginilo, o histidilo, es sustituido por (o mediante) un residuo electronegativo, p. ej. glutamilo o aspartilo; o (d) un residuo que tiene una cadena lateral voluminosa, p. ej. fenilalanina, es sustituido por (o mediante) uno que no tenga una cadena lateral, p. ej. glicina. Las variantes pueden mostrar la misma actividad biológica cualitativa (es 20 decir actividad xilanasa) aunque se pueden seleccionar variantes para modificar las características de las xilanasas según se necesite.

En un aspecto, las xilanasas de la invención comprenden epítopos o etiquetas de purificación, secuencias señal u otras secuencias de fusión, etc. En un aspecto, las xilanasas de la invención se pueden fusionar a péptido aleatorio 25 para formar un polipéptido de fusión. Mediante "fusionado" o "conectado operablemente" en la presente memoria se quiere significar que el péptido aleatorio y la xilanasa se conectan entre sí, de tal manera que se minimiza la alteración de la estabilidad de la estructura de la xilanasa, p. ej., conserva la actividad xilanasa. El polipéptido de fusión (o polinucleótido de fusión que codifica el polipéptido de fusión) puede comprender también componentes adicionales, incluyendo múltiples péptidos en múltiples bucles. 30

En un aspecto, los péptidos y ácidos nucleicos que los codifican se aleatorizan, o bien se aleatorizan completamente o su aleatorización es parcial, p. ej. en la frecuencia del nucleótido/residuo generalmente o por posición. "Aleatorizado" significa que cada ácido nucleico y péptido consiste esencialmente en nucleótidos y aminoácidos al azar, respectivamente. En un aspecto, los ácidos nucleicos que dan lugar a los péptidos se pueden sintetizar 35 químicamente, y de este modo pueden incorporar cualquier nucleótido en cualquier posición. De este modo, cuando los ácidos nucleicos se expresar para formar péptidos, se puede incorporar cualquier residuo de aminoácido a cualquier posición. El procedimiento sintético se puede diseñar para generar ácidos nucleicos aleatorizados, para permitir la formación de todas o la mayoría de las combinaciones posibles a lo largo de la longitud del ácido nucleico, formando de este modo una biblioteca de ácidos nucleicos aleatorizados. La biblioteca puede proporcionar una 40 población suficientemente diversa estructuralmente productos de expresión aleatorizados que afecte a un intervalo suficiente probabilísticamente de respuestas celulares para proporcionar una o más células que exhiben una respuesta deseada. De este modo, la invención proporciona una biblioteca interacción suficientemente larga de manera que al menos uno de sus miembros tenga una estructura que proporcione su afinidad por cierta molécula, proteína, u otro factor. 45

Las xilanasas son enzimas multidominio que consisten opcionalmente en un péptido señal, un módulo de unión a carbohidrato, un dominio catalítico de xilanasa, un conector y/u otro dominio catalítico.

La invención proporciona un medio para generar polipéptidos quiméricos que pueden codificar polipéptidos híbridos 50 biológicamente activos (p. ej., xilanasas híbridas). En un aspecto, los polinucleótidos originales codifican polipéptidos biológicamente activos. El método de la invención produce nuevos polipéptidos híbridos utilizando procedimientos celulares que integran la secuencia de los polinucleótidos originales de manera que el polinucleótido híbrido resultante codifica un polipéptido que demuestra actividades derivadas de los polipéptidos biológicamente activos originales. Por ejemplo, los polinucleótidos originales pueden codificar una enzima concreta a partir de diferentes 55 microorganismos. Una enzima codificada por un primer polinucleótido de un organismo o variante puede, por ejemplo, funcionar eficazmente en condiciones ambientales concretas, p. ej. alta salinidad. Una enzima codificada por un segundo polinucleótido de un organismo diferente o variante puede funcionar eficazmente en condiciones ambientales diferentes, tales como temperaturas extremadamente altas. Un polinucleótido híbrido que contienen secuencias del primer y segundo polinucleótidos originales pueden codifican una enzima que muestra las 60 características de ambas enzimas codificadas por los polinucleótidos originales. De este modo, la enzima codificada por el polinucleótido híbrido puede funcionar eficazmente en condiciones ambientales compartidas por cada una de las enzimas codificadas por el primer y segundo polinucleótidos, p. ej., alta salinidad y temperaturas extremas.

Los polinucleótidos de la invención codifican xilanasas. Las glicosidasa hidrolasas se clasificaron primeramente en familias en 1991, véase, p. ej., Henrissat (1991) Biochem. J. 280:309-316. Desde entonces, las clasificaciones se han actualizado continuamente, véanse, p. ej., Henrissat (1993) Biochem. J. 293:781-788; Henrissat (1996) Biochem. J. 316:695-696; Henrissat (2000) Plant Physiology 124:1515-1519. Existen 87 familias identificadas de glicosidasa hidrolasas. En un aspecto, las xilanasas de la invención se pueden may be clasificar en la familia 11. La 5 familia de clasificación 5, 6, 8, 10, 11, 26 o 30, se muestra en la Tabla 5, más abajo.

Tabla 5

SEQ ID: FAMILIA

9, 10

1, 2

5,6

7,8

99, 100

11,12

127, 128

27,28

97,98

45,46

141,142

107, 108

129, 130

93,94

63, 64

25,26

49,50

67,68

85,86

29,30

51,52

35,36

147,148

119, 120

123, 124

249, 250

149, 150

83,84

43,44

133, 134

113, 114

105, 106

75, 76

111,112

SEQ ID: FAMILIA

117, 118

115, 116

125, 126

137,138

135, 136

69, 70

89,90

31,32

13,14

65,66

57,58

77, 78

73, 74

109,110

59,60

71,72

139, 140

55, 56

15, 16

131, 132

95,96

101,102

39,40

143, 144

103, 104

17, 18

53, 54

21,22

151,152

23, 24

121, 122

41, 42

47,48

247,248

33,34

19,20

87,88

81, 82

91,92

SEQ ID: FAMILIA

61,62

37,38

79,80

231,232

157,158

189, 190

167, 168

207,208

251,252

213,214

177, 178

187,188

205, 206

211,212

197,198

209,210

185, 186

229, 230

223, 224

179,180

193, 194

173, 174

217,218

153,154

219,220

183, 184

253, 254

199,200

255, 256

155, 156

169,170

195,196

215,216

191,192

175,176

161, 162

221, 222

225,226

163, 164

SEQ ID: FAMILIA

159, 160

233, 234

171,172

203, 204

181, 182

227,228

165, 166

257, 258

237, 238

241,242

239,240

245, 246

235, 236

313,314

345,346

321, 322

323, 324

315,316

201,202

265, 266

145,146

287,288

293, 294

351, 352

311,312

279, 280

289, 290

283, 284

373,374

337,338

371,372

291,292

3,4

307,308

343,344

349, 350

329,330

355, 356

339, 340

SEQ ID: FAMILIA

295, 296

333, 334

281, 282

361,362

347,348

319,320

357,358

365,366

273,274

277,278

271,272

285, 286

259, 260

325, 326

331,332

359, 360

303, 304

363, 364

305,306

341,342

375, 376

377, 378

379,380

301,302

309,310

263, 264

269,270

353,354

299, 300

367, 368

261,262

369,370

267,268

317,318

297, 298

327,328

275,276

Un polipéptido híbrido resultante del método de la invención puede exhibir actividad enzimática especializada no desplegada por las enzimas originales. Por ejemplo, después de la recombinación y/o el reordenamiento reductivo de los polinucleótidos que codifican las actividades hidrolasa, el polipéptido híbrido resultante codificado por un

polinucleótido híbrido se puede escrutar para determinar las actividades hidrolasa especializadas obtenidas de cada una de las enzimas originales, es decir el tipo de enlace sobre el que actúa la hidrolasa y la temperatura a la que funciona la hidrolasa. De este modo, por ejemplo, la hidrolasa se puede escrutar para averiguar las funcionalidades químicas que distinguen la hidrolasa híbrida de las hidrolasas originales, tales como: (a) amida (enlaces peptídicos), es decir, xilanasas; (b) enlaces éster, es decir, esterasas y lipasas; (c) acetales, es decir, glicosidasas y, por ejemplo, 5 la temperatura, pH o concentración de sal a la cual funciona el polipéptido híbrido.

Las fuentes de los polinucleótidos originales se puede aislar de organismos individuales ("organismos aislados"), colecciones de organismos que se han desarrollado en medios definidos ("cultivos de enriquecimiento"), u, organismos no cultivados ("muestras ambientales"). Es muy preferible el uso de un enfoque independiente del cultivo 10 para obtener polinucleótidos que codifican bioactividades novedosas de muestras ambientales puesto que permite el acceso a recursos no explotados de biodiversidad.

Las "bibliotecas ambientales" se generan a partir de muestras ambientales y representan los genomas colectivos de organismos de origen natural logrados al clonar vectores que han sido propagados en anfitriones procarióticos 15 adecuados. Debido a que el ADN clonado se extrae inicialmente directamente de muestras ambientales, las bibliotecas no están limitadas a la pequeña fracción de procariotas que se pueden desarrollar en cultivo puro. Adicionalmente, una normalización del ADN ambiental presente en estas muestras podría permitir una representación más equitativa del ADN de todas las especies presentes en la muestra original. Esto puede aumentar espectacularmente la eficacia del descubrimiento de genes interesantes a partir de constituyentes mínimos de la 20 muestra que pueden estar infrarrepresentados en varios órdenes de magnitud en comparación con las especies dominantes.

Por ejemplo, las genotecas generada a partir de uno o más microorganismos no cultivados se escrutan para determinar una actividad de interés. Las rutas potenciales que codifican moléculas bioactivas de interés se capturan 25 en primer lugar en células procarióticas en forma de bibliotecas de expresión de genes. Los polinucleótidos que codifican actividades de interés se aíslan a partir de tales bibliotecas y se introducen en una célula anfitriona. La células anfitriona se cultiva en condiciones que promueven la recombinación y/o el reordenamiento reductivo creando biomoléculas potencialmente activas con actividades novedosas o potenciadas.

Adicionalmente, la subclonación se puede realizar para aislar adicionalmente secuencias de interés. En la subclonación, una porción de ADN se amplifica, se digiere, generalmente mediante enzimas de restricción, para separar mediante corte la secuencia deseada, la secuencia deseada se liga en un vector receptor y se amplifica. En cada etapa de la subclonación, la porción se examina para determinar la actividad de interés, con el fin de asegurarse de que no se ha excluido el ADN que codifica la proteína estructural. El inserto se puede purificar en 35 cualquier etapa de la subclonación, por ejemplo, mediante electroforesis en gel antes de la ligación en un vector o donde células que contienen el vector receptor y células que no contienen el vector receptor se colocan en medios selectivos que contienen, por ejemplo, un antibiótico, que destruirá las células que no contienen el vector receptor. Los métodos específicos de subclonación de insertos de ADNc en vectores son bien conocidos en la técnica (Sambrook et al., Molecular Cloning: A Laboratory Manual, 2a Ed., Cold Spring Harbor Laboratory Press (1989)). En 40 otro aspecto, las enzimas de la invención son subclones. Tales subclones pueden diferir de los clones parentales, por ejemplo, en su longitud, una mutación, una etiqueta o una marca.

En un aspecto, las secuencias señal de la invención se identifican después de la identificación de los polipéptidos de xilanasa novedosos. Las rutas mediante las cuales las proteínas se clasifican y se transportan a su localización 45 celular apropiada son referidas con frecuencia como rutas de redireccionamiento de proteínas. Uno de los elementos más importantes en todos estos sistemas de redireccionamiento es una secuencia de aminoácidos corta en el extremo amino de un polipéptido recién sintetizado denominado secuencia señal. Esta secuencia señal dirige una proteína a su localización apropiada en la célula y es eliminada durante el transporte o cuando la proteína alcanza su destino final. La mayoría de las proteínas lisosomales, de membrana, o secretadas tienen una secuencia señal 50 amino terminal que las marca para la traslocación al lumen del retículo endoplásmico. Se han determinado más de 100 secuencias señal para proteínas en este grupo. Las secuencias señal pueden variar en longitud de 13 a 36 residuos de aminoácidos. Los expertos en la técnica conocen diversos métodos de reconocimiento de secuencias señal. En un aspecto, los péptidos se identifican por medio de un método referido como SignalP. SignalP utiliza una red neural combinada que reconoce ambos péptidos señal y sus sitios de escisión. Véase, p. ej. Nielsen (1997) 55 "Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites" Protein Engineering, vol. 10, núm. 1, págs. 1-6. Se debe entender que algunas de las xilanasas de la invención pueden contener o no secuencias señal. Puede ser deseable que incluyan una secuencia de ácido nucleico que codifica una secuencia señal de una xilanasa conectada operablemente a una secuencia de ácido nucleico de una xilanasa diferente u, opcionalmente, una secuencia señal de una proteína no xilanasa. 60

Los microorganismos a partir de los cuales se puede preparar el polinucleótido incluyen microorganismos procarióticos, tales como Eubacteria y Archaebacteria y microorganismos eucarióticos inferiores tales como hongos, ciertas algas y protozoos. Los polinucleótidos se pueden aislar a partir de muestras ambientales en cuyo caso el

ácido nucleico se puede recuperar sin cultivar de un organismo o recuperar de uno o más organismos cultivados. En un aspecto, tales microorganismos pueden ser extremófilos, tal como hipertermófilos, psicrófilos, psicrótrofos, halófilos, barófilos y acidófilos. Se pueden utilizar polinucleótidos que codifican enzimas aisladas de microorganismos extremófilos. Tales enzimas pueden funcionar a temperaturas por encima de alrededor de 100°C en fuentes de aguas termales terrestres y aberturas térmicas del fondo del mar, a temperaturas por debajo de 0°C 5 en aguas árticas, en el entorno salino saturado del Mar Muerto, a valores de pH de alrededor de 0 en depósitos de hulla y en fuentes geotérmicas ricas en azufre, o a valores de pH mayores de 11 en lodos de aguas residuales. Por ejemplo, diversas esterasas y lipasas clonadas y expresadas en organismos extremófilos muestran alta actividad a lo largo de un amplio intervalo de temperaturas y pH.

Los polinucleótidos seleccionados y aislados como se ha descrito antes se introducen en una célula anfitriona adecuada. Una célula anfitriona adecuada es cualquier célula que es capaz de promover la recombinación y/o el reordenamiento reductivo. Los polinucleótidos seleccionados están ya preferiblemente en un vector que incluye las secuencias de control apropiadas. La célula anfitriona puede ser una célula eucariótica superior, tal como una célula de mamífero, o una célula eucariótica inferior, tal como una célula de levadura, o preferiblemente, la célula anfitriona 15 puede ser una célula procariótica, tal como una célula bacteriana. La introducción del constructo en la célula anfitriona se puede efectuar mediante transfección con fosfato de calcio, transfección mediada por DEAE-Dextrano, o electroporación (Davis et al., 1986).

Como Ejemplos representativos de los anfitriones apropiados, se pueden mencionar: células bacterianas; tales como 20 E. coli, Streptomyces, Salmonella typhimurium; célula fúngicas, tales como levaduras; células de insecto tales como S2de Drosophilia y Sf9 de Spodoptera; células animales tales como CHO, COS o melanoma de Bowes; adenovirus; y células vegetales. Se considera que la selección de un anfitrión apropiado se encuentra al alcance de los expertos en la técnica a partir de las enseñanzas de la presente memoria.

Remitiéndose concretamente a diversos sistemas de cultivo de células de mamíferos que se pueden emplear para proteínas recombinantes, los ejemplos de los sistemas de expresión de mamíferos incluyen las líneas de fibroblastos de riñón de mono COS-7, descritas en "SV40-transformed simian cells support the replication of early SV40 mutants" (Gluzman, 1981) y otras líneas celulares capaces de expresar un vector compatible, por ejemplo, las líneas celulares C127, 3T3, CHO, HeLa y BHK. Los vectores de expresión de mamífero comprenderán un origen de replicación, un 30 promotor y un intensificador adecuados y también sitios de unión al ribosoma necesarios cualesquiera, un sitio de poliadenilación, un donador de empalme y sitios aceptores, secuencias de terminación de la transcripción y secuencias no transcritas flanqueantes 5'. Las secuencias de ADN derivadas de los sitios de poliadenilación y empalme de SV40 se pueden utilizar para proporcionar los elementos genéticos no transcritos requeridos.

En otro aspecto, se prevé que el método de la presente invención se puede utilizar para generar polinucleótidos novedosos que codifican rutas bioquímicas de uno o más operones o complejos génicos o porciones de los mismos. Por ejemplo, las bacterias y muchos eucariotas tienen un mecanismo coordinado para la regulación génica cuyos productos están implicados en procedimientos relacionados. Estos genes se agrupan, en estructuras referidas como "complejos génicos", en un solo cromosoma y se transcriben juntos bajo el control de una sola secuencia reguladora, 40 incluyendo un solo promotor que inicia la transcripción del complejo completo. De este modo, un complejo génico es un grupo de genes adyacentes que son idénticos o están relacionados, usualmente como su función. Un ejemplo de una ruta bioquímica codificada por complejos génicos son los policétidos.

El ADN del complejo génico se puede aislar de diferentes organismos y ligar en vectores, particularmente vectores 45 que contienen secuencias reguladoras de la expresión que pueden controlar y regular la producción de una proteína detectable o la actividad de la matriz relacionada con la proteína de los complejos génicos ligados. Los vectores que tienen una capacidad excepcionalmente grande para la introducción de ADN exógeno son particularmente apropiados para su uso con tales complejos génicos y se describen a modo de ejemplo en la presente memoria por incluir el factor f (o factor de fertilidad) de E. coli. Este factor f E. coli es un plásmido que afecta a su propia 50 transferencia de alta frecuencia durante la conjugación y es ideal para lograr y propagar establemente grandes fragmentos de ADN, tales como complejos génicos de muestras microbiana mixtas. Un aspecto de la invención es la utilización de vectores de clonación, referidos como "fósmidos" o vectores de cromosomas bacterianos artificiales (BAC). Estos están derivados del factor f de E. coli que es capaz de integrar establemente grandes segmentos de ADN genómico. Cuando se integran con ADN de una muestra ambiental no cultivada mixta, esto hace posible 55 alcanzar grandes fragmentos genómicos en forma de una " biblioteca de ADN ambiental" estable. Otro tipo de vector para su uso la presente invención es un vector cosmídico. Los vectores cosmídicos fueron diseñados originalmente para clonar y propagar grandes segmentos de ADN genómico. La clonación en vectores cosmídicos la describen con detalle Sambrook et al., en Molecular Cloning: A Laboratory Manual, 2a Ed., Cold Spring Harbor Laboratory Press (1989). Una vez ligados en un vector apropiado, se pueden introducir dos o más vectores que contienen 60 diferentes complejos génicos de policétido sintasa en una célula anfitriona adecuada. Las regiones de homología de secuencia parcial compartidas por los complejos génicos promoverán procedimientos tienen como consecuencia la reorganización de la secuencia dando como resultado un complejo génico híbrido. El complejo génico híbrido

novedoso se puede escrutar a continuación para determinar las actividades potenciadas no encontradas en los complejos génicos originales.

Un método para producir un polipéptido híbrido biológicamente activo y rastrear tal polipéptido para determinar la actividad potenciada puede ser: 5

1) introduciendo al menos un primer polinucleótido en una conexión operable y un segundo polinucleótido en una conexión operable, compartiendo el al menos primer polinucleótido y segundo polinucleótido al menos una región de homología de secuencia parcial, en una célula anfitriona adecuada;

2) cultivando la célula anfitriona en condiciones que promuevan la reorganización de secuencia dando como 10 resultado a polinucleótido híbrido en una conexión operable;

3) expresando un polipéptido híbrido codificado por el polinucleótido híbrido;

4) escrutando el polipéptido híbrido en condiciones que promuevan la identificación de la actividad biológica potenciada; y

5) aislando el polinucleótido que codifica el polipéptido híbrido. 15

Los métodos para escrutar diversas actividades enzimáticas son conocidos por los expertos en la técnica y se comentan a lo largo de la presente memoria. Tales métodos se pueden emplear cuando se aíslen los polipéptidos y polinucleótidos de la invención.

Metodologías de Escrutinio y Dispositivos de Verificación "En línea (On-line)"

Al poner en practica los métodos de la invención, se pueden utilizar una variedad de aparatos y metodologías junto con los polipéptidos y ácidos nucleicos de la invención, p. ej., para escrutar polipéptidos para determinar su actividad xilanasa (p. ej., análisis tales como hidrólisis de caseína en zimogramas, la liberación de fluorescencia a partir de la 25 gelatina, o la liberación p-nitroanalida a partir de diversos sustratos peptídicos pequeños), para escrutar compuestos como moduladores potenciales, p. ej., activadores o inhibidores, de una actividad xilanasa, para determinar los anticuerpos que se unen a un polipéptido de la invención, para determinar los ácidos nucleicos que hibridan con un ácido nucleico de la invención, para escrutar las células que expresan un polipéptido de la invención y similares. Además de los formatos de matriz descritos en detalle más abajo para escrutar muestras, también se puede utilizar 30 formatos alternativos para poner en práctica los métodos de la invención. Tales formatos incluyen, por ejemplo, espectrómetros de masas, cromatógrafos, p. ej., HPLC de alto rendimiento y otras formas de cromatografía líquida, y formatos más pequeños, tales como placas de 1536 pocillos, placas de 384 pocillos y etcétera. Los aparatos de escrutinio de alto rendimiento se pueden adaptar y utilizar para poner en práctica los métodos de la invención, véase, p. ej., la Solicitud de Patente de los Estados Unidos Núm. 20020001809. 35

Matrices Capilares

Los ácidos nucleicos o polipéptidos de la invención se pueden inmovilizar en o aplicar a una matriz. Las matrices se pueden utilizar para escrutar o verificar bibliotecas de composiciones (p. ej., moléculas pequeñas, anticuerpos, 40 ácidos nucleicos, etc.) para determinar su capacidad para unirse a o modular la actividad de un ácido nucleico o un polipéptido de la invención. Las matrices capilares, tales como GIGAMATRIX™, Diversa Corporation, San Diego, CA; y las matrices descritas, p. ej., en Solicitud de Patente de los Estados Unidos Núm. 20020080350 A1; el documento WO 0231203 A; el documento WO 0244336 A, proporcionan un aparato alternativo para albergas y escrutar muestras. En un aspecto, la matriz capilar incluye una pluralidad de capilares formados en una matriz de 45 capilares adyacentes, donde cada capilar comprende al menos una pared que define un lumen para retener una muestra. El lumen puede ser cilíndrico, cuadrado, hexagonal o de cualquier otra forma geométrica con tal que las paredes formen un lumen para la retención de un líquido o muestra. Los capilares de la matriz capilar se pueden mantener juntos en íntima proximidad para formar una estructura planar. Los capilares se pueden unir entre sí, fusionándolos (p. ej., cuando los capilares están hechos de vidrio), encolándolos, pegándolos, o fijándolos lado con 50 lado. Adicionalmente, la matriz capilar puede incluir material intersticial dispuesto entre capilares adyacentes en la matriz, formando de ese modo un dispositivo planar sólido que contiene una pluralidad de orificios.

Se puede formar una matriz capilar de cualquier número de capilares individuales, por ejemplo, un intervalo de 100 a 4.000.000 de capilares. Adicionalmente, se puede formar una matriz capilar que tenga alrededor de 100.000 55 capilares individuales o más en el tamaño y forma convencionales de una placa Microtiter® para su ajuste en equipos de laboratorio convencionales. Los lúmenes se cargan manualmente o automáticamente utilizando cualquier acción o microinyección capilar utilizando una aguja delgada. Las muestras de interés se pueden eliminar posteriormente de los capilares individuales para su análisis o caracterización adicionales. Por ejemplo, se coloca una sonda de tipo aguja, delgada en comunicación fluida con un capilar seleccionado para añadir o retirar material 60 del lumen.

En un análisis de escrutinio de un solo recipiente, los componentes del análisis se mezclan produciendo una solución de interés, antes de su inserción en la matriz capilar. El lumen se carga mediante acción capilar cuando al

menos una porción de la matriz se sumerge en una solución de interés. Las reacciones químicas o biológicas y/o la actividad en cada capilar son verificadas para determinar los eventos detectables. Un evento detectable es referido con frecuencia como un "éxito", que usualmente se puede distinguir de los "no éxitos" que producen los capilares mediante detección óptica. De este modo, las matrices capilar permiten masivamente la detección paralela de "éxitos". 5

En un análisis de escrutinio de múltiples recipientes, un polipéptido o ácido nucleico, p. ej., un ligando, se puede introducir en un primer componente, que es introducido en al menos una porción de un capilar de una matriz capilar. A continuación se puede introducir una burbuja de aire en el capilar detrás del primer componente. A continuación se puede introducir un segundo componente en el capilar, donde el segundo componente se separa del primer 10 componente mediante la burbuja de aire. El primer y segundo componentes se pueden mezclar a continuación aplicando presión hidrostática a ambos lados de la matriz capilar para destruir la burbuja. Después se controla la matriz capilar para determinar un evento detectable resultante de la reacción o no reacción de los dos componentes.

En un análisis de escrutinio de la unión, se puede introducir una muestra de interés en forma de un primer líquido 15 marcado con una partícula detectable en un capilar de una matriz capilar, donde el lumen del capilar es recubierto con un material de unión para unir la partícula detectable al lumen. El primer líquido se puede eliminar a continuación del tubo capilar, donde la partícula detectable unida se mantiene dentro del capilar, y se puede introducir un segundo líquido en el tubo capilar. El capilar se controla después para determinar un evento detectable resultante de la reacción o no reacción de la partícula con el segundo líquido. 20

Matrices, o "Biochips"

Los ácidos nucleicos o polipéptidos de la invención se pueden inmovilizar en o aplicar a una matriz. Las matrices se pueden utilizar para escrutar o controlar bibliotecas de composiciones (p. ej., moléculas pequeñas, anticuerpos, 25 ácidos nucleicos, etc.) para determinar su capacidad para unirse a o modular la actividad de un ácido nucleico o un polipéptido de la invención. Por ejemplo, en un aspecto de la invención, un parámetro controlado es la expresión de un transcrito de un gen de xilanasa. Uno o más, o, todos los transcritos de una célula se pueden medir mediante hibridación de una muestra que comprende transcritos de la célula, o, ácidos nucleicos representativos de o complementarios a transcritos de una célula, mediante hibridación con ácidos nucleicos inmovilizados sobre una 30 matriz, o "biochip". Mediante la utilización de una "matriz" de ácidos nucleicos sobre un microchip, algunos o todos los transcritos de una célula se pueden cuantificar simultáneamente. Alternativamente, también se pueden utilizar matrices que comprenden ácido nucleico genómico para determinar el genotipo de una cepa construida mediante los métodos de la invención. Las matrices" de polipéptidos también se pueden utilizar para cuantificar simultáneamente una pluralidad de proteínas. La presente invención se puede poner en práctica con cualquier "matriz" conocida 35 también referida como "micromatriz" o "matriz de ácido nucleico" o "matriz de polipéptido" o "matriz de anticuerpo" o "biochip", o cualquier variación de los mismos. Las matrices son genéricamente una pluralidad de "puntos" o "elementos diana", comprendiendo cada elemento diana una cantidad definida de una o más moléculas biológicas, p. ej., oligonucleótidos, inmovilizados sobre una zona definida de una superficie sustrato para su unión específica a una molécula muestra, p. ej., transcritos de ARNm. 40

Al poner en práctica los métodos de la invención, se puede incorporar en su totalidad o en parte cualquier matriz conocida y/o método para elaborar y utilizar matrices, o variaciones de los mismos, como se describe, por ejemplo, en las Patentes de los Estados Unidos Núms. 6.277.628; 6.277.489; 6.261.776; 6.258.606; 6.054.270; 6.048.695; 6.045.996; 6.022.963; 6.013.440; 5.965.452; 5.959.098; 5.856.174; 5.830.645; 5.770.456; 5.632.957; 5.556.752; 45 5.143.854; 5.807.522; 5.800.992; 5.744.305; 5.700.637; 5.556.752; 5.434.049; véanse también, p. ej., los documentos WO 99/51773; WO 99/09217; WO 97/46313; WO 96/17958; véanse también, p. ej., Johnston (1998) Curr. Biol. 8:R171-R174; Schummer (1997) Biotechniques 23:1087-1092; Kern (1997) Biotechniques 23:120-124; Solinas-Toldo (1997) Genes, Chromosomes & Cancer 20:399-407; Bowtell (1999) Nature Genetics Supp. 21:25-32. Véanse también las Solicitudes de Patente de los Estados Unidos Publicadas Núms. 20010018642; 20010019827; 50 20010016322; 20010014449; 20010014448; 20010012537; 20010008765.

Anticuerpos y métodos de escrutinio basados en anticuerpos

La invención proporciona anticuerpos aislados o recombinantes que se unen específicamente a una xilanasa de la 55 invención. Estos anticuerpos se pueden utilizar para aislar, identificar o cuantificar las xilanasas de la invención o polipéptidos relacionados. Estos anticuerpos se pueden utilizar para aislar otros polipéptidos dentro del alcance de la invención u otras xilanasas relacionadas. Los anticuerpos se pueden diseñar para unirse a un sitio activo de una xilanasa. De este modo, la invención proporciona métodos para inhibir xilanasas utilizando los anticuerpos de la invención (véase la discusión anterior concerniente a las aplicaciones de las composiciones anti-xilanasa de la 60 invención).

La invención proporciona fragmentos de las enzimas de la invención, incluyendo fragmentos inmunogénicos de un polipéptido de la invención. La invención proporciona composiciones que comprenden un polipéptido o péptido de la invención y coadyuvantes o portadores y similares.

Los anticuerpos se pueden utilizar en inmunoprecipitación, tinción, columnas de inmunoafinidad, y similares. Si se 5 desea, las secuencias de ácido nucleico que codifican antígenos específicos se pueden generar mediante inmunización seguido de aislamiento del polipéptido o ácido nucleico, amplificación o clonación e inmovilización del polipéptido sobre una matriz de la invención. Alternativamente, los métodos de la invención se puede utilizar para modificar la estructura de un anticuerpo producido por una célula que se vaya a modificar, p. ej., se puede aumentar o disminuir la afinidad de un anticuerpo. Además, la capacidad para elaborar o modificar anticuerpos puede ser un 10 fenotipo construido en una célula mediante los métodos de la invención.

Los métodos para la inmunización, la producción y el aislamiento de anticuerpos (policlonales y monoclonales) son conocidos por los expertos en la técnica y descritos en the bibliografía científica y de patentes, véase, p. ej., Coligan, CURRENT PROTOCOLS IN IMMUNOLOGY, Wiley/Greene, NY (1991); Stites (eds.) BASIC AND CLINICAL 15 IMMUNOLOGY (7th ed.) Lange Medical Publications, Los Altos, CA ("Stites"); Goding, MONOCLONAL ANTIBODIES: PRINCIPLES AND PRACTICE (2a ed.) Academic Press, New York, NY (1986); Kohler (1975) Nature 256:495; Harlow (1988) ANTIBODIES, A LABORATORY MANUAL, Cold Spring Harbor Publicaciones, New York. También se pueden generar anticuerpos in vitro, p. ej., utilizando bibliotecas de presentación de fagos que expresan el sitio de unión al anticuerpo recombinante, además de los métodos in vivo tradicionales utilizando animales. 20 Véanse, p. ej., Hoogenboom (1997) Trends Biotechnol. 15:62-70; Katz (1997) Annu. Rev. Biophys. Biomol. Struct. 26:27-45.

Los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de 25 los mismos, también se pueden utilizar para generar anticuerpos que se unen específicamente a los polipéptidos o fragmentos. Los anticuerpos resultantes se pueden utilizar en procedimientos de cromatografía de inmunoafinidad para aislar o purificar el polipéptido o para determinar si el polipéptido está presente en una muestra biológica. En tales procedimientos, una preparación de proteína, tal como un extracto, o una muestra biológica se pone en contacto con un anticuerpo capaz de unirse específicamente a uno de los polipéptidos de las secuencias de 30 aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de los mismos.

En procedimientos de inmunoafinidad, el anticuerpo se ancla a un soporte sólido, tal como una cuenta u otra matriz de la columna. La preparación de proteína se coloca en contacto con el anticuerpo en condiciones en las que el 35 anticuerpo se une específicamente a uno de los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, o un fragmento del mismo. Después de un lavado para eliminar las proteínas unidas no específicamente, se hacen eluir los polipéptidos unidos específicamente.

La capacidad de las proteínas en una muestra biológica para unirse al anticuerpo se puede determinar utilizando 40 cualquiera de una variedad de procedimientos familiares para los expertos en la técnica. Por ejemplo, la unión se puede determinar marcando el anticuerpo con una marca detectable tal como un agente fluorescente, una marca enzimática, o un radioisótopo. Alternativamente, la unión del anticuerpo a la muestra se puede detectar utilizando un anticuerpo secundario que tiene en el mismo tal marca detectable. Los análisis concretos incluyen análisis ELISA, análisis sándwich, radioinmunoanálisis y Transferencias Western. 45

Los anticuerpos policlonales generados contra los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de los mismos se pueden obtener mediante inyección directa de los polipéptidos en un animal o administrando los polipéptidos a un animal, por ejemplo, un animal no humano. El 50 anticuerpo obtenido de este modo se unirá a continuación al propio polipéptido. De esta manera, se puede utilizar incluso una secuencia que codifica solo un fragmento del polipéptido para generar anticuerpos que se pueden unir al polipéptido nativo completo. Tales anticuerpos se pueden utilizar a continuación para aislar el polipéptido a partir de células que expresan ese polipéptido.

Para la preparación de anticuerpos monoclonales, se puede utilizar cualquier técnica que proporcione anticuerpos producidos mediante cultivos continuos de líneas celulares. Los ejemplos incluyen la técnica del hibridoma (Kohler y Milstein, Nature, 256:495-497, 1975), la técnica del trioma, la técnica del hibridoma de células B humanas (Kozbor et al., Immunology Today 4:72, 1983) y la técnica del hibridoma de EBV (Cole, et al., 1985, en Monoclonal Antibodies and Cancer Therapy, Alan R. Liss, Inc., págs. 77-96). 60

Las técnicas descritas para la producción de anticuerpos de cadena sencilla (Patente de los Estados Unidos Núm. 4.946.778) se pueden adaptar para producir anticuerpos de cadena sencilla para los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias esencialmente idénticas a éstas, o fragmentos que comprenden al menos

5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de los mismos. Alternativamente, se pueden utilizar ratones transgénicos para expresar anticuerpos humanizados para estos polipéptidos o fragmentos de los mismos.

Los anticuerpos generados contra los polipéptidos de las secuencias de aminoácidos del Grupo B y secuencias 5 esencialmente idénticas a éstas, o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de los mismos se pueden utilizar en el escrutinio de polipéptidos similares de otros organismos y muestras. En tales técnicas, los polipéptidos del organismo se ponen en contacto con el anticuerpo y se detectan los polipéptidos que se unen específicamente al anticuerpo. Cualquiera de los procedimientos descritos anteriormente se puede utilizar para detectar la unión al anticuerpo. Uno de tales análisis de escrutinio se describe 10 en "Methods for Measuring Cellulase Activities", Methods in Enzymology, Vol 160, págs. 87-116.

Kits

La invención proporciona kits que comprenden las composiciones, p. ej., ácidos nucleicos, casetes de expresión, 15 vectores, células, semillas transgénicas o plantas o partes de plantas, polipéptidos (p. ej., xilanasas) y/o anticuerpos de la invención. Los kits también pueden contener material básico para ilustrar las metodologías y usos industriales de la invención, como se describe en la presente memoria.

Construcción de la célula completa y parámetros metabólicos de medición 20

Los métodos de la invención proporcionan la evolución de la célula completa, o la construcción de la célula completa, de una célula para desarrollar una nueva cepa celular que tenga un nuevo fenotipo, p. ej., una actividad xilanasa nueva o modificada, modificando la composición genética de la célula. La composición genética se puede modificar mediante la adición a la célula de un ácido nucleico de la invención, p. ej., una secuencia codificante para 25 una enzima de la invención. Véanse, p. ej., los documentos WO 0229032; WO 0196551.

Para detectar el nuevo fenotipo, se controla al menos un parámetro metabólico de una célula modificada en la célula en un marco temporal a "tiempo real" o "en linea". En un aspecto, se controla una pluralidad de células, tal como un cultivo celular, en "tiempo real" o "en linea". En un aspecto, se controla una pluralidad de parámetros metabólicos en 30 "tiempo real" o "en linea". Los parámetros metabólicos se pueden controlar utilizando las xilanasas de la invención.

El análisis de flujo metabólico (AFM) está basado en un marco bioquímico conocido. Se construye una matriz metabólica linealmente independiente basándose en la ley de conservación de la masa y en la hipótesis del estado seudoestacionario (HESE) en los metabolitos intracelulares. Al poner en práctica los métodos de la invención, se 35 establecen redes metabólicas, incluyendo:

la identidad de todos los sustratos, productos y metabolitos intermedios de la ruta

la identidad de todas las reacciones químicas que interconvierten los metabolitos de las rutas, la estequiometría de las reacciones de la ruta, 40

la identidad de todas las enzimas que catalizan las reacciones, la cinética de la reacción enzimática,

las interacciones reguladoras entre los componentes de la ruta, p. ej. interacciones alostéricas, interacciones enzima-enzima etc,

la compartimentalización intracelular de las enzimas o cualquier otra organización supramolecular de las enzimas, y, 45

la presencia de gradientes de cualquier concentración de metabolitos, enzimas o moléculas efectoras o barreras a la difusión para su movimiento.

Una vez que se construye la red metabólica para una cepa dada, se puede introducir la presentación matemática mediante la noción de matriz para estimar los flujos metabólicos intracelulares si están disponibles los datos del 50 metaboloma en linea. El fenotipo metabólico se basa los cambios de la red metabólica completa en una célula. El fenotipo metabólico se basa en el cambio de la ruta de utilización con respecto a las condiciones ambientales, la regulación genética, el estado de desarrollo y el genotipo, etc. En un aspecto de los métodos de la invención, después del cálculo del AFM en linea, el comportamiento dinámico de las células, su fenotipo y otras propiedades se analizan investigando la utilización de la ruta. Por ejemplo, si aumenta el aporte de glucosa y el oxígeno disminuye 55 durante la fermentación de la levadura, la utilización de rutas respiratorias se reducirá y/o detendrá, y dominará la utilización de las rutas fermentativas. El control del estado fisiológico de los cultivos celulares se hará posible después del análisis de la ruta. Los métodos de la invención pueden ayudar a determinar cómo manipular la fermentación determinando cómo cambiar el suministro de sustrato, la temperatura, el uso de inductores, etc. para controlar el estado fisiológico de las células para moverse a lo largo de la dirección deseable. Al poner en practica 60 los métodos de la invención, también se pueden comparar los resultados del AFM con datos del transcriptoma y proteoma para diseñar experimentos y protocolos de ingeniería metabolica o barajado de genes, etc.

Al poner en practica los métodos de la invención, se puede conferir y detectar cualquier fenotipo modificado o nuevo, incluyendo características nuevas o mejoradas en la célula. Se puede controlar cualquier aspecto del metabolismo o del crecimiento.

Control de la expresión de un transcrito de ARNm 5

En un aspecto de la invención, el fenotipo construido comprende el aumento o la disminución de la expresión de un transcrito de ARNm (p. ej., un mensaje de xilanasa) o generando nuevos transcritos (p. ej., xilanasa) en una célula. Esta expresión aumentada o reducida se puede rastrear comprobando la presencia de una xilanasa de la invención o mediante análisis de la actividad xilanasa. Los transcritos de ARNm, o mensajes, también se pueden detectar y 10 cuantificar por medio de cualquier método conocido, incluyendo, p. ej., transferencias Northern, reacciones de amplificación cuantitativas, hibridación a matrices, y similares. Las reacciones de amplificación cuantitativas incluyen, p. ej., PCR cuantitativa, incluyendo, p. ej., reacción en cadena de la polimerasa mediante transcripción inversa cuantitativa, o RT-PCR; RT-PCR en tiempo real cuantitativa, o " RT-PCR cinética en tiempo real" (véanse, p. ej., Kreuzer (2001) Br. J. Haematol. 114:313-318; Xia (2001) Transplantation 72:907-914). 15

En un aspecto de la invención, el fenotipo ideado se genera desactivando la expresión de un gene homólogo. La secuencia codificante del gene o uno o más elementos de control de la transcripción pueden estar desactivados, p. ej., promotores o intensificadores. De este modo, la expresión de un transcrito puede estar anulada completamente o solo mermada. 20

En un aspecto de la invención, el fenotipo construido comprende el aumento de la expresión de un gen homólogo. Esto se puede efectuar desactivando un elemento de control negativo, incluyendo un elemento regulador de la transcripción que actúa en cis o trans, o, mutagenizando un elemento de control positivo. Uno o más, o, todos los transcritos de una célula se pueden medir mediante hibridación de una muestra que comprende transcritos de la 25 célula, o, ácidos nucleicos representativos de o complementarios a transcritos de una célula, mediante hibridación a ácidos nucleicos inmovilizados sobre una matriz.

Control de la expresión de polipéptidos, péptidos y aminoácidos

En un aspecto de la invención, el fenotipo ideado comprende el aumento o la disminución de la expresión de un polipéptido (p. ej., una xilanasa) o la generación de nuevos polipéptidos en una célula. Esta expresión aumentada o disminuida se puede rastrear determinando la cantidad de xilanasa presento o mediante análisis de la actividad xilanasa. Los polipéptidos, péptidos y aminoácidos también se pueden detectar y cuantificar por medio de cualquier método conocido en la técnica, incluyendo, p. ej., resonancia magnética nuclear (RMN), espectrofotometría, 35 radiografía (radiomarcaje de proteínas), electroforesis, electroforesis capilar, cromatografía líquida de alta resolución (HPLC), cromatografía en capa fina (TLC), cromatografía de hiperdifusión, diversos métodos inmunológicos, p. ej. inmunoprecipitación, inmunodifusión, inmunoelectroforesis, radioinmunoanálisis (RIA), análisis inmunoabsorbentes con enzima ligada (ELISA), análisis inmunofluorescentes, electroforesis en gel (p. ej., SDS-PAGE), tinción con anticuerpos, clasificador de células activadas por fluorescencia (FACS), pirólisis-espectrometría masas, 40 Espectrometría de Infrarrojos por Transformada de Fourier, espectrometría Raman, GC-MS, y LC-Electropulverización y cap-LC-tándem-espectrometrías de masas por electropulverización, y similares. También se pueden escrutar bioactividades novedosas utilizando métodos, o variaciones de los mismos, descritos en la Patente de los Estados Unidos Núm. 6.057.103. Además, como se comenta con detalle más abajo, se pueden medir uno o más, o, todos los polipéptidos de una célula utilizando una matriz de proteínas. 45

Aplicaciones Industriales

La enzima xilanasas de la invención pueden ser catalizadores altamente selectivos. Pueden catalizar reacciones con estereo-, regio- y quimio-selectividades exquisitas sin precedente en la química sintética convencional. Por otra 50 parte, las enzimas son notablemente versátiles. Las enzimas xilanasas de la invención se pueden adaptar a funcionar en disolventes orgánicos, funcionar a pH extremos (por ejemplo, pH elevados y pH bajos) temperaturas extremas (por ejemplo, temperaturas elevadas y temperaturas bajas), niveles de salinidad extremos (por ejemplo, alta salinidad y baja salinidad) y catalizan reacciones con compuestos que no están relacionados estructuralmente con sus sustratos fisiológicos, naturales. 55

Composiciones Detergentes

Los métodos para elaborar y utilizar composiciones detergentes, se observan p. ej., en la Patente de los Estados Unidos Núm. 6.413.928; 6.399.561; 6.365.561; 6.380.147. Las composiciones detergentes pueden ser una 60 composición acuosa de una o dos partes, una composición líquida no acuosa, un sólido moldeado, una forma granular, una forma particulada, una pastilla comprimida, un gel y/o una pasta y una forma en suspensión. Las xilanasas de la invención se pueden utilizar también como un producto aditivo detergente en forma sólida o líquida.

Tales productos aditivos están destinados a funcionar como suplemento o refuerzo de composiciones detergentes convencionales y se pueden añadir en cualquier fase del procedimiento de limpieza.

El contenido de enzima activa real depende del método de fabricación de la composición detergente y no escrítico, suponiendo que la solución detergente tiene la actividad enzimática deseada. En un aspecto, la cantidad de xilanasa 5 presente en la solución final oscila de alrededor de 0,001 mg a 0,5 mg por gramo de la composición detergente. La enzima concreta elegida para su uso en el procedimiento y los productos depende de las condiciones de utilidad final, incluyendo la forma física del producto, el pH de uso, la temperatura de uso, y los tipos de suciedad que vayan a ser degradados o alterados. La enzima se puede elegir para proporcionar una actividad y estabilidad óptimas para cualquier conjunto dado de condiciones de utilidad. En un aspecto, las xilanasas de la presente invención son 10 activas en el pH que oscila de alrededor de 4 a alrededor de 12 y en el intervalo de temperatura de alrededor de 20°C a alrededor de 95°C. Los detergentes pueden comprender tensioactivos catiónicos, no iónicos semi-polares o zwitteriónicos; o, mezclas de los mismos.

Las xilanasas de la invención se pueden formular en detergentes en polvo y líquidos que tienen pH entre 4,0 y 12,0 15 a niveles de alrededor de 0,01 a alrededor de 5% (preferiblemente de 0,1% a 0,5%) en peso. Estas composiciones detergentes pueden incluir también otras enzimas tales como xilanasas, celulasas, lipasas o endoglicosidasas, endo-beta-1,4-glucanasas, beta-glucanasas, endo-beta-1,3(4)-glucanasas, cutinasas, peroxidasas, lacasas, amilasas, glucoamilasas, pectinasas, reductasas, oxidasas, fenoloxidasas, ligninasas, pululanasas, arabinanasas, hemicelulasas, mananasas, xiloglucanasas, xilanasas, pectín acetil esterasas, ramnogalacturonano acetil esterasas, 20 poligalacturonasas, ramnogalacturonasas, galactanasas, pectín liasas, pectín metilesterasas, celobiohidrolasas y/o transglutaminasas. Estas composiciones detergentes pueden incluir también reforzantes y estabilizadores.

La adición de xilanasas de la invención a composiciones de limpieza no crea ninguna limitación de uso especial. En otras palabras, cualquier temperatura y pH adecuados para el detergente también son adecuados para las 25 composiciones con tal que la enzima esté activa o sea tolerante al pH y/o temperatura de uso pretendidos. Además, las xilanasas de la invención se pueden utilizar en una composición de limpieza sin detergentes, de nuevo solas o combinadas con reforzantes y estabilizadores.

Las composiciones de limpieza incluyendo tales composiciones detergentes pueden ser para limpiar superficies 30 duras, composiciones detergentes para limpiar tejidos, composiciones lavavajillas, composiciones de limpieza orales, composiciones de limpieza de dentaduras, o soluciones de limpieza de lentes de contacto.

Un método para lavar un objeto comprende poner en contacto el objeto con un polipéptido de la invención en condiciones suficiente para su lavado. Se puede añadir una xilanasa de la invención como aditivo detergente. La 35 composición detergente se puede formular, por ejemplo, en forma de una composición detergente para al colada a mano o a máquina que comprende un polipéptido de la invención. Un aditivo para la colada adecuado para el pre-tratamiento de tejidos manchados pueden comprender un polipéptido de la invención. Una composición suavizante de tejidos puede comprender una xilanasa de la invención. Alternativamente, una xilanasa de la invención se puede formular en forma de una composición detergente para uso en operaciones generales de limpieza de superficies 40 duras domésticas. En aspectos alternativos, los aditivos para detergentes y las composiciones detergentes pueden comprender uno o más de otras enzimas tales como una xilanasa, una lipasa, una cutinasa, otra xilanasa, una carbohidrasa, una celulasa, una pectinasa, una mananasa, una arabinasa, a galactanasa, una xilanasa, una oxidasa, p. ej., una lactasa, y/o una peroxidasa (véase también, lo antedicho). Las propiedades de la enzima o las enzimas de la invención se eligen para que sean compatibles con el detergente seleccionado (es decir pH óptimo, 45 compatibilidad con otros ingredientes enzimáticos y no enzimáticos, etc.) y la enzima o las enzimas están presentes en cantidades eficaces. En un aspecto, las enzimas xilanasas de la invención se utilizan para eliminar materiales malolientes de los tejidos. Las diversas composiciones detergentes y métodos para elaborarlas que se puede utilizar se describen, p. ej., en las Patentes de los Estados Unidos Núms. 6.333.301; 6.329.333; 6.326.341; 6.297.038; 6.309.871; 6.204.232; 6.197.070; 5.856.164. 50

Cuando se formulan en forma de composiciones adecuadas para su uso en un método de lavado a máquina para la colada, las xilanasas de la invención pueden comprender un compuesto tensioactivo y un reforzante. Estas pueden comprender adicionalmente uno o más componentes detergentes, p. ej., compuestos poliméricos orgánicos, agentes blanqueantes, enzimas adicionales, supresores del agua de lavado, dispersantes, dispersantes de jabón de cal, 55 agentes suspensores de manchas y anti-redepósito e inhibidores de la corrosión. Las composiciones para la colada pueden contener también agentes suavizantes, como componentes detergentes adicionales. Tales composiciones que contienen carbohidrasa pueden proporcionar limpieza de tejidos, eliminación de la suciedad, mantenimiento de la blancura, suavizamiento, apariencia de color, inhibición de la transferencia de colorantes e higienización cuando se formulan en forma de composiciones detergentes para la colada. 60

La densidad de las composiciones detergentes para la colada puede oscilar de alrededor de 200 a 1500 g/litros, o, de alrededor de 400 a 1200 g/litro, o, de alrededor de 500 a 950 g/litro, o, 600 a 800 g/litro, de composición; ésta se puede medir a alrededor de 20°C.

La forma "compacta" de las composiciones detergentes para la colada se refleja mejor por su densidad y, en términos de composición, por la cantidad de sal de carga inorgánica. Las sales de cargas inorgánica son ingredientes convencionales de composiciones detergentes en forma de polvo. En composiciones detergentes convencionales, las sales de carga están presentes en cantidades sustanciales, típicamente de 17% a 35% en peso de la composición total. En un aspecto de las composiciones compactas, la sal de carga está presente en 5 cantidades que no excedan de 15% de las composición, o, no exceda de 10%, o, no exceda de 5% en peso de la composición. Las sales de carga inorgánica se pueden seleccionar entre las sales de metales alcalinos y alcalinotérreos de sulfatos y cloruros, p. ej., sulfato de sodio.

Las composiciones detergentes líquidas pueden estar también en una "forma concentrada". En un aspecto, las 10 composiciones detergentes líquidas pueden contener una cantidad inferior de agua, en comparación con los detergentes líquidos convencionales. En aspectos alternativos, el contenido de agua del detergente líquido concentrado es menor de 40%, o, menor de 30%, o, menor de 20% en peso de la composición detergente. Los compuestos detergentes pueden comprender formulaciones como las descritas en el documento WO 97/01629.

Las xilanasas de la invención pueden ser útiles para formular diversas composiciones de limpieza. Varios compuestos conocidos son tensioactivos adecuados incluyendo detergentes no iónicos, aniónicos, catiónicos, o zwitteriónicos, se pueden utilizar, p. ej., como se describe en las Patentes de los Estados Unidos Núms. 4.404.128; 4.261.868; 5.204.015. Además, las xilanasas se pueden utilizar, por ejemplo, en aplicaciones de jabón líquido o en pastilla, formulaciones para el cuidado de la vajilla, soluciones o productos de limpieza de lentes de contacto, 20 hidrólisis de péptidos, tratamiento de residuos, aplicaciones textiles, como enzimas fusión-escisión en la producción de proteínas, y similares. Las xilanasas pueden proporcionar un aumento de rendimiento en una composición detergente en comparación con otra xilanasa detergente, esto es, el grupo enzimático puede aumentar la limpieza de ciertas manchas sensibles a las enzimas tales como hierba o sangre, según se determina mediante la evaluación habitual después de un ciclo de lavado convencional. Las xilanasas se pueden formular en detergentes en polvo y 25 líquidos que tienen un pH entre 6,5 y 12,0 a niveles de alrededor de 0,01 a alrededor de 5% (por ejemplo, alrededor de 0,1% a 0,5%) en peso. Estas composiciones de limpieza detergentes pueden incluir también otras enzimas tales como xilanasas, xilanasas, amilasas, celulasas, lipasas o endoglicosidasas conocidas, así como reforzantes y estabilizadores.

Las composiciones detergentes que tienen actividad xilanasa (una xilanasa de la invención) se pueden utilizar con compuestos de frutas, hortalizas y/o barro y arcilla (véase, por ejemplo, la Patente de los Estados Unidos Núm. 5.786.316).

Tratamiento de fibras y artículos textiles 35

Los métodos para tratar fibras y tejidos pueden utilizar una o más xilanasas de la invención. Las xilanasas se pueden utilizar en cualquier método de tratamiento de fibras o tejidos, que son bien conocidos en la técnica, véase, p. ej., la Patente de los Estados Unidos Núm. 6.261.828; 6.077.316; 6.024.766; 6.021.536; 6.017.751;5.980.581; la Publicación de Patente de los Estados Unidos Núm. 20020142438 A1. Por ejemplo, las xilanasas de la invención se 40 pueden utilizar en el desaprestado de fibras y/o tejidos. En un aspecto, se mejora el tacto y la apariencia de un tejido por medio de un método que comprende poner en contacto el tejido con una xilanasa de la invención en una solución. En un aspecto, el tejido se trata con la solución a presión. Por ejemplo, las xilanasas de la invención se pueden utilizar en la eliminación de manchas.

Las xilanasas de la invención se pueden utilizar para tratar cualquier material celulósico, incluyendo fibras (p. ej., fibras de algodón, cáñamo, linaza o lino), tejidos cosidos y no cosidos, p. ej., géneros tricotados, géneros tejidos, tela vaquera, hilaturas, y tejidos de rizo, elaborados de algodón, mezclas de algodón o productos celulósicos naturales o fabricados por el hombre (p. ej. originados a partir de fibras de celulosa que contienen xilano por ejemplo de pasta de madera) o combinaciones de los mismos. Los ejemplos de las combinaciones son combinaciones de algodón o 50 rayón/viscosa con uno o más materiales acompañantes tales como lana, fibras sintéticas (p. ej. fibras de poliamida, fibras acrílicas, fibras de poliéster, fibras de poli(alcohol vinílico), fibras de poli(cloruro de vinilo), fibras de poli(cloruro de vinilideno), fibras de poliuretano, fibras de poliurea, fibras de aramida), y fibras que contienen celulosa (p. ej. rayón/viscosa, ramio, cáñamo, linaza/lino, yute, fibras de acetato de celulosa, liocel).

Los procedimientos de tratamiento de artículos textiles (utilizando xilanasas de la invención) se pueden utilizar junto con otros tratamientos de artículos textiles, p. ej., desgrasado y blanqueo. El desgrasado es la eliminación de material no celulósico de la fibra de algodón, p. ej., la cutícula (consistente principalmente de ceras) y la pared celular primaria (consistente principalmente de pectina, proteína y xiloglucano). Es necesaria una eliminación apropiada de la cera para obtener una alta humectabilidad. Esto es necesario para la tintura. La eliminación de las 60 paredes celulares primarias mediante el procedimientos de la invención mejora la eliminación de la cera y asegura una tintura más uniforme. El tratamiento de artículos textiles con los procedimientos de la invención puede mejorar la blancura en el procedimiento de blanqueado. El producto químico principal utilizado en el desgrasado es el hidróxido de sodio a altar concentraciones y a elevadas temperaturas. El blanqueado comprende la oxidación del artículo

textil. El blanqueado implica típicamente el uso de peróxido de hidrógeno como agente oxidante con el fin de obtener un tejido completamente blanqueado (blanco) o para asegurar un matiz limpio del colorante.

La invención también proporciona xilanasas alcalinas (xilanasas activas en condiciones alcalinas). Estas tienen aplicaciones de amplio alcances en el tratamiento de artículos textiles, desengomado de las fibras vegetales (p. ej., 5 fibras liberianas vegetales), tratamiento de aguas residuales pécticas, elaboración de papel, y fermentaciones de café y té. Véase, p. ej., Hoondal (2002) Applied Microbiology and Biotechnology 59:409-418.

Tratamiento de alimentos y elaboración de alimentos

Las xilanasas de la invención tienen numerosas aplicaciones en la industria de elaboración de alimento. Por ejemplo, en un aspecto, las xilanasas de la invención se utilizan para mejorar la extracción de aceite a partir de material vegetal rico en aceite, p. ej., semillas ricas en aceite, por ejemplo, aceite de soja a partir de habas de soja, aceite de oliva a partir de aceitunas, aceite de colza a partir de semillas de colza y/o aceite de girasol a partir de semillas de girasol. 15

Las xilanasas de la invención se pueden utilizar para la separación de componentes de materiales de células vegetales. Por ejemplo, la xilanasas de la invención se pueden utilizar en la separación de material rico en xilano (p. ej., células vegetales) en sus componentes. En un aspecto, las xilanasas de la invención se pueden utilizar para separar cultivos ricos en xilano o cultivos ricos en aceite en proteínas valiosas y fracciones de aceite y cáscara. El 20 procedimiento de separación se puede realizar mediante el uso de métodos conocido en la técnica.

Las xilanasas de la invención se pueden utilizar en la preparación de zumos, jarabes, extractos y similares de frutas u hortalizas para incrementar el rendimiento. Las xilanasas de la invención se pueden utilizar en el tratamiento enzimático (p. ej., hidrólisis de materiales vegetales que comprenden xilano) de diversos materiales derivados de 25 pared celular vegetal o materiales de desecho, p. ej. de cereales, granos, producción de vino o zumo, o residuos agrícolas tales como cáscaras vegetales, cáscaras de haba, pasta de remolacha azucarera, pasta de aceituna, pasta de patata, y similares. Las xilanasas de la invención se pueden utilizar para modificar la consistencia y la apariencia de las frutas u horatalizas elaboradas. Las xilanasas de la invención se pueden utilizar para tratar material vegetal para facilitar la elaboración del material vegetal, incluyendo alimentos, facilitar la purificación o extracción de 30 componentes vegetales. Las xilanasas de la invención se pueden utilizar para mejorar el valor del pienso, disminuir la capacidad de retención de agua, mejorar la degradabilidad en plantas de tratamiento de aguas residuales y/o mejorar la conversión de material vegetal para el ensilaje, y similares.

En un aspecto, las xilanasas de la invención se utilizan en aplicaciones para panificación, p. ej., galletas y galletas 35 saladas, para hidrolizar arabinoxilanos y crear masas no pegajosas que no sean difíciles de maquinar y para reducir el tamaño de las galletas. El uso de las xilanasas de la invención para hidrolizar los arabinoxilanos se utiliza para prevenir la rehidratación rápida del producto horneado dando como resultado la pérdida de carácter crujiente y la reducción de la vida útil. En un aspecto, la xilanasas de la invención se utilizan como aditivos en la elaboración de masas. En un aspecto, las xilanasas de la invención se utilizan en el acondicionamiento de masas, donde en un 40 aspecto las xilanasas poseen alta actividad a lo largo de un intervalo de temperatura de alrededor de 25-35°C y a un pH casi neutro (7,0 – 7,5). En un aspecto, las enzimas para el acondicionamiento de masas se puede inactivar a las temperaturas extremas de panificación (>260°C).

En un aspecto, las xilanasas de la invención se utilizan como aditivos en la elaboración de masas para realizarlas 45 óptimamente a las condiciones de pH y temperatura de la masa. En un aspecto, una enzima de la invención se utiliza para el acondicionamiento de masas. En un aspecto, una xilanasa de la invención posee alta actividad a lo largo de un intervalo de temperatura de 25-35°C y a pH caso neutro (7,0 – 7,5). En un aspecto, la enzima es inactivada a las temperaturas extremas de panificación, por ejemplo, >260°C.

Tratamiento de papel o pasta

Las xilanasas de la invención pueden estar en el tratamiento de pasta o destintado de papel. Por ejemplo, en un aspecto, la invención proporciona un procedimiento de tratamiento de papel en el que se utiliza una xilanasa de la invención. En un aspecto, la xilanasa de la invención es aplicable en la reducción de la necesidad de un agente 55 blanqueante químico, tal como dióxido de cloro, y en entornos muy alcalinos y de alta temperatura. En un aspecto, la xilanasa de la invención es una endoxilanasa alcalina termoestable que puede efectuar una reducción de más de 25% del requerimiento de dióxido de cloro de la pasta kraft con una pérdida de rendimiento de pasta menor de 0,5%. En un aspecto, los parámetros límite son pH 10, 65-85°C y tiempo de tratamiento menor de 60 minutos a una carga de enzima de menos de 0,001% en peso. Se puede someter a ensayo una reserva de xilanasas para determinar la 60 capacidad para hidrolizar el xilano marcado con colorante, por ejemplo, a pH 10 y 60°C. La enzimas positivas para la prueba en estas condiciones se pueden evaluar a continuación, por ejemplo a pH 10 y 70°C. Alternativamente, las enzimas se pueden someter a ensayo a pH 8 y pH 10 a 70°C. Al descubrir las xilanasas deseable en las de la industria de la pasta y el papel, se eligieron como diana bibliotecas de entornos de alta temperatura o altamente

alcalinos. Específicamente, estas bibliotecas se escrutaron para determinar las enzimas que funcionan a pH alcalino y a una temperatura de aproximadamente 45°C. En otro aspecto, las xilanasas de la invención son útiles en la industria de la pasta y el papel en la degradación de una conexión hemicelulosa de la lignina, con el fin de liberar la lignina.

Piensos para animales y aditivos para alimentos o piensos

Los métodos para el tratamiento de piensos y alimentos para animales y aditivos para alimentos o piensos pueden utilizar las xilanasas de la invención, para animales incluyendo mamíferos (p. ej., seres humanos), aves, peces y similares. Los piensos, alimentos, y aditivos para animales pueden comprender xilanasas de la invención. En un 10 aspecto, el tratamiento de piensos, alimentos y aditivos para animales las utilizando xilanasas de la invención puede ayudar a la disponibilidad de los nutrientes, p. ej., almidón, proteínas, y similares, en los piensos o aditivos para animales. Rompiendo las proteínas difíciles de digerir o indirectamente o directamente desenmascarando el almidón (u otros nutrientes), la xilanasa hace los nutrientes más accesibles a otras enzimas endógenas o exógenas. La xilanasa también puede causar simplemente la liberación de nutrientes y azúcares rápidamente digeribles y 15 fácilmente absorbidos.

Cuando se añaden a piensos para animales, las xilanasas de la invención mejoran la rotura in vivo del material de la pared celular vegetal debido parcialmente a la reducción de la viscosidad intestinal (véase, p. ej., Bedford et al., Proceedings of the 1st Symposium on Enzymes in Animal Nutrition, 1993, págs. 73-77), con lo que se logra una 20 mejor utilización de los nutrientes vegetales por el animal. De este modo, utilizando las xilanasas de la invención en piensos se mejora la tasa de crecimiento y/o la proporción de conversión de pienso (es decir el peso de pienso ingerido con respecto a la ganancia de peso) del animal.

El aditivo para piensos para animales de la invención puede ser un producto enzimático granular que se puede 25 remezclar fácilmente con los componentes del pienso. Alternativamente, aditivos para piensos pueden formar un componente de una pre-mezcla. El producto enzimático granular de la invención puede estar revestido o no revestido. El tamaño de partícula de los productos granulados enzimáticos pueden ser compatibles con los del pienso y los componentes de premezcla. Esto proporciona un medio seguro y conveniente para incorporar enzimas a piensos. Alternativamente, el aditivo para piensos para animales puede ser una composición líquida estabilizada. 30 Esta puede ser una suspensión acuosa o con una base oleosa. Véase, p. ej., la Patente de los Estados Unidos Núm. 6.245.546.

Las xilanasas de la presente invención, en la modificación de piensos o alimentos para animales, pueden elaborar el alimento o pienso in vitro (modificando los componentes del pienso o alimento) o in vivo. Las xilanasas se pueden 35 añadir a las composiciones de piensos o alimentos para animales que contienen altas cantidades de xilanos, p. ej. pienso o alimento que contiene material vegetal de cereales, granos y similares. Cuando se añade al pienso o alimento la xilanasa mejora significativamente la rotura in vivo del material que contiene xilano, p. ej., paredes de la célula vegetal, con lo que se logra una mejor utilización de los nutrientes vegetales por el animal (p. ej., ser humano). En un aspecto, se mejora la tasa de crecimiento y/o la proporción de conversión de pienso (es decir el peso de 40 pienso ingerido con respecto a la ganancia de peso) del animal. Por ejemplo una proteína que comprende xilano parcialmente digerible o indigerible es degradada completamente o parcialmente por una xilanasa de la invención, p. ej. en combinación con otra enzima, p. ej., beta-galactosidasa, a péptidos y galactosa y/o galactooligómeros. Estos productos de digestión enzimática son mas digeribles para el animal. De este modo, las xilanasas de la invención pueden contribuir a la energía disponible del pienso o el alimento. Asimismo, mediante la contribución a la 45 degradación de proteínas que comprenden xilano, una xilanasa de la invención puede mejorar la digeribilidad y la absorción de constituyentes del pienso o alimento carbohidratados y no carbohidratados tales como proteínas, grasa y minerales.

En otro aspecto, la xilanasa de la invención se puede suministrar expresando las enzimas directamente en los 50 cultivos de pienso transgénico (en forma, p. ej., de plantas transgénicas, semillas y similares), tales como granos, cereales, maíz, haba de soja, semilla de colza, aztramuz y similares. Como se ha comentado anteriormente, la invención proporciona plantas transgénicas, partes de plantas y células vegetales que comprenden una secuencia de ácido nucleico que codifica un polipéptido de la invención. En un aspecto, el ácido nucleico se expresa de manera que la xilanasa de la invención es producida en cantidades recuperables. La xilanasa se puede recuperar a partir de 55 cualquier planta o parte de planta. Alternativamente, la planta o parte de planta que contiene el polipéptido recombinante se puede utilizar tal cual para mejorar la calidad de un alimento o pienso, p. ej., mejorando su valor nutritivo, palatabilidad, y propiedades reológicas, o para destruir un factor antinutritivo.

Los métodos para eliminar oligosacáridos del pienso antes de su consumo por un sujeto animal pueden utilizar una 60 xilanasa de la invención. En este procedimiento se forma un pienso que tiene un valor energético metabolizable incrementado. Además de las xilanasas de la invención, se pueden utilizar galactosidasas, celulasas y combinaciones de las mismas. En un aspecto, la enzima se añade en una cantidad igual a entre alrededor de 0,1% y

1% en peso del material para pienso. En un aspecto, el pienso es un material de un cereal, un trigo, un grano, un haba de soja (p. ej., un haba de soja molida). Véase, p. ej., la Patente de los Estados Unidos Núm. 6.399.123.

Los métodos para utilizar una xilanasa como suplemento nutricional en las dietas de animales se pueden llevar a cabo preparando un suplemento nutricional que contiene una enzima xilanasa recombinante que comprende al menos treinta aminoácidos contiguos de un aminoácido de las secuencias de aminoácidos del Grupo B, y 5 administrando el suplemento nutricional a un animal para incrementar la utilización del xilano contenido en el alimento ingerido por el animal.

Una matriz de liberación de enzimas peletizada comestible puede liberar fácilmente una enzima xilanasa, tal como una que tiene una secuencia de aminoácidos de las secuencias de aminoácidos del grupo B, o al menos 30 10 aminoácidos contiguos de la misma, en medios acuosos, tales como, por ejemplo, el fluido digestivo de un animal. La matriz de liberación de enzimas se prepara a partir de un portador comestible granulado seleccionado entre componentes tales como germen de grano que es residuo de la extracción de aceite, forraje, alfalfa, heno, cáscara de soja, harina de semilla de giralsol y salvado de trigo, y similares, que dispersan fácilmente la enzima recombinante contenida allí en medios acuosos. Para su uso, la matriz de liberación de enzimas peletizada 15 comestible se administra a un animal para la liberación de xilanasa al animal, por ejemplo en forma de un suplemento nutricional. Los sustratos basados en granos pueden comprender o estar derivados de cualquier grano comestible adecuado, tal como trigo, maíz, soja, sorgo, alfalfa, cebada, y similares. Un sustrato a base de granos ilustrativo es un sustrato a base de maíz. El sustrato se puede obtener de cualquier parte adecuada del grano, pero es preferiblemente un germen de grano aprobado para su uso en piensos para animales, tal como germen de maíz 20 que se obtiene en un procedimiento de molienda en mojado o en seco. El germen de grano comprende preferiblemente un germen residuo de extracción, que es un germen de grano del cual se ha expulsado el aceite, por ejemplo mediante presión o extracción con hexano u otro disolvente. Alternativamente, el germen de grano es extraído expeliéndolo, esto es, el aceite ha sido separado por presión.

La matriz de liberación de enzimas está en forma de partículas plurales discretas, peletes o gránulos. Mediante "gránulos" se quieren significar partículas que son comprimidas o compactadas, por ejemplo mediante peletización, extrusión, o compactación similar para eliminar el agua de la matriz. Tal compresión o compactación de las partículas también promueve la cohesión intrapartícula de las partículas. Por ejemplo, los gránulos se pueden preparar peletizando en sustrato o base de grano en un molino peletizador. Los peletes preparados de ese modo se 30 muelen o desmenuzan hasta un tamaño de gránulo adecuado para su uso como coadjuvante en piensos para animales. Puesto que la propia matriz está aprobada para su uso en piensos para animales, ésta se puede utilizar como diluyente para la liberación de enzimas en piensos para animales.

Preferiblemente, la matriz de liberación de enzimas está en forma de gránulos que tienen un tamaño de gránulo que 35 oscila de una malla de alrededor de 4 a alrededor de 400 (USS); más preferiblemente, una malla de alrededor de 8 a alrededor de 80; y muy preferiblemente una malla de alrededor de 14 a alrededor de 20. Si el germen de grano es extraído mediante extracción con disolvente, puede ser necesario el uso de un agente lubricante tal como aceite de maíz en el peletizador, pero tal agente lubricante normalmente no es necesario si el germen es extraído expeliéndolo. Alternativamente, la matriz se prepara mediante procedimientos de compactación o compresión tales 40 como, por ejemplo, extrusión del sustrato a base de grano a través de un troquel y molienda del producto extrudido hasta un tamaño de gránulo adecuado.

La matriz de liberación de enzimas puede incluir adicionalmente un componente polisacárido como agente de cohesión para mejorar la cohesión de los gránulos de la matriz. Se cree que el agente de cohesión proporciona 45 grupos hidroxilo adicionales, que potencia la unión entre las proteínas del grano dentro del gránulo de la matriz. Se cree adicionalmente que los grupos hidroxilo adicionales funcionan así potenciando los puentes de hidrógeno de las proteínas al almidón y a otras proteínas. El agente de cohesión puede estar presente en cualquier cantidad adecuada para potenciar la cohesión de los gránulos de la matriz de liberación de enzimas. Los agentes de cohesión adecuados incluyen uno o más de dextrinas, maltodextrinas, almidones, tales como almidón de maíz, harinas, 50 derivados celulósicos, hemicelulósicos, y similares. Por ejemplo, el porcentage de germen de grano y de agente de cohesión en la matriz (sin incluir la enzima) es 78% de harina de germen de maíz y 20% en peso de almidón de maíz.

Puesto que la matriz liberadora en enzimas de la invención se elabora a partir de materiales biodegradables, la 55 matriz puede ser sujeto de degradación, por ejemplo mediante la proliferación de moho. Para prevenir o inhibir tal proliferación del moho, la matriz puede incluir un inhibidor del moho, tal como una sal propionato, que puede estar presente en cualquier cantidad suficiente para inhibir la proliferación del moho en la matriz liberadora de enzimas, proporcionando de ese modo una matriz de liberación en una formulación estable que no requiere refrigeración.

La enzima xilanasa contenida en la matriz y métodos de liberación de enzimas es preferiblemente una xilanasa termoestable, como se ha descrito en la presente memoria, de manera que resiste la inactivación de la xilanasa durante fabricación donde se pueden emplear temperatura elevadas y/o vapor de agua para preparar matriz de liberación de enzimas paletizada. Durante la digestión del pienso que contiene la matriz de liberación de enzimas,

los fluidos digestivo acuosos causarán la liberación de la enzima activa. También se pueden incorporar otros tipos de enzimas termoestables y suplementos nutricionales que son termoestables a la matriz de liberación para su liberación en cualquier tipo de condiciones acuosas.

Se puede aplicar un revestimiento a las partículas de la matriz enzimática para muchos diferentes propósitos, tales 5 como añadir un sabor o suplemento nutricional a los piensos para animales, retrasar la liberación de los suplementos y enzimas de los piensos para animales en condiciones gástricas, y similares. O, el revestimiento se puede aplicar para lograr un objetivo funcional, por ejemplo, siempre que sea deseable ralentizar la liberación de la enzima desde las partículas de la matriz o para controlas las condiciones bajo las que se liberará la enzima. La composición del material de revestimiento puede ser una que sea disgregada selectivamente por un agente al que 10 sea susceptible (tal como calor, ácido o base, enzimas u otros agentes químicos). Alternativamente, se pueden aplicar consecutivamente a las partículas de la matriz dos o más revestimientos susceptibles a tales agentes disgregantes diferentes.

Un procedimiento para la preparación de una matriz liberadora de enzimas comprende proporcionar partículas 15 plurales discretas de un sustrato a base de grano con un tamaño de partícula adecuado para su uso como una matriz liberadora de enzimas, donde las partículas comprenden una enzima xilanasa codificada por una secuencia de aminoácidos de las secuencias de aminoácidos del Grupo B o al menos 30 aminoácidos consecutivos de las mismas. Preferiblemente, el procedimiento incluye compactar o comprimir las partículas de la matriz liberadora de enzimas para formar gránulos, lo que muy preferiblemente se logra mediante peletización. El inhibidor de moho y el 20 agente de cohesión, cuando se utilizan, se pueden añadir en cualquier momento adecuado, y preferiblemente se mezclan con el sustrato a base de grano en las proporciones deseadas antes de la peletización del sustrato a base de grano. El contenido de humedad del pienso en el molino peletizador se encuentra preferiblemente en los intervalos mostrados anteriormente con respecto al contenido de humedad en el producto finalizado, y preferiblemente es de alrededor de 14-15%. Preferiblemente, se añade humedad a la materia prima en forma de una 25 preparación acuosa de la enzima para llevar la materia prima a este contenido de humedad. La temperatura en el molino peletizador se lleva preferiblemente a alrededor de 82°C con vapor de agua. El molino peletizador se puede manejar en cualquier condición que confiera suficiente actividad a la materia prima para proporcionar peletes. El propio procedimiento de peletización es un procedimiento económico para eliminar el agua de la composición que contiene enzima. 30

En un aspecto, el molino peletizador se maneja con una matriz de 3,2 mm por 51 mm (1/8 pulgadas por 2 pulgadas) a una presión de 45 kg/min. (100 lb./min.) a 82°C para proporcionar peletes, que a continuación se desmenuzan en un molino peletizador desmenuzador para proporcionar partículas plurales discretas que tienen un tamaño de partícula susceptible de pasar a través de un tamiz de malla 8 pero que quedan retenidas en un tamiz de malla 20. 35

Las xilanasas termoestables de la invención se pueden utilizar en tales peletes. Pueden tener temperaturas óptimas altas y resistencia térmica alta de manera que se puede lograr una reacción enzimática a una temperatura no llevada a cabo hasta ahora. Se puede utilizar el gen codificante de la xilanasa como se muestra en cualquiera de las secuencias de las secuencias de ácido nucleico del Grupo A en la preparación de xilanasas (p. ej. utilizando 40 GSSM™ como se ha descrito en la presente memoria) que tienen características diferentes de las de las xilanasas de las secuencias de aminoácidos del Grupo B (en términos de pH óptimo, temperatura óptima, resistencia térmica, estabilidad frente a disolventes, actividad específica, afinidad con el sustrato, capacidad de secreción, velocidad de traducción, control de la transcripción y similares). Además, se puede emplear un polinucleótido de las secuencias de ácido nucleico del Grupo A para el escrutinio de xilanasas variantes preparadas mediante los métodos descritos 45 en la presente memoria para determinar aquellas que tienen una actividad deseada, tal como termoestabilidad o termotolerancia mejoradas o modificadas. Por ejemplo, la Patente de los Estados Unidos Núm. 5.830.732, describe un análisis de escrutinio para determinar la termotolerancia de una xilanasa.

Tratamiento de Residuos 50

Las xilanasas de la invención se pueden utilizar en una variedad de aplicaciones industriales diferentes, p. ej., en el treatamiento de residuos. El procedimiento de digestión de residuos sólidos utilizando xilanasas de la invención puede comprender la reducción de la masa y el volumen de residuos sólidos sustancialmente no tratados. Los residuos sólidos se pueden tratar mediante un procedimiento digestivo enzimático en presencia de una solución 55 enzimática (incluyendo xilanasas de la invención) a una temperatura controlada. Esto da como resultado una reacción sin fermentación bacteriana apreciable de los microorganismos añadidos. El residuo sólido se convierte en un residuo licuado y ningún residuo sólido restante. El residuo líquido resultante se puede separar de cualquier residuo sólido restante. Véase p. ej., la Patente de los Estados Unidos Núm. 5.709.796.

Productos para higiene bucal

Los productos para higiene bucal pueden comprender xilanasas de la invención. Los productos para la higiene bucal ilustrativos incluyen pastas dentales, cremas dentales, geles o polvos dentales, odónticos, colutorios, formulaciones

de enjuague post- o pre-cepillado, chicles, grageas, o caramelos. Véase, p. ej., la Patente de los Estados Unidos Núm. 6.264.925.

Elaboración y fermentación de cerveza

Los métodos para elaborar (p. ej., fermentar) cerveza pueden comprender xilanasas de la invención. En un procedimiento ilustrativo, las materias primas que contienen almidón se disgregan y se procesan para formar una malta. Se utiliza una xilanasa de la invención en cualquier momento del procedimiento fermentación. Por ejemplo, las xilanasas de la invención se pueden utilizar en el procesamiento de la malta de la cebada. La materia prima principal para la elaboración de cerveza es la malta de cebada. Esto puede consistir en un procedimiento de tres 10 etapas. Primero, el grano de cebada se puede empapar para incrementar el contenido de agua, p. ej., hasta alrededor de 40%. Segundo, se puede hacer germinar el grano mediante incubación de 1 a 25°C durante 3 a 6 días cuando la síntesis enzimática se estimula el control de giberelinas. En un aspecto, las xilanasas de la invención se añaden en esta (o cualquier otra) etapa del procedimiento. Las xilanasas de la invención se pueden utilizar en cualquier procedimiento de producción de cerveza o bebidas alcohólicas, como se describe, p. ej., en la Patente de 15 los Estados Unidos Núm. 5.762.991; 5.536.650; 5.405.624; 5.021.246; 4.788.066.

En un aspecto, se utiliza una enzima de la invención para mejorar la filtrabilidad y viscosidad del mosto y para obtener una hidrólisis más completa de los componentes del endospermo. El uso de una enzima de la invención incrementarla también el rendimiento de extracto. El procedimiento de elaboración de cerveza implica la germinación 20 del grano de cebada (malteado) seguido de la extracción y la rotura de los carbohidratos almacenados para producir azúcares sencillos que son utilizados por la levadura para la fermentación alcohólica. La degradación de las reservas de carbohidratos presentes en el endospermo de la cebada y los complementos para la elaboración de cerveza requieren la actividad de algunas enzimas diferentes.

En un aspecto, una enzima de la invención tiene actividad a pH ligeramente ácido (p. ej., 5,5-6,0), p. ej., en el intervalo de temperatura 40°C a 70°C; y, en un aspecto, con inactivación a 95°C. La actividad en tales condiciones será óptima, pero no son un requerimiento esencial para la eficacia. En un aspecto, una enzima de la invención tiene actividad entre 40-75°C, y pH 5,5-6,0; es estable a 70° durante al menos 50 minutos, y, en un aspecto, se inactiva a 96-100°C. Las enzimas de la invención se pueden utilizar con otras enzimas, p. ej., beta-1,4-endoglucanasas y 30 amilasas.

Aplicaciones médicas y de investigación

Las xilanasas de la invención se pueden utilizar como agentes antimicrobianos debido a sus propiedades 35 bacteriolíticas. Las xilanasas de la invención se pueden utilizar para eliminar la salmonela o proteger animales de la misma, como se describe p. ej., en las Solicitudes PCT Núms. WO 0049890 y WO 9903497.

Otras aplicaciones industriales

Las xilanasas de la invención se pueden utilizar y las secuencias de aminoácidos del Grupo B se utilizan en una amplia gama de aplicaciones para alimentos, piensos para animales y bebidas. Se descubre nuevas xilanasas mediante escrutinio bibliotecas y ADN bibliotecas existentes construidas a partir de diversas localizaciones mesófilas y moderadamente termófilas así como de fuentes elegidas como diana incluyendo flora digestiva, microorganismos en residuos animales, bacterias de suelo y hábitats altamente alcalinos. También son útiles las biotrampas y las 45 estrategias de enriquecimiento primarias utilizando sustratos de arabinoxilano y/o fracciones de polisacáridos no solubles de material de pienso para animales.

Se utilizan dos formatos de escrutinio (basados en la actividad y basados en la secuencia) en el descubrimiento de xilanasas novedosas. El enfoque basado en la actividad es un escrutinio directo para la actividad xilanasa en placas 50 de agar utilizando un sustrato tal como AZO-xilano (Megazyme). Alternativamente se puede utilizar un enfoque basado en la secuencia, que cuenta con la bioinformática y la biología molecular para diseñar sondas para hibridación y bioinmunopurificación. Véase, por ejemplo, las Patentes de los Estados Unidos Núms. 6.054.267, 6.030.779, 6.368.798, 6.344.328. Los éxitos del escrutinio se purifican, se secuencian, se caracterizan (por ejemplo, determinando la especificidad, la temperatura y el pH optimo), se analizan utilizando bioinformática, se subclonan y 55 se expresan para determina su caracterización bioquímica. Estos métodos se pueden utilizar en el escrutinio de xilanasas útiles en innumerables aplicaciones, incluyendo acondicionamiento de masas y como enzimas adicionales de piensos para animales.

Al caracterizar las enzimas obtenidas de un escrutinio, se puede evaluar la utilidad ilustrativa en el procesamiento de 60 masas y aplicaciones para panificación. La caracterización puede incluir, por ejemplo, la medición de la especificidad del sustrato (xilano, arabinoxilano, CMC, BBG), temperatura y estabilidad de pH y la actividad específica. Se puede utilizar una enzima comercial como referencia. En un aspecto, las enzimas de la invención actividad significativa a pH ≥ 7 y 25-35° C, son inactivas en xilano insoluble, son estables y activas en sacarosa al 50-67%.

En otro aspecto, la utilidad como aditivos para pienso se puede evaluar a partir de la caracterización de enzimas candidato. La caracterización puede incluir, por ejemplo, medición de la especificidad de sustrato (xilano, arabinoxilano, CMC, BβG), temperatura y estabilidad de pH, actividad específica y estabilidad gástrica. En un aspecto el pienso se diseña para un animal monogástrico y en otro aspecto el pienso se diseña para un animal rumiante. En un aspecto, las enzimas de la invención tienen actividad significativa a pH 2-4 y 35-40°C, una vida 5 media superior a 30 minutos en fluido gástrico, vida media en formulación (en tampón o células) superior a 5 minutos a 85°C y se utilizan en forma de un aditivo de pienso para animales monogástricos. En otro aspecto, las enzimas de la invención tienen una o más de las siguientes características: actividad significativa a pH 6,5-7,0 y 35-40°C, una vida media superior a 30 minutos en el fluido del rumen, estabilidad de formulación tan estable como el polvo seco y se utilizan en forma de un aditivo de pienso para animales rumiantes. 10

Las enzimas son reactivas con una amplia gama de sustratos naturales y no naturales, posibilitando de ese modo la modificación virtualmente de cualquier compuesto inicial orgánico. Por otra parte, a diferencia de los catalizadores químicos tradicionales, las enzimas son altamente enantio- y regio-selectivas. El alto grado de especificidad de grupo funcional mostrado por las enzimas posibilita el seguimiento de cada reacción en una secuencia sintética que 15 conduce a un nuevo compuesto activo. Las enzimas también son capaces de catalizar muchas reacciones diversas no relacionadas con su función fisiológica en la naturaleza. Por ejemplo, las peroxidasas catalizan la oxidación de fenoles con peróxido de hidrógeno. Las peroxidases pueden catalizar también reacciones de hidroxilación que no están relacionadas con la función nativa de la enzima. Otros ejemplos son las xilanasas que catalizan la rotura de polipéptidos. En solución orgánica algunas xilanasas pueden también acilar azúcares, una función no relacionada 20 con la función nativa de estas enzimas.

La presente invención explota las propiedades catalíticas únicas de las enzimas. Si bien el uso de biocatalizadores (es decir, enzimas purificadas o brutas, células vivas o no vivas) en transformaciones químicas requiere normalmente de la identificación de un biocatalizador concreto que reacciona con un compuesto de partida 25 específico, la presente invención utiliza biocatalizadores seleccionados y condiciones de reacción que son específicas de los grupos funcionales que están presentes en muchos compuestos de partida. Cada biocatalizador es específico de un grupo funcional, o varios grupos funcionales relacionado y puede reaccionar con muchos compuestos de partida que contienen este grupo funcional. Las reacciones biocatalíticas producen una población de derivados a partir de un solo compuesto de partida. Estos derivados se pueden someter a otra ronda de reacciones 30 biocatalíticas para producir una segunda población de compuestos derivado. Se pueden producir miles de variaciones del compuesto original con cada iteración de la derivatización biocatalítica.

Las enzimas reaccionan en sitios específicos de un compuesto de partida sin afectar al resto de la molécula, un procedimiento que es muy difícil de alcanzar utilizando métodos químicos tradicionales. Este alto grado de 35 especificidad biocatalítica proporciona el medio para identificar un solo compuesto activo en la biblioteca. La biblioteca está caracterizada por la serie de reacciones biocatalíticas utilizadas para producirlo, una denominada "historial biosintético". El escrutinio de la biblioteca para determinar las actividades biológicas y el seguimiento del historial biosintético identifica la secuencia de reacciones específica que produce el compuesto activo. La secuencia de reacciones se repite y se determina la estructura del compuesto sintetizado. Este modo de identificación, a 40 diferencia de otros enfoques de síntesis y escrutinio, no requiere tecnologías de inmovilización y los compuestos se pueden sintetizar y someter a ensayo libres en solución utilizando virtualmente cualquier tipo de análisis de escrutinio. Resulta importante observar, que el alto grado de especificidad de las reacciones enzimáticas sobre los grupos funcionales permite el "seguimiento" de reacciones enzimáticas específicas que constituyen la biblioteca producida biocatalíticamente. 45

Muchas de las etapas procedimentales se realizan utilizando automatización robótica lo que permite la ejecución de muchos miles de reacciones biocatalíticas y análisis de escrutinio por día así como asegura un alto nivel de exactitud y reproducibilidad. Como resultado, se puede producir una biblioteca de compuestos derivados en cuestión de semanas que podría tardar años en producirse utilizando los métodos químicos actuales. (Para enseñanzas 50 adicionales sobre la modificación de moléculas, incluyendo moléculas pequeñas, véase el documento PCT/US94/09174).

La invención se describirá adicionalmente con referencia a los siguientes Ejemplos; no obstante, se debe entender que la invención no está limitada a tales Ejemplos. 55

EJEMPLOS

Ejemplo 1: Descubrimiento de la enzima endoglicosidasa basado en el cultivo en placa: escrutinio de expresión 60

Determinación del título de la biblioteca Lambda: Añadir 1,0 µL de provisión de partida de biblioteca amplificada Lambda Zap Express a 600 µL de células MRF' de E. coli (DO600 = 1,0). Diluir la provisión de MRF' con MgSO4 10 mM. Incubar la mezcla a 37°C durante 15 minutos, a continuación transferir la suspensión a 5-6 mL de agar NZY

Top a 50°C y mezclar suavemente. Verter inmediatamente la solución de agar sobre placas grandes (150 mm) de medio NZY y permitir que el agar Top se solidifique completamente (aproximadamente 30 minutos). Invertir la placa. Incubar la placa a 39°C durante 8-12 horas. (El número de placas es aproximado. Determinar el título de fago para producir 50.000 pfu/placa. Diluir una alícuota de la Biblioteca de fagos con tampón SM si fuera necesario.)

Escrutinio de sustrato: Añadir Lambda Zap Express (50.000 pfu) de la biblioteca amplificada a 600 µL de células MRF' de E. coli (DO600 = 1,0) e incubar a 37°C durante 15 minutos. Mientras se incuba la suspensión de fagos/células, añadir 1,0 mL del sustrato de polisacárido marcado con colorante deseado (usualmente 1-2% p/v) a 5,0 mL de agar NZY top a 50°C y mezclar cuidadosamente. (Mantener la solución a 50°C hasta que se necesite). Transferir la suspensión celular a una solución de sustrato/agar top y mezclar suavemente. Verter inmediatamente la 10 solución sobre placas grandes (150 mm) de medio NZY. Permitir que el agar Top se solidifique completamente (aproximadamente 30 minutos), a continuación invertir la placa. Incubar la placa a 39°C durante 8-12 horas. Observar las zonas aclaradas (halos) alrededor de las placas. Quitar el núcleo de las placas con halos fuera del agar y transferirlas a microtubos estériles. (Una punta de pipeta grande con orificio de 200 µL funciona bien para retirar (quitar el núcleo) el tapón de agar que contiene la placa deseada.) Resuspender el fago en 500 µL de tampón SM. 15 Añadir 20 µL de cloroformo para inhibir cualquier crecimiento celular adicional.

Aislamiento de clones puros: Añadir 5 µL de la suspensión de fagos resuspendida a 500 µL de células MRF' de E. coli (DO600 = 1,0). Incubar a 37°C durante 15 minutos. Mientras se está incubando la suspensión de fagos/células, añadir 600 µL de sustrato de polisacárido marcado con colorante deseado (usualmente 1-2% p/v) a 3,0 mL de agar 20 NZY top a 50°C y mezclar cuidadosamente. (Mantener la solución a 50°C hasta que se necesite). Transferir la suspensión celular a la solución de sustrato/agar top y mezclar suavemente. Verter inmediatamente la solución sobre placas pequeñas (90 mm) de medio NZY y permitir que el agar top se solidifique completamente (aproximadamente 30 minutos), a continuación invertir la placa. Incubar la placa a 39°C durante 8-12 horas. Observar una zona aclarada (halo) de la placa alrededor de una sola placa (clon puro). (Si no se puede aislar una 25 sola placa, ajustar el título y volver a cultivar en placa la suspensión de fagos). Los fagos se resuspenden en 500 µL de tampón SM y se añaden 20 µL de cloroformo para inhibir cualquier crecimiento celular adicional.

Escisión de clones puros: Permitir que la suspensión de fagos puros se incube a temperatura ambiente durante 2 a 3 horas o durante la noche a 4°C. Añadir 100 µL de la suspensión de fagos puros a 200 µL de células MRF' de E. coli 30 (DO600 = 1,0). Añadir 1,0 µL de fago coadyuvante ExAssist (>1 x 106 pfu/mL; Stratagene). Incubar la suspensión a 37°C durante 15 minutos. Añadir 3,0 mL de medio 2 x YT a la suspensión celular. Incubar a 37°C durante 2-2.5 horas con sacudimiento. Transferir a un tubo a 70°C durante 20 minutos. Transferir 50-100 µL de la suspensión de fegémidos a un microtubo que contiene 200 µL de células Exp 505 de E. coli (DO600 = 1,0). Incubar la suspensión a 37°C durante 45 minutos. Cultivar en placa 100 µL de suspensión celular en medio LBkan 50 (medio LB con 50 µg/mL 35 de Kanamicina). Incubar la placa a 37°C durante 8-12 horas. Observar la placa para determinar las colonias. Cualquiera de las colonias que crecen contienen el fegémido puro. Recoger una colonia y cultivar en un pequeño (3-10 mL) cultivo líquido durante 8-12 horas. El medio de cultivo es LB kan 50 líquido.

Verificación de la actividad: Transferir 1,0 mL de cultivo líquido a un microtubo estéril. Centrifugar a 13200 rpm 40 (16000 g) durante 1 minuto. Descartar el sobrenadante y añadir 200 µL de tampón de fosfato pH 6,2. Someter a sonicación durante 5 a 10 segundos sobre hielo utilizando una micropunta ("microtip). Añadir 200 µL del sustrato apropiado, mezclar suavemente e incubar a 37°C durante 1,5-2 horas. Se debe ejecutar también un control negativo que contiene solo tampón y sustrato. Añadir 1,0 mL de etanol absoluto (200 proof) a la suspensión y mezclar. Centrifugar a 13200 rpm durante 10 minutos. Observar el color del sobrenadante. La cantidad de coloración puede 45 variar, pero se considera que cualquier tubo con más coloración que el control tiene actividad positiva. Se puede utilizar un espectrofotómetro para esta etapa si así se desea o necesita. (Para Azo-xilano, Megazyme, leer a 590 nm).

RFLP de clones puros de las mismas Bibliotecas: Transferir 1,0 mL de cultivo líquido a un microtubo estéril. 50 Centrifugar a 13200 rpm (16000 g) durante 1 minuto. Seguir el protocolo del kit QIAprep spin mini (Qiagen) para el aislamiento del plásmido y utilizar 40 µL de agua purificada como tampón de elución. Transferir 10 µL del ADN plasmídico a un microtubo estéril. Añadir 1,5 µL de Buffer 3 (New England Biolabs), 1,5 µL de solución 100X BSA (New England Biolabs) y 2,0 µL de agua purificada. Añadir a esto 1,0 µL de endonucleasas de restricción Not 1 y 1,0 µL de Pst 1 (New England Biolabs). Incubar durante 1,5 horas a 37°C. Añadir 3,0 µL 6X tampón de Carga 55 (Invitrogen). Hacer circular 15 µL de muestra digerida sobre un gel de agarosa al 1,0% durante 1-1.5 horas a 120 voltios. Observar el gel con un sistema para tomar imágenes del gel. Realizar el análisis de secuencia sobre todos los clones con un patrón de digestión diferente.

La Tabla 6 describe diversas propiedades de las enzimas de la descripción. 60

Tabla 6

SEQ ID NO.: Topt* Tstab** pHopt* Actividades significativas pl Mw Observaciones

151, 152: 50°C <1 min a 65°C 5,5 - 9,0 AZO-xilano 5,7 40,2

155, 156: 50°C <1 min a 65°C 5,5 - 8,0 AZO-xilano 8,8 62,7

169, 170: 50°C > 1 min a 65°C; < 1 min a 85°C 7,0 AZO-xilano 8,7 36,7

195, 196: 50°C >1 min a 65°C < 10 min, < 1 min 85°C 5,5 AZO-xilano 8,5 36,7

215, 216: 85°C <3 min a 85°C 5,5 - 8,0 AZO-xilano 8,6 34,8

47, 48: 50°C < 0.5 min a 65°C; < 1 min a 85°C 7,0 - 8,0 AZO-xilano 6,2 40,3

191, 192: 385°C > 30 sec a 85°C 5,5 AZO-xilano 7,8 34,6

247, 248: 50°C < 1 min a 65°C 8,0 AZO-xilano 9,4 43,5

7,8: 50°C > 1 min 85°C < 5 min 5,5 AZO-xilano 4,5 55,3

221, 222: 50 - 65°C <1 min a 75°C 5,5 AZO-xilano 8,3 34,6

163, 164: 65°C <1 min a 65°C 7,0 AZO-xilano 6,3 36,0

19, 20: 37°C <5 min a 50°C 7,0 - 8,0 AZO-xilano 9,2 41,5

87, 88: 37 - 50°C < 1 min a 85°C 8,0 AZO-xilano 5,2 36,7

81, 82: 50°C < 1 min a 65°C 7,0 - 9,0 AZO-xilano 5,3 38,8

91, 92: 50°C < 1 min a 65°C 7 - 8 AZO-xilano, AZO- CMC 5,4 39,0

61, 62: 37°C <5 min a 50°C 7,0 - 9,0 AZO-xilano, AZO- CMC 5,4

159, 160: 85°C < 30 sec a 85°C 5,5 AZO-xilano 8,3 34,5

233, 234: 50°C > 30 sec < 1 min a 65°C; < 1 min a 85°C 7,0 AZO-xilano 8,5 35,1

203, 204: 50 - 65°C > 1 min a 65°C < 5 min, < 1 min 85°C 5,5 AZO-xilano 9,5 21,7

181, 182: 385°C > 1 min a 85°C 5,5 - 8,0 AZO-xilano 8,8 35,5

227, 228: 65°C >1 min a 85°C < 5 min 5,5 - 7,0 AZO-xilano 7,8 25,8

45, 46: 345°C 35 min 45°C, <0.5 min 55°C > 5,5 AZO-xilano 6,7 40,4 ***

231, 232: 65°C >10 min a 50°C 5,5 - 7,0 AZO-xilano 8,4 31,4

129, 130: 65°C <1min a 75°C 5,5 AZO-xilano 5,1

93, 94: 50°C < 1 min a 60°C 8,0 - 9,0 AZO-xilano 5,3 39,1

189, 190: 65°C <1 min a 65°C 5,5 AZO-xilano 9,2 20,3 ****

49, 50: 70°C <20 min 70°C >5 AZO-xilano 5,7 38,9

85, 86: 50°C >5 min a 85°C 5,5 - 7,0 AZO-xilano 6,1 48,4

99, 100: 50°C <1 min a 75°C 5,5 - 8,0 AZO-xilano 10,8 36,6

123, 124: 385°C <30 sec 100 °C 5,5 - 7,0 AZO-xilano 6,1 44,1

249, 250: 45°C >1 min 75°C < 10 min 5,5 AZO-xilano 5,3

167, 168: 85°C < 5 min 85°C 5,5 AZO-xilano 9,5 21,7

207, 208: 75°C < 5 min 65 °C 5,5 AZO-xilano 9,1 20,4

251, 252: 65 - 75°C < 1 min 85 °C 5,5 AZO-xilano 8,8 20,4 *****

11, 12: <90°C <40 min 70°C >6 AZO-xilano 6,8 43,9

177, 178: 65°C < 1 min a 75°C 5,5 AZO-xilano 8,7 44,6

9, 10: 50°C <1 min a 65°C 5,5 - 7,0 AZO-xilano 4,9 46,1

43, 44: 37°C inestable 5,5 - 7,0 AZO-xilano 4,9 39,1

113, 114: 65 - 75°C < 1 min a 75°C 5,5 - 8,0 AZO-xilano 41,2

SEQ ID NO.: Topt* Tstab pHopt* Actividades significativas pl Mw Observaciones

75, 76: 50°C < 1 min 85°C 7,0 - 9,0 AZO-xilano 4,7 39,4

111,112: 37°C >10 min 50°C 7 - 8 AZO-xilano 5,6 41,0

117, 118: 37°C inestable 7 - 8 AZO-xilano 9,1 53,3

115, 116

-

-

-

AZO-xilano 8,9 50,8

125, 126

37°C

-

8,0 AZO-xilano 5,3 41,1

137, 138: 50°C < 30 sec a 65°C 5,5 AZO-xilano 5,7 38,5

69, 70: 385°C < 5 min a 85°C 5,5 - 9,0 AZO-xilano 6,4 58,0

205, 206: 50°C <1min a 65°C 5,5 - 8 AZO-xilano 4,3 35,1

211,212: 50°C <1min a 65°C 5,5 AZO-xilano 4,4 35,4

197,198: 65°C <1 min a 65°C 5,5 AZO-xilano 8,8 20,1

31, 32: 37°C inestable 7,0 AZO-xilano 5,1 54,4

13, 14: 50°C <1 min a 65°C AZO-xilano 5,5 40,0

65, 66: 50°C < 1 min a 65°C 5,5 AZO-xilano, AZO- CMC 4,8 55,5

257, 258: 37°C inestable 5,5 AZO-xilano, AZO- β-glucano de cebada, AZO-CMC 5,3 100,8

57,58: 50°C <1min a 65°C 7,0 AZO-xilano 4,8 56,7

185,186: 50 - 75°C < 1 min a 80°C 5,5 AZO-xilano 8,8 23,2

243, 244: 75°C >0.5 min @ 85°C 5,5 AZO-xilano 8,8 44,4

77,78: 50°C < 5 min a 65°C, < 1 min 85°C 5,5 AZO-xilano 5,3 44,5

229,230: 37°C 330 min 55°C, < 5 min 75°C 5,5 AZO-xilano 8,7 20,6 ******

109, 110: 65°C >0.5 min @ 75°C 5,5 AZO-xilano 4,9 45,2

193, 194: 65°C < 1 min a 75°C 5,5 AZO-xilano 5,4 29,1

173, 174: 65°C < 1 min a 80°C 7,0 AZO-xilano 7,6 51,6

59, 60: 37°C <1 min a 65°C 7,0 AZO-xilano 6,6 42,5

101, 102: 50°C >0.5 min @ 65°C 7,0 AZO-xilano 8,7 41,1

55,56: 37°C > 5 min a 50°C; < 1 min a 85°C 7,0 AZO-xilano 6,5 41,8

15, 16: 50°C < 1 min a 65°C 7,0 AZO-xilano 6,4 40,2

131, 132

-

-

-

AZO-xilano 5,6 42,1

145,146: 65 - 85°C < 1 min a 85°C 5,5 AZO-xilano 5,2 43,7

219, 220

-

-

5,5 AZO-xilano 6,6 34,5

253,254: 65°C > 5 min a 85°C 5,5 - 7 AZO-xilano 7,8 34,6

255, 256: 65°C > 1 min 65°C <3 min 5,5 - 7,0 AZO-xilano 8,3 35,0

* pH o temperatura optima determinados mediante las tasas iniciales utilizando AZO-AZO-xilano como sustrato ** estabilidad térmica, tiempo que la enzima conservó actividad significativa (aprox > 50 %) *** Acondicionamiento de la masa **** GSSM™ parental para la evolución de la tolerancia térmica para aplicaciones de piensos para animales ***** mutación N35D realizada para incrementar la actividad a bajo pH basándose en la actividad relativa de la enzima mutante conocida públicamente a pH 4 aumentó significativamente ****** Acondicionamiento de la masa

Ejemplo 2: Escrutinio GSSM™ para Mutantes Tolerantes Térmicos

El siguiente ejemplo describe un método ilustrativo para el escrutinio de enzimas térmicamente tolerantes. 5

Placas Principales: Preparar placas para un recolector de colonias marcando placas de 96 pocillos y tomando alícuotas de 200 µL de LB Amp100 en cada pocillo (se necesitan ~20 ml por placa de 96 pocillos). Después de retornar las placas del recolector, retirar el medio de la fila 6 de la placa A. Remplazar por una inoculación del SEQ ID NO: 189. Colocar en una incubadora humidificada a 37°C durante la noche.

Placas de Análisis: Fijar los cultivos del aparato en una placa de 96 pocillos de nueva aportación (200 µL/pocillo LB 10 Amp100). Retirar la envoltura de plástico y remplazar por un Precinto Permeable a los Gases. Colocar en una incubadora humidificada durante la noche. Retirar el precinto y remplazar por una tapa de plástico. Centrifugar los cultivos en una centrifuga de sobremesa a 3000 rpm durante 10 min. Eliminar el sobrenadante por medio de inversión sobre una toalla de papel. Añadir alícuotas de 45 µL de tampón Cit-Phos-KCl pH 6 a cada pocillo. Remplazar la tapa de plástico por un precinto de placa de aluminio. Utilizar un rodillo para lograr un buen sellado. 15 Resuspender las células en un aparato de sacudimiento de placas a un nivel 6-7 durante ~30 segundos.

Colocar la placa de 96 pocillos en una incubadora a 80°C durante 20 minutos. No apilar. Después de eso, retirar las placas inmediatamente a agua helada para enfriar durante unos pocos minutos. Retirar el precinto de aluminio y remplazar por una tapa de plástico. Añadir 30 µL de Azo-xilano al 2%. Mezclar como antes sobre el aparato de 20 sacudimiento de placas. Incubar a 37°C en una incubadora humidificada durante la noche.

Añadir 200 µL de etanol a cada pocillo y pipetear arriba y abajo un par de ocasiones para mezclar. Como alternativa cambiar las puntas cada vez, enjuagar con un lavado de etanol y secar mediante expulsión a una toalla de papel. Centrifugar las placas a 3000 rpm durante 10 minutos. Retirar 100 µL de sobrenadante a una placa de 96 pocillos de 25 nueva aportación. Leer la DO590.

Ejemplo 3: Análisis GSSM™ para la Verificación de Éxitos de los Mutantes Tolerantes Térmicos

El siguiente ejemplo describe un método ilustrativo para someter a ensayo las enzimas térmicamente tolerantes. 30

Fijar los clones del aparato o recolectados en placas de 96 pocillos por duplicado (200 µl/pocillo de LB Amp 100). Retirar la envoltura de plástico y remplazar por un Precinto Permeable a los Gases. Colocar en una incubadora humidificada durante la noche. Retirar el precinto y remplazar por una tapa de plástico. Centrifugar los cultivos en una centrifuga de sobremesa a 3000 rpm durante 10 min. Eliminar el sobrenadante por medio de inversión sobre 35 una toalla de papel. Añadir alícuotas de 25 µL de solución de BPER/Lisozima/ADNasa (véase más abajo) a cada pocillo. Resuspender las células en un aparato de sacudimiento de placas a un nivel 6-7 durante ~30 segundos.

Incubar la placa sobre hielo durante 15 minutos. Añadir 20 µL de tampón Cit-Phos-KCl pH 6 a cada placa. Remplazar la tapa de plástico por un precinto de placa de aluminio. Utilizar un rodillo para lograr un buen sellado. 40 Resuspender las células en un aparato de sacudimiento de placas a un nivel 6-7 durante ~30 segundos.

Colocar la placa de 96 pocillos en una incubadora a 80°C durante 20 minutos y la otra a 37°C. No apilar. Retirar las placas inmediatamente a agua helada para enfriar durante unos pocos minutos(utilizar una bandeja grande de plástico si fuera necesario). Retirar el precinto de aluminio. Añadir 30 µL de Azo-xilano al 2%. Precintar con un precinto de plástico permeable a los gases. Mezclar como antes sobre el aparato de sacudimiento de placas. Incubar un conjunto de placas a 37°C y 80°C en una incubadora humidificada a 37°C durante 2 horas y el otro 5 conjunto durante 4 horas.

Después de la incubación, dejar reposar la placa durante ~5 minutos a temperatura ambiente. Añadir 200 µL de etanol a cada pocillo y pipetear arriba y abajo un par de ocasiones para mezclar. En lugar de cambiar las puntas cada vez, enjuagar con un lavado de etanol y secar mediante expulsión a una toalla de papel. Solamente, utilizar un 10 nuevo grupo de puntas para cada clon. Centrifugar las placas a 3000 rpm durante 10 minutos. Retirar 100 µL de sobrenadante a una placa de 96 pocillos de nueva aportación. Leer la DO590.

Solución de BPER/Lisozima/ADNasa (4,74 mL en total):

4,5 mL de BPR 15

200 µL de Lisozima de 10 mg/mL (recién elaborada en tampón Cit-fos de pH 6)

40 µL de ADNasa I de5 mg/mL (recién elaborada en tampón Cit-fos de pH 6

EJEMPLO 4: Análisis de xilanasa con arabinoxilano de trigo como sustrato

El siguiente ejemplo describe un análisis de xilanasa ilustrativo que se puede utilizar, por ejemplo, para determinar si una enzima se encuentra dentro del alcance de la invención.

Los SEQ ID NOS: 11, 12, 69, 70, 77, 78, 113, 114, 149, 150, 159, 160, 163, 164, 167, 168, 181, 182, 197, y 198 se sometieron a un análisis a pH 8 (tampón fosfato de Na) y 70°C utilizando arabinoxilano de trigo como sustrato. Las 25 enzimas se caracterizaron como se muestra en la Tabla 7.

Tabla 7

SEQ ID NOS:: Concentración de proteína (mg/ml) Volumen de producto lisado añadido a cada vial Núm. de viales Unidades/ml* proteína (mg/mL) U/mg

11, 12: 0,5 22,0 7,4

113, 114: 0,6 22,0 3,0

163, 164: 0,6 22,0 1,1

197, 198: 1,0 22,0 1,4

167, 168: 2,2 22,0 10,4

77, 78: 0,5 22,0 1,3

69, 70: 1,3 22,0 1,7

181, 182: 0,8 22,0 1,1

159, 160: 0,9 22,0 2,0

149, 150: 0,5 22,0 1,1

*Basándose en la adición de 1 mL de agua a cada muestra. Las unidades son µmoles de xilosa liberados por minuto basándose en un análisis con azúcares reductores.

EJEMPLO 5: Generación de una xilanasa ilustrativa de la invención 30

El siguiente ejemplo describe la generación de una xilanasa ilustrativa de la invención utilizando tecnología de mutagénesis por saturación de sitio de genes (GSSM™), designada variante o mutante "9x" (el ácido nucleico mostrado en el SEQ ID NO: 377, la secuencia de polipéptidos mostrada en el SEQ ID NO: 378).

Se utilizó GSSM™ para crear una biblioteca completa de mutaciones puntuales en el SEQ ID NO: 190 ilustrativo, de la xilanasa de "tipo salvaje" (codificada por el SEQ ID NO: 189). El escrutinio para la termotolerancia de la xilanasa descrito anteriormente identificó nueve mutantes de un solo sitio de aminoácido (Figura 6A) (D8F, Q11H, N12L, G17I, G60H, P64V, S65V, G68A & S79P) que tenían tolerancia térmica mejorada con respecto a la enzima de tipo salvaje (según se midió después de una prueba térmica a 80°C durante 20 minutos). La enzima de tipo salvaje y los 40 nueve mutantes de un solo sitio de aminoácido se produjeron en E. coli y se purificaron utilizando una etiqueta de hexahistidina N-terminal. No existió ninguna diferencia notoria en la actividad debida a la etiqueta.

La Figura 6 ilustra los nueve mutantes de un solo sitio de aminoácido de la "variante 9x", o, como se muestra en el SEQ ID NO: 378 (codificada por el SEQ ID NO: 377), generada mediante Mutagénesis por Saturación de Sitio de Genes (GSSM™) por "Gene Site Saturation Mutagenesis" de la enzima de "tipo salvaje" del SEQ ID NO: 190 ilustrativa (codificada por el SEQ ID NO: 189). La Figura 6A es un diagrama esquemático que ilustra la posición, la numeración y el cambio de aminoácido por los mutantes puntuales tolerantes térmicos del gen de "tipo salvaje" 5 (SEQ ID NO: 190, codificados por el SEQ ID NO: 189). Se generó una biblioteca de los 64 codones para cada posición de aminoácido en el gen (~13.000 mutantes) y se escrutó para determinar las mutaciones que aumentaban la tolerancia térmica. La variante "9X" se generó combinando los 9 mutantes de un solo sitio en una enzima. El punto medio de transición de la temperatura de fusión (Tm) se determinó mediante DSC para cada enzima mutante y la variante "9X" (SEQ ID NO: 378) se muestra a la derecha. La Figura 6B ilustra el desplegamiento de las enzimas de 10 "tipo salvaje" (SEQ ID NO: 190) y "variante/mutante" "9X" (SEQ ID NO: 378) controladas mediante DSC a una velocidad de escrutinio de 1°C/min. Los datos de la DSC restados de los de referencia se normalizaron para la concentración de proteína.

Análisis de la Actividad Xilanasa 15

Las actividades enzimáticas se determinaron utilizando 400 µL de Azo-xilano al 2% como sustrato en 550 µL de tampón CP (citrato-fosfato), pH 6,0 a las temperaturas indicadas. Las mediciones de la actividad como una función del pH se determinaron utilizando soluciones tampón de Britton y Robinson 50 mM (pH 3,0, 5,0, 6,0, 7,0, 8,0 y 9,0) preparadas mezclando soluciones de ácido fosfórico 0,1 M, ácido bórico 0,1 M y ácido acético 0,1 M seguido de 20 ajuste de pH con hidróxido de sodio 1 M. Las reacciones se iniciaron añadiendo 50 µL de enzima purificada de 0,1 mg/ml. Se tomaron los puntos temporales desde los 0 a 15 minutos en los que se añadieron 50 µL de la mezcla de reacción a 200 µL de la solución de precipitación (etanol del 100%). Cuando se hubieron tomado todos los puntos temporales, las muestras se mezclaron, se incubaron durante 10 minutos y se centrifugaron a 3000 g durante 10 minutos a 4°C. Se añadieron alícuotas del sobrenadante (150 µL) a placas de 96 pocillos de nueva a aportación y se 25 midió la absorbancia a 590 nm. Los valores de A590 se trazaron frente al tiempo y la velocidad inicial se determinó a partir de la pendiente de la línea.

Calorimetría de Barrido Diferencial (DSC).

La calorimetría se realizó utilizando un aparato de DSC Nano II Modelo 6100 (Calorimetry Sciences Corporation, American Fork, UT) utilizando el paquete de soporte informático DSCRun para la adquisición de datos, CpCalc para el análisis, CpConvert para la conversión a la capacidad térmica molar de microvatios y CpDeconvolute para la desconvolución. El análisis se llevó a cabo con 1 mg/ml de proteína recombinante en fosfato de potasio 20 mM (pH 7,0) y KCl 100 mM a una velocidad de barrido de 1ºC/min. Se mantuvo un presión constante de 5 atm durante todos 35 los experimentos de DSC para prevenir la posible desgasificación de la durante el calentamiento. La base instrumental se registró rutinariamente antes de los experimentos con ambas células cargadas con tampón. La reversibilidad de las transiciones inducidas térmicamente se sometió a ensayo volviendo a calentar la solución en la célula del calorímetro inmediatamente después de enfriar la primera ronda.

Determinación de la Tolerancia Térmica.

Todas las enzimas se analizaron para determinar la tolerancia térmica a 80°C en fosfato de potasio 20 mM (pH 7,0) y KCl 100 mM. La enzimas se calentaron a 80°C durante 0, 5, 10 o 30 minutos en tubos de paredes delgadas y se enfriaron sobre hielo. Las actividades residuales se determinaron con Azo-xilano como sustrato utilizando el análisis 45 descrito anteriormente para la medición de la actividad.

Huella Dactilar del Polisacárido.

Las huellas dactilares del polisacárico se determinaron mediante análisis de polisacárido utilizando electroforesis en 50 gel de carbohidrato (PACE). El xilano Beechwood (0,1 mg/mL, 100 µL, Sigma, Poole, Dorset, UK) o xilooligosacáridos (1 mM, 20 µL, Megazyme, Wicklow, Irlanda) se trataron con enzima (1 - 3 µg) en un volumen total de 250 µL durante 16 horas. La reacción se tamponó en acetato de amonio 0,1 M pH 5,5. Se realizaron controles sin sustratos o enzimas en las mismas condiciones para identificar compuestos específicos cualesquiera en las enzimas, polisacáridos/oligosacáridos o reactivos de marcaje. Las reacciones se detuvieron mediante ebullición 55 durante 20 min. Los análisis se realizaron independientemente al menos 2 veces para cada condición. Se llevaron a cabo derivatización utilizando ANTS (ácido 8-aminonaftalen-1,3,6-trisulfónico, Molecular Probes, Leiden, Holanda), electroforesis y tecnología de imágenes como se ha descrito (Goubet, F., Jackson, P., Deery, M. y Dupree, P. (2002) Anal. Biochem. 300, 53-68).

Calculo de la Eficacia Biológica ("Fitness").

La eficacia biológica (Fn), para una variante de enzima dada, n, se calculó ponderando equitativamente el aumento del punto medio de transición de la temperatura de desnaturalización (Tm) y el aumento (o disminución) de la actividad enzimática relativa a la mayor diferencia en cada parámetro en todas las variantes: Fn = FTn + FVn, donde FTn = factor de eficacia biológica de la variante a la Tm y FVn = factor de eficacia biológica de la variante para la actividad. Los factores de eficacia biológica para cada una (Tm y actividad) son relativos a la mayor diferencia en la 5 Tm o la velocidad en todas las variantes. FTn = (Tm - TmL) / (TmH - TmL) donde Tmn es la Tm para la variante dada, n, y TmL es la menor Tm de todas las variantes y TmH la mayor Tm de todas las variantes y FVn = (Vn - VL) / (VH- VL) donde Vn es la velocidad relativa para la variante dada, n, y VL es la velocidad más baja de todas las variantes y VH la velocidad más alta de todas las variantes.

Evolución mediante el método GSSM™.

La tecnología GSSM™ se utilizó para crear una biblioteca completa de mutaciones puntuales en la xilanasa ilustrativa de la invención SEQ ID NO: 190 (codificada por el SEQ ID NO: 189); incluyendo la xilanasa ilustrativa de la invención SEQ ID NO: 378 (codificada por el SEQ ID NO: 377). La termotolerancia de la xilanasa escrutada 15 descrita anteriormente identifica nueve mutantes de un solo sitio de aminoácido (Figura 6A), D8F, Q11H, N12L, G17I, G60H, P64V, S65V, G68A & S79P, que tenían tolerancia térmica mejorada con respecto a la enzima de "tipo salvaje" ilustrativa SEQ ID NO: 190 (codificada por el SEQ ID NO: 189), según se midió después de una prueba térmica a 80°C durante 20 minutos. La enzima de tipo salvaje y los nueve mutantes de un solo sitio de aminoácido se produjeron en E. coli y se purificaron utilizando una etiqueta de hexahistidina N-terminal. No hubo un diferente de 20 actividad notoria debida a la etiqueta.

Para determinar el efecto de las mutaciones de un solo aminoácido sobre la actividad enzimática, se purificaron los nueve mutantes y su actividad xilanasa (velocidades iniciales en el óptimo de temperatura para el tipo salvaje, 70°C) se comparó con la de la enzima de "tipo salvaje" ilustrativa SEQ ID NO: 190. Las actividades enzimáticas fueron 25 comparables a las del tipo salvaje (velocidad inicial normalizada a 1,0) para los mutantes D8F, N12L, G17I, G60H, P64V, S65V G68A y S79P (con respecto a sus velocidades iniciales 0,65, 0,68, 0,76, 1,1, 1,0, 1,2, 0,98 y 0,84 respectivamente) confirmando que estas mutaciones no alteran significativamente las actividad enzimática. Las velocidades iniciales se midieron 3 o más veces y la varianza fue típicamente menor de 10%. En contraste con estos ocho mutantes, se observó una reducción notable de la actividad enzimática para el mejor mutante de un solo sitio, 30 tolerante térmico, Q11H (velocidad inicial relativa 0,35).

Temperatura de fusión (Tm) de las enzimas de "tipo salvaje" y mutantes de un solo sitio tolerantes térmicas.

La xilanasa de "tipo salvaje" SEQ ID NO: 190 y los nueve mutantes de un solo sitio de aminoácido tolerantes 35 térmicos se analizaron utilizando calorimetría de barrido diferencial (DSC). La agregación resultó evidente para la enzima de tipo salvaje según se evidenció por un hombre en el seguimiento de DSC para su desnaturalización térmica, véase la Figura 6B. Las enzimas mutantes evolucionadas no mostraron indicios de agregación. Para todas las enzimas, la desnaturalización inducida térmicamente fue irreversible y no se observó transición discernible en un segundo escrutinio de la muestra. Debido a la irreversibilidad de la desnaturalización, solo se pudo calcular la Tm 40 aparente (temperatura de fusión) (como describen, p. ej., Sanchez-Ruiz (1992) Biophys. J. 61:921-935; Beldarrain (2000) Biotechnol. Appl. Biochem. 31:77-84). La Tm de la enzima de tipo salvaje fue de 61°C mientras que las Tm de todos los mutantes puntuales aumentaron y oscilaron de 64°C a 70°C (Figura 6A). La mutación Q11H introdujo el mayor aumento (Tm= 70°C) sobre el tipo salvaje seguida de P64V (69°C), G17I (67°C) y D8F (67°C).

Enzima ilustrativa de la GSSM™ combinada "9X" del SEQ ID NO: 378

La enzima "9X" (SEQ ID NO: 378) se construyó combinando los cambios de un solo sitio de los nueve mutantes tolerantes térmicos recogidos mediante mutagénesis dirigida al sitio (Figura 6A). La enzima "9X" (SEQ ID NO: 378) se expresó en E. coli y se purificó hasta la homogeneidad. La DSC se realizó para determinar la temperatura de 50 fusión. La Tm de la enzima "9X" fue 34 grado mayor que la del SEQ ID NO: 190, la enzima de "tipo salvaje", demostrando un desplazamiento espectacular de su estabilidad térmica (Figura 6B).

Para evaluar el efecto de las mutaciones combinadas y de la temperatura de fusión elevada sobre las propiedades bioquímicas de la enzima, se construyeron los perfiles de pH y temperatura y se compararon con el SEQ ID NO: 55 190, la enzima de "tipo salvaje". La Figura 7 ilustra la caracterización bioquímica de las enzimas de "tipo salvaje" y mutante 9X "evolucionada". La Figura 7A ilustra la dependencia del pH de la actividad para las enzimas de tipo salvaje y mutante 9X evolucionada. La actividad xilanasa se midió a 37°C a cada pH y la velocidad inicial se trazó frente a la absorbancia a 590 nm para determinar las velocidades iniciales. La Figura 7B ilustra la dependencia de la temperatura de la actividad para las enzimas de tipo salvaje y mutante 9X evolucionada. Las temperaturas óptimas 60 de las enzimas tipo salvaje y mutante 9X se midieron a lo largo de un intervalo de temperatura de 25-100°C a pH 6,0 y están basadas en las velocidades iniciales medidas a lo largo de 5 minutos. La Figura 7C ilustra la estabilidad térmica de las enzimas de tipo salvaje y mutante 9X evolucionada. La dependencia térmica de la actividad de las enzimas de tipo salvaje y mutante 9X evolucionada se midió calentando en primer lugar la enzimas a cada una de

las temperaturas indicadas durante 5 minutos seguido de refrigeración a temperatura ambiente y medición de la actividad residual (velocidad inicial a 37°C, pH 6,0). Para todos los experimentos las velocidades iniciales se midieron 2 veces o más y la variación fue menor de 10%.

Las enzimas del SEQ ID NO: 190 y del SEQ ID NO: 378 (el mutante "9X") tuvieron perfiles de pH/actividad 5 comparables con la mayor actividad entre pH 5 y 6 (Figura 7A). Ambas enzimas tuvieron una velocidad inicial/temperatura optima a 70°C similares, sin embargo, el SEQ ID NO: 190, la enzima de "tipo salvaje" tuvo mayor actividad a menores temperaturas (25-50°C) mientras que el SEQ ID NO: 378 (el mutante "9X") conservó más de 60% de su actividad hasta 100°C (determinada por medio de su velocidad inicial) en presencia de sustrato (Figura 7B). La actividad del SEQ ID NO: 190, la enzima de "tipo salvaje" no fue detectable a temperaturas superiores a 10 70°C.

Para determinar el efecto de las 9 mutaciones combinadas sobre la tolerancia térmica de la enzima, se midió la actividad residual y se comparó con el SEQ ID NO: 190, la enzima de "tipo salvaje". La actividad residual se determinó mediante una prueba térmica durante 5 minutos a cada temperatura (37, 50, 60, 70, 80 y 90°C) seguido 15 de mediciones de la actividad a 37°C. El SEQ ID NO: 190 fue completamente inactivo por encima de 70°C mientras que el mutante 9X evolucionado desplegó una actividad significativa después de calentar a 70, 80 e incluso 90°C (Figura 7C). Además, si bien la actividad de la enzima de tipo salvaje disminuyó al aumentar la temperatura, la variante 9X es activó una poco calentando a temperaturas de hasta 60°C.

Generación de variantes combinatorias de GSSM™ utilizando Tecnología GeneReassembly™.

Para identificar las variantes combinatorias de los 9 mutantes de un solo sitio de aminoácido con la mayor tolerancia térmica y actividad en comparación con la SEQ ID NO: 378 construida aditivamente (la variante "9X"), se construyó y rastreó una biblioteca GeneReassembly™ (Patente de los Estados Unidos Núm. 6.537.776) de todas las 25 combinaciones mutantes posibles (29). Utilizando la tolerancia térmica como criterio de escrutinio, se identificaron 33 combinaciones únicas de las nueve mutaciones como lo fue la variante 9X original. Se realizó un escrutinio secundario para seleccionar las variantes con mayor actividad/expresión que la 9X evolucionada. Este escrutinio produjo 10 variantes con secuencias que poseían entre 6 y 8 de las mutaciones individuales originales en diversas combinaciones, como se ilustra en Figura 8A. La Figura 8 ilustra las variantes combinatorias identificadas utilizando 30 la tecnología GeneReassembly™. La Figura 8A ilustra la biblioteca GeneReassembly™ de todas las combinaciones posibles de las 9 mutaciones puntuales GSSM™ que se construyó y escrutó para determinar las variantes con tolerancia térmica y actividad mejoradas. Se obtuvieron once variantes incluyendo la variante 9X. Como se muestra en la figura, las variantes poseían 6, 7, 8, o 9 de las mutaciones puntuales en diversas combinaciones. El punto medio de la transición de la temperatura de fusión (Tm) correspondiente determinado mediante DSC de cada 35 variante se muestra a la derecha. La Figura 8B ilustra la actividad relativa (velocidad inicial medida a lo largo de un período de tiempo de 5 minutos) de las variantes 6X-2 y 9X en comparación con el tipo salvaje al óptimo de temperatura (70°C) y pH 6,0. Las barras de error muestran el intervalo en la velocidad inicial para 3 mediciones.

La temperatura de fusión (Tm) de cada una de las variantes combinatorias fue al menos 28°C superior a la del tipo 40 salvaje (Figura 8A) y todas las variantes de reensamblaje desplegaron una actividad relativa superior a la de la enzima 9X. La actividad de una variante en particular, 6X-2, fue superior a la de la enzima de tipo salvaje y significativamente mejor (1,7X) que la de la enzima 9X (Figura 8B). La comparación de la secuencia de las variantes de reensamblaje identificaron al menos 6 mutaciones que fueron requeridas para el aumento de termoestabilidad (>20 grados). Las 33 variantes únicas encontradas en el escrutinio de termoestabilidad inicial contenían ambas 45 mutaciones Q11H y G17I demostrando su importancia para la tolerancia térmica.

Análisis de las huellas dactilares de los productos polisacáridos de tipo salvaje y variantes.

Los productos generados por las variantes de "tipo salvaje", 6X-2 y 9X se compararon mediante análisis de 50 polisacáridos utilizando electroforesis en gel de carbohidratos (PACE). Se sometieron a ensayo diferentes sustratos (oligosacáridos y polisacáridos) para determinar la hidrólisis por las xilanasas. Los productos de digestión de las 3 xilanasas sometidas a ensayo fueron muy similares, como se ilustra en la Figura 9. Las tres enzimas hidrolizaron (Xyl)6 y (Xyl)5, principalmente a (Xyl)3 y (Xyl)2, y (Xyl)4 se hidrolizó a (Xyl)2 (Figura 9A). Solo se observó una pequeña cantidad de hidrólisis de (Xyl)3 a (Xyl)2 y se observó Xyl indicando que (Xyl)3 es un sustrato relativamente malo para 55 la enzima. No se detectó actividad sobre (Xyl)2. El xilano Beechwood, que contiene residuos de glucuronosilo, fue hidrolizado por las tres enzimas principalmente a (Xyl)2 y (Xyl)3, pero se detectaron otras bandas que migraban entre las bandas de oligoxilano (Figura 9B). En el análisis PACE, cada oligosacárido tenía una migración específica dependiendo de la composición del azúcar y del grado de polimerización (Goubet, F., Jackson, P., Deery, M. y Dupree, P. (2002) Anal. Biochem. 300, 53-68), de este modo, estas bandas corresponden igualmente a 60 oligoglucuronoxilanos. Por lo tanto, las enzimas evolucionadas retuvieron la especificidad de sustrato de la enzima de "tipo salvaje".

Como se ha observado anteriormente, la Figura 9 ilustra las huellas dactilares producto de las variantes enzimáticas de "tipo salvaje" SEQ ID NO: 190 (codificada por el SEQ ID NO: 189), 6X-2 (SEQ ID NO: 380, codificada por el SEQ ID NO: 379) y SEQ ID NO: 378 (el mutante "9X"),según se determina mediante PACE. La Figura 9A ilustra las huellas dactilares obtenidas después de la hidrólisis de los oligoxilanos (Xyl)3, (Xyl)4, (Xyl)5 y (Xyl)6 por las enzimas de "tipo salvaje" y variantes. Las calles de control contienen oligosacárido incubado en las condiciones de análisis en 5 ausencia de enzima. La Figura 9B ilustra las huellas dactilares obtenidas después de la hidrólisis de xilano Beechwood mediante las enzimas de tipo salvaje y variantes. Los patrones contenían (Xyl)2, (Xyl)3, (Xyl)4. Todos los análisis se realizaron a 37°C y pH 5,5.

Se utilizó una combinación de estrategias de evolución génica de laboratorio para generar rápidamente una xilanasa 10 termoestable, altamente activa optimizada para la compatibilidad con procedimiento en varias de aplicaciones comerciales industriales. La metodología GSSM™ se empleó para escrutar la secuencia completa de la xilanasa de "tipo salvaje" SEQ ID NO: 190 (codificada por el SEQ ID NO: 189) ilustrativa y para identificar 9 mutaciones puntuales que mejoran la tolerancia térmica. Si bien no tenía un efecto discernible sobre el perfil del producto de hidrólisis de la enzima, como se ilustra en la Figura 9, la adición de las 9 mutaciones a la secuencia de proteínas dio 15 como resultado una reducción moderada de la actividad enzimática específica en el óptimo de temperatura del SEQ ID NO: 190 (el "tipo salvaje") 70°C, véase la Figura 9B. Utilizando el método GeneReassembly™ para generar una biblioteca combinatoria de los 9 mutantes de un solo sitio de aminoácido, se superó esta reducción de actividad. A continuación se obtuvieron las variantes termoestable (Tm entre 89°C y 94°C) con actividad mejor que la variante "9X" a partir del escrutinio de la biblioteca GeneReassembly™. Con una Tm de 90°C, la actividad enzimática 20 específica superó la de tipo salvaje y es particularmente notable una huella dactilar producto inalterada y comparable a la del SEQ ID NO: 190 (el "tipo salvaje"), la variante 6X-2 (SEQ ID NO: 380, codificada por el SEQ ID NO: 379). En el conocimiento de los autores de la presente invención el desplazamiento de la Tm obtenida para estas variantes es el incremento máximo referido de la aplicación de tecnologías de evolución dirigida.

El SEQ ID NO: 380 (la variante 6X-2) incluye los siguientes cambios, en comparación con el SEQ ID NO: 190 (el "tipo salvaje"): D8F, Q11H, G17I, G60H, S65V y G68A. El SEQ ID NO: 379 incluye los siguientes cambios de nucleótidos, en comparación con el SEQ ID NO: 189 de "tipo salvaje": los nucleótidos de las posiciones 22 a 24 son TTC, los nucleótidos de las posiciones 31 a 33 son CAC, los nucleótidos de las posiciones 49 a 51 son ATA, los nucleótidos de las posiciones 178 a 180 son CAC, los nucleótidos de las posiciones 193 a 195 son GTG, los 30 nucleótidos de las posiciones 202 a 204 son GCT.

Con el fin de calibrar la eficacia de la mezcla combinatoria frente a la adición de los mutantes puntuales al fenotipo deseado, se calculó para cada mutante un parámetro de eficacia biológica combinando las contribuciones de los cambio en la actividad enzimática y la termoestabilidad. El término eficacia biológica como se ha descrito en la 35 presente memoria no es una medida objetiva que se pueda comparar con otras enzimas, sin un término que permite la medición del suceso de evolución dirigida de esta xilanasa concreta. Puesto que la eficacia biológica de la enzima, F, se calcula ponderando equitativamente los cambios en la Tm y la actividad enzimática para este conjunto de variantes, el valor máximo de eficacia biológica permisible es 2 (FT ≤ 1 y Fv ≤1, véase más arriba). En otras palabras, si la variante con la mejor actividad también tenía la mayor Tm, su valor de eficacia biológica sería 2. Con un valor de 40 eficacia biológica próximo a 2 (véase la Fig. 10B), la variante 6X-2 (SEQ ID NO: 380, codificada por el SEQ ID NO: 379) es la más próxima a poseer la mejor combinación posible de estabilidad térmica y actividad enzimática. La mutación de un solo sitio que confiere el valor máximo de eficacia biológica S65V. Aunque la Tm del mutante S65V es menor que la del mutante Q11H (66°C frente a 70°C respectivamente), tiene un valor de eficacia biológica más alto puesto que su actividad específica no se reduce con respecto al tipo salvaje. 45

La Figura 10A es un diagrama esquemático que ilustra la mejora del nivel de estabilidad térmica (representada por Tm) sobre el "tipo salvaje" obtenido mediante evolución GSSM™. El mutante de un solo sitio de aminoácido y la variante combinatoria con la mayor estabilidad térmica (Q11H y "9X" (SEQ ID NO: 378), respectivamente) se muestran en comparación con el tipo salvaje. La Figura 10B ilustra a "diagrama de eficacia biológica" de la mejora 50 enzimática obtenida combinando las tecnologías GSSM™ y GeneReassembly™. La eficacia biológica se determinó utilizando la fórmula F = FT + FV donde la eficacia biológica (F) se calcula ponderando equitativamente la eficacia biológica de la tolerancia térmica (FT) y la eficacia biológica de la actividad relativa (FV) como se ha descrito anteriormente. Se muestra la mutación puntual que confiere la mayor eficacia biológica (S65V). Combinando las 9 mutaciones puntuales también se mejora la eficacia biológica (SEQ ID NO: 378, la variante "9X"). Sin embargo, la 55 mayor mejora de la eficacia biológica se obtuvo combinando los métodos GSSM™ y GeneReassembly™ para obtener la mejor variante, 6X-2 (SEQ ID NO: 380).

El método GeneReassembly™ también permitió la identificación de residuos importantes que parecen absolutamente necesarios para mejorar la estabilidad térmica. Estuvieron presentes dos residuos clave, Q11H y 60 G17I, en cada variante de GeneReassembly™ identificado basándose en la tolerancia térmica (véase la Figura 6A). Se han estudiado los determinantes estructurales para la estabilidad térmica de las proteínas y se han documentado diversas teorías, p. ej., de Kinjo (2001) Eur. Biophys. J. 30:378-384; Britton (1999) J. Mol. Biol. 293:1121-1132; Ladenstein (1998) Adv. Biochem. Eng. Biotechnol. 61:37-85; Britton (1995) Eur. J. Biochem. 229:688-695; Tanner

(1996) Biochemistry 35:2597-2609; Vetriani (1998) Proc. Natl. Acad. Sci. USA 95:2300-2305. Los patrones de enlaces de hidrógeno, interacciones iónicas, empaquetamiento hidrófobo y descenso de la longitud de las bucles superficiales están entre los factores clave incluso aunque la contribución de cada uno a la estabilidad de la proteína no se comprende en su totalidad. Dado que la mayoría de las sustituciones puntuales beneficiosas identificadas del ensayo de todas las sustituciones posibles de un solo aminoácido implicaron el remplazo de residuos relativamente 5 polares, cargados o pequeños (glicina) por residuos mucho más hidrófobos, se puede deducir que las interacciones hidrófobas juegan el papel más significativo en el aumento de la termoestabilidad de esta proteína. Incluso con un buen conocimiento de las interacciones óptimas para aumentar la tolerancia térmica, la predicción de dónde realizar la mutaciones que introducen tales interacciones no es sencilla. Un enfoque no racional utilizando el método GSSM™, no obstante, permite un muestreo rápido de todas las cadenas laterales de todas las posiciones dentro de 10 una estructura de proteína. Tal enfoque conduce al descubrimiento de sustituciones de aminoácidos que introducen interacciones funcionales que eran imposibles de prever.

EJEMPLO 6: Pre-tratamiento de pasta de papel con xilanasas de la invención

En un aspecto, las xilanasas de la invención se pueden utilizar para pretratar pasta de papel. Este ejemplo describe un protocolo de escrutinio rutinario ilustrativo para determinar si una xilanasa es útil para el pretratamiento de pasta de papel; p. ej., para reducir el uso de agentes químicos blanqueantes (p. ej., dióxido de cloro, ClO2) cuando se utiliza para pretratar Pasta de papel Kraft.

El protocolo de escrutinio tiene dos parámetros de ensayo alternativos: El impacto del tratamiento con xilanasa después de la etapa de deslignificación con oxígeno (pasta post-O2); y, el impacto de la xilanasa en un procedimiento que no incluye deslignificación con oxígeno (pasta no blanqueada pre-O2).

Para las condiciones de tratamiento de la pasta que estimulan las condiciones del procedimiento en situaciones 25 industriales, p. ej., factorías: pH 8,0; 70°C; duración 60 min.

El procedimiento se describe esquemáticamente en el Diagrama Flujo de la Figura 11.

Se identificaron veinte xilanasas mediante pruebas bioquímicas que fueron activas en estas condiciones. De las 20 30 xilanasas, 6 fueron capaces de reducir significativamente la demanda de ClO2 cuando se utilizaron para pretratar pasta Kraft antes de blanquearla químicamente. Las seis son: SEQ ID NO: 182 (codificada por el SEQ ID NO: 181); SEQ ID NO: 160 (codificada por el SEQ ID NO: 159); SEQ ID NO: 198 (codificada por el SEQ ID NO: 197); SEQ ID NO: 168 (codificada por el SEQ ID NO: 167); SEQ ID NO: 216 (codificada por el SEQ ID NO: 215); SEQ ID NO: 260 (codificada por el SEQ ID NO: 259). Otras mostraron cierta actividad pero no tan buena. Las xilanasas SEQ ID NO: 35 182 (codificada por el SEQ ID NO: 181) y SEQ ID NO: 160 (codificada por el SEQ ID NO: 159) son modulares y contienen un módulo de unión a carbohidrato además del dominio catalítico xilanasa. Se demostró que los derivados truncados de estas 2 xilanasas que contienen solo el dominio catalítico son más eficaces en esta aplicación. La mejor xilanasa, SEQ ID NO: 160 (codificada por el SEQ ID NO: 159) se estudió más exhaustivamente. Los resultados se pueden resumir a continuación: 40

-: el pretratamiento de pasta de picea/pino/abeto (SPF) post-O2 con 2 unidades/g de SEQ ID NO: 160 (codificada por el SEQ ID NO: 159) reduce el uso subsiguiente de ClO2 en 22% para alcanzar un brillo de 65%GE;

-: el pretratamiento de pasta no blanqueada de SPF pre-O2 con 0,5 unidades/g de SEQ ID NO: 160 (codificada por el SEQ ID NO: 159) reduce es uso subsiguiente de ClO2 en 13% para alcanzar un brillo de 65%GE; 45

-: el pretratamiento de pasta de álamo pre-O2 con 0,5 unidades/g de SEQ ID NO: 160 (codificada por el SEQ ID NO: 159) reduce el uso de ClO2 en al menos 22%;

-: el pretratamiento de Abeto Douglas/cicuta pre-O2 con 0,5 unidades/g de SEQ ID NO: 160 (codificada por el SEQ ID NO: 159) reduce el uso de ClO2 en al menos 22%;

-: en las condiciones de tratamiento empleadas, la reducción del rendimiento a partir del tratamiento con xilanasa 50 no sobrepasó 0,5% cuando se comparó con la pasta que había sido blanqueada con el mismo factor kappa pero no tratada con xilanasa;

-: las condiciones óptimas para el tratamiento de pasta SPF post-O2 con los SEQ ID NOS: 159, 160 fueron: pH 6-7, dosis de enzima 0,3 unidades/g, tiempo de tratamiento 20-25 min. En estas condiciones, fue posible una reducción del uso de ClO2 de 28% para alcanzar un brillo de 69%GE. 55

En experimentos adicionales:

SEQ ID NO: 160 (XYLA), codificada por el SEQ ID NO: 159 = xilanasa de tipo salvaje completa:

● XYLA (E.c) = variante truncada de los SEQ ID NOS: 159, 160 que contiene solo un dominio catalítico de 60 xilanasa expresado en E. coli

● XYLA (P.f) = ídem pero expresado en P. fluorescens

SEQ ID NO: 182 (codificada por el SEQ ID NO: 181) = segunda xilanasa de tipo salvaje completa:

● XYLB (E.c) = variante truncada etc, etc expresada en E.coli

● XYLB (P.f) = ídem pero expresada en P. fluorescens

Datos de Respuesta a la Dosis para las Xilanasas Principales en Pasta No blanqueada Pre-O2

Condiciones para la etapa con xilanasas (etapa X) a continuación: 5

pH 8

Temperatura 70°C

Tiempo 60 min

Factor Kappa 0,24

Para un control no enzimático, el factor kappa fue 0,30 10

Los resultados mostraron un aumento dependiente de la dosis del brillo para las muestras tratadas con xilanasa a una carga inferior de dióxido de cloro (ClO2) (Kf 0,24 vs Kf 0,30).

En cada caso, el derivado truncado pareció ser más eficaz que la xilanasa completa. La dosis de xilanasa óptima 15 pareció estar alrededor de 0,6 a 0,7 U/g de pasta.

Pretratamiento de Pasta No Blanqueada Intercontinental Pre-O2 con las 4 mejores Xilanasas

Determinación de Respuesta a la Dosis de ClO2 en Do 20

Esquema experimental

● Pasta no blanqueada Pre-O2

o Kappa inicial 31,5

● Condiciones de la etapa X

o Carga de Xilanasa 0,7 U/gm 25

o Temperatura 70°C

o pH 8

o Tiempo de tratamiento 1 hr

o Consistencia de la pasta 10%

● Secuencia de blanqueo XDEp 30

o Factor kappa 0,22, 0,26 y 0,30 (%D en pasta: 2,63, 3,12 y 3,60)

Brillo final después de una secuencia de blanqueo de 3 etapas frente al factor Kappa (carga de ClO2):

● XYLB - A un brillo de 61,5 final, la etapa X posibilita una reducción en el uso de ClO2 de 3,89 kg/tonelada de 35 pasta.

● XYLB (E.c) - A un brillo de 61,5 final, la etapa X posibilita una reducción de la carga de ClO2 de 4,07 kg/tonelada de pasta.

● XYLA - A un brillo de 61,5, la etapa X posibilita una a reducción en el uso de ClO2 de 4,07 kg/tonelada de pasta. 40

● XYLA (E.c) - A un brillo de 61,5 final, la etapa X posibilita una reducción en el uso de ClO2 de 4,90 kg/tonelada de pasta.

Determinación de la Respuesta a la Dosis de ClO2 en Do:

Enzima: Ahorros de ClO2 en Do (kg/tonelada de OD) Reducción de Kf en Do

XYLB: 3,89 11,7%

XYLB (E.c): 5,08 15,8%

XYLA: 4,07 12,2%

XYLA (E.c): 4,90 14,7%

Xilanasa 0,7 U/g, pH 8,0, 70 °C, 1 hr

Pasta: Pasta no blanqueada Pre-O2, kappa inicial 31,5

El porcentaje de ahorro de ClO2 tiene poca trascendencia para la industria. Su principal preocupación son los 50 kilogramos de ClO2 requeridos por tonelada de pasta OD. Esto tiene sentido cuando se considera que un porcentaje menor de ahorro observado con una gran cantidad de pasta no blanqueada kappa inicial puede ser más valioso en

términos de Kg de ClO2 ahorrados que un mayor porcentaje de reducción para una pequeña cantidad de pasta kappa inicial que requerirá una menor carga total de ClO2 para alcanzar el brillo objetivo.

Relación entre el Brillo, el Rendimiento y el Factor Kappa para la Pasta de Control Blanqueada:

Los resultados mostraron que el blanqueo con dosis crecientes de ClO2 para lograr un mayor brillo objetivo da como resultado una pérdida creciente de rendimiento de pasta. Esto es un problema puesto que la pasta en esta etapa del procedimiento tiene un valor de casi 400 dólares por tonelada y la pérdida de celulosa cuesta dinero.

Un beneficio de la xilanasa (p. ej., una xilanasa de la invención) es que el uso de una dosis de ClO2 inferior puede 10 reducir las pérdidas de rendimiento con tal que la acción de la propia xilanasa no anule la ganancia.

Datos de Respuesta a la Dosis para el Pretratamiento de Pasta No Blanqueada Pre-O2 con Xilanasa XYLB (P.f):

Esquema experimental

● Pasta No Blanqueada Northwood Pre-O2

 Kappa inicial 28,0 20

 Consistencia inicial 32,46%

 Brillo inicial 28,37

● Condiciones de la etapa X

 Carga de Xilanasa 0 a 2,70 U/gm

 Temperatura 58°C a 61°C

 pH 8,2 a 8,5

 Tiempo de tratamiento 1hr

● Secuencia de blanqueo XDEp

 Factor kappa 0,24

● Ahorro de ClO2 calculado para factores kappa entre 0,24 y 0,30 35

El propósito de este experimento fue evaluar la mejor de las 4 xilanasas sobre la pasta no blanqueada SPF no lavada. Los resultados mostraron incrementos dependientes de la dosis en el brillo final para la pasta tratada con XYLB (E.c), alcanzándose el brillo en presencia de xilanasa a Kf inferior de 0,24, aproximándose asintóticamente el brillo logrado a Kf superior de 0,30. 40

Relación entre la Dosis de Xilanasa XYLB (E.c) y el Ahorro de Dióxido de Cloro (Pasta No Blanqueada Pre-O2):

Ahorro de ClO2 en % de Pasta OD: Ahorro de ClO2 en kg/tonelada de Pasta Dosis de Xilanasa en U/gm

0,299%: 2,99 0,31

0,363%: 3,63 0,51

0,406%: 4,06 0,71

0,439%: 4,39 0,91

0,483%: 4,83 1,26

0,523%: 5,32 1,80

0,587%: 5,87 2,70

La Dosis Óptima de Xilanasa se encuentra entre 0,5 y 0,9 U/gm

La dosis óptima está en el intervalo de 0,5 a 0,9 U/g. Por encima de esta dosis hay una disminución del retorno por incremento unitario de xilanasa. Las reducciones de la dosis de dióxido de cloro por tonelada de pasta tratada de esta magnitud con significativas comercialmente.

Procedimiento de bioblanqueo de tres etapas 5

Se desarrolló un procedimiento de bioblanqueo de tres etapas que simularía mejor las operaciones de blanqueo actuales en una planta de blanqueo de pasta en molino (Fig. 1). Esta secuencia de blanqueo es designada mediante (X)DoEp, donde X representa la etapa de tratamiento con xilanasa, D la etapa de blanqueo con dióxido de cloro, y Ep la etapa de extracción con peróxido alcalino. La alimentación primaria utilizada en los ensayos de aplicación de 10 los autores de la presente invención fue Southern Softwood Kraft Brownstock (sin deslignificación con oxígeno). También se sometieron a ensayo las xilanasas candidato más eficaces que mostraron un alto potencial de reducción química del blanqueo en los análisis de bioblanqueo sobre dos especies de pasta Kraft de madera dura (arce y álamo). Una vez finalizada cada ronda de bioblanqueo, la pasta resultante se utilizó para producir hojas de papel elaboradas a mano convencionales TAPPI (Technical Association of Pulp and Paper Industries). Se midió el brillo 15 GE% de cada hoja de papel elaborada a mano, y los valores de brillo se utilizaron como indicación de hasta que punto había funcionado cada enzima sobre la pasta durante la etapa de pretratamiento enzimático (X).

Resultados:

De las aproximadamente 110 xilanasas que se escrutaron utilizando la secuencia de bioblanqueo (X)DoEp, 4 enzimas, es decir, XYLA (P.f); XYLB (P.f); SEQ ID NO216 (codificada por el SEQ ID NO: 215); SEQ ID NO: 176 (codificada por el SEQ ID NO: 175); mostraron el mayor potencial para reducir el uso de blanqueantes químicos. Mientras que XYLA (P.f) y XYLB (P.f) mostraron igualmente un alto rendimiento (el mejor entre las cuatro mejores), XYLA (P.f) mostró una mejor tolerancia que XYLB (P.f). Los resultados se pueden resumir a continuación: 25

● Es posible lograr un brillo de la hoja elaborada a mano de 60 (GE%) utilizando una secuencia de blanqueo de tres etapas [(X)DoEp] que implica el pretratamiento de Southern Softwood Kraft Brownstock con las siguientes cuatro enzimas a los niveles de carga enumerados más abajo (pH=8, 65°C y 1 h):

o XYLA (P.f) a 0,55 U/g de pasta 30

o XYLB (P.f) a 0,75 U/g de pasta

o SEQ ID NOS: 215, 216 a 1,80 U/g de pasta

o SEQ ID NOS: 175, 176 at 1,98 U/g de pasta

● El pretratamiento de Southern Softwood Kraft Brownstock con 2 U/g de pasta de XYLA (P.f) reduce el uso de ClO2 en 18,7% para alcanzar un brillo GE% final de 61. 35

● XYLA (P.f) exhibe buena tolerancia a mayor pH y proporciona más ahorros químicos de 14% cuando la etapa de pretratamiento enzimático funciona a pH = 10.

● El pretratamiento de Southern Softwood Kraft Brownstock con 2 U/g de pasta de XYLB (P.f) reduce el uso de ClO2 en 16,3% para alcanzar un brillo GE% final de 60,5.

● Pretratamiento de pasta Kraft de álamo con 2 U/g pasta de XYLA (P.f) y XYLB (P.f) reduce el uso de ClO2 en 40 alrededor de 35% para alcanzar un brillo GE% final de 77.

● Pretratamiento de pasta Kraft de arce con 2 U/g pasta de XYLA (P.f) y XYLB (P.f) reduce el uso de ClO2 en alrededor de 38% para alcanzar un brillo GE% final de 79.

● Las dos xilanasas que funcionan mejor, a saber XYLA (P.f) y XYLB (P.f), son enzimas truncadas, que contienen solo el dominio catalítico, y se produjeron en Pseudomonas fluorescens. 45

Si bien la invención ha sido descrita en detalle con referencia a ciertos aspectos preferidos de la misma, se entenderá que las modificaciones y variaciones están dentro del alcance de lo que se describe y reivindica.

LISTA DE SECUENCIAS 50

<110> VERENIUM CORPORATION

<120> XILANASAS, ÁCIDOS NUCLEICOS QUE LAS CODIFICAN Y MÉTODOS PARA ELABORARLAS Y

UTILIZARLAS

<130> 48287.EP01 55

<140> PCT/US2003/019153 <141> 2003-03-16

<150> US 60/389,299 <151> 2002-06-14

<160> 380 60

<170> FastSEQ para Windows Version 4.0

<210> 1 <211> 1128 <212> ADN <213> Bacteria 65

<400> 1

<210> 2 <211> 375 <212> PRT 5 <213> Bacteria

<400> 2 10

<210> 3 <211> 2196

<212> ADN <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 3 5

<210> 4 <211> 711 10 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 4

<210> 5 <211> 2106 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 5 10

<210> 6 <211> 701 <212> PRT 5 <213> Desconocido

<220> <223> obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(47) 10

<400> 6

<210> 7 <211> 1539 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 7 10

<210> 8 <211> 512 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(57) 10

<400> 8

<210> 9 <211> 1311 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 9 10

<210> 10 <211> 436 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(36)

<400> 10

<210> 11 <211> 1224 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 11

<210> 12 <211> 407 <212> PRT 5 <213> desconocido

<220> <223> obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(28) 10

<400> 12

<210> 13 <211> 1053 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 13 10

<210> 14 <211> 350 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<400> 14

<210> 15 <211> 1110 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 15 10

<210> 16 <211> 369 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(20)

<400> 16

<210> 17 <211> 1035 <212> ADN 5 <213> Bacteria

<400> 17 10

<210> 18 <211> 344 <212> PRT <213> Bacteria

<220> <221> SEÑAL <222> (1)...(31)

<400> 18 5

<210> 19 <211> 1152 <212> ADN 10 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 19 15

<210> 20 <211> 383 <212> PRT <213> Desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(29)

<400> 20 10

<210> 21 <211> 1119 <212> ADN 15 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 21

<210> 22 <211> 372 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(28) 10

<400> 22

<210> 23 <211> 1137 <212> ADN <213> desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental

<400> 23 10

<210> 24 <211> 378 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(29)

<400> 24

<210> 25 5 <211> 978 <212> ADN <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental 10

<400> 25

<210> 26 <211> 325

<212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 26 5

<210> 27 <211> 1173 10 <212> ADN <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 27 15

<210> 28 <211> 390

<212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL 5 <222> (1)...(27)

<400> 28 10

<210> 29 <211> 2331 <212> ADN <213> Archaea

<400> 29

<210> 30 5 <211> 776 <212> PRT <213> Archaea

<400> 30

<210> 31 <211> 1134 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 31 10

<210> 32 <211> 377 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 32 10

<210> 33 <211> 1815 <212> ADN 15 <213> desconocido

<220> <223> obtenido a partir de una muestra ambiental

<400> 33

<210> 34 5 <211> 604 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental 10

<221> SEÑAL <222> (1)...(23)

<400> 34

<210> 35 <211> 2286 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 35

<210> 36 <211> 761 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 36 10

<210> 37 <211> 2769 <212> ADN <213> Desconocido 5

<220> <223> Obtenido a partir de una muestra ambiental

<400> 37 10

<210> 38 <211> 922 <212> PRT <213> desconocido 15

<220> <223> Obtenido a partir de una muestra ambiental

<400> 38

<210> 39 <211> 1143 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 39

<210> 40 <211> 380 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(24) 10

<400> 40

<210> 41 <211> 1893 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 41 10

<210> 42 <211> 630 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(37)

<400> 42

<210> 43 <211> 1011 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 43 10

<210> 44 <211> 336 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<400> 44

<210> 45 <211> 1137 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 45 10

<210> 46 <211> 378 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(25)

<400> 46

<210> 47 <211> 1137 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 47 10

<210> 48 <211> 378 <212> PRT <213> desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(26)

<400> 48 10

<210> 49 <211> 996 <212> ADN 15 <213> Desconocido

<220> <223> obtenido a partir de una muestra ambiental

<400> 49

<210> 50 <211> 331 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 50 10

<210> 51 <211> 3162 <212> ADN 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 51

<210> 52 5 <211> 1053 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental 10

<221> SEÑAL <222> (1)...(30)

<400> 52

<210> 53 <211> 2370 <212> ADN <213> Bacteria 5

<400> 53

<210> 54 <211> 787 <212> PRT 10 <213> Bacteria

<220> <221> SEÑAL <222> (1)...(37)

<400> 54 15

<210> 55 <211> 1143 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 55 10

<210> 56 <211> 380 <212> PRT 15 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(24)

<400> 56 5

<210> 57 <211> 1578 <212> ADN <213> Desconocido 10

<220> <223> Obtenido a partir de una muestra ambiental

<400> 57

<210> 58 <211> 525 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(22) 10

<400> 58

<210> 59 <211> 1104 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 59 10

<210> 60 <211> 367

<212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL 5 <222> (1)...(21)

<400> 60

<210> 61 <211> 1041 10 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 61 15

<210> 62 <211> 346 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 62 10

<210> 63 <211> 1110 <212> ADN 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 63

<210> 64 <211> 369 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(20) 10

<400> 64

<210> 65 <211> 1557 <212> ADN <213> Desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental

<400> 65 10

<210> 66 <211> 518 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(22)

<400> 66

<210> 67 5 <211> 1224 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental 10

<400> 67

<210> 68 <211> 407 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(28) 10

<400> 68

<210> 69 <211> 1596 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 69 10

<210> 70 <211> 531 <212> PRT <213> desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(25)

<400> 70 10

<210> 71 <211> 1269 <212> ADN <213> Desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental

<400> 71

<210> 72 <211> 422 10 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 72 15

<210> 73 <211> 4455 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 73 10

<210> 74 <211> 1484 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(21) 10

<400> 74

<210> 75 <211> 1122 <212> ADN <213> desconocido 5

<220> <223> Obtenido a partir de una muestra ambiental

<400> 75

<210> 76 <211> 373 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(22) 10

<400> 76

<210> 77 <211> 1248 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 77 10

<210> 78 <211> 415 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(27)

<400> 78 20

<210> 79 <211> 1293 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 79 10

<210> 80 <211> 430 <212> PRT <213> desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(36)

<400> 80 10

<210> 81 <211> 1017 <212> ADN 15 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 81

<210> 82 <211> 338 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 82 10

<210> 83 <211> 3024 <212> ADN 15 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 83

<210> 84 5 <211> 1007 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental 10

<221> SEÑAL <222> (1)...(30)

<400> 84

<210> 85 <211> 1254 <212> ADN <213> Bacteria 5

<400> 85

<210> 86 <211> 417 <212> PRT 10 <213> Bacteria

<400> 86

<210> 87 <211> 1089 <212> ADN 5 <213> Desconocido

<220> <223> obtenido a partir de una muestra ambiental

<400> 87 10

<210> 88 <211> 362 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(29)

<400> 88

<210> 89 <211> 2541 <212> ADN 5 <213> Bacteria

<400> 89

<210> 90 <211> 846 <212> PRT 5 <213> Bacteria

<220> <221> SEÑAL <222> (1)...(40)

<400> 90 10

<210> 91 <211> 1023 <212> ADN <213> desconocido 5

<220> <223> Obtenido a partir de una muestra ambiental

<400> 91

<210> 92 10 <211> 340 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental 15

<400> 92

<210> 93 <211> 1011 <212> ADN 5 <213> desconocido

<220> <223> obtenido a partir de una muestra ambiental

<400> 93 10

<210> 94 <211> 336 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<400> 94

<210> 95 <211> 1143 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 95 10

<210> 96 <211> 380 <212> PRT 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(24)

<400> 96 5

<210> 97 <211> 1407 <212> ADN <213> desconocido 10

<220> <223> Obtenido a partir de una muestra ambiental

<400> 97

<210> 98 <211> 468 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 98 10

<210> 99 <211> 1074 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 99 10

<210> 100 <211> 357 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(33)

<400> 100

<210> 101 <211> 1131 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 101 10

<210> 102 <211> 376

<212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL 5 <222> (1)...(23)

<400> 102 10

<210> 103 <211> 1449 <212> ADN <213> Bacteria

<220> 15 <223> obtenido a partir de una muestra ambiental

<400> 103

<210> 104 <211> 482 <212> PRT 5 <213> Bacteria

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(41) 10

<400> 104

<210> 105 <211> 2793 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 105 10

<210> 106 <211> 930 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(22) 10

<400> 106

<210> 107 <211> 1725 <212> ADN <213> Bacteria 5

<400> 107

<210> 108 10 <211> 574 <212> PRT <213> Bacteria

<400> 108

<210> 109 5 <211> 1242 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 109

<210> 110 5 <211> 413 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental 10

<221> SEÑAL <222> (1)...(26)

<400> 110

<210> 111 <211> 1089 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 111 10

<210> 112 <211> 362 <212> PRT 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 112

<210> 113 5 <211> 1155 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental 10

<400> 113

<210> 114 <211> 384 <212> PRT <213> desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(28)

<400> 114 10

<210> 115 <211> 1362 <212> ADN 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 115

<210> 116 <211> 453 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 116 10

<210> 117 <211> 1437 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 117 10

<210> 118 <211> 478 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 118 10

<210> 119 <211> 2559 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 119 10

<210> 120 <211> 852 <212> PRT 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(33) 20

<400> 120

<210> 121 <211> 1905 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 121 10

<210> 122 <211> 634 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(20) 10

<400> 122

<210> 123 <211> 1200 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 123 10

<210> 124 <211> 399 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(20) 10

<400> 124

<210> 125 <211> 1089 <212> ADN <213> desconocido

<220> 5 <223> obtenido a partir de una muestra ambiental

<400> 125

<210> 126 <211> 362 10 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 126 15

<210> 127 <211> 960 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 127 10

<210> 128 <211> 319 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<400> 128

<210> 129 <211> 3021 <212> ADN 5 <213> Bacteria

<400> 129

<210> 130 <211> 1006 <212> PRT 5 <213> Bacteria

<400> 130

<210> 131 <211> 1218 <212> ADN <213> desconocido 5

<220> <223> Obtenido a partir de una muestra ambiental

<400> 131

<210> 132 10 <211> 405 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental 15

<221> SEÑAL <222> (1)...(26)

<400> 132

<210> 133 <211> 1011 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 133 10

<210> 134 <211> 336 <212> PRT <213> desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental

<400> 134

<210> 135 <211> 1170 10 <212> ADN <213> desconocido

<220> <223> obtenido a partir de una muestra ambiental

<400> 135 15

<210> 136 <211> 389 <212> PRT <213> Desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(25)

<400> 136 10

<210> 137 <211> 1044 <212> ADN 15 <213> Desconocido

<220> <223> obtenido a partir de una muestra ambiental

<400> 137

<210> 138 <211> 347 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 138 10

<210> 139 <211> 1143 <212> ADN 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 139

<210> 140 5 <211> 380 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental 10

<221> SEÑAL <222> (1)...(24)

<400> 140

<210> 141 <211> 1134 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 141 10

<210> 142 <211> 377 <212> PRT <213> desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(25)

<400> 142 10

<210> 143 <211> 3285 <212> ADN 15 <213> Bacteria

<400> 143

<210> 144 5 <211> 1094 <212> PRT <213> Bacteria

<220> <221> SEÑAL 10 <222> (1)...(32)

<400> 144

<210> 145 <211> 1629 <212> ADN <213> Eucariota 5

<400> 145

<210> 146 <211> 542 <212> PRT 10 <213> Eucariota

<400> 146

<210> 147 <211> 1146 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 147

<210> 148 <211> 381 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(28) 10

<400> 148

<210> 149 <211> 1044 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 149 10

<210> 150 <211> 347 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(18)

<400> 150 20

<210> 151 <211> 1131 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 151 10

<210> 152 <211> 376 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(21)

<400> 152

<210> 153 <211> 1020 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 153 10

<210> 154 <211> 339

<212> PRT <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL 5 <222> (1)...(16)

<400> 154

<210> 155 <211> 1836 10 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 155 15

<210> 156 <211> 611 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(21) 10

<400> 156

<210> 157 <211> 645 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 157

<210> 158 <211> 214 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(29) 10

<400> 158

<210> 159 <211> 1041 <212> ADN 15 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 159 20

<210> 160 <211> 346

<212> PRT <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL 5 <222> (1)...(23)

<400> 160 10

<210> 161 <211> 1047 <212> ADN <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<400> 161

<210> 162 <211> 348 <212> PRT <213> desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(32)

<400> 162 10

<210> 163 <211> 1068 <212> ADN 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 163

<210> 164 <211> 355 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(26) 10

<400> 164

<210> 165 15 <211> 1047

<212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 165 5

<210> 166 <211> 348 10 <212> PRT <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL 15 <222> (1)...(23)

<400> 166

<210> 167 <211> 669 <212> ADN <213> desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental

<400> 167

<210> 168 <211> 222 10 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL 15 <222> (1)...(36)

<400> 168

<210> 169 <211> 1041 20 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 169 25

<210> 170 <211> 346 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(24) 10

<400> 170

<210> 171 15 <211> 678 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental 20

<400> 171

<210> 172 <211> 225 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(29) 10

<400> 172 225

<210> 173 <211> 1503 15 <212> ADN <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 173 20

<210> 174 <211> 500 <212> PRT 5 <213> desconocido

<220> <223> obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(22) 10

<400> 174

<210> 175 <211> 1053 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 175 10

<210> 176 <211> 350

<212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL 5 <222> (1)...(27)

<400> 176

<210> 177 <211> 1299 10 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 177 15

<210> 178 <211> 432 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(26) 10

<400> 178

<210> 179 <211> 852 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 179 10

<210> 180 <211> 283 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(19)

<400> 180 20

<210> 181 <211> 1077 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 181 10

<210> 182 <211> 358 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(25)

<400> 182

<210> 183 <211> 1083 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 183 10

<210> 184 <211> 360

<212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL 5 <222> (1)...(32)

<400> 184 10

<210> 185 <211> 684 <212> ADN <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<400> 185

<210> 186 <211> 227 20

<212> PRT <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL 5 <222> (1)...(27)

<400> 186

<210> 187 <211> 642 10 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 187 15

<210> 188 <211> 213 <212> PRT <213> desconocido 20

<220> <223> obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(28)

<400> 188 25

<210> 189 <211> 570 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 189 10

<210> 190 <211> 189 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<400> 190

<210> 191 <211> 1053 <212> ADN <213> desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental

<400> 191 10

<210> 192 <211> 350 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(27)

<400> 192

<210> 193 <211> 840 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 193 10

<210> 194 <211> 279 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(21)

<400> 194

<210> 195 5 <211> 1044 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental 10

<400> 195

<210> 196 <211> 347 <212> PRT 15 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(23) 20

<400> 196

<210> 197 5 <211> 636 <212> ADN <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental 10

<400> 197

<210> 198 <211> 211 <212> PRT 15 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(28) 20

<400> 198

<210> 199 5 <211> 1074 <212> ADN <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental 10

<400> 199

<210> 200 <211> 354 <212> PRT 15 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(30) 20

<400> 200

<210> 201 5 <211> 1002 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental 10

<400> 201

<210> 202 <211> 333 <212> PRT 15 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<210> 203 <211> 687 5 <212> ADN <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 203 10

<210> 204 <211> 228 <212> PRT <213> Desconocido 15

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(30)

<400> 204 20

<210> 205 <211> 1068 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 205 10

<210> 206 <211> 355 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(29)

<400> 206

<210> 207 <211> 633 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 207 10

<210> 208 <211> 210 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(27)

<400> 208

<210> 209 <211> 1194 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 209 10

<210> 210 <211> 398 <212> PRT 15 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(25) 20

<400> 210

<210> 211 5 <211> 1086 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental 10

<400> 211

<210> 212 <211> 361 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(29) 10

<400> 212

<210> 213 <211> 912 <212> ADN <213> desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental

<400> 213

<210> 214 <211> 303 10 <212> PRT <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 214 15

<210> 215 <211> 1065 20 <212> ADN <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 215 25

<210> 216 <211> 354 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(31) 10

<400> 216

<210> 217 <211> 1083 <212> ADN 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 217 5

<210> 218 <211> 360 <212> PRT <213> Desconocido 10

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(29)

<400> 218 15

<210> 219 <211> 1029 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 219 10

<210> 220 <211> 342 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(23)

<400> 220 20

<210> 221 <211> 1044 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 221 10

<210> 222 <211> 347 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(24)

<400> 222 20

<210> 223 <211> 642 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 223 10

<210> 224 <211> 213 <212> PRT <213> desconocido

<220> 15 <223> obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(28)

<400> 224

<210> 225 <211> 1059 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 225 10

<210> 226 <211> 352 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(25)

<400> 226

<210> 227 <211> 747 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 227 10

<210> 228 <211> 248 <212> PRT 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(39) 20

<400> 228

<210> 229 <211> 642 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 229 10

<210> 230 <211> 213 <212> PRT 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(28) 20

<400> 230

<210> 231 <211> 1008 <212> ADN 5 <213> Bacteria

<400> 231 10

<210> 232 <211> 335 <212> PRT <213> Bacteria

<220> 15 <221> SEÑAL <222> (1)...(41)

<400> 232

<210> 233 <211> 1071 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 233 10

<210> 234 <211> 356 <212> PRT 15 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(26)

<400> 234 5

<210> 235 <211> 1539 <212> ADN <213> desconocido 10

<220> <223> Obtenido a partir de una muestra ambiental

<400> 235

<210> 236 <211> 512 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(28) 10

<400> 236

<210> 237 <211> 1269 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 237 10

<210> 238 <211> 422 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(32) 10

<400> 238

<210> 239 <211> 1281 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 239 10

<210> 240 <211> 426 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(30)

<400> 240 20

<210> 241 <211> 1695 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 241 10

<210> 242 <211> 564 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(28) 10

<400> 242

<210> 243 <211> 1272 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 243 10

<210> 244 <211> 423 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(33)

<400> 244

<210> 245 <211> 1263 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 245

<210> 246 <211> 401 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(32) 10

<400> 246

<210> 247 <211> 1044 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 247 10

<210> 248 <211> 347 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<400> 248

<210> 249 <211> 1439 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 249 10

<210> 250 <211> 479 <212> PRT 15 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(33)

<400> 250 5

<210> 251 <211> 555 10 <212> ADN <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 251 15

<210> 252 <211> 184 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 252 10

<210> 253 <211> 1047 <212> ADN <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental

<400> 253

<210> 254 <211> 347 20 <212> PRT <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL 25 <222> (1)...(24)

<400> 254

<210> 255 5 <211> 1137 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental 10

<400> 255

<210> 256 <211> 378 <212> PRT 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<221> SEÑAL <222> (1)...(51)

<400> 256 5

<210> 257 <211> 2694 10 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental

<400> 257 15

<210> 258 5 <211> 897 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental 10

<400> 258

<210> 259 <211> 1143 <212> ADN <213> desconocido

<220> 5 <223> obtenido a partir de una muestra ambiental.

<400> 259

<210> 260 <211> 380 10 <212> PRT <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL 15 <222> (1)...(24)

<400> 260

<210> 261 <211> 1629 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 261 10

<210> 262 <211> 542 <212> PRT 15 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)... (26)

<400> 262 5

<210> 263 <211> 1092 <212> ADN <213> desconocido 10

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 263

<210> 264 5 <211> 363 <212> PRT <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental. 10

<221> SEÑAL <222> (1)...(29)

<400> 264

<210> 265 <211> 996 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 265 10

<210> 266 <211> 331 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental.

<400> 266

<210> 267 <211> 1956 <212> ADN 5 <213> Bacteria

<400> 267

<210> 268 <211> 651 <212> PRT 5 <213> Bacteria

<220> <221> SEÑAL <222> (1)...(30)

<400> 268 10

<210> 269 <211> 1110 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 269 10

<210> 270 <211> 369 <212> PRT 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 270

<210> 271 5 <211> 1128 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental. 10

<400> 271

<210> 272 <211> 375 <212> PRT <213> desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(22)

<400> 272 10

<210> 273 <211> 1134 <212> ADN 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 273

<210> 274 <211> 377 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(74) 10

<400> 274

<210> 275 <211> 1401 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 275 10

<210> 276 <211> 466 <212> PRT 15 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 276 5

<210> 277 <211> 1128 <212> ADN <213> Desconocido 10

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 277

<210> 278 <211> 375 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(19) 10

<400> 278

<210> 279 <211> 786 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 279 10

<210> 280 <211> 261 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(22)

<400> 280 20

<210> 281 <211> 963 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 281 10

<210> 282 <211> 320 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental.

<400> 282

<210> 283 <211> 4161 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 283 10

<210> 284 <211> 1386 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(28) 10

<400> 284

<210> 285 <211> 1569 <212> ADN <213> desconocido 5

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 285 10

<210> 286 <211> 522 <212> PRT <213> desconocido 15

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 286

5

<210> 287 <211> 1695 <212> ADN <213> desconocido

<220> 10 <223> Obtenido a partir de una muestra ambiental.

<400> 287

<210> 288 <211> 564 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(23) 10

<400> 288

<210> 289 <211> 2796 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 289

<210> 290 <211> 931 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(22) 10

<400> 290

<210> 291 <211> 1230 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 291 10

<210> 292 <211> 409 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 292 10

<210> 293 <211> 1002 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 293 10

<210> 294 <211> 333 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental.

<400> 294

<210> 295 <211> 1134 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 295 10

<210> 296 <211> 377 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(26)

<400> 296 20

<210> 297 <211> 1842 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 297 10

<210> 298 <211> 613 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 298 10

<210> 299 <211> 1047 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 299 10

<210> 300 <211> 348 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(24)

<400> 300

<210> 301 <211> 642 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 301 10

<210> 302 <211> 213 <212> PRT 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(28) 20

<400> 302

<210> 303 <211> 1404 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 303 10

<210> 304 <211> 467 <212> PRT 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(74) 20

<400> 304

<210> 305 5 <211> 3705 <212> ADN <213> Bacteria

<400> 305

<210> 306 5 <211> 1234 <212> PRT <213> Bacteria

<220> <221> SEÑAL 10 <222> (1)...(32)

<400> 306

<210> 307 <211> 3729 <212> ADN <213> desconocido 5

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 307

<210> 308 <211> 1242 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 308 10

<210> 309 <211> 1830 <212> ADN <213> desconocido 5

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 309

<210> 310 10 <211> 609 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental. 15

<221> SEÑAL <222> (1)...(20)

<400> 310

<210> 311 <211> 3972 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 311 10

<210> 312 <211> 1323 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(33) 10

<400> 312

<210> 313 <211> 1392 <212> ADN <213> Bacteria 5

<400> 313

<210> 314 <211> 463 <212> PRT 5 <213> Bacteria

<220> <221> SEÑAL <222> (1)...(22)

<400> 314 10

<210> 315 <211> 1224 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 315 10

<210> 316 <211> 407 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(28)

<400> 316

<210> 317 <211> 1695 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 317 10

<210> 318 <211> 564 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 318 10

<210> 319 <211> 1095 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 319 10

<210> 320 <211> 364 <212> PRT 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(27)

<400> 320

<210> 321 5 <211> 1608 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental. 10

<400> 321

<210> 322 <211> 536 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 322 10

<210> 323 <211> 2355 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 323 10

<210> 324 <211> 784 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 324 10

<210> 325 <211> 1146 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 325

<210> 326 <211> 381 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(27) 10

<400> 326

<210> 327 <211> 1500 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 327 10

<210> 328 <211> 499 <212> PRT <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(29)

<400> 328 20

<210> 329 <211> 2268 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 329

<210> 330 <211> 755 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(35) 10

<400> 330

<210> 331 <211> 1242 <212> ADN <213> Desconocido 5

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 331

<210> 332 10 <211> 413 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental. 15

<221> SEÑAL <222> (1)...(28)

<400> 332

<210> 333 <211> 1152 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 333 10

<210> 334 <211> 383 <212> PRT 15 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(30)

<400> 334 5

<210> 335 <211> 849 <212> ADN <213> desconocido 10

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 335

<210> 336 15 <211> 282

<212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL 5 <222> (1)...(50)

<400> 336 10

<210> 337 <211> 870 <212> ADN <213> Desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental.

<400> 337

<210> 338 <211> 289 20 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 338 25

<210> 339 5 <211> 1125 <212> ADN <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental. 10

<400> 339

<210> 340 <211> 374 <212> PRT 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(23) 20

<400> 340

<210> 341 5 <211> 1347 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental. 10

<400> 341

<210> 342 <211> 448 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(45) 10

<400> 342

<210> 343 <211> 2217 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 343

<210> 344 <211> 738 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 344 10

<210> 345 <211> 849 <212> ADN <213> Desconocido 5

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 345

<210> 346 10 <211> 282 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental. 15

<400> 346

<210> 347 <211> 1794 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 347 10

<210> 348 <211> 597 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(20)

<400> 348

<210> 349 <211> 1794 <212> ADN <213> desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental.

<400> 349

<210> 350 <211> 597 10 <212> PRT <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL 15 <222> (1)...(20)

<400> 350

<210> 351 <211> 1860 5 <212> ADN <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 351 10

<210> 352 <211> 619 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(73) 10

<400> 352

<210> 353 <211> 1983 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 353

<210> 354 <211> 660 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(18) 10

<400> 354

<210> 355 <211> 1125 5 <212> ADN <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 355 10

<210> 356 <211> 374 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(21) 10

<400> 356

<210> 357 <211> 1155 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 357 10

<210> 358 <211> 384 <212> PRT <213> desconocido

<220> 15 <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(25)

<400> 358 20

<210> 359 <211> 2724 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 359 10

<210> 360 <211> 908 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(31) 10

<400> 360

<210> 361 <211> 5040 <212> ADN <213> desconocido 5

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 361

<210> 362 <211> 1680 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(26) 10

<400> 362

<210> 363 <211> 1317 5

<212> ADN <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 363 5

<210> 364 <211> 438 <212> PRT <213> Desconocido 10

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 364

<210> 365 <211> 3246 <212> ADN 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 365 10

<210> 366 <211> 1081 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(65) 10

<400> 366

<210> 367 <211> 1338 <212> ADN <213> desconocido 5

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 367 10

<210> 368 <211> 445 <212> PRT <213> Desconocido

<220> 5 <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(23)

<400> 368 10

<210> 369 <211> 1077 <212> ADN 15 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 369

<210> 370 <211> 358 <212> PRT 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<221> SEÑAL <222> (1)...(27) 10

<400> 370

<210> 371 15 <211> 1245

<212> ADN <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 371 5

<210> 372 <211> 415 <212> PRT <213> desconocido 10

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 372

<210> 373 <211> 1539 <212> ADN 5 <213> Desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 373 10

<210> 374 <211> 512 <212> PRT 5 <213> desconocido

<220> <223> Obtenido a partir de una muestra ambiental.

<400> 374 10

<210> 375 <211> 570 <212> ADN 5 <213> Secuencia Artificial

<220> <223> Polinucleótido generado sintéticamente

<400> 375 10

<210> 376 <211> 189 <212> PRT <213> Secuencia artificial

<220> 15 <223> Polipéptido generado sintéticamente

<400> 376

<210> 377 <211> 570 <212> ADN 5 <213> Secuencia Artificial

<220> <223> Polinucleótido generado sintéticamente

<400> 377 10

<210> 378 <211> 189 <212> PRT <213> Secuencia Artificial

<220> 15 <223> Polipéptido generado sintéticamente

<400> 378 20

<210> 379 <211> 570 <212> ADN <213> Secuencia Artificial

<220> 25 <223> Polinucleótido generado sintéticamente.

<400> 379

<210> 380 <211> 189 <212> PRT 5 <213> Secuencia Artificial

<220> <223> Polipéptido generado sintéticamente.

<400> 380 10

Claims

REIVINDICACIONES

1. Un ácido nucleico, sintético o recombinante, aislado que comprende:

(a) un ácido nucleico que codifica al menos un polipéptido que tiene una actividad xilanasa, donde el ácido nucleico comprende una secuencia que tiene al menos 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, o más, o 5 tiene 100% de identidad de secuencia con el SEQ ID NO: 159, o que codifica un fragmento enzimáticamente activo del polipéptido;

(b) un ácido nucleico que codifica al menos un polipéptido que tiene una actividad xilanasa, donde el ácido nucleico comprende una secuencia que hibrida en condiciones restrictivas con un ácido nucleico que comprende la secuencia del SEQ ID NO: 159; 10

donde las condiciones restrictivas comprenden una etapa de lavado que comprende un lavado en 0,2X SSC a una temperatura de alrededor de 65°C durante alrededor de 15 minutos;

(c) un ácido nucleico que codifica un polipéptido que tiene actividad xilanasa, donde el polipéptido comprende la secuencia de aminoácidos del SEQ ID NO: 160;

o 15

(d) un ácido nucleico que comprende una secuencia completamente complementaria a cualquiera de (a) a (c);

donde la actividad xilanasa comprende una capacidad para reducir la demanda ClO2 cuando se utiliza para pretratar pasta Kraft.
2. Un ácido nucleico sintético o recombinante, aislado que comprende un ácido nucleico del SEQ ID NO 159, donde 20 el ácido nucleico codifica un polipéptido que tiene actividad xilanasa.
3. El ácido nucleico de reivindicación 1 o 2 que codifica una xilanasa que carece de una secuencia señal o modulo de unión a carbohidrato.
4. El ácido nucleico de cualquiera de reivindicaciones 1 a 3 que codifica una xilanasa y que comprende adicionalmente una secuencia heteróloga no asociada naturalmente con el ácido nucleico de cualquiera de las reivindicaciones 1 a 3.
5. El ácido nucleico de reivindicación 4, donde la secuencia heteróloga comprende: una secuencia señal, un modulo 30 de unión a carbohidrato, un dominio catalítico (CD), una secuencia conectora, un dominio de detección o purificación, o una de sus combinaciones.
6. Una sonda de ácido nucleico para identificar, detectar o aislar un ácido nucleico que codifica un polipéptido con una actividad xilanasa, donde la sonda comprende la secuencia de reivindicación 1 o 2, 35

donde la sonda identifica, detecta o aísla el ácido nucleico mediante unión o hibridación.
7. Un par de cebadores de amplificación, donde el par de cebadores comprende un primer miembro que tiene una secuencia como la mostrada mediante al menos alrededor de 10 a 50 bases consecutivas de, o alrededor de los primeros (los 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 o más residuos de la 40 secuencia de reivindicación 1 o 2;

y un segundo miembro que tiene una secuencia como la mostrada mediante al menos alrededor de 10 a 50 bases de la hebra complementaria consecutivas del primer miembro, o alrededor de los primeros (los 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 o más residuos de la hebra complementaria del primer miembro.
8. Un ácido nucleico que codifica una xilanasa recombinante generado mediante amplificación de un polinucleótido utilizando un par de cebadores de amplificación que comprende un par de cebadores de amplificación como los mostrados en la reivindicación 7, donde el ácido nucleico codifica al menos un polipéptido que tiene una actividad xilanasa que comprende una capacidad para reducir la demanda de ClO2 cuando se utiliza para pretratar pasta Kraft. 50
9. Una xilanasa sintética o recombinante, aislada codificada por la secuencia de ácido nucleico de la reivindicación 8.
10. Un método para amplificar un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa que 55 comprende la amplificación de un ácido nucleico molde con un par de cebadores de amplificación capaces de amplificar la secuencia de ácido nucleico de la reivindicación 1 o 2, o una subsecuencia del mismo; donde el par de cebadores de amplificación comprende el par de cebadores de amplificación de la reivindicación 7.
11. Un casete de expresión, un vector o un vehículo de clonación que comprende un ácido nucleico que 60 comprende la secuencia de ácido nucleico de la reivindicación 1 o 2.
12. Una célula transformada que comprende:

(a) la secuencia de ácido nucleico de la reivindicación 1 o 2;

(b) el casete de expresión casete de expresión, vector o vehículo de clonación de la reivindicación 11;

(c) un ácido nucleico que codifica el polipéptido de la reivindicación 14.
13. Un animal no humano transgénico o planta transgénica o grano transgénico que comprende:

(a) la secuencia de ácido nucleico de la reivindicación 1 o 2; 5

(b) el casete de expresión casete de expresión, vector o vehículo de clonación de la reivindicación 11;

(c) un ácido nucleico que codifica el polipéptido de la reivindicación 14.
14. Un polipéptido sintético o recombinante, aislado que tiene actividad xilanasa, donde el polipéptido comprende una secuencia de aminoácidos: 10

(a) que tiene al menos 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, o más, o tiene 100% de identidad de secuencia con la secuencia de aminoácidos del SEQ ID NO: 160, o un fragmento enzimáticamente activo de la misma, donde la actividad xilanasa comprende una capacidad para reducir la demanda de ClO2 cuando se utiliza para pretratar pasta Kraft; o

(b) codificada por un ácido nucleico que tiene una secuencia como la mostrada en la reivindicación 1 o 2. 15
15. Un polipéptido sintético o recombinante, aislado que comprende una secuencia de aminoácidos del SEQ ID NO: 160, donde el polipéptido tiene actividad xilanasa.
16. El polipéptido de la reivindicación 14 o 15, pero que carece de una secuencia señal o modulo de unión a 20 carbohidrato.
17. El polipéptido de cualquiera de las reivindicaciones 14 a 16, que comprende adicionalmente una secuencia heteróloga no asociada naturalmente con el polipéptido de cualquiera de las reivindicaciones 14 a 16.
18. El polipéptido de la reivindicación 17, donde la secuencia heteróloga comprende una secuencia señal, un modulo de unión a carbohidrato, un dominio catalítico (CD), una secuencia conectora, un dominio de detección o purificación, o una de sus combinaciones.
19. El polipéptido de cualquiera de las reivindicaciones 14 a 18, que comprende adicionalmente al menos un sitio de 30 glicosilación.
20. Una preparación de proteína que comprende:

(a) un polipéptido codificado por la secuencia de ácido nucleico de la reivindicación 1 o 2;

(b) el polipéptido de la reivindicación 14 o 15. 35
21. Un heterodímero que comprende (a) un polipéptido codificado por una secuencia de ácido nucleico de la reivindicación 1 o 2 o el polipéptido de la reivindicación 14 o 15; y (b) un segundo dominio.
22. Un homodímero que comprende (a) un polipéptido codificado por una secuencia de ácido nucleico de la 40 reivindicación 1 o 2; el polipéptido de la reivindicación 14 o 15; y (b) un segundo dominio.
23. Un polipéptido inmovilizado, donde el polipéptido comprende:

(a) un polipéptido codificado por la secuencia de ácido nucleico de la reivindicación 1 o 2;

(b) el polipéptido de la reivindicación 14 o 15. 45
24. Una matriz, micromatriz, biochip o chip que comprende

(a) el polipéptido inmovilizado de la reivindicación 23, o un ácido nucleico inmovilizado que comprende la secuencia de ácido nucleico de la reivindicación 1 o 2.
25. Un anticuerpo sintético o recombinante, aislado que se une específicamente a un polipéptido:

(a) un polipéptido codificado por la secuencia de ácido nucleico de la reivindicación 1 o 2;

(b) el polipéptido de la reivindicación 14 o 15.
26. A hibridoma que comprende un anticuerpo que se une específicamente a un polipéptido: 55

(a) un polipéptido codificado por la secuencia de ácido nucleico de la reivindicación 1 o 2;

(b) el polipéptido de la reivindicación 14 o 15.
27. Un método de aislar o identificar un polipéptido con una actividad xilanasa que comprende las etapas de:

(a) proporcionar un anticuerpo como se muestra en la reivindicación 25; (b) proporcionar una muestra que 60 comprende polipéptidos; y (c) poner en contacto la muestra de la etapa (b) con el anticuerpo de la etapa (a) en condiciones en las que el anticuerpo se puede unir específicamente al polipéptido, aislando o identificando de ese modo un polipéptido que tiene una actividad xilanasa.
28. Un método para elaborar un anticuerpo anti-xilanasa que comprende administrar a un animal no humano; (a) el ácido nucleico de la reivindicación 1 o 2, o una subsecuencia del mismo, en una cantidad suficiente para generar una respuesta inmunitaria humoral, elaborando de ese modo un anticuerpo anti-xilanasa; o, (b) un polipéptido de la reivindicación 14 o 15, en una cantidad suficiente para generar una respuesta inmunitaria humoral, elaborando de ese modo un anticuerpo anti-xilanasa. 5
29. Un método para producir un polipéptido recombinante que comprende las etapas de: (a) proporcionar un ácido nucleico conectado operablemente a un promotor, donde el ácido nucleico comprende la secuencia de ácido nucleico de la reivindicación 1 o 2, o el ácido nucleico que codifica el polipéptido de la reivindicación 14 o 15; y (b) expresar el ácido nucleico de la etapa (a) en condiciones que permitan la expresión del polipéptido, produciendo de 10 ese modo un polipéptido recombinante.
30. El método de la reivindicación 29 que comprende adicionalmente transformar una célula anfitriona con el ácido nucleico de la etapa (a) seguido de la expresión del ácido nucleico de la etapa (a), produciendo de ese modo un polipéptido recombinante en una célula transformada. 15
31. Un método para identificar un sustrato de xilanasa que comprende las siguientes etapas: (a) proporcionar un polipéptido de la reivindicación 14 o 15, o codificado por la secuencia de ácido nucleico de la reivindicación 1 o 2; (b) proporcionar un sustrato de ensayo; y (c) poner en contacto el polipéptido de la etapa (a) con el sustrato de ensayo de la etapa (b) y detectar un descenso en la cantidad de sustrato o un incremento en la cantidad de producto 20 de reacción, donde un descenso en la cantidad del sustrato o un incremento en la cantidad de un producto de reacción identifica el sustrato de ensayo como un sustrato de xilanasa.
32. Un método para determinar si un compuesto de ensayo se une específicamente a un polipéptido que comprende las siguientes etapas: 25

(A) (a) expresar un ácido nucleico o un vector que comprende el ácido nucleico en condiciones permisivas para la traducción del ácido nucleico a un polipéptido, donde el ácido nucleico tiene la secuencia de ácido nucleico de la reivindicación 1 o 2; (b) proporcionar un compuesto de ensayo; (c) poner en contacto el polipéptido con el compuesto de ensayo; y (d) determinar si el compuesto de ensayo de la etapa (b) se une específicamente al polipéptido; o, 30

(B) (a) proporcionar un polipéptido de la reivindicación 14 o 15; (b) proporcionar un compuesto de ensayo; (c) poner en contacto el polipéptido con el compuesto de ensayo; y (d) determinar si el compuesto de ensayo de la etapa (b) se une específicamente al polipéptido.
33. Un método para identificar un modulador de una actividad xilanasa que comprende las siguientes etapas: 35 (a) proporcionar un polipéptido de la reivindicación 14 o 15; (b) proporcionar un compuesto de ensayo; (c) poner en contacto el polipéptido de la etapa (a) con el compuesto de ensayo de la etapa (b) y medir una actividad de la xilanasa, donde un cambio en la actividad xilanasa medida en presencia del compuesto de ensayo en comparación con la actividad en ausencia del compuesto de ensayo proporciona una determinación de que el compuesto de ensayo modula la actividad xilanasa. 40
34. Un método para aislar, detectar o recuperar un ácido nucleico que codifica un polipéptido con una actividad xilanasa de una muestra que comprende las etapas de:

(a) proporcionar el par de cebadores de amplificación de la reivindicación 7 o la sonda de la reivindicación 6; (b) aislar un ácido nucleico de la muestra o tratar la muestra de manera que el ácido nucleico en la muestra sea 45 accesible para la hibridación al par de cebadores de amplificación o sonda; y, (c) combinar el ácido nucleico de la etapa (b) con el par de cebadores de amplificación o sonda de la etapa (a) y amplificar o identificar un ácido nucleico de la muestra, aislando, detectando o recuperando de este modo un ácido nucleico que codifica un polipéptido con una actividad xilanasa a partir de la muestra.
35. Un método para incrementar la termotolerancia o termoestabilidad de una xilanasa, comprendiendo el método la glicosilación una xilanasa, donde la xilanasa comprende al menos 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 250, 300 o más residuos de aminoácidos continuos de un polipéptido que tiene una actividad xilanasa que comprende la secuencia de aminoácidos de la reivindicación 14 o 15, incrementando de ese modo la termotolerancia o termoestabilidad de la xilanasa. 55
36. Un método para elaborar una molécula pequeña que comprende las siguientes etapas: (a) proporcionar una pluralidad de enzimas biosintéticas capaces de sintetizar o modificar una molécula pequeña, donde una de las enzimas comprende una enzima xilanasa codificada por la secuencia de ácido nucleico de la reivindicación 1 o 2; (b) proporcionar un sustrato para al menos una de las enzimas de la etapa (a); y (c) hacer reaccionar el sustrato de la 60 etapa (b) con las enzimas en condiciones que faciliten una pluralidad de reacciones biocatalíticas para generar una molécula pequeña mediante una serie de reacciones biocatalíticas.
37. Un método para modificar una molécula pequeña que comprende las siguientes etapas: (a) proporcionar una enzima xilanasa, donde la enzima comprende un polipéptido la secuencia de aminoácidos de la reivindicación de la reivindicación 14 o 15, o un polipéptido codificado por un ácido nucleico que comprende la secuencia de ácido nucleico de la reivindicación 1 o 2; (b) proporcionar un molécula pequeña; y (c) hacer reaccionar la enzima de la etapa (a) con la molécula pequeña de la etapa (b) en condiciones que faciliten una reacción enzimática catalizada 5 por la enzima xilanasa, modificando de ese modo una molécula pequeña by una reacción enzimática de xilanasa.
38. Un método para producir una biblioteca de ácidos nucleicos que codifican una pluralidad de sitios activos de xilanasa modificados o sitios de unión al sustrato, donde los sitios activos modificados o sitios de unión al sustrato derivan de un primer ácido nucleico que comprende una secuencia que codifica un primer sitio 10 activo o un primer sitio de unión al sustrato comprendiendo el método las siguientes etapas:

(a) proporcionar un primer ácido nucleico que codifica un primer sitio activo o primer sitio de unión al sustrato, donde la primera secuencia de ácido nucleico comprende la secuencia de ácido nucleico de la reivindicación 1 o 2, y el ácido nucleico codifica un sitio activo de xilanasa o un sitio de unión al sustrato de xilanasa;

(b) proporcionar un conjunto de oligonucleótidos mutagénicos que codifican variantes de aminoácidos de origen 15 natural a una pluralidad de codones elegidos como diana en el primer ácido nucleico; y,

(c) utilizar el conjunto de oligonucleótidos mutagénicos para generar un conjunto de ácidos nucleicos variantes que codifican el sitio activo o codifican el sitio de unión al sustrato que codifican una variedad de variaciones de aminoácido en cada codón de aminoácido que fue mutagenizado, produciendo de ese modo una biblioteca de ácidos nucleicos que codifican una pluralidad de sitios activos de xilanasa modificados o sitios de unión al 20 sustrato.
39. Un método para determinar un fragmento funcional de una enzima xilanasa que comprende las etapas de: (a) proporcionar una enzima xilanasa, donde la enzima comprende un polipéptido que tiene la secuencia de aminoácidos de la reivindicación 14 o 15, o un polipéptido codificado por la secuencia de ácido nucleico de la 25 reivindicación 1 o 2; y, (b) suprimir una pluralidad de residuos de aminoácidos de la secuencia de la etapa (a) y someter a ensayo la subsecuencia restante para determinar una actividad xilanasa, determinando de ese modo un fragmento funcional de una enzima xilanasa.
40. Un método para construir una célula completa de fenotipos nuevos o modificados utilizando análisis de 30 flujo metabólico en tiempo real, comprendiendo el método las siguientes etapas: (a) elaborar una célula modificada modificando la composición genética de una célula, donde la composición genética es modificada mediante la adición a la célula de un ácido nucleico que comprende la secuencia de ácido nucleico de la reivindicación 1 o 2; (b) cultivar la célula modificada para generar una pluralidad de células modificadas; (c) medir al menos un parámetro metabólico de la célula controlando el cultivo celular de la etapa (b) en tiempo real; y, (d) analizar los datos de la 35 etapa (c) para determinar si el parámetro método difiere de una medición comparable en una célula no modificada en condiciones similares, identificando de ese modo un fenotipo construido en la célula utilizando análisis de flujo metabólico en tiempo real.
41. Un método para expresar en exceso una xilanasa recombinante en una célula que comprende expresar un 40 vector que comprende la secuencia de ácido nucleico de la reivindicación 1 o 2.
42. Un método para elaborar una planta transgénica que comprende las siguientes etapas:

(a) introducir una secuencia de ácido nucleico heteróloga en la célula, donde la secuencia de ácido nucleico heteróloga comprende la secuencia de ácido nucleico de la reivindicación 1 o 2; (b) producir una planta 45 transgénica a partir de la célula transformada.
43. Un método para expresar una secuencia de ácido nucleico heteróloga en una célula vegetal que comprende las siguientes etapas: (a) transformar la célula vegetal con una secuencia de ácido nucleico heteróloga conectado operablemente a un promotor, donde la secuencia de ácido nucleico heteróloga comprende la secuencia 50 de ácido nucleico de la reivindicación 1 o 2; (b) cultivar la planta en condiciones en las que la secuencia de ácido nucleico heteróloga se exprese en la célula vegetal.
44. Un método para hidrolizar, romper o desorganizar una composición que comprende xilano que comprende las siguientes etapas: (a) proporcionar un polipéptido de la reivindicación 14 o 15, o un polipéptido que 55 tiene una actividad xilanasa codificada por la secuencia de ácido nucleico de la reivindicación 1 o 2; (b) proporcionar un composición que comprende un xilano; y (c) poner en contacto el polipéptido de la etapa (a) con la composición de la etapa (b) en condiciones en las que la xilanasa hidroliza, rompe o desorganiza la composición que comprende xilano.
45. Un método para reducir lignina en una madera, un producto de madera, una pasta de madera, una pasta Kraft, un papel, un producto de papel, una pasta de papel, o una de sus combinaciones, que comprende: (i) poner en contacto la madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el producto de

papel, el producto de pasta de papel, o una de sus combinaciones, con al menos un polipéptido de la reivindicación 14 o 15 o un polipéptido codificado por la secuencia de ácido nucleico de la reivindicación 1 o 2.
46. Un método para reducir una lignina en una madera, un producto de madera, una pasta de madera, una pasta Kraft, un papel, un producto de papel, una pasta de papel, o una de sus combinaciones, en condiciones 5 de alta temperatura y de pH alcalino, comprendiendo el método las siguientes etapas:

(a) proporcionar al menos un polipéptido de la reivindicación 14 o 15 o un polipéptido codificado por la secuencia de ácido nucleico de la reivindicación 1 o 2;

(b) proporcionar:

(i) una composición que comprende una madera, producto de madera, pasta de madera, pasta Kraft, papel, 10 producto de papel, pasta de papel que comprenden lignina o una de sus combinaciones, o

(ii) una composición que comprende una madera blanda y/o una madera dura, o derivada de una madera blanda y/o una madera dura; y

(c) poner en contacto la composición de (b) con el polipéptido de la etapa (a) en condiciones que comprenden una temperatura de 60-85°C y pH 10, donde el polipéptido reduce la lignina en la madera, el producto de 15 madera, la pasta de madera, la pasta Kraft, el papel, el producto de papel, la pasta de papel, o una de sus combinaciones, o

(d) el método de (c), donde el polipéptido cataliza la degradación de un enlace de hemicelulosa de la lignina en la madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el producto de papel, la pasta de papel, o una de sus combinaciones, liberando de ese modo lignina. 20
47. Un método para tratar una madera, un producto de madera, una pasta de madera, una pasta Kraft, un papel, un producto de papel, una pasta de papel, o una de sus combinaciones, en condiciones de alta temperatura y pH alcalino, comprendiendo el método las siguientes etapas:

(a) proporcionar al menos un polipéptido de la reivindicación 14 o 15 o un polipéptido codificado por la 25 secuencia de ácido nucleico de la reivindicación 1 o 2;

(b) proporcionar

(i) una composición que comprende una madera, un producto de madera, una pasta de madera, una pasta Kraft, un papel, un producto de papel, una pasta de papel o una de sus combinaciones, o

(ii) una composición que comprende una madera blanda y/o una madera dura, o derivada de una madera 30 blanda y/o una madera dura; y

(c) poner en contacto la composición de (b) con el polipéptido de la etapa (a) en condiciones que comprenden una temperatura de 60-85°C y pH 10, donde el polipéptido cataliza la hidrólisis de los compuestos en la madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el producto de papel, la pasta de papel, o una de sus combinaciones. 35
48. Un método para blanquear una madera, un producto de madera, una pasta de madera, una pasta Kraft, un papel, un producto de papel, una pasta de papel, o una de sus combinaciones, en condiciones de alta temperatura y pH alcalino, comprendiendo el método las siguientes etapas:

(a) proporcionar al menos un polipéptido de la reivindicación 14 o 15 o un polipéptido codificado por la 40 secuencia de ácido nucleico de la reivindicación 1 o 2;

(b) proporcionar una madera, un producto de madera, una pasta de madera, una pasta Kraft, un papel, un producto de papel, una pasta de papel o una de sus combinaciones; y

(c) poner en contacto la madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el producto de papel, la pasta de papel o una de sus combinaciones; con el polipéptido de la etapa (a) en condiciones que 45 comprenden una temperatura de 60-85°C y pH 10, donde el polipéptido cataliza la hidrólisis de los compuestos en la madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el producto de papel, la pasta de papel, o una de sus combinaciones.
49. Un método para reducir el uso de agentes químicos de blanqueo en un procedimiento de blanqueo de 50 una madera, un producto de madera, una pasta de madera, una pasta Kraft, un papel, un producto de papel, una pasta de papel, o una de sus combinaciones, en condiciones de alta temperatura y pH alcalino, comprendiendo el método las siguientes etapas:

(a) proporcionar al menos un polipéptido de la reivindicación 14 o 15 o un polipéptido codificado por la secuencia de ácido nucleico de la reivindicación 1 o 2; 55

(b) proporcionar una madera, un producto de madera, una pasta de madera, una pasta Kraft, un papel, un producto de papel, una pasta de papel o una de sus combinaciones; y

(c) poner en contacto la madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el producto de papel, la pasta de papel o una de sus combinaciones; con el polipéptido de la etapa (a) en condiciones que comprenden una temperatura de 60-85°C y pH 10, 60

donde el polipéptido cataliza la hidrólisis de compuestos en la madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el producto de papel, la pasta de papel o una de sus combinaciones, bioblanqueando de ese modo la madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el

producto de papel, la pasta de papel o una de sus combinaciones, y reduciendo el uso de agentes químicos de blanqueo en el procedimiento de blanqueo; o

(d) el método de (c), donde el agente de blanqueo químico comprende un cloro, un dióxido de cloro, un compuesto cáustico, un peróxido, o cualquiera de sus combinaciones.
50. Un método para liberar una lignina de una madera, un producto de madera, una pasta de madera, una pasta Kraft, un papel, un producto de papel, una pasta de papel, o una de sus combinaciones, en condiciones de alta temperatura y pH alcalino, comprendiendo el método las siguientes etapas:

(a) proporcionar al menos un polipéptido de la reivindicación 14 o 15 o un polipéptido codificado por la secuencia de ácido nucleico de la reivindicación 1 o 2; 10

(b) proporcionar una madera, producto de madera, pasta de madera, pasta Kraft, papel, producto de papel, pasta de papel que comprenden lignina, o una de sus combinaciones; y

(c) poner en contacto la madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el producto de papel, la pasta de papel o una de sus combinaciones, de la etapa (b) con el polipéptido de la etapa (a) en condiciones que comprenden una temperatura de 60-85°C y pH 10, donde el polipéptido cataliza la hidrólisis de 15 compuestos en la madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el producto de papel, la pasta de papel o una de sus combinaciones, facilitando de ese modo la liberación de lignina a partir de la madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el producto de papel, la pasta de papel o una de sus combinaciones; o

(d) el método de (c), donde el polipéptido cataliza la degradación de un enlace hemicelulosa de la lignina en la 20 madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el producto de papel, la pasta de papel o una de sus combinaciones, liberando de ese modo lignina.
51. Una composición que comprende:

una madera, un producto de madera, una pasta de madera, una pasta Kraft, un papel, un producto de papel, 25 una pasta de papel, o una de sus combinaciones y

un polipéptido de la reivindicación 14 o 15, o un polipéptido codificado por la secuencia de ácido nucleico de la reivindicación 1 o 2.
52. Un método para tratar una madera, un producto de madera, una pasta de madera, una pasta Kraft, un 30 papel, un producto de papel, una pasta de papel, o una de sus combinaciones, que comprende

poner en contacto la madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el producto de papel, la pasta de papel o una de sus combinaciones, con al menos un polipéptido de la reivindicación 14 o 15, o un polipéptido codificado por la secuencia de ácido nucleico de la reivindicación 1 o 2.
53. Un método para blanquear una madera, un producto de madera, una pasta de madera, una pasta Kraft, un papel, un producto de papel, una pasta de papel, o una de sus combinaciones, que comprende

poner en contacto la madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el producto de papel, la pasta de papel o una de sus combinaciones, con al menos un polipéptido de la reivindicación 14 o 15 o un polipéptido codificado por la secuencia de ácido nucleico de la reivindicación 1 o 2. 40
54. Un método para reducir el uso de agentes químicos de blanqueo en un procedimiento de blanqueo de una madera, un producto de madera, una pasta de madera, una pasta Kraft, un papel, un producto de papel, una pasta de papel, o una de sus combinaciones, que comprende:

poner en contacto la madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el producto de 45 papel, la pasta de papel o una de sus combinaciones, con al menos un polipéptido de la reivindicación 14 o 15 o un polipéptido codificado por la secuencia de ácido nucleico de la reivindicación 1 o 2.
55. Un método para liberar una lignina de una madera, un producto de madera, una pasta de madera, una pasta Kraft, un papel, un producto de papel, una pasta de papel, o una de sus combinaciones, que comprende: 50

poner en contacto la madera, el producto de madera, la pasta de madera, la pasta Kraft, el papel, el producto de papel, la pasta de papel o una de sus combinaciones, con al menos un polipéptido de la reivindicación 14 o 15 o un polipéptido codificado por la secuencia de ácido nucleico de la reivindicación 1 o 2.