ES2349573T3

ES2349573T3 - Métodos de generación de matrices de expresión de proteínas y el uso de las mismas en detección rápida.

Info

Publication number: ES2349573T3
Application number: ES01902520T
Authority: ES
Inventors: Michelle Anne Mulder; Mitali Samaddar; Roland Z. Sense Proteomic Ltd. KOZLOWSKI; John David Sutherland; Jonathon Michael Sense Proteomic Limited BLACKBURN
Original assignee: Sense Proteomic Ltd
Current assignee: Sense Proteomic Ltd
Priority date: 2000-01-31
Filing date: 2001-01-31
Publication date: 2011-01-05
Anticipated expiration: 2021-01-31
Also published as: GB0002215D0

Abstract

Un método para generar una selección de proteínas que consiste en: (a)proporcionar un conjunto de moléculas de ADN codificadoras de proteínas que se etiquetan bien en la terminal N o C con una porción de molécula marcadora; (b)expresar las proteínas individuales etiquetadas en un formato especialmente separado; (c) purificar e inmovilizar cada proteína etiquetada en un formato espacialmente definido para producir una selección de proteínas sobre un soporte sólido, y de este modo las interacciones específicas entre la etiqueta y el soporte sólido se usan tanto en la purificación como en la inmovilización.

Description

La presente invención hace referencia a nuevos métodos para generar selecciones de expresión de proteínas, así como el uso de dichas selecciones en rápidas revisiones médicas.

Los proyectos relativos al mapeo genómico están revolucionando el proceso de descubrimiento de objetivos terapéuticos y con ello el proceso de descubrimiento de fármacos. A medida que se identifican nuevos objetivos terapéuticos, el análisis de una elevada producción de bibliotecas químicas existentes y combinatorias sugerirá muchos compuestos principales potenciales que son activos contra estos objetivos. Claramente, no resulta económico perseguir todos los compuestos principales incluso a través de ensayos clínicos en la primera fase; sin embargo, actualmente no existen métodos rápidos para evaluar tales compuestos principales en términos de sus perfiles de posible actividad contra todas las proteínas en el organismo. Si estuviera disponible, este método permitiría potenciales perfiles de toxicología de todos los compuestos principales que van a analizarse en una primera fase y esta información mejoraría en gran medida el proceso de decidir qué compuestos buscar y qué compuestos dejar de lado.

Existe una necesidad complementaria en la industria farmacéutica por identificar todos los objetivos de fármacos existentes (ya disponibles en el mercado o aún en desarrollo) y, a partir de ello, definir su mecanismo de acción. La disponibilidad de esta información facilitará enormemente el proceso de conseguir aprobación reguladora para nuevos fármacos ya que está muy claro que los cuerpos reguladores ahora consideran que un conocimiento del mecanismo de acción es de primordial importancia. Además, este tipo de información permitía diseñar mejores fármacos de segunda generación. Esto se deduce porque la mayoría de los fármacos tienen al menos efectos secundarios menores, que probablemente son el resultado de combinar el fármaco o un metabolito del mismo con objetivos no deseados; todas estas proteínas objetivos necesitan ser identificadas con el fin de definir los criterios necesarios para diseñar fármacos mejorados. Sin embargo, en la actualidad, no existen métodos simples para generar esta información y un gran número de fármacos potenciales que cuestan millones de dólares se quedan por el camino simplemente por falta de conocimiento del objetivo de acción.

Las interacciones proteína-proteína se están reconociendo cada vez más por ser de vital importancia al determinar las respuestas celulares para tensiones tanto internas como externas. Por lo tanto, las interacciones específicas proteína-proteína representan objetivos potenciales para la intervención mediada por fármacos en infecciones y otros estados de enfermedad. Actualmente, el ensayo de doble híbrido en levadura es el único método fiable para evaluar las interacciones proteína-proteína pero los ensayos in vivo de este tipo no serán fácilmente compatibles incluso en un formato de baja productividad con la identificación de agonistas o antagonistas específicos de interacciones proteína-proteína. Las selecciones de expresión proteómica funcional, o “chips de proteoma”, permitirán la especificidad de las interacciones proteína-proteína y la especificidad de cualquier efecto mediado por el fármaco que se determinará en un formato in vitro. Por lo tanto, tendrán un enorme potencial porque simplemente revolucionarán esta área de investigación.

Un modo en el que las selecciones proteómicas funcionales podrían generarse es para individualmente clonar, expresar, purificar e inmovilizar todas las proteínas expresadas en el proteoma específico. Sin embargo, aquí una importante consideración inicial concierne el tamaño absoluto del genoma de interés junto con las consideraciones sobre la disponibilidad de datos secuenciales para el genoma completo. A modo de ilustración de estos puntos, un genoma bacteriano habitual tiene ~5Mbp y ahora se han secuenciado completamente un pequeño número (por ejemplo Helicobacter pylori, Escherichia coli y Mycobacterium tuberculosis); los genomas fúngicos tienen normalmente ~40Mbp, genomas de mamíferos en ~3Gbp y genomas de plantas en ~10GBP. Las estimaciones actuales establecen que la secuencia de genoma humano acabará alrededor de 2003, aunque se cuestiona que mucha de esta información llegue al dominio público. Claramente, no resulta nada práctico esperar que los genomas de elementos diferentes a los organismos que sirven de modelo representativo se encontrarán disponibles en un plazo de tiempo real, ya que desde la perspectiva de proteómica funcional, los organismos modelos solamente tienen un valor limitado. De modo que, mientras en principio durante los próximos cuatro años puede ser posible diseñar y sintetizar cebadores para clonar cada uno de los ~100,000 genes en el genoma humano a partir de bibliotecas de ADN, en la práctica resultará muy caro (el coste sólo de los cebadores ronda varios millones de dólares) y un proceso enormemente laboriosos, incluso si los datos secuenciales necesarios están disponibles.

¿Pero qué ocurre con aquellos organismos farmacéuticamente relevantes para los que no se dispondrá datos secuenciales completos? La proteómica funcional no puede simplemente ignorarlos de modo que ¿cuáles son las alternativas? En principio, las bibliotecas de expresión de cADN pueden usarse junto con una inmovilización no específica para crear una selección de proteínas, pero esta tecnología es significativamente limitada debido al hecho de que la inmovilización no específica normalmente se asocia con la pérdida de función porque afecta al pliegue de la proteína. Además, todas las proteínas de células huéspedes también se inmovilizarán lo que, en el mejor de los casos, reducirá notablemente los radios señal-a-ruido, y en el peor de los casos, dará como resultado una confusión de resultados positivos. Por lo tanto, la habilidad para crear una selección de proteoma funcional en el que las proteínas individuales se inmovilicen específicamente y se purifiquen a través de un motivo o etiqueta sin afectar la función y sin requerir conocimientos de la secuencia completa del genoma representará un gran avance en el campo de proteómica funcional.

Nosotros hemos desarrollado en la actualidad una nueva técnica que soluciona los problemas anteriormente descritos proporcionando una metodología que permite que cada proteína en un proteoma se etiquete con un marcador común en una posición definida en la proteína sin requerir ningún conocimiento previo sobre la secuencia de ADN de los genes correspondientes. Esta “etiqueta” puede usarse a continuación para dar una similitud y especificidad a la inmovilización que se realiza hacia abajo y a los procedimientos de purificación, lo que a su vez permite la creación de selecciones espacialmente definidas en las que se muestran cientos de proteínas de un proteoma determinado.

Hay que tener en especial consideración el hecho relacionado con el posicionamiento precios de la “etiqueta”. Si la etiqueta se inserta dentro del marco en un gen pero en una posición no definida y arbitraria, existe el riesgo de que la proteína resultante etiquetada se trunque de manera no definida y en la mayoría de los casos se destruirá el correcto pliegue, y por ello la función. La metodología aquí descrita salva este problema insertando la etiqueta inmediatamente después del codón de inicio e inmediatamente antes del codón de parada de un gen determinado de modo que las proteínas individuales etiquetadas y de longitud complete se plieguen correctamente y puedan de este modo conservar la función cuando se inmovilizan específicamente en la selección.

Debido a que cada proteína en la selección será completamente funcional, a continuación las selecciones pueden analizarse directamente para identificar los objetivos de los fármacos u otras moléculas biológicamente relevantes. La definición espacial de las selecciones permitirá que el fenotipo de cada proteína pueda relacionarse directamente con su genotipo posibilitando así la identificación de “blancos” o “impactos”.

WO 00/04382 describe selecciones de proteínas, que incluyen proteínas que se inmovilizan en un soporte sólido por medio de una etiqueta que puede localizarse en la terminal N o C. Las proteínas se purifican y a continuación se imprimen en una película orgánica. WO 99/39210 describe la generación de una selección secundaria de anticuerpos a partir de una selección primaria de proteínas. Las proteínas se purifican y a continuación se inmovilizan en la selección por medio de una etiqueta. WO 99/45130 describe un sistema de expresión baculovirus, que incluye un sistema para expresar proteínas etiquetadas.

Por consiguiente, en un primer aspecto, la presente invención proporciona un método para generar una selección de proteínas que consiste en:

(a)proporcionar un conjunto de moléculas de ADN codificadoras

de proteínas que se etiquetan bien en la terminal N o C con

una porción de molécula marcadora;

(b)expresar las proteínas individuales etiquetadas en un formato

especialmente separado;

(c)purificar e inmovilizar en un solo paso cada proteína etiquetada en un formato espacialmente definido para producir una selección de proteínas sobre un soporte sólido, y de este modo las interacciones específicas entre la etiqueta y el soporte sólido se usan tanto en la purificación como en la inmovilización. En algunas realizaciones, el método incluye la clonación y

expresión de una o más proteínas como proteínas de longitud completa que se etiquetan de manera individual en la terminal N o C con una molécula marcadora.

La molécula marcadora puede ser una secuencia de péptido, por ejemplo, una etiqueta hexa-histidina, un epítope de anticuerpo o un imitador de biotina, o incluso una proteína completa, o dominio de proteína, por ejemplo el dominio de proteína que se enlaza con maltosa. La propia molécula marcadora puede modificarse posttranslacionalmente, p. ej., mediante la adición de una biotina o molécula lípida. En una realización preferente, la molécula marcadora también permitirá la purificación de proteínas “etiquetadas”.

Por lo tanto, los métodos de la presente invención permiten la modificación específica, en un recipiente, de cada miembro de una biblioteca de ADN de manera que no es necesario ningún conocimiento sobre la secuencia de genes individuales. En su lugar, se basa en el codón común de inicio y terminación en todos los genes. La modificación se realizará en forma de una precisa inserción, dentro de la estructura, de ADN secuencial adicional y conocido bien inmediatamente después del codón de inicio o inmediatamente precediendo el codón de terminación de cada cADN tal y como se requiera.

El ADN adicional codificará una fracción marcadora, que se encontrará en el mismo marco de lectura que cada producto individual cADN. Por lo tanto, cada cADN genéticamente producido de acuerdo con los métodos de la presente invención codificará una proteína individual que ahora tiene una fracción común, p. ej., un polipéptido, una “etiqueta” fusionada precisamente con sus terminal N o C. Debido a que todos los miembros de la biblioteca de cADN se modificarán precisamente de la misma manera, el resultado será que todas las proteínas codificadas por la biblioteca cADN estarán ahora etiquetadas con una fracción común en las terminales N o C.

Se describen las selecciones formadas por medio de los métodos aquí descritos.

Dichas selecciones comprenden la biblioteca de expresión con proteína “etiquetada”, inmovilizada, normalmente sobre un soporte sólido. La persona experta en la materia entenderá que existe un rango de posibles soportes sólidos de uso común en el área de selecciones y cualquiera de estos “sustratos” puede utilizarse en la producción de selecciones.

Tal y como aquí se establece, los métodos de la presente invención permiten el etiquetaje de todas las proteínas en un proteoma determinado específicamente en la terminal N o C. Mientras algunas proteínas pueden no tolerar las extensiones de la terminal N y otras pueden no tolerar las extensiones de la terminal C, es probable que la gran mayoría de proteínas toleren una u otra de dichas extensiones. Sin embargo, los métodos existentes para clonar bibliotecas simplemente no pueden tratar este problema ya que clonan genes como cADNs de longitud completa y no modificados o al azar y fusiones casi inevitablemente truncadas con alguna pareja proteica. En comparación con estos, los métodos presentes permiten que bibliotecas de cADN precisas y de longitud completa se creen como fusiones para, por ejemplo, una pareja de péptido deseado. En comparación con los primeros, el método para inmovilizar proteínas en una selección tal y como aquí se describe es a través de interacción específicas en lugar de no específicas, y estas interacciones específicas son una función de la etiqueta añadida a las terminales de cada cADN. Además, los métodos aquí descritos pueden usarse para cribar proteínas purificadas e inmovilizadas que se han expresado en organismos de huéspedes no bacterianos y ayudar al mantenimiento de la función a través de un correcto pliegue y a una modificación post-translacional, mientras que los métodos existentes tales como exposición en fagos o bibliotecas de expresión λ-cADN se limitan a huéspedes bacterianos en los que la mayoría de proteínas eucarióticas se sintetizan en una forma no funcional, debido su pliegue incorrecto o a una modificación posttranslacional incorrecta.

Los métodos de la presente invención tienen una amplia gama de aplicaciones potenciales in vitro que pueden dividirse en términosgenerales en tres áreas principales. Éstas son el estudio de interacciones proteína-ligando, el estudio de interacciones proteína-proteína, y el estudio de interacciones proteína-ADN. Interacciones Proteína-Ligando

Los métodos aquí descritos permitirán un rápido diseño de las interacciones entre una nueva entidad química determinada y todas las proteínas en un determinado proteoma. Esto puede conseguirse fácilmente sondando la selección apropiada de proteoma con NCE siguiendo varios rigores en los que puede considerarse una criba inversa de alto rendimiento. La lectura de esta criba será directamente útil en muchas situaciones, algunas de las cuales se describen a continuación.

Los programas de exploración de alto rendimiento en los que las bibliotecas de compuestos se testan contra células u organismos completos a menudo identifican moléculas iniciales que dan lugar a un cambio fenotípico sin que se conozca el objetivo antes de la exploración. Sin embargo, la posterior identificación del objetivo primario puede resultar un proceso muy laborioso. Los métodos de la presente invención pueden aplicarse directamente a este tipo de problemas ya que será posible cresar una selección de proteomas funcionales para la especie en cuestión y a continuación cribar esta selección con el compuesto principal para identificar a qué proteínas dentro del proteoma se dirige. Esta técnica enormemente paralela para identificar las interacciones proteína-ligando acelerará en gran medida y simplificará la determinación de objetivos primarios de NCEs, y también permitirá la identificación de interacciones secundarias más débiles que también pueden ser importantes. Además, los métodos pueden aplicarse directamente a la cuestión de reactividad cruzada de especies, permitiendo que un potencial compuesto antifúngico, por ejemplo, pueda evaluarse rápidamente en términos de sus interacciones con, por ejemplo, todas las proteínas en un proteoma humano; este tipo de información tiene muchas posibilidades de ser muy útil en cualquier optimización posterior de compuestos principales.

Los métodos de exploración de elevado rendimiento permiten en la actualidad una rápida identificación de pequeñas moléculas que se ligan con una proteína determinada que previamente ha sido reconocida como un potencial objetivo terapéutico. Sin embargo, estos métodos no responden a la pregunta de cómo de selectiva puede ser una interacción, siendo este conocimiento potencialmente crucial para decidir si perseguir un determinado compuesto principal

o no; la sabiduría popular establece que los compuestos que van dirigidos a proteínas sencillas tienen más posibilidades de mostrar menos efectos secundarios que aquellas que también afectan a un gran número de proteínas relacionadas o no relacionadas.

Existe un número de ejemplos de compuestos que han progresado con éxito a lo largo de ensayos clínicos de tercera fase pero que han fallado a la hora de ganar la aprobación reguladora porque se desconoce su mecanismo primario de acción. Los fármacos antidepresivos mianserina y trazodona y el fármaco tenidap de la compañía Pfizer son ejemplos, representando cada uno de ellos inversiones de cientos de millones de dólares que no se han recuperado. Los métodos aquí descritos pueden aplicarse potencialmente a la resurrección de dichos fármacos fallidos ya que si pueden descubrirse los objetivos primarios de estos fármacos y posteriormente verificarse en términos de mecanismo de acción, los datos de ensayos clínicos tan caros ya serán aptos para la aprobación reguladora.

Todos los fármacos existentes tienen efectos secundarios, en mayor o menos medida, siendo aquí el ejemplo, el sino atractivo fármaco clozapina para combatir la esquizofrénico. Si puede determinarse el origen molecular de estos efectos secundarios, se facilitaría en gran medida el diseño de fármacos de futura generación con efectos primarios optimizados combinados con efectos secundarios minimizados. De nuevo, los métodos aquí descritos pueden aplicarse directamente a estos problemas ya que al crear un perfil de las interacciones entre un compuesto y todas las proteínas en un proteoma, las interacciones secundarias aberrantes se identificarán y posteriormente podrán analizarse para saber si están relacionadas con los conocidos efectos secundarios.

Los métodos de la presente invención también pueden usarse para identificar familias de proteínas, como serina proteasas, cribando las selecciones de proteoma con inhibidores genéricos. Esto permitiría el posterior desarrollo de biochips mostrando, por ejemplo, todas las serina proteasas humanas o, de manera alternativa, todas las quinasas o todas las enzimas p450 para una exploración más enfocada de compuestos principales. Un biochip p450, por ejemplo, tendría utilidad en evaluar si un compuesto principal determinado tiene posibilidades de metabolizarse o no, ya que la hidroxilación mediada por p450 a menudo representa el primer paso en este proceso y probablemente es una de las primeras fuentes de la variabilidad paciente-a-paciente en respuesta al fármaco; ahora, de hecho, uno de los objetivos del diseño de fármacos es generar compuestos que no se metabolicen en primer lugar, y aquí, de nuevo, un chip p450 tendría una utilidad potencial significativa. Interacciones Proteína-Proteína

Las interacciones proteína-proteína y los complejos de multiproteínas son de vital importancia en biología celular. Las rutas de señalización, por ejemplo, normalmente se inician con una interacción entre una receptor de superficie celular y un ligando externo, y esto va seguido de una cascada de interacciones proteína-proteína que finalmente dan como resultado la activación de un gen específico. La interacciones proteína-proteína pueden depender de la presencia de un ligando específico o, de manea alternativa, pueden bloquearse por la acción de un ligando específico, mientras que algunos complejos de multiproteínas solamente se formarán de una manera dependiente de ligandos.

Se han identificado cientos de interacciones usando tecnologías de doble híbrido. Los métodos aquí descritos superan las limitaciones de tales métodos y pueden usarse para cribar selecciones de proteomas con proteínas individuales etiquetadas con el fin de identificar no solamente las parejas interactivas sino también las fuerzas relativas de interacciones individuales. Los métodos también pueden aplicarse para la identificación de los componentes de complejos con multiproteínas, incluso cuando su montaje depende del ligando.

Un ejemplo del uso de los métodos en el modo en el que identifica las interacciones proteína-proteína sería la identificación de las parejas señalizadoras del dominio citosólico de un receptor particular de superficie celular que se ha implicado en un estado de enfermedad; la identificación de tales parejas señalizadoras sería directamente relevante desde una perspectiva farmacéutica ya que las interacciones proteína-proteína podrían inmediatamente representar posibles objetivos terapéuticos. Interacciones Proteína-ADN

Se ha estimado que aproximadamente el 10% de todos los genes en el genoma humano codifican factores de transcripción aunque solamente un pequeño porcentaje de estos están actualmente identificados. El enlace de factores de transcripción específicos con elementos procesadores de ADN, a menudo en respuesta a estímulos externos, es un prerrequisito para la formación de complejos potenciadores que a continuación activan la expresión del gen. Existen varios puntos en los que la expresión del gen puede en principio estar afectada por la administración de fármacos: un fármaco podría bloquear el enlace de una proteína o molécula pequeña con un receptor de superficie celular y, a causa de ello, bloquear la cascada señalizadora en el inicio; un fármaco podría bloquear una interacción proteína-proteína o inhibir una actividad enzimática dentro de la cascada señalizadora; o de manera alternativa, un fármaco podría bloquear la formación de interacciones específicas proteína-ADN o proteína-proteína en el complejo potenciador. Aquí, a modo de ejemplo, el factor de transcripción NFкB participa en los procesos celulares diversos e inmunes y en respuestas a inflamación, desarrollo de extremidades, shock séptico, asma y producción de propéptidos de VIH. La mayoría de las cascadas señalizadoras intracelulares en la activación de NF-кB son comunes a todos los procesos de modo que no representan objetivos viables para intervenir. Por lo tanto, las diferencias entre las respuestas residen en la interacción original ligando-receptor o en la formación de complejos potenciadores. Se sabe que NF-кB se enlaza al menos con 14 elementos potenciadores diferentes y, por lo tanto, los complejos potenciadores representan objetivos potenciales terapéuticos. Sin embargo, la delineación de un complejo potenciador individual requiere el conocimiento del número de proteínas individuales que se enlazan con ADN y también sus interacciones proteína-proteína entre sí. Los métodos presentes pueden usarse para responder directamente ambas preguntas. Una selección proteómica puede cribarse con sondas específicas de ADN para identificar proteínas nuevas que se enlazan con ADN. De manera alternativa, la selección proteómica puede cribarse con el dominio de transactivación de un factor determinado de transcripción para identificar otras proteínas con las que interactúa. La relación cruzada de estas cribas debería permitir la identificación de nuevos componentes de complejos potenciadores específicos.

Las selecciones de proteínas generadas por los métodos de la presente invención también permitirán la selección de moléculas, que reconocen cada una de las proteínas mostradas en las selecciones. En una realización preferente, las moléculas seleccionadas serán proteínas de anticuerpos y de elementos similares a anticuerpos y se expondrán en fagos o en ribosomas os

se unirán covalentemente con el mARN codificador.

Por lo tanto, una biblioteca de anticuerpos expuesta en fagos puede aplicarse a cada una de las proteínas inmovilizadas en la selección y los anticuerpos que no se combinen se retiran mediante un lavado. A continuación, el fago seleccionado puede recuperarse y usarse para infectar bacterias de acuerdo con procedimientos habituales. Las bacterias infectadas por los fagos pueden producir bien partículas de fago que muestran los anticuerpos seleccionados durante más rondas de selección, o pueden producir fragmentos solubles de anticuerpo para uso directo. Los términos “anticuerpo” o “fragmentos de anticuerpo” aquí hacer referencia a fragmentos Fvs, FAB de cadena sencilla, fragmentos de individuales de cadena ligera

o pesada, derivados de ratón, humano, camello u otros organismos.

En una realización preferente, la selección de proteínas tendrá un formato de micropozo de modo que, tras el primer paso de selección, las partículas fágicas pueden recuperarse añadiendo células bacterianas apropiadas a cada pozo donde se infectarán por la acción de las partículas fágicas seleccionadas. A continuación, puede añadirse el medio de crecimiento a cada pozo y se deja que las bacterias infectadas crezcan y expresen los fragmentos de anticuerpo, mientras se mantiene la separación física de los fragmentos de anticuerpo seleccionados con respecto a cada proteína inmovilizada en la selección. Si se desea, pueden usarse nuevas partículas fágicas producidas por las bacterias infectadas en rondas posteriores de selección. Estos procedimientos son ahora rutinarios en la selección de fragmentos de anticuerpos policlonales y monoclonales en una única proteína purificada e inmovilizada. A continuación, y en la práctica, las selecciones originales de proteínas que aquí se presentan permitirán la generación de fragmentos de anticuerpos policlonales y monoclonales para cientos de proteínas correctamente plegadas de una manera enormemente paralela mientras que, si no, se usarían los métodos estándar de selección de anticuerpos in vitro.

Los fragmentos de anticuerpo seleccionados y solublemente expresados de cada pozo de la selección original pueden inmovilizarse ellos mismos en una nueva selección espacialmente definida de modo que los fragmentos de anticuerpo en cada posición de la nueva selección se seleccionaron frente a la proteínas inmovilizadas en una única posición definida en la selección original. Las selecciones de anticuerpo así seleccionadas contendrán en cada posición bien fragmentos de anticuerpo policlonal o monoclonal, dependiendo del número de rondas de selección realizadas antes de la inmovilización de los fragmentos solubles de anticuerpo.

Estas selecciones de anticuerpo tendrán un número de usos potenciales que incluyen la captura de proteínas individuales de una célula cruda o un lisado celular controlar la expresión diferencial del proteoma relevante. De manera alternativa, las proteínas capturadas por anticuerpo pueden analizarse directamente para la función de enlace con ligando. En general, cualquier anticuerpo monoclonal podría combinarse con la proteína objetivo para bloquear su función, pero otro anticuerpo monoclonal podría combinar pero no bloquear la función. En una técnica muy paralela, claramente no resulta nada práctico evaluar todos los anticuerpos monoclonales con todas las proteínas en un proteoma de manera individual para comprobar su habilidad de enlace sin afectar a la función. En cambio, un conjunto policlonal de anticuerpos para todas las proteínas en un proteoma tiene posibilidades de contener anticuerpos individuales que tienen la habilidad deseada para combinarse pero no para afectar a la función y además, contendrán anticuerpos individuales que reconocen todas las modificaciones post-translacionales de una proteína determinada. Por consiguiente, en general, las selecciones de anticuerpos policlonales en lugar de monoclonales generados tal y como aquí se describe posiblemente presentarán ventajas para cribar proteínas capturadas directamente para la función.

En comparación con la selección original de proteínas, las selecciones de anticuerpos creadas por los métodos aquí descritos tendrán la ventaja de que todas las proteínas inmovilizadas en la selección serán estables bajo condiciones similares. Las proteínas capturadas desde la célula cruda o lisado de tejido no serán recombinantes pero se expresarán de manera natural. Además, las proteínas capturadas pueden cribarse para función o enlace con ligando, etc, directamente tras la captura de la célula cruda o lisado de tejido, lo que debería ayudar al mantenimiento de la función.

(i): En algunas realizaciones, el método de la invención comprende además el paso de poner en contacto uno o más compuestos con una selección de proteínas como la aquí definida y medir en enlace de uno o más compuestos con las proteínas en la selección; de este modo se analizan uno o más compuestos en busca de actividad biológica.

(ii): En algunas realizaciones, el método de la invención comprende además el paso de poner en contacto una o más proteínas, p. ej., un receptor de superficie celular con una selección como la aquí definida, y medir el enlace de una o más proteínas específicas con las proteínas de la selección; de este modo se analizan una

o más proteínas para las interacciones específicas proteína-proteína.

(iii) En algunas realizaciones, el método de la invención comprende además el paso de poner en contacto una o más sondas de ácido nucleico con una selección como la aquí definida, y medir el enlace de las sondas con las proteínas de la selección; de este modo se analizan una

o más proteínas para las interacciones específicas proteína-ácido nucleico.

(iv): Se describe el uso de una selección como la aquí definida en para una rápida selección de un compuesto, proteína o ácido nucleico.

(v): Se describe el uso de una selección tal y como aquí se define para seleccionar moléculas que reconocen cada proteína en la selección, donde las moléculas son preferiblemente anticuerpos.

(vi): En algunas realizaciones, el método de la invención comprende además el paso de poner en contacto una selección de proteínas, tal y como aquí se define, con

una biblioteca de anticuerpos, de modo que una o más proteínas en la selección de proteínas se enlazan con al menos un anticuerpo en la biblioteca de anticuerpos, retirando todos los anticuerpos que no estén ligados e inmovilizando aquellos anticuerpos que se enlacen con las proteínas en la selección de proteínas, generando de este modo una selección de anticuerpos.

(vii) Se describe un método para seleccionar función o abundancia de proteínas que comprende el paso de poner en contacto una selección de anticuerpos como los aquí definidos con una mezcla de una o más proteínas.

Los métodos (i), (ii), (iii) y (vi) también pueden incluir el paso de, en primer lugar, proporcionar la selección de acuerdo con uno o más métodos de la presente invención.

Las características preferentes de cada aspecto de la invención son aplicables a cada uno de los aspectos, con los cambios correspondientes.

A continuación, la presente invención se describirá con referencia a los siguientes ejemplos, que en ningún caso deberían considerarse como limitativos del alcance de la invención.

FIGURA 1a: muestra la construcción del vector pMM106H;

FIGURA 1b: muestra los detalles de la amplificación PCR y la digestión de exonucleasa de un gen a modo de ejemplos (GST) antes del etiquetaje;

FIGURA 1c: muestra detalles de la ligadura específica y la amplificación PCR para introducir la etiqueta; FIGURA 1d: muestra detalles de la clonación de los productos PCR; y

FIGURA 1e: muestra la reacción entre Glutationa y 1-cloro-2,4dinitrobenceno catalizado por GST. Ejemplo 1

(a)Construcción de Vector (ver Figura 1a)

Hemos construido un vector pMM106H derivado de pUC19 que contiene un fuerte promotor híbrido (Ptrc) para conducir la expresión de los genes clonados a un punto Nco I inmediatamente por debajo de la secuencia promotora. Insertamos una secuencia de ADN sin sentido 676 bp como un fragmento de relleno entre el punto Nco I y un punto descendente Hpa I. Hpa I es un cortador con punta desafilada y está ubicado para partir el vector de modo que el ADN descendente codifique un poliasparagina, péptido de hexahistidina si el marco de lectura se encuentra sobre la primera fase de la punta desafilada. Después de la etiqueta de hexahistidina, encontramos un codón de parada ámbar (TAG) seguido del gen codificador de la proteína verde fluorescente (GFP) de la medusa Aequorea victoria. Los genes clonados en pMM106H como fragmentos Nco I/punta desafilada dan como resultado fusiones con la etiqueta His y GFP solamente si el marco de lectura correcto se crea en el punto Hpa I durante la clonación. Aquí, GFP se usa como un gen informador para facilitar la exploración visual de clones que expresan la etiqueta His, mientras que también proporcionan una indicación del correcto pliegue de la proteína de fusión, ya que GFP es solamente activo cuando se pliega en la conformación correcta. El codón de parada ámbar dará como resultado una pequeña cantidad de proteínas de fusión de longitud completa para la visualización de colonias verdes, mientras que la mayor parte de las proteínas de fusión terminarán inmediatamente después de la etiqueta His y pueden usarse para la posterior inmovilización y para ensayos con enzimas. La construcción de pMM106H se confirmó mediante secuencias:

Construimos un segundo vector pGSTN mediante una primera amplificación PCR de gen glutatión S transferasa (GST) de Schistosoma japonicum de pGEX-2T (Pharmacia) bajo condiciones estándar usando cebadores “GSTfwd2” (5’ -ATG CTG CAG ACG TCA ACA GTA TCC ATG GCC CCT ATA CTA GG-3’) y ’GSTHindIII’ (5’ -GCG AGG AAG CTT GTC AAT CAG TCA CGA TGA ATT CCC G-3’). Estos cebadores introducen un lugar de restricción Nco I en el codón de inicio de GST, mutan el segundo residuo de GST de serina a alanina, e introducen un codón de parada en el lugar de clonación múltiples 3’-del gen GST seguido de un lugar de restricción Hin dIII. A continuación, el producto PCR se clona bajo condiciones estándares como un fragmento Nco I/ Hin dIII a pTrcHisA (Invitrogen) previamente digerido con Nco I/ Hin dIII para generar pGSTN.

(b) Amplificación PCR y digestión de genes de exonucleasa antes del etiquetado (ver figura 1b)

Amplificamos el gen GST de la construcción pGSTN usando una reacción en cadena de polimerasa con cebadores específicos de vector diseñado a la medida “STdelantero” (5’ -ATG CTG ACG TCA TGA GGC CCA TGG GGC CCG GAT AAC AAT TTC ACA CAG G3’) y ’STtrasero’ (5’-GCG GAT CCT TGC GGC CGC CAG GCA AAT TCT GTT T-3’) que se combinan con el vector 156 bp sobre el codón de inicio y 84 bp bajo el codón de parada, respectivamente. Se llevaron a cabo 30 ciclos de PCR (94ºC 1 min; 57ºC 1 min; 72ºC 2 min) en cuatro reacciones separadas de 100 µl. Cada reacción PCR contenía ~20 ng de plantilla de ADN, 50 pmol de cada cebador y 2.5 unidades de polimerasa Pwo. Cada reacción PCR se realizó en un búfer estándar (10 mM Tris.HCl pH 8.8, 25 mM KCl, 5 mM (NH4)2SO4, 2 mM MgSO4, 10% DMSO). Además, cada una de las cuatro reacciones PCR también contenía una mezcla no estándar de trifosfato deoxinucleótido, del siguiente modo: Reacción 1) 200µM dATP, 200µM dTTP, 200µM dCTP, 150µM dGTP, 50µM α-S-dGTP; Reacción 2) 200µM dATP, 200µM dTTP, 200µM dGTP, 150µM dCTP, 50µM α-S-dCTP; Reacción 3) 200µM dATP, 200µM dGTP, 200µM dCTP, 150µM dTTP, 50µM α-S-dTTP; Reacción 4) 200µM dGTP, 200µM dTTP, 200µM dCTP, 150µM dATP, 50µM α-S-dATP.

La inclusión de un único trifostato deoxinucleótido α-thio en cada mezcla específica PCR da como resultado una incorporación arbitraria pero estadística de α-S-dNTP en el producto final específico PCR. A continuación, las cuatro mezclas individuales PCR se reunieron y se purificaron usando un kit de limpieza QIAquick PCR (Qiagen), bajo condiciones estándares, y se digirieron hasta su finalización con la enzima de restricción Aat II. Posteriormente, los ~1000bp productos PCR resultantes se purificaron con gel.

5µg de producto PCR digerido se incubó a continuación con 375 unidades de Exonucleasa III durante 45 minutos en una reacción de 50µl. La digestión de Exo III se llevó a cabo en una búfer de reacción estándar (66mM Tris.HCl pH 8.0, 6.6mM MgCl2, 5mM DTT, 50µg/ml albúmina de suero bovino). Estas condiciones aseguran que la digestión por parte de Exo III llegue a su finalización. A continuación, la enzima se desactivó calentándola a 75ºC durante 15 minutos. El producto de la digestión Exo III es un conjunto anidado de eliminaciones desde el extremo 3’ del producto PCR; el extremo 5’ del producto PCR se protege de la digestión puesto que la restricción con Aat II deja un saliente en el punto 3’ que es además resistente a la actividad de Exonucleasa III.

La exonoucleasa III es una exonucleasa no procesadora 3’-a 5’-que es incapaz de hidrolizar nucleótidos que contienen α-thio por lo que en el presente protocolo, cada vez que Exo III alcanza una base α-thio-deoxinucleótida, el truncamiento progresivo del extremo 3’ empotrado del producto PCR se detiene. Por lo tanto, el resultado de red es un conjunto anidado de eliminaciones como consecuencia de la incorporación arbitraria de cada α-S-dNTP en la fase temprana. El radio de α-S-dNTP con dNTP usado en las amplificaciones de PCR original se determinó empíricamente de manera que el sobre de eliminaciones anidadas abarcaron una ventana 4000bp de tamaños centrados aproximadamente 100bp más cortos que el producto PCR original de longitud completa. Confirmamos esto tomando una porción de la mezcla Exo II y tratando las eliminaciones anidadas con nucleasa de frijol mungo. Este proceso retiró los salientes 5’ y 3’ para producir productos con punta desafilada que a continuación se midieron sobre geles 1% agarosa/TBE, usando una cadena de ADN 100bp como estándar.

Claramente, se pudieron usar un número de diferentes actividades de nucleasa 3’ y 5’ para generar el conjunto necesario de las eliminaciones empotradas en 3’ en el procedimiento anteriormente descrito; se incluyen aunque no se limitan a Exonucleasa III, polimerasa I de ADN E. coli, polimerasa de ADN T4, polimerasa de ADN T7.

(c) Ligadura Específica y amplificación PCR para introducir etiquetas (ver figura 1c)

Se diluyeron 5µl de la mezcla de reacción Exo III en búfer de ligasa ADN T4 en presencia de un exceso molar multiplicado por 25 5 de una “mezcla oligo”. La “mezcla oligo” consiste en cualquiera de los 2 subconjuntos de oligonucleótidos. El primer subconjunto, “oligomezclaA”, contiene 12 oligonucleótidos en los que cada uno de los tres posibles codones de parada están representados en el extremo 5’, seguidos inmediatamente por una base degenerada. La 10 región restante de cada uno de los oligos es la misma en los 12 casos y efectivamente es una secuencia arbitraria excepto para dos sitios de enzima de restricción Tipo IIS (Sap I y Bam I), a lo que sigue una secuencia complementaria de reconocimiento para el cebador “LMB2” (5’-GTA AAA CGA CGG CCA GT-3’) en el extremo 3’. Las

15 secuencias de los 12 oligos son las siguientes:

imagen1

35 Sap I Bam I sitio de unión LMB2

El segundo subconjutno, “oligomezclaB”, consiste en 3 conjuntos de oligonucleótidos, cada uno de los cuales con uno de los 3 codones de parada representados en el extremo 5’, seguido inmediatamente por 6 residuos degenerados. La región restante de cada uno de los oligos es la misma en los 3 conjuntos y contiene dos sitios de enzima de restricción Tipo IIS (Bpm I y Bse RII), a lo que sigue una secuencia complementaria de reconocimiento para el cebador “LMB2” en el extremo 3’. Las secuencias de los 3 conjuntos de oligos son las siguientes:

imagen2

Bse RI Bpm I sitio de unión LMB2

La mezcla Exo III más la oligomezclaA u oligomezcla B se alinearon durante 30 minutos a 16ºC y a continuación se añadieron 400 Unidades de ligasa ADN T4, y posteriormente la reacción se incubó durante la noche a 16ºC. Los productos de ligadura se purificaron usando un kit de limpieza PCR QIAquick (Qiagen) bajo condiciones estándares y se usó como plantilla en una reacción PCR estándar usando polimerasa Pwo con cebadores “STdelantero” y “LMB2”. Se realizaron 30 ciclos de PCR (94ºC, 1 min; 57ºC 1 min; 72ºC 2 min) para generar productos PCR que oscilaran los 1000bp.

Tanto la oligomezclaA como la oligomezclaB son capaces de alinearse de manera competitiva con las regiones de ADN con una cadena única de la plantilla original expuesta por la hidrólisis Exo II de una cadena del dúplex realizado en el paso precio. Tras el alineamiento, una ligadura correcta entre un oligo y una plantilla requiere que el oligo se ponga en línea con absoluta complementariedad en su extremo 5’ y, además, que el residuo empotrado en 3’ de la plantilla dúplex directamente está contiguo al residuo 5’ del oligo específicamente alineado. PCR que usa el cebador que se enlaza con el oligo recién ligado y un segundo cebador que se enlaza en el extremo 5’ de la plantilla del dúplex de manera selectiva y especificativa amplifica a continuación solamente aquellos dúplex que han sufrido dicha ligadura. El extremo 5’ de cada uno de los 12 oligos en la oligomezclaA corresponde a un codón de parada y por lo tanto, de los 12 oligos contenidos en esta mezcla, solamente uno puede alinearse con absoluta complementariedad en su extremo 5’ con la secuencia de reconocimiento con cuatro pares de base que consiste en el primer codón de parada estructural de GST y base inmediatamente 3 del codón de parada, tal y como se muestra en la Figura 1c. El resto de los 11 oligos pueden alinearse perfectamente en sus extremos 5 en todos los lugares dentro del conjunto anidado de eliminaciones pero estos otros hechos específicos para alinear solamente pueden darse en codones de parada fuera del marco en el gen GST o en codones de parada por debajo del primer codón de parada dentro del marco. Siempre que un oligo recién alineado colinde directamente con el residuo empotrado en 3’ de la plantilla del dúplex, la ligadura tiene lugar. Por lo tanto, PCR en esta fase amplificará no solamente el gen exacto y de longitud completa sino también un conjunto de productos truncados y extendidos. Se espera que los oligos en la oligomezclaB reaccionen de la misma manera. El extremo 5’ de cada uno de los 3 conjuntos de oligos en el subconjunto corresponde a un codón de parada, seguido de 6 residuos que efectivamente son arbitrarios. Por lo tanto, el subconjunto contendrá una permutación en la que el codón de parada y los siguiente 6 residuos coincidirán perfectamente con los de la parte inferior del gen de interés. Este oligo se enlazará con una especificidad mayor en comparación con el oligo correspondiente del subconjunto de 12 oligos, ya que la complementariedad se extiende sobre 9 nucleótidos en lugar de 4.

La diferencia teórica entre la oligomezclaA y la oligmezclaB reside en la secuencia que inmediatamente va después del codón de parada en el extremo 5’ de cada oligo. En la oligomezclaA, una base degenerada sencilla es a continuación seguida por una secuencia de ADN sencilla sin sentido pero definida de modo que sea posible que esta región definida pueda influir a la hora de alinear la oligomezcla a favor de codones individuales de “parada” (ya estén dentro o fuera del marco) dentro de cualquier gen determinado proporcionando una complementariedad con la pareja base involuntaria pero adicional más allá de las cuatro interacciones diseñadas con emparejamiento base en el extremo 5’ de cada oligo. Cualquier parcialidad en el alineamiento puede manifestarse en dirección descendente en una desviación hacia clones en los que se ha dado la escisión y reemplazo específico de un codón individual de parada (ya sea dentro o fuera del marco). Dicha desviación en la frecuencia de modificación en diferentes codones de parada podría no ser adecuada y la oligomezclaB se diseña para salvar esta dificultad del siguiente modo. Cualquier codón de parada en un gen individual o biblioteca irá inmediatamente seguido por una secuencia definida aunque desconocida. Los tres codones de parada están representados en la oligomezlcaB y cada uno de ellos está inmediatamente seguido por todas las secuencias posibles de hexanucleótido (es decir, por una secuencia hexámera) de modo que en cualquier codón de parada determinado en un gen o biblioteca, habrá un oligo en oligomezclaB que corresponderá al codón de parada y, exactamente, a su secuencia precisa e inferior, dando como resultado 9 parejas base de total complementariedad. Debido a que esto será cierto para todos los codones de parada, la oligomezclaB no debería sufrir ninguna desviación del tipo que podría ser posible con la oligomezlcaA.

Hemos descubierto que el proceso global de digestión, recocimiento y ligadura de Exo III de las oligomezclas y la amplificación específica PCR han sido reproducibles en un alto grado. Como controles en este proceso, hemos mostrado que si la Exonucleas II, ligasa ADN T45 o cualquiera de las oligomezclas se omite, no obtenemos absolutamente ningún producto PCR. Esto demuestra que este proceso es altamente selectivo.

También se apreciará que la ligasa ADN T4 podría sustituirse por un número de diferentes ligasas de ADN, por ejemplo ligasa ADN Taq o ligasa ADN Tsc, que podrían mostrar diferentes especificidades.

(d) Variación en el procedimiento

Claramente, podría usarse un número de diferentes actividades 3’ y 5’ para generar el conjunto necesario de eliminaciones empotradas y anidadas en 3’ en el procedimiento anteriormente descrito; éstas incluyen pero no se restringen a Exonucleasa III, polimerasa I de ADN E. coli, polimerasa de ADN T4, polimerasa de ADN T7.

Una variación obvia en el procedimiento original para producir inserciones de longitud completa con el codón de parada o codón de inicio retirados con precisión implica la producción de un conjunto anidado de eliminaciones empotradas en 5’ en un producto PCR que abarca la secuencia codificadora. Potencialmente, esto podrías llevarse a cabo usando nucleasas tales como exonucleasa λ, polimerasa I de ADN E. coli, polimerasa de ADN Taq, exonucleasa 6 del gen T7. Por lo tanto, el producto PCR original, por ejemplo, podría digerirse con exonucleasa λ, lo que retira los nucleótidos de la cadena de dsADN en una dirección 5’ a 3’. Dibdo a que la enzima solamente reconoce los grupos de fosfato 5’ como sustratos, una de las dos cadenas puede protegerse incorporando un grupo hidroxil en el extremo del cebador apropiado en la amplificación inicial de PCR. Por consiguiente, podría crearse un conjunto anidado de eliminaciones, tal y como se ha descrito anteriormente, para exonucleasa III, salvo que la cadena opuesta se digiera para dejar terminales empotradas en 5’. Una mezcla de oligos en la que el complemento del codón de parada se representa en el extremo 3’ del oligo, está inmediatamente precedida por 6 residuos aleatorios y, antes de ellos, por una secuencia definida que codifica un punto de restricción Tipo IIS que puede a continuación alinearse con las regiones expuestas de la cadena sencilla. Un oligo de la mezcla se alineará específicamente con cada codón de parada expuesto y servirá como un cebador para polimerasa I ADN E. coli, que polimeriza en la dirección 5’ y 3, digiriendo la cadena delante de ella con su actividad de exonucleasa en 5’ y 3’. Este nuevo fragmento dúplex de ADN puede amplificarse de manera específica usando un cebador que se enlaza con el extremo 5’ del producto original PCR y uno que se enlace específicamente con el oligo recién alineado y extendido. En este procedimiento, no es necesario que el extremo 3’ del oligo alineado colinde directamente con el residuo empotrado 5’ de la plantilla dúplex. Los oligos de la mezcla pueden alinearse con cualquier región complementaria sobre la plantilla de ADN expuesta con cadena sencilla de una manera similar a la preparación arbitraria de hexámeros, pero es importante el hecho de que la extensión de la cadena solamente ocurrirá donde el extremo 3’ se haya alineado con absoluta complementariedad y los extremos 3’ de los oligos en la mezcla se diseñan para que solamente sean complementarios con los codones de parada. Por lo tanto, únicamente cuando el extremo 3’ de un oligo se haya enlazado específicamente con el correspondiente codón de parada, la extensión del cebador y la posterior amplificación PCR tendrán lugar. El enlace con codones de parada fuera del marco y aquellos por debajo del verdadero codón de parada del gen de interés también tendrán lugar, dando como resultado la amplificación PCR de no sólo el gen exacto de longitud completa, sino también un conjunto de productos truncados y extendidos.

(e) Clonaciónyanálisisdelosproductos PCR (ver figura 1d)

Los productos PCR (~5µg) que oscilan en tamaño desde 800 a 1000 bp se limpiaron usando un kit de purificación PCR QIAquick (Qiagen) y a continuación se digirieron hasta la finalización con la enzima de restricción Bpm I del Tipo IS. Esta enzima corta remotamente pero específicamente 14 bases de sus secuencia de reconocimiento en una cadena y 16bp en la otra cadena dejando un extremo empotrado en 3’. Por consiguiente, esta modificación en la restricción específicamente suprime del producto PCR el codón de parada en el que el extremo 5’ de un oligo individual de la “mezcla oligo” se alineó y ligó de manera exitosa en el paso previo.

Los extremos empotrados en 3’ de los productos digeridos se retiraron a continuación usando nucleasa de frijol mungo bajo condiciones estándares para generar un extremo desafilado en el extremo 3’ de los productos PCR. El ADN se purificó usando un kit de purificación de PCR QIAquick (Qiagen) bajo condiciones estándares y a continuación se digirieron hasta el final con la enzima de restricción Nco I. Los fragmentos restringidos de ADN que oscilaban entre 800bp y 1000bp se purificaron a continuación sobre un gel 1% agarosa/TBE usando un kit de extracción de gel QIAquick (Qiagen). El vector pMM106H (3µg) se digirió hasta su finalización con las enzimas Nco I y Hpa I y el fragmento eje de 2870bp se purificó con gel. El ADN del vector y los productos PCR restringidos se ligaron posteriormente bajo condiciones estándares y la mezcla de la ligadura se usó para transformar células E. coli DH5α que a continuación se recuperaron y colocaron en placas LB que contenían 100µg/ml carbenicilina.

Este procedimiento de clonación se llevó a cabo sobre el conjunto completo de productos PCR obtenidos en el paso previo. Sin embargo, solamente los productos PCR derivados de alinear de manera específica y ligadura de un oligo con el primer codón de parada dentro del marco debería ser capaz de ocasionar fusiones estructurales con la etiqueta de hexahistidina y GFP tras los pasos de clonación por medio de este procedimiento; el resto de productos PCR clonados de esta manera solamente deberían dar lugar a fusiones fuera del marco con la etiqueta de hexahistidina y GFP. Esto ocurre porque la ligadura del extremo desafilado del producto PCR con el extremo desafilado del vector da como resultado una fusión genética en la que el marco de lectura de translación del vector de ADN descendente es dictado por el marco de lectura original del codón de parada suprimido. Si el codón de parada estuviera fuera del marco con respecto al gen GST, la recién agregada secuencia codificadora de hexahistidina también se encontraría fuera del marco con respecto al gen GST, mientras que si el codón de parada estuviera dentro del marco con respecto al gen GST, la recién agregada secuencia codificadora de hexahistidina también se encontraría dentro del marco con respecto al gen GST. Sin embargo, solamente aquellos productos en los que el codón de parada específicamente suprimido fue el primer codón de parada dentro del marco de GST pueden ocasionar a proteína de fusión GST con etiqueta de hexahistidina (y GFP) cuando el aDN se transcribe y traslada. Las únicas proteínas con etiqueta de hexahistidina (y GFP) que pueden surgir del proceso global específico arriba descrito serán consecuentemente y necesariamente fusiones GST de longitud completa con la poliasparagina, etiqueta de hexahistidina.

Las colonias obtenidas del procedimiento de clonación arriba descrito se visualizaron en 365nm para identificar colonias verdes fluorescentes. Se recogieron noventa colonias (blancas y verdes) de manera arbitraria, se someten a una replicación en placa y se analizan mediante Western blot de colonias bajo condiciones estándares usando anticuerpos con etiqueta anti-His y anticuerpos anti-GST. El anticuerpo con etiqueta anti-His solamente se ligará a colonias que expresen la proteína etiquetada con hexahistidina de modo que el Western blot dar información directa sobre el número de colonias que expresan fusiones dentro del marco con la etiqueta hexahistidina. Por otro lado, el anticuerpo anti-GST se liga cerca de la terminal C de la proteína GSTE y por lo tanto solamente reconoce colonias que expresan proteínas GST de longitud completa o casi completa. Identificamos aquellas colonas que contenían una proteína que fue reconocida de manera positiva tanto por los anticuerpos con etiqueta anti-His como por los anticuerpos anti-GST. El ADN de estas colonias fue amplificado, purificado y secuenciado. Los datos de la secuenciación confirmaron la presencia de dos fusiones perfectas dentro del marco con GST de longitud completa, es decir, clones en los que el primer codón de parada dentro del marco del gen original GST había sido específicamente suprimido y sustituido por una poliasparagina dentro del marco, etiqueta hexahistidina. Por lo tanto, el índice de modificación exitosa que obtuvimos por medio de este procedimiento global es aproximadamente 2.2%. Los dos clones positivos resultaron ser verdes fluorescentes tras la exposición a luz ultravioleta de onda larga, debido a la expresión de suficientes cantidades de la fusión de longitud completa GSThexahistidina-GFP. Por consiguiente, en experimentos posteriores, solamente se recogieron colonias verdes fluorescentes para analizarlas con Western blot. Hemos descubierto que aproximadamente 70-80% de las colonias fluorescentes expresan proteínas reconocida por el anticuerpo con etiqueta anti-His. Es posible que en el resto del 20-30% de los casos, la traslación se inicie en el primer ATG del gen GFP, independientemente de la etiqueta hexahistidina, posiblemente con la ayuda de un punto de enlace pseudo-ribosoma introducido por la inserción clonada.

Hemos amplificado, purificado y secuenciado ADN plásmido de colonias verdes fluorescentes que expresan proteína reconocida tanto por los anticuerpos con etiqueta anti-His como por los anticuerpos anti-GST. Para las inserciones preparadas usando tanto la oligomezclaA como la oligomezclaB, el índice de modificaciones exitosas fue aproximadamente el 25% de todas las colonias verdes. Por lo tanto, el uso del gen GFP como marcador para fusiones dentro del marco aumenta la eficacia, aproximadamente 10 veces, a la hora de detectar los clones correctos.

También se podrá apreciar que la Nucleasa de Frijol Mungo podría sustituirse por otras nucleasas diferentes de cadena sencilla, por ejemplo, nucleasa S1 o RNasaT, que podrían mostrar diferentes especificidades y que un número de diferentes enzimas de restricción del Tipo IIS adecuadamente posicionadas podrían usarse en lugar de BpmI, por ejemplo SapI.

(f) Inmovilización y análisis funcional de proteínas etiquetadas (ver figura 1e)

Las células E. coli DH5α se transformaron con uno de los plásmidos GST de longitud completa y con etiqueta de hexahistidina, creados a partir de la metodología arriba mencionada. Una única colonia resistente a la carbenicilina creció en fase logarítmica o exponencial en 10ml de cultivo liquido y a continuación se complementó con 100µM IPTG para provocar la expresión de GST con etiquetad hexahistidina. Tras el crecimiento durante 4 horas más, las células se cosecharon y lisaron mediante congelacióndescongelación/lisozima. SDS-PAGE de lisado crudo mostró una proteína sobreexpresada del tamaño esperado (27kDA), que representó aproximadamente el 20% del total de proteína soluble, así como una pequeña cantidad de la fusión 54 kDa GSThexahistidina-GFP, generada a través de supresión de ámbar. El lisado crudo (500µl; 100µg) se mezcló a continuación con gotas magnéticas Níquel-NTA (50µl; capacidad de enlace 15µg proteína etiquetada con hexahistidina) y las gotas se recuperaron mediante sedimentación bajo un campo magnético. El sobrenadante se descartó y las gotas se lavaron y posteriormente se volvieron a suspender en un búfer de ensayo con glutationa S transferasa que contenía 1 mM respectivamente de glutationa y 1-cloro-2,4dinitrobenceno. En el momento del final del ensayo se recogieron los datos tras 30 minutos a temperatura ambiente midiendo la absorbencia en 340nm; esta longitud de onda corresponde al λmáxdel producto de la reacción catalizada con GST.

Como controles, los cultivos de DH5α que contenía bien el vector matriz (pMM106H) o un plásmido que codifica una proteína con etiqueta His no relacionada (alanina racemasa) fueron cultivados, inducidos, cosechados, lisados y sometidos a ensayo en paralelo. La actividad GST solamente se detectó en las gotas que se habían mezclado con el lisado crudo que contenía GST con etiqueta His, demostrando claramente que la actividad GST observada se debía específicamente al GST con etiqueta His inmovilizado y además que la proteína retenía la actividad sobre la inmovilización específica.

Tras la finalización del ensayo enzimático, la proteína se eluyó de las gotas magnéticas añadiendo búfer que contenía 100mM de imidazola y se analizó con SDS-PAGE. Esto demostró que la muestra que dio como resultado en el ensayo una actividad positiva contenía una única proteína inmovilizada del tamaño exacto que se esperaba para glutationa S transferasa (27kDa), confirmando de este modo que la actividad observada en las gotas se debió solamente a esta proteína recombinante con etiqueta His. Ejemplo 2

(a) Modificación, inmovilización, y ensayo de GST usando dos etiquetas diferentes

Tras el procedimiento descrito en el Ejemplo 1 para modificar glutationa-S-transferasa con etiqueta hexahistidina, hemos demostrado que este procedimiento es independiente de la naturaleza precisas del la etiqueta que se está añadiendo.

En primer lugar, se construyeron dos vectores que fueron idénticos a pMM106H excepto en que el fragmento rellenador de ADNsin sentido Nco I/Hpa I 676bp se sustituyó por un fragmento Nco I/Hpa I 300bp derivado del gen Escherichia coli gdhA y la etiqueta de hexahistidina fue sustituida por el péptido FLAG (una etiqueta de epítope) o la etiqueta Strep II (que se enlaza específicamente y con una elevada afinidad con estreptavidina). Estos vectores se han designado pMM104F y pMM104S, respectivamente. Estos vectores (3µg cada uno) se digirieron por separado hasta su finalización con Nco I y Hpa I y los fragmentos del eje 2870bp se purificaron con gel y se ligaron con los fragmentos GST generados de la oligomezlca A tal y como se describe en el Ejemplo 1. Usando una combinación de anticuerpos anti-FLAG y anti-GST, a lo que siguió la secuenciación, los clones fueron identificados de manera que contenían fusiones perfectas dentro del marco del gen GST de longitud completa con la etiqueta FLAG. De manera similar, usando una combinación de anticuerpos anti-GST y un conjugado de estreptavidina-peroxidasa de rábano que posteriormente se secuenció, se identificaron los clones que contenían fusiones perfectas dentro del marco del gen GST de longitud completa con la etiqueta Strep II. En ambos ejemplos, la frecuencia con la que se encontraron fusiones de longitud completa dentro del marco fue la misma (dentro del error experimental) que la determinada en el Ejemplo I.

Estos clones se usaron en experimentos de inmovilización, esencialmente como se ha descrito en el Ejemplo 1, excepto que los sustratos de inmovilización fueron gotas magnéticas en placas de 96 pozos cubiertas por anticuerpo anti-FLAG y por estreptavidina, respectivamente. Como en el Ejemplo 1, hemos sido capaces de demostrar la inmovilización específica de las proteínas de fusión por medio de estas etiquetas, y además hemos sido capaces de demostrar que la fusión GST conserva su actividad cuando se inmoviliza por medio de la etiqueta FLAG o Strep. Ejemplo 3

(a) Modificación de una segunda proteína usando la etiqueta de hexahistidina

Siguiendo el procedimiento descrito en el Ejemplo 1 para glutationa-S-transferasa, hemos demostrado que este procedimiento es independiente del gen preciso que se está manipulando.

Por lo tanto, comenzando con un plásmido que codifica el factor de trascripción humana NF-кB p50 y continuando exactamente con el mismo procedimiento descrito en el Ejemplo 1 (usando oligomezclaA) a menos que se especifique lo contrario, hemos sido capaces de demostrar la modificación de NF-кB p50 de modo que el primer codón de parada dentro del marco haya sido específicamente suprimido y reemplazado por una fusión estructural con ADN que codifica una poliasparagina, etiqueta de hexahistidina. Los Western blots con las colonias que usaron un anticuerpo con etiqueta anti-His permitieron la identificación de clones que expresan proteína etiquetada con hexahistidina. El ADN de estas colonias fue amplificado, purificado y secuenciado. Los datos secuenciales confirmaron que varios clones codificaron perfectas fusiones dentro del marco con NF-кB de longitud completa, es decir, clones en los que el codón de parada ha sido específicamente suprimido y reemplazado por una etiqueta de hexahistidina dentro del marco estructural. La frecuencia con la que se encontraron fusiones de longitud completa dentro del marco en el caso de NF-кB p50 fue 1.1%, que está cerca de, y dentro del error experimental, lo determinado en el Ejemplo 1 para GST.

(b) InmovilizaciónyanálisisfuncionaldeNF-кB p50 etiquetado con hexahistidina

Las células E. coli DH5α se transformaron con uno de los plásmidos NF-кB de longitud completa y con etiqueta de hexahistidina, creados a partir de la metodología arriba mencionada. Una única colonia resistente a la carbenicilina creció en fase logarítmica o exponencial en 10ml de cultivo liquido y a continuación se complementó con 100µM IPTG para provocar la expresión de NFкB p50 con etiquetad hexahistidina. Tras el crecimiento durante 4 horas más, las células se cosecharon y lisaron mediante sonicación. SDS-PAGE de lisado crudo mostró una proteína sobreexpresada del tamaño esperado (38kDA), que representó aproximadamente el 5% del total de proteína soluble, así como una pequeña cantidad de la fusión 65 kDa NF-кB p50-hexahistidina-GFP, generada a través de supresión de ámbar.

imagen3

Punto de enlace NF- кB P50

Un oligonucleótido dúplex, “motivo кB”, que contiene un punto de enlace palindrómico para NF-кB p50, se etiquetó en las bases 3’ con digoxigenina usando transferasa en terminal 3 bajo condiciones estándares (Boehringer Mannheim).

Los lisados de proteína se prepararon usando el método congelación-descongelación/lisozima en PBS (salina con búfer de fosfato pH 7.5) que contiene 5 mM β-mercaptoetanol. Se aplicaron 200 µl del lisado de proteína soluble de cada clon al micropozo cubierto con Ni-NTA y se incubó a temperatura ambiente durante 45 minutos. Al finalizar el periodo de incubación, los pozos se lavaron tres veces con PBST (PBS que contenía 0.02% Triton X-100) para retirar todas las proteínas no ligadas. Los pozos se lavaron tres veces con búfer que se enlaza con ADN (10 mM Tris.HCl pH 7.4, 75 mM KCl que contenía 5 mM β-mercaptoetanol con un tiempo de remojo de 1 minuto. Se añadió el motivo кB etiquetado con 3’ digoxigenina (2 pmol) a los pozos en 200 µl del búfer que se enlaza con ADN que contiene 1 µg de ADN poli (dI-dC) no específico. Después de otros 30 minutos de incubación, se retiró el ADN no ligado lavando los pozos tres veces con 10 mM Tris.HCl pH 7.4, 25 mM KCl que contenía 0.02% Triton X-100. Un conjugado de fosfatasa alcalina de anticuerpo anti-digoxigenina se diluyó con 150mU/ml en “búfer de dilución de anticuerpo” (10mM Tris.HCl pH 7.4, 25mM cloruro de potasio) complementado con 0.2% albúmina de suero bovino. El anticuerpo diluido (200 µl) se aplicó a continuación a los micropozos. Después de 30 minutos a temperatura ambiente, el anticuerpo no ligado se retiró lavando los micropozos con “bufer de dilución de anticuerpo” (3x350 µl) complementado con 0.02% Triton X-100. A continuación, se añadieron 200µl de un búfer (100mM Tris.HCl pH9.5, 100mM NaCl, 50mM MgCl2) que contenía 250µM fosfato p-nitrofenilo (pNPP), un sustrato de fosfato alcalino se añadieron a los pozos y la reacción se dejó reposar durante la noche a temperatura ambiente, y después la coloración amarilla en cada pozo (correspondiente a la formación de un producto, p-nitrofenol) se cuantificó en 405nm. El índice de fondo de hidrólisis del sustrato pNPP fue bajo de modo que un resultado positivo de ensayo fue claro a partir de la aparición de color amarillo en los pozos. Como controles en este ensayo omitimos el lisado crudo, o el oligonucleótido etiquetado, o el anticuerpo, o añadimos un exceso multiplicado por 20 de oligo dúplex no etiquetado o sustituimos el NF-кB p50 etiquetado con hexahistidina que contenía lisados crudos con cantidades equivalentes de un lisado celular crudo de células DH5α que expresan GST con etiqueta de hexahistidina en el mismo fondo de vector.

En este ensayo, NF-кB p50 en primer lugar se enlaza con el oligonucleótido etiquetado por medio del punto de enlace específico. El complejo proteína-ADN se inmoviliza a continuación en los micropozos por medio de la etiqueta hexahistidina y el resto de las proteínas (incluyendo complejos entre el oligo etiquetado y otras proteínas de enlace con ADN presentes en el lisado crudo) junto con otros oligos no ligados y etiquetados se lavan. Debido a que el conjugado de anticuerpo reconoce la etiqueta en el oligo, no la proteína etiquetada con hexahistidina, solamente puede observarse una señal positiva en el ensayo si la interacción NF-кB p50-ADN se mantiene durante la inmovilización de NF-кB p50 por medio de la etiqueta; si esta interacción no se mantiene, el oligo se perderá durante los pasos de lavado y no se observará cambio de color.

Descubrimos que el producto amarillo sólo se detectó en los micropozos que habían contenido el lisado crudo de NF-кB p50 con etiqueta de hexahistidina y el oligonucleótido etiquetado con digoxigenina y al cual el conjugado de fosfatasa alcalina de anticuerpo anti-digoxigenina se había añadido. Esto demostró que el cambio de color observado fue debido específicamente al complejo inmovilizado NF-кB p50-oligonucleótido y además que NF-кB p50 mantuvo la actividad durante la inmovilización específica.

Ejemplo 4

Un procedimiento alternativo para producir genes de longitud completa o cADNs con el codón de parada eliminado con precisión implica la producción de un conjunto anidad específico de cadena de eliminaciones empotradas en 5’ en un producto PCR que abarca la secuencia codificadora. Potencialmente, esto podría llevarse a cabo usando cualquier exonucleasa 5’-a 3’-como exonucleasa λ, polimerasa I de ADN E. coli, polimerasa ADN Taq, o exonuclesa 6 de gen T7. Una vez que se ha creado el conjunto anidado de eliminaciones empotradas en 5’-, una oligomezcla puede alinearse con las regiones expuestas de la cadena sencilla; esta mezcla de oligos consiste en un conjunto de oligos en el que el complemento de cada codón de parada está representado en el extremo 3’, inmediatamente precedido por 6 residuos arbitrarios y, antes de ello, por una secuencia definida codificadora de un punto de restricción de Tipo IIS y una secuencia complementaria de reconocimiento para el cebador “LMB2” (ver Ejemplo 1). Por lo tanto, la secuencia del conjunto de oligos es la siguiente:

imagen2

Un oligo de la mezcla se alineará específicamente cada codón de parada expuesto en la cadena de sentido y servirá como un cebador para la polimerasa de ADN que tiene bien actividad para desplazar la cadena, como polimerasa Taq, o actividad de exonucleasa 5’-o 3’-, como polimerasa I de ADN E. coli. El fragmento dúplex de ADN recién generado puede entonces amplificarse de manera específica usando un cebador que se enlaza con el extremo 5’-del producto PCR original y uno que se enlaza específicamente con el oligo recién alineado y extendido. En este procedimiento, el extremo 3’ del oligo alineado no es necesario para colindar directamente con el residuo empotrado en 5’-de la plantilla dúplex. Los oligos de la mezcla pueden alinearse con una región complementaria sobre la plantilla de ADN expuesta con una única cadena de una manera similar a la preparación arbitraria de hexámeros, pero como hecho importante, la extensión de la cadena solamente ocurrirá en los lugares en los que el extremo 3’ se haya alineado con absoluta complementariedad. Debido a que los extremos 3’ de los oligos en la mezcla están diseñados para ser complementarios con los codones de parada, solamente cuando el extremo 3’-de un oligo se haya unido específicamente con el codón de parada correspondiente tendrán lugar la extensión del cebador y la posterior amplificación PCR. La unión con los codones de parada fuera del marco y aquellos situados bajo el verdadero codón de parada del gen de interés también tendrá lugar, dando como resultado la amplificación PCR de no solamente el gen exacto de longitud completa, sino también de un conjunto de productos truncados y extendidos. Sin embargo, estos productos pueden descartarse fácilmente en sucesivos pasos porque no ocasionarán fusiones estructurales con la etiqueta del péptido.

Realizar el procedimiento de alineamiento y extensión sobre un conjunto anidado de eliminaciones en 5’ tal y como se ha descrito tiene ventajas significativas con respecto a llevar a cabo el procedimiento de alineamiento y extensión sobre una molécula de ADN o ARN con únicamente una cadena que abarca una región completa codificadora. Esto se debe a que el número de puntos con los cuales los cebadores pueden alinearse específicamente antes de la extensión se restringe en gran medida por la presencia de la doble porción de cadena del conjunto anidado de eliminaciones. La porción de cadena sencilla de eliminaciones abarcará principalmente la región no trasladada de 3’-de los genes y tendrá el efecto de influir en gran medida a los productos de extensión a favor de los codones de parada externos a la secuencia codificadora y también a favor de productos más largos de extensión; estos factores actuarán incrementando enormemente la frecuencia en la que el primer codón de parada dentro del marco es específicamente retirado por el procedimiento global. De hecho, hemos intentado alinear y extender los oligos descritos en el paso (b) a continuación usando una plantilla de región codificadora de una sola cadena, y hemos sido capaces de identificar los clones de longitud completa y correctamente modificados a partir del experimento. En comparación, los resultados del experimento descrito en detalle a continuación demuestra claramente que el uso del conjunto anidado de eliminaciones en 5’ como la plantilla para los pasos de alineamiento y extensión es tanto efectivo como eficiente para facilitar la retirada específica del primer codón de parada dentro del marco de la secuencia codificadora para producir fusiones con la etiqueta del polipéptido de longitud completa y dentro del marco.

(a) Amplificación PCR y digestión de exonucleasa de genes antes del etiquetaje

Por lo tanto, en primer lugar realizamos una amplificación PCR inicial de un gen GST exactamente como se ha descrito en el Ejemplo 1, los pasos (a) y (b), excepto que el cebador “STinverso” en la amplificación fuer ahora 5’-fosforalizado. El producto PCR purificado se digirió a continuación con 2.5 unidades de exonucleasa λ (kit de Novagen Strandase) durante 40 minutos a 37ºC en un búfer estándar de reacción (67mM glicina-KOH pH9.4, 2.5mM MgCl2, 50µg/ml albúmina de suero bovino). A continuación, la enzima se desactivó calentándola a 75ºC durante 15 minutos. Debido a que la exonucleasa λ solamente reconoce los grupos de fosfato en 5’ como sustratos, la cadena sentido está protegida de la digestión y el producto de la digestión es por lo tanto un conjunto anidado de eliminaciones del extremo 5’ de la cadena antisentido del producto PCR.

(b) Ligadura específica, extensión y amplificación para introducir la etiqueta

5µl de la mezcla de reacción de exonucleasa λ se diluyeron en búfer de reacción con polimerasa I de ADN de E. coli en presencia de 250µM dNTPs y un exceso molar multiplicado aproximadamente por 25 del siguiente conjunto de oligo degenerado:

5’-GTA AAA CGA CGG CCA GTC TGG AGG AGG AGA NNN NNN TCA-3’

Los fragmentos digeridos y los oligos se alinearon durante 30 minutos a 37ºC y, a continuación, 5 unidades de polimerasa I de ADN de E. coli se añadieron y posteriormente la reacción se incubó durante 3 horas a 37ºC. Los productos extendidos se purificaron usando un kit de limpieza de PCR QIAquick (Qiagen) bajo condiciones estándares y se usó como plantilla en una reacción PCR estándar usando polimerasa Pwo con cebadores “STdelantero” y “LMB2”. Se realizaron 30 ciclos de PCR (94ºC, 1 min; 57ºC, 1 min; 72ºC, 2 min) para generar productos PCR que se extendieron hasta 1000bp.

Los productos PCR generados a partir del procedimiento arriba descrito se digirieron y clonaron al vector pMM106H tal y como se ha descrito en el paso (e) del Ejemplo 1. Las colonias se obtenidas a partir del proceso de clonación se visualizaron a 365nm para identificar colonias verdes fluorescentes. Se recogieron 73 colonias, se sometieron a la técnica de la réplica en placa y se analizaron por medio de Wester blot de colonias bajo condiciones estándares usando anticuerpos con etiqueta anti-His y anti-GST. El ADN de 15 colonias que fueron positivas con anti-His y anti-GST se amplificó, purificó y secuenció. Los datos secuenciales confirmaron la presencia de 10 fusiones estructurales perfectas con GST de longitud completa, es decir, clones en los que el primer codón de parada dentro del marco del gen original GST ha sido específicamente suprimido y reemplazado por una poliasparagina dentro del marco, etiqueta de hexahistidina. Por lo tanto,el índice de modificación con éxito que obtuvimos por medio de este procedimiento global se cifra en el 39% del número total de colonias verdes fluorescentes. Ejemplo 5

(a) Identificación de una proteína de un pozo de 11 genes

Hemos aplicado exactamente el mismo proceso que en el Ejemplo 1 excepto en las especificaciones del pozo de 11 genes diferentes listados en la tabla a continuación. Hemos generado selecciones de proteínas resultantes específicamente modificadas de moto que cada posición en la selección corresponda a una única proteína recombinante inmovilizada por medio de la etiqueta agregada como resultado de este procedimiento. A continuación, hemos analizado la selección mediante un ensayo funcional y hemos identificado con éxito componentes individuales proteicos del pozo.

imagen2

Inicialmente, los once genes se subclonaron en el mismo eje de vector pTrcHisA ya que, entre otras cosas, este hecho imita la situación en la que se encuentra la biblioteca de ADN. Los cebadores “STdelantero” y “STtrasero” descritos en el Ejemplo 1 se diseñaron para ser cebadores universales para la amplificación de genes codificados en el interior del eje de vector pTrcHisA.

El cebador “Stdelantero” se diseñó de tal manera que codificara un número de puntos de restricción tal y como se indica a continuación:

imagen2

Por lo tanto, cualquiera de las enzimas de restricción Aat II o Sfi I puede usarse para generar salientes en 3’ para fines de protección de exonucleasa. Para fines de clonación direccional al final del proceso de modificación, en este Ejemplo elegimos usar Bsp HI ya que, aunque estadísticamente cortará con más frecuencia en el interior de la biblioteca, genera extremos cohesivos que son compatibles con el punto de clonación de Nco I en el vector con etiqueta pMM106H aquí usado y no corta ninguno de los 11 genes en el pozo presente. Claramente, en principio podría usarse cualquiera de los puntos de restricción codificados del cebador siempre y cuando el vector de etiqueta contenga un lugar de clonación equivalente por debajo del promotor; Sfi I tendría muchas ventajas en este aspecto en un formato más grande de biblioteca porque tiene una secuencia de reconocimiento de 8bp de modo que la frecuencia de incidencia arbitraria de un lugar Sfi I en un gen determinado será mucho más baja (1 en 6.5x104) que para una secuencia de reconocimiento de 6bp como la de Bsp HI (1 en 4.096).

El vector de la etiqueta pMM106H es un vector “ATG”, es decir, el punto de clonación 5’ (Nco I) coincide en parte con el codón de inicio ATG posicionado bajo un punto de unión de ribosoma (RBS) para la expresión de proteínas nativas. Sin embargo, en el procedimiento aquí descrito no dependemos de los genes clonados que tienen un punto de restricción común en sus codones de inicio. En su lugar, simplemente dependemos del promotor codificado por el vector que inicia la transcripción para producir mARN, con las señales necesarias para el inicio translacional que proporcionan los propios genes clonados. Por lo tanto, en este Ejemplo todos los genes en el pozo original tienen un codón de inicio inmediatamente precedido por un RBS, con independencia de la presencia o ausencia de un punto de clonación en ATG. A causa de que el cebador “STdelantero” se enlaza bajo RBS en los once clones iniciales, la posterior clonación post-modificación que usa cualquiera de los puntos de restricción codificados por el cebador introducirá los genes recién modificados en el vector de la etiqueta junto con sus RBS o ATG original de modo que el inicio de la translación estará asegurada. En un formato de biblioteca cADN, se aplica la misma situación en la que todos los cADNs de longitud completa tendrán sus propias regiones 5’ no trasladadas (UTR) que contienen las señales de iniciación translacional eucariótica. Todo esto es necesario para obtener una adecuada iniciación translacional, y en este caso a continuación se clona el cADN modificado junto con sus 5’-UTR a un vector eucariótico lo que produce señales de iniciación translacional una vez más; por lo tanto, puede usarse un conjunto universal de cebadores PCR equivalentes a los que se usan en este Ejemplo.

El proceso de modificación se llevó a cabo tal y como se describe en el Ejemplo 1 con las siguientes modificaciones. Se uso un pozo equimolar de onces genes como plantilla para la amplificación PCR inicial usando cebadores “STdelantero” y “STtrasero”, y posteriormente los fragmentos se digirieron con Sfi para proteger el extremo 5’ ya que esta encima tiene una secuencia de reconocimiento de 8bp y no corta ninguno de los 11 genes. La oligomezclaA (ver Ejemplo 1) se usó en el paso de alineamiento. Tras la segunda amplificación PCR, los fragmentos modificados se dividieron en 2 fondos que se digirieron por separado con Bpm Iy Sap I. Estadísticamente, una pequeña fracción de genes en las bibliotecas contendrá bien un punto Sap I (secuencia de reconocimiento de 7bp; probabilidad de incidencia arbitraria = 1 en 16.384) o un punto Bpm I (secuencia de reconocimiento de 6bp; probabilidad de incidencia arbitraria = 1 en 4.096) pero solamente una fracción muy pequeña contendrá los dos (probabilidad de incidencia arbitraria = 1 en 6.7x107). Por lo tanto, las dos enzimas de restricción del Tipo II se usaron por separado para asegurar de manera efectiva que la modificación específica de todos los genes de longitud completa no se excluyera por la presencia de uno u otro punto de restricción dentro del gen.

Los fragmentos digeridos de los dos pozos se unieron para el tratamiento con nucleasa de frijol mungo y la digestión con Bsp HI. Los fragmentos resultantes se purificaron con gel en 4 rangos de tamaño diferentes y se ligaron por separado al vector pMM106H (se digirieron hasta su finalización con Nco I y Hpa I se purificaron con gel) con el fin de evitar una ligadura preferencial de inserciones más pequeñas. Las células transformadas se visualizaron bajo luz UV (365 nm) y las colonias verdes fluorescentes se seleccionaron de manera visual para someterlas a análisis Western blot.

Aproximadamente el 30% del número total de las colonias transformadas fueron verde fluorescentes y, de ella, el 73% expresaron proteínas que son reconocidas por anticuerpos con etiqueta anti-His. 190 colonias verdes y His positivas fueron inoculadas en 1.5 ml de medio líquido en bloques con 96 pozos profundos y crecieron durante la noche. Las células se recogieron mediante centrifugación y se lisaron mediante congelacióndescongelación/lisozima. A continuación, los lisados crudos se aplicaron a pozos individuales de una placa con 96 pozos cubierta de Níquel-NTA y las proteínas no ligadas se retiraron mediante lavado, dejando las proteínas recombinantes con etiqueta His inmovilizadas en los pozos. Posteriormente, las proteínas inmovilizadas se sometieron a ensayo para actividades NF-кB usando el ensayo descrito en el Ejemplo 2 y los pozos que contenían “hits” positivos fueron identificados por la aparición de coloración amarilla. Tres clones mostraron actividad positiva de enlace de ADN “кB-motivo”. Una caracterización adicional de los clones positivos mostró que uno codificó fusiones dentro del marco, de longitud completa y precisas del gen p50 NF-кB con la etiqueta de hexahistidina tal como se esperaba. Se descubrió que los otros dos clones codifican proteínas de enlace de ADN relacionadas que son conocidas por compartir la misma especificidad de ADN que p-50 NF-кB, aunque con menores afinidades de enlace.

Por consiguiente, este resultado demuestra que la interrogación funcional de las selecciones generadas mediante este procedimiento puede identificar tanto interacciones específicas como interacciones más débiles que son sin embargo específicas y biológicamente relevantes. Como consecuencia, hemos usado este procedimiento para crear selecciones de proteínas funcionales en un formato de micropozo y, usando estas selecciones, hemos identificado con éxito proteínas individuales a partir de un pequeño subconjunto en base a una interacción específica proteína-ligando.

Claims

REIVINDICACIONES

1ª. – Un método para generar una selección de proteínas que consiste en:

(a)proporcionar un conjunto de moléculas de ADN codificadoras de proteínas que se etiquetan bien en la terminal N o C con una porción de molécula marcadora;

(b)expresar las proteínas individuales etiquetadas en un formato especialmente separado;

(c)purificar e inmovilizar cada proteína etiquetada en un formato espacialmente definido para producir una selección de proteínas sobre un soporte sólido, y de este modo las interacciones específicas entre la etiqueta y el soporte sólido se usan tanto en la purificación como en la inmovilización.

2ª.-El método de la reivindicación 1, donde la porción de molécula marcadora es una secuencia de péptido seleccionada del grupo consistente en:

(a)una etiqueta hexa-histidina; (b)una proteína completa o dominio de proteína;

(c)un epítope de anticuerpo; (d)un imitador de biotina; y (e)dominio de proteína que se enlaza con maltosa. 3ª.-El método de las reivindicaciones previas, donde la porción

de molécula marcadora se modifica post-translacionalmente. 4ª.-El método de la reivindicación 3, done la modificación posttranslacional incluye la adición de una biotina o molécula lípida.

5ª. – El método de las reivindicaciones anteriores, donde las proteínas etiquetadas se pliegan correctamente para mantener la función.

6ª.-El método de las reivindicaciones previas, donde las proteínas etiquetadas tienen longitud completa.

7ª. – El método de cualquiera de las reivindicaciones previas, donde las moléculas cADN que codifican proteínas etiquetadas se producen mediante un método que consiste en la inserción de una secuencia adicional y conocida de ADN que codifica la porción de molécula marcadora bien inmediatamente tras un codón de parada o

bien inmediatamente antes de un codón de parada presente en dichas moléculas de ADN que consiste en los siguientes pasos: (a)generar un conjunto de eliminaciones anidadas a partir de dichas moléculas de ADN; (b)alinear y ligar con el conjunto de eliminaciones anidadas un primer y un segundo conjunto de oligonucleótidos; en los que

(i)

la secuencia o secuencia complementaria de uno o más de los tres posibles codones de parada está representado en la mezcla del primer conjunto de oligonucleótidos, y

(ii)

la secuencia o secuencia complementaria de uno o más de los tres principales codones de parada está representado en la mezcla del segundo conjunto de oligonucleótidos

(c)amplificar de manera específica los productos ligados mediante una reacción de extensión con cebador utilizando un cebador de oligonucleótido elegido por ser complementario con el primer y segundo conjunto de oligonucleótidos.

8ª. – El método de cualquiera de las reivindicaciones 1 a 6, que además comprende los pasos de poner en contacto uno más compuestos de la prueba con la selección de proteínas y medir el enlace de uno o más compuestos con las proteínas en la selección, cribando de este modo uno o más compuestos para actividad biológica.

9ª. – El método de cualquiera de las reivindicaciones 1 a 6, que además comprende el paso de poner en contacto una o más proteínas, p. ej. Un receptor de superficie celular, con la selección de proteínas y medir el enlace de una o más proteínas específicas con las proteínas de la selección, cribando de este modo una o más proteínas para interacción específicas proteína-proteína.

10ª. – El método de cualquiera de las reivindicaciones 1 a 6, que además comprende el paso de poner en contacto sondas ácidas con la selección de proteínas, y medir el enlace de las sondas con las proteínas, cribando de este modo una o más proteínas para interacciones específicas proteína-ácido nucleico.

11ª.-El método de cualquiera de las reivindicaciones 1 a 6, que además comprende el paso de poner en contacto la selección de proteínas con una biblioteca de anticuerpos, de modo que una o más proteínas en la selección de proteínas está ligada con al menos un

5 anticuerpo de la biblioteca de anticuerpos, retirando aquellos anticuerpos que no estén ligados, e inmovilizar aquellos anticuerpos ligados a las proteínas en la selección de proteínas, produciendo de este modo una selección de anticuerpos.