ES2897202T3

ES2897202T3 - Sistema de genoteca de vectores bicomponente para el ensamblado y diversificación rápida de marcos de lectura abiertos del receptor de linfocitos T de longitud completa

Info

Publication number: ES2897202T3
Application number: ES18743749T
Authority: ES
Inventors: Reagan Micheal Jarvis; Ryan Edward Hill; Luke Benjamin Pase
Original assignee: Genovie AB
Current assignee: Genovie AB
Priority date: 2017-07-18
Filing date: 2018-07-17
Publication date: 2022-02-28
Anticipated expiration: 2038-07-17
Also published as: CN111315883B; AU2018303164A1; AU2018303164B2; CA3067124A1; CN111315883A; EP3655532A1; WO2019016175A1; KR20200028415A; DK3655532T3; JP7335224B2; NZ759372A; EP3655532B1; JP2020530769A; US20200231974A1; WO2019016175A9; KR102652494B1

Abstract

Un sistema combinado que comprende dos componentes independientes, en donde un primer componente es un vector que tiene segmentos génicos variables y constantes (V-C) del receptor de linfocitos T (TCR), y un segundo componente es un vector que tiene segmentos génicos de unión (J) del TCR, en donde el primer componente es un vector de entrada V-C que contiene a. origen de replicación, b. un primer marcador de selección positiva c. elemento o elementos genéticos 5', d. secuencia de Kozak, e. segmento génico variable del TCR, f. una primera secuencia de Tipo IIS, para reconocimiento y corte específicos de sitio mediante una primera enzima de restricción de Tipo IIS, en donde la secuencia está orientada de forma que la enzima corta en 5' de dicha secuencia de reconocimiento y en el extremo 3' del segmento génico variable del TCR, g. un marcador de selección negativa, h. una segunda secuencia de Tipo IIS, para reconocimiento y escisión específicos de sitio mediante una segunda enzima de restricción de Tipo IIS, en donde la secuencia está orientada de forma que la enzima corta 3' por escisión directa de dicha secuencia de reconocimiento y en el extremo 5' del segmento génico constante del TCR, i. segmento génico constante del TCR, y j. elemento o elementos genéticos 3', en donde el segundo componente es un vector donante J que contiene a. origen de replicación, b. un segundo marcador de selección positiva, c. una tercera secuencia de Tipo IIS para reconocimiento y escisión específicos de sitio mediante una tercera enzima de restricción de Tipo IIS, en donde la secuencia está orientada de forma que la enzima corta 3' de dicha secuencia de reconocimiento y en el extremo 5' del segmento génico de unión del TCR, d. segmento génico de unión al TCR, e. una parte C, que corresponde a una pequeña parte 5' de un segmento génico constante, y f. una cuarta secuencia de Tipo IIS para reconocimiento y escisión específicos de sitio por la cuarta enzima de restricción de Tipo IIS, en donde la secuencia está orientada de forma que la enzima corta 5' de dicha secuencia de reconocimiento y en la parte de la parte C del TCR del extremo 3' de la construcción, de forma que la secuencia del saliente monocatenario generado es complementario al generado por dicha segunda secuencia de Tipo IIS.

Description

DESCRIPCIÓN

Sistema de genoteca de vectores bicomponente para el ensamblado y diversificación rápida de marcos de lectura abiertos del receptor de linfocitos T de longitud completa

Campo de la invención

El receptor heterodimérico de linfocitos T (TCR) es fundamental para la inmunidad adaptativa. Se generan TCR únicos continuamente durante la génesis de linfocitos T, donde un conjunto de segmentos génicos se recombinan en un único marco de lectura abierto (ORF) contiguo del TCR. Debido al alto grado de diversidad generada en este proceso de recombinación, es difícil capturar datos de secuencia de pares de TCR que se expresan en células individuales. Además, esta diversidad también supone un desafío para proporcionar estos marcos de lectura abiertos (ORF) del TCR dentro de construcciones genéticas de alto rendimiento para ensayos y manipulación de la función del TCR. La presente invención, en su primer aspecto, proporciona un sistema de genoteca de vectores bicomponente preensamblados que consiste en vectores de entrada variable-constante (entrada V-C) y vectores donantes de unión (donante J) que comprenden partes de segmentos génicos del TCR. El sistema bicomponente se diseña de modo que cuando un vector de entrada V-C seleccionado de la genoteca de vectores de entrada V-C se combina con un vector donante J seleccionado de la genoteca de vectores donantes J, junto con un dúplex de oligonucleótidos de ADN sintético que codifica la región determinante de la complementariedad del TCR 3 (odeCDR3) en una reacción de ciclo de digestión con enzima de restricción/ligasa, se crea un único vector que reconstituye el ORF del TCR de longitud completa. Dicho sistema de genoteca de vectores permite métodos independientes de la PCR para la generación rápida y económica de los ORF del TCR en contextos de vectores seleccionados. Además, este sistema permite nuevos flujos de trabajo para generar secuencias sintéticas del TCR para los flujos de trabajo de maduración por afinidad y/o funcional. Este sistema de ingeniería y reconstitución del ORF del TCR (TORES) es por lo tanto una herramienta poderosa para el análisis funcional y la ingeniería del TCR. En el segundo aspecto, se proporciona un TORES con vectores de entrada V-C modificados junto con un tercer componente que es un vector donante terminador bidireccional (donante BiT) para permitir una segunda etapa para unir dos pares de cadenas de ORF del TCR, en un sentido de codificación antiparalelo, en un solo vector producto. Este sistema TORES2 bidireccional permite flujos de trabajo alternativos para administrar construcciones de ORF del TCR emparejadas para la manipulación y caracterización del TCR.

Antecedentes de la invención

La vigilancia inmunitaria por linfocitos T (células T) es una función básica de la inmunidad adaptativa de todos los vertebrados provistos de mandíbulas. La vigilancia inmunitaria de los linfocitos T se logra a través de una rica diversidad funcional entre los subtipos de linfocitos T, que sirve para eliminar células neoplásicas e infectadas por patógenos, y coordinan respuestas inmunitarias adaptativas a patógenos invasores, microorganismos comensales, factores no propios comensales tales como componentes moleculares de alimentos e incluso mantener la autotolerancia inmunitaria. Para responder a diversos factores extraños y factores propios, los linfocitos T deben poder detectar específicamente constituyentes moleculares de estos factores extraños y factores propios. Por lo tanto, los linfocitos T deben poder detectar una parte importante de moléculas propias y extrañas con la que una persona se encuentre, con especificidad suficiente para desencadenar respuestas eficientes contra organismos patógenos y células propias enfermas, al tiempo que se evita desencadenar dichas respuestas contra células propias sanas. La naturaleza altamente compleja de esta tarea resulta evidente cuando se considera la diversidad prácticamente ilimitada de moléculas tanto extrañas como propias, y considerando que dichos organismos patógenos están bajo presión evolutiva para evadir la detección por parte de los linfocitos T.

Receptor de linfocitos T (TCR)

Los linfocitos T se definen principalmente por la expresión de un receptor de linfocitos T (TCR). El TCR es el componente del linfocito T que es responsable de interactuar con, y detectar, las dianas de la inmunidad adaptativa de los linfocitos T. En términos generales, el TCR se compone de un complejo proteico heterodimérico presentado en la superficie celular. Cada una de las dos cadenas del TCR se compone de dos dominios extracelulares, que son la región variable (V) y la región constante (C), perteneciendo ambas al dominio de la superfamilia de las inmunoglobulinas (IgSF), y formando láminas p antiparalelas. Estos están fijados a la membrana celular mediante un dominio transmembrana Tipo I, que incorpora una cola citoplásmica corta. La cualidad de los linfocitos T para adaptarse y detectar diversos constituyentes moleculares surge de la variación en las cadenas de TCR que se genera durante la génesis de los linfocitos T. Esta variación se genera por recombinación somática de forma similar a la génesis de anticuerpos en los linfocitos B.

Diversidad de cadenas del TCR

El grupo de linfocitos T consiste en varias subpoblaciones funcional y fenotípicamente heterogéneas. Sin embargo, los linfocitos T pueden clasificarse a grandes rasgos como ap o yó según la forma del TCR reordenado somáticamente que expresan en su superficie. Existen dos formas de pares de cadenas del TCR; pares TCR alfa (TRA) y TCR beta (TRB); y pares TRC gamma (TRG) y TCR delta (TRD). Las linfocitos T que expresan pares TRA:TRB se denominan linfocitos T ap, mientras que los linfocitos T que expresan pares TRG:TRD se denominan frecuentemente linfocitos T yS.

Los TCR de ambas formas ap y yS son responsables del reconocimiento de diversos ligandos, o 'antígenos', y cada linfocito T genera cadenas del receptor ap o yS de novo durante la maduración de los linfocitos T. Estos pares de cadenas de novo del TCR logran diversidad de reconocimiento a través de la generación de diversidad de secuencias del receptor en un proceso denominado recombinación somática V(D)J por el cual cada linfocito T expresa copias de un único TCR reordenado de forma distinta. En los loci de TRA y t Rg , hay disponibles varios segmentos génicos variables (V) y funcionales (J) distintospara su recombinación y yuxtapuestos a segmentos génicos constantes (C), que por tanto se denomina recombinación VJ. La recombinación en los loci de TRB y TRD incluye de forma adicional un segmento génico de diversidad (D), y esto se denomina recombinación VDJ.

Cada TCR recombinado tiene potencial de especificidad para un único ligando, determinada por la estructura del sitio de unión al ligando formado por las cadenas a y p en el caso de los linfocitos T ap o por las cadenas y y S en el caso de los linfocitos T yS. La diversidad estructural de los TCR está limitada principalmente a tres bucles en horquilla cortos en cada cadena, denominadas regiones determinantes de la complementariedad (CDR). Tres CDR proceden de cada cadena del par de cadenas del receptor y, colectivamente, estos seis bucles CDR se asientan en el extremo distal a la membrana del dominio extracelular del TCR para formar el sitio de unión al antígeno.

La diversidad de secuencias de cada cadena del TCR se obtiene de dos formas. Primero, la selección aleatoria de segmentos génicos para recombinación proporciona diversidad inicial de secuencias. Por ejemplo, la recombinación de TRB se produce entre 47 segmentos génicos V únicos, 2 segmentos génicos D únicos y 13 segmentos génicos J únicos de la línea germinal. De forma general, el segmento génico V contribuye a los bucles CDR1 y CDR2 y, por lo tanto, están codificados por la línea germinal. El segundo modo para generar diversidad de secuencia se produce en los bucles CDR3 hipervariables, que se generan por deleción aleatoria de nucleótidos de patrón y adición de nucleótidos no del patrón en las uniones entre los segmentos génicos V, (D) y J recombinantes.

Complejo TCR:CD3

Los pares de cadenas ap y yS maduras del TCR se presentan en la superficie celular en un complejo con varias subunidades de CD3 auxiliares, denominadas £, y, S y Z. Estas subunidades se asocian con los Tc R ap o yS en forma de tres dímeros (ey, eS, Z). Este complejo TCR:CD3 forma la unidad para iniciar las respuestas de señalización celular después de la unión de un TCR ap o yS con el antígeno afín. Los CD3 auxiliares asociados como complejo TCR:CD3 aportan motivos de señalización denominados motivos de activación del inmunorreceptor basados en tirosina (ITAM). Cada CD3e, CD3y y CD3S contribuye con una única ITAM mientras que el homodímero CD3Z contiene 3 ITAM. Los tres dímeros de CD3 (ey, eS, Z) que se ensamblan con el TCR contribuyen, por lo tanto, con 10 ITAM. Tras la unión del TCR con su antígeno afín, la fosforilación de los restos de tirosina en tándem crea sitios de acoplamiento emparejados para proteínas que contienen dominios de homología Src 2 (SH2), tales como la esencial proteína asociada a la cadena Z de 70 kDa (ZAP-70). El reclutamiento de tales proteínas inicia la formación de complejos de señalización TCR:CD3 que en última instancia son responsables de la activación y diferenciación de los linfocitos T.

Linfocitos T ap

Los linfocitos T ap son generalmente más abundantes en los seres humanos que sus contrapartes los linfocitos T yS. La mayoría de los linfocitos T ap interactúan con antígenos peptídicos presentados por complejos de HLA en la superficie celular. Estos linfocitos T que reconocen el péptido-HLA (pHLA) fueron los primeros en ser descritos y, con diferencia son los mejor caracterizados. También se han descrito formas menos frecuentes de linfocitos T ap. Al parecer, los linfocitos T invariantes asociadas a la mucosa (MAIT) parecen tener una diversidad de cadena a y p relativamente limitada, y reconocen metabolitos bacterianos en vez de fragmentos de proteína. Las linfocitos T natural killer invariantes (linfocitos T iNK) y los linfocitos T reactivos a micolilo codificados por la línea germinal (linfocitos T GEM) se limitan al reconocimiento de glicolípidos presentados de forma cruzada por moléculas no HLA. Se considera que los linfocitos T iNK interactúan en gran medida con glicolípidos presentados por CD1d mientras que los linfocitos T GEM interactúan con glicolípidos presentados por CD1b. Se cree que otras formas de linfocitos T interactúan con glicolípidos en el contexto de CD1a y CD1c; sin embargo, dichas células aún deben caracterizarse con un detalle significativo.

Linfocitos T ap convencionales

La característica clave de la mayoría de los linfocitos T ap es el reconocimiento de antígenos peptídicos en el contexto de moléculas HLA. Se denominan frecuentemente linfocitos T ap 'convencionales'. En un individuo, las moléculas de propias de HLA presentan péptidos de proteínas propias y extrañas a los linfocitos T, proporcionando la base esencial de la inmunidad adaptativa contra neoplasias y patógenos extraños, tolerancia adaptativa hacia organismos comensales, alimentos y el propio organismo. El locus de1HLA que codifica para las proteínas HLA es la región más polimórfica y densa en genes del genoma humano, y se han descrito más de 12.000 alelos en humanos. El elevado grado de polimorfismo en el locus de1HLA asegura una diversidad de presentación de antígenos peptídicos entre individuos, que es importante para la inmunidad a nivel de población.

HLA de clase I y II

Existen dos formas de complejos clásicos de HLA: HLA de clase I (HLAI) y HLA de clase II (HLAII). Existen tres genes de HLAI clásicos: HLA-A, HLA-B, HLA-C. Estos genes codifican para una cadena a que atraviesa la membrana, que se asocia con una cadena invariante de p2-microglobulina (p2M). La cadena a de HLAI se compone de tres dominios con un pliegue de inmunoglobulina: a1, a2 y a3. El dominio a3 es proximal a la membrana y en gran medida invariante, mientras que los dominios a1 y a2 forman juntos la hendidura de unión al antígeno distal a la membrana polimórfica. Existen seis genes de HLAII clásicos: HLA-DPAl, HLA-DPB1, HLA-DQA1, HLA-DQB1, HLA-DRA, y HLA-DRB1. Estos genes codifican complejos DP, DQ y DR heterodiméricos de HLA que comprenden una cadena a y una cadena p. Cada cadena tiene dos dominios estructurales principales con un pliegue de inmunoglobulina, donde el dominio a2 y p2 comprende módulos proximales a la membrana y en gran medida invariantes similares a los del dominio a3 de HLAI. Los dominios a2 y p2 de HLAII forman juntos la hendidura de unión al antígeno distal a la membrana y son regiones de elevado polimorfismo.

La hendidura de unión al antígeno de HLAI y HLAII comprende dos hélices a antiparalelas sobre una plataforma de ocho láminas p antiparalelas. En esta hendidura, el antígeno peptídico se une y presenta en una conformación extendida. Los restos de contacto con péptidos en HLAI y HLAII son el lugar de la mayor parte del polimorfismo de secuencias, que constituye la base molecular de los diversos repertorios de péptidos presentados por distintos alelos de HLA. El péptido tiene un amplio contacto con la hendidura de unión al antígeno y, como resultado, cada alelo de HLA impone restricciones y preferencias de secuencia distintas sobre los péptidos presentados. Por lo tanto, un péptido dado se unirá únicamente a un número limitado de HLA y, a la inversa, cada alelo admite únicamente una fracción particular de la colección de péptidos de una proteína determinada. El conjunto de alelos de HLAI y HLAII que está presente en cada individuo se denomina haplotipo de HLA. El polimorfismo de los genes de HLAI y HLAII y la expresión codominante de alelos heredados dan lugar a una diversidad muy grande de haplotipos de HLA en la población humana, que cuando se une a la enorme diversidad de secuencias de los TCR ap, supone un importante problema para la estandarización del análisis de estas interacciones HLA-antígeno-TCR.

Acoplamiento del TCR ap de HLAI y HLAII

Los TCR ap reconocen péptidos como parte de una interfase de unión a pHLA mixta formada por restos tanto de1HLA como del antígeno peptídico (autoalterado). Los complejos de HLAI se presentan en la superficie de casi todas las células nucleadas y generalmente se considera que presentan péptidos derivados de proteínas endógenas. Por lo tanto, los linfocitos T pueden interrogar el proteoma celular endógeno de una célula presentadora de HLAI mediante el muestreo de los complejos de pHLAI de una célula interactuante. El acoplamiento de HLAI requiere la expresión del correceptor CD8 del TCR por el linfocito T interactuante; por lo tanto, el muestreo de HLAI está limitado a los linfocitos T CD8+ ap. Por el contrario, la presentación superficial de los complejos HLAII está restringida en gran medida al APC profesional y de forma general se considera que presentan péptidos derivados de proteínas exógenas a la célula presentadora. Por lo tanto, un linfocito T interactuante puede interrogar al proteoma del microambiente extracelular en el que reside la célula presentadora.

El acoplamiento de HLAII requiere la expresión del correceptor CD4 del TCR por el linfocito T interactuante; por lo tanto, el muestreo de HLAII está restringido a los linfocitos T CD4+ ap.

Selección tímica de los TCR ap

La función de los TCR ap, como se ha descrito anteriormente, es la detección de complejos de pHLA, de forma que el linfocito T presentador de TCR pueda suscitar respuestas relacionadas con la función de dicho linfocito T para establecer inmunidad. Debe tenerse en cuenta que el repertorio de TCR ap generado dentro de un individuo debe dar cuenta de la inmensa e imprevista diversidad de todos los antígenos extraños que probablemente se encuentren en el contexto de un haplotipo específico y antes de su aparición real. Este resultado se logra en un entorno donde se generan numerosos TCR ap extremadamente diversos de una forma casi aleatoria con el potencial de reconocer complejos de pHLA no especificados al tiempo que solo se instruyen específicamente para evitar interacciones fuertes con los pHLA propios. Esto se coordina cuidadosamente durante la maduración de los linfocitos T en un proceso denominado selección tímica de los linfocitos.

Durante la primera etapa de maduración de linfocitos T en el timo, los linfocitos T que portan TCR ap que no pueden interactuar con complejos auto-pHLA con suficiente afinidad, son despojados de una señal de supervivencia y se eliminan. Esta etapa, denominada selección positiva, asegura que los linfocitos T supervivientes porten un repertorio de TCR que sea al menos potencialmente capaz de reconocer péptidos extraños o alterados presentados en el contexto correcto de HLA. Posteriormente, los TCR ap que interactúan fuertemente con pHLA propios y, por lo tanto, tienen el potencial de activar la autoinmunidad se eliminan activamente a través de un proceso de selección negativa. Esta combinación de selección positiva y negativa da lugar a que solo sean los linfocitos T los que solamente llevan TCR ap con baja afinidad por el pHLA propio que puebla la periferia. Esto establece un repertorio de linfocitos T ap que está autorrestringido pero que no es autorreactivo. Esta naturaleza altamente individualizada de la génesis de linfocitos T frente al haplotipo de HLA subraya las dificultades existentes en el análisis normalizado de las interacciones TCR ap-HLA. Además, forma la base tanto del rechazo de injertos como de la enfermedad de injerto contra hospedador, y del principio general de que los TCR ap identificados en un individuo pueden tener un efecto completamente diferente en un segundo individuo, lo que tiene claras implicaciones para estrategias terapéuticas y de diagnóstico basadas en TCR y basadas en linfocitos T que surgen en la práctica clínica.

Linfocitos T ap no convencionales

Las formas no restringidas por HLA, o 'no convencionales', de linfocitos T ap tienen dianas de antígeno molecular muy diferentes. Estos linfocitos T ap no convencionales no se acoplan a los complejos de HLA clásicos, sino que se acoplan a proteínas similares a HLA conservadas tales como la familia CD1 o MR1. La familia CD1 comprende cuatro formas implicadas en la presentación de antígenos cruzada (CD1a,b,c y d). Estos complejos de superficie celular tienen una cadena a parecida a HLAI, que forma heterodímeros con p2-M. Un pequeño bolsillo hidrófobo presentado en la superficie distal de la membrana de la cadena a forma un sitio de unión para antígenos basados en lípidos derivados de patógenos. Linfocitos T innatos como los linfocitos NK (linfocitos T iNK) son el ejemplo mejor entendido de reconocimiento de la familia de lípidos/CD1 donde los linfocitos T GEM representan otro ejemplo destacado. Se sabe que los linfocitos T iNK 'Tipo I' interactúan fuertemente con el lípido a-GalCer en el contexto de CD1d. Estos linfocitos T iNK muestran una diversidad de TCR muy limitada con una cadena a del TCR fija (Va10/Ja18) y un número limitado de cadenas p (con uso restringido de vp) y se han asimilado a receptores de reconocimiento de patrones moleculares innatos asociados a patógenos (PAMPS) tales como los receptores similares a Toll y a Nod. Por el contrario, los linfocitos T NK 'Tipo II' presentan un repertorio de TCR más diverso, y parecen tener un modo de acoplamiento al complejo CD1 d-lípido más diverso. Las linfocitos T GEM reconocen los glicolípidos derivados de micobacterias presentados por CD1b, sin embargo, solo están empezando a comprenderse los detalles moleculares de la presentación de antígenos por CD1 a, b y c así como su reconocimiento de linfocitos T.

Las células MAIT expresan principalmente una cadena a invariante del TCR (TRAV1-2 ligado a TRAJ33, TRAJ20 o TRAJ12), que puede emparejarse con una serie de cadenas p del TCR. En vez de péptidos o lípidos, los TCR MAIT pueden unirse a metabolitos de folato y riboflavinizados derivados de patógenos presentados por la molécula análoga a HLAI, MR1. La diversidad limitada pero significativa en los TCR observados en los TCR MAIT parece permitir el reconocimiento de metabolitos diversos pero relacionados en el contexto del MR1 conservado.

No se entiende bien cómo se seleccionan en el timo los TCR de linfocitos T ap no clásicos restringidos por HLA durante la maduración. Sin embargo, parece probable que se siga aplicando el proceso fundamental de selección negativa y positiva descrito anteriormente y algunas pruebas sugieren que esto ocurre en nichos especializados dentro del timo.

Linfocitos T y5

A diferencia de la comprensión mecanística detallada de la génesis de los TCR ap y de la unión a pHLA, se sabe relativamente poco acerca de los antígenos diana y el contexto de sus contrapartes los linfocitos T yS. Esto se debe en parte a su abundancia relativamente baja en el compartimiento de linfocitos T circulantes. Sin embargo, se considera en general que los linfocitos T yS no están restringidos estrictamente por HLA y parecen reconocer el antígeno de superficie más libremente de forma no muy distinta a la de los anticuerpos. De forma adicional, se ha apreciado más recientemente que los linfocitos T yS pueden dominar el compartimiento de linfocitos T residente de tejidos epiteliales, el sitio de interacción principal del sistema inmunitario con el antígeno extraño. Además, están empezando a aparecer en la bibliografía diversos mecanismos de inmunovigilancia de tumores y de vigilancia de otras formas de células propias desreguladas para linfocitos T yS. Las dianas de antígeno específicas de los linfocitos T yS de Tipo tanto innato como adaptativo siguen estando poco definidas, pero la distribución en los tejidos y el reconocimiento rápido de los PAMP sugieren un papel fundamental de los linfocitos T yS tanto en la respuesta temprana a antígenos extraños como también temprano en la vida cuando el sistema inmunitario adaptativo aún está madurando.

Las diversas funciones de los linfocitos T yS parecen estar basadas en el uso de distintos segmentos génicos Vy V5, y pueden clasificarse ampliamente en dos categorías principales en las que los linfocitos T yS con TCR en gran medida invariables median el reconocimiento similar al innato de los PAMP muy tempranamente en la infección. Además de los PAMP, se cree que este tipo de linfocitos T yS reconocen además moléculas propias, incluidos fosfoantígenos que podrían proporcionar señales muy tempranas de estrés celular, infección y desarrollo potencialmente neoplásico. El reconocimiento de los PAMP y los denominados patrones moleculares asociados a peligro (DAMPS), así como las grandes cantidades de linfocitos T yS similares a los innatos con restringidos a tejidos sugieren fuertemente que estos linfocitos son adecuados para responder rápidamente a la exposición de antígenos sin necesidad de activación, migración selectiva y expansión clonal previas.

Se considera que una segunda forma de linfocitos T yS son de naturaleza más adaptativa, con un repertorio de TCR yS muy diverso y la capacidad de circular periféricamente y de acceder a los tejidos linfoides directamente. Se han descrito dichos linfocitos T yS específicos de antígeno para patógenos humanos comunes dichos como el CMV, y parecen constituir una respuesta con memoria. Sin embargo, también se ha observado que los linfocitos T Y5 muestran únicamente proliferación clonal relativamente limitada después de la activación y hay pocos datos disponibles sobre el grado de diversidad del TCR y las respuestas específicas de los linfocitos T yS en circulación periférica, o en tejidos. Además, aun cuando se considera de forma general que los TCR yS no interactúan con los complejos de pHLA y, por lo tanto, no se unen a los antígenos peptídicos en este contexto, solo se han caracterizado algunas dianas de antígeno de los linfocitos T yS y la comprensión del marco molecular subyacente es muy limitada.

La baja frecuencia de los linfocitos T yS periféricos y la dificultad para estudiar los linfocitos T residentes en tejidos de seres humanos han limitado nuestro conocimiento de cómo este tipo importante y diverso de linfocitos T participa en las respuestas inmunitarias adaptativas. Esta área emergente de investigación requeriría tecnologías más fiables con las que capturar y caracterizar linfocitos T yS poco frecuentes, aislar sus pares de TCR e identificar sus antígenos afines.

Antígenos y células presentadoras de antígeno

En el contexto de los linfocitos T y los TCR, los antígenos pueden definirse como cualquier molécula que puede unirse a un TCR dando lugar a una señal que se transduce dentro del linfocito T. Los antígenos de linfocitos T mejor caracterizados son péptidos presentados en un complejo con HLAI y HLAII y unidos a linfocitos T ap convencionales. Sin embargo, en los últimos años se ha hecho evidente que los linfocitos T ap no convencionales y los linfocitos T yS son capaces de unirse a una amplia variedad de biomoléculas como antígenos, incluidos lípidos, lipopéptidos, glicopéptidos, glicolípidos y a varios metabolitos y catabolitos. Además, se ha observado que los linfocitos T yS pueden unirse a proteínas completamente plegadas directamente de forma similar a los anticuerpos. Por lo tanto, el punto de vista de de los antígenos de linfocitos T están restringidos en gran medida a péptidos presentados por h La se ha ampliado en las dos últimas décadas para incluir casi cualquier biomolécula. Con este concepto en mente, es relevante definir qué puede considerarse una célula presentadora de antígeno (APC).

Como se ha definido en las secciones anteriores, HLAI y HLAII tienen perfiles de expresión dispares entre los diversos tipos de células. Se acepta ampliamente que casi todas las células nucleadas presentan complejos HLAI en la superficie celular y, por lo tanto, son competentes para presentar antígenos peptídicos para el muestreo de linfocitos T. Sin embargo, el HLAII tiene un perfil de expresión restringido, y al menos en condiciones de estado estacionario se expresa únicamente en la superficie de células que tienen una función especializada de presentación de antígenos, incluidas las células dendríticas (DC), macrófagos y linfocitos B. Estos tipos de células especializadas se denominan frecuentemente APC profesionales. Para los propósitos de este documento, el término APC se utiliza para describir cualquier célula nucleada con capacidad de presentar un antígeno para el muestreo de linfocitos T ap o yS. Tales antígenos no se limitan a los presentados como 'carga' en complejos presentadores de antígeno específicos, tales como HLA y moléculas similares a HLA, sino que también pueden incluir cualquier resto presentado en la superficie celular que pueda unirse a un linfocito con TCR ap o yS.

Uso terapéutico de los TCR

La transferencia adoptiva de linfocitos T primarias se ensayó primero en un entorno clínico a principios de la década de los 90 del siglo pasado, partiendo de linfocitos T expandidos ex vivo polarizados hacia antígenos víricos para conferir inmunidad viral en pacientes inmunocomprometidos. Se han ensayado enfoques similares utilizando linfocitos T primarios expandidos ex vivo contra antígenos específicos de cáncer poco después para el tratamiento de neoplasias malignas. Una limitación en estos enfoques tempranos que sigue constituyendo un desafío hoy día es no comprender la naturaleza y diversidad de linfocitos T enfrentados a la necesidad de optimizar finamente su composición en el producto terapéutico. Actualmente, el uso de linfocitos T primarios expandidos ex vivo ha sido abandonado en gran medida por la industria farmacéutica con excepción de unas pocas iniciativas que utilizan linfocitos T primarios con especificidad para antígenos víricos.

En los últimos años, la capacidad de introducir material genético de forma fiable en células humanas primarias ha sido testigo del surgimiento de una serie de agentes terapéuticos de linfocitos T experimentales genéticamente modificados. Dichos productos celulares terapéuticos tienen como propósito aprovechar la potencia de las respuestas de linfocitos T y redirigir la especificidad de los linfocitos T hacia un antígeno diana asociado a una enfermedad, por ejemplo, un antígeno expresado únicamente por células cancerosas. Estos han dependido en gran medida de la transferencia de un receptor de antígeno quimérico (CAR) a linfocitos T receptores, en vez de pares de cadenas del TCR reales. Un CAR representa un resto de direccionamiento (con mayor frecuencia, un elemento de anticuerpo monocatenario dirigido a una proteína expresada en la superficie de células cancerosas) injertada en elementos receptores de señal tales como la cadena Z del complejo CD3, para producir un receptor quimérico sintético que imita la función del CD3-TCR. Estos denominados productos de linfocitos T CAR (CAR-T) han tenido un éxito mixto en ensayos clínicos hasta la fecha y a pesar de su potencial no es fácil de llevarlos más allá de tumores con dianas moleculares únicas inherentes tales como neoplasias malignas de linfocitos B. De forma alternativa, la transferencia del par de cadenas de TCR de longitud completa a los linfocitos T presenta un interés creciente. Actualmente, dichos agentes terapéuticos de linfocitos T con TCR manipulado genéticamente están limitados por procesos de fabricación complicados y, como sucede con los productos CAR-T, por una escasez de antígenos diana y de construcciones de direccionamiento validadas. Hasta la fecha se ha centrado en el uso de los TCR ap para el reconocimiento de antígenos peptídicos presentados por HLAI en células cancerosas, y un desafío fundamental de este enfoque es la necesidad de que los antígenos sean específicos de células cancerosas.

Se ha considerado que dado que la interacción TCR-pHLA tiene afinidad relativamente baja, es probable que los TCR nativos sean subóptimos para terapias de linfocitos T con TCR manipulados genéticamente. Se han diseñado varios enfoques para TCR madurados por afinidad in vitro, de forma muy parecida a la maduración por afinidad de anticuerpos monocatenarios. Estos enfoques de maduración por afinidad de los TCR también utilizan de forma general formatos monocatenarios, en donde la región V de una cadena se fusiona a la región V de otra cadena para producir una construcción polipeptídica única. Dichos polipéptidos únicos pueden utilizarse después en sistemas de presentación en fagos o levaduras adaptados a partir de flujos de trabajo de ingeniería de anticuerpos y pasados por rondas de selección basadas en la unión a la diana. Existen dos limitaciones inherentes en dicho enfoque del TCR monocatenario en términos de producir pares funcionales de cadenas del TCR. En primer lugar, la selección se basa en la afinidad de unión a la diana. Sin embargo, se ha documentado bien que la afinidad del TCR no siempre está correlacionada con la intensidad o la competencia de la salida de señalización del TCR. En segundo lugar, la selección de construcciones monocatenarias basada en afinidad no siempre se traduce en afinidades equivalentes una vez que se reconstituyen como receptores de longitud completa.

En un contexto terapéutico, existe una limitación adicional en los pares del TCR madurados por afinidad. Es decir, considerando que sus secuencias se han alterado, las construcciones resultantes por definición ya no están sometidas a selección tímica, en donde los TCR que reaccionan fuertemente con los antígenos propios se eliminan del repertorio. Por lo tanto, estos TCR modificados conllevan el riesgo inherente de ser autorreactivos, lo que es muy difícil de descartar in vitro utilizando los métodos actuales. Por la misma razón, debe individualizarse cualquier TCR seleccionado o diseñado genéticamente para la aplicación terapéutica. Si los TCR son TCR modificados artificialmente o TCR nativos aplicados entre individuos, deben descartarse las reactividades cruzadas sobre la base del haplotipo de HLA y el repertorio de péptidos presentado de cada individuo específico para evitar una autoinmunidad potencialmente letal. Esto se debe al hecho de que la selección tímica se hace en un fondo de todas las moléculas HLA disponibles específicas únicamente para dicho individuo dado. La probabilidad de dicha reactividad cruzada no está clara. Sin embargo, la capacidad de nuestro repertorio de TCR para reconocer los complejos de pHLA de otros individuos de la misma especie como extraños es una propiedad fundamental de la inmunidad adaptativa y es la base del rechazo a los injertos y de la enfermedad de injerto contra hospedador. Ensayos clínicos recientes que utilizan un par de cadenas de TCR maduradas frente al antígeno asociado a melanoma específico de cáncer (MAGE) señalaban el problema potencial de evitar la selección tímica. Cuando los linfocitos T autólogos que contenían los TCR madurados se volvieron a infundieron a dos pacientes con cáncer, estos pacientes desarrollaron rápidamente una cardiopatía mortal. Estudios posteriores determinaron que los TCR madurados específicos de MAGE tuvieron reactividad cruzada con un péptido presentado por HLAI de la proteína cardíaca titina. Esto sugiere fuertemente que la reactividad cruzada es una posibilidad clara en el uso terapéutico de los TCR.

Una forma distinta de utilizar los TCR con fines terapéuticos es su uso como reactivos de afinidad de una forma muy parecida a las sustancias terapéuticas de anticuerpos. Se han utilizado moléculas del TCR monocatenario en ensayos clínicos para administrar sustancias de fármacos conjugados a poblaciones celulares que expresan antígenos específicos de HLA. Este enfoque se considera en general más seguro que los agentes terapéuticos de linfocitos T CAR o con TCR manipulados, ya que la administración de la sustancia farmacológica puede simplemente retirarse. Sin embargo, el potencial de reactividad cruzada y los efectos no buscados que son difíciles de prever siguen suponiendo una limitación potencial en este escenario.

Detección del repertorio de TCR en el diagnóstico clínico

En un aspecto relacionado, existe un creciente interés en utilizar la detección de la abundancia de secuencias específicas del TCR con fines de diagnóstico clínico. Con el aumento de los métodos de secuenciación profunda en particular, es posible capturar de forma global toda la diversidad del TCR en un individuo y de pares ap coincidentes en contextos específicos. Esto supone potencialmente un medio para diagnosticar dolencias y patologías específicas simplemente detectando la abundancia de clones de linfocitos T expandidos, como lectura indirecta de la respuesta inmunitaria establecida contra un antígeno asociado a enfermedad en el paciente. Sin embargo, dichos enfoques globales están limitados actualmente a respuestas inmunitarias muy intensas con puntos temporales clínicos establecidos y presentan la dificultad subyacente de identificar el antígeno diana específico de cualquier TCR particular identificado mediante secuenciación.

Uso terapéutico y de diagnóstico de antígenos de linfocitos T

El punto fuerte fundamental de aprovechar las respuestas inmunitarias adaptativas se traduce en un desafío técnico fundamental ya que la exquisita especificidad de la interacción TCR-antígeno requiere un conocimiento detallado de los antígenos asociados específicamente a cada patógeno, célula cancerosa o enfermedad autoinmune. Además, cada antígeno puede presentarse mediante un complejo presentador de antígeno específico, o alelo del mismo, de forma que el descubrimiento del antígeno debe hacerse para cada gen HLA y alelo correspondientes. Para varias enfermedades infecciosas como el VIH, la gripe y el CMV que están asociadas con respuestas inmunitarias adaptativas fuertes y que muestran generalmente jerarquías de respuesta de epítopos conservadas, se han cartografiado los epítopos más importantes en el contexto de algunos HLA comunes. De forma similar, se han hecho esfuerzos crecientes y sistemáticos en los campos del cáncer, de la alergia y de la autoinmunidad para mapear los antígenos asociados a linfocitos T. Sin embargo, son procedimientos complicados y los esfuerzos para describir de forma sistemática los antígenos de linfocitos T asociados a distintos contextos clínicos se ven obstaculizados por la ausencia de protocolos eficientes, sólidos, rápidos y escalables.

Específicamente, las células cancerosas suponen un aspecto importante y difícil, ya que la mayoría de los péptidos presentados en la superficie de las células cancerosas son antígenos propios o muy similares a los propios. Por lo tanto, la selección tímica habrá eliminado los TCR que podrían reconocer fuertemente estos péptidos, al tiempo que el tumor evoluciona para evadir el reconocimiento inmunitario. Esto significa que las respuestas inmunitarias potentes contra tumores establecidos son relativamente poco frecuentes y dianas difíciles de predecir o descubrir. Sin embargo, estas respuestas existen y, lo que es importante, se asocian generalmente con un mejor resultado. En la mayoría de casos, los antígenos asociados a tumores (TAA) tendrán características distintivas de los antígenos propios y se derivarán de proteínas que se sobreexpresan durante el desarrollo del cáncer, que de lo contrario estarían ausentes del tipo celular en esta etapa del desarrollo o alteradas específicamente por mutación genética o modificaciones postraduccionales tales como la fosforilación.

Cuando está disponible, el conocimiento de dichos epítopos permite interrogar la respuesta de los linfocitos T asociados para realizar descubrimientos fundamentales, con fines de diagnóstico y, por ejemplo, como una prueba de eficacia de una vacuna. Es importante destacar que también proporcionan dianas muy específicas para la tolerización de linfocitos T en alergia y autoinmunidad y, de forma crucial, apuntan a dianas valiosas para inmunoterapia específica y contra células cancerosas. Las neoplasias representan una diana especialmente valiosa ya que la promesa de inmunoterapias celulares y el progreso en las manipulaciones de linfocitos T se ven ralentizadas por una falta de TAA diana validadas más allá de los pocos casos donde se dispone de marcadores específicos para el tipo de cáncer.

A la vista del potencial de la terapia celular y de la falta de dianas validadas, la identificación de antígenos de TCR prometedores sigue siendo uno de los cuellos de botella más acuciantes de la inmunoterapia basada en TCR, especialmente en el esfuerzo para tratar el cáncer.

Obtención de los ORF del TCR de longitud completa

Debido principalmente a la diversidad de uso en segmentos génicos V en los TCR de origen natural, es complicado capturar datos de secuencia de cadenas de TCR emparejadas procedentes de grupos de linfocitos T. De forma general, para capturar de forma fiable la secuencia con fiabilidad elevada, es necesario amplificar el TCR utilizando métodos de transcripción inversa y/o PCR, con una combinación de cebadores que cubra toda la diversidad de la región V de la combinación de dianas. Este proceso genera fragmentos de ORF a partir de los que pueden obtenerse los datos de secuencia; sin embargo, constituye un material de partida inadecuado para clonar fácilmente ORF del TCR de longitud completa. Por lo tanto, las estrategias de alta eficiencia para extraer datos de secuencias emparejadas partiendo de grupos de linfocitos T son generalmente incompatibles con la clonación de los ORF del TCR de longitud completa para aplicaciones posteriores. Por lo tanto, se requiere una síntesis costosa y prolongada de los ORF del TCR para cualquier ensayo o aplicación funcional de los pares de TCR secuenciados.

Diversificación de los ORF del TCR de longitud completa

El uso terapéutico creciente de los TCR ha visto un aumento del interés por diversificar las secuencias del TCR dentro de flujos de trabajo de afinidad y/o maduración funcional para obtener pares de TCR sintéticos de especificidad y función definidas. De forma general, esto se ha logrado mediante la unión de pares de cadenas de TCR en una construcción monocatenaria para metodologías de presentación de fagos, y la introducción de una diversidad de secuencias en estas construcciones monocatenarias. Actualmente faltan tecnologías que puedan diversificar rápidamente los ORF del TCR únicos de forma sistemática, y donde estos ORF del TCR de longitud completa sean aplicables a ensayos y/o selección inmediatos en un contexto de expresión en superficie en células de mamífero viables. Una tecnología de ese tipo sería de gran valor en la maduración de los pares de TCR, con especificidad y capacidad de señalización altamente definidas, para uso terapéutico.

Aspectos tecnológicos de los análisis de TCR y antígenos de linfocitos T

En general, el desarrollo de terapias basadas en TCR sigue estando en sus primeras etapas y el éxito ha sido limitado. Los enfoques de diagnóstico, si bien tienen un inmenso potencial, rara vez se han aplicado en estudios clínicos controlados que pretendan evaluar patologías o respuestas a terapia en pacientes. Unas técnicas no suficientemente desarrolladas para la captura fiable de pares de cadenas del TCR nativos y el análisis sistemático de interacciones TCR-antígeno con elevado rendimiento y en un contexto funcional de comunicación celular han sido los principales obstáculos para el desarrollo de terapias y diagnósticos basados en TCR.

Los enfoques de secuenciación profunda han llevado a una mejor comprensión de la diversidad de los receptores de los linfocitos T en la salud y en la enfermedad. Sin embargo, estos enfoquesse han centrado generalmente en tramos cortos que abarcan las regiones CDR3, principalmente de la cadena p del TCR. La mayoría de los estudios han ignorado la contribución de la cadena a del TCR, y pocos han buscado analizar las cadenas ap emparejadas así como la especificidad de antígeno de los TCR considerados de interés. Los flujos de trabajo recientes utilizando encapsulación de células únicas y codificación genética ha permitido el emparejamiento de pares de cadenas ap o yS del TCR nativo y el análisis de secuencias de longitud completa; sin embargo, dichos flujos de trabajo siguen siendo experimentales.

Los pares de cadenas del TCR aislados pueden analizarse en términos de especificidad de antígeno en modos biofísico o funcional. El análisis biofísico requiere la producción recombinante tanto del TCR como del antígeno analito en forma soluble. En el caso de los TCR restringidos al HLA, esto requeriría por lo tanto la generación de todos los TCR individuales así como de los complejos pHLA afines. Esto supone un desafío técnico muy considerable, es lento y con muy bajo rendimiento. Además, dicho análisis solo proporcionaría afinidades de interacción, que no están bien correlacionadas con características funcionales de formas predecibles.

Hasta hace poco, el análisis funcional detallado de secuencias del TCR aisladas en un contexto celular se ha limitado a laboriosos protocolos de transfección de pares de cadenas del TCR analito a linfocitos T primarios o a líneas de linfocitos T inmortales, y la detección de respuestas celulares mediante análisis por citometría de flujo tradicional de la activación celular, o detección de factores secretados desde células transfectadas en la exposición con antígeno. En una publicación reciente de Guo y col., se comunicó la clonación rápida, expresión y caracterización funcional de cadenas de TCR emparejadas procedentes de células individuales (Molecular Therapy - Methods and clinical development (2016) 3: 15054). En este estudio, se expresaron parejas de analitos de TCR ap humanos en una línea celular indicadora que carecía de expresión de TCR ap, y que contenía un sistema indicador de proteína fluorescente verde (GFP) unido al promotor Nur77 que se activa en la estimulación del TCR. Este sistema sigue siendo ineficiente debido a la falta de integración estandarizada del TCR en el genoma de la línea celular indicadora, y no proporciona una forma sistemática para la exposición con antígeno unido a células por un elemento APC.

De forma similar a los flujos de trabajo para identificar los TCR contra antígenos de linfocitos T conocidos, el descubrimiento de novo de antígenos de linfocitos T novedosos para la salud y la enfermedad sigue suponiendo un desafío considerable. La mayoría de los enfoques siguen siendo de naturaleza biofísica, y tienen como propósito producir antígenos candidatos que puedan ensayarse en protocolos de inmunización, o a través de la identificación de TCR afines como se ha tratado anteriormente. Existe poca o ninguna estandarización en el campo del descubrimiento de antígenos de linfocitos T, y el campo está restringido en gran medida al estudio académico.

Con el interés creciente en los TCR y sus antígenos afines para uso tanto terapéutico como diagnóstico, y con la aparición de medios para capturar cantidades significativas de pares de cadenas ap y yS nativos, aún se carece de tecnologías fiables de alto rendimiento y estandarizadas para el análisis sistemático de interacciones TCR-antígeno. Es importante señalar que se carece de sistemas estandarizados para la reconstitución rápida y/o diversificación sistemática de los ORF del TCR de longitud completa, de forma que estos ORF puedan aplicarse directamente al análisis funcional de pares de cadenas de TCR en el contexto nativo de un TCR de analito que se presenta en la superficie de una célula viable en un contexto nativo. Dicha capacidad es importante para lograr análisis de alto rendimiento de pares de cadenas de TCR nativas, pero también maduración por afinidad y/o funcional de pares de cadenas de TCR para usos terapéuticos y diagnósticos.

Existe una clara necesidad de métodos rápidos y sistemáticos para la reconstitución de cadenas de TCR, y de su diversificación sistemática, en métodos de alto rendimiento que permitan el uso de TCR en diagnóstico basado tanto en informática como en reactivos, y también inmunoterapias personalizadas basadas en el TCR.

Descripción detallada de la invención

La presente invención aborda las necesidades anteriormente mencionadas. La presente invención proporciona en un primer aspecto, un sistema de vectores bicomponente que comprende genotecas preensambladas que consisten en vectores que contienen secuencias variables (V), de unión (J) y constantes (C) para cadenas de TCR. El primer componente de dicho sistema comprende un vector de entrada V-C que contiene secuencias V y C. El segundo componente del sistema comprende un vector donante J que contiene la secuencia J. El sistema de vectores bicomponente está preensamblado en genotecas de vectores de entrada V-C y vectores donantes J con todas las combinaciones de secuencias V-C y secuencias J deseables, respectivamente. El sistema de vectores bicomponente se diseña de forma que un único vector de entrada V-C y un único vector donante J con las secuencias deseadas pueden combinarse con un dúplex de oligonucleótidos de ADN corto que codifica una secuencia CDR3 (odeCDR3) para reconstituir un ORF del TCR de longitud completa in vitro, en un solo tubo de ensayo en una reacción dependiente de enzima de restricción y ligasa e independiente de PCR. Además, el sistema modular bicomponente está idealmente adaptado para generar rápidamente grandes genotecas de ORF del TCR de longitud completa sintéticos o mutantes para flujos de trabajo de maduración por afinidad o funcional. En un segundo aspecto, los vectores de entrada V-C modificados para un par recíproco de cadenas TCR (es decir, TRA/TRB o TRD/TRG) se compilan en un sistema vectorial de 5 componentes para proporcionar un sistema en el que los pares de cadenas TCR reconstituidas pueden unirse en un único vector. Este segundo sistema utiliza ambos vectores de entrada V-C modificados, los mismos vectores donantes J que el primer sistema, y también un vector donante del terminador bidireccional (donante BiT) para obtener pares de cadenas del TCR contiguos codificados en orientación antiparalela en una construcción final, donde cada cadena del TCR intercala un elemento 'terminador bidireccional'.

Sistema de ingeniería y reconstitución del ORF del TCR (TORES)

La presente invención proporciona en primer lugar un sistema de vectores bicomponente con características únicas adecuadas para los usos anteriormente mencionados. Este sistema de reconstitución e ingeniería genética del ORF del TCR (TORES) se utiliza junto con un tercer componente, un dúplex de oligonucleótidos que codifica CDR3 (odeCDR3), para ensamblar de novo los ORF del TCR de longitud completa dentro de un contexto de vector definido y/o generar diversidad de secuencias con fórmula dentro de un ORF de TCR determinado.

La presente invención se resume en la Figura 1A. Un vector de entrada V-C seleccionado que contiene los segmentos génicos V y C del TCR necesarios para un ORF del TCR de longitud completa diana se combina con un vector donante J que contiene el segmento génico J del TCR necesario. El ORF del TCR de longitud completa se completa mediante la adición de un dúplex de oligonucleótidos que codifica CDR3 (odeCDR3), que representa la secuencia no fijada de la línea no germinal generada durante la recombinación V(D)J e interpuesta por la secuencia de V y J fija codificada por la línea germinal codificada por el vector de entrada V-C y el vector donante J, respectivamente. El sistema de vectores bicomponente y el tercer componente de odeCDR3 está diseñado de forma que, cuando se combinan en una reacción de ciclo de enzima de restricción y ligasa, se reconstituye el ORF de V-CDR3-J-C TCR completo. Esto se logra mediante una o más enzimas de restricción de Tipo IIS que se utilizan para realizar el ensamblado “ sin cicatrices” de los elementos genéticos de forma estandarizada. El sistema de vectores bicomponente se ensambla en una genoteca que contiene todos los segmentos génicos V, C y J necesarios para la reconstitución de los ORF diana del TCR de longitud completa (Figura 1B). Por ejemplo, puede construirse una genoteca que contenga todos los segmentos génicos que codifican las secuencias de proteínas nativos del repertorio TRA humano como se describe en los Ejemplos 1 y 2, y el repertorio TRB humano como se describe en el Ejemplo 3.

Para reconstituir un ORF del TCR de longitud completa, a partir de la información de secuencia que es suficiente para definir el uso de segmentos génicos V, J y C, junto con la secuencia CDR3 no fija intercalada por segmentos V y J fijos, primero se seleccionan el vector de entrada V-C y el vector donante J que corresponden al uso V/C y J del ORF diana del TCR. También se genera un odeCDR3 que corresponde a la secuencia de CDR3 no fija necesaria para completar el ORF del TCR de longitud completa. Estos tres componentes se combinan con una enzima de restricción de Tipo IIS y una enzima ADN-ligasa en una reacción de ciclo para generar el ORF diana del TCR de longitud completa como se describe en la Figura 4 y en el Ejemplo 7. El TCR de longitud completa reconstituido resultante está contenido dentro de la cadena principal del vector de entrada V-C, por lo tanto contiene todas las características del vector contenidas dentro de esta construcción parental.

La acción de la enzima de restricción de Tipo IIS de los tres componentes combinados (Figura 4 a, b, c) en un ciclo de reacción con enzima de restricción/ligasa da lugar a dos subproductos de reacción y a dos productos intermedios de reacción. El subproducto de reacción derivado del vector de entrada V-C es el marcador de selección natural escindido y los sitios de unión de Tipo IIS (Figura 4D). La cadena principal del vector donante J de la cual se ha escindido la parte del segmento J representa un segundo subproducto de reacción (Figura 4E). La parte de segmento J escindida del vector donante J representa un producto de reacción intermedio, y contiene tanto una parte de segmento J, una parte C pequeña del segmento C, como salientes monocatenarios necesarios para la ligación (Figura 4F). El segundo intermedio de reacción es la cadena principal de entrada V-C parental que contiene los segmentos V y C, y salientes monocatenarios necesarios para la ligación (Figura 4G). El producto final de la reacción representa un ORF del TCR de longitud completa reconstituido dentro de la cadena principal del vector de entrada V-C precursor, que comprende la ligación del odeCDR3 (Figura 4C), la parte escindida del segmento J (Figura 4F) y la cadena principal de entrada V-C que contiene los segmentos génicos V y C (Figura 4G).

Componentes del vector de entrada V-C y del vector donante J

En el presente contexto, un sistema bicomponente combinado incluye uno o más vectores de entrada V-C que contienen

a. origen de replicación,

b. un primer marcador de selección positiva,

c. elemento o elementos genéticos 5',

d. secuencia de Kozak,

e. segmento génico variable del TCR,

f. una primera secuencia de Tipo IIS, para el reconocimiento y escisión específicos de sitio mediante una enzima de restricción de Tipo IIS,

g. un marcador de selección negativa,

h. una segunda secuencia de Tipo IIS,

i. segmento génico constante del TCR, y

j. elemento o elementos genéticos 3'

en donde, a) y b) se utilizan para la propagación y selección tanto del vector de entrada V-C precursor como del vector que contiene el TCR reconstituido en un hospedador bacteriano; c) y j) se utilizan para definir la aplicación posterior del ORF del TCR de longitud completa reconstituido; d) asegura el inicio eficiente de la traducción en células eucariotas, que podría representar de forma alternativa una secuencia Shine-Dalgarno para la regulación transicional en procariotas y archaea; e) representa el segmento génico variable (V) procedente del codón de iniciación hasta un motivo en el extremo 5' de la región CDR3 conservada en todos los segmentos V de un sistema de vectores bicomponente determinado; f) representa una secuencia de reconocimiento de Tipo IIS que dirige el corte de una enzima de restricción de Tipo IIS en dirección 5' para crear un saliente monocatenario estandarizado en el extremo 3' del segmento génico V; g) representa un marcador de selección negativa para eliminar el vector de entrada V-C precursor durante el funcionamiento del sistema para reconstituir un ORF del TCR de longitud completa; h) representa una secuencia de reconocimiento de Tipo IIS que dirige el corte de una enzima de restricción de Tipo IIS en la dirección 3' dirección para crear un saliente monocatenario estandarizado en el extremo 5' del segmento génico C; i) representa el segmento génico constante (C) procedente de un motivo en el extremo 5' del segmento génico C conservado en todos los segmentos C de un sistema vectorial bicomponente dado, y que define el límite con el segmento J (véanse las Figuras 2 y 4).

Un vector de entrada V-C que se utiliza para la reconstitución genética del ORF del TCR de longitud completa sin necesidad de una aplicación biológica posterior, por ejemplo, para utilizar como patrón en flujos de trabajo de biología molecular, el vector de entrada V-C mínimo comprendería elementos a), b), e), f), h) e i), careciendo de elementos reguladores.

Un vector de entrada V-C también puede contener una o más unidades de transcripción para la expresión de ORF adicionales adecuados para aplicaciones posteriores, por ejemplo, un gen o construcción indicadora de resistencia a antibióticos de mamífero.

El sistema bicomponente combinado incluye uno o más vectores donantes J que contienen

a. origen de replicación,

b. un segundo marcador de selección positiva,

c. una segunda secuencia de Tipo IIS,

d. segmento génico de unión al TCR,

e. una parte C, que corresponde a una pequeña parte 5' de un segmento génico constante, y

c. una cuarta secuencia de Tipo IIS.

en donde, a) y b) se utilizan para propagación y selección del vector donante J; c) representa una secuencia de reconocimiento de Tipo IIS que dirige el corte de una enzima de restricción de Tipo IIS en la dirección 3' y crear un saliente monocatenario estandarizado en el extremo 5' del segmento génico J; d) representa el segmento génico de unión (J) que parte de un 5' del motivo que define el límite 3' de la región CDR3 conservada para la totalidad de segmentos J en un sistema de vectores bicomponente dado, a una secuencia 3' que incorpora la parte C, que representa una parte en 5' del segmento C codificado por uno o más vectores de entrada V-C contenidos dentro del sistema bicomponente; representa una secuencia de reconocimiento de Tipo IIS que dirige el corte de una enzima de restricción de Tipo IIS en la dirección 5' para crear un saliente monocatenario estandarizado en el extremo 3' del segmento génico J, y contenido dentro de la parte de la parte C de la secuencia (véanse las Figuras 3 y 4).

Un vector donante J no tiene que llevar estrictamente una secuencia de parte C, que codifica una pequeña parte 5' del segmento génico C. Esta parte C se utiliza para optimizar y estandarizar salientes para la reacción de reconstitución durante el funcionamiento de un TORES. Esto se debe a la mayor variación de secuencia observada en el extremo 3' de los segmentos génicos J, de forma que la inclusión de una parte C permite la estandarización por generación de salientes dentro del segmento génico C menos diverso. En el caso de construir un TORES para un locus del TCR procedente de otro organismo que no tenga diversidad de segmentos J 3', o utilizando segmentos génicos J sintéticos, esta parte C puede omitirse a favor de la estandarización de salientes dentro de dichos segmentos J. Esto reduciría la complejidad de la construcción de la genoteca de donantes J.

Cada una de la primera, segunda, tercera y cuarta secuencias de Tipo IIS puede ser igual o distinta. Preferiblemente, son iguales. Esto garantiza que cada uno de los sitios de restricción dentro del sistema de vectores bicomponente sea compatible con la misma enzima de Tipo IIS, y solo se necesita una única enzima para la reacción de ciclo de enzima de restricción/ligasa durante la reconstitución del ORF del TCR de longitud completa que utiliza el sistema. Las enzimas de Tipo IIS no cortan dentro de su secuencia de reconocimiento y, por lo tanto, los salientes monocatenarios se generan extrínsecos a la secuencia de reconocimiento. Por lo tanto, la naturaleza del saliente generado después de la acción de la enzima de restricción de Tipo IIS depende tanto de la orientación de la secuencia de reconocimiento como, de hecho, de la secuencia adyacente (véanse los Ejemplos 1 a 4).

De forma alternativa, cada una de las secuencias de restricción de Tipo IIS pueden ser distintas entre sí. Sin embargo, con la adición de cada secuencia de reconocimiento única, debe incorporarse una enzima de Tipo IIS adicional en la reacción de ciclo de enzima de restricción/ligasa. Esto aumentaría la complejidad y el coste de una reacción de reconstitución para ensamblar un ORF del TCR de longitud completa.

El primer y segundo marcadores de selección positiva dentro del vector de entrada V-C y del vector donante J, respectivamente, son normalmente diferentes. Esto es para asegurar que el vector de entrada V-C, que proporciona la cadena principal del producto ORF del TCR de longitud completa final, pueda seleccionarse independientemente del vector donante J, y por tanto eliminar los transformantes que llevan vectores donantes J sin digerir o recircularizados que de otro modo aportan un fondo a la reacción de reconstitución (véanse las Figuras 2 y 3 y el Ejemplo 7).

Los marcadores de selección positiva pueden seleccionarse de

a. un gen de resistencia a antibióticos,

b. un gen complementario auxótrofo,

c. un gen indicador

en donde la selección, el formato y la aplicación de dichos marcadores de selección positiva son bien conocidos por los expertos en la técnica.

El elemento genético en 5' incorporado a un vector de entrada V-C comprende uno o más elementos seleccionados de

a. elemento cis actuante en genes,

b. sitio de reconocimiento heteroespecífico para las enzimas recombinasas,

c. un brazo de recombinación homóloga en 5' para un sitio genómico de interés

d. un sitio aceptor de corte y empalme de ARNm,

e. un sitio interno de entrada al ribosoma, y

f. secuencia del aislante epigenético

en donde, a) dirige la expresión del transcrito codificado por el producto ORF del TCR de longitud completa reconstituido dentro de la cadena principal del vector de entrada V-C; b) representa una secuencia que dirige la recombinación dirigida al sitio en presencia de enzimas recombinasas para insertar el producto ORF del TCR de longitud completa reconstituido dentro de la cadena principal del vector de entrada V-C en un contexto genético específico; c) representa una secuencia que dirige la recombinación homóloga dirigida al sitio para insertar el producto o Rf del TCR de longitud completa reconstituido dentro de la cadena principal del vector de entrada V-C en un contexto genético específico; d) permite enfoques del dominio de fusión diseñado por ingeniería genética para manipular la forma de la proteína expresada a partir del ORF del TCR de longitud completa reconstituido en la cadena principal del vector de entrada V-C e) permite el inicio de la traducción del ARNm expresado a partir del ORF del TCR de longitud completa reconstituido independiente de protección en la cadena principal del vector de entrada V-C f) permite el aislamiento de la actividad transcripcional afectada de cualquier otra forma por los elementos potenciadores en un contexto genómico donde puede insertarse el ORF del TCR de longitud completa reconstituido en la cadena principal del vector de entrada V-C.

Puede utilizarse un elemento cis actuante para dirigir la expresión transitoria de los TCR reconstituidos en una cadena principal del vector de entrada V-C proporcionada en los Ejemplos 1 y 3, cuando dicho vector que contiene un ORF del TCR reconstituido se transfecta en células de mamífero.

Puede utilizarse un sitio de reconocimiento heteroespecífico para enzimas recombinasas para permitir el intercambio de casetes mediado por recombinasa de los TCR reconstituidos en una cadena principal del vector de entrada V-C proporcionada en el Ejemplo 4, cuando dicho vector que contiene un ORF del TCR reconstituido se transfecta en células de mamífero en presencia de una enzima recombinasa adecuada.

Una primera secuencia de reconocimiento de Tipo IIS que se incluye en el vector de entrada V-C se orienta para cortar en 5' de dicha secuencia de reconocimiento y dentro del segmento génico variable del TCR (Figura 4a) para producir un saliente de ADN monocatenario en el extremo 3' del segmento génico variable (Figura 4g) que es complementario al del extremo 5' del odeCDR3 sintetizado (Figura 4c). Para más detalles sobre cómo se diseña esta secuencia de reconocimiento de primer Tipo IIS, véanse los Ejemplos 1,3, 5 y 6.

Un vector de entrada V-C contiene un marcador de selección negativa entre la primera secuencia de reconocimiento de Tipo IIS y la segunda secuencia de reconocimiento de Tipo IIS (véase más abajo la Figura 2). Este marcador de selección negativa se selecciona de

a. un sitio de reconocimiento de enzimas de restricción no contenido en otro sitio del primer componente o dentro del segmento génico de unión del TCR,

b. un gen suicida bacteriano y

c. un elemento indicador.

en donde el marcador de selección negativa se utiliza para eliminar las células hospedadoras transformadas con el vector de entrada V-C parental y, por lo tanto, reducir el fondo de una reacción de reconstitución cuando se utiliza el primer marcador de selección positiva para seleccionar transformantes que contienen el ORF del TCR diana dentro de la cadena principal del vector de entrada V-C (véase el Ejemplo 7).

Con la excepción del propio marcador de selección negativa, todas las demás secuencias del sistema de dos partes deben estar desprovistas de dicha secuencia para no transmitir una selección negativa indebida sobre la base de la inclusión de esta secuencia en otra parte del sistema.

En el presente contexto, una segunda secuencia de reconocimiento de Tipo IIS que se incluye en el vector de entrada V-C se orienta para cortar en 3' de dicha secuencia de reconocimiento y dentro del segmento génico constante del TCR (Figura 4a) para producir un saliente de ADN monocatenario en el extremo 5' del segmento génico constante (Figura 4g) que es complementario al del extremo 3' del intermedio de reacción del fragmento donante J (Figura 4f). Para detalles sobre cómo se diseña esta secuencia de reconocimiento de segundo Tipo IIS, véanse los Ejemplos 1,2, 3 y 5. El elemento genético 3' incorpora a un vector de entrada V-C comprende uno o más elementos seleccionados de a. un elemento terminador,

b. sitio de reconocimiento heteroespecífico para las enzimas recombinasas,

c. un brazo de recombinación homóloga 3', para un sitio genómico de interés,

d. un sitio donador de corte y empalme de ARNm,

e. un sitio interno de entrada al ribosoma, y

f. secuencia del aislante epigenético.

en donde a) representa una secuencia que dirige la terminación transcripcional para la producción eficiente de ARNm del ORF del TCR in situ y puede codificar una señal de poli-A; b) representa una secuencia que dirige la recombinación homóloga dirigida al sitio para insertar el producto ORF del TCR de longitud completa reconstituido dentro de la cadena principal del vector de entrada V-C en un contexto genético específico; c) permite la fusión de un ORF del TCR a una unidad transcripcional después de la integración en un locus genómico que codifica un sitio aceptor de corte y empalme de ARNm posterior para manipular la intensidad de los niveles de expresión de TCR o la forma de la proteína expresada a partir del ORF del TCR de longitud completa reconstituido en la cadena principal del vector de entrada V-C e) permite el inicio independiente de la traducción del ARNm expresado a partir del ORF del TCR de longitud completa reconstituido en la cadena principal del vector de entrada V-C f) evita la interacción inadecuada entre dominios de cromatina adyacentes, aislando de este modo el ORF del TCR de longitud completa de la regulación transcripcional adyacente o la descondensación de la heterocromatina en un contexto genómico donde puede insertarse el ORF del TCR reconstituido en la cadena principal del vector de entrada V-C.

Se utiliza un elemento terminador para garantizar la terminación de la transcripción durante la expresión de los TCR reconstituidos en una cadena principal del vector de entrada V-C proporcionada en los Ejemplos 1 y 3, cuando dicho vector que contiene un ORF del TCR reconstituido se transfecta en células de mamífero.

Se utiliza un sitio de reconocimiento heteroespecífico para enzimas recombinasas para permitir el intercambio de casetes mediado por recombinasa de los TCR reconstituidos en una cadena principal del vector de entrada V-C proporcionada en el Ejemplo 4, cuando dicho vector que contiene un ORF del TCR reconstituido se transfecta en células de mamífero en presencia de una enzima recombinasa adecuada.

Un vector donante J contiene un segmento génico J con una secuencia de parte C que representa un fragmento 5' del segmento génico C hasta el 3' del segmento génico J (Figura 3).

La secuencia de la parte C se diseña para estandarizar los salientes monocatenarios generados por la acción de la enzima de Tipo IIS en el extremo 3' del intermedio de reacción del fragmento J derivado del vector donante J (Figura 4f), y el que está en el extremo 5' del segmento génico C dentro del producto intermedio de reacción del vector de entrada V-C abierto digerido por el Tipo IIS (Figura 4g).

Una tercera secuencia de reconocimiento de Tipo IIS que se incluye en el vector donante J se orienta para cortar 3' de dicha secuencia de reconocimiento y dentro del segmento génico de unión del TCR (Figura 4b) para producir un saliente de ADN monocatenario en el extremo 5' del segmento génico de unión (Figura 4f) que es complementario al del extremo 5' del odeCDR3 sintetizado (Figura 4c). Para ver más detalles sobre cómo se diseña esta secuencia de reconocimiento de tercer Tipo IIS, véanse los Ejemplos 2, 3, 5 y 6.

Una cuarta secuencia de reconocimiento de Tipo IIS que se incluye en el vector donante J se orienta para cortar 5' de dicha secuencia de reconocimiento y dentro de la parte C del TCR (Figura 4b) para producir un saliente de ADN monocatenario en el extremo 3' de la parte C (Figura 4f) que es complementario al que tiene el producto intermedio de reacción del vector de entrada V-C abierto digerido en 5' con el Tipo IIS (Figura 4G). Para detalles sobre cómo se diseña esta secuencia de reconocimiento del tercer Tipo IIS, véanse los Ejemplos 1,2, 3, 5 y 6.

El sistema de vectores de dos partes, todos los segmentos génicos del TCR codificados y las partes no deben contener secuencias de reconocimiento de Tipo IIS que se utilizan para la operación, o ensamblado, del vector de entrada V-C o del vector donante J. La inclusión de dichas secuencias daría como resultado la acción de la enzima de restricción de Tipo IIS dentro de los segmentos o partes génicas codificadas, y daría como resultado la interrupción del proceso de reconstitución del TCR. De forma similar, las secuencias de reconocimiento de Tipo IIS no deberían incluirse en las cadenas principales del vector, ni en ningún elemento genético en 5' y 3' en estos vectores, ni los fragmentos de clonación utilizados para ensamblar el sistema de vectores de dos partes, ni el odeCDR3 que representa un tercer componente del sistema (véase más abajo).

Puede construirse un sistema vectorial bicomponente del TORES para cualquier colección de cadenas del TCR. En los ejemplos 1 a 4 que siguen, se construyen sistemas de vectores bicomponente para los loci de TRA y TRB humanos que codifican las cadenas alfa y beta del TCR humano, respectivamente. La construcción de tal TORES es igualmente aplicable en el contexto de los loci de TRD y TRG que codifican el par de cadenas delta y gamma del TCR, respectivamente, o de hecho para cualquier sistema de pares de cadenas TRA/TRB, TRD/TRG o variante del TCR que se encuentra en los vertebrados con mandíbulas.

El tercer componente odeCDR3

Para reconstituir un ORF del TCR de longitud completa utilizando cualquiera del TORES dado, se requiere un pequeño fragmento del ORF no codificado por el vector de entrada V-C bicomponente y el sistema del vector donante J como tercer componente. Este tercer componente toma la forma de un dúplex de oligonucleótidos que codifica CDR3 (odeCDR3).

Dicho tercer componente, odeCDR3, comprende

a. una primera secuencia de saliente monocatenario complementario del primer sitio de reconocimiento y corte de enzima de restricción de Tipo IIS orientada para cortar en 5' de la secuencia de reconocimiento y dentro del segmento génico variable del TCR del vector de entrada V-C,

b. un segmento bicatenario que codifica una región CDR3 del TCR y desprovisto de elemento de selección negativo, cuyo elemento de selección negativo es el definido en el punto 10, y también desprovisto de cualquier secuencia de restricción de Tipo IIS de la primera o segunda parte, y

c. una segunda secuencia de saliente monocatenario complementario del tercer sitio de reconocimiento y escisión de enzima de restricción de Tipo IIS orientada para escindir en 3' de la secuencia de reconocimiento y dentro del segmento génico de unión del TCR del vector donante J.

De forma alternativa, el odeCDR3 puede estar compuesto de una molécula de ADNbc y/o ADN plasmídico que codifica el CDR3 flanqueado por dos enzimas de Tipo IIS consistentes con el primer componente (vector de entrada V-C) o segundo componente (vector donante J), orientado de forma que cuando se digiere, se generan un producto digerido que comprende los a, b y c descritos anteriormente y dos subproductos que codifican para fragmentos ADNbc cortos flanqueados por los sitios de Tipo IIS. Este ADNbc de odeCDR3 alternativo es compatible con la reacción de la enzima de restricción/ligasa, que no requiere necesariamente una digestión o procesamiento previo.

Como alternativa al uso de la configuración de vector de entrada V-C y vector donante J en un TORES, la configuración del vector de entrada J-C y el vector donante V también pueden utilizarse aplicando el mismo marco conceptual.

Métodos para utilizar un TORES para reconstituir un ORF del TCR de longitud completa

Puede utilizarse un TORES para reconstituir un ORF del TCR de longitud completa en un contexto de vector genético, a partir de la información de las secuencias, como se presenta para un par de cadenas TRA/TRB humanas en el Ejemplo 7.

Para que TORES reconstituya un ORF del TCR de longitud completa a partir de la información de secuencia, dado el recurso de un sistema de vectores bicomponente para una cadena TCR dada, el método comprende

a. seleccionar un vector de entrada V-C,

b. seleccionar un vector donante J,

c. seleccionar un odeCDR3,

d. combinar a, b y c para reaccionar con i) una o varias enzimas de restricción de Tipo IIS para escindir todos los sitios de reconocimiento y escisión con enzimas de restricción de Tipo IIS presentes en el vector de entrada V-C y en el vector donante J y ii) enzima ADN-ligasa y iii) someter la mezcla combinada a una reacción de termociclado,

e. transformar el producto de reacción obtenido en la etapa d en un organismo hospedador seleccionable competente para la propagación del vector de ADN, y

f. realizar una selección del organismo hospedador para obtener el marco de lectura abierto del TCR reconstituido de longitud completa en la cadena principal del vector de entrada V-C.

en donde, a) y b) se seleccionan sobre la base del vector seleccionado que codifica los segmentos génicos V, J y C en el ORF del TCR de longitud completa diana; c) se selecciona sobre la base de completar la secuencia ORF del TCR de longitud completa no codificada por los vectores de entrada V-C o donante J seleccionados en a) y b), y unidos por los segmentos variable y de unión codificados en los mismos; d) combinar los tres componentes seleccionados en una mezcla de reacción junto con una enzima de restricción que cortará la primera, segunda, tercera y cuarta secuencias de reconocimiento de enzimas de restricción de Tipo IIS en los vectores de entrada V-C y donante J; e) representa, de forma general, bacterias competentes para transformación; f) la selección del hospedador se basa en el primer marcador de selección positiva proporcionado por la cadena principal del vector de entrada V-C.

De forma general, un flujo de trabajo para seleccionar y definir los elementos genéticos de un ORF del TCR de longitud completa para la reconstitución implica la secuenciación de novo de cadenas TCR procedentes de tejidos del organismo diana. El Ejemplo 8 que sigue presenta la identificación de novo de un conjunto de pares de cadenas TRA/TRB específicos de un antígeno CMVH en un contexto restringido por HLA-B*07:02. El flujo de trabajo descrito en la Figura 13, incorpora transcripción inversa y amplificación basada en PCR de pares de cadenas de TCR procedentes de células individuales clasificadas con secuenciación de Sanger posterior. Existe un requisito para la información de secuencia de alta calidad que abarca los segmentos V, CDR3, J y C del ORF del TCR, que dicta el uno o varios enfoques de secuenciación específicos asumidos.

Por lo tanto, un método para seleccionar y reconstituir un marco de lectura abierto del TCR comprende

a. Obtener una secuencia de marco de lectura abierto del TCR en donde dicha información de secuencia es suficiente para identificar i) el uso de un segmento génico variable ii) el uso de un segmento génico constante iii) el uso de segmento génico de unión iv) una secuencia CDR3 completa que abarca el límite de segmento génico variable hasta el límite de segmento génico de unión, y

b. seleccionar un vector de entrada V-C correspondiente a los segmentos génicos variables y constantes identificados en la etapa a. i) y a. ii), respectivamente, y

c. seleccionar un vector donante J correspondiente al segmento génico de unión identificado en la etapa a, iii), y

d. generar un odeCDR3 que corresponde a la secuencia de CDR3 identificada en la etapa a. iv), y

e. combinar b, c y d para reaccionar con i) una o varias enzimas de restricción de Tipo IIS para cortar todos los sitios de reconocimiento y escisión con enzimas de restricción de Tipo IIS presentes en el vector de entrada V-C y en el vector donante J y ii) enzima ADN-ligasa, iii) someter la mezcla combinada a una reacción de termociclado, y

f. transformar el producto de reacción obtenido de la etapa e. en un organismo hospedador seleccionable competente para la replicación del plásmido, y

g. realizar una selección del organismo hospedador para obtener el marco de lectura abierto del TCR reconstituido de longitud completa en la cadena principal del vector de entrada V-C.

en donde, a) se lleva a cabo con métodos de secuenciación bien conocidos del experto en la técnica capaz de obtener una secuencia de suficiente longitud y calidad como para identificar los cuatro elementos genéticos requeridos; b) y c) se seleccionan de una genoteca de TORES que contiene vectores necesarios; d) se sintetiza de novo o se selecciona de una genoteca de odeCDR3; e) se lleva a cabo en un solo recipiente de reacción.

Para seleccionar el vector de entrada V-C apropiado, el vector donante J y el odeCDR3, las secuencias diana del TCR se alinearon respecto a una genoteca de segmentos génicos V, C y J para buscar sus cadenas del TCR correspondientes para determinar el uso de los segmentos V, C y J de la cadena diana. Esta etapa de alineación y análisis de secuencia también debe permitir la definición de la secuencia codificante CDR3 y, por lo tanto, la definición de la secuencia odeCDR3. Por lo tanto, de forma general, dicho análisis de secuencia permite la selección de vectores de entrada V-C y vectores donantes J para la reconstitución de cadenas de TCR. El análisis también permite la síntesis de odeCDR3 para cada reacción de reconstitución en cadena. Este proceso se describe bien en el Ejemplo 8 y se resume como parte de la Figura 13.

Es deseable llevar a cabo la digestión de Tipo IIS y la ligación dependiente de ADN-ligasa (etapa e) en una reacción de un solo ciclo. Esto minimiza las etapas de procesamiento y se hace posible por el diseño del sistema, donde las enzimas de restricción de Tipo IIS cortan fuera de sus secuencias de reconocimiento, de forma que pueden generarse varios salientes únicos con una sola enzima, manteniendo así una clonación direccional eficiente del producto intermedio de reacción del vector donante J y odeCDR3 en la cadena principal del vector de entrada V-C.

De forma alternativa, la digestión por restricción de Tipo IIS y la ligación de ADN pueden hacerse en procedimientos secuenciales.

En el Ejemplo 8, la aplicación del TORES se ilustra en el contexto de la clasificación de células activada por fluorescencia de células individuales (FACS) de linfocitos T CD8 específicos de antígeno a partir de sangre periférica humana para transcripción inversa y amplificación basada en PCR de pares de cadenas TRA/TRB del TCR, seguido por secuenciación de Sanger. Este es un flujo de trabajo aplicable de forma general, en donde cualquier tejido puede ser la fuente de linfocitos T de cualquier vertebrado con mandíbulas, y las células pueden clasificarse según cualquier característica fenotípica. Es importante señalar que no es necesario teñir las células individuales clasificadas por especificidad del antígeno utilizando reactivos de multímeros de HLA.

El enfoque de secuenciación del TCR utilizado no se limita a ningún método o tecnología particular, siempre que se obtenga suficiente información de secuencia de alta calidad para que las características genéticas definidas anteriormente del uno o más ORF de TCR puedan definirse basándose en la dicha información de secuencia.

El uso de FACS para separar células individuales de forma que los pares de cadenas del TCR nativos puedan secuenciarse e identificarse es un método potente gracias a la información fenotípica precisa y detallada que puede recogerse con paneles de anticuerpos multiespecíficos. Sin embargo, existen otros métodos para repartir células, que incluyen: PCR en emulsión; enfoques de PCR digital que utilizan encapsulación de células en microfluidos; PCR digital que utiliza sustratos de reparto físico.

En general, es deseable obtener pares del TCR nativos a partir de un material fuente, ya que ambas cadenas de un par de TCR contribuyen al acoplamiento y reconocimiento de HLA-antígeno. Sin embargo, existen casos en los que puede ser deseable la recuperación de una sola cadena, tal como el análisis de alto rendimiento de una sola cadena contra una especificidad establecida. En tal caso, los TCR pueden amplificarse y/o secuenciarse a partir de células no separadas.

Métodos para utilizar TORES para generar ORF del TCR de longitud completa con secuencia diversificada Un sistema TORES está idealmente adaptado para generar ORF del TCR de longitud completa diversificados en varios modos sistemáticos. Dicha diversificación sistemática puede aplicarse a flujos de trabajo de maduración por afinidad y/o funcional para cadenas del TCR. Dicha diversificación de secuencias diana de la cadena del TCR se describe bien en los Ejemplos 9 y 10.

Dichos métodos de diversificación de secuencias ORF del TCR siguen el mismo esquema general que en una reacción de reconstitución. La diversificación puede realizarse en múltiples reacciones de reconstitución paralelas, donde se genera una única variante del ORF del TCR por reacción. Sin embargo, en la mayoría de escenarios, es deseable generar un conjunto de variantes de ORF del TCR en una sola reacción. Cada uno de estos enfoques se logra proporcionando múltiples variantes de uno o más de cada componente genético (vector de entrada V-C, vector donante J, odeCDR3) en una reacción de reconstitución.

Como se describe en el Ejemplo 9, puede diversificarse sistemáticamente un ORF del TCR en la región CDR3 agregando un grupo de odeCDR3 con diversidad de secuencia posicional definida.

Un método para seleccionar y reconstituir un marco de lectura abierto de TCR para lograr la diversidad de ORF del TCR en la región CDR3, comprende por lo tanto

d. generar dos o más odeCDR3 que corresponden a la secuencia de CDR3 identificada en la etapa a. iv), con una composición de secuencia variante, y

e. combinar b, c y d para reaccionar con i) una o varias enzimas de restricción de Tipo IIS para escindir todos los sitios de reconocimiento y escisión con enzimas de restricción de Tipo IIS presentes en el vector de entrada V-C y en el vector donante J y ii) enzima ADN-ligasa, iii) someter la mezcla combinada a una reacción de termociclado, y

g. realizar una selección del organismo hospedador para obtener el marco de lectura abierto del TCR reconstituido de longitud completa en la cadena principal del vector de entrada V-C,

en donde, a) se lleva a cabo con métodos de secuenciación bien conocidos para un experto en la técnica capaz de obtener una secuencia de suficiente longitud y calidad como para identificar los cuatro elementos genéticos requeridos; b) y c) se seleccionan de una genoteca de TORES que contiene vectores necesarios; d) se sintetiza de novo o se selecciona de una genoteca de odeCDR3; e) se lleva a cabo en un solo recipiente de reacción.

Dicho método puede lograrse agrupando todas las variantes de odeCDR3 en una reacción única para generar un grupo de secuencias diversificadas, pero puede lograrse igualmente probando cada variante de odeCDR3 en una reacción paralela.

La odeCDR3 variante puede generarse mediante una variedad de métodos muy conocidos por los expertos en la técnica. La selección de la posición y el alcance de la degeneración/diversidad de odeCDR3 pueden variar de un solo cambio de resto en una sola posición a una secuencia completamente redundante de toda la longitud del odeCDR3.

Como se describe en el Ejemplo 10, un ORF del TCR puede diversificarse sistemáticamente manteniendo la región CDR3 mediante la provisión de odeCDR3, pero diversificando el uso de los segmentos V, C y J proporcionando dos o más del vector de entrada V-C y/o el vector donante J a la reacción de reconstitución.

Un método para seleccionar y reconstituir un marco de lectura abierto del TCR utilizando segmentos V, C y/o J diversificados comprende, por lo tanto

b. seleccionar dos o más vectores de entrada V-C no correspondientes a los segmentos génicos variables y constantes identificados en la etapa a. i) y a. ii), respectivamente, y

c. seleccionar dos o más vectores donantes J que no corresponden al segmento génico de unión identificado en la etapa a, iii), y

Tal método puede lograrse combinando todos los vectores de entrada V-C y/o variantes de vector donante J en una reacción única para generar un grupo de secuencias diversificadas, pero puede lograrse igualmente mediante la prueba de cada variante de vector en una reacción paralela.

Cada vector entrada V-C y donante J de una genoteca dada podría seleccionarse para proporcionar una cobertura completa de los segmentos génicos V, C y J.

Cualquier combinación de diversificación de CDR3 y V, C y J descrita anteriormente podría utilizarse para generar grupos o genotecas de ORF del TCR diversificados.

Este sistema puede utilizarse para generar genotecas completamente sintéticas de ORF con cobertura completa del uso de segmentos génicos V, C y J nativos y características de CDR3 definidas.

Características de un TORES con respecto a los métodos de reconstitución/diversificación

Como se ha mencionado anteriormente, es deseable llevar a cabo la reacción de ciclo de ensamblado con una sola enzima de restricción de Tipo IIS. Esto economiza el uso de enzima de restricción y ello es posible por la naturaleza de la acción de Tipo IIS, y el diseño de salientes monocatenarios únicos en el sistema de vectores bicomponente y odeCDR3.

De forma alternativa, hasta cuatro secuencias de reconocimiento de enzimas de restricción de Tipo IIS a través de los cuatro sitios de reconocimiento de Tipo IIS del vector de entrada V-C y el vector donante J.

Para una clonación eficiente de los productos ORF del TCR, se ejecuta al menos una etapa de selección negativa durante el ensamblado de un ORF del TCR de longitud completa mediante el uso del TORES, seleccionada de

a. realizar la digestión con enzima de restricción del producto de reacción para eliminar el vector de entrada V-C precursor

b. realizar una selección de genes suicidas para eliminar hospedadores competentes transformados con vector de entrada V-C precursor y/o

c. realizar la selección de células hospedadoras transformadas con el vector de entrada V-C precursor mediante la identificación de un indicador.

en donde, la selección negativa se utiliza para eliminar el vector de entrada V-C precursor que sigue sin digerir mediante la una o varias enzimas de Tipo IIS o que se ha religado a la forma parental después de la digestión.

La eliminación del vector de entrada V-C precursor es crítica, considerando que la cadena principal del vector de entrada V-C y, por lo tanto, el marcador de selección positiva portado en esta cadena principal, se utiliza para la selección positiva del vector que contiene el producto de reacción ORF del TCR de longitud completa.

En el presente contexto, la selección negativa se hace utilizando un sitio de enzima de restricción que se ha diseñado dentro del subproducto de reacción escindido del vector de entrada V-C (Figura 4d). Este procedimiento de selección negativa se describe en los Ejemplos 7 y 8.

Uno cualquiera, o una combinación de los métodos de selección negativa mencionados anteriormente, pueden utilizarse para eliminar el vector de entrada V-C precursor de los productos clonados finales. Dicho procedimiento de selección negativa puede omitirse si la eficiencia de la clonación se considera lo suficientemente alta para una recuperación eficiente los productos de reacción clonados.

Se requiere la selección de los vectores que contienen el ORF del TCR de longitud completa clonado en el organismo hospedador transformado para obtener el producto clonado final. Dichas selecciones son bien conocidas por los expertos en la técnica.

Un organismo hospedador representa una bacteria competente para transformación, y la selección de transformantes que contienen el ORF del TCR de longitud completa contenido en una cadena principal del vector de entrada V-C comprende la selección con antibióticos. Esto implica añadir antibiótico al sistema de cultivo en el que se introducen las células transformadas, y la resistencia a este antibiótico está codificada por el gen representado como el primer marcador de selección positiva en la cadena principal del vector de entrada V-C.

De forma alternativa, la eliminación de factores auxotróficos del sistema de cultivo en el que se introducen los transformantes puede ser una forma de selección positiva, en donde la complementación auxotrófica es conferida por un producto génico codificado en la cadena principal del vector de entrada V-C. Puede utilizarse una combinación de las selecciones positivas descritas anteriormente.

Genotecas de vector de entrada V-C y vector donante J que comprenden un TORES

Para que un TORES realice eficientemente la operación de reconstitución o diversificación de los ORF del TCR seleccionados, se requiere la construcción previa de una genoteca de vectores de entrada V-C y de vectores donantes J. A partir de esta genoteca, que es específica de cada forma de cadena TCR, se realizan selecciones para completar el uso de V/J/C de la secuencia ORF del TCR diana, cuando se complementa con la secuencia odeCDR3.

Las genotecas de vectores de entrada V-C y donantes J pueden construirse para contener todos los segmentos génicos variables, constantes y de unión del TCR de la línea germinal de un organismo que tiene dichos TCR. Dicha genoteca puede incluir también todas las combinaciones del vector de entrada V-C, así como para el TORES específico de locus de TRB presentado en el Ejemplo 3, en donde la genoteca se replica con ambos segmentos génicos constantes contra cada segmento variable.

Una genoteca de vectores de entrada V-C y donantes J pueden contener segmentos génicos V/J/C, de forma que la secuencia de aminoácidos traducida de la proteína codificada no esté modificada en relación con la secuencia de proteínas codificada por los segmentos génicos de la línea germinal.

Dicha genoteca permite el cambio en la secuencia de ácido nucleico subyacente para generar una genoteca desprovista por lo demás de secuencias de reconocimiento de Tipo IIS no deseadas, o de elementos de selección positivos y negativos. Los cambios en la secuencia de ácido nucleico subyacente también pueden utilizarse para la optimización de codones para la expresión de cadenas TCR reconstituidas en células de diferentes organismos huésped.

De forma alternativa, una genoteca de vectores de entrada V-C y donantes J pueden contener segmentos génicos V/J/C, de forma que la secuencia de aminoácidos traducida de la proteína codificada esté modificada en relación con la secuencia de proteínas codificada por los segmentos génicos de la línea germinal.

Dicha genoteca puede utilizarse para construir TCR con características optimizadas para distintos usos de diagnóstico o terapéuticos. Podrían utilizarse cambios en los restos o regiones del marco dentro de los segmentos génicos V/J/C para aumentar la expresión o estabilidad en varios escenarios, tales como la expresión de TCR como reactivos solubles. De forma similar, las alteraciones en las regiones marco que no están implicadas en los contactos directos de HLA-antígeno pueden utilizarse para alterar la capacidad de señalización de los TCR reconstituidos producidos por el TORES.

También pueden codificarse etiquetas de afinidad o secuencias inmunogénicas en regiones marco para ayudar en la purificación y/o detección de los TCR reconstituidos en aplicaciones posteriores.

Las genotecas de vectores de entrada V-C y donantes J pueden ensamblarse en el kit que comprende una combinación de

a. uno o más vectores de entrada V-C que codifican combinaciones de segmentos génicos variables y constantes, y b. uno o más vectores donantes J que codifican los segmentos génicos J, y opcionalmente

c. uno o más odeCDR3 estandarizados con salientes monocatenarios coincidentes con el vector de entrada V-C y salientes monocatenarios del vector donante J como control positivo odeCDR3 y, opcionalmente d. un ORF del TCR de longitud completa preensamblado como referencia

en donde, a) y b) cubren la diversidad genética requerida de segmentos génicos de un organismo diana, con una secuencia de aminoácidos no modificada o modificada relevante para la aplicación prevista; c) se utiliza como control positivo en las reacciones de reconstitución d) se utiliza como control positivo en aplicaciones posteriores de ORF del TCR de longitud completa reconstituido con las genotecas de vector de entrada V-C y vector donante J proporcionadas en dicho kit.

Método para construir vectores de entrada V-C

El ensamblado de genotecas de vectores de entrada V-C y donantes J puede lograrse mediante una variedad de métodos de biología molecular bien conocidos para los expertos en la técnica, que incluyen la síntesis directa de ADN de los vectores requeridos. Sin embargo, se prefiere un enfoque combinatorio rápido y económico que utilice fragmentos que contengan segmentos génicos pequeños. Dicho método permite el ciclado rápido de las formas de vectores de entrada V-C y donantes J que son importantes para los flujos de trabajo de ingeniería del TCR. De forma similar, puede utilizarse una expansión rápida de genoteca de vectores de entrada V-C y vectores donantes J dada para explicar el polimorfismo de un solo nucleótido y otras diferencias alélicas de segmentos génicos del TCR entre individuos de una población dada, que puedan tener significado funcional o afectar a la inmunogenicidad de una secuencia del TCR en un contexto terapéutico pseudoalogénico. En los Ejemplos 1, 2 y 3 se describen bien métodos sistemáticos para ensamblar genotecas de vectores de entrada V-C y vectores donantes J.

Un método para construir una entrada V-C comprende combinar tres componentes de ADN seleccionados de a. un fragmento de clonación del segmento génico variable

b. un fragmento de clonación del segmento génico constante

c. una cadena principal del vector de entrada V-C

en donde, a) contiene el segmento génico variable; b) contiene el segmento génico constante; c) representa la cadena principal del vector de entrada V-C en la que se ensamblan los fragmentos génicos variables y constantes.

En el presente contexto, un fragmento de clonación del segmento génico variable comprende

a. una secuencia de unión del cebador 5' para la propagación dependiente de la reacción en cadena de la polimerasa del fragmento

b. una quinta secuencia de Tipo IIS orientada para cortar en la dirección 3'

c. una primera secuencia del saliente que codifica un saliente monocatenario definido tras la acción de la enzima de Tipo IIs en la quinta secuencia de Tipo IIs de b.

d. una secuencia de Kozak

e. un segmento génico variable del TCR

f. una primera secuencia de Tipo IIS

g. un segmento de secuencia 5' de un marcador de selección negativa

h. una sexta secuencia de Tipo IIS orientada para cortar en la dirección 5' de forma que se genere un saliente monocatenario dentro del segmento de secuencia 5' del marcador de selección negativa de g.

i. una secuencia de unión del cebador 3' para la propagación dependiente de la reacción en cadena de la polimerasa del fragmento

en donde, b) y h) codifican secuencias de Tipo IIS utilizadas en el ensamblado del vector de entrada V-C; f) codifica secuencias de Tipo IIS utilizadas en una reacción de reconstitución; g) representa un fragmento de la secuencia del marcador de selección negativa que se completa mediante un fragmento complementario proporcionado en el fragmento de clonación del segmento génico constante.

En la Figura 5 se presenta una representación esquemática del fragmento de clonación del segmento génico variable. Los Ejemplos 1 y 3 describen el formato y uso de estos fragmentos de clonación para ensamblar vectores de entrada V-C para los loci de TRA y TRB humanos, respectivamente.

Estos ejemplos definen fragmentos de clonación de segmentos génicos TRA variables humanos como SEQ0001 a SEQ0046, y fragmentos de clonación de segmentos génicos TRB variables humanos como SEQ0435 a SEQ0481.

Para ensamblar un vector de entrada V-C debe combinarse un fragmento de clonación de segmento génico variable con un fragmento de clonación de segmento génico constante.

Un fragmento de clonación del segmento génico constante comprende

b. una séptima secuencia de Tipo IIS orientada para cortar en la dirección 3' de forma que se genere un saliente monocatenario dentro del segmento de secuencia 3' del marcador de selección negativa de c.

c. un segmento de secuencia 3' de un marcador de selección negativa

d. una segunda secuencia de Tipo IIS

e. un segmento génico constante del TCR

f. una segunda secuencia del saliente que codifica un saliente monocatenario definido tras la acción de la enzima de Tipo IIs en la octava secuencia de Tipo IIs de g.

g. una octava secuencia de Tipo IIS orientada para cortar en la dirección 5' de forma que se genera un saliente monocatenario en la secuencia del saliente de f.

h. una secuencia de unión del cebador 3' para la propagación dependiente de la reacción en cadena de la polimerasa del fragmento

en donde, b) y g) codifican secuencias de Tipo IIS utilizadas en el ensamblado del vector de entrada V-C; g) codifica secuencias de Tipo IIS utilizadas en la operación de una reacción de reconstitución; c) representa un fragmento de la secuencia del marcador de selección negativa que se completa por un fragmento complementario proporcionado en el fragmento de clonación del segmento génico constante.

En la Figura 6 se muestra una representación esquemática del fragmento de clonación del segmento génico variable. Los Ejemplos 1 y 3 describen el formato y uso de estos fragmentos de clonación para ensamblar vectores de entrada V-C para los loci de TRA y TRB humanos, respectivamente.

Estos ejemplos definen el fragmento de clonación del segmento génico TRB variable humano como SEQ0047, y fragmentos de clonación de segmentos génicos TRB constantes humanos como SEQ0482 a SEQ0483.

Los fragmentos de clonación de segmentos génicos variables y constantes se combinan en una cadena principal del vector de entrada V-C para ensamblar un vector de entrada V-C,

Una cadena principal del vector de entrada V-C comprende

a. un origen de replicación

b. un primer marcador de selección positiva

c. un elemento genético 5'

d. una primera secuencia de reconocimiento de enzimas de restricción que permite la digestión de la cadena principal para crear un saliente monocatenario complementario al saliente creado dentro del fragmento de clonación del segmento génico variable por una acción de Tipo IIS durante la reacción de ensamblado

e. una segunda secuencia de reconocimiento de enzimas de restricción que permite la digestión de la cadena principal para crear el fragmento de clonación del segmento génico constante por una acción de Tipo IIS durante la reacción de ensamblado

f. un elemento genético 3'.

en donde c) y f) representan elementos genéticos utilizados para la aplicación de los ORF del TCR reconstituidos en diferentes sistemas biológicos como se ha mencionado anteriormente.

En la Figura 7 se muestra una representación esquemática del fragmento de clonación del vector de entrada V-C. Los Ejemplos 1 ,3 y 4 describen el formato y uso de diferentes formas de la cadena principal del vector de entrada V-C para ensamblar vectores de entrada V-C para loci de TRA y TRB, respectivamente.

Una cadena principal del vector de entrada V-C utilizada para la expresión transitoria posterior de los ORF del TCR reconstituidos en células de mamífero se define como SEQ0048, mientras que un par de cadenas principales del vector de entrada V-C utilizadas para el intercambio de casete mediado por recombinasa de los ORF del TCR reconstituidos se definen como SEQ0688 y SEQ0689,

El ciclado rápido de fragmentos de clonación génica variables y constantes en diferentes cadenas principales del vector de entrada V-C es un enfoque económico para alterar las características del contexto del vector de los ORF del TCR reconstituidos a partir de una combinación V/J/C determinada. Esto permite la replicación rápida de la reclasificación de genotecas de segmentos génicos del TCR nativos o sintéticos en diferentes aplicaciones biológicas.

En los ejemplos de fragmentos de clonación de segmentos génicos variables y constantes y cadenas principales del vector de entrada V-C citados en la presente descripción, la enzima de Tipo IIS utilizada para el ensamblado del vector es Bbsl, mientras que la enzima de Tipo IIS utilizada para la reconstitución del ORF del TCR es Bsal. La cadena principal del vector de entrada V-C contiene sitios de reconocimiento de enzimas de restricción para Acc65l y Xbal, para crear salientes compatibles con los salientes 5' y 3' generados en los fragmentos de clonación génica variable y constante, respectivamente, por la acción de Bbsl.

Puede utilizarse cualquier otra combinación de enzimas de restricción para las reacciones de ensamblado y reconstitución, siempre que satisfagan los criterios descritos anteriormente.

Preferiblemente, las secuencias de Tipo IIS utilizadas para ensamblar el vector de entrada V-C, designadas como la quinta, sexta, séptima y octava secuencias de Tipo IIS anteriores, son iguales.

De forma alternativa, podrían utilizarse hasta cuatro secuencias de reconocimiento de Tipo IIS distintas para este procedimiento.

Las secuencias de Tipo IIS utilizadas para ensamblar el vector de entrada V-C, designadas como la quinta, sexta, séptima y octava secuencias de Tipo IIS anteriores, deben ser distintas de las utilizadas para la reacción de reconstitución; la primera, segunda y cuarta secuencias de Tipo IIS designadas anteriormente.

El método para combinar los fragmentos de clonación de segmentos génicos variables y constantes con la cadena principal del vector de entrada V-C para ensamblar un vector de entrada V-C se describe en los Ejemplos 1 y 3.

Un método de ensamblado de un vector de entrada V-C comprende

a. Digestión de la cadena principal del vector de entrada V-C con las dos enzimas de restricción específicas de las secuencias de reconocimiento contenidas dentro de la cadena principal del vector de entrada V-C b. Combinar la cadena principal del vector de entrada V-C digerida con el fragmento de clonación V y el fragmento de clonación C junto con la enzima ADN-ligasa y una o más enzimas de restricción de Tipo IIS que reconocen la quinta, sexta, séptima y octava secuencias de Tipo IIS, y someter la mezcla combinada a una reacción de termociclado, y c. Transformación del producto de reacción resultante en un organismo hospedador competente y selección positiva utilizando el primer marcador de selección positiva para obtener el vector de entrada V-C completo en donde; a) crea salientes monocatenarios complementarios a los generadas en fragmentos de clonación variables y constantes por la acción de enzimas de Tipo IIS en b); b) representa la digestión de fragmentos variables y constantes para generar salientes que se ligarán con los salientes generados en a), y permitir la ligación de los salientes complementarios generados en los fragmentos de marcador de selección negativa para ligar los fragmentos variables y constantes; c) representa la selección y propagación del producto del vector de entrada V-C. Características genéricas de vectores de entrada V-C y elementos de construcción

Las descripciones anteriores utilizan los loci de TRA y TRB humanos de HLA como plantilla para la definición de un sistema TORES, como también se detalla en los Ejemplos 1 a 4. Sin embargo, en un TORES puede ensamblarse una familia de segmentos génicos de cualquier locus de TCR. En la descripción anterior se dan directrices sobre dónde hay flexibilidad en el diseño de un sistema TORES, para ambos loci de TRA/TRB humanos, pero aplicables también a cualquier otro locus de cualquier organismo. En la sección actual, las características genéricas de un sistema se describen utilizando el diseño de TRA/TRB presentado en los Ejemplos 1 a 4 como patrón.

Para lograr un TORES para cualquier locus de TCR dado, se requieren cuatro elementos de secuencia específicos para una cadena de TCR codificada por dichos loci de TCR:

X - un fragmento de segmento génico variable (V)

Y - un fragmento de segmento génico constante (C)

Y '- parte de un segmento génico constante (C)

Z - un fragmento de segmento génico de unión (J)

Según la descripción anterior y los ejemplos que siguen, estas cuatro formas de elementos de secuencia de TCR pueden ensamblarse en varios contextos vectoriales para construir y desplegar un TORES para cualquier combinación V-J-C dada para cualquier cadena TCR dada. Por ejemplo, sistemas para el locus de TRG y TRD humanos nativos, formas de cadena del TCR variantes y/o sintéticas, o formas de cadena del TCR nativas de un organismo distinto al humano.

Los fragmentos de los segmentos génicos V y C son aquellos ensamblados en un vector de entrada V-C mediante un fragmento de clonación V y un fragmento de clonación C, respectivamente. Este proceso se describe bien en los Ejemplos 1 y 3.

La secuencia SEQ0690 representa un fragmento de clonación genérico del segmento génico variable, en donde la primera secuencia de Tipo IIS codifica el reconocimiento de la enzima Bsal, y la quinta y sexta secuencias de Tipo IIS codifican el reconocimiento de la enzima Bbsl y, por lo tanto, el fragmento de clonación del segmento génico variable. El fragmento del segmento génico variable codificado se designa como XNn, en donde X es la designación del segmento génico variable, N representa cualquier nucleótido y n representa el número de nucleótidos en esa secuencia.

La secuencia SEQ0691 representa un fragmento de clonación genérico del segmento génico constante, en donde la primera secuencia de Tipo IIS codifica el reconocimiento de la enzima Bsal, y la séptima y octava secuencias de Tipo IIS codifican el reconocimiento de la enzima Bbsl y, por lo tanto, el fragmento de clonación del segmento génico constante. El fragmento del segmento génico constante codificado se designa como YNn, en donde Y es la designación del segmento génico constante, N representa cualquier nucleótido y n representa el número de nucleótidos en esa secuencia.

Se utiliza una cadena principal del vector de entrada V-C representada por la secuencia SEQ0048 para construir vectores de entrada V-C adecuados para la expresión transitoria o marcos de lectura abiertos de TCR de longitud completa reconstituidos en una célula hospedadora de mamífero, en donde el primer y el segundo salientes se generan por la acción enzimática de Acc65l y Xbal de la cadena principal, respectivamente, y los elementos genéticos 5' y 3' están representados por el promotor constitutivo y la señal de poliadenilación, respectivamente.

Se utiliza una cadena principal del vector de entrada V-C representada por la secuencia SEQ0688 para construir vectores de entrada V-C adecuados para el intercambio de casete mediado por recombinasa con dianas genéticas coincidentes con secuencias de recombinasa heteroespecíficas adecuadas, en donde el primer y el segundo saliente se generan por acción de las enzimas Acc65l y Xbal de la cadena principal, respectivamente, y los elementos genéticos 5' y 3' están representados por secuencias de recombinasa heteroespecíficas de F14 y F15 que dirigen la actividad de flipasa, respectivamente.

Se utiliza una cadena principal del vector de entrada V-C representado por la secuencia SEQ0689 para construir vectores de entrada V-C adecuados para el intercambio de casete mediado por recombinasa con dianas genéticas con secuencias de recombinasa heteroespecíficas coincidentes, en donde el primer y segundo salientes se generan por acción de las enzimas Acc65l y Xbal de la cadena principal, respectivamente, y los elementos genéticos 5' y 3' están representados por secuencias heteroespecíficas de recombinasa FRT y F3 que dirigen la actividad de flipasa, respectivamente.

Combinando el fragmento de clonación V genérico descrito anteriormente, el fragmento de clonación C con una cadena principal seleccionada del vector de entrada V-C, los vectores de entrada V-C variantes pueden construirse para diferentes aplicaciones posteriores de ORF del TCR reconstituidos dentro de estos contextos de vectores variables.

la secuencia SEQ0692 representa un vector de entrada V-C genérico construido utilizando la cadena principal del vector de entrada V-C que tiene la secuencia SEQ0048. Este vector de entrada V-C resultante es adecuado para la expresión transitoria o para marcos de lectura abiertos del TCR de longitud completa reconstituido en una célula hospedadora de mamífero, en donde la primera y segunda secuencias de Tipo IIS codifican el reconocimiento de la enzima Bsal, y el fragmento de segmento génico variable se designa como XNn, y el fragmento de segmento génico constante se designa como YNn, en donde X e Y son designaciones para dichas secuencias, N representa cualquier nucleótido y n representa el número de nucleótidos en cada secuencia.

La secuencia SEQ0693 representa un vector de entrada V-C genérico construido utilizando la cadena principal del vector de entrada V-C que tiene la secuencia SEQ0688 está representado por la secuencia SEQ0693, que contiene las secuencias F14 y F15 adecuadas para el intercambio de casete mediado por recombinasa con dianas genéticas con secuencias de recombinasa heteroespecíficas coincidentes, en donde la primera y segunda secuencias de Tipo IIS codifican el reconocimiento de la enzima BsaI y el fragmento de segmento génico variable se designa como XNn y el fragmento de segmento génico constante se designa como YNn, en donde X e Y son designaciones para dichas secuencias, N representa cualquier nucleótido y n representa el número de nucleótidos en cada secuencia.

La secuencia SEQ0694 representa un vector de entrada V-C genérico construido utilizando la cadena principal del vector de entrada V-C que tiene la secuencia SEQ0689, que contiene las secuencias FRT y F3 adecuadas para el intercambio de casete mediado por recombinasa con dianas genéticas con secuencias de recombinasa heteroespecíficas coincidentes, en donde la primera y segunda secuencias de Tipo IIS codifican el reconocimiento de la enzima BsaI y el fragmento de segmento génico variable se designa como XNn y el fragmento de segmento génico constante se designa como YNn, en donde X e Y son designaciones para dichas secuencias, N representa cualquier nucleótido y n representa el número de nucleótidos en cada secuencia.

El uso de pares de vectores de entrada V-C con sitios de recombinasa heteroespecíficos diferentes puede utilizarse para cada cadena de un par de cadenas TCR, como se presenta en el Ejemplo 4 para el par de cadenas TRA y TRB humanas. Esto significa que en una aplicación posterior del TCR, las cadenas reconstituidas en este sistema TORES emparejado pueden suministrarse en un contexto genético con sitios receptores de recombinasa heteroespecíficos dobles. Por ejemplo, una línea celular que contenga dichos sitios receptores de recombinasa heteroespecíficos dobles para la integración genómica del par de cadenas del TCR.

La descripción anterior del vector de entrada V-C, y los componentes a partir de los cuales se ensamblan, se basa en el uso de las enzimas de Tipo IIS Bbsl y Bsal para la construcción y operación, respectivamente. Sobre la base de la guía anterior, pueden utilizarse una o más enzimas Tipo IIS alternativas para cada una de estas tareas.

Método para construir vectores donantes J

De forma similar al método combinatorio descrito anteriormente para la construcción de vectores de entrada V-C, puede utilizarse un método combinatorio para construir vectores donantes J. En el presente método, un vector donante J se construye en un proceso de dos etapas que implica la construcción de un vector del casete de recepción J intermedio en una primera etapa, en el que las partes de los segmentos J se insertan en una segunda etapa para formar el vector donante J. En este contexto, un vector del casete de recepción J, como el vector donante J derivado del mismo, contiene un pequeño fragmento de un segmento génico constante, denominado parte C. Por lo tanto, sería deseable un método o construcción combinatoria rápida para iterar diferentes formas de vectores donantes J que requieran el uso diferencial de segmentos génicos constantes. Este método se describe bien de forma práctica en los Ejemplos 2 y 3.

Un método para construir un vector donante J comprende combinar cuatro componentes de ADN seleccionados de

a. fragmento del casete de recepción J

b. cadena principal del vector donante J

c. vector del casete de recepción J

d. parte del segmento J

en donde, a) contiene la parte C mencionada anteriormente y cuatro sitios de clonación de Tipo IIS distintos para el ensamblado del vector y la operación de reacción de reconstitución; b) es la cadena principal del vector en la cual se inserta uno para crear c); d) es la parte del segmento génico J que se combina con c) para crear un vector donante J.

Un fragmento del casete de recepción J comprende

a. un primer saliente monocatenario en el extremo 5' complementario a la secuencia del saliente generado en la cadena principal del vector donante J

b. una tercera secuencia de Tipo IIS orientada para cortar en dirección 3' unida a una secuencia que forma un saliente monocatenario cuando la enzima actúa sobre él dirigida por una novena secuencia de Tipo IIS mencionada en c. c. una novena secuencia de Tipo IIs orientada para cortar en la dirección 5' y para crear un saliente monocatenario mencionado en b.

d. un marcador de selección negativa

e. una décima secuencia Tipo de IIS orientada para cortar en dirección 3' y crear un saliente monocatenario en el extremo 5' de la secuencia descrita en f.

f. una parte c que representa una parte 5' del fragmento génico constante, con la secuencia de un saliente en el extremo 5' generada por la acción enzimática dirigida por la décima secuencia de Tipo IIS y la secuencia de un saliente en el extremo 3' generada por la acción enzimática dirigida por la cuarta secuencia de Tipo IIS mencionada en g. g. una cuarta secuencia de Tipo IIS orientada para cortar en la dirección 5' de forma que se genera un saliente monocatenario dentro de la secuencia 5' que contiene la parte c mencionada en g

h. un segundo saliente monocatenario en el extremo 3' complementario de la secuencia del saliente generado en la cadena principal del vector donante J

en donde; a) y h) se utilizan para la clonación direccional en la cadena principal del vector donante J; b) y g) codifican secuencias de Tipo IIS utilizadas en la operación de una reacción de reconstitución; c) y e) codifican secuencias de Tipo IIS utilizadas en el ensamblado del vector donante J; d) representa un marcador de selección negativa para la eliminación del vector del casete de recepción J precursor durante el ensamblado del vector donante J; f) representa el fragmento del segmento génico constante que lleva el vector donante J.

La Figura 8 muestra una representación esquemática del fragmento del casete de recepción J. Los Ejemplos 2 y 3 describen el formato y uso de estos fragmentos del casete de recepción J para ensamblar vectores del casete de recepción J para los loci de TRA y TRB humanos, respectivamente.

En el presente contexto, los fragmentos del casete de recepción J se forman por la hibridación de oligonucleótidos monocatenarios parcialmente complementarios, lo que da como resultado un dúplex de ADN con salientes monocatenarios en cada extremo.

Los fragmentos del casete de recepción J para el locus de TRA se describen como SEQ0098 y SEQ0099.

Los fragmentos del casete de recepción J para el locus de TRB se describen como SEQ0578 y SEQ0581, en donde existen dos formas para representar los dos segmentos génicos constantes utilizados en el locus de TRB humano.

En los ejemplos proporcionados, el fragmento del casete de recepción J, la enzima de Tipo IIS utilizada para el ensamblado del vector donante J es Bbsl, mientras que la enzima de Tipo IIS utilizada para la reconstitución del ORF del TCR es Bsal.

Una cadena principal del vector donante J comprende

a. un origen de replicación

b. un segundo marcador de selección positiva

c. una primera secuencia de reconocimiento de enzimas de restricción que permite la digestión de la cadena principal para crear un saliente monocatenario complementario a un saliente del fragmento del casete de recepción J d. una segunda secuencia de reconocimiento de enzimas de restricción que permite la digestión de la cadena principal para crear un saliente monocatenario complementario a un saliente del fragmento del casete de recepción J en donde c) y d) permiten la clonación direccional de los fragmentos del casete de recepción J utilizando secuencias salientes complementarias únicas.

En la Figura se representa esquemáticamente una cadena principal del vector donante J 9 y se describe en detalle en los Ejemplos 2 y 3. Una secuencia de cadena principal del vector donante J se representa como SEQ0097.

La cadena principal del vector donante J contiene sitios de reconocimiento de enzimas de restricción para EcoRI y Xhol, para crear salientes compatibles con el saliente 5' y los salientes 3' proporcionados en los fragmentos de clonación génica del casete de recepción J.

El método para generar un vector del casete de recepción J mediante la combinación de un fragmento del casete de recepción J y la cadena principal del vector donante J se describe bien en los Ejemplos 2 y 3.

Se construye un vector del casete de recepción J combinando el fragmento del casete de recepción TRAJ y la cadena principal del vector donante J de TRA, en donde el método comprende

a. Digestión de la cadena principal del vector donante J con las dos enzimas de restricción específicas de las secuencias de reconocimiento contenidas dentro de la cadena principal del vector de entrada V-C

b. Combinando la cadena principal del vector donante J digerido con el fragmento del casete receptor J con la enzima ADN-ligasa

c. Transformación del producto de reacción resultante en un organismo hospedador competente y selección positiva utilizando dicho segundo marcador de selección positiva para obtener el vector del casete de recepción J

en donde; a) crea salientes monocatenarios complementarios a los contenidos dentro de los fragmentos del casete de recepción J; b) representa la ligación de salientes complementarios para formar el vector del casete de recepción J; c) representa la selección y propagación del producto del vector de recepción J.

La Figura 10 muestra una representación esquemática del vector del casete de recepción J. Los Ejemplos 2 y 3 describen la construcción de vectores del casete de recepción J para los loci de TRA y TRB humanos, respectivamente.

Un vector del casete de recepción J para el locus de TRA se describe como SEQ0098, mientras que los del locus de TRB se describen como SEQ0582 y SEQ0583. El locus de TRB utiliza dos segmentos génicos constantes, por lo tanto la réplica J de TRB de los vectores del casete de recepción J contienen secuencias de la parte C específicas de cada segmento génico constante.

Un vector del casete de recepción J se combina con una parte del segmento J para crear un vector donante J. La parte del segmento J codifica el volumen del segmento del gen J.

Dicha parte de segmento J comprende

a. Una primera secuencia del saliente monocatenario en el extremo 5' que es complementaria al saliente generado en el vector del casete de recepción J, cuando sobre él actúa la enzima dirigida por la novena secuencia de Tipo IIS

b. Una parte del segmento génico de unión

c. Una segunda secuencia del saliente monocatenario en el extremo 3' que es complementario al saliente generado en el vector del casete de recepción J, cuando sobre él actúa la enzima dirigida por la décima secuencia de Tipo IIS

en donde, a) y c) dirigen la clonación direccional de la parte del segmento J en el vector del casete de recepción J digerido mediante la una o varias enzimas de Tipo IIS proporcionadas en la reacción de ensamblado; b) codifica el segmento génico de unión que va a llevar el producto del vector donante J.

En la Figura 11 se muestra una representación esquemática de una parte del segmento J. Los Ejemplos 2 y 3 describen partes de segmentos J utilizadas para construir vectores donantes J para los loci de TRA y TRB humanos, respectivamente.

Las partes cortas de segmentos J que abarcan el uso de segmentos génicos J del locus de TRA humano se describen como SEQ0099 a SEQ0210, en donde la parte del segmento J se genera mediante el anillado parcial de oligonucleótidos monocatenarios complementarios, dando lugar a un dúplex de ADN con salientes monocatenarios en cada uno de los extremos.

Puede utilizarse una parte corta del segmento J para generar vectores donantes J con partes estandarizadas del segmento J de longitud mínima, como se presenta en los Ejemplos 2 y 3.

Puede utilizarse una parte larga del segmento J para generar vectores donantes J con cobertura extendida del segmento génico J para minimizar el tamaño del odeCDR3 utilizado en las reacciones de reconstitución del TCR. El acortamiento del elemento odeCDR3 ahorra costes de síntesis de dicho elemento y, también minimiza la carga mutacional en estos dúplex de oligonucleótido.

Las partes largas de segmentos J que abarcan el uso de segmentos génicos J del locus de TRA humano se describen como SEQ0211 a SEQ0322, en donde la parte del segmento J se genera mediante el anillado parcial de oligonucleótidos monocatenarios complementarios, dando como resultado un dúplex de ADN con salientes monocatenarios en cada uno de los extremos.

Las partes cortas de segmentos J que abarcan el uso de segmentos génicos J del locus de TRB humano se describen como SEQ0584 a SEQ0609, en donde la parte del segmento J se genera mediante el anillado parcial de oligonucleótidos monocatenarios complementarios dando como resultado un dúplex de ADN con salientes monocatenarios en cada uno de los extremos.

Las partes largas de segmentos J que abarcan el uso de segmentos génicos J del locus de TRB humano se describen como SEQ0610 a SEQ0635, en donde la parte del segmento J se genera mediante el anillado parcial de oligonucleótidos monocatenarios complementarios dando como resultado un dúplex de ADN con salientes monocatenarios en cada uno de los extremos.

En el presente contexto, las secuencias de Tipo IIS utilizadas para el ensamblado del vector donante J, designadas como la novena y décima secuencias de Tipo IIS anteriores, son iguales.

De forma alternativa, podrían utilizarse hasta dos secuencias de reconocimiento de Tipo IIS distintas para este procedimiento.

Las secuencias de Tipo IIS utilizadas para ensamblar el vector donante J, designadas como la novena y décima secuencias de Tipo IIS anteriores, deben ser diferentes de las utilizadas para la reacción de reconstitución; la primera, segunda, tercera y cuarta secuencias de Tipo IIS designadas anteriormente.

Las secuencias de Tipo IIS utilizadas para ensamblar el vector donante J, designadas como la novena y décima secuencias de Tipo IIS anteriores, son las mismas que las utilizadas para ensamblar el vector de entrada V-C; designadas como quinta, sexta, séptima y octava secuencias de Tipo IIS anteriores.

Estas secuencias de Tipo IIS utilizadas para ensamblar los vectores de entrada V-C y donantes J no tienen que ser iguales o distintas, ya que se tratan independientemente.

Una parte del segmento J se combina con un vector del casete de recepción J que contiene una parte C coincidente para generar un vector donante J.

Un vector donante J se construye combinando una cadena principal del vector donante J con una parte del segmento J, en donde el método comprende

a. Combinar el vector del casete de recepción J con la parte del segmento J, junto con la enzima ADN-ligasa y una o más enzimas de restricción Tipo IIS que reconocen la novena y décima secuencias Tipo IIS, y someter la mezcla combinada a una reacción de termociclado,

b. Transformación del producto de reacción resultante en un organismo hospedador competente y selección positiva utilizando dicho segundo marcador de selección positiva para obtener el vector donante J completo en donde, la acción de la enzima de Tipo IIS en la novena y décima secuencias de Tipo IIS en la etapa a) crea salientes monocatenarios dentro del vector del casete de recepción J, a través de la escisión de la secuencia del marcador de selección negativa.

En la Figura 3 se presenta una representación esquemática del vector donante J. Los Ejemplos 2 y 3 describen el uso de partes del segmento J y un vector del casete de recepción J para construir vectores donantes J para los loci de los TRA y TRB humanos, respectivamente.

Los vectores donantes J que contienen segmentos J cortos del locus del TRA humano se describen como SEQ0323 a SEQ0378, mientras que los vectores donantes J que contienen segmentos J largos del locus del TRA humano se describen como SEQ0379 a SEQ0434.

Los vectores donantes J que contienen segmentos J cortos del locus del TRB humano emparejado con segmentos génicos constantes C1 se describen como SEQ0636 a SEQ0648, mientras que los vectores donantes J que contienen segmentos J largos del locus del TRA humano se describen como SEQ0662 a SEQ0674.

Los vectores donantes J que contienen segmentos J cortos del locus del TRB humano emparejado con segmentos génicos constantes C2 se describen como SEQ0649 a SEQ0661, mientras que los vectores donantes J que contienen segmentos J largos del locus del TRA humano se describen como SEQ0675 a SEQ0687.

En los ejemplos proporcionados, la enzima de Tipo IIS utilizada para ensamblar un vector donante J es Bbsl, mientras que la enzima de Tipo IIS utilizada en la reconstitución de un TCR es Bsal. El marcador de selección negativa es una secuencia de la enzima de restricción Notl.

El método para construir un vector donante J conlleva también una etapa de selección negativa para eliminar el vector del casete de recepción J precursor antes de la transformación y selección.

En el ejemplo proporcionado, esta selección negativa implica una digestión Notl para eliminar el vector del casete de recepción J precursor antes de la transformación y selección.

Características genéricas de vectores donantes J y elementos de construcción

Como se ha descrito anteriormente y en el Ejemplo 5 más abajo, varias características de una genotecas de vectores de entrada y donante J pueden ser genéricas, siempre que los elementos de segmento génico del TCR se construyan en un contexto genérico para lograr un sistema TORES.

X - un fragmento de segmento génico variable (V)

Y - un fragmento de segmento génico constante (C)

Y '- parte de un segmento génico constante (C)

Z - un fragmento de segmento génico de unión (J)

La parte del segmento génico C y el fragmento del segmento génico J son los ensamblados en el vector donante J a través de un fragmento del casete de recepción J y un fragmento de clonación J, respectivamente. Este proceso se describe bien en los Ejemplos 2 y 3.

Un fragmento del casete de recepción J genérico representado por las secuencias SEQ0695 y SEQ0696, en donde la tercera y cuarta secuencias de Tipo IIS codifican el reconocimiento de la enzima Bsal, y la novena y décima secuencias de Tipo IIS codifican el reconocimiento de la enzima Bbsl, y el marcador de selección negativa representa una secuencia de reconocimiento de la enzima de restricción Notl. Dentro de esta secuencia, la parte C codificada se designa como Y'Nn, en donde Y' es la designación para la parte C, N representa cualquier nucleótido y n representa el número de nucleótidos en esa secuencia.

Los fragmentos del casete de recepción J se generan mediante hibridación de oligonucleótidos monocatenarios representados por el par de secuencias con la secuencia parcialmente complementaria.

Una cadena principal del vector donante J para construir un vector del casete de recepción J con el fragmento del casete de recepción J genérico anterior se representa por SEQ0097, en donde las enzimas de restricción EcoRI y Xhol se utilizan para generar salientes de ADN monocatenario necesarios para la inserción de la secuencia del fragmento del casete de recepción J.

Un vector del casete de recepción J construido mediante la combinación del fragmento del casete de recepción J generado a partir de los fragmentos del casete de recepción J representados como las secuencias SEQ0695 y SEQ0696, y una cadena principal del vector donante J representada por la secuencia SEQ0097, están representados por lo tanto por SEQ0697. Dentro de este vector del casete de recepción J, la tercera y cuarta secuencias de Tipo IIS codifican el reconocimiento de la enzima Bsal, y la novena y décima secuencias de Tipo IIS codifican el reconocimiento de la enzima Bbsl, y el marcador de selección negativa representa una secuencia de reconocimiento de la enzima de restricción Notl. Como se deriva del fragmento del casete de recepción J, la parte C codificada se designa como Y'Nn, en donde Y' es la designación para la parte C, N representa cualquier nucleótido y n representa el número de nucleótidos en esa secuencia.

El vector del casete de recepción J tiene una parte del segmento J insertada para obtener un vector donante J.

Una parte genérica del segmento J utilizada para su inserción en el vector del casete de recepción J genérico representado por SEQ0697, se representa por lo tanto mediante las secuencias complementarias SEQ0698 y SEQ0699, en donde la parte del segmento génico J se denota como ZNn, en donde Z es la designación del segmento génico J, N representa cualquier nucleótido, y n representa el número de nucleótidos en dicha secuencia.

Una parte de segmento J se genera por anillamiento los dos oligonucleótidos monocatenarios representados por SEQ0698 y SEQ0699.

Un vector donante J genérico ensamblado a partir de la combinación del vector del casete de recepción J representado por SEQ0697 y la parte del segmento J representado por las secuencias complementarias SEQ0698 y SEQ0699 está representado por lo tanto mediante la secuencia SEQ0700. Este vector donante J resultante contiene por lo tanto dos inserciones de secuencias anotadas de ZNn e Y'Nn, en donde Z es la designación del segmento del gen J e Y' es la designación de la parte del segmento C, N representa cualquier nucleótido, y n representa el número de nucleótidos en dichas secuencias.

La descripción anterior del vector de entrada V-C, y los componentes a partir de los cuales se ensamblan, se basan en el uso de las enzimas de Tipo IIS Bbsl y Bsal para la construcción y operación, respectivamente. Sobre la base de la orientación anterior, pueden utilizarse una o más enzimas Tipo IIS alternativas para cada una de estas tareas.

Uso de los ORF del TCR de longitud completa en contextos de vector definidos para diagnóstico y terapéuticos

Un desafío clave para aprovechar la inmunidad de los linfocitos T en el tratamiento de enfermedades es la diversidad interindividual de los sistemas HLA y TCR, junto con el contenido intraindividual masivo del repertorio de TCR. Esto significa que los medicamentos y estrategias terapéuticas que se basan en la evaluación y/o administración de los TCR requieren una evaluación sólida de la función del TCR en un contexto biológico adecuado.

Para lograr una evaluación precisa de pares de cadenas del TCR nativo se necesita un método de alto rendimiento fiable y rentable para administrar los ORF del TCR capturados en contextos de vectores definidos. Un TORES para cualquier par de cadenas dado es un medio para suministrar dichos ORF del TCR.

Un contexto de vector definido para los ORF del TCR puede ser, por ejemplo, un vector de expresión transitorio, por ejemplo, donde los TCR puedan caracterizarse rápidamente en la superficie de las células humanas como se describe en el Ejemplo 8. En este ejemplo, los TCR podrían secuenciarse y volverse a expresar para confirmar la especificidad esperada. Esto permite el uso de secuencias del TCR validadas para seguir la abundancia de clonotipos del TCR por secuencia o amplificación o ensayos basados en sondas para procedimientos diagnósticos durante intervenciones inmunoterapéuticas de forma personalizada. De forma similar, la captura y validación rápidas de pares de cadenas de TCR significa que dichos pares del TCR podrían administrarse en medicina personalizada, tal como la administración de construcciones de TCR solubles como compuesto medicinal, o la provisión del TCR en una célula efectora como agente terapéutico celular.

En un enfoque similar, un sistema TORES es idealmente adecuado para la manipulación de los ORF del TCR para cambiar la especificidad y/o la función, como se describe en los Ejemplos 9 y 10. Esta ingeniería puede utilizarse para mejorar o reducir la intensidad de la señalización y/o cambiar o redirigir la especificidad de los pares de cadenas de TCR hacia antígenos específicos de la enfermedad. Dichas secuencias del TCR modificadas podrían proporcionarse en estrategias inmunoterapéuticas personalizadas en lugar de pares de cadenas del TCR nativas.

Sistema de diseño por ingeniería genética y reconstitución del ORF del TCR bidireccional (TORES 2)

El sistema TORES descrito anteriormente trata cada cadena del TCR dentro de sistemas de genoteca de vectores de dos partes independientes. Por lo tanto, los productos de la operación de TORES son vectores discretos que codifican los ORF del TCR reconstituido. En un aspecto independiente, la presente invención proporciona un sistema alternativo para unir pares de cadenas recíprocas del TCR en un único vector producto con un método de dos etapas. Esto se logra en un sistema de genoteca de vectores de cinco componentes, en donde los vectores de entrada V-C modificados se combinan con los vectores donantes J del sistema TORES y odeCDR3 para lograr una reconstitución de un par de cadenas del TCR en reacciones diferenciadas. A continuación, los vectores de entrada V-C modificados permiten una reconstitución de los ORF del TCR para que se unan en una segunda etapa mediante la adición de un quinto componente vectorial, el vector donante del terminador bidireccional (donante BiT), para lograr un vector que codifica los dos pares del OFR del TCR en sentido de codificación antiparalelo.

Estos TORES bidireccionales (TORES2) representan un sistema combinado de vectores de cinco componentes ya que las modificaciones realizadas en los elementos que codifican los vectores de entrada V-C de los pares de cadenas recíprocos no son simétricos. Lo que significa que los vectores de entrada V-C comprenden disposiciones distintas. Es decir, el ORF reconstituido de una cadena se escinde del vector producto de la primera etapa y se liga en orientación antisentido en el vector producto recíproco de la primera etapa. Por lo tanto, el emparejamiento de los vectores de entrada V-C es crítico, ya que uno de los vectores de entrada V-C originales del sistema TORES2 representa la cadena principal del producto final y, por lo tanto, codifica los elementos genéticos 3' y 5' deseados para la aplicación posterior del par de TCR reconstituido y unido. Para mayor claridad, la descripción y los ejemplos presentados a continuación fijan la cadena del TRA como la cadena principal del producto final (p. ej., vector de entrada V-Ca) y el TRB como cadena integrada en esta cadena principal del producto final (p. ej., vector de entrada V-Cp). La disposición recíproca es igualmente válida, así como cualquier otra combinación de pares recíprocos de cadenas del TCR.

Componentes del vector de entrada V-C de TORES2

Como se ha mencionado anteriormente, el sistema de genoteca de vectores de cinco componentes que comprende TORES2 difiere del sistema TORES en la provisión de contextos de vector de entrada V-C modificados. Estas modificaciones incorporan sitios de Tipo IIS (marcados como de Tipo IIS n .° 2) y elementos de selección negativos (marcados como selección negativa n .° 2) distintos de los utilizados para la reconstitución del ORF del TCR en una primera etapa, para dirigir la unión de dichos ORF reconstituidos en un solo vector en una segunda etapa. En efecto, el sistema TORES2 incorpora el sistema TORES dentro de un nuevo contexto de vector de entrada V-C. La descripción siguiente trata la TRA cadena como la cadena principal del producto final, y la cadena TRB como la ligada a la cadena principal de la TRA reconstituida en una orientación antisentido. El mismo marco se aplica a cualquier par de cadenas del TCR, y no hay razones particulares en cuanto a por qué cualquiera de las cadenas del TCR tenga que estar en una de las disposiciones de los vectores descritos, o en la otra.

El vector de entrada V-Ca contiene,

a. origen de replicación,

b. un primer marcador de selección positiva,

c. elemento o elementos genéticos 5',

d. secuencia de Kozak,

e. segmento génico alfa variable del TCR,

f. una primera secuencia de Tipo IIS, para el reconocimiento y corte específicos de sitio mediante una enzima de restricción de Tipo IIS (para una enzima de Tipo IIS n.° 1),

g. un primer marcador de selección negativa,

h. una segunda secuencia de Tipo IIS (para una enzima de Tipo IIS n.° 1),

i. segmento génico constante del TCR,

j. una tercera secuencia de Tipo IIS (para una enzima de restricción de Tipo IIS n.° 2),

k. un segundo marcador de selección negativa,

l. una cuarta secuencia de Tipo IIS (para una enzima de restricción de Tipo IIS n.° 2), y

m. elemento o elementos genéticos en 3'

en donde, a) y b) se utilizan para la propagación y selección tanto del vector de entrada V-C precursor como del vector que contiene el TCR reconstituido en un hospedador bacteriano; c) y m) se utilizan para definir la aplicación posterior de los ORF de longitud completa reconstituidos y contiguos, y pueden incluir elementos como se ha descrito anteriormente para el TORES; d) asegura el inicio eficiente de la traducción en células eucariotas, lo que podría representar de forma alternativa una secuencia de Shine-Dalgarno para la regulación de la transición en procariotas y arqueas; e) representa el segmento génico variable (V) alfa del codón de inicio para un motivo en el extremo 5' de la región CDR3 conservada en todos los segmentos V de un sistema de vectores bicomponente determinado; f) representa una secuencia de reconocimiento de Tipo IIS n.° 1 que dirige una enzima de restricción de Tipo IIS para cortar en la dirección 5' y crear un saliente monocatenario estandarizado en el extremo 3' del segmento génico V; g) representa un marcador de selección negativa n.° 1 para eliminar el vector de entrada V-C precursor durante el funcionamiento del sistema para reconstituir un ORF del TCR de longitud completa; h) representa una secuencia de reconocimiento de Tipo IIS n.° 1 que dirige una enzima de restricción de Tipo IIS para cortar en la dirección 3' y crear un saliente monocatenario estandarizado en el extremo 5' del segmento génico C; i) representa el segmento génico constante (C) de un motivo en el extremo 5' del segmento génico C conservado en todos los segmentos C de un sistema vectorial bicomponente específico, y que define el límite con el segmento J (véanse las Figuras 2 y 4); j) representa una secuencia de reconocimiento de Tipo IIS n.° 2 que dirige una enzima de restricción de Tipo IIS para cortar en la dirección 5' y crear un saliente monocatenario estandarizado en el extremo 3' después del segmento génico C, esta enzima de Tipo IIS es diferente de la primera y la segunda enzima de Tipo IIS n.° 1; k) representa un marcador de selección negativa n.° 2 para eliminar el vector del ORF del TCR precursor durante la operación de crear una construcción de vector bidireccional; es distinto del primer marcador de selección negativa; l) representa una secuencia de reconocimiento de Tipo IIS n.° 2 que dirige una enzima de restricción de Tipo IIS para cortar en la dirección 3' y crear un saliente monocatenario estandarizado antes del elemento genético 3', esta enzima de Tipo IIS es distinta de la primera y segunda enzimas de Tipo IIS n.° 1; m) representa el elemento o elementos genéticos 3'.

La disposición del vector de entrada V-Ca descrito anteriormente se representa en la Figura 20a.

De forma general, las enzimas primera y segunda de Tipo IIS (designadas como de Tipo IIS n.° 1) son iguales, pero también pueden ser diferentes. De forma similar, la tercera y cuarta enzimas de Tipo IIS (designadas como de Tipo IIS n.° 2) son generalmente iguales pero también pueden ser diferentes. Críticamente, la una o varias enzimas de Tipo IIS utilizadas en el primer y segundo sitios de Tipo IIS (Tipo IIS n.° 1) deben ser diferentes de la enzima o enzimas utilizadas en el tercer y cuarto sitios de Tipo IIS (Tipo IIS n.° 2).

Una cadena principal del vector de entrada V-Ca se representa por SEQ0756, como se presenta en el Ejemplo 11.

El Ejemplo 11 más abajo presenta un vector de entrada V-Ca del TORES2 para el locus de TRA humano (SEQ0756), en donde algunas de las secuencias V/C se han modificado respecto a las incorporadas en el sistema TORES ya que están desprovistas de la enzima de Tipo IIS utilizada en el tercer y cuarto sitios (SEQ0757 a SEQ0763)

El vector de entrada V-Cp contiene,

a. origen de replicación,

b. un primer marcador de selección positiva,

c. elemento o elementos genéticos 5',

d. una primera secuencia de Tipo IIS, para el reconocimiento y escisión específicos de sitio mediante una enzima de restricción de Tipo IIS n.° 2

e. secuencia de Kozak,

f. segmento génico beta variable del TCR,

g. una segunda secuencia de Tipo IIS, para el reconocimiento y escisión específicos de sitio mediante una enzima de restricción de Tipo IIS (Tipo IIS n.° 1),

h. un primer marcador de selección negativa,

i. una tercera secuencia de Tipo IIS (Tipo IIS n.° 1),

j. segmento génico constante del TCR,

k. una cuarta secuencia de Tipo IIS (Tipo IIS n.° 2),

l. un segundo marcador de selección negativa, y

m. elemento o elementos genéticos 3'

en donde, a) y b) se utilizan para la propagación y selección tanto del vector de entrada V-C precursor como del vector que contiene el TCR reconstituido en un hospedador bacteriano; c) y m) opcionalmente definen la aplicación posterior del ORF del TCR de longitud completa reconstituido como se ha descrito anteriormente para el sistema TORES; d) representa una secuencia de reconocimiento de Tipo IIS n.° 2 que dirige una enzima de restricción de Tipo IIS para cortar en la dirección 3' y crear un saliente monocatenario estandarizado después del elemento genético 5' y antes de la secuencia de Kozak, esta enzima de Tipo IIS es distinta de la segunda y tercera enzimas de Tipo IIS n.° 1; e) asegura el inicio eficiente de la traducción en células eucariotas, lo que podría representar de forma alternativa una secuencia de Shine-Dalgarno para la regulación de la transición en procariotas y arqueas; f) representa el segmento génico variable (V) del codón de inicio a un motivo en el extremo 5' de la región CDR3 conservada en todos los segmentos V en un sistema de vectores bicomponente determinado; g) representa una secuencia de reconocimiento de Tipo IIS n.° 1 que dirige una enzima de restricción de Tipo IIS para cortar en la dirección 5' y crear un saliente monocatenario estandarizado en el extremo 3' del segmento génico V; h) representa un marcador de selección negativa para eliminar el vector de entrada V-C precursor durante el funcionamiento del sistema para reconstituir un ORF del TCR de longitud completa; i) representa una secuencia de reconocimiento de Tipo IIS n.° 1 que dirige una enzima de restricción de Tipo IIS para cortar en el la dirección 3' y crear un saliente monocatenario estandarizado en el extremo 5' del segmento génico C; j) representa el segmento génico constante (C) de un motivo en el extremo 5' del segmento génico C conservado en todos los segmentos C de un sistema de vectores bicomponente específico y que define el límite con el segmento J (véanse las Figuras 2 y 4); k) representa una secuencia de reconocimiento de Tipo IIS n.° 2 que dirige una enzima de restricción de Tipo IIS para cortar en la dirección 5' y crear un saliente monocatenario estandarizado después del segmento C pero antes del segmento del elemento genético 3', esta enzima de Tipo IIS es distinta de la segunda y tercera enzimas de Tipo IIS n.° 1; m) representa un segundo marcador de selección negativa que es distinto del primer marcador de selección negativa, I) representa el elemento o elementos genéticos 3'.

La disposición del vector de entrada V-Cp descrito anteriormente se representa en la Figura 20b.

Los elementos genéticos en 3' y 5' son opcionales en el contexto del vector de entrada V-Cp, ya que el ORF reconstituido dentro de este vector se escinde y se liga posteriormente en el contexto de la cadena principal del vector de entrada V-Ca. Es decir, la cadena principal del vector de entrada V-Ca.

De forma general, la segunda y la tercera enzima del Tipo IIS (designadas como Tipo IIS n.° 1) son iguales, pero también pueden ser diferentes. De forma similar, las enzimas primera y cuarta Tipo IIS (designadas como Tipo IIS n.° 2) son generalmente iguales pero también pueden ser diferentes. Críticamente, la una o varias enzimas de Tipo IIS utilizadas para el segundo y tercer sitios de Tipo IIS (Tipo IIS n.° 1) deben ser diferentes de la una o varias enzimas utilizadas para el primer y cuarto sitios (Tipo IIS n.° 2).

De forma general, el primer y segundo sitios de Tipo IIS (Tipo IIS n.° 1) del vector de entrada V-Ca son los mismos que el segundo y tercer del vector de entrada V-Cp, pero esto no es necesario ya que estas reacciones pueden funcionar independientemente. La reconstitución de cadenas TRA y cadenas TRB en el sistema descrito podría realizarse en una sola reacción si el primer y segundo sitios de Tipo IIS del vector de entrada V-Ca fueran distintos de los del segundo y tercer sitios de Tipo IIS de los vectores de entrada V-Cp.

De forma general, el tercer y cuarto sitios de Tipo IIS (Tipo IIS n.° 2) de los vectores de entrada V-Ca son los mismos que el primero y el cuarto de los vectores de entrada V-Cp para que solo sea necesario añadir una única enzima de Tipo IIS (Tipo IIS n.° 2) a la segunda reacción de unión.

De forma general, el segundo marcador de selección negativa (selección negativa n.° 2) de cada vector de entrada V-Ca y V-Cp es el mismo para facilitar la selección negativa eficiente de vectores parentales en la etapa adjunta de la actuación de TORES2, pero también puede ser distinto.

Una cadena principal del vector de entrada V-Cp se representa por SEQ0764, como se presenta en el Ejemplo 11.

El Ejemplo 11 más abajo presenta un vector de entrada V-Cp del TORES2 para el locus de TRB humano (SEQ0764), en donde algunas de las secuencias V/C se han modificado respecto a las incorporadas en el sistema TORES ya que están desprovistas de la enzima de Tipo IIS utilizada en el primer y cuarto sitios (SEQ0765 a SEQ0776)

Componentes J donante y odeCDR3 del TORES2

El vector donante J y el dúplex de oligonucleótidos que codifica el CDR3 son los mismos que ya se describieron para el TORES convencional mencionado anteriormente. Ambos se utilizan dentro de la una o varias reacciones de la primera etapa para reconstituir los pares recíprocos de cadenas TCR dentro de los contextos de cadena principal del vector de entrada V-C designados en un procedimiento idéntico al descrito anteriormente para el TORES.

Vector donante del terminador bidireccional (donante BiT) del TORES2

Los primeros cuatro componentes de la genoteca de vectores del TORES2 representan los vectores de entrada V-Ca y V-Cp junto con los vectores donantes J de cada una de las cadenas TRA y TRB de la descripción centrada en TRA/TRB. Nuevamente, cabe señalar que cualquier cadena TCR puede incorporarse a este sistema siguiendo los principios de diseño descritos, y que la configuración de TRA y TRB específica se ha fijado para mayor claridad.

El quinto componente representa el vector donante del terminador bidireccional (donante de BiT), que proporciona un elemento terminador bidireccional que está interpuesto por las cadenas TRA y TRB de sentido antiparalelo reconstituidas en la reacción de la primera etapa, y unidas mediante este elemento terminador bidireccional en la reacción de la segunda etapa.

El terminador bidireccional se proporciona generalmente como un vector y también está rodeado por dos enzimas de restricción de Tipo IIS (Tipo IIS n.° 2). Es igualmente relevante proporcionar el elemento terminador bidireccional como una construcción de ADNbc lineal con estos sitios de Tipo IIS, o con salientes de ADN monocatenario diana sin sitios de Tipo IIS.

El vector que contiene el terminador bidireccional contiene,

a. origen de replicación,

b. un segundo marcador de selección positiva,

c. secuencia del primer Tipo IIS (Tipo IIS n.° 2),

d. terminador bidireccional, y

e. secuencia del segundo Tipo IIS (Tipo IIS n.° 2)

en donde a) y b) se utilizan para la propagación y selección del vector que lleva el terminador bidireccional en un hospedador bacteriano, c) representa una secuencia de reconocimiento de Tipo IIS que dirige una enzima de restricción de Tipo IIS (Tipo IIS n.° 2) para cortar en la dirección 3' y crear un saliente monocatenario estandarizado, d) representa el terminador bidireccional que se utiliza para asegurar la terminación transcripcional en las cadenas de ADN sentido y antisentido durante la expresión de los TCR reconstituidos en la estructura TRA, cuando dicho vector que contiene un ORF del TCR reconstituido se transfecta a células de mamífero; e) representa una secuencia de reconocimiento de Tipo IIS (Tipo IIS n.° 2) que dirige una enzima de restricción de Tipo IIS para cortar en la dirección 5' y crear un saliente monocatenario estandarizado.

La disposición del vector donante BiT descrito anteriormente se representa en la Figura 21.

De forma general, el marcador de selección positiva contenido dentro del donante de BiT es distinto del de los marcadores de selección positiva que tienen los vectores de entrada V-Ca y V-Cp, para minimizar el arrastre del donante de BiT precursor a la segunda etapa de reacción de unión.

De forma general, el primer y el segundo sitios de Tipo IIS (Tipo IIS n.° 2) del donante de BiT son iguales que tanto el tercer como el cuarto sitio de Tipo IIS de los vectores de entrada V-Ca y el primero y el cuarto de los vectores de entrada V-Cp, para que solo sea necesario añadir una única enzima de Tipo IIS (Tipo IIS n.° 2) a la segunda reacción de unión.

La secuencia del elemento terminador bidireccional se representa por SEQ0777.

Funcionamiento de TORES2 para reconstituir y unir los pares de ORF del TCR de longitud completa

El funcionamiento del TORES2 es un proceso de dos etapas, que incorpora una primera etapa de reconstitución del ORF del TCR, y una segunda etapa de unión del ORF del TCR. El método para la reconstitución de los ORF del TCR es idéntico al descrito anteriormente para el TORES (véanse las Figuras 1 y 4). Los productos de la primera etapa son por lo tanto análogos a los productos de TORES, comprendiendo vectores que codifican los ORF del TCR de longitud completa que contienen la disposición de elementos V-CDR3-J-C. Sin embargo, el sistema TORES2 proporciona estos ORF del TCR en un contexto de cadena principal distinto del sistema TORES, en donde la cadena principal de TORES2 contiene sitios de clonación adicionales para facilitar la reacción de la segunda etapa de unión. Esta segunda etapa de reacción de enzima de restricción y ciclo de ligasa implica la unión de los ORF del TCR reconstituidos procedentes de la primera etapa, en un sentido antiparalelo y la interposición de un elemento terminador bidireccional proporcionado por el donante de BiT. El proceso general se representa en la Figura 22, que representa la disposición TRA/TRB TORES2 descrita anteriormente.

El vector que codifica TRA reconstituido (Figura 22 a), el vector que codifica TRB (Figura 22 b) y el donante BiT (Figura 22 c) se hacen reaccionar en un solo tubo con enzima de Tipo IIS (Tipo IIS n.° 2) y ligasa y se someten a una reacción de enzima de restricción y ciclo de ligasa. La enzima de restricción de Tipo IIS digiere los tres vectores proporcionados para obtener tres subproductos de reacción y tres productos intermedios de reacción con salientes diseñados para la ligación direccional en el producto de reacción.

Los tres subproductos de reacción se representan por el elemento de selección negativa n.° 2 y los sitios de Tipo IIS n.° 2 procedentes del vector TRA (Figura 22d), la cadena principal abierta del vector que codifica TRB de la que se ha escindido el ORF de TRB reconstituido (Figura 22e) y la cadena principal abierta del donante BiT de la que se ha escindido el elemento terminador bidireccional (Figura 22f).

El primero de los intermedios de reacción es el vector TRA abierto, que codifica el ORF del TRA reconstituido en el contexto de la cadena principal del vector de entrada V-Ca (Figura 22g). El tercer sitio de Tipo IIS n.° 2 en el vector de entrada V-Ca original que se ha descrito anteriormente dirige la enzima para cortar en la dirección 5' y crear un saliente monocatenario estandarizado en el extremo 3' después del segmento génico C (Figura 22g, saliente X 1 -5'), mientras que el cuarto sitio de Tipo IIS n.° 2 dirige la escisión de la enzima en la dirección 3' para crear un saliente monocatenario estandarizado antes del elemento genético en 3' (Figura 22e, saliente X 3-3').

El segundo intermedio de reacción es el fragmento que codifica ORF de TRB escindido del contexto del vector de entrada V-Cp. El primer sitio de Tipo IIS n.° 2 en el vector de entrada V-Cp descrito anteriormente dirige la enzima para cortar en la dirección 3' y crear un saliente antes de la secuencia de Kozak (Figura 22h, saliente X 3-5'). El cuarto sitio de Tipo IIS n.° 2 dirige la enzima a cortar en la dirección 5' y crear un saliente después del segmento C (Figura 22h, saliente X2-3'). Cabe señalar que la Figura 22 h representa este intermedio en la orientación antisentido en la que se ligará en el contexto del vector producto.

El tercer intermedio de reacción es el elemento terminador bidireccional escindido del donante BiT, donde el primer sitio de Tipo IIS n.° 2 dirige la enzima para cortar en la dirección 5' y producir un saliente monocatenario estandarizado (Figura 22i, saliente X 1-3'). El segundo sitio de Tipo IIS n.° 2 dirige la enzima para cortar en la dirección 3' y crear un saliente monocatenario estandarizado (Figura 22i, saliente X 2-5').

Dentro de la reacción de ciclo de la enzima de restricción y de la ligasa, los salientes monocatenarios dirigen la ligación direccional mediada por ligasa en el vector producto, uniendo las cadenas del TRA y TRB en el contexto original de la cadena principal del vector de entrada V-Ca (Figura 22j).

Un TORES2 puede construirse para cualquier colección de cadenas TCR. Para mayor claridad, los loci de TRA y TRB se utilizan como estudio de caso para la descripción. La construcción de dichos TORES2 es igualmente aplicable en el contexto de los loci TRD y TRG que codifican el par de cadenas delta y gamma del TCR, respectivamente, o de hecho para cualquier sistema de pares de cadenas TRA/TRB, TRD/TRG o variante del TCR que se encuentra en los vertebrados con mandíbulas.

En los ejemplos siguientes se proporciona un sistema TORES2 para los loci de TRA/TRB humanos, y se aplica a la reconstitución de un ORF del TCR humano modelo que posteriormente se integra en una línea celular coincidente modificada que contiene sitios RMCE coincidentes con los elementos genéticos 5' y 3' del contexto de la cadena principal del vector de entrada V-Ca original. Esto demuestra que TORES2 se utiliza fácilmente junto con líneas celulares diseñadas por ingeniería genética coincidentes optimizadas para la integración y presentación de los ORF del TCR reconstituidos en una configuración de un dispositivo de dos partes similar a la descrita en la solicitud WO 2018/083318 A1.

A continuación se proporciona una tabla que muestra las secuencias mencionadas en la presente descripción.

Lista de abreviaturas

APC Célula presentadora de antígeno

BiT Donante del terminador bidireccional

CAR-T Linfocitos T CAR

CAR Receptor de antígeno quimérico

CDR Regiones determinantes de la complementariedad

Segmento C Segmento constante (también región C)

CMV Citomegalovirus

DAMPS Patrones moleculares asociados a peligros

DC Células dendríticas

ADN Ácido desoxirribonucleico

ADNbc Molécula de ácido desoxirribonucleico bicatenario

Segmento D Segmento de Diversidad (también región D)

eAPC Célula presentadora de antígeno diseñada por ingeniería genética FACS Clasificación de células activadas por fluorescencia

FRT Diana de reconocimiento de flipasa

GEM Linfocitos T reactivos a micolilo codificados por la línea germinal de linfocitos T GFP Proteína fluorescente verde

HLAI HLA de clase I

HLAII HLA de clase II

HDR Recombinación dirigida por homología

HLA Antígeno leucocitario humano

IgSF Superfamilia de inmunoglobulinas

IRES Sitio interno de entrada al ribosoma

ITAM Motivo de activación basado en tirosina del inmunorreceptor

Linfocitos T iNK Linfocitos T natural killer invariantes

Segmento J Segmento de unión (también región J)

MACS Clasificación celular activada magnéticamente

MAGE Antígeno asociado a melanoma

MAIT Linfocitos T invariantes asociados a la mucosa

odeCDR3 Dúplex de oligonucleótidos que codifica CDR3

ORF Marco de lectura abierto

PAMPS Patrones moleculares asociados a patógenos

PCR Reacción en cadena de la polimerasa

RMCE Intercambio de casete mediado por recombinasa

RFP Proteína fluorescente roja

RT Transcripción inversa

ADN Ácido ribonucleico

SH2 Homología Src 2

Células T Linfocitos T

TCR Receptor de linfocitos T

TRA TCR alfa

TRB TCR beta

TRD TCR delta

TRG TCR gamma

TAA Antígenos asociados a tumores

TORES Sistema de ingeniería y reconstitución del ORF del TCR

TORES2 Sistema de ingeniería y reconstitución del ORF del TCR bidireccional

Segmento V Segmento variable (también región V)

P2M p2 microglobulina

ZAP-70 Proteína asociada a la cadena Z de 70 kDa

Lista de definiciones

Par de cadenas del TCR complem entarias: dos cadenas del TCR, en donde las proteínas traducidas pueden formar un TCRsp en la superficie de una célula presentadora de TCR

Afinidad: Parámetro cinético o de equilibrio de la interacción entre dos o más moléculas o proteínas

Alelo: Forma variante de un gen específico

Am plicón: una fragmento de ADN o ARN que es el origen y/o un producto de amplificación artificial utilizando diversos métodos, que incluyen PCR.

Analito: una entidad que interesa identificar y/o medir y/o interrogar

Anticuerpo: Molécula de afinidad expresada por células especializadas del sistema inmunitario denominadas linfocitos B y que contiene dos cadenas. Los linfocitos B expresan un repertorio muy grande y muy diverso de anticuerpos que generalmente no se unen a proteínas propias, pero que pueden unir y neutralizar patógenos o toxinas que pudieran suponer una amenaza para el hospedador. Los anticuerpos nativos o modificados artificialmente se utilizan frecuentemente como reactivos de afinidad.

APC: Célula presentadora de antígeno. Una célula que puede presentar un antígeno en su superficie celular, generalmente en el contexto de un HLA.

C (segmento): Segmento constante. También región constante. Uno de los segmentos génicos que se utiliza para ensamblar el receptor de linfocitos T. La región c es un segmento distinto que en vez de dirigir la diversidad del TCR, define su función general en el sistema inmunitario.

Fragmento de clonación C: Fragmento de clonación constante. También denominado fragmento de clonación de segmento génico C. Construcción que lleva una parte de un segmento génico C utilizado para construir un vector de entrada V-C.

Parte C: Parte constante. Una pequeña parte de la secuencia constante del segmento génico llevada por un fragmento del casete de recepción J, el casete de recepción J y el vector donante J para estandarizar las secuencias salientes para la actuación del TORES para reconstituir los ORF del TCR.

CDR: regiones determinantes de la complementariedad. Secuencias cortas en el extremo orientado hacia el antígeno de los TCR y anticuerpos que desempeñan la mayor parte de la función de unión a dianas. Cada anticuerpo y TCR contiene seis CDR y generalmente son la parte más variable de las moléculas, que permiten la detección de un gran número de diversas moléculas diana.

Elemento cis actuante: regiones de ADN antisentido que regulan la transcripción de ORF cercanos.

D (segmento): Segmento de diversidad. También región D. Uno de los segmentos génicos que se utiliza para ensamblar el receptor de linfocitos T. Cada individuo tiene un gran número de variaciones distintas de estas regiones, permitiendo así armar linfocitos T con una variedad muy grande de TCR distintos.

Diversificación: Proceso donde se diversifica una secuencia.

ADN: Ácido desoxirribonucleico. Nombre químico de la molécula que forma el material genético que codifica genes y proteínas.

Endógeno: Sustancia que se origina dentro de una célula

Elemento regulador condicional eucariota: Secuencia de ADN que puede alterar la actividad de un promotor, que puede inducirse o reprimirse bajo condiciones definidas.

Promotor eucariótico: Secuencia de ADN que codifica un sitio de unión a la ARN polimerasa y elementos de respuesta. La secuencia de la región promotora controla la unión de la ARN polimerasa y de los factores de transcripción; por lo tanto, los promotores tienen gran importancia en la determinación del lugar y el momento en que se expresará el gen de interés.

Terminador eucariota/terminador de señal: Secuencia de ADN reconocida por factores proteicos que se asocian con la ARN polimerasa II y que desencadenan el proceso de terminación de la transcripción. También codifica la señal poli-A

FACS/citometría de flu jo : Clasificación de células activadas por fluorescencia. La citometría de flujo es una técnica por la cual las células individuales pueden analizarse en masa para determinar la expresión de marcadores intracelulares y de superficie celular específicos. Una variación de esa técnica, la clasificación celular, permite recuperar las células que llevan un conjunto definido de marcadores para un análisis posterior.

Flipasa: Una recombinasa (Flipasa, Flp) derivada del plásmido de 2 |um de la levadura del pan Saccharomyces cerevisiae.

Sitios de recombinasa heteroespecíficos: Secuencia de ADN reconocida por una enzima recombinasa para estimular el entrecruzamiento de dos moléculas de ADN

HLA I: Antígeno leucocitario humano de clase I. Un gen que se expresa en todas las células nucleadas humanas y se exporta a la superficie celular donde presenta como carga fragmentos cortos, péptidos o proteínas internas a los receptores de linfocitos T. De este modo presenta fragmentos de infecciones potenciales en curso junto con proteínas intrínsecas. El HLA I puede presentarse además en forma de péptidos de carga que se añaden al medio de cultivo, generados a partir de proteínas expresadas a partir de elementos génicos introducidos o generados a partir de proteínas captadas por la célula. Los genes HLA de clase I son polimórficos, lo que significa que es probable que diferentes individuos tengan variaciones en el mismo gen, dando lugar a una variación en la presentación. Relacionado con e1HLA de clase II.

HLA II: Antígeno leucocitario humano de clase II. Gen que se expresa en células específicas humanas que coordinan y ayudan a la respuesta inmune adaptativa, por ejemplo, en células dendríticas. Relacionado con e1HLA de clase I. Las proteínas HLA de clase II se exportan a la superficie celular, donde presenta como carga fragmentos cortos, péptidos, proteínas externas a receptores de linfocitos T. De este modo presenta fragmentos de infecciones potenciales en curso junto con proteínas intrínsecas. El HLA II puede presentarse además en forma de péptidos de carga que se añaden al medio de cultivo, generados a partir de proteínas expresadas a partir de elementos génicos introducidos o generados a partir de proteínas captadas por la célula. Los genes HLA de clase II son polimórficos, lo que significa que es probable que diferentes individuos tengan variaciones en el mismo gen, dando lugar a una variación en la presentación.

Brazos homólogos: Tramo de ADN que tiene una identidad de secuencia casi idéntica a un brazo homólogo del complemento y que, por lo tanto, favorece el intercambio de dos moléculas de ADN por el proceso celular de la reparación dirigida por homología.

Vigilancia inmunitaria: Proceso en el que el sistema inmunitario detecta, y es activado por, infecciones, neoplasias malignas u otras alteraciones potencialmente patógenas.

Aislante: Secuencia de ADN que evita que un gen se vea influido por la activación o represión de genes cercanos. Los aislantes también impiden la descondensación de la heterocromatina de un gen silenciado a un gen transcrito activamente.

Integración: Ligación física de una secuencia de ADN en un cromosoma de una célula

Sitio interno de entrada al ribosoma (IRES): Secuencia de ADN que, una vez transcrita, codifica un elemento de ARN que permite el inicio de la traducción de una forma independiente de la protección

J (segmento): Segmento de unión. Además, región J. Uno de los segmentos génicos que se utiliza para ensamblar el receptor de linfocitos T. Cada individuo tiene un gran número de variaciones diferentes de estas regiones, lo que permite armar linfocitos T con una variedad muy grande de TCR diferentes.

Vector de entrada J-C: Vector del sistema de vectores bicomponente que lleva los segmentos J y C del TCR y que recibe secuencias de los vectores donantes V y odeCDR3 durante la reconstitución de un ORF del TCR de longitud completa.

Cadena principal del donante J: Se une a la cadena principal del donante. La cadena principal del vector en la que se inserta un fragmento del casete de recepción J para crear un vector del casete de recepción J.

Vector donante J: Vector del sistema de vectores bicomponente que lleva el segmento J del TCR, y dona este segmento al vector de entrada V-C durante la reconstitución de un ORF del TCR de longitud completa.

Fragmento del casete de recepción J: Fragmento del casete de recepción de unión. Un fragmento de clonación que lleva una parte C utilizada para construir un vector del casete de recepción J.

Vector del casete de recepción J: Unión al vector del casete de recepción. El vector, que lleva una parte C, en la que se inserta una parte de segmento J para crear un vector donante J.

Parte del segmento J: Parte del segmento de unión. Construcción de ADN que lleva una parte de un segmento génico J que se inserta en un vector del casete de recepción J para generar un vector donante J.

K es un código de nucleótido que indica ceto (K = G o T)

Secuencia de Kozak: Secuencia corta requerida para la iniciación eficiente de la traducción

M es un código de nucleótido que indica aMino (M = A o C)

HLA de clase I principal: una familia de APX que comprende los genes HLA-A, HLA-B y HLA-C Coincidente: Cuando dos componentes codifican elementos genéticos que dirigen y restringen la interacción entre los componentes complementados

Sitio de reconocimiento de meganucleasa: Secuencia de ADN reconocida por una endodesoxirribonucleasa, denominada comúnmente meganucleasa

Elemento genético m óvil: Secuencia de ADN que puede permitir la integración de ADN con la actividad de enzimas transposasa

N es un código de nucleótido que indica cualquier nucleótido (N = A, T, C o G)

Natural: una entidad de origen natural en la célula

Marcador de selección negativa: Marcador seleccionable que confiere selección negativa a un vector y/u organismo hospedador que tiene dicho vector portador del marcador

odeCDR3: dúplex de oligonucleótidos que codifica para regiones determinantes de la complementariedad. Construcción sintética que tiene la secuencia genética CDR3 con salientes terminales, que se utiliza junto con el sistema de vectores bicomponente para reconstituir un ORF del TCR de longitud completa.

Origen de replicación: una secuencia concreta de un vector, plásmido o genoma en la que se inicia la replicación. ORF: Marco de lectura abierto. Extensión de material genético que codifica un marco de traducción para la síntesis de una proteína (polipéptido) por el ribosoma

Saliente: Una secuencia monocatenaria en el extremo de una molécula de ácido nucleico bicatenaria. A menudo denominados extremos cohesivos.

PCR: Reacción en cadena de la polimerasa en la cual una molécula de ADN diana específica se amplifica exponencialmente

Péptido: Cadena corta de aminoácidos de 6 - 30 aminoácidos de longitud

Análisis fenotípico: Análisis de las características observables de una célula.

Plásmido: Construcción genética que puede replicarse independientemente de los cromosomas, de forma típica una cadena de ADN circular pequeña en el citoplasma de una bacteria o un protozoo.

Polimórfico: Presente en formas diferentes en individuos de la misma especie por la presencia de alelos diferentes del mismo gen.

Polipéptido: Proteína que consiste en untira de péptidos que forman una estructura tridimensional.

Marcador de selección positiva: Un marcador seleccionable que confiere selección positiva a un vector y/u organismo hospedador que tiene dicho vector portador del marcador.

Cebador: Secuencia de ADN corta que permite el reconocimiento específico de una secuencia de ADN diana, por ejemplo, durante una PCR.

Promotor: Elemento regulador de ADN para el inicio controlado de la expresión génica.

Recombinasa: Enzimas que median la recombinación genética.

Reconstitución: En el presente contexto, la reconstitución describe el funcionamiento de TORES y TORES2 para ensamblar un ORF del TCR. Una 'reacción de reconstitución' es la mezcla de reacción y la reacción de termociclado que implica esta operación.

Elemento indicador: Elemento genético que media una señal de notificación en el organismo o vector que lleva dicho elemento. Puede utilizarse como marcador de selección positiva o negativa.

Secuencia de escisión por enzimas de restricción: La secuencia genética escindida mediante una enzima de restricción, que puede ser intrínseca o intrínseca a la secuencia de reconocimiento de dicha enzima de restricción.

Secuencia de reconocim iento de enzimas de restricción: La secuencia genética que es reconocida y a la que se une una enzima de restricción.

Marcador seleccionable: Secuencia de ADN que confiere un rasgo adecuado para métodos de selección artificial. Sitio aceptor del corte: Secuencia de ADN en el extremo 3' del intrón AM, APX CM o reactivo de afinidad para la interacción con células con TCRsp en la superficie o reactivos basados en TCRsp.

Sitio donante del corte: Una secuencia de ADN en el extremo 5' del intrón.

Gen suicida: Un gen que mediará la muerte celular dentro del organismo hospedador que lleva ese gen. Puede utilizarse como marcador de selección positiva o negativa.

Sintética: una entidad que se genera artificialmente.

Células T: Linfocito T. Leucocito que expresa un receptor de linfocitos T en su superficie. Seleccionado por el sistema inmunitario para no reaccionar con el propio organismo, pero que tiene el potencial de reconocer infecciones y neoplasias malignas, así como de rechazar injertos procedentes de la mayoría de los miembros de la misma especie.

TCR: Receptor de linfocitos T. Molécula de afinidad expresada por un subgrupo de linfocitos denominados linfocitos T. En seres humanos, el TCR reconoce la carga presentada por APX CM o APX AM, que incluye fragmentos procedentes de infecciones víricas virales o bacterianas o células cancerosas. Por lo tanto, el reconocimiento del TCR forma parte integrante del sistema de inmunidad adaptativa. El TCR consiste en dos cadenas que están emparejadas en la superficie celular. El TCR expresado en la superficie de cada linfocito se ensambla aleatoriamente a partir de un gran conjunto de genes variados (los segmentos v, d, j y c) y por tanto cada individuo tiene un conjunto de linfocitos T que expresan un repertorio muy grande y diverso de diferentes TCR.

TRA: Locus que codifica para TCR alfa. Uno de los cuatro loci distintos que codifican genes que pueden formar una cadena del TCR recombinada VDJ. Las proteínas de la cadena alfa del TCR traducidas se emparejan de forma típica con las proteínas de la cadena beta del TCR traducidas para formar TCRsp alfa/beta.

TRB: Locus que codifica TCR beta. Uno de los cuatro loci distintos que codifican genes que pueden formar una cadena del TCR recombinada VDJ. Las proteínas de la cadena beta del TCR traducidas se emparejan de forma tipica con las proteínas de la cadena alfa del TCR para formar TCRsp alfa/beta.

TRD: Locus que codifica para TCR delta. Uno de los cuatro loci distintos que codifican genes que pueden formar una cadena del TCR recombinada VDJ. Las proteínas de la cadena delta del TCR traducidas típicamente se emparejan con las proteínas de la cadena gamma del TCR traducidas para formar TCRsp gamma/delta.

TRG: Locus que codifica TCR gamma. Uno de los cuatro loci distintos que codifican genes que pueden formar una cadena del TCR recombinada VDJ. Las proteínas de la cadena gamma del TCR traducidas se emparejan de forma típica con las proteínas de la cadena delta del TCR traducidas para formar TCRsp gamma/delta.

Enzima de restricción de Tipo IIS: enzimas de restricción que reconocen secuencias de ADN asimétricas y cortan fuera de su secuencia de reconocimiento.

V (segmento): Región variable. Además, región V. Uno de los segmentos génicos que se utiliza para ensamblar el receptor de linfocitos T. Cada individuo tiene un gran número de variaciones diferentes de estas regiones, lo que permite armar linfocitos T con una variedad muy grande de TCR diferentes.

Vector de entrada V-C: El vector del sistema de vectores bicomponente que lleva los segmentos V y C del TCR y que recibe secuencias de los vectores donantes J y odeCDR3 durante la reconstitución de un ORF del TCR de longitud completa.

Fragmento de clonación V: Fragmento de clonación variable. También denominado fragmento de clonación de segmento de gen V. Construcción que tiene una parte de un segmento génico V para construir un vector de entrada V-C.

Vector donante V: Vector del sistema de vectores bicomponente que lleva el segmento V del TCR y dona este segmento al vector de entrada J-C durante la reconstitución de un ORF del TCR de longitud completa.

Vector: Un vector es una construcción genética que contiene información genética. En el presente contexto, un vector describe habitualmente vectores de ADN plasmídico. Un vector puede representar cualquier construcción de este tipo que pueda propagarse y seleccionarse en un organismo hospedador.

W es un código de nucleótido que indica Débil (W = A o T).

Leyendas de las figuras

Figura 1. Sistema de vectores bicomponente para la reconstitución rápida del ORF del TCR de longitud completa.

A)

Se ilustran las características centrales del sistema de vectores bicomponente (Cuadro i), la entrada del dúplex de oligonucleótido necesario (Cuadro ii) y el vector ORF del TCR de longitud completa resultante (Cuadro iii). El primer componente representa un vector de entrada V-C, que incorpora un segmento génico V (variable) del TCR seleccionado y un segmento génico C (constante) del TCR. Este vector de entrada representa la cadena principal en la que se incluirá el ORF del TCR final de longitud completa. Por lo tanto, cualquier característica deseable de esta cadena principal del vector se adapta a la aplicación posterior prevista. Normalmente, estará representado por al menos un elemento genético en 5' y 3'. El segmento génico V y el segmento génico C necesarios para el ORF del TCR de longitud completa diana se seleccionan de una genoteca de vectores de entrada V-C para construir un ORF del TCR de cualquier combinación V/C deseada (Cuadro i). El segundo componente representa un vector donante J, que contiene un segmento génico (de unión) J seleccionado. Este vector donante actúa donando el segmento génico J y, por lo tanto, la cadena principal de este vector es un subproducto de la reacción. El segmento génico J deseado del o Rf del TCR diana se selecciona de una genoteca de vectores donantes J. Para completar la secuencia necesaria para el ORF del TCR de longitud completa, se sintetiza un dúplex de oligonucleótido corto que corresponde en gran medida a la región CDR3 del ORF del TCR maduro (Cuadro ii). Este dúplex de oligonucleótido se sintetiza con salientes monocatenarios compatibles con salientes únicos generados por digestión con enzimas de restricción de vectores entrada V-C y donantes J. Cuando se combinan en una reacción de un solo tubo junto con las enzimas de restricción y ligasa adecuadas, el ORF del TCR de longitud completa se reconstituye a partir de las secuencias proporcionadas por los vectores de entrada V-C y donantes J seleccionados de una genoteca preexistente, y el dúplex de oligonucleótido sintetizado (Cuadro iii).

B)

Se ilustra la función de la característica general de la genoteca del sistema de reconstitución del ORF del TCR. Se selecciona un único vector de entrada V-C de una genoteca de vectores de entrada V-C con combinaciones V-C variables (Cuadro i). Esta selección se basa en las secuencias de combinación V-C necesarias para una cadena del TCR seleccionada. Un único vector de entrada J se selecciona de una genoteca de vectores donantes J con segmentos génicos J codificados variables (Cuadro ii). Esta selección se basa en las secuencias de combinación J necesarias para la misma cadena del TCR seleccionada que la del vector de entrada V-C. Por último, se selecciona un dúplex oligomérico que codifica CDR3 (odeCDR3) para completar el ORF de longitud completa de la cadena diana del TCR (Cuadro iii). Estos tres componentes (Cuadro i, ii y iii) se combinan en una sola reacción junto con las enzimas de restricción y ligasa adecuadas. El ciclo de reacción produce un ORF del TCR de longitud completa reconstituido en una sola etapa en el contexto de la cadena principal del vector de entrada V-C (Cuadro iv).

Figura 2. Diagrama esquemático del plásmido con las características genéticas de un vector de entrada V-C genérico.

Se representa un esquema de plásmido circularizado de un vector de entrada V-C con los elementos genéticos mínimamente necesarios representados como cuadros marcados. Kozak se refiere a la secuencia consenso que desempeña un papel en el inicio eficiente de la traducción. Segmento V se refiere a una secuencia seleccionada que codifica una parte del ORF de la línea germinal variable del TCR, u ORF mutante/sintético. Tipo IIS ^ se refiere a un sitio de unión de enzimas de restricción de Tipo IIS orientado de forma que la enzima corta en la dirección 5'. Tipo IIS se refiere a un sitio de unión de enzimas de restricción de Tipo IIS orientado de forma que la enzima corta en la dirección 3. Selección - se refiere a un elemento de selección negativo diseñado para ser perjudicial para el plásmido que contiene la secuencia durante la reacción de reconstrucción del TCR de longitud completa, o en etapas de selección posteriores. Segmento C se refiere a una secuencia seleccionada que codifica una parte del ORF de la línea germinal constante del TCR, o ORF mutante/sintético. Selección n.° 1 se refiere a un primer marcador de selección positiva del sistema bicomponente utilizado para transmitir una ventaja selectiva al organismo que aloja el vector, y que es diferente del marcador de selección positiva del segundo componente vectorial (véase la Figura 3). Ori se refiere a un origen de replicación utilizado para la propagación del plásmido dentro de un hospedador compatible. Elemento genético 5' se refiere a cualquier elemento genético deseado que proporciona atributos requeridos para la aplicación posterior del TCR de longitud completa reconstruido, y debe situarse en 5' del TCR de longitud completa reconstruido, por ejemplo, un elemento cis actuante. Elemento genético 3' se refiere a cualquier elemento genético deseado que proporciona atributos requeridos para la aplicación posterior del TCR de longitud completa reconstruido, y debe situarse en 3' del ORF del TCR de longitud completa reconstruido, por ejemplo, un elemento terminador de la transcripción.

Figura 3. Diagrama esquemático del plásmido con las características genéticas de un vector donante J genérico.

Se representa un esquema de plásmido circularizado de un vector donante J con las características genéticas mínimamente necesarias representadas como cuadros marcados. La parte del segmento J se refiere a una secuencia de ADN que codifica una parte de un ORF de la línea germinal de unión a TCR, o segmento génico J mutante/sintético. La Parte C se refiere a una pequeña parte 5' del segmento génico constante del TCR. Tipo IIS ^ se refiere a un sitio de unión de enzimas de restricción de Tipo IIS orientado de forma que la enzima escinde en la dirección 5'. Tipo IIS^ se refiere a un sitio de unión de enzimas de restricción de Tipo IIS orientado de forma que la enzima escinde en la dirección 3'. Selección n.° 2 se refiere al primer marcador de selección positiva del sistema bicomponente utilizado para conferir una ventaja selectiva al organismo que aloja el vector, y que es diferente del marcador de selección positiva del primer componente vectorial (véase la Figura 2). Ori se refiere a un origen de replicación utilizado para la propagación del plásmido dentro de un hospedador compatible.

Figura 4. Descripción genérica de la entrada genética, subproductos, intermedios y producto del sistema de vectores bicomponente para reconstruir un ORF del TCR de longitud completa.

Se ilustran los dos componentes del sistema vectorial (a y b), el dúplex de oligonucleótido (c); cuando estos tres componentes se combinan en una sola reacción con la enzima de restricción de Tipo IIS y ligasa, se generan dos subproductos de reacción (d y e), dos productos intermedios de reacción (f y g) y un producto de reacción (h). Los vectores de entrada y el producto del sistema bicomponente se representan como esquemas de plásmidos circularizados donde los elementos genéticos están representados como cuadros marcados; los vectores plasmídicos abiertos que representan el subproducto o producto intermedio son esquemas de plásmidos no circularizados donde los elementos genéticos están representados como cuadros marcados; y el ADN lineal se representa como una serie de cuadros marcados que describen elementos genéticos.

a) Un plásmido de entrada V-C genérico como el ilustrado en la Figura 2.

b) Un plásmido donante J genérico como el ilustrado en la Figura 3.

c) Un dúplex de oligonucleótido de ADN que contiene la secuencia de CDR3 flanqueada por dos salientes de ADN monocatenario, saliente £ 1-5' y el saliente £ 1-3'. El saliente £ 1-5' es compatible con el saliente £ 1-3' en el intermedio del vector de entrada V-C abierto (g). El saliente £2-3' es compatible con el saliente £ 2-5' en el intermedio del vector de entrada V-C abierto (f).

d) La digestión del vector de entrada V-C (a) con la enzima de restricción de Tipo IIS da como resultado un subproducto de reacción del vector de entrada V-C de ADN lineal que contiene el elemento de selección - y los elementos de Tipo IIS^ y de Tipo IIS^ .

e) La digestión del vector donante J (b) con la enzima de restricción de Tipo IIS da como resultado un subproducto plasmídico no circularizado que contiene todos los elementos genéticos del plásmido precursor excepto los que lleva el intermedio del fragmento donante J escindido (f).

f) La digestión del vector donante J (b) con la enzima de restricción de Tipo IIS da como resultado un fragmento de ADN lineal que contiene la parte del segmento J y la parte C flanqueadas por salientes de ADN monocatenario, salientes £ 2-5' y salientes £ 3-3'. El saliente £2-5' es compatible con el saliente £2-3' en el dúplex de oligonucleótido de ADN de CDR3 (c). El saliente £3-5' es compatible con el saliente £3-5' en el intermedio del vector de entrada V-C abierto (g).

g) La digestión del vector de entrada V-C (a) con la enzima de restricción de Tipo IIS da como resultado un intermedio de plásmido no circularizado que contiene todos los elementos genéticos del plásmido precursor excepto los que tiene el subproducto de la reacción del vector de entrada V-C del ADN lineal escindido (d). La digestión ha creado además dos salientes de ADN monocatenario, el saliente £ 1-3' y el saliente £ 3-5'. El saliente £ 1 -3' es compatible con el saliente £ 1 -5' en el dúplex de oligonucleótidos de ADN de CDR3 (c). El saliente £ 3-5' es compatible con el saliente £ 3-3' en el intermedio del vector de entrada V-C abierto (f).

h) La ligación de los tres salientes compatibles de ADN monocatenario da como resultado el vector ORF de longitud completa del TCR como plásmido circularizado. Este plásmido contiene todos los elementos genéticos del vector de entrada V-C precursor (a) con excepción del subproducto de reacción del vector de entrada V-C escindido (d). Además, el vector ORF del TCR de longitud completa incorpora la secuencia de CDR3 del dúplex de oligonucleótidos de ADN de CDR3 (c) y la parte del segmento J y la parte C del intermedio de reacción del fragmento donante J. Las flechas indican los puntos aproximados de ligación entre los salientes de ADN monocatenario compatibles £ 1, £ 2 y £ 3. El punto de ligación £ 1 comprende los elementos £ 1-3' y £ 1-5' donados por el intermedio de reacción del vector de entrada V-C (g) y el dúplex de oligonucleótidos ADN (c) de CDR3, respectivamente. El punto de ligación £2 comprende los elementos £2-3' y £2-5' donados por el dúplex de oligonucleótidos de ADN CDR3 (c) y el intermedio de reacción del fragmento donante J (f), respectivamente. El punto de ligación £3 comprende los elementos £3-3' y £3-5' donados por el intermedio de reacción del fragmento donante J (f) y el intermedio de reacción del vector de entrada V-C (g), respectivamente.

Figura 5 Disposición de los fragmentos de clonación V para la construcción de vectores de entrada V-C

Se muestra una representación de los fragmentos de clonación V utilizados para ensamblar vectores de entrada V-C de un TORES para cadenas TRA y TRB del TCR humano como se describe en los Ejemplos 1 a 4.

El fragmento de clonación V está flanqueado por secuencias únicas de unión de iniciadores en los extremos 5' y 3' para facilitar la amplificación mediada por PCR de los fragmentos de clonación. Los sitios Bbsl representan sitios de unión de enzimas de restricción de Tipo IIS específicos utilizados en el ensamblado del vector de entrada V-C, donde ^ indica que el sitio de reconocimiento está orientado para cortar en la dirección 3' del sitio y ^ indica que el sitio está orientado para cortar en la dirección 5'. El sitio Bbsl -4 corta en 5' de la secuencia de Kozak codificada para crear el Saliente*1. El sitio Bsal ^ corta para crear el saliente Notl en 5' que sobresale dentro del fragmento Notl en 5'. El Saliente*1 y el saliente Notl en 5' se ligan finalmente con el Saliente*1' de la cadena principal del vector de entrada V-C digerido y el saliente Notl en 3' del fragmento de clonación C digerido, respectivamente, durante el ensamblado del vector de entrada V-C. El fragmento NotI 5' representa un fragmento 5' de 6 nucleótidos de la secuencia de reconocimiento Notl, en donde Notl actúa como marcador de selección negativa para eliminar el vector de entrada V-C precursor durante el funcionamiento de TORES. El sitio de reconocimiento Notl completo se reconstituye con el fragmento Notl 3' proporcionado por el fragmento de clonación C. El segmento V representa el segmento génico V del TCR que debe codificar el vector de entrada V-C final y codifica desde el codón de iniciación ATG del segmento V específico hasta el último codón Cys del segmento V que define el límite de la región CDR3. El sitio ^ Bsal es la secuencia de reconocimiento de enzimas de restricción de Tipo IIS utilizada durante el funcionamiento del sistema TORES para reconstituir un ORF del TCR de longitud completa. La acción de la enzima Bsal, en donde el sitio está orientado para cortar en la dirección 5', da como resultado la creación de un saliente £ 1 en el extremo 3' del segmento V que abarca los tres nucleótidos del último codón Cys de cada segmento V y el tercer nucleótido del codón que precede a ese codón Cys. Este saliente se estandariza entre todos los segmentos V en un conjunto de TORES dado. Por último, el saliente £ 1 en 3' del segmento V se liga con el saliente £ 1 en el odeCDR3 en 5' durante el funcionamiento del sistema TORES para reconstituir un ORF del TCR de longitud completa. Todos los sp denotan la adición de uno o más nucleótidos para crear la separación correcta entre las secuencias de reconocimiento de Tipo IIS y las secuencias salientes diana, o para separar el sitio de reconocimiento y corte de Notl para una acción eficiente.

Figura 6 Disposición de los fragmentos de clonación C para la construcción de vectores de entrada V-C

Se muestra una representación de los fragmentos de clonación C utilizados para ensamblar vectores de entrada V-C de un TORES para cadenas TRA y TRB del TCR humano como se describe en los Ejemplos 1 a 4.

El fragmento de clonación C está flanqueado por secuencias únicas de unión de iniciadores en los extremos 5' y 3' para facilitar la amplificación mediada por PCR de los fragmentos de clonación. Los sitios Bbsl representan sitios de unión de enzimas de restricción de Tipo IIS específicos utilizados en el ensamblado del vector de entrada V-C, donde ^ indica que el sitio de reconocimiento está orientado para cortar en la dirección 3' del sitio y ^ indica que el sitio está orientado para cortar en la dirección 5'. El sitio Bbsl ^ corta para crear el saliente Notl en 3' que sobresale dentro del fragmento Notl en 3'. El sitio Bsal ^ corta 3' del codón de terminación del segmento C para crear un saliente*2 en el extremo 3' del segmento C. El Saliente*2 y el saliente Notl en 3' se ligan en últim ainstancia con el Saliente*2' de la cadena principal del vector de entrada V-C digerido y el saliente Notl en 5' del fragmento de clonación V digerido, respectivamente, durante el ensamblado del vector de entrada V-C. El fragmento NotI 3' representa un fragmento en 3' de 6 nucleótidos de la secuencia de reconocimiento Notl, en donde Notl actúa como marcador de selección negativa para eliminar el vector de entrada V-C precursor durante la actuación de TORES. El sitio de reconocimiento Notl completo se reconstituye con el fragmento Notl en 5' proporcionado por el fragmento de clonación C.

El segmento C representa el segmento génico C del TCR que debe codificar el vector de entrada V-C final y codifica desde el resto de citosina 5' del primer codón Glu del segmento génico C hasta el codón de terminación. El sitio ^ Bsal es la secuencia de reconocimiento de enzimas de restricción de Tipo IIS utilizada durante el funcionamiento del sistema TORES para reconstituir un ORF del TCR de longitud completa. La acción de la enzima Bsal, en donde el sitio está orientado para cortar en la dirección 3', da como resultado la creación de un saliente £ 3 en el extremo 5' del segmento C. Este saliente se estandariza entre todos los segmentos C en un conjunto de TORES dado. Por último, el saliente £ 3 en el 5' del segmento C se liga con el saliente £ 3 de la parte C en el 3' del vector donante J durante la actuación del sistema TORES para reconstituir un ORF del TCR de longitud completa. Todos los sp denotan la adición de uno o más nucleótidos para crear la separación correcta entre las secuencias de reconocimiento de Tipo IIS y las secuencias salientes diana, o para separar el sitio de reconocimiento y corte de Notl para una acción eficiente.

Figura 7 Disposición de la cadena principal del vector de entrada V-C para la construcción de vectores de entrada V-C

Se muestra una representación de la cadena principal del vector de entrada V-C utilizada para ensamblar vectores de entrada V-C de un TORES para cadenas TRA y TRB del TCR humano como se describe en los Ejemplos 1 a 4.

El ADN plasmídico circular contiene un origen de replicación (Ori) y un marcador de selección positiva n.° 1. Este marcador de selección se utiliza para la selección de hospedadores transformados cuando se aíslan clones de la cadena principal del vector de entrada V-C y vectores de entrada V-C durante el ensamblado, y también para la selección de vectores que contienen un ORF del TCR de longitud completa durante la actuación del TORES. Los elementos genéticos 5' y 3' codifican los elementos diana que flanquean el ORF del TCR final después de la generación del ORF de TCR final de longitud completa después de su generación durante la actuación del TORES. Un elemento génico 5' podría representar un elemento promotor de mamífero para dirigir la expresión de transcritos de TCR, y un elemento genético 3' podría representar una secuencia terminadora de la transcripción. El sitio ACC65I representa una secuencia de reconocimiento de enzimas de restricción, en donde la acción de la enzima Acc65I da como resultado la creación de un Saliente*1'. Este Saliente*1' se liga al Saliente*1 del fragmento de clonación V digerido durante el ensamblado del vector de entrada V-C. El sitio Xbal representa una secuencia de reconocimiento de enzimas de restricción, en donde la acción de la enzima Xbal da como resultado la creación de un Saliente*2'. Este Saliente*2' se liga con el Saliente*2 en el fragmento de clonación C digerido durante el ensamblado del vector de entrada V-C. Sp denota la adición de nucleótidos para separar los sitios de reconocimiento Acc65I y Xbal para una acción eficiente de ambas enzimas.

Figura 8 Disposición del fragmento del casete de recepción J

Se muestra una representación de un fragmento del casete de recepción J utilizado en el ensamblado de vectores donantes J de un TORES para cadenas de TRA y TRB del TCR humano como se describe en los Ejemplos 2 y 3. Un fragmento del casete de recepción J se inserta en una cadena principal donante J para generar un vector del casete de recepción J.

Se genera un fragmento del casete de recepción J anillando dos oligonucleótidos complementarios para crear una construcción de ADN bicatenario lineal con salientes monocatenarios de 4 nucleótidos en los extremos 5' y 3' que se utilizan para la inserción del fragmento en la cadena principal del vector donante J. El Saliente*3 del extremo 5' del fragmento del casete de recepción J se une al Saliente*3' de la cadena principal del vector donante J digerido, mientras que el Saliente*4 del extremo 3' se une al Saliente*4' de la cadena principal del vector donante J digerido.

Los sitios Bsal representan los sitios de reconocimiento de restricción de Tipo IIS utilizados durante la actuación del TORES para ensamblar un ORF del TCR de longitud completa. El sitio Bsal ^ está orientado para cortar en la dirección 5' y actúa sobre la secuencia de la parte C para generar un saliente £ 3 en la parte C 3'. El sitio Bsal ^ actúa en última instancia en la parte del segmento J del vector donante J para crear el saliente £ 2 en el extremo 5' de la parte del segmento J. El elemento Bsal ^ también contiene el Saliente*5, que se genera por acción de Bbsl ^ en el sitio Bbsl durante el ensamblado del vector donante J.

Los sitios Bbsl representan los sitios de reconocimiento de restricción de Tipo IIS utilizados para ensamblar el vector donante J. El sitio Bbsl ^ corta el elemento Bsal -> para generar un Saliente*5, mientras que el sitio Bbsl ^ corta el extremo 5' de la parte C para generar un Saliente*6. El Saliente*5 y el Saliente*6 se ligan en última instancia al Saliente*5' y al Saliente*6' de la parte del segmento J, respectivamente.

La parte C representa una pequeña parte del segmento génico C diana para permitir la generación estandarizada de salientes no palindrómicos durante la actuación del TORES. Esta parte C se inserta finalmente en el extremo 3' de la parte del segmento J, y forma parte de la secuencia que se une al segmento C contenida en el vector de entrada V-C digerido durante el funcionamiento del TORES para generar un ORF del TCR de longitud completa.

El sitio Notl representa un marcador de selección negativa utilizado para eliminar el vector del casete de recepción J precursor durante la generación del vector donante J.

Todos los sp denotan la adición de uno o más nucleótidos para crear la separación correcta entre las secuencias de reconocimiento de Tipo IIS y las secuencias salientes diana, o para separar el sitio de reconocimiento y corte de Notl para una acción eficiente.

Figura 9 Disposición de la cadena principal del donante J

Se muestra una representación de la cadena principal del donante J utilizado en el ensamblado de vectores donantes J de un TORES para cadenas TRA y TRB del TCR humano como se describe en los Ejemplos 2 y 3. Se inserta un fragmento del casete de recepción J en una cadena principal donante J para generar un vector del casete de recepción J.

El ADN plasmídico circular contiene un origen de replicación (Ori) y un marcador de selección positiva n.° 2. Este marcador de selección se utiliza para la selección de huéspedes transformados cuando se aíslan clones de cadena principal del vector donante J y vectores donantes J durante el ensamblado. Es importante destacar que este marcador de selección positiva es distinto del marcador de selección positiva n.° 1 dentro de los vectores de entrada V-C, de forma que los vectores donantes J precursores se eliminan con selección positiva n.° 1 durante el funcionamiento del TORES para generar un ORF del TCR de longitud completa en el contexto de la cadena principal del vector de entrada V-C.

El sitio EcoRI representa una secuencia de reconocimiento de enzimas de restricción, en donde la acción de la enzima EcoRI da como resultado la creación de un Saliente*3'. Este Saliente*3' se une al Saliente*3 del fragmento del casete de recepción J hibridado durante el ensamblado del vector del casete de recepción J. El sitio Xbol representa una secuencia de reconocimiento de enzimas de restricción, en donde la acción de la enzima Xbol da como resultado la creación de un Saliente*4'. Este Saliente*4' se une al Saliente*4 del fragmento del casete de recepción J hibridado durante el ensamblado del vector del casete de recepción J. Sp denota la adición de nucleótidos para separar los sitios de reconocimiento Acc65I y Xbal para una acción eficiente de ambas enzimas.

Figura 10 Disposición del vector del casete de recepción J

Se muestra una representación de la cadena principal de un donante J utilizado en el ensamblado de vectores donantes J de un TORES para cadenas TRA y TRB del TCR humano como se describe en los Ejemplos 2 y 3. Se crea un vector del casete de recepción J mediante la inserción de un fragmento del casete de recepción J en una cadena principal donante J.

El ADN plasmídico circular contiene un origen de replicación (Ori) y un marcador de selección positiva n.° 2. Este marcador de selección se utiliza para la selección de huéspedes transformados cuando se aíslan clones de cadena principal del vector donante J y vectores donantes J durante el ensamblado. Es importante señalar que este marcador de selección positiva es distinto del marcador de selección positiva n.° 1 dentro de los vectores de entrada V-C, de forma que los vectores donantes J precursores se eliminan con selección positiva en n.° 1 durante la actuación del TORES para generar un ORF del TCR de longitud completa en el contexto de la cadena principal del vector de entrada V-C.

Los sitios Bsal representan los sitios de reconocimiento de restricción de Tipo IIS utilizados durante el funcionamiento del TORES para ensamblar un ORF del TCR de longitud completa. El sitio Bsal ^ está orientado para cortar en la dirección 5' y actúa sobre la secuencia de la parte C para generar un saliente £ 3 en la parte C 3'. El sitio Bsal ^ actúa en último término en la parte del segmento J del vector donante J para crear el saliente £ 2 en el extremo 5' de la parte del segmento J. El elemento Bsal ^ también contiene el Saliente*5, que se genera por acción de Bbsl ^ en el sitio Bbsl durante el ensamblado del vector donante J.

Los sitios Bbsl representan los sitios de reconocimiento de restricción de Tipo IIS utilizados para ensamblar el vector donante J. El sitio Bbsl ^ corta el elemento Bsal ^ para generar un Saliente*5, mientras que el sitio Bbsl ^ corta el extremo 5' de la parte C para generar un Saliente*6. El Saliente*5 y el Saliente*6 se unen en último término al Saliente*5' y al Saliente*6' de la parte del segmento J, respectivamente.

La parte C representa una pequeña parte del segmento génico C diana para permitir la generación estandarizada de salientes no palindrómicos durante la actuación del TORES. Esta parte C se inserta finalmente en el extremo 3' de la parte del segmento J, y forma parte de la secuencia que se liga al segmento C contenida en el vector de entrada V-C digerido durante la actuación del TORES para generar un ORF del TCR de longitud completa.

Figura 11 Disposición de una parte de segmento J

Se muestra una representación de una parte del segmento J utilizada en el ensamblado de segmento J de un TORES para cadenas TRA y TRB del TCR humano como se describe en los Ejemplos 2 y 3. Una parte del segmento J se inserta en un vector del casete de recepción J para crear un vector donante J.

La hibridación de oligonucleótidos monocatenarios complementarios para formar una construcción de ADN bicatenario lineal con salientes monocatenarios en cualquier extremo genera una parte del segmento J. El Saliente*5' del extremo 5' se anilla con el Saliente*5 generado dentro del vector del casete de recepción J digerido con Bbsl. El Saliente*6' del extremo 3' se anilla con el Saliente*6 generado dentro del vector del casete de recepción J digerido con Bbsl.

La parte del segmento J representa la secuencia diana del segmento del gen J. Dependiendo del estilo del vector donante J en construcción (es decir, corto o largo), el límite 5' de la parte del segmento J se define de forma distinta. Para los vectores donantes J cortos, el límite 5' de la parte del segmento J se define como los motivos Phe-Ala/Gly o Trp-Gly que se utilizan para definir el límite canónico entre las partes J y CDR3 de un ORF del TCR de longitud completa. Para vectores donantes J largos, el límite 5' de la parte del segmento J se extiende diez a doce nucleótidos 5' del motivo Phe-Ala/Gly o Trp-Gly. Esto extiende la parte del ORF de TCR global codificado por el vector donante J, y acorta por el contrario la longitud del odeCDR3 necesaria para construir un ORF del TCR de longitud completa durante la actuación del TORES. En el extremo 3' de la parte del segmento J hay codificado un único resto de adenina (A) que representa el primer nucleótido del fragmento C. Esta adenina se excluye del vector del casete de recepción J.

Figura 12 Validación de especificidad del par TRA/TRB modelo reconstituido con TCR

Se reconstituyó un par de cadenas de TRA/TRB del TCR modelo con especificidad para un antígeno derivado de pp65 del CMVH restringido por HLA-A2*01 con el sistema TORES como se describe en el ejemplo 7. Los dos productos plasmídicos de TRA y TRB se transfectaron transitoriamente en una línea celular humana que expresa constitutivamente los componentes de CD3, pero que carece de la expresión endógena de las cadenas de TRA y TRB del TCR. 48 horas después de la transfección, las células se trataron con anticuerpos contra el tetrámero CD3, TCRalfa/beta y HLA-A2*01-NLVPMVATV específico y se analizaron por citometría de flujo. El par TCR modelo se presentó en la superficie celular como se indica por la tinción positiva con anticuerpos de CD3 y TCRalfa/beta (izquierda, panel superior). El par TCR modelo también mostró tinción positiva para el reactivo del tetrámero HLA-A2*01-NLVPMVATV (izquierda, panel inferior), lo que indica la especificidad de unión esperada. Se transfectó también en paralelo un par irrelevante de construcciones de plásmidos TRA y TRB (paneles centrales), así como un vector vacío (paneles más a la derecha). El TCR irrelevante se presentó en la superficie celular como se indica por la tinción positiva para anticuerpos de CD3 y TCRalfa/beta (centro, panel superior), pero no mostró unión para el reactivo del tetrámero HLA-A2*01-NLVPMVATV (centro, panel inferior). Las células transfectadas con el vector vacío no mostraron tinción para anticuerpos de CD3 o TCRalfa/beta ni para el reactivo del tetrámero HLA-A2*01-NLVPMVATV.

Figura 13 Flujo de trabajo para la identificación y reconstitución de un conjunto de pares de cadenas TRA/TRB de TCR de sangre periférica humana

Para demostrar el uso del sistema TORES en la reconstitución de pares de cadenas TRA/TRB nativas de TCR capturadas a partir de una muestra humana, se generó un conjunto de TCR específicos para el antígeno pp65 de CMVH restringido por HLA-B*07:02, TPRVTGGGAM, a través de la captura de información de secuencia procedente de la clasificación de células individuales de células tetrámero positivas procedentes de una fracción de PBMC humana. Este proceso se describe en el Ejemplo 8.

i) Una fracción de PBMC de un donante con el alelo de HLA-B*07:02 se tiñe con un reactivo de tetrámero HLA-B*07:02-TPRV. Los linfocitos T CD8+ únicos que muestran tinción positiva para el tetrámero se depositan en tubos de PCR individuales mediante FACS.

ii) Los tubos que contienen una sola célula se sometieron a una reacción de transcripción inversa con conjuntos de cebadores anclados en todos los segmentos génicos variables y constantes expresados de ambas cadenas TRA y TRB.

iii) Se realizaron reacciones de la PCR anidadas sobre el producto de transcripción inversa con conjuntos de cebadores internos, aún anclados en todos los segmentos génicos V y C expresados, independientemente de las cadenas TRA y TRB.

iv) El producto de PCR anidada se somete a secuenciación de Sanger

v) Las secuencias de productos de la PCR se alinearon respecto a una genoteca de segmentos génicos de TCR de la línea germinal humana para determinar el uso de segmentos génicos V y J (y C) para cada cadena de TCR amplificada. Se determina la secuencia CDR3 del codón Cys 5' hasta los motivos Phe-Ala/Gly o Trp-Gly 3'.

vi) Se selecciona un vector de entrada V-C de la genoteca de TORES correspondiente al uso determinado de los segmentos génicos V y C de cada cadena TRA y TRB a reconstituir.

vii) Un vector donante J se selecciona de la genoteca de TORES correspondiente al uso determinado de los segmentos génicos J de cada cadena TRA y TRB a reconstituir.

viii) Se sintetiza un odeCDR3 correspondiente a la región CDR3 determinada a partir de cada cadena TRA y TRB a reconstituir.

ix) Se ensambla un ciclo de reacción de enzima de restricción (RE)independiente /ligasa para cada TRA y TRB del TCR a reconstituir, que contiene el vector de entrada V-C seleccionado, el vector donante J y el odeCDR3 sintetizado.

x) El producto de reacción de ciclo de RE/ligasa se transforma en bacterias y se pone bajo selección de antibióticos para el primer marcador de selección positiva (es decir, cadena principal del vector de entrada V-C).

xi) Los clones se propagan y confirman mediante secuenciación de Sanger del ORF de TCR de longitud completa final.

Figura 14 Validación de especificidad para un conjunto de pares de cadenas TRA/TRB de TCR capturado de sangre periférica humana y reconstituido con TORES

Se capturó un conjunto de seis pares de cadenas TRA/TRB de TCR a partir de sangre periférica humana y se reconstituyó a través del flujo de trabajo detallado en la Figura 13 y descrito en el Ejemplo 8. Los seis pares del TCR tuvieron la especificidad esperada para el reactivo del tetrámero B*07:02-TPRV utilizado para aislar los linfocitos T CD8+ individuales. Cada uno de los seis pares capturados, un par de cadenas de TCR irrelevante, y un vector vacío del control se transfectaron en células humanas que expresaban componentes de CD3, pero que carecían de la expresión endógena para las cadenas TRA y TRB del TCR. 48 horas después de la transfección, se utilizó un análisis por citometría de flujo para teñir las células con anticuerpos contra CD3, las cadenas alfa y beta del TCR y se confirmó la especificidad del TCR reconstituido y expresado con el reactivo del tetrámero HLA-B*07:02-TPRV específico. Los datos se presentan como gráficos de contorno. Cada panel muestra la señal de CD3 en el eje X y la del tetrámero HLA-B*07:02-TPRV en el eje y. La inserción en la parte inferior derecha de cada panel es la relación de señal del tetrámero HLA-B*07:02-TPRV en las células positivas para CD3 respecto a las células negativas para CD3 en unidades arbitrarias de grado de tinción del tetrámero. Los seis pares de cadenas de TCR presentados muestran cierto grado de tinción con el tetrámero específico en comparación con el control de pares de TCR irrelevante.

Figura 15 Funcionamiento del TORES para generar cadenas del TCR diversificadas en CDR3

Se muestra una representación esquemática del TORES cuando se utiliza para generar cadenas del TCR de longitud completa con inserciones de CDR3 diversificadas. Se define un TCR precursor utilizando V-J-C, y se define la secuencia de la región CDR3. Se introdujeron en el tubo de reacción el vector de entrada V-C único correspondiente (cuadro i) y el único vector donante J (cuadro ii). Se sintetizó un conjunto de odeCDR3 con degeneración de nucleótidos posicional y/o mutagénesis puntual definida que cambia la secuencia de aminoácidos codificada (Cuadro iii). Dicho grupo de CDR3 podría incluir secuencias de CDR3 completamente aleatorizadas dentro de los límites del marco de odeCDR3 definido, para crear unos ORF del TCR de longitud completa 'sintéticos' de CDR utilizando V-J-C de línea germinal. Estos tres componentes (Cuadro i, ii y iii) se combinan en una sola reacción junto con las enzimas de restricción y ligasa adecuadas. El ciclo de reacción produce numerosos ORF del TCR de longitud completa reconstituidos variantes, proporcional al número de odeCDR3 variantes incluidas, en una sola etapa en el contexto de la cadena principal del vector de entrada V-C (Cuadro iv).

Figura 16 Una sola ronda de diversificación de la cadena del TCR que utiliza degeneración limitada de CDR3 genera un conjunto de TCR con un amplio espectro de afinidades diana

La cadena TRA de un par de cadenas TRA/TRB del TCR modelo con especificidad para un antígeno pp65 derivado del CMVH, como se ha descrito en el Ejemplo 7, se sometió a un ciclo de diversificación de CDR3 según el esquema presentado en la Figura 15 y como se ha descrito en el Ejemplo 9. La odeCDR3 de la cadena TRA se sintetizó con degeneración de nucleótidos por 4 veces en 3 posiciones separadas, alterando el uso de codones en esas tres posiciones. El producto de reacción resultante contenía 64 variantes de cadena de longitud completa, incluida la secuencia parental. Se clonó cada una de las 64 cadenas TRA y se confirmó la secuencia.

A) Cada uno de los 64 plásmidos de la cadena TRA se transfectó transitoriamente en una línea celular humana que expresa constitutivamente los componentes de CD3, pero que carece de la expresión endógena de las cadenas TRA y TRB del TCR. 48 horas después de la transfección, las células se tiñeron con anticuerpos contra CD3 y contra el reactivo del tetrámero HLA-A2*01-NLVPMVATV específico y se analizaron por citometría de flujo. La relación entre la intensidad de fluorescencia media (IFM) de la señal del tetrámero NLVPMVATV HLA-A2*01-NLVPMVATV para la población CD3+ respecto de la población CD3- se representó gráficamente como indicación de la fuerza de unión de cada variante del par de cadenas del TCR. La flecha indica el punto de datos correspondiente al TRA parental. Los óvalos indican variantes de elevada unión y sin unión en cada extremo del espectro.

B) Cada variante de cadena de TRA se presenta en una tabla con la relación IFM de la señal del tetrámero HLA-A2*01-NLVPMVATV para la población CD3+ respecto de la población CD3-, y el aminoácido presente en cada una de las tres posiciones diversificadas (Pos1, 2 y 3), en código de una letra. La flecha indica el punto de datos correspondiente al TRA parental. Los paréntesis indican variantes de elevada unión y sin unión en cada extremo del espectro.

Figura 17 Actuación del TORES para generar cadenas del TCR diversificadas en segmentos V

Se muestra una representación esquemática del TORES cuando se utiliza para generar cadenas del TCR de longitud completa con usos del segmento V diversificados. Se define un TCR precursor utilizando V-J-C, y se define la secuencia de la región CDR3. El único vector donante J correspondiente (cuadro ii) se introdujo en el tubo de reacción, al igual que el único odeCDR3 sintetizado para corresponder con la secuencia de la región CDR3 parental (cuadro iii). Se añade también al tubo de reacción una selección de vectores de entrada V-C, que corresponde a los segmentos V y C deseados en el producto ORF del TCR de longitud completa diversificado del segmento V del producto (Cuadro i). Estos tres componentes (Cuadro i, ii y iii) se combinan en una sola reacción junto con las enzimas de restricción y ligasa adecuadas. El ciclo de reacción produce numerosos ORF del TCR de longitud completa reconstituidos variantes, proporcional al número de vectores de entrada V-C variantes incluidos, en una sola etapa en el contexto de la cadena principal del vector de entrada V-C (Cuadro iv).

Figura 18 Funcionamiento del TORES para generar cadenas del TCR diversificadas en el segmento J

Se muestra una representación esquemática del TORES cuando se utiliza para generar cadenas del TCR de longitud completa con uso diversificado del segmento J. Se define un TCR precursor utilizando V-J-C, y se define la secuencia de la región CDR3. El único vector de entrada V-C correspondiente (cuadro i) se introdujo en el tubo de reacción, al igual que el único odeCDR3 sintetizado para que corresponda a la secuencia de la región CDR3 parental (cuadro iii). También se añade al tubo de reacción una selección de donantes J, que corresponde a los segmentos J deseados en el producto ORF del TCR de longitud completa diversificado del segmento J del producto (Cuadro ii). Estos tres componentes (Cuadro i, ii y iii) se combinan en una sola reacción junto con las enzimas de restricción y ligasa adecuadas. El ciclo de reacción produce una serie de ORF de TCR de longitud completa reconstituidos variantes, proporcional al número de vectores de entrada donantes J incluidos, en una sola etapa en el contexto de la cadena principal del vector de entrada V-C (Cuadro iv).

Figura 19 Funcionamiento del TORES para generar cadenas del TCR diversificadas en segmentos V/J

Se muestra una representación esquemática del TORES cuando se utiliza para generar cadenas del TCR de longitud completa con uso diversificado de segmentos V y J. Se define un TCR precursor utilizando V-J-C, y se define la secuencia de la región CDR3. El odeCDR3 único correspondiente se sintetizó para que corresponda a la secuencia de la región CDR3 parental (Cuadro iii). Se añadió al tuno de reacción una selección de vectores de entrada V-C y vectores donantes J, que corresponde a la combinación de los segmentos V(C) y J deseados en el producto ORF del TCR de longitud completa diversificado para el segmento V/J (Cuadro ii). Estos tres componentes (Cuadro i, ii y iii) se combinan en una sola reacción junto con las enzimas de restricción y ligasa adecuadas. El ciclo de reacción produce un numerosos ORF del TCR de longitud completa reconstituidos variantes, proporcional al número de combinaciones de vectores donantes V-C y J posibles a partir de los incluidos, en una sola etapa en el contexto de la cadena principal del vector de entrada V-C (Cuadro iv).

Figura 20. Esquema de las características genéticas de los vectores de entrada TORES2 V-Ca y V-Ca.

Se representa un esquema de un plásmido circularizado de vectores de entrada V-Ca (a) y V-Ca (b) con los elementos genéticos mínimamente necesarios representados como cuadros marcados. Kozak se refiere a la secuencia consenso que desempeña un papel en el inicio eficiente de la traducción. Segmento V se refiere a una secuencia seleccionada que codifica una parte del ORF de la línea germinal variable del TCR, u ORF mutante/sintético. Tipo IIS n . ° 1 f se refiere a un primer sitio de unión de enzimas de restricción de Tipo IIS orientado de forma que la enzima corte en la dirección 5'. Tipo IIS n.° 1 ^ se refiere a un primer sitio de unión de enzimas de restricción de Tipo IIS orientado de forma que la enzima corte en la dirección 3'. selección - n.° 1 se refiere a un elemento de selección negativo diseñado para ser perjudicial para el plásmido que contiene la secuencia durante la reacción de reconstrucción del TCR de longitud completa, o etapas de selección posteriores. Segmento C se refiere a una secuencia seleccionada que codifica una parte del ORF de la línea germinal constante del TCR, o ORF mutante/sintético. Tipo IIS n.° 2 ^ se refiere a un segundo sitio de unión de enzimas de restricción de Tipo IIS orientado de forma que la enzima corte en la dirección 5'. La enzima es diferente del primer Tipo de IIS. Tipo IIS n.° 2 ^ se refiere a un segundo sitio de unión de enzimas de restricción de Tipo IIS orientado de forma que la enzima corte en la dirección 3'. La enzima es diferente del primer Tipo de IIS. selección - n.° 2 se refiere a un elemento de selección negativo diseñado para ser perjudicial para el plásmido que contiene la secuencia durante el ensamblado del vector bidireccional de longitud completa de ORF del TCR. selección - n.° 2 es diferente de la primera selección -. selección n.° 1 se refiere al primer marcador de selección positiva del sistema bicomponente utilizado para transmitir una ventaja selectiva al organismo que aloja el vector, y que es diferente del marcador de selección positiva de un segundo componente vectorial (donante J) (véase la Figura 2). Ori se refiere a un origen de replicación utilizado para la propagación del plásmido dentro de un hospedador compatible. Elemento genético 5' se refiere a cualquier elemento genético deseado que proporciona atributos requeridos para la aplicación posterior del TCR de longitud completa reconstituido, y debe estar situado 5' del TCR de longitud completa reconstituido, por ejemplo, un elemento RMCE. Elemento genético 3' se refiere a cualquier elemento genético deseado que proporciona atributos requeridos para la aplicación posterior del TCR de longitud completa reconstruido, y debe estar situado3' del ORF del TCR de longitud completa reconstruido, por ejemplo, un segundo elemento RMCE.

Figura 21. Diagrama esquemático del plásmido con las características genéticas del vector donante del terminador bidireccional (donante BiT).

Se representa un esquema de plásmido circularizado de un vector donante terminador bidireccional con las características genéticas mínimamente necesarias representadas como cuadros marcados. El elemento term inador bidireccional (T-T) se refiere a una secuencia de ADN que codifica un terminador bidireccional. Tipo IIS n.° 2^ se refiere a un segundo sitio de unión de enzimas de restricción de Tipo IIS orientado de forma que la enzima corte en la dirección 3'. Tipo IIS n.° 2^ se refiere a un segundo sitio de unión de enzimas de restricción de Tipo IIS orientado de forma que la enzima corte en la dirección 5'. selección n.° 2 se refiere al primer marcador de selección positiva del sistema bicomponente utilizado para transmitir una ventaja selectiva al organismo que aloja el vector, y que es diferente del marcador de selección positiva del primer componente vectorial (véase la Figura 20). Ori se refiere a un origen de replicación utilizado para la propagación del plásmido dentro de un hospedador compatible.

Figura 22. Descripción genérica de la entrada genética, subproductos, intermedios y producto del sistema de vectores bicomponente bidireccionales para reconstruir un vector con TRA y TRB emparejadas.

Se ilustran el TRA (a), TRB (b) y el vector donante del terminador bidireccional (c); cuando estos tres componentes se combinan en una sola reacción con la enzima de restricción del segundo Tipo IIS y ligasa, se generan tres subproductos de reacción (d, e y f), tres intermedios de reacción (g, h e i) y un producto de reacción (j). Los vectores de entrada y el producto del sistema bicomponente se representan como esquemas de plásmidos circularizados donde los elementos genéticos están representados como cuadros marcados; los vectores plasmídicos abiertos que representan el subproducto o intermedio son esquemas de plásmidos no circularizados donde los elementos genéticos están representados como cuadros marcados; y el ADN lineal se representa como una serie de cuadros marcados que describen elementos genéticos.

a) Un ORF del TRA reconstituido en el contexto del vector de entrada V-C^ como se describe en la Figura 20a.

b) Un ORF del TRA reconstituido en el contexto del vector de entrada V-C^ como se describe en la Figura 20b

c) Un vector donante de BiT como se representa en la Figura 21

d) La digestión del vector TRA (a) con la enzima de restricción de Tipo IIS n.° 2 da como resultado un subproducto de reacción de vector TRA de ADN lineal que contiene el elemento de selección - n.° 2 y el sitio de unión de Tipo IIS n.° 2 ^ y de Tipo IIS n.° 2 ^ .

e) La digestión del vector TRB (b) con la enzima de restricción de Tipo IIS n.° 2 da como resultado un subproducto de reacción del vector TRB de ADN lineal que contiene los elementos genéticos 5' y 3', los elementos del Tipo IIS n.° 2 ^ y de Tipo IIS n.° 2 ^ , el elemento de selección - n.° 2, el elemento de selección n.° 1 y el origen del elemento de replicación.

f) La digestión del vector donante del terminador bidireccional (c) con la enzima de restricción de Tipo IIS n.° 2 da como resultado un subproducto plasmídico no circularizado que contiene todos los elementos vectoriales del plásmido precursor excepto los que lleva el intermedio del fragmento donante del terminador bidireccional escindido (i).

g) La digestión del vector TRA (a) con la enzima de restricción de Tipo IIS n.° 2 da como resultado un intermedio de plásmido no circularizado que contiene todos los elementos genéticos del plásmido precursor excepto los que tiene el subproducto de la reacción del vector TRA del ADN lineal escindido (d). La digestión ha creado además dos salientes de ADN monocatenario, saliente £ 1-5' y el saliente £ 3-3'. El saliente £ 1-5' es compatible con el saliente £ 1-3' en el intermedio del vector del terminador bidireccional (i). El saliente £ 3-3' es compatible con el saliente £ 3-5' en el intermedio del fragmento TRB (h).

h) La digestión del vector TRB (b) con la enzima de restricción de Tipo IIS n.° 2 da como resultado un fragmento de ADN lineal que contiene el segmento C, parte C, segmento J, CDR3, segmento V^ y secuencia Kozak flanqueada por salientes de ADN monocatenario, el saliente £2-3' y el saliente £3-5'. El saliente £2-3' es compatible con el saliente £2-5' en el intermedio del terminador bidireccional (i). El saliente £ 3-5' es compatible con el saliente £ 3-3' en el intermedio del vector de TRA abierto (g).

i) La digestión del vector donante del terminador bidireccional (c) con la enzima de restricción de Tipo IIS n.° 2 produce un intermedio de fragmento de ADN lineal que contiene el terminador bidireccional. La digestión ha creado de forma adicional dos salientes de ADN monocatenario, el saliente £ 1-3' y el saliente £ 2-5'. El saliente £ 1-3' es compatible con el saliente £ 1-5' en el intermedio del vector de TRA abierto (g). El saliente £2-5' es compatible con el saliente £2-3' en el intermedio del fragmento TRB (h).

j) La ligación de los tres salientes de ADN monocatenario compatibles da como resultado el vector de TRA y TRB emparejadas bidirección en forma de un plásmido circularizado. Este plásmido contiene todos los elementos genéticos del vector TRA parental (a) con excepción del subproducto de reacción vector TRA escindido (d). Además, el vector ORF del TCR de longitud completa incorpora el intermedio del fragmento TRB (h) y el intermedio del terminador bidireccional (i). Las flechas indican los puntos aproximados de ligación entre los salientes de ADN monocatenario compatibles £ 1, £ 2 y £ 3. El punto de ligación £1 comprende los elementos £1-5' y £1-3' donados por el intermedio de reacción del vector TRA (a) y el intermedio del terminador bidireccional (i), respectivamente. El punto de ligación £2 comprende los elementos £2-3' y £2-5' donados por el intermedio del fragmento TRB (h) y el fragmento del terminador bidireccional (i), respectivamente. El punto de ligación £3 comprende los elementos £3-3' y £3-5' donados por el intermedio de reacción del vector TRA (a) y el intermedio de reacción del fragmento TRB (h), respectivamente.

Figura 23 Validación de especificidad de un par TRA/TRB de TCR modelo reconstituido utilizando TORES2

Se reconstituyó un par de cadenas de TRA/TRB del TCR modelo con especificidad para un antígeno restringido por HLA-A*02:01 con el sistema TORES2 como se describe en el ejemplo 11. El vector donante TRA/TRB bidireccional se utilizó para integrar de forma estable los ORF del TCR en una línea celular humana que expresaba constitutivamente componentes CD3 pero que carecía de expresión endógena para las cadenas TRA y TRB, y que codifica además un sitio receptor genómico compatible con los sitios RMCE contenidos dentro del vector donante de producto que tiene contribución del vector de entrada V-Ca original. La funcionalidad del vector donante de TRA y TRB emparejado de longitud completa reconstituido generado por el TORES2 se determinó por tinción de superficie del complejo CD3, y la especificidad esperada del TCR reconstituido y expresado se confirmó por tinción con tetrámero HLA-A*02:01-SLLMWITQV específico.

a) El par de TCR modelo se integró en el genoma de la línea celular presentadora del TCR modificada genéticamente que contiene sitios receptores genómicos coincidentes con el vector donante. Este sitio receptor genómico contiene elementos promotores que dirigen dos marcadores fluorescentes independientes (proteína fluorescente roja, RFP y proteína fluorescente azul, BFP) en disposición antiparalela interpuestos por un elemento terminador bidireccional análogo al producto final del vector donante TRA/TRB del TORES2 TRA/TRB descrito en el Ejemplo 11. Después de la transfección y el crecimiento de las células receptoras, se llevó a cabo un análisis mediante citometría de flujo para observar la persistencia de estos indicadores fluorescentes. Por lo tanto, la ausencia de los sitios del receptor genómico (RFP-BFP-) indicó que las células habían integrado correctamente el vector donante TRA/TRB. Aunque las células no integraron el vector donante TRA/TRB, mostraron presencia de los sitios receptores genómicos (RFP+BFP+). La mayoría de las células integraron con éxito las secuencias del vector donante TRA/TRB en el sitio receptor genómico.

b) Cada una de las poblaciones RFP-BFP- y RFP+BFP+ de a) se clasificaron y volvieron a representar en un segundo gráfico de histograma de superposición. Las células que integraron la construcción bidireccional también mostraron tinción positiva con anticuerpo de Cd3, lo que demuestra que TCR se expresaba en la superficie celular (histograma claro). Las células que no integraron la construcción bidireccional no mostraron tinción con el anticuerpo de CD3 (histograma oscuro).

c) y d) las células RFP-BFP- analizadas en a) y b) se clasificaron y volvieron a representar como gráficos de contorno. Se tiñeron muestras paralelas de las células con el reactivo del tetrámero HLA-A*02:01-SLLMWITQV c), o no d), en donde la doble positividad para el tetrámero/CD3 en c) indica la especificidad esperada del par TCR ORF reconstituido e integrado.

Materiales y métodos

Secuenciación de ADN

Toda la secuenciación mencionada en los ejemplos presentados se realizó mediante el método de Sanger, y fue realizada por GATC Biotec AB, Suecia.

Síntesis de ADN

Todas las síntesis de ADN mencionadas en los ejemplos presentados fueron realizadas por Integrated DNA Technologies BVBA, Bélgica.

Los fragmentos de ADN >125 pb se sintetizaron como moléculas de ADN bicatenarias lineales como un producto de 'Fragmentos de genes gBlock’.

Los fragmentos de ADN de 15-60 nt se sintetizaron como moléculas de ADN monocatenario como un producto de 'Fragmento de oligonucleótidos personalizado’.

Los fragmentos de ADN de 61-124 nt se sintetizaron como moléculas de ADN monocatenario como un producto de Fragmento de oligonucleótidos de ADN Ultramer’.

Ensamblado y clonación de la genoteca de vectores

La construcción de vectores descrita en los ejemplos comprende una variedad de métodos bien conocidos por los expertos en la técnica, y las composiciones de reacción específicas se describen detalladamente en los Ejemplos 1 a 3. En los procedimientos descritos se utilizaron los siguientes materiales clave:

Dúplex de oligonucleótidos que codifica el ensamblado de CDR3 (odeCDR3)

odeCDR3 se ensambló rutinariamente por anillado de oligonucleótidos monocatenarios parcialmente complementarios. En el Ejemplo 6 se proporciona una descripción detallada de la composición de reacción y de las condiciones. En los procedimientos descritos se utilizaron los siguientes materiales clave:

Reconstitución del TCR

El funcionamiento del TORES para reconstituir los ORF del TCR de longitud completa se describe en detalle en los Ejemplos 7 a 9. En los procedimientos descritos se utilizaron los siguientes materiales clave:

Clasificación de células activadas por fluorescencia (FACS)

Linfocitos T CD8+ positivos para el HLA multímero único se clasificaron mediante FACS para la amplificación y secuenciación de cadenas del TCR. Esto se logró utilizando metodologías estandarizadas de clasificación celular utilizando el instrumento BDInflux. En resumen, las células se tiñeron con el reactivo de HLA multímero en hielo durante 10 minutos, a continuación con anticuerpos de CD3 y CD8 como marcadores de linfocitos T CD8+. Los linfocitos con la señal CD3+CD8+Multímero+ se clasificaron en una placa de PCR precargada con 5 pl de agua exenta de nucleasas. Las muestras se congelaron rápidamente hasta el procesamiento posterior. En los procedimientos descritos se utilizaron los siguientes materiales clave:

Secuenciación de cadenas alfa y beta de TCR a partir de linfocitos T individuales

Los linfocitos T clasificados individualmente mediante FACS se sometieron a un proceso de amplificación en dos etapas que implica la recogida de cebadores específicos de la región V de cada TRA y TRB, seguido por reacciones de PCR anidadas emparejadas que crean amplicones de TRA y TRB para el análisis de secuencias como se describe en el Ejemplo 8. Este procedimiento se ha descrito anteriormente (Han y col. Nat Biotechnol.

2014 32(7): 684-692). En los procedimientos descritos se utilizaron los siguientes materiales:

Ejemplo 1

Diseño y ensamblado de una genoteca de vectores de entrada V-C de TRA para un repertorio de TRA humana natural

Un TORES consiste en una genoteca de vectores de entrada V-C y una genoteca de vectores donantes J para una cadena del TCR dada. Cuando se combina con una secuencia diana de odeCDR3 a introducir en un contexto V-J-C seleccionado, puede reconstituirse un ORF del TCR de longitud completa. Variando las características de la secuencia odeCDR3 y/o de la selección de V/J/C, esta etapa de reconstitución también puede representar una etapa de diversificación de secuencia de un ORF del TCR en flujos de trabajo de ingeniería de etapas de diversificación de secuencia de un ORF del TCR. En el presente ejemplo, el diseño y ensamblado de una genoteca de vectores de entrada V-C de TRA que contiene el repertorio de secuencias V-C de TRA humanas nativos. Este es un ejemplo del tipo de vector de entrada V-C genérico representado en la Figura 2.

Los componentes de ADN necesarios para una genoteca de vectores V-C de TRA son:

I. Un fragmento de clonación V de TRA para cada segmento génico V de TRA funcional codificado en el genoma humano

II. Fragmento de clonación C único de TRA

III. Una cadena principal del vector de entrada V-C

En el presente ejemplo, los fragmentos de clonación V de TRA y C de TRA se sintetizaron y utilizaron para su ensamblado en una cadena principal del vector de entrada V-C diana en una sola reacción de enzima de restricción y ligasa. En el presente ejemplo, la cadena principal de entrada V-C diana se diseñó para permitir la expresión transitoria de los ORF del TRA reconstituidos en células de mamífero.

En el presente ejemplo, la genoteca de vectores de entrada V-C de TRA se construye con la enzima de restricción de Tipo IIS Bbsl. La enzima de restricción de Tipo IIS utilizada en el funcionamiento del TORES completo para reconstituir los ORF del TRA de longitud completa es Bsal.

Diseño de fragmentos de clonación V de TRA sintéticos

La disposición de los elementos genéticos de los fragmentos de clonación V de TRA en el presente ejemplo se representa en la Figura 5.

Cada extremo del fragmento de clonación V de TRA codifica una secuencia estandarizada 5' y 3' de ADN de unión al cebador de 20 nucleótidos para la propagación del fragmento general por PCR.

Proximal a la unión del cebador 5' hay codificado un sitio de unión de la enzima de restricción Bbsl de Tipo IIS, en donde la dirección del sitio de unión de Bbsl guía la enzima Bbsl para cortar el ADN en 3' respecto a su secuencia de reconocimiento. Los salientes generados por la actividad enzimática de Bbsl se denominan Saliente*1. Este saliente está diseñado para permitir la clonación dependiente de ligasa dirigida con un brazo de la cadena principal del vector de entrada V-C.

Una secuencia consenso de kozak está codificado en 5' del codón de iniciación ATG dentro del segmento génico V de TRA para el inicio eficiente de la traducción del ARNm de TRA reconstituido y expresado final. En el presente ejemplo, cada segmento V de TRA codifica todos los aminoácidos desde el resto de metionina inicial hasta la última cisteína (Cys) del segmento V de TRA. Este residuo Cys se reconoce generalmente como un límite de los segmentos génicos TRA variables, cuya deleción es rara en cadenas TRA recombinadas y funcionales de origen natural. Cuando es necesario, las secuencias de consenso nativas de V de TRA humanas se han editado para eliminar las secuencias de reconocimiento de cualquier enzima de restricción utilizada en las operaciones de ensamblado o reconstitución con el TORES, y también de cualquier enzima utilizada en aplicaciones posteriores.

Hacia el extremo 3' del segmento V de TRA hay codificado un sitio de unión de enzima de restricción Bsal de Tipo IIS, Bsal ^ . La dirección del sitio de unión de Bsal guía la enzima Bsal para cortar el ADN en 5' respecto a su secuencia de reconocimiento. La secuencia del saliente resultante está diseñada para incluir el último codón de cisteína del elemento de segmento V y el 3er nucleótido del codón de aminoácidos que precede a la cisteína. Por lo tanto, la acción de Bsal en la secuencia diseñada crea un Saliente Cys£1 de V de TRA en el extremo 3' del segmento V de TRA. En el presente ejemplo, este Saliente Cys £1 se estandariza entre todos los segmentos V de TRA incluidos para simplificar y unificar la estrategia de clonación. Cuando fue necesario, se cambiaron los nucleótidos que codifican el elemento genético V de TRA para codificar este saliente estandarizado pero sin cambiar la secuencia de aminoácidos traducida. Este sitio Bsal ^ se utiliza durante la reacción de reconstitución de TRA de longitud completa.

En este ejemplo actual, el marcador de selección negativa del vector de entrada V-C es un sitio de unión a enzimas de restricción Notl. Para construir un sitio de unión Notl, se combinan dos mitades del sitio cuando el fragm ento de clonación V de TRA y el fragm ento de clonación C de TRA se ligan entre sí. El fragmento de clonación V de TRA codifica el segmento Notl 5' de seis nucleótidos.

El extremo 5' de la secuencia de unión del cebador en 3' codifica un segundo sitio de restricción Bbsl, que dirige la enzima Bbsl para cortar el ADN en 5' respecto a su secuencia de reconocimiento, Bbsl^ . La acción de Bbsl en la secuencia diseñada crea por lo tanto un saliente de 4 nucleótidos, saliente Notl 5 ', diseñado para ser complementario del saliente generado en el fragmento de ADN C de TRA y reconstituye un sitio de unión Notl en la ligación.

Sp denota adiciones de nucleótidos en puntos específicos del fragmento de clonación V de TRA para lograr la separación correcta del sitio de unión de enzimas de restricción de Tipo IIS y el sitio de corte, cuando está adyacente a dichos sitios. Los bloques Sp que flanquean la secuencia del sitio de unión de enzimas de restricción Notl se han utilizado para separar adecuadamente el sitio de unión y de corte de Notl para una acción eficiente. La selección de nucleótidos tuvo en cuenta el impacto potencial de la metilación de DAM en el sitio de unión a Bsal.

Las secuencias completas de ADN para los fragmentos de clonación V de TRA en el presente ejemplo de cadenas TRA humanas nativas se proporcionan como SEQ0001 a SEQ0046. Estas secuencias incluyen las secuencias de unión al iniciador 5' y las secuencias de unión al iniciador 3'.

Diseño del fragmento de clonación C de TRA sintético

en la Figura 6 se representa la disposición de los elementos genéticos de los fragmentos de clonación C de TRA en el presente ejemplo.

Cada extremo del fragmento de clonación C de TRA codifica una secuencia estandarizada 5' y 3 de ADN de unión al cebador 'de 20 nucleótidos para la propagación del fragmento general por PCR.

Proximal a la secuencia de unión al cebador 5' hay codificado un sitio de reconocimiento de la enzima de restricción Bbsl, de forma que la enzima Bbsl cortará el ADN 3' respecto a su secuencia de reconocimiento, Bbsi^ .

El fragmento de clonación C de TRA codifica el segmento Noti 3' de seis nucleótidos, que completa un sitio de reconocimiento NotI que constituirá el marcador de selección negativa del vector de entrada V-C. El sitio de restricción BbsI ^ adyacente actúa sobre el elemento NotI 3' para crear el saliente Notl 3' de cuatro nucleótidos. Este saliente está diseñado para ser complementario al saliente Notl 5' generado en el fragmento de ADN V de TRA y reconstituir un sitio de unión Notl completo en el ensamblado de vectores de entrada V-C.

En el extremo 3' del elemento Notl 3 ', el fragmento de clonación C de TRA codifica un sitio de unión de enzimas de restricción Bsal, Bsal ^ . La dirección del sitio de unión de Bsal guía la enzima Bsal para cortar el ADN 5' respecto a su secuencia de reconocimiento. La secuencia del saliente resultante está diseñada para comenzar desde la primera citosina del fragmento genético C de TRA, saliente C de TRA £3. Este sitio Bsai ^ se utiliza durante la reacción de reconstitución TRA de longitud completa. La enzima Bsal^ actúa sobre el segmento C de TRA codificado en el vector de entrada V-C para crear el Saliente de C de TRA £3 necesario durante las reacciones de reconstitución. En el presente ejemplo, en el fragmento de clonación C de TRA hay incluida una secuencia de C de TRA de consenso desde el resto de citosina 5' del primer codón de glutamina hasta el codón de terminación

El extremo 5' de la unión al cebador en 3' codifica una secuencia de reconocimiento de la enzima de restricción Bbsl, Bbsl ^ . La dirección del sitio de unión a Bbsl guía la enzima Bbsl para cortar el ADN 5' respecto a su secuencia de reconocimiento. Los salientes generados por la actividad enzimática de Bbsl se denominan Saliente*2 . El diseño de este saliente permite la clonación dependiente de ligasa dirigida con un brazo de la cadena principal del vector de entrada V-C^ durante el ensamblado.

Sp denota las adiciones de nucleótidos en puntos específicos del fragmento de clonación C de TRA para lograr la separación correcta del sitio de unión de enzimas de restricción de Tipo IIS y el sitio de corte, cuando está adyacente a dichos sitios. Los bloques Sp que flanquean la secuencia del sitio de unión de enzimas de restricción Notl se han utilizado para separar adecuadamente el sitio de unión y de corte de Notl para una acción eficiente. La selección de nucleótidos tuvo en cuenta el impacto potencial de la metilación de DAM en el sitio de unión a Bsal

La secuencia completa de ADN para el fragm ento de clonación C de TRA del presente ejemplo de cadenas TRA humanas nativas se presenta como SEQ0047. Esta secuencia incluye las secuencias de unión al iniciador 5' y las secuencias de unión al iniciador 3'.

Diseño de la cadena principal del vector de entrada V-C para la expresión transitoria del ORF del TRA reconstituido en células de mamífero

En el presente ejemplo, la cadena principal del vector de entrada V-C se deriva del plásmido pMA. Codifica un origen de replicación Col E1, ori, junto con el gen de la beta-lactamasa de resistencia a antibióticos, selección positiva n.° 1. La beta-lactamasa confiere resistencia al grupo de antibióticos betalactámicos de la penicilina, tales como ampicilina y carbenicilina.

La cadena principal del vector, como se representa en la Figura 7, codifica los elementos genéticos necesarios que confieren la funcionalidad adecuada para aplicaciones posteriores del ORF del TRA completamente reconstituido. En este ejemplo, el elemento genético 5' codifica el promotor constitutivo mamífero de CMV y el elemento genético 3' codifica la señal de poliadenilación de SV40pA para permitir la expresión transitoria del ORF del TRA completamente reconstituido en una célula de mamífero.

En el presente ejemplo, la cadena principal del vector codifica sitios de unión de enzimas de restricción Acc65I y Xbal que generan el saliente *1' y saliente *2', respectivamente. El Saliente*1' es complementario al Saliente*1 en el fragmento de clonación V de TRA (Figura 5). El Saliente*1' es complementario del Saliente*2 en el fragmento de clonación C de TRA (Figura 6). Estos salientes complementarios permiten la clonación dirigida de los fragmentos de clonación V de TRA y C de TRA en la cadena principal del vector de entrada V-C.

La característica Sp denota nucleótidos añadidos entre los sitios de reconocimiento de los enzimas de restricción Acc65I y Xbal necesarios para separar los dos sitios para una acción eficiente.

La secuencia de ADN de la cadena principal del vector procedente del elemento genético 5' que codifica promotor constitutivo del CMV hasta el elemento genético 3' que codifica la señal de poliadenilación de SV40pA se presenta como SEQ0048.

Método para ensamblar la genoteca de vectores de entrada V-C de TRA

Este método utiliza técnicas estandarizadas de biología molecular para ensamblar el fragm ento de clonación V de TRA seleccionado (Figura 5) y el fragm ento de clonación C de TRA (Figura 6) en una cadena principal del vector de entrada V-C dada (Figura 7) para crear un vector de entrada V-C de t Ra (Figura 2). En este ejemplo, el método lleva a cabo la digestión con enzimas de restricción y la reacción de ligación en una sola reacción. Reacción de digestión y ligación de RE

100 ng de cadena principal del vector lineal (linealizado por digestión con ACC65I y Xbal)

10 ng del fragmento genético V de TRA

20 ng del fragmento genético C de TRA

2 pl de tampón de ligasa NEB 10x

0,5 pl de Bbsl

1 pl de ADN-ligasa de T4

Hasta 20 pl de H²O

Condiciones de reacción

Etapa 1; 2 minutos a 37 0C

Etapa 2; 3 min a 16 0C

Repetir las etapas 1 y 2, 20 veces

5 min a 50 0C

5 min a 80 0C

Volver a la temperatura ambiente

El producto resultante se transforma en células E. coli competentes que se seleccionan por colonias resistentes a carbenicilina. Los plásmidos aislados de colonias seleccionadas se secuencian para determinar las construcciones ensambladas correctamente. El procedimiento se repite para cada fragmento de clonación del segmento V independiente. Las construcciones resultantes componen la genoteca de vectores de entrada V-C de TRA para su uso en la reconstitución de ORF de longitud completa para su uso posterior en la expresión transitoria de dicho TRA reconstituido en células de mamífero. La secuencia de los fragmentos V-C clonados que componen la genoteca del vector de entrada V-C de TRA se presenta como SEQ0049 a SEQ0094. Las secuencias presentadas incluyen toda la secuencia Kozac que precede al codón de iniciación del segmento variable, hasta el codón de terminación del segmento C.

Ejemplo 2

Diseño y ensamblado de una genoteca de vectores de donantes J de TRA para un repertorio de TRA humana nativa Un TORES consiste en una genoteca de vectores de entrada V-C y una genoteca de vectores donantes J para una cadena del TCR dada. Cuando se combina con una secuencia diana de odeCDR3 a introducir en un contexto V-J-C seleccionado, puede reconstituirse un ORF del TCR de longitud completa. Variando las características de la secuencia odeCDR3 y/o de la selección de V/J/C, esta etapa de reconstitución también puede representar una etapa de diversificación de secuencia de un ORF del TCR en flujos de trabajo de ingeniería de etapas de diversificación de secuencia de un ORF del TCR

En el presente ejemplo, el diseño y ensamblado de una genoteca de vectores donantes J de TRA que contiene el repertorio de secuencias V-C de TRA humanas nativas. Este es un ejemplo del tipo de vector donante J genérico representado en la Figura 3.

En el presente ejemplo, un fragm ento del casete de recepción J de TRA se construye y se inserta en la cadena principal del vector donante J para crear un vector del casete de recepción J . Posteriormente, partes sintéticas de segmento J de TRA se pueden ensamblar en un vector del casete de recepción J de TRa para crear la genoteca de vectores donantes J . Este método flexible de ensamblado multietapa permite un diseño rápido y económico de las características del segmento donante J, tales como variaciones en la longitud del segmento J.

Los componentes de ADN necesarios para una genoteca de vectores donantes J de TRA son:

I. Fragmento del casete de recepción J de TRA

II. Cadena principal del vector donante J

III. Vector del casete de recepción J de TRA

IV. Parte del segmento J de TRA

Diseño del fragmento sintético del casete de recepción J de TRA

El anillado de dos oligonucleótidos de ADN monocatenarios se utiliza para generar el fragmento del casete del sitio receptor que, por diseño, contiene salientes monocatenarios de 4 nucleótidos a cada extremo del fragmento de ADN; el Saliente*3 y el Saliente*4. Los salientes de 4 nucleótidos permiten la clonación dirigida dependiente de ligasa a una cadena principal del vector donante J para crear el vector del casete de recepción J de TRA, representado en la Figura 8.

El par de sitios de restricción de Tipo IIS, BsaI ^ y Bsal ^ está situado en el extremo 5' y 3' del fragmento de ADN del casete del sitio de recepción. La dirección del sitio de reconocimiento de Bsal es para guiar a la enzima Bsal para cortar el ADN hacia el centro de la construcción. Estos sitios se utilizan durante el protocolo de reconstitución del ORF de TRA generando un saliente $2-5' y un saliente $3-3'. El Saliente $3 es un componente de la parte C de TRA codificada en el fragmento del casete de recepción, mientras que el Saliente $2 se define después de clonar la parte del segmento J de TRA (véase más abajo).

El par Bbsl de los sitios de reconocimiento de Tipo IIS Bbsl ^ y Bbsl ^ están codificados cerca del centro del casete y se utilizan para ensamblar el vector donante J de TRA, durante la creación de salientes complementarios incluidos en las partes del segmento J de TRA sintetizadas (véase más abajo). El sitio Bbsl en 5', Bbsl ^ , corta el sitio Bsal para crear el Saliente*5 en el extremo 3' de esta característica. El sitio Bbsl en 3', Bbsl ^ , corta el elemento de parte C de TRA, para crear un Saliente*6 en el extremo 5' de este elemento. Estos salientes están codificados en las características de la parte Bsal y C de TRA de esta construcción para evitar la adición de nucleótidos no nativos que se incorporarían al ORF del TRA reconstituido final.

La región entre el saliente generado por la enzima Bbsl ^ y el saliente generado por la enzima Bsal ^ codifica una parte de la región C de TRA que comienza a partir del segundo nucleótido del fragmento genético C de TRA, parte C de TRA. El motivo para comenzar a partir del segundo nucleótido del fragmento genético C de TRA es porque, en el presente ejemplo de un locus de TRA humano TORES, el saliente resultante es TATC y no un saliente palindrómico, lo que sería el caso si se incluyera el comienzo del fragmento genético C de TRA (saliente resultante ATAT). Debe evitarse un saliente palindrómico, ya que permitiría que dos extremos de vector se uniesen sin la inserción de la parte del segmento J requerida. La orientación del sitio Bbsl ^ permite la clonación dependiente de ligasa dentro del marco de todos los fragmentos J de TRA 3' hasta el comienzo de la región C de TRA 5' del casete del sitio receptor. La orientación del sitio Bsal ^ permite la clonación dependiente de ligasa dentro del marco del comienzo de la región C de TRA con los fragmentos C de TRA restantes en la etapa final del protocolo de reconstitución del ORF de longitud TRA completa utilizando un TORES completo.

Entre los dos sitios de unión de Bbsl hay una secuencia de reconocimiento de 8 nucleótidos de la enzima N otl. Este sitio de restricción se utiliza como un marcador de selección negativa para reducir el fondo de colonias del plásmido parental. Esto se logra cuando la enzima Notl se añade después de realizar la inserción del fragmento génico J de TRA. Por lo tanto, los plásmidos que clonan correctamente un fragmento de gen J de TRA deberán seguir siendo circulares en presencia de la enzima Notl pero los plásmidos parentales que no intercambiaron su sitio Notl por un fragmento de gen J de TRA se linealizarán, sesgando a su vez la transformación bacteriana para que propague un plásmido que contiene el fragmento J de TRA circular completo.

Sp denota las adiciones de nucleótidos en puntos específicos del fragmento del casete de recepción J de TRA para lograr la separación correcta del sitio de unión de enzimas de restricción de Tipo IIS y el sitio de corte, cuando está adyacente a dichos sitios. Los bloques Sp que flanquean la secuencia del sitio de unión de enzimas de restricción Notl se han utilizado para separar adecuadamente el sitio de unión y corte Notl para una acción eficiente. Se han incluido nucleótidos adicionales para mantener el marco de lectura correcto dentro del TRA de longitud completa reconstituido final. La selección de nucleótidos tuvo en cuenta el impacto potencial de la metilación de DAM en el sitio de unión a Bsal.

La secuencia completa de ADN para el fragmento del casete de recepción J de TRA del presente ejemplo de cadenas TRA humanas nativas se presenta como SEQ0095 y SEQ0096. Se especifican ambas secuencias de oligonucleótidos directa (F1) e inversa (R1).

Diseño de la cadena principal del vector donante J

La cadena principal del vector donante J se utiliza para insertar el fragmento del casete de recepción J de TRA para crear el vector del casete de recepción J de TRA. Por tanto se lleva la cadena principal en la genoteca de vectores donantes J. En la reacción final para crear los ORF de TRA longitud completa, esta cadena principal es un subproducto de reacción (Figura 4E) y, por lo tanto, tiene características mínimas como se representa en la Figura 9. En el presente ejemplo, la cadena principal del vector donante J codifica para un origen de replicación Col E1, ori. La resistencia a antibióticos es el gen de la aminoglicósido 3'-fosfotransferasa, selección positiva n.° 2. La aminoglicósido 3'-fosfotransferasa confiere resistencia a sustratos antibióticos tales como kanamicina, estreptomicina, neomicina y gentamicina. Esta selección positiva alternativa se utiliza para asegurar que los vectores donantes J no se seleccionen después de la reconstitución del ORF del TCR de longitud completa, que se seleccionan en la selección positiva n.° 1. En el presente ejemplo, los sitios de unión de la enzima de restricción EcoRI y Xhol del vector que generan salientes complementarios, el saliente *3' y el saliente *4 ', respectivamente. El Saliente*3' es complementario al Saliente*3 contenido dentro del fragm ento del casete de recepción J de TRA. El Saliente*4' es complementario al Saliente*4 contenido dentro del fragm ento del casete de recepción J de TRA. Estos salientes permiten la clonación dirigida del fragmento del casete de recepción J de TRA.

El bloque Sp denota nucleótidos añadidos entre los sitios de unión de enzimas de restricción EcoRI y Xhol para separar los dos sitios para asegurar una acción eficiente.

En el presente ejemplo, la cadena principal del donante J se presenta como SEQ0097.

Método para ensamblar el vector del casete de recepción J de TRA

Este método utiliza técnicas estándar de biología molecular para ensamblar los fragmentos del casete de recepción J de TRA dado (Figura 8) en una cadena principal del vector donante J dado (Figura 9) para crear un vector del casete de recepción J de TRA (Figura 10). El vector del casete de recepción J de TRA resultante se utiliza para insertar partes del segmento J de TRA (Figura 11) para construir vectores donantes J de TRA (Figura 3).

Primero, los dos oligonucleótidos que forman el fragmento de ADN del casete de recepción J de TRA deben fosforilarse y anillarse.

Mezcla de reacción

Oligonucleótido (cadena sentido) (100 pM) 1 pl

Oligonucleótido (cadena antisentido) (100 pM) 1 pl

Tampón de ligasa de T410x 1 pl

T4 PNK 1 pl

H²O 6 pl

Condiciones de reacción

Incubar a 37 0C durante 1 hora

Desnaturalizar a 95 0C durante 5 min

Hibridar los oligonucleótidos sentido y antisentido enfriando lentamente la reacción a 25 0C a 3 0C por min Ligación de ensamblado de fragmentos del casete de recepción J de TRA y de la cadena principal del vector donante J. Mezcla de reacción

Cadena principal del vector lineal 100 ng

Fragmento de ADN del casete del sitio receptor (0,5 pM) 2 pl

Tampón de ligasa de T410x 2 pl

Ligasa de T4 0,5 pl

H²O hasta 20 pl

Condiciones de reacción

Incubar durante 1 hora a 25 °C

Inactivar térmicamente a 65 0C durante 10 min

El producto resultante se transforma en células E. coli competentes y se selecciona por colonias resistentes a kanamicina. Las colonias resistentes se seleccionan para determinar las construcciones correctamente ensambladas. El plásmido resultante es el vector del casete de recepción J de TRA . En el presente ejemplo, el vector del casete de recepción J de TRA se presenta como SEQ0098 y se representa en la Figura 10.

Diseño de partes sintéticas de segmentos J de TRA

Después de haber generado el vector del casete de recepción J de TRA sintético, deben generarse las partes del segmento J de TRA sintéticas a introducir en este vector. Cada secuencia J de TRA se inserta en un contexto del vector receptor J de TRA independiente para generar la genoteca de vectores donantes J de TRA como parte del TOReS de TRA humana.

La genoteca de vectores donantes J viene en dos formas distintas, que comprenden una parte larga o corta del segmento J. La parte del segmento J de TRA corta codifica para todos los aminoácidos desde el inicio del codón de límite de CDR3. Sin embargo, teniendo en cuenta que la mayoría de los segmentos J de TRA se recortan en menos de 10 nucleótidos durante el reordenamiento del TCR, se diseña una genoteca de donantes J de TRA que contiene un segmento de línea germinal J de TRA más largo, la parte del segmento J de TRA larga. El motivo de una genoteca de fragmentos de genes J de TRA más largos es que se necesitaría un dúplex de oligonucleótidos que codifica para CDR3 más corto (odeCDR3) para la reconstitución de un TRA de longitud completa, que si se utilizara el fragmento J de TRA corto . Dado que se proporcionan secuencias altamente variables como dúplex de oligonucleótidos cortos, odeCDR3, es menos probable que una síntesis de oligonucleótidos de CDR3 más corto contenga contaminantes de oligonucleótidos truncados o mutados y, por lo tanto, se reduce la probabilidad de clonar el dúplex de oligonucleótidos con errores de secuencia durante la reconstrucción del TRA de longitud completa. Además, las síntesis de odeCDR3 más cortos ahorra costes.

Las partes de los segmentos J de TRA se construyen anillando dos oligonucleótidos de ADN monocatenarios diseñados para contener salientes monocatenarios de 4 nucleótidos en cada extremo del fragmento de ADN. La parte resultante del segmento J de TRA se representa en la Figura 11.

El saliente 5' designado Saliente*5' es complementario al Saliente*5' generado dentro del vector del casete de recepción del donante J por acción de Bbsl. El saliente 3' designado Saliente*6' es complementario del Saliente*6' generado dentro del vector del casete de recepción del donante J por acción de Bbsl. Este par de salientes complementarios permite la clonación direccional de las partes del segmento J de TRA en el vector del casete de recepción J de TRA.

La parte de segmento J de TRA corto codifica para todos los aminoácidos desde el inicio del codón Phe del límite CDR3-J. La CDR3 se define como la secuencia flanqueada por la Cys conservada C terminal de la región V y la Phe en la región J que forma parte del motivo conservado Phe-Gly/Ala. Este motivo Phe-Gly/Ala conservado se utiliza para estandarizar los salientes 5' de los fragmentos J de TRA hasta TTTG para la reconstitución de TRA posterior. Las excepciones a esta estandarización en el presente ejemplo son TRAJ33 y TRAJ38 humanas que límitan la región CDR3 con Trp y Gly. Los salientes 5' son TGGG para TRAJ33 y TRAJ38 en el presente ejemplo.

La parte de segmento J largo está diseñada para codificar más aminoácidos en el extremo N terminal de los aminoácidos límite de CDR3. El punto de inicio de cada fragmento de gen largo está en el primer nucleótido de un codón de aminoácido situado a 10-12 nt del extremo 5' del elemento de unión del TCR codificado por la línea germinal. El extremo 5' de cada parte larga del segmento J sigue siendo idéntico al de la parte corta del segmento J de TRA.

En ambas partes corta y larga del segmento J de TRA se añade una adenina, representada como bloque A en la Figura 11, al extremo 3' de cada parte de segmento J de TRA. Esta adenina representa el primer nucleótido del fragmento C de TRA que se excluye del casete de recepción J de TRA.

Las secuencias de las partes cortas de los segmentos J de TRA del presente ejemplo de segmentos J humanos nativos se presentan como SEQ0099 a SEQ0210 y las partes largas de los segmentos J de TRA como SEQ0211 a SEQ0322. En ambos casos se especifican ambas secuencias de oligonucleótidos directa (F1) e inversa (R1).

Método para ensamblar la genoteca de vectores de donante J corto o largo

Este método utiliza técnicas estandarizadas de biología molecular para clonar el segmento J de TRA corto o la parte del segmento J de TRA largo (Figura 11) en el vector del casete de recepción J de TRA (Figura 10) para crear los vectores donantes J de TRA (Figura 3) que contienen los segmentos J de TRA cortos o largos. En este ejemplo, el método lleva a cabo la digestión con enzimas de restricción y la reacción de ligación en una sola reacción.

Los componentes de ADN necesarios para una genoteca de vectores donantes J son los siguientes:

I. Parte corta de segmento J de TRA o parte larga de segmento J de TRA

II. Vector del casete de recepción de donante J

Fosforilación y anillado de dos oligonucleótidos para formar el fragmento de ADN de la parte del segmento J Mezcla de reacción

Oligonucleótido (cadena sentido) (100 pM) 1 pl

Oligonucleótido (cadena antisentido) (100 pM) 1 pl

Tampón de ligasa de T4 10x 1 pl

T4 PNK 1 pl

H²O 6 pl

Condiciones de reacción

Incubar a 37 0C durante 1 hora

Desnaturalizar a 95 0C durante 5 min

Hibridar los oligonucleótidos sentido y antisentido enfriando lentamente la reacción a 25 0C, a 3 0C por min Reacción de digestión y ligación de RE

Estructura principal del casete de recepción J de TRA 100 ng

Fragmento de ADN J de TRA (0,5 pM) 2 pl

Tampón de ligasa de T4 NEB 10x 2 pl

Bbsl 0,5 pl

ADN-ligasa de T4 0,5 pl

H²O hasta 20 pl

Condiciones de reacción

Etapa 1; 2 minutos a 37 0C

Etapa 2; 3 min a 16 0C

Repetir las etapas 1 y 2, 20 veces

5 min a 50 0C

5 min a 80 0C

Volver a temperatura ambiente

Se añaden 0,5 pl de enzima Notl y se incuba durante 30 min a 37 0C para linealizar el vector parental.

El producto de reacción se transforma en células competentes de E. coli y se seleccionan por resistencia a kanamicina. Las colonias resistentes seleccionadas se secuencian para determinar las construcciones ensambladas correctamente. Las construcciones resultantes componen la genoteca de vectores donante J de TRA que codifica un fragmento génico J largo o corto.

La secuencia de las genotecas resultantes, excluyendo la secuencia de la cadena principal no incluida en los sitios de reconocimiento Bsal, se presenta como SEQ0323 a SEQ0378 para la genoteca donante J de TRA corta y SEQ0379 a SEQ0434 para la genoteca donante J de TRA larga .

Ejemplo 3

Diseño y ensamblado del vector de entrada V-C de TRB y genotecas del vector donante J de TRB para el repertorio de TRB humano nativo

En los ejemplos anteriores, se ha descrito detalladamente el diseño y ensamblado del vector de entrada V-C y las genotecas del vector donante J para el repertorio de TRA humano nativo. El diseño y ensamblado general de dichas genotecas vectoriales que codifican secuencias del repertorio de TRB es esencialmente el mismo. En el presente ejemplo, el diseño y ensamblado del vector de entrada V-C de TRB y las genotecas del vector donante J de TRB se esbozan brevemente para construir un TORE o el locus del t Rb del TRC humano nativo.

Diseño y ensamblado de una genoteca de vectores de entrada V-C de TRB para un repertorio de TRB humana nativa

En el presente ejemplo, el diseño y ensamblado de una genoteca de vectores de entrada V-C de TRB que contiene el repertorio de secuencias V-C de TRB humanas nativas. Este es un ejemplo del Tipo de vector de entrada V-C genérico representado en la Figura 2.

Los componentes de ADN requeridos para una genoteca de vectores V-C de TRB son:

I. Un fragmento de clonación V de TRB para cada segmento génico V de TRB funcional codificado en el genoma humano

II. Un fragmento de clonación C1 de TRB o C2 de TRB

III. Una cadena principal del vector de entrada V-C

A diferencia del locus de TRA humano, el locus de TRB humano codifica dos segmentos constantes distintos, C1 y C2 de TRB. Por lo tanto, para capturar ambas regiones constantes, se construyen dos conjuntos de vectores de entrada V-C para emparejar cada uno de los segmentos V con cada uno de los segmentos C1 y C2.

En el presente ejemplo, los fragmentos de clonación V de TRB y C de TRB se sintetizaron y utilizaron para ensamblarse en una cadena principal del vector de entrada V-C diana en una sola reacción de enzima de restricción y ligasa. En el presente ejemplo, la cadena principal de entrada V-C diana se diseñó para permitir la expresión transitoria de los ORF del TRB reconstituidos en células de mamífero.

En el presente ejemplo, la genoteca de vectores de entrada V-C de TRB se construye con la enzima de restricción de Tipo IIS Bbsl. La enzima de restricción de Tipo IIS utilizada en el funcionamiento del biblioteca para reconstituir los ORF del TRB de longitud completa es Bsal.

Diseño de fragmentos de clonación V de TRB sintéticos

La disposición de los elementos genéticos de los fragmentos de clonación V de TRB es idéntica a la los de los fragmentos de clonación V de TRA descritos en el Ejemplo 1, como se representa en la Figura 5.

Las secuencias completas de ADN para los fragm entos de clonación V de TRB en el presente ejemplo de cadenas TRB humanas nativas se presentan como SEQ0435 a SEQ481.

Diseño del fragmento de clonación C de TRB sintético

La disposición de los elementos genéticos de los fragmentos de clonación V de TRB es idéntico a los de los fragmentos de clonación C de TRA descritos en el Ejemplo 1, como se representa en la Figura 6.

El locus de TRB codifica dos segmentos C distintos, y ambos se incluyen en el diseño de la genoteca de vectores de entrada V-C de TRB.

La secuencia completa de ADN para los fragmentos de clonación C de TRB en el presente ejemplo de cadenas TRB humanas nativas se presentan como SEQ0482 y SEQ0483.

Método para ensamblar la genoteca de vectores de entrada V-C de TRB

El método para ensamblar los fragm entos de clonación V de TRB y C de TRB dados en una cadena principal del vector de entrada V-C dada para crear un vector de entrada V-C de TRB es idéntico al descrito en el Ejemplo 1. La cadena principal del vector de entrada V-C utilizada, diseñada para la expresión transitoria de ORF de t Ra o TRB de longitud completa en células de mamífero, se utiliza en el presente ejemplo y en el ejemplo 1 (SEQ0048).

La secuencia de los fragmentos V-C clonados que componen la genoteca del vector de entrada V-C de TRA se presenta como SEQ0484 a SEQ0577.

Diseño y ensamblado de una genoteca de vectores de donantes J de TRB para un repertorio de TRB humana nativa En el presente ejemplo, el diseño y ensamblado de una genoteca de vectores donantes J de TRB que contiene el repertorio de secuencias V-C de TRB humanas nativas. Este es un ejemplo del Tipo de vector donante J genérico representado en la Figura 3.

En el presente ejemplo, un fragmento del casete de recepción J de TRB se construye y se inserta en la cadena principal del vector donante J para crear un vector del casete de recepción J de TRB. Posteriormente, una parte sintética de segmento J de TRB puede ensamblarse en un vector del casete de recepción J de TRB para crear la genoteca de vectores donantes J de TRB. Este método flexible de ensamblado multietapa permite un diseño rápido y económico de las características del segmento donante J, tales como variaciones en la longitud del segmento J.

Este procedimiento sigue el mismo patrón que el ensamblado del vector donante J de TRA descrito en el Ejemplo 2. Sin embargo, cabe señalar que dado que los fragmentos del casete de recepción J contienen partes del segmento C, los fragmentos del casete de recepción de J de TRA y J de TRB difieren con respecto a la secuencia de la parte C, que debe corresponder a los segmentos génicos C respectivos. Además, a diferencia del escenario para J de TRA que solo requiere un único fragmento del casete de recepción J, el J de TRB requiere dos fragmentos distintos del casete de recepción J para dar cuenta del uso de segmentos de C1 y C2 alternativos. Los componentes de ADN necesarios para una genoteca de vectores donantes J de TRB son:

I. Fragmento del casete de recepción J de C1 de TRB o J de C2 de TRB

II. Cadena principal del vector donante J

III. Vector de casete de recepción J de C1 de TRB o J de C2 de TRB

IV. Parte del segmento J de TRB

Diseño del fragmento sintético del casete de recepción J de TRA

El anillado de dos oligonucleótidos de ADN monocatenarios se utiliza para generar los fragmentos del casete receptor, que contienen salientes monocatenarios de 4 nucleótidos en cada extremo del fragmento de ADN, representado en la Figura 8. Los salientes de 4 nucleótidos permiten la clonación dirigida dependiente de ligasa en una cadena principal del vector donante J para crear el vector del casete de recepción J de TRB.

Los dos fragmentos del casete receptor necesarios para el uso alternativo de los segmentos C1 y C2 se presentan como SEQ0578 y SEQ0581. Para cada fragmento se proporcionan las secuencias de oligonucleótidos directa (F1) e inversa (R1).

Método para ensamblar los vectores de casete de recepción J de TRB

El método para ensamblar los vectores del casete de recepción J de TRB es idéntico al del método para ensamblar los vectores del casete de recepción J de TRA descrito en el Ejemplo 2. Se utiliza la misma cadena principal del vector donante J (SEQ0097) para generar dos vectores del casete de recepción J de TRB, conteniendo cada uno contiene una parte de C1 o C2 que corresponde a los segmentos C alternativos del locus de TRB.

Los dos vectores de casete de recepción de J de TRB resultantes se utilizan para insertar partes del segmento J de TRB para construir vectores de donante J de TRB .

Los vectores del casete de recepción J de TRB resultantes se presentan como SEQ0582 y SEQ0583.

Diseño de partes sintéticas de segmentos J de TRB

Las partes de los segmentos J de TRB se construyen mediante el anillado de dos oligonucleótidos de ADN monocatenarios diseñados para contener salientes monocatenarios de 4 nucleótidos en cada extremo del fragmento de ADN. La disposición de esta parte y método de ensamblado son idénticos a los de las partes del segmento J de TRA, y se representan en la Figura 11.

En el caso de la parte de segmento J de TRB corto , codifica para todos los aminoácidos desde el inicio del codón de Phe del límite de CDR3-J. La CDR3 se define como la secuencia flanqueada por la Cys conservada en el extremo C de la región V y la Phe en la región J que forma parte del motivo Phe-Gly conservado para todos los segmentos J de TRB nativos. Este motivo Phe-Gly conservado se utiliza para estandarizar los salientes en 5' de los fragmentos J de TRB hasta TTTG para la reconstitución del TRA posterior. A diferencia de los segmentos J de TRA, no hay excepciones a este saliente estandarizado en las partes de los segmentos J de TRA del presente ejemplo.

Se añade una adenina a ambas partes del segmento J de TRB corto y largo , representada como bloque A en la Figura 11, al extremo 3' de cada parte de segmento J de TRB. Esta adenina representa el primer nucleótido del fragmento C de TRB que se excluye de los casetes de recepción J de TRB.

Las secuencias de las partes cortas de los segmentos J de TRB del presente ejemplo de segmentos J humanos nativos se presentan como SEQ0584 a SEQ0609 y las partes largas de los segmentos J de TRB como SEQ0610 a SEQ0635. En ambos casos se especifican las secuencias de oligonucleótidos directa (F1) e inversa (R1).

Método para ensamblar la genoteca de vectores de donante J de TRB corto o largo

El procedimiento para ensamblar las genotecas donantes J de TRB es idéntico al de las genotecas TRA descritas en el Ejemplo 2. Sin embargo, en el caso de las genotecas de TRB, deben generarse cuatro genotecas, a diferencia de las genotecas cortas y largas para los segmentos del locus de TRA.

En el caso de genotecas de TRB, puede construirse cada genoteca corta y larga para contener cada uno de los segmentos alternativos de C C1 y C2, lo que da como resultado cuatro subconjuntos dentro de la genoteca donante J de TRB.

I. Parte corta de segmento J de TRB o parte larga de segmento J de TRB

II. Vector de casete de recepción J de C1 de TRB o J de C2 de TRB

Siguiendo el mismo procedimiento que se describe en el Ejemplo 2, se generan los cuatro subconjuntos resultantes dentro de la genoteca donante de J de TRB. Se presenta la secuencia de las genotecas resultantes, que excluye la secuencia de la cadena principal fuera de los sitios de reconocimiento Bsal.

Genoteca de donantes J cortos C1 de TRB presentada como SEQ0636 a SEQ0648

Genoteca de donantes J cortos C2 de TRB presentada como SEQ0649 a SEQ0661

Genoteca de donantes J largos C1 de TRB presentada como SEQ0662 a SEQ0674

Genoteca de donantes J largos C2 de TRB presentada como SEQ0675 a SEQ0687

Ejemplo 4

Diseño de vectores de entrada V-C de TRA y TRB para aplicación de intercambio de casetes mediada por recombinasa

El diseño de los vectores de entrada V-C de TRA y TRB en los Ejemplos 1 y 3, respectivamente, es tal que los TCR de longitud completa reconstituidos utilizando estos TORES para cada cadena TCR pueden aplicarse directamente a la expresión transitoria en células de mamífero mediante transfección. El diseño general del TORES permite que la cadena principal del vector de entrada V-C se intercambie por cualquier cadena principal adecuada para aplicaciones posteriores, y las genotecas necesarias del vector de entrada V-C se ensamblen rápidamente a partir de fragmentos de clonación V y C.

En el presente ejemplo, se utiliza un par de cadenas principales heteroespecíficas del vector de entrada V-C FRT para ensamblar genotecas del vector de entrada V-C de TRA y TRB. Cada genoteca de vectores de entrada V-C de TRA y TRB se construye con cadenas principales de vectores que contienen secuencias diana de reconocimiento de flipasa (FRT) distintas. Una aplicación posterior de dichos vectores es la presentación de pares de TRA y TRB reconstituidos finales para una integración genómica rápida en células de mamífero que contienen sitios FRT relevantes.

En el presente ejemplo, el vector de entrada V-C de TRA del diseño representado en la Figura 7 contiene secuencias FRT, F14 y F15, como elementos genéticos 5' y 3', respectivamente. Esta secuencia de cadena principal del vector de entrada V-C de F14/F15 se presenta como SEQ0688.

Esta cadena principal se utilizó para construir la genoteca de entrada V-C de TRA del diseño descrito en la Figura 2, utilizando fragmentos de clonación V de TRA (SEQ0001 a SEQ0046) y el fragmento de clonación C de TRA (SEQ0047) utilizando los métodos descritos en el Ejemplo 1. Esta construcción produjo una genoteca de entrada V-C de TRA con secuencias idénticas a las de la genoteca de vectores de entrada V-C de TRA de expresión transitoria (SEQ0049 a SEQ0094), pero flanqueada por las secuencias FRT en el contexto de la cadena principal del vector de entrada V-C F14/F15.

En el presente ejemplo, el vector de entrada V-C de TRB del diseño representado en la Figura 7 contiene secuencias FRT, y FRT F3, como elementos genéticos 5' y 3', respectivamente. Esta secuencia de cadena principal del vector de entrada V-C de FRT/F3 se presenta como SEQ0689.

Esta cadena principal se utilizó para construir la genoteca de entrada V-C de TRB del diseño descrito en la Figura 2, utilizando fragmentos de clonación V de TRB (SEQ0435 a SEQ0481) y los fragmentos de clonación C de TRB (SEQ0482 y SEQ0483) utilizando los métodos descritos en el Ejemplo 3. Esta construcción produjo una genoteca de entrada V-C de TRB con secuencias idénticas a las de la genoteca de vectores de entrada V-C de TRB de expresión transitoria (SEQ0484 a SEQ0577), pero flanqueada por las secuencias FRT en el contexto de la cadena principal del vector de entrada V-C FRT/F3.

De forma general, los vectores de entrada V-C de TRA y TRB del presente ejemplo pueden utilizarse indistintamente con vectores de entrada V-C de los ejemplos anteriores. En cada caso, el vector donante J permanece sin cambios, al igual que el diseño y la provisión de odeCDR3 (véase el Ejemplo 6). En efecto, diferentes cadenas principales del vector de entrada V-C proporcionan los ORF del TCR de longitud completa en contextos de vector deseados para aplicaciones posteriores como un producto directo de la reacción de reconstitución del TCR.

Ejemplo 5

Diseño de vectores de entrada V-C y vectores donantes J adecuados para proporcionar cualquier combinación V-J-C

En los ejemplos anteriores de vectores de entrada V-C y vectores donantes J, se utilizan cadenas TRA y TRC del TCR humanas nativas como demostración práctica del TORES. Sin embargo, está claro que cualquier cadena TCR nativa o no nativa puede utilizarse en el formato TORES en la inserción de las secuencias de cadena TCR necesarias en los formatos de vector especificados.

Para lograr un TORES para cualquier cadena de TCR dada, se requieren cuatro elementos de secuencia específicos para dicha cadena del TCR:

X - un fragmento de segmento génico variable (V)

Y - un fragmento de segmento génico constante (C)

Y '- parte de un segmento génico constante (C)

Z - un fragmento de segmento génico de unión (J)

Según los ejemplos anteriores, estas cuatro formas de elementos de secuencia pueden ensamblarse en varios contextos vectoriales para construir y desplegar un TORES para cualquier combinación V-J-C dada para cualquier cadena TCR dada. Por ejemplo, sistemas para el locus de TRG y t Rd humanos nativos, formas de cadena del TCR variantes sintéticos o formas de cadena del TCR nativas de un organismo distinto al humano.

Ensamblado del vector de entrada V-C y construcción final

Para lograr el ensamblado del vector de entrada V-C, pueden construirse dos intermedios que contengan los fragmentos de segmentos génicos V y C relevantes.

Un fragmento de clonación V, según la Figura 5, está diseñado para contener el fragmento de segmento génico V necesario en el contexto de sitios de clonación adecuados para el ensamblado final del vector de entrada V-C. En el presente ejemplo, como también se presenta en los Ejemplos 1,3 y 4, el ensamblado de vectores de entrada V-C se logró utilizando sitios de enzimas de restricción Bbsl para crear salientes diana en los extremos 5' y 3' para coincidir con salientes complementarios en la cadena principal del vector de entrada V-C y el fragmento de clonación C, respectivamente. La estrategia ilustrada incorpora también un sitio de restricción de la enzima Notl como marcador de selección negativa.

La secuencia genérica de tal enfoque de clonación se presenta como SEC-0690, en donde el fragmento del segmento génico V está delimitado por sitios Bbsl en los extremos 5' y 3', y el fragmento del segmento génico V se designa como XNn, en donde X es la designación del segmento génico V, N representa cualquier nucleótido y n representa el número de nucleótidos en dicha secuencia. El fragmento del segmento génico V está unido por Kozac y nucleótidos espaciadores en los extremos 5' y 3', respectivamente, e incluye el codón de inicio de traducción.

El segundo intermedio que puede construirse para ensamblar genotecas de vectores de entrada V-C para secuencias de cadena de TCR específicas es el fragmento de clonación C, como se representa en la Figura 6. En el presente ejemplo, como también se presenta en los Ejemplos 1, 3 y 4, el ensamblado de vectores de entrada V-C se logró utilizando sitios de enzimas de restricción Bbsl para crear salientes diana en los extremos 5' y 3' para coincidir con salientes complementarios en el fragmento de clonación V y la cadena principal del vector de entrada V-C, respectivamente. La estrategia ilustrada también incorpora un sitio de restricción de la enzima Notl como marcador de selección negativa.

La secuencia genérica de dicho enfoque de clonación se presenta como SEC-0691, en donde el fragmento del segmento génico C está delimitado por sitios Bbsl en los extremos 5' y 3', y el fragmento del segmento génico C se designa como YNn, en donde Y es la designación del segmento génico C, N representa cualquier nucleótido y n representa el número de nucleótidos en dicha secuencia. El fragmento del segmento génico C está unido por la citosina 5' del primer codón Glu del segmento génico C, o sitio conservado equivalente, y los nucleótido(s) separador(es) en los extremos 5' y 3', respectivamente, e incluiría el codón de terminación de traducción.

Para ensamblar un vector de entrada V-C utilizando los fragmentos de clonación V y C definidos anteriormente, estos fragmentos se combinan con una cadena principal del vector de entrada V-C como se representa en la Figura 7 y se describe en los Ejemplos 1 y 3. En el ejemplo presente y en los anteriores, esta cadena principal se define con los sitios de unión de enzimas de restricción Acc65I y Xbal que generan el saliente *1' y el saliente *2', respectivamente. El Saliente*1' es complementario del Saliente*1 dentro del fragmento de clonación V (Figura 5). El Saliente*2' es complementario del Saliente*2 dentro del fragmento de clonación C (Figura 6). Estos salientes complementarios permiten la clonación dirigida de los fragmentos de clonación V y C en la cadena principal del vector de entrada V-C.

Como se ha descrito en el Ejemplo 4, una cadena principal del vector de entrada V-C (Figura 7), mediante la provisión de los elementos genéticos 5' y 3' al vector de entrada V-C (Figura 2), proporciona en última instancia el contexto del vector en el que se reconstituye un ORF del TCR de longitud completa (Figura 4h). Por lo tanto, puede hacerse una gama de selecciones para la cadena principal del vector de entrada V-C/vector de entrada V-C que satisfaga una gama de aplicaciones posteriores para el ORF del TCR reconstituido.

En el presente ejemplo, como en los ejemplos 1, 3 y 4 anteriores, se proporcionan tres cadenas principales distintas del vector de entrada V-C.

La secuencia de la cadena principal del vector de entrada V-C con el elemento genético 5' que codifica el promotor constitutivo del CMV hasta el elemento genético 3' que codifica la señal de poliadenilación de SV40pA se presenta como SEQ0048. Este contexto del vector permite la expresión transitoria de los ORF del TCR reconstituido en células de mamífero.

Cuando esta cadena principal del vector de entrada V-C de expresión transitoria SEQ0048 se combina con el fragmento de clonación V genérico (SEQ0690) y el fragmento de clonación C (SEQ0691) en el presente ejemplo, la secuencia SEQ0692 puede definir un vector de entrada V-C generalizado.

La secuencia de la cadena principal del vector de entrada V-C con el elemento genético 5' que codifica el sitio FTR, F14, la secuencia y el elemento genético 3' que codifica el sitio FRT, F15, se presenta como SEQ0688. Este contexto de vector permite el intercambio de casete mediado por flipasa en los ORF del TCR reconstituido en contextos genéticos limitados por sitios FRT heteroespecíficos F14 y F15. Por ejemplo, dicho enfoque puede emplearse para la integración estable de los ORF del TCR en líneas celulares de mamífero que contienen dichos sitios receptores FRT heteroespecíficos.

Cuando esta cadena principal del vector de entrada V-C F14/F15 RCME de expresión transitoria SEQ0688 se combina con el fragmento de clonación V genérico (SEQ0690) y el fragmento de clonación C (SEQ0691) en el presente ejemplo, la secuencia SEQ0693 puede definir un vector de entrada V-C generalizado.

La secuencia de una segunda cadena principal del vector de entrada V-C con el elemento genético 5' que codifica el sitio FRT, la secuencia FRT, y el elemento genético 3' que codifica el sitio FRT, F3, se presenta como SEQ0689. Este contexto de vector permite el intercambio de casete mediado por flipasa en los ORF del TCR reconstituido en contextos genéticos limitados por sitios FRT heteroespecíficos FRT y F3. Por ejemplo, dicho enfoque puede emplearse para la integración estable de los ORF del TCR en líneas celulares de mamífero que contienen dichos sitios receptores FRT heteroespecíficos.

Cuando esta cadena principal del vector de entrada V-C FRT/F3 RCME de expresión transitoria SEQ0689 se combina con el fragmento de clonación V genérico (SEQ0691) y el fragmento de clonación C (SEQ0692) en el presente ejemplo, la secuencia SEQ0694 puede definir un vector de entrada V-C generalizado.

En el presente ejemplo, una cadena TCR puede reconstituirse en uno de los dos contextos RCME, y una segunda cadena en el otro contexto RCME. Por ejemplo, un ORF de TRA puede reconstituirse en el contexto de F14/F15, y un ORF de TRB puede reconstituirse en el contexto de FRT/F3. Por lo tanto, las construcciones TRA/TRB emparejadas pueden integrarse en una línea celular de mamífero que contiene sitios F14/F15 y FRT/F3 por RCME para la expresión estable del par TRA/TRB en dicha línea celular.

Ensamblado del vector donante J y construcción final

Se han descrito anteriormente construcciones genéricas que se pueden utilizar para ensamblar varias combinaciones de segmentos génicos V y C del TCR en vectores de entrada V-C como componentes de un TORES.

Para completar un TORES se requieren vectores donantes J adecuados. Como se ha descrito anteriormente en el Ejemplo 2, un vector donante J puede ensamblarse en un proceso multietapa para lograr un sistema donante J con flexibilidad para diseñar características de segmentos J. Un aspecto importante a destacar es que el vector donante J aporta una parte C que corresponde al segmento C de una genoteca de vectores de entrada V-C coincidentes.

Para ensamblar una genoteca de vectores donantes J, se necesitan cuatro construcciones distintas;

I. Fragmento del casete de recepción J

II. Cadena principal del vector donante J

III. Vector del casete de recepción J

IV. Parte del segmento J

En el presente ejemplo, como en el Ejemplo 2, el vector donante J se ensambla utilizando sitios de restricción Bbsl, y el TORES general funciona utilizando sitios de restricción Bsal incluidos tanto en el vector donante J resultante como en el vector de entrada V-C coincidente.

Cabe señalar que el fragmento del casete de recepción J como se representa en la Figura 8 contiene una parte C correspondiente al segmento C aportado por la genoteca de vector donante V-C coincidente. La secuencia genérica de ese enfoque de clonación se presenta como SEQ0695 a SEQ0696, en donde la parte C que codifica una parte 5' del segmento C está limitada por un sitio de reconocimiento Bbsl al 5' y un sitio Bsal al 3'. Las dos secuencias presentadas representan los oligonucleótidos sentido y antisentido anillados para generar el fragmento del casete de recepción J, en donde las secuencias Y' proporcionadas son complementarias. La parte C en la secuencia presentada se designa Y'Nn, en donde Y' es la designación de la parte C que coincide con el segmento Y C descrito anteriormente, N representa cualquier nucleótido y n representa el número de nucleótidos en dicha secuencia. El sitio Bbsl está separado y orientado para cortar en dirección 3' y crear un saliente de clonación que coincida con una parte del segmento J a insertar. El sitio Bsal está separado y corta en dirección 5' para crear el saliente C en la reacción de ensamblado final para generar los ORF del TCR de longitud completa durante la actuación del TORES. También se utiliza en la operación final del TORES un segundo sitio Bsal en el extremo 5' del fragmento del casete de recepción J, cortado en la dirección 3' El corte del sitio interno de Bbsl en la dirección 5' crea el segundo saliente de clonación para el ensamblado del vector donante J. En el presente ejemplo, hay codificado un sitio de restricción de Notl separado entre los sitios de reconocimiento de Bbsl para actuar como marcador de selección negativa para eliminar los fragmentos precursores del proceso de ensamblado del vector donante J. El fragmento de recepción J se ensambla por anillado de dos oligonucleótidos complementarios diseñados para producir dos salientes monocatenarios de 4 nucleótidos, designados como saliente*3 en el extremo 5' y saliente*4 en el extremo 3', como se describe en el Ejemplo 2.

Para ensamblar el vector intermedio del casete de recepción J con el fragmento del casete de recepción J descrito anteriormente debe crearse una cadena principal donante J, como se ilustra en la Figura 9. En el presente ejemplo, las características de clonación de esta cadena principal del vector son sitios de restricción EcoRI y Xol separados para permitir una acción enzimática de restricción eficiente. La digestión de esta cadena principal con EcoRI y Xol genera el saliente*3' y el saliente*4' complementarios del saliente*3 y el saliente*4 en el fragmento de casete de recepción J ensamblado. Esto permite la clonación direccional del fragmento del casete de recepción J en la cadena principal donante J para crear el vector del casete de recepción J como se describe en el Ejemplo 2. Un ejemplo de la cadena principal del vector donante J con un marcador de selección positiva diferente del que tiene el vector de entrada V-C descrito anteriormente se presenta como SEQ0097.

El vector del casete de recepción J obtenido anteriormente se representa en la Figura 10, y esencialmente ilustra el fragmento del casete de recepción J en el contexto de la cadena principal del vector donante J, y se presenta como SEQ0697, en donde Y' es la designación de la parte C que coincide con el segmento C que se denomina Y que se ha descrito anteriormente, N representa cualquier nucleótido y n representa el número de nucleótidos en esa secuencia.

Dentro del vector del casete de recepción J se inserta una matriz de segmentos J para construir una genoteca de vectores donantes J. El diseño del segmento génico J se representa en la Figura 11, en donde un segmento génico J está limitado por el saliente*5' y el saliente*6' en los extremos 5' y 3', respectivamente. La parte del segmento J está separada del saliente 3' por un único nucleótido de adenina en el presente ejemplo, para mantener las secuencias de reconocimiento de enzimas y el marco de lectura correcto cuando se inserta la parte del segmento J en el vector del casete de recepción J para crear un vector donante J, como se describe en el Ejemplo 2. En el presente ejemplo, una secuencia genérica para la parte del segmento J se presenta como SEQ0698 a SEQ0699, en donde la parte del segmento J del gen se designa como ZNn, en donde Z es la designación del segmento J del gen, N representa cualquier nucleótido y n representa el número de nucleótidos en dicha secuencia. Las dos secuencias presentadas representan oligonucleótidos sentido y antisentido anillados para ensamblar la parte del segmento J, en donde las secuencias Z son complementarias.

El vector donante J genérico final obtenido en el presente ejemplo se presenta como SEQ0700, cuya representación se presenta en la Figura 3. Este vector donante J en el presente ejemplo representa una parte del segmento J insertada y la parte C procedente del vector del casete de recepción J. La secuencia se presenta con dos inserciones de secuencias anotadas de ZNn e Y'Nn, en donde Z es la designación del segmento génico J, e Y' es la designación de la parte del segmento C, N representa cualquier nucleótido, y n representa el número de nucleótidos en dichas secuencias.

Dentro de todas las secuencias proporcionadas, la selección de nucleótidos tuvo en cuenta el impacto potencial de la metilación de DAM en los sitios de unión a Bsal. Se eliminaron todas las secuencias de reconocimiento adicionales para el ensamblado y las enzimas de selección dentro de los vectores. También deberá eliminarse cualquiera de tales secuencias de reconocimiento de la línea germinal o de los elementos V, J y C sintéticos del TCR insertados en el fragmento y contextos de vector descritos.

Ejemplo 6

Diseño y generación del dúplex de oligonucleótidos que codifica para CDR3 (odeCDR3)

En el ejemplo anterior se describen varios formatos de TORES en el diseño y generación de genotecas de vectores de entrada V-C y vectores donantes J coincidentes para diversas aplicaciones. El uso de estas genotecas de vectores de entrada V-C y vectores donantes J para la reconstitución en una sola etapa de marcos de lectura abiertos de TCR de longitud completa requiere la provisión de un dúplex de oligonucleótidos que codifique la construcción CDR3 (odeCDR3) para completar la secuencia diana de la cadena del TCR de longitud completa (Figura 4C). Una vez generadas las genotecas del vector de entrada V-C y vectores donantes J, estos vectores representan los elementos de reserva a los que se puede recurrir indefinidamente para seleccionar las combinaciones V-J-C deseadas de las secuencias de las cadenas del TCR de longitud completa diana. Sin embargo, el odeCDR3 representa una secuencia corta única específica del ORF del TCR de longitud completa diana.

El presente ejemplo describe el diseño y la generación de odeCDR3 para su uso en las plataformas de vectores nativos de TRA y TRB humanos.

Diseño del odeCDR3 de TRA

La hibridación de dos oligonucleótidos de ADN monocatenarios genera un odeCDR3 que contiene salientes monocatenarios de 4 nucleótidos en cada extremo del fragmento de ADN, como se ilustra en la Figura 4c. Los salientes de 4 nucleótidos se diseñan para permitir la clonación dirigida dependiente de ligasa al extremo 3' del segmento V de TRA codificado en el vector de entrada, (saliente $1-5') y al extremo 5' del fragmento J de TRA durante la reconstitución de TRA (saliente $2-3'). El Saliente $1-5' se estandariza a CTGC, complementario añ Saliente $1-5 estandarizado codificado en el segmento V del vector de entrada V-C de TRA. En el caso del saliente $2-3', este puede tomar dos formas de secuencia, determinadas por la divergencia de secuencias entre los segmentos J del locus de TRA humano. Para los segmentos J de TRA humanos nativos TRAJ33 y TRAJ38, el Saliente $2-3' se estandariza a TGGG, complementario al Saliente $2-3 codificado en el vector donante J de estos dos segmentos J. Para el resto de segmentos J de TRA humanos el Saliente $2-3' se estandariza a TTTG, complementario al Saliente $2-3 codificado en el vector donante J de estos segmentos J (véase el Ejemplo 2).

Diseño del odeCDR3 de TRB

En cuanto al odeCDR3 de TRB, el anillado de dos oligonucleótidos de ADN monocatenarios genera un odeCDR3 que contiene salientes monocatenarios de 4 nucleótidos en cada extremo del fragmento de ADN, como se representa en la Figura 4c. Los salientes de 4 nucleótidos están diseñados para permitir la clonación dirigida dependiente de ligasa al extremo 3' del segmento V de TRB codificado en el vector de entrada, saliente 1-5', y al extremo 5' del fragmento J de TRB durante la reconstitución de TRB saliente 2-3'. El saliente 1-5' se estandariza a TTGC, complementario alsaliente 1-5 estandarizado codificado en el segmento V de los vectores de entrada V-C de TRB. A diferencia del odeCDR3 de TRA, en donde se necesitan dos formas alternativas del Saliente 2-3, para el odeCDR3 de TRB el Saliente 2-3 se estandariza a TTTG, complementario al Saliente 2 3 codificado en el vector donante J de todos los segmentos J de TRB (véase el Ejemplo 3).

Diseño general del odeCDR3

De forma general, el diseño de odeCDR3 debe hacer que los salientes coincidan con los salientes de 4 nucleótidos diseñados para permitir la clonación dirigida dependiente de ligasa al extremo 3' del segmento V codificado en el vector de entrada (Saliente 1-5') y al extremo 5' del fragmento J durante la reconstitución, (Saliente 2-3').

Método para generar el dúplex de oligonucleótidos de ADN de CDR3 fosforilado

Fosforilación y anillado de dos oligonucleótidos para formar el odeCDR3

Mezcla de reacción

Oligonucleótido (cadena sentido) (100 gM) 1 gl

Oligonucleótido (cadena antisentido) (100 gM) 1 gl

Tampón de ligasa de T4 10x 1 gl

T4 PNK 1 gl

H²O 6 gl

Condiciones de reacción

Incubar a 37 0C durante 1 hora

Desnaturalizar a 95 0C durante 5 min

Anillar los oligonucleótidos sentido y antisentido enfriando lentamente la reacción a 25 0C a 3 0C por min

Ejemplo 7

Reconstitución del ORF de longitud completa de TRA y TRB a partir de genotecas de los vectores donantes J y de entrada V-C respectivas

Ejemplo JG9a/b.

Este ejemplo describe las etapas utilizadas para definir los componentes de la genoteca de vectores y odeCDR3 necesarios para reconstituir los ORF del TCR de longitud completa de TRA y TRB dada la información de secuencia de los TCR diana. El presente ejemplo también demuestra el proceso de ensamblado del par de cadenas de TRA y TRB del TCR modelo de longitud completa, y confirma su especificidad mediante la expresión transitoria en un modelo de células humanas, y la tinción del TCR presentado en la superficie con reactivo multímero HLA-específico.

Selección del vector de entrada V-C, vector donante J y odeCDR3

Las secuencias de todos los fragmentos posibles de la línea germinal que se representan en la genoteca de clonación se alinean con las secuencias t Ra o TRB de interés. Los fragmentos génicos con la identidad más alta con la secuencia TRA o TRB determinan qué elemento genético V, J y C constituirán las secuencias de clonotipo de TRA o TRB deseadas. Para TRA, el vector de entrada V-C apropiado se selecciona según la determinación del uso de V de la TRA deseada. Para TRB, cuando la cobertura de secuencias es suficiente para determinar el uso de V y C, se seleccionará el vector de entrada de V-C adecuado que corresponda al uso de V del clonotipo de TRB deseado, además de si dicho clonotipo utiliza TRBC1 o TRBC2.

Cuando la versión tanto corta como larga del elemento genético J de TRA o J de TRB específico se alinean con la secuencia TRA y TRB, respectivamente, se utilizarán los plásmidos correspondientes que codifican los elementos genéticos más largos para la reconstrucción de TRA.

La secuencia odeCDR3 necesaria para sintetizar TRA se determina como la región entre el extremo 3' del fragmento genético V de TRA alineado y el extremo 5' del fragmento genético TRAJ alineado. La cadena sentido del oligonucleótido requiere el saliente adicional de 4 nucleótidos 5', el saliente $1-5', CTGC que es universal respecto al saliente generado en el vector de entrada V de TRA cuando se digiere con Bsal, el saliente $ 1-3 '. La cadena antisentido del oligonucleótido complementario requiere el saliente de 4 nucleótidos adicional en 5', el saliente $2-3', que es único para el saliente específicamente para el vector TRAJ añadido a la reacción de reconstrucción de TRA, el saliente $2-5'.

La secuencia CDR3 necesaria para sintetizar TRB se determina como la región entre el extremo 3' del fragmento genético V de TRB alineado y el extremo 5' del fragmento genético J de TRB alineado. La cadena sentido del oligonucleótido requiere el saliente adicional de 4 nucleótidos en 5', el saliente $1-5', TTGC que es universal respecto del saliente generado en el vector de entrada V de TRB cuando se digiere con Bsal, el saliente $1-3'. La cadena antisentido del oligonucleótido complementario requiere el saliente de 4 nucleótidos adicional en 5', el saliente $2-3', que es único para el saliente específicamente para el J vector TRB añadido a la reacción de reconstrucción de TCR, el saliente $2-5'.

En el presente ejemplo, se utiliza un par de TRA/TRB del TCR modelo con una especificidad conocida para un antígeno restringido por HLA-A2*01. Las secuencias de las cadenas TRA y TRB se presentan como SEQ701 y SEQ702, respectivamente.

Basándose en esta secuencia de longitud completa, fue sencillo seleccionar los vectores de entrada V-C y donantes J adecuados y partir de las genotecas de TRA y TRB. En el presente ejemplo, se utilizó el vector de entrada V-C del Tipo de expresión transitoria, es decir, con la cadena principal presentada como SEQ0048.

En el presente ejemplo se seleccionaron el vector de entrada V-C de TRA SEQ0088 (de la lista 0049 a 0094) y el vector donante J SEQ0371 (de la lista 0323 a 0378).

En el presente ejemplo se seleccionaron el vector de entrada V-C de TRB SEQ0563 (de la lista 0484 a 0577) y el vector donante J SEQ0637 (de la lista 0636 a 0687).

El odeCDR3 sintetizado para la cadena TRA se presenta en SEQ703 y SEQ704 como sentido y antisentido, respectivamente.

El odeCDR3 sintetizado para la cadena TRB se presenta en SEQ705 y SEQ706 como sentido y antisentido, respectivamente.

Método para la reconstitución de longitud completa

Para cada uno de los componentes TRA y TRB seleccionados anteriormente, se realizaron ciclos de reacción con enzima de restricción/ligasa como se describe a continuación.

Reacción de digestión y ligación de RE

Vector de entrada V-C 100 ng

Vector donante J 60 ng

dúplex de oligonucleótidos odeCDR3 (0,5 pM) 2 pl

Tampón de ligasa de T4 10x 2 pl

Bsal 0,5 pl

ADN-ligasa de T4 0,5 pl

H²O hasta 20 pl

Condiciones de reacción

Etapa 1; 2 minutos a 37 0C

Etapa 2; 3 min a 16 0C

Repetir las etapas 1 y 2, 20 veces

5 min a 50 0C

5 min a 80 0C

Volver a la temperatura ambiente

Añadir 0,5 pl de enzima Notl y se incuba durante 30 min a 37 0C

El producto de reacción resultante se transformó en células E. coli competentes y se sembró en placas que contenían carbenicilina.

Se realizó el análisis y secuenciación de colonias resistentes a carbenicilina para determinar las construcciones ensambladas correctamente. El análisis de colonias se realizó mediante digestión diagnóstica con enzimas de restricción del ADN plasmídico aislado, y los tamaños esperados de los fragmentos de ADN se observaron mediante electroforesis de a Dn . Las construcciones resultantes codifican las secuencias de clones de TCR alfa y beta de longitud completa.

Validación de los vectores TRA y TRB reconstituidos.

Para verificar la especificidad del par TRA/TRB del TCR reconstituido anterior, ambas construcciones se transfectaron transitoriamente en una línea celular que expresa todos los componentes de CD3, pero que carece de expresión de TRA y TRB. Este análisis se presenta en la Figura 12, en donde el TCR reconstituido se transfecta junto con un TCR irrelevante y un control de vector vacío. El vector vacío no muestra tinción de superficie con anticuerpos para TCRalfa/beta ni CD3, ni tampoco se tiñen estas células de control con el reactivo del tetrámero HLA-A2*01-NLVPMVATV (Figura 12, paneles de la derecha). La expresión del TCR es necesaria para la presentación superficial del complejo CD3. El TCR irrelevante produce tinción positiva para TCRalfa/beta y CD3, pero no muestra tinción para el reactivo del tetrámero HLA-A2*01-NLVPMVATV (Figura 12, paneles centrales). Esto indica que un TCR se expresa en la superficie celular, pero no es específico del antígeno diana cargado en el reactivo tetramérico HLA-A2*01. El TCR diana produce tinción positiva para TCRalfa/beta y CD3, y también muestra una tinción positiva para el reactivo del tetrámero HLA-A2*01-NLVPMVATV (paneles más a la izquierda). Esto indica que el TCR reconstituido se presenta sobre la superficie celular y que también es específico del antígeno diana cargado en el reactivo tetramérico HLA-A2*01, como se espera.

Ejemplo 8

Reconstitución de un conjunto de pares de cadenas TRA/TRB del TCR específico de antígeno identificado a partir de sangre periférica humana

Uno de los requisitos clave de las próximas estrategias en el diagnóstico y terapia basados en TCR personalizados es la capacidad de capturar y caracterizar rápidamente pares de cadenas del TCR específicas de antígeno de los individuos. En el presente ejemplo, se lleva a cabo un flujo de trabajo en donde los pares de cadenas de TRA/TRB del TCR se amplifican y se secuencian a partir de linfocitos T individuales aislados de sangre humana periférica, seguido por la reconstitución y validación de estos pares a través de la expresión transitoria en células de mamífero.

Secuenciación y reconstitución de los pares de cadenas TRA y TRB

La Figura 13 presenta el flujo de trabajo general. En resumen, se recogió una muestra de PBMC reciente de un donante positivo para HLA-B*07:02, y se tiñó con un reactivo multímero HLA-B*07:02-TPRV. Este multímero HLA es el alelo HLA-B*07:02 cargado con un antígeno inmunodominante conocido del gen pp65 del CMVH, cuya secuencia peptídica completa es; TPRVTGGGAM. Las células positivas individuales para el multímero HLA-B*07:02-TPRV se clasificaron por FACS en tubos de PCR de 0,2 ml que contenían 5 pl de agua. Las muestras se congelaron rápidamente y se almacenaron a -80 0C hasta un procesamiento posterior (Figura 13 Etapa i).

Los aislados de una sola célula se sometieron a un proceso de amplificación en dos etapas que implica la recogida de cebadores específicos de la región V para cada TRA y TRB (Figura 13 etapa ii), seguido por reacciones de PCR anidadas emparejadas que crean amplicones de TRA y TRB (Figura 13 etapa iii) para el análisis de secuencias (Figura 13 etapa iv). Este procedimiento se ha descrito anteriormente (Han y col. Nat Biotechnol. 2014 32(7): 684 692).

En el presente ejemplo, 6 clones emparejados se presentan como ejemplo de procesamiento posterior. Las secuencias obtenidas se presentan como SEQ0707 a SEQ0718.

Estas secuencias se alinearon después respecto a la genoteca de segmentos génicos V, C y J según sus cadenas TRA y TRB correspondientes para determinar el uso de los segmentos V, C y J de cada cadena amplificada. Esta etapa de análisis de secuencias también permite la definición de la secuencia codificante CDR3 y, por lo tanto, la definición de la secuencia odeCDR3 (Figura 13 etapa v). Este análisis de secuencia permite la selección de vectores de entrada V-C (Figura 13 etapa vi) y vectores donantes J (Figura 13 etapa vii) para la reconstitución de cadenas del TCR. El análisis también permite la síntesis de odeCDR3 para cada reacción de reconstitución en cadena (Figura 13 etapa viii). Las selecciones y secuencias se resumen en la Tabla 1.

La tabla que sigue presenta un resumen de las ID secuencia para los pares TRA/TRB de TCR identificados en el ejemplo de secuenciación de novo y reconstitución

La selección de estos componentes permite el ensamblado de reacciones independientes de reacciones de ciclo con enzima de restricción/ligasa para cada cadena TRA y TRB para realizar la reconstitución de los ORF del TCR de longitud completa (Figura 13 etapa ix). Cada reacción se realiza como se ha descrito en el Ejemplo 7 anterior, que incluye la transformación y la selección con antibióticos y (Figura 13 etapa X), seguidamente propagación y confirmación de secuenciación de los ORF del TCR reconstituidos resultantes (Figura 13 etapa xi).

Validación de los pares de cadenas TRA y TRB

Para verificar la especificidad del conjunto de pares TRA/TRB del TCR reconstituidos anteriormente, las construcciones emparejadas se transfectaron transitoriamente en una línea celular que expresa todos los componentes CD3, pero que carece de la expresión de TRA y TRB, como se presenta en el ejemplo 7. Este análisis se presenta en la Figura 14. Las células se transfectaron con cada uno de los 6 pares de construcciones de ORF del TCR, en paralelo con un par de clones TRA/TRB irrelevantes y un vector vacío de control. Las células se analizaron por citometría de flujo después de la tinción con un anticuerpo contra CD3 y el reactivo del tetrámero HLA-B*07:02-TPRV utilizado inicialmente para aislar los linfocitos T individuales de la muestra de PBMC. Todas las construcciones emparejadas del presente ejemplo mostraron unión al reactivo del tetrámero HLA-B*07:02-TPRV diana, y se observan diferencias cuantitativas. El número insertado en cada cuadro representa la relación IFM de eventos celulares negativos para CD3 respecto de los positivos para CD3.

Ejemplo 9

Diversificación rápida de la cadena del TCR a través de la degeneración del odeCDR3

La diversificación y selección de los ORF del TCR es deseable para diseñar con ingeniería genética pares de cadenas de TCR con especificidades, afinidades y/o capacidad de señalización alteradas. El sistema TORES es adecuado para la generación rápida de colecciones de cadenas TCR que se alteran sistemáticamente respecto de la secuencia diana original. En el presente ejemplo se presenta un enfoque para diversificar un par de cadenas del TCR modelo mediante la inclusión de un odeCDR3 en una reacción de reconstitución con una degeneración de nucleótidos definida y limitada en posiciones seleccionadas del codón. Este enfoque se utilizó para diversificar la cadena TRA del par TRA/TRB de TCR modelo presentado en el Ejemplo 7. Esta diversificación de reacción única se muestra para producir un conjunto de TCR con una amplia gama de afinidades para un reactivo multímero específico de HLA cuando se presenta en la superficie de células de mamífero con su par de cadena de TRB natural. Este enfoque es idealmente adecuado para un diseño rápido del TCR por ingeniería genética utilizando los ORF del TCR de longitud completa que pueden presentarse y seleccionarse en un contexto funcional de células de mamífero viables.

Generación de la diversa colección de cadenas TRA

La Figura 15 presenta la estrategia general para generar una colección diversificada por secuencias de cadenas de TCR en una reacción única utilizando una mezcla de odeCDR3. Un único vector de entrada C-V y el vector donante J se seleccionan para representar los segmentos génicos V,J y C diana en el producto final del TCR de longitud completa (Figura 15, cuadro i y cuadro ii). Se genera una combinación de odeCDR3 con diversidad seleccionada, de forma que haya un número de secuencias de CDR3 distintas representadas en la combinación de odeCDR3 (Figura 15, Cuadro iii). Cuando todos los componentes se combinan en un ciclo de reacción con enzima de restricción/ligasa, el producto resultante es una colección de construcciones que contienen cadenas de TCR de longitud completa con uso definido de los segmentos génicos V,J C, y una diversidad definida en la región CDR3 (Figura 15, Cuadro iv). El número de cadenas del TCR de longitud completa diversificada en el producto final es directamente proporcional al número de variantes de odeCDR3 en la combinación inicial de odeCDR3 agregada a la reacción.

En el presente ejemplo, se utiliza un par TRA/TRB de TCR modelo con una especificidad conocida por un antígeno de citomegalovirus humano (CMVH) presentado en HLA-A2*01 (el mismo par que el Ejemplo 7). Este péptido antigénico se deriva de la proteína pp65 del CMVH, y la secuencia completa de aminoácidos del antígeno peptídico que se presenta en HLA-A2*01 es NLVPMVATV. Las secuencias de las cadenas TRA y TRB se presentan como SEQ701 y SEQ702, respectivamente.

En el presente ejemplo, la cadena TRA fue el objetivo de la diversificación de la secuencia, y esto se logró a través de la síntesis de oligos sentido y antisentido de odeCDR3 con degeneración de nucleótidos en 3 posiciones distintas, cada una alterando un codón independiente para dar lugar a la posibilidad de 4 aminoácidos distintos en cada uno de los tres codones. Los codones seleccionados para degeneración se separaron a través del bucle CDR3. Los oligonucleótidos de odeCDR3 se presentan como SEQ0743 y SEQ0744, en donde los codones degenerados se denotan como N.

Los oligonucleótidos de odeCDR3 se anillaron por el método descrito en el Ejemplo 6, con la degeneración de aminoácidos por 4 veces en 3 posiciones de codón independientes, dando como resultado un grupo de productos de odeCDR3 con 64 secuencias únicas, que incluyen la secuencia codificante original (es decir, SEQ0701).

odeCDR3 se utilizó para ensamblar los ORF del TRA de longitud completa siguiendo el método descrito en el Ejemplo 7 para crear 64 ORF del TRA únicos con una degeneración de aminoácidos por 4 veces en 3 posiciones distintas de codón. En el presente ejemplo, el odeCDR3 se sintetizó utilizando nucleótidos degenerados en las posiciones indicadas y, por lo tanto, la reconstitución se realizó en un solo tubo para generar las 64 variantes de cadena. El enfoque es igualmente válido donde se proporciona un único odeCDR3 a reacciones discretas en paralelo. Se prepararon todos los clones esperados y la secuencia se confirmó a partir de una sola reacción. Cada cadena TRA se preparó como un stock de plásmido separado para su caracterización posterior.

Caracterización de cadenas TRA diversificadas con un par de cadenas TRB

Para caracterizar la especificidad, cada una de las 64 cadenas TRA del TCR derivadas anteriormente se transfectaron simultáneamente con la cadena TRB (SEQ0702) en una línea celular que expresa todos los componentes CD3, pero que carece de expresión de TRA y TRB. Después, estas células se tiñeron con un anticuerpo contra CD3 y un reactivo multímero HLA-A2*01-NLVPMVATV, y se analizaron por citometría de flujo. Este análisis se presenta en la Figura 16.

Cada población transfectante se expresa como la relación de la intensidad media de fluorescencia (IFM) de la señal de CD3 positiva para el multímero HLA-A2*01-NLVPMVATV respecto de las poblaciones de CD3 negativas, y se representa gráficamente en un gráfico de dispersión clasificado en relación ascendente (Figura 16a). Es evidente que las cadenas de TRA diversificadas producen una gama de afinidades con el multímero HLA-A2*01-NLVPMVATV. La cadena alfa original se indica con una flecha. La mayoría de los clones diversificados mostraron una peor unión que el original. También se observa un número significativo de clones sin unión. Sorprendentemente, varios clones mostraron un aumento significativo en la tinción con el multímero de HLA-A2*01-NLVPMVATV (clones de afinidad elevada), que incluyen clones que mejoran la señal relativa en más de 3 veces. Los clones también se presentan como una tabla de rango ascendente de relación de IFM, especificando los aminoácidos presentados y las posiciones 1, 2 y 3 diversificadas (Figura 16b). Puede observarse que una Pro en posición 2 estabiliza mucho la unión con el multímero de HLA-A2*01 -NLVPMVATV, y en menor grado una Asp en la posición 3. Por el contrario, una His en la posición 3 suprime completamente la unión, salvo en presencia de Pro en la posición 2. Este sesgo de posición de las sustituciones de aminoácidos hacia la mayor y menor unión con el multímero HLA-A2*01-NLVPMVATV sugiere fuertemente una alteración genuina en la afinidad de unión en la degeneración de aminoácidos dirigida creada en la cadena TRA utilizando el TORES.

En general, este ejemplo demuestra que una mínima diversidad en el bucle CDR3 introducida en una sola etapa por degeneración de odeCDR3 dentro del TORES puede crear una colección de TCR con diversas características de unión hacia el complejo analito HLA-antígeno. Esto puede incorporarse directamente a los flujos de trabajo de maduración del TCR para generar TCR sintéticos con características alteradas en diversos escenarios de diseño del TCR, pero manteniendo el contexto natural de longitud completa de las cadenas del TCR junto con el uso de los segmentos génicos V,J y C nativos.

Ejemplo 10

Diversificación rápida de la cadena del TCR a través del barajado de segmentos V y J

La diversificación y selección de los ORF del TCR es deseable para diseñar por ingeniería genética pares de cadenas de TCR con especificidades, afinidades y/o capacidad de señalización alteradas. El sistema TORES es adecuado para la generación rápida de colecciones de cadenas TCR que se alteran sistemáticamente a partir de la secuencia diana original.

En el presente ejemplo se describe un enfoque de diversificación de cadenas del TCR, en donde se proporciona un único odeCDR3 a una reacción en cadena del TCR de longitud completa con múltiples vectores de entrada V-C, vectores donantes J o múltiplos tanto de vectores de entrada V-C como de vectores donantes J. Puede utilizarse un enfoque de ese tipo para diversificar una cadena de TCR dada utilizando segmentos V, J y C de la línea germinal natural, mientras se mantiene la posibilidad de llevar contactos centrales del CDR3 con el complejo de HLA-antígeno afín en cadenas TCR nuevas. Este enfoque es idealmente adecuado para un diseño rápido del TCR por ingeniería genética utilizando los ORF del TCR de longitud completa que pueden presentarse y seleccionarse en un contexto funcional de células de mamífero viables.

En la Figura 17 se presenta un ejemplo del uso del segmento génico V con barajado. Este ejemplo esquemático describe un enfoque para mantener un único uso de odeCDR3 y del vector donante J, donde la secuencia coincide con la cadena TCR parental, a la vez que proporciona una selección de segmentos génicos V mediante la provisión de varios vectores de entrada V-C a la reacción de reconstitución. En el caso de cadenas del TCR que tienen la oportunidad de utilizar múltiples segmentos génicos C (p. ej., TRB humano), esto también puede incluirse en el flujo de trabajo de diversificación. El producto de una reacción que contiene un único odeCRD3 y vector donante J, y una selección de vectores de entrada V-C, constará de varias cadenas del TCR de longitud completa que contengan la secuencia CDR3/J parental y cada uno de los segmentos génicos V (y/o C) proporcionados. Un enfoque de ese tipo es igualmente válido para lograr reacciones discretas con varios vectores de entrada V-C seleccionados, más que con la reacción agrupada ilustrada en la Figura 17.

En la Figura 18 se presenta un ejemplo del uso del segmento génico J con barajado. Este ejemplo esquemático describe un enfoque para mantener un único uso de odeCDR3 y vector de entrada V-C, donde la secuencia coincide con la cadena TCR parental, a la vez que proporciona una selección de segmentos génicos J proporcionando una selección de vectores donantes J a la reacción de reconstitución. El producto de una reacción que contiene un único odeCRD3 y vector entrada V-C, y una selección de vectores donantes J, constará de varias cadenas del TCR de longitud completa que contengan la secuencia CDR3/V-C parental y cada uno de los segmentos génicos donantes J proporcionados. Un enfoque de ese tipo es igualmente válido para lograr reacciones discretas con varios vectores de donante J seleccionados, más que con la reacción agrupada ilustrada en la Figura 18.

En la Figura 19 se presenta un ejemplo final del uso del barajado de los segmentos génicos V y J. Este ejemplo esquemático describe un enfoque para mantener un único odeCDR3, donde la secuencia coincide con la cadena del TCR parental, a la vez que proporciona una selección de ambos segmentos génicos V(-C) y J proporcionando una selección de ambos vectores V-C y donante J a la reacción de reconstitución. El producto de una reacción que contiene un único odeCRD3 único y una selección de ambos vectores de entrada V-C y donantes J, que constará de varias cadenas del TCR de longitud completa que contienen la secuencia CDR3 parental, y cada combinación de segmentos génicos V(-C) y donante J proporcionada a la reacción. Un enfoque de ese tipo es igualmente válido para lograr reacciones discretas con varios vectores de entrada V-C y donantes J seleccionados, más que con la reacción agrupada ilustrada en la Figura 19.

Ejemplo 11

Reconstitución de ORF del TCR de longitud completa a partir de TRA y TRB utilizando TORES2

Este ejemplo describe un TORES2 para los loci de TRA/TRB humanos con sitios RMCE como elementos genéticos 5' y 3', y demuestra la reconstitución de un par de TCR modelo humano, y la posterior integración de los ORF reconstituidos en una línea celular diseñada por ingeniería genética que tiene sitios RMCE coincidentes con los elementos genéticos 5' y 3' del contexto de la cadena principal del vector de entrada V-Ca original. El par TRA/TRB de TCR modelo tiene especificidad conocida por un antígeno restringido HLA-A*02:01. Las secuencias TRA y TRB modelo están representadas por SEQ0778 y SEQ0779, respectivamente. El péptido antigénico tiene la secuencia de aminoácidos SLLMWITQV.

Vectores de entrada V-C, vector donante J, odeCDR3 y terminador bidireccional para TORES2

V-Ca, V-Cp, el vector donante J y el dúplex de oligonucleótido que codifica el odeCDR3 se seleccionan con los mismos criterios de selección que se describen en el Ejemplo 7. Como se ha descrito anteriormente, el TORES2 requiere la adaptación de V-Ca y V-Cp para incorporar distintos sitios de Tipo IIS y elementos de selección negativa. Las secuencias de la cadena principal del vector de entrada V-Ca y V-Cp están representadas por SEQ7056 y SEQ0764, respectivamente. Debido a la adición de nuevos sitios de restricción a estas secuencias de cadena principal, algunas de las secuencias de segmentos V requieren modificación a las secuencias de nucleótidos subyacentes en comparación con las presentadas para el sistema TORES anterior, para eliminar estos nuevos sitios de restricción de la secuencia codificante del TCR. Las secuencias V-C de TRA modificadas están representadas por SEQ0757 a SEQ0763 y las secuencias V-C de TRB modificadas por SEQ0765 a SEQ0776. El resto de secuencias TRA y TRB utilizadas fueron las descritas para el sistema TORES anterior.

Componente donante del terminador bidireccional

El vector donante del terminador bidireccional (donante de BiT) proporciona el elemento terminador bidireccional introducido en la segunda etapa de reacción, y que en última instancia se une a las cadenas TRA y TRB antiparalelas reconstituidas en la primera etapa de reacción. En el presente ejemplo, el elemento terminador bidireccional está representado por SEQ0777, y se proporciona en un contexto de cadena principal de vector adecuado.

Reacciones de reconstitución

La primera reacción del ciclo de reacción con enzima de restricción/ligasa para reconstituir los ORF de TRA y TRB diana se realiza como se describe en el Ejemplo 7. Esto da como resultado TRA y TRB reconstituidos, cada uno dentro de sus contextos de cadena principal de entrada V-C respectivos. En la segunda reacción, estos dos vectores de producto se combinan con el vector donante de BiT en una nueva reacción del ciclo de la enzima ligasa para generar el vector producto final, que codifica los ORF de TRA y TRB reconstituidos en un sentido antiparalelo y unidos mediante el elemento terminador bidireccional introducido.

Reacción de digestión y ligación de RE para TORES2

Vector ORF del TRA reconstituido 25 ng

Vector ORF DE TRB reconstituido 25 ng

Vector donante BiT 25 ng

Tampón de ligasa de T4 10x 2 pl

Esp3I 0,5 pl

ADN-ligasa de T4 0,5 pl

H²O hasta 20 pl

Condiciones de reacción

Etapa 1; 2 minutos a 37 0C

Etapa 2; 3 min a 16 0C

Repetir las etapas 1 y 2, 20 veces

5 min a 50 0C

5 min a 80 0C

Volver a la temperatura ambiente

Añadir 0,5 pl de enzimas Sall y Mlul e incubar durante 30 min a 37 0C

Validación del ORF del TCR de longitud completa reconstituido

Para verificar la funcionalidad del vector donante TRA/TRB bidireccional reconstituido generado por el sistema TORES2, la construcción se suministró en una línea celular que expresa todos los componentes CD3 pero que carece de expresión de TRA y TRB, y que adicionalmente codifica sitios receptores genómicos compatibles con los sitios RMCE contenidos dentro del vector donante producto y que proceden del vector de entrada V-Ca original, y elementos promotores antiparalelos adecuados en los extremos 5' y 3'. El análisis se presenta en la Figura 23, en donde el vector donante reconstituido se transfecta a células. Las células que han perdido los marcadores del sitio receptor genómico (Figura 23 a, RFP- BFP-) son células que expresan el ORF del TCR bidireccional, dando lugar a la expresión superficial de CD3 (Figura 23 B, histograma gris claro). Mientras, las células que no perdieron los marcadores del sitio receptor genómico son células que no integraron la construcción TCR bidireccional (Figura 23a) RFP+BFP+) y no se tiñeron para la expresión superficial de CD3 (Figura 23 B, histograma gris oscuro). La expresión del TCR es necesaria para la presentación superficial del complejo CD3. Todas las células RFP-BFP- que han perdido los marcadores receptores genómicos son positivas para la expresión de CD3 superficial (Figura 23b, histograma gris claro). Todas las células RFP+BFP+ que no han perdido los marcadores receptores genómicos son negativas para la expresión de CD3 superficial (Figura 23b) histograma gris oscuro). Estas células CD3+ que expresan el TCR reconstituido también muestran tinción positiva para el reactivo del tetrámero HLA-A*02:01-SLLMWITQV (Figura 23c) en comparación con las células que no se tiñeron con dicho tetrámero (Figura 23d). En su conjunto, los resultados indican que el TCR reconstituido se presenta en la superficie celular y es específico para el antígeno diana cargado en el reactivo del tetrámero HLA-A*02:01-SLLMWITQV.

Claims

REIVINDICACIONES

Un sistema combinado que comprende dos componentes independientes, en donde un primer componente es un vector que tiene segmentos génicos variables y constantes (V-C) del receptor de linfocitos T (TCR), y un segundo componente es un vector que tiene segmentos génicos de unión (J) del TCR,

en donde el primer componente es un vector de entrada V-C que contiene

a. origen de replicación,

b. un primer marcador de selección positiva

c. elemento o elementos genéticos 5',

d. secuencia de Kozak,

e. segmento génico variable del TCR,

f. una primera secuencia de Tipo IIS, para reconocimiento y corte específicos de sitio mediante una primera enzima de restricción de Tipo IIS, en donde la secuencia está orientada de forma que la enzima corta en 5' de dicha secuencia de reconocimiento y en el extremo 3' del segmento génico variable del TCR,

g. un marcador de selección negativa,

h. una segunda secuencia de Tipo IIS, para reconocimiento y escisión específicos de sitio mediante una segunda enzima de restricción de Tipo IIS, en donde la secuencia está orientada de forma que la enzima corta 3' por escisión directa de dicha secuencia de reconocimiento y en el extremo 5' del segmento génico constante del TCR,

i. segmento génico constante del TCR, y

j. elemento o elementos genéticos 3',

en donde el segundo componente es un vector donante J que contiene

a. origen de replicación,

b. un segundo marcador de selección positiva,

c. una tercera secuencia de Tipo IIS para reconocimiento y escisión específicos de sitio mediante una tercera enzima de restricción de Tipo IIS, en donde la secuencia está orientada de forma que la enzima corta 3' de dicha secuencia de reconocimiento y en el extremo 5' del segmento génico de unión del TCR,

d. segmento génico de unión al TCR,

e. una parte C, que corresponde a una pequeña parte 5' de un segmento génico constante, y f. una cuarta secuencia de Tipo IIS para reconocimiento y escisión específicos de sitio por la cuarta enzima de restricción de Tipo IIS, en donde la secuencia está orientada de forma que la enzima corta 5' de dicha secuencia de reconocimiento y en la parte de la parte C del TCR del extremo 3' de la construcción, de forma que la secuencia del saliente monocatenario generado es complementario al generado por dicha segunda secuencia de Tipo IIS.

Un sistema combinado según 1, en donde el elemento genético 5' comprende uno o más elementos seleccionados de

a. elemento génico cis actuante,

b. sitio de reconocimiento heteroespecífico para las enzimas recombinasas,

c. un brazo de recombinación homóloga 5', para un sitio genómico de interés,

d. un sitio aceptor de corte y empalme de ARNm,

e. un sitio interno de entrada al ribosoma, y

f. una secuencia de aislante epigenético.

Un sistema combinado según cualquiera de las reivindicaciones 1-2, en donde el marcador de selección negativa se selecciona de

a. un sitio de reconocimiento de enzimas de restricción no contenido en otro sitio del primer componente o dentro del segmento génico de unión del TCR,

b. un gen suicida bacteriano y

c. un elemento indicador.

Un sistema combinado según cualquiera de las reivindicaciones 1-3, en donde el elemento genético en 3' comprende uno o más elementos seleccionados de

a. un elemento terminador,

b. sitio de reconocimiento heteroespecífico para las enzimas recombinasas,

c. un brazo de recombinación homóloga 3', para un sitio genómico de interés,

d. un sitio donador de corte y empalme de ARNm,

e. un sitio interno de entrada al ribosoma, y

f. una secuencia del aislante epigenético.

5. Un sistema combinado según cualquiera de las reivindicaciones 1-4, en donde los componentes no contienen ninguna secuencia de Tipo IIS además de las definidas anteriormente, y solo contienen dicho marcador de selección negativa.

6. Un sistema combinado según cualquiera de las reivindicaciones anteriores, que comprende además un tercer componente que comprende un dúplex de oligonucleótido que codifica CDR3 (odeCDR3), en donde el odeCDR3 tiene

a. una primera secuencia de saliente monocatenario complementario al generado por escisión del primer sitio de restricción de Tipo IIS en el extremo 3' del segmento génico variable del TCR, b. un segmento bicatenario que codifica una región CDR3 del TCR y desprovisto de marcador de selección negativa, donde dicho elemento de selección negativa es como se define en la reivindicación 5, y dicho elemento bicatenario también está desprovisto de cualquier secuencia de restricción de Tipo IIS del primer o segundo componente, y

c. una segunda secuencia de saliente monocatenario complementario del generado por escisión del tercer sitio de enzima de restricción de Tipo IIS en el extremo 5' del segmento de unión del TCR.

7. Un sistema combinado según cualquiera de las reivindicaciones 1-5 que comprende además un tercer componente que comprende un dúplex de oligonucleótido que codifica CDR3 (odeCDR3), en donde el odeCDR3 es una molécula de ADNbc o ADN plasmídico que codifica el CDR3 flanqueado por dos sitios de reconocimiento y escisión de Tipo IIS, de forma que el corte efectuado por dichas enzimas da como resultado salientes monocatenarios complementarios a los generados mediante la primera escisión de Tipo IIS en el vector de entrada V-C en el extremo 5', y con la tercera escisión de Tipo IIS del vector donante J en el extremo 3', para obtener un producto digerido de dicho odeCDR3 que comprende a, b y c como se describe en la reivindicación 6.

8. Un sistema combinado según cualquiera de las reivindicaciones 1-7, en donde la primera a cuarta secuencias de Tipo IIS son iguales o distintas.

9. Una genoteca de vectores de dos partes que comprende una genoteca de vectores de entrada V-C como se define en la reivindicación 1 y una genoteca de vectores donantes J como se define en la reivindicación 1, en donde la genoteca de vectores de entrada V-C es

una colección de uno o más vectores que representan todos los segmentos génicos variables y constantes del TCR de la línea germinal de un organismo que tiene dichos TCR, o

una colección de uno o más vectores que representan una colección de variantes de segmentos génicos variables y constantes del TCR de línea germinal de un organismo que tiene dichos TCR, de forma que la secuencia de aminoácidos traducida de la proteína codificada no esté modificada con respecto a la secuencia de proteínas codificada por el segmento génico de línea germinal, o

una colección de uno o más vectores que representan una colección de variantes de segmentos génicos variables y constantes del TCR de línea germinal de un organismo que tiene dichos TCR, de forma que la secuencia de aminoácidos traducida de la proteína codificada está modificada con respecto a la secuencia de proteínas codificada por el segmento génico de línea germinal y en donde

la genoteca de vectores donantes J es una colección de uno o más vectores que representan los segmentos génicos de unión del TCR de la línea germinal de un organismo que tiene dichos TCR, o una colección de uno o más vectores que representan variantes de segmentos génicos de unión del TCR de línea germinal de un organismo que tiene dichos TCR, de forma que la secuencia de aminoácidos traducida de la proteína codificada no está modificada con respecto a la secuencia de proteínas codificada por el segmento génico de línea germinal, o

una colección de uno o más vectores que representan variantes de segmentos génicos de unión del TCR de línea germinal de un organismo que tiene dichos TCR, de forma que la secuencia de aminoácidos traducida de la proteína codificada está modificada con respecto a la secuencia de proteínas codificada por el segmento génico de línea germinal.

10. Un método para la reconstitución in vitro de un marco de lectura abierto (ORF) de TCR de longitud completa, comprendiendo dicho método

a. seleccionar un vector de entrada V-C,

b. seleccionar un vector donante J,

c. seleccionar un odeCDR3,

d. combinar a, b y c para reaccionar con i) una o varias enzimas de restricción de Tipo IIS para cortar todos los sitios de reconocimiento y escisión con enzimas de restricción de Tipo IIS presentes en el vector de entrada V-C y en el vector donante J y ii) enzima ADN-ligasa, y someter la mezcla combinada a una reacción de termociclado,

e. transformar el producto de reacción obtenido en la etapa d. en un organismo hospedador competente para la propagación del vector de ADN, y

f. propagar dicho organismo hospedador para obtener el marco de lectura abierto del TCR reconstituido de longitud completa en la cadena principal del vector de entrada V-C resultante.

11. Un vector de entrada V-C seleccionado de

la secuencia SEQ0692,

la secuencia SEQ0693, y

la secuencia SEQ0694.

12. Un vector donante J representado por la secuencia SEQ0700.

13. Una genoteca de vectores de entrada V-C como se define en cualquiera de las reivindicaciones 1-8 para su uso junto con una genoteca de vectores donantes J y un odeCDR3 para reconstituir un ORF del TCR de longitud completa, en donde los vectores de entrada V-C contienen segmentos génicos variables y constantes para recapitular el uso de segmentos génicos del locus del TRA humano, representados por las secuencias SEQ0049 a SEQ0094; y/o los vectores de entrada V-C contienen segmentos génicos variables y constantes para recapitular el uso de segmentos génicos del locus del TRB humano, representado por las secuencias SEQ0484 a SEQ0577.

14. Una genoteca de vectores donantes J como se define en cualquiera de las reivindicaciones 1-8, que contiene segmentos génicos de unión para recapitular el uso de segmentos génicos del locus del TRA humano, representado por las secuencias SEQ0323 a SEQ0378, en donde los vectores se utilizan junto con un odeCDR3 que abarca toda la región CDR3; y/o

que contiene segmentos génicos unidos para recapitular el uso de segmentos génicos del locus del TRA humano representado por las secuencias SEQ0379 a SEQ0434,

en donde los vectores se utilizan junto con un odeCDR3 de longitud reducida en tres a cuatro codones.

15. Una genoteca de vectores donantes J como se define en cualquiera de las reivindicaciones 1-8, que contiene segmentos génicos de unión para recapitular el uso de segmentos génicos del locus del TRB humano, representado por las secuencias SEQ0636 a SEQ0661, en donde los vectores se utilizan junto con un odeCDR3 que abarca toda la región CDR3, y/o

que contiene segmentos génicos unidos para recapitular el uso de segmentos génicos del locus del TRB humano representado por las secuencias SEQ0662 a SEQ0687,

en donde los vectores se utilizan junto con un odeCDR3 de longitud reducida en tres a cuatro codones.

16. Una genoteca según la reivindicación 14 o 15 para su uso junto con un vector de entrada V-C y un odeCDR3 para reconstituir un ORF del TCR de longitud completa.

17. Un sistema combinado según cualquiera de las reivindicaciones 1-8, en donde el primer componente es un vector de entrada V-C que codifica una primera cadena del TCR, el sistema comprende además un componente que comprende un vector donante del terminador bidireccional (BiT) y un componente que comprende un vector de entrada V-C que codifica una segunda cadena del TCR complementaria de la primera cadena del TCR.

18. Un sistema combinado según la reivindicación 17, en donde dicho vector de entrada V-C del primer componente comprende además

a. una quinta secuencia de Tipo IIS, para reconocimiento y escisión específicos de sitio mediante una quinta enzima de restricción de Tipo IIS, en donde la secuencia está orientada de forma que la enzima escinde 5' de dicha secuencia de reconocimiento y en el extremo 3' del segmento génico constante,

b. un marcador de selección negativa situado 3' de la quinta secuencia de Tipo IIS, c. una sexta secuencia de Tipo IIS para reconocimiento y escisión específicos de sitio mediante una sexta enzima de restricción de Tipo IIS situada 3' del marcador de selección negativa de b., en donde la secuencia está orientada de forma que la enzima escinde 3' de dicha secuencia de reconocimiento, y hacia el 5' del o de los elementos genéticos3'.

19. Un sistema combinado según la reivindicación 17 o 18, en donde el vector de entrada V-C que codifica una segunda cadena del TCR es complementaria a la primera cadena y comprende además

a. una séptima secuencia de Tipo IIS para reconocimiento y escisión específicos de sitio mediante una séptima enzima de restricción de Tipo IIS, en donde la secuencia está orientada de forma que la enzima escinde3' de dicha secuencia de reconocimiento y en el 5' de la secuencia de Kozak,

b. una octava secuencia de Tipo IIS, para reconocimiento y escisión específicos de sitio mediante una octava enzima de restricción de Tipo IIS, en donde la secuencia está orientada de forma que la enzima escinde 5' de dicha secuencia de reconocimiento y en el extremo 3' del segmento génico constante,

c. un marcador de selección negativa situado en el extremo 3' de la quinta secuencia de Tipo IIS.

20. Un sistema combinado según cualquiera de las reivindicaciones 17-19, en donde dicho vector donante de BiT contiene un origen de replicación,

a. un marcador de selección positiva,

b. una novena secuencia de Tipo IIS para reconocimiento y corte específico de sitio mediante una novena enzima de restricción de Tipo IIS, en donde la secuencia está orientada de forma que la enzima escinde 3' de dicha secuencia de reconocimiento y el extremo 5' de un elemento terminador bidireccional, d,

c. un elemento terminador bidireccional que codifica dos terminadores de la transcripción en disposición antisentido, y

d. una décima secuencia de Tipo IIS para reconocimiento y corte específico de sitio mediante una décima enzima de restricción de Tipo IIS, en donde la secuencia está orientada de forma que la enzima escinde 5' de dicha secuencia de reconocimiento y el 3' del elemento terminador bidireccional, d.

21. Un sistema combinado según cualquiera de las reivindicaciones 17-20, en donde de la primera a cuarta secuencias de Tipo IIS son iguales o distintas.

22. Un sistema combinado según una cualquiera de las reivindicaciones 17-20, en donde de la quinta a décima secuencias de Tipo IIS son iguales o distintas, y son distintas de las secuencias primera a cuarta de Tipo IIS.

23. Un sistema combinado según una cualquiera de las reivindicaciones 17-22, en donde el marcador de selección negativa se selecciona de

a. un sitio de reconocimiento de enzimas de restricción no contenido en otro sitio del primer componente o dentro del segmento génico de unión del TCR,

b. un gen de suicidio bacteriano y

c. un elemento indicador,

y en donde los marcadores de selección negativa definidos en b. de la reivindicación 18 y en c. de la reivindicación 19 son distintos del marcador de selección negativa definido en g. de la reivindicación 1, y el marcador de selección negativa definido en g. de la reivindicación 1 es distinto de los del vector de entrada V-C del primer componente y del vector de entrada V-C que codifica dicha segunda cadena del TCR complementaria a la primera cadena del TCR.

24. Una genoteca de vectores de entrada V-C como se define en cualquiera de las reivindicaciones 17-23, en donde la genoteca comprende una primera y una segunda genoteca de vectores de entrada V-C, conteniendo cada una una colección de uno o más vectores que representan todos los segmentos génicos variables y constantes del TCR de la línea germinal de un organismo que tiene dichos TCR, o

una colección de uno o más vectores que representan una colección de variantes de segmentos génicos variables y constantes del TCR de línea germinal de un organismo que tiene dichos TCR, de forma que la secuencia de aminoácidos traducida de la proteína codificada no esté modificada con respecto a la secuencia de proteínas codificada por el segmento génico de línea germinal, o

una colección de uno o más vectores que representan una colección de variantes de segmentos génicos variables y constantes del TCR de línea germinal de un organismo que tiene dichos TCR, de forma que la secuencia de aminoácidos traducida de la proteína codificada está modificada con respecto a la secuencia de proteínas codificada por el segmento génico de línea germinal,

en donde la primera y segunda genotecas de vectores de entrada V-C codifican cadenas recíprocas del TCR.

25. Una genoteca de vectores de entrada V-C según la reivindicación 24 para su uso en la provisión de un par de marcos de lectura abiertos (ORF) del TCR de longitud completa, codificados en disposición antiparalela en una única construcción producto.

Un métoseledo para la reconstitución in vitro de un par de marcos de lectura abiertos (ORF) del TCR de longitud completa, codificados en disposición antiparalela en una única construcción producto, comprendiendo dicho método

a. seleccionar un vector de entrada V-C para cada cadena del TCR,

b. seleccionar un vector donante J para cada cadena TCR,

c. seleccionar un odeCDR3 para cada cadena del TCR,

d. combinar a, b y c para cada TCR en una reacción independiente para reaccionar con i) una o varias enzimas de restricción de Tipo IIS para cortar el primer a cuarto sitio de reconocimiento y escisión con enzimas de restricción de Tipo IIS presentes en los vectores de entrada V-C y en los vectores donantes J y ii) enzima ADN-ligasa y someter las mezclas combinadas a reacciones de termociclado para obtener un primer y segundo producto de reacción,

e. combinar ambos productos de reacción de la etapa d. con un vector donante BiT como se define en la reivindicación 17 con i) una o varias enzimas de restricción de Tipo IIS para cortar el quinto al décimo sitio de reconocimiento y escisión con enzimas de restricción de Tipo IIS y ii) enzima ADN-ligasa, y someter los productos de reacción combinados a reacciones de termociclado para obtener un tercer producto de reacción,

f. transformar el tercer producto de reacción de la etapa e. en un organismo hospedador competente para la propagación del vector de ADN, y

g. propagar dicho organismo hospedador para obtener el marco de lectura abierto del TCR reconstituido de longitud completa en la cadena principal del vector de entrada V-C resultante.

Un par de vectores de entrada V-C representados por la SEQ ID n.°: 0756 y 0764.

Un par de vectores de entrada V-C según la reivindicación 27, para utilizar en el intercambio de casetes mediado por recombinasa con dianas genéticas con secuencias de recombinasa heteroespecíficas coincidentes.

Un elemento terminador bidireccional, representado por la secuencia SEQ0777.