ES2987640T3

ES2987640T3 - Uso de cebado aleatorio para obtener información de V(D)J de longitud completa para la secuenciación del repertorio inmunitario

Info

Publication number: ES2987640T3
Application number: ES20816802T
Authority: ES
Inventors: Christina Chang; Margaret Nakamoto
Original assignee: Becton Dickinson and Co
Current assignee: Becton Dickinson and Co
Priority date: 2019-11-08
Filing date: 2020-11-06
Publication date: 2024-11-15
Anticipated expiration: 2040-11-06
Also published as: EP4407041A2; JP2023500679A; EP4055160A1; US20210139970A1; CN114729350A; EP4055160B1; JP2024160229A; WO2021092386A1; EP4407041A3; EP4407041B1; US11773436B2; JP7522189B2

Abstract

En el presente documento se describen sistemas, métodos, composiciones y kits para etiquetar dianas de ácidos nucleicos en una muestra. En algunas realizaciones, las dianas de ácidos nucleicos (por ejemplo, ARNm) se codifican inicialmente en el extremo 3' y posteriormente se codifican en el extremo 5' tras una reacción de cambio de plantilla y una hibridación y extensión intermolecular y/o intramolecular. Las dianas de ácidos nucleicos codificadas en 5' y/o 3' pueden servir como plantillas para reacciones de amplificación y/o reacciones de cebado y extensión aleatorias para generar una biblioteca de secuenciación. El método puede comprender generar una secuencia de longitud completa de la diana de ácidos nucleicos alineando una pluralidad de lecturas de secuenciación. En algunas realizaciones también se proporcionan métodos de elaboración de perfiles de repertorio inmunitario. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Uso de cebado aleatorio para obtener información de V(D)J de longitud completa para la secuenciación del repertorio inmunitario

ANTECEDENTES

Campo

La presente divulgación se refiere de manera general al campo de la biología molecular y, en particular, a los análisis multiómicos que usan codificación con códigos de barras moleculares.

Descripción de la técnica relacionada

Los métodos y técnicas de codificación con códigos de barras moleculares son útiles para el análisis transcriptómico unicelular, incluyendo el descifrado de perfiles de expresión génica para determinar los estados de las células usando, por ejemplo, la transcripción inversa, la amplificación por reacción en cadena de la polimerasa (PCR) y la secuenciación de próxima generación (NGS). El código de barras molecular también es útil para el análisis proteómico de células individuales. Hay una necesidad de métodos y técnicas para elaborar perfiles de expresión de longitud completa de dianas de ácidos nucleicos (por ejemplo, transcritos que contienen V(D)J). Hay una necesidad de composiciones y métodos que permitan tanto la identificación como el recuento de dianas de ácidos nucleicos (por ejemplo, transcritos que contienen V(D)J). La WO2018218222A1 describe métodos para la secuenciación de genes diana y la codificación con códigos de barras de células individuales junto con el análisis de la expresión génica en células individuales. La WO2020072380A1 describe sistemas, métodos, composiciones y kits para marcar dianas de ácidos nucleicos en una muestra. Las dianas de ácidos nucleicos (por ejemplo, ARNm) pueden codificarse con códigos de barras inicialmente en el extremo 3' y posteriormente codificarse con códigos de barras en el extremo 5' tras una reacción de cambio de plantilla e hibridación y extensión intermolecular y/o intramolecular.

SUMARIO

La invención se expone en el conjunto de reivindicaciones adjunto. Los términos "realización" y "realizaciones" deben interpretarse como realización o realizaciones de la invención únicamente en la medida en que entren dentro del alcance de las reivindicaciones adjuntas. De lo contrario, se refieren únicamente a realizaciones de la divulgación.

Lo divulgado en la presente incluye métodos para marcar dianas de ácido nucleico en una muestra. En algunas realizaciones, el método comprende: poner en contacto copias de una diana de ácido nucleico con una pluralidad de códigos de barras de oligonucleótidos, en donde cada código de barras de oligonucleótidos comprende una primera secuencia universal, un marcador molecular (por ejemplo, un primer marcador molecular), y una región de unión a la diana capaz de hibridar con la diana de ácido nucleico; generando una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una la región de unión a la diana y un complemento de la región de unión a la diana; hibridar el complemento de la región de unión a la diana de cada molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de uno o más de: (i) un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos, (ii) la propia molécula de ácido nucleico codificada con código de barras, y (iii) una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras; extender los extremos 3'de la pluralidad de moléculas de ácido nucleico codificadas con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas que comprenden cada una el primer marcador molecular y un segundo marcador molecular; amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas usando un cebador específico de la diana capaz de hibridar con una secuencia de la diana de ácido nucleico y un cebador que comprenda la primera secuencia universal, generando de este modo una primera pluralidad de amplicones codificados con código de barras que comprenden la secuencia de la diana de ácido nucleico, o una parte de la misma; hibridar cebadores aleatorios con la primera pluralidad de amplicones codificados con código de barras y extender los cebadores aleatorios para generar una pluralidad de productos de extensión, en donde los cebadores aleatorios comprenden una segunda secuencia universal, o un complemento de la misma; y amplificar la pluralidad de productos de extensión usando cebadores capaces de hibridar con la primera secuencia universal y la segunda secuencia universal, o complementos de las mismas, generando de este modo una segunda pluralidad de amplicones codificados con código de barras. En algunas realizaciones, el método comprende: determinar el número de copias de la diana de ácido nucleico en la muestra basándose en el número de primeros marcadores moleculares con secuencias distintas, segundos marcadores moleculares con secuencias distintas, o una combinación de los mismos, asociados con la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos. En algunas realizaciones, el método no comprende fragmentación, etiquetado, o ambos.

Lo divulgado en la presente incluye métodos para determinar el número de dianas de ácido nucleico en una muestra. En algunas realizaciones, el método comprende: poner en contacto copias de una diana de ácido nucleico con una pluralidad de códigos de barras de oligonucleótidos, en donde cada código de barras de oligonucleótidos comprende una primera secuencia universal, un marcador molecular (por ejemplo, un primer marcador molecular), y una región de unión a la diana capaz de hibridar con la diana de ácido nucleico; generando una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una la región de unión a la diana y un complemento de la región de unión a la diana; hibridar el complemento de la región de unión a la diana de cada molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de uno o más de: (i) un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos, (ii) la propia molécula de ácido nucleico codificada con código de barras, y (iii) una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras; extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas que comprenden cada una el primer marcador molecular y un segundo marcador molecular; amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas usando un cebador específico de la diana capaz de hibridar con una secuencia de la diana de ácido nucleico y un cebador que comprende la primera secuencia universal, generando de este modo una primera pluralidad de amplicones codificados con códigos de barras que comprenden la secuencia de la diana de ácido nucleico, o una parte de la misma; hibridar cebadores aleatorios con la primera pluralidad de amplicones codificados con código de barras y extender los cebadores aleatorios para generar una pluralidad de productos de extensión, en donde los cebadores aleatorios comprenden una segunda secuencia universal, o un complemento de la misma; amplificar la pluralidad de productos de extensión usando cebadores capaces de hibridar con la primera secuencia universal y la segunda secuencia universal, o complementos de las mismas, generando de este modo una segunda pluralidad de amplicones codificados con código de barras; y determinar el número de copias de la diana de ácido nucleico en la muestra basándose en el número de primeros marcadores moleculares con secuencias distintas, segundos marcadores moleculares con secuencias distintas, o una combinación de los mismos, asociados con la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos.

En algunas realizaciones, determinar el número de copias de la diana de ácido nucleico en la muestra comprende: (a) determinar el número de copias de la diana de ácido nucleico en la muestra basándose en el número de segundos marcadores moleculares con secuencias distintas asociadas con la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos, y/o (b) determinar el número de copias de la diana de ácido nucleico en la muestra basándose en el número de primeros marcadores moleculares con secuencias distintas asociados con la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos. En algunas realizaciones, el método comprende: desnaturalizar la pluralidad de moléculas de ácido nucleico codificadas con código de barras antes de hibridar el complemento de la región de unión a la diana de cada molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de: (i) un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos, (ii) la propia molécula de ácido nucleico codificada con código de barras, y/o (iii) una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras.

En algunas realizaciones, el método comprende: desnaturalizar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas antes de amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas. En algunas realizaciones, la secuencia de cada una de la pluralidad de dianas de ácido nucleico comprende una subsecuencia de cada una de la pluralidad de dianas de ácido nucleico. En algunas realizaciones, la secuencia de la diana de ácido nucleico en la pluralidad de moléculas de ácido nucleico codificadas con código de barras comprende una subsecuencia de la diana de ácido nucleico. En algunas realizaciones, el primer marcador molecular hibrida con el segundo marcador molecular después de extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras. En algunas realizaciones, las moléculas de ácido nucleico codificadas con código de barras extendidas comprenden cada una el primer marcador molecular, el segundo marcador molecular, la región de unión a la diana y el complemento de la región de unión a la diana. En algunas realizaciones, el complemento de la región de unión a la diana es complementario a una parte de la región de unión a la diana. En algunas realizaciones, la región de unión a la diana comprende una secuencia específica de gen, una secuencia poli(dT), o ambas.

En algunas realizaciones, generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una la región de unión a la diana y un complemento de la región de unión a la diana comprende: (i) codificar con códigos de barras copias de una diana de ácido nucleico en una muestra usando la pluralidad de códigos de barras de oligonucleótidos para generar una pluralidad de moléculas de ácido nucleico codificadas con códigos de barras que comprenden cada una una secuencia complementaria a por lo menos una parte de la diana de ácido nucleico, un primer marcador molecular y la región de unión a la diana; y (ii) unir un oligonucleótido que comprende un complemento de la región de unión a la diana a la pluralidad de moléculas de ácido nucleico codificadas con códigos de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con códigos de barras que comprende cada una la región de unión a la diana y un complemento de la región de unión a la diana.

En algunas realizaciones, generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una la región de unión a la diana y un complemento de la región de unión a la diana comprende: (i) codificar con códigos de barras copias de una diana de ácido nucleico en una muestra usando la pluralidad de códigos de barras de oligonucleótidos para generar una pluralidad de moléculas de ácido nucleico codificadas con códigos de barras que comprenden cada una una secuencia complementaria a por lo menos una parte de la diana de ácido nucleico, un primer marcador molecular y la región de unión a la diana; (ii) amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras amplificadas; y (iii) unir un oligonucleótido que comprende un complemento de la región de unión a la diana a la pluralidad de moléculas de ácido nucleico codificadas con código de barras amplificadas para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una la región de unión a la diana y un complemento de la región de unión a la diana.

En algunas realizaciones, codificar con códigos de barras de copias una diana de ácido nucleico en una muestra comprende extender la pluralidad de códigos de barras de oligonucleótidos hibridados con las copias de la diana de ácido nucleico para generar la pluralidad de moléculas de ácido nucleico codificadas con código de barras. En algunas realizaciones, extender la pluralidad de códigos de barras de oligonucleótidos hibridados con las copias de la diana de ácido nucleico comprende la transcripción inversa de las copias de la diana de ácido nucleico hibridadas con la pluralidad de códigos de barras de oligonucleótidos. En algunas realizaciones, unir el oligonucleótido que comprende el complemento de la región de unión a la diana comprende ligar el oligonucleótido que comprende el complemento de la región de unión a la diana con la pluralidad de moléculas de ácido nucleico codificadas con código de barras y/o moléculas de ácido nucleico codificadas con código de barras amplificadas. En algunas realizaciones, la región de unión a la diana comprende una secuencia poli(dT), y en donde la unión del oligonucleótido que comprende el complemento de la región de unión a la diana comprende añadir una pluralidad de monofosfatos de adenosina a la pluralidad de moléculas de ácido nucleico codificadas con código de barras y/o moléculas de ácido nucleico codificadas con código de barras amplificadas usando una desoxinucleotidil transferasa terminal.

En algunas realizaciones, generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una la región de unión a la diana y un complemento de la región de unión a la diana comprende: extender la pluralidad de códigos de barras de oligonucleótidos hibridados con las copias de la diana de ácido nucleico en presencia de una transcriptasa inversa y un oligonucleótido de cambio de plantilla que comprende la región de unión a la diana, o una parte de la misma, para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras, cada una de las cuales comprende una secuencia complementaria a por lo menos una parte de la diana de ácido nucleico, un primer marcador molecular, la región de unión a la diana y un complemento de la región de unión a la diana. En algunas realizaciones, la transcriptasa inversa es capaz de actividad transferasa terminal. En algunas realizaciones, el oligonucleótido de cambio de plantilla comprende uno o más ribonucleótidos 3', por ejemplo tres ribonucleótidos 3'. En algunas realizaciones, los ribonucleótidos 3' comprenden guanina. En algunas realizaciones, la transcriptasa inversa comprende una transcriptasa inversa viral, por ejemplo una transcriptasa inversa del virus de la leucemia murina (MLV) o una transcriptasa inversa del virus de la leucemia murina de Moloney (MMLV). En algunas realizaciones, el método comprende extender la pluralidad de códigos de barras de oligonucleótidos hibridados con las copias de la diana de ácido nucleico en presencia de uno o más de etilenglicol, polietilenglicol, 1,2-propanodiol, dimetilsulfóxido (DMSO), glicerol, formamida, 7-deaza-GTP, acetamida, sal de cloruro de tetrametilamonio, betaína, o cualquier combinación de los mismos.

En algunas realizaciones, hibridar el complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de la propia molécula de ácido nucleico codificada con código de barras comprende la hibridación intramolecular de la región de unión a la diana y el complemento de la región de unión a la diana dentro de una molécula de ácido nucleico codificada con código de barras para formar una horquilla. En algunas realizaciones, el segundo marcador molecular es el complemento del primer marcador molecular.

En algunas realizaciones, hibridar el complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con la región de unión a la diana de un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos comprende la hibridación intermolecular del complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos. En algunas realizaciones, el segundo marcador molecular es diferente del primer marcador molecular, y en donde el segundo marcador molecular no es un complemento del primer marcador molecular. En algunas realizaciones, el método comprende extender los extremos 3' de los códigos de barras de oligonucleótidos hibridados con el complemento de la región de unión a la diana de la molécula de ácido nucleico codificada con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas que comprenden cada una un complemento del primer marcador molecular y un segundo marcador molecular. En algunas realizaciones, la secuencia del segundo marcador molecular es diferente de la secuencia del primer marcador molecular, en donde el segundo marcador molecular no es un complemento del primer marcador molecular.

En algunas realizaciones, hibridar el complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras comprende la hibridación intermolecular del complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras. En algunas realizaciones, la secuencia del segundo marcador moleculares diferente de la secuencia del primer marcador molecular, y en donde el segundo marcador molecular no es un complemento del primer marcador molecular.

En algunas realizaciones, la muestra comprende una célula individual, una pluralidad de células, una pluralidad de células individuales, un tejido, una muestra tumoral, o cualquier combinación de los mismos. En algunas realizaciones, una célula individual comprende una célula inmunitaria o una célula tumoral circulante. En algunas realizaciones, la célula inmunitaria es una célula B o una célula T. En algunas realizaciones, el cebador específico de la diana hibrida específicamente con un receptor inmunitario. En algunas realizaciones, el cebador específico de la diana hibrida específicamente con una región constante de un receptor inmunitario, una región variable de un receptor inmunitario, una región de diversidad de un receptor inmunitario, la unión de una región variable y una región de diversidad de un receptor inmunitario, o una combinación de las mismas. En algunas realizaciones, el receptor inmunitario es un receptor de células T (TCR) y/o un receptor de células B (BCR). En algunas realizaciones, el TCR comprende la cadena alfa del TCR, la cadena beta del TCR, la cadena gamma del TCR, la cadena delta del TCR, o cualquier combinación de las mismas. En algunas realizaciones, el receptor BCR comprende la cadena pesada del BCR y/o la cadena ligera del BCR.

En algunas realizaciones, extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras comprende la extensión de los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras usando una ADN polimerasa que carece de por lo menos una de la actividad de exonucleasa 5' a 3' y actividad de exonucleasa 3' a 5'. En algunas realizaciones, la ADN polimerasa comprende un fragmento de Klenow. En algunas realizaciones, el método comprende obtener información de secuencia de la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos. En algunas realizaciones, la obtención de la información de secuencia comprende unir adaptadores de secuenciación a la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos. En algunas realizaciones, amplificar la pluralidad de productos de extensión comprende añadir secuencias de sitios de unión de cebadores de secuenciación y/o adaptadores de secuenciación, secuencias complementarias de los mismos, y/o partes de los mismos, a la pluralidad de productos de extensión. En algunas realizaciones, los adaptadores de secuenciación comprenden la secuencia P5, la secuencia P7, una secuencia complementaria de la misma, o una parte de la misma. En algunas realizaciones, los cebadores de secuenciación comprenden un cebador de secuenciación de Lectura 1, un cebador de secuenciación de Lectura 2, una secuencia complementaria de los mismos o una parte de los mismos. En algunas realizaciones, obtener la información de secuencia de la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos, comprende: obtener datos de secuenciación que comprenden una pluralidad de lecturas de secuenciación de la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos, en donde cada una de la pluralidad de lecturas de secuenciación comprende (1) una secuencia de marcador celular, (2) una secuencia de marcador molecular, y/o (3) una subsecuencia de la diana de ácido nucleico.

En algunas realizaciones, el método comprende: para cada secuencia de marcador celular única, que indica una única célula de la muestra: alinear cada una de la pluralidad de lecturas de secuenciación de la diana de ácido nucleico para generar una secuencia alineada de la diana de ácido nucleico. En algunas realizaciones, la secuencia alineada de la diana de ácido nucleico comprende por lo menos el 50% de la secuencia de ADNc de la diana de ácido nucleico, por lo menos el 70% de la secuencia de ADNc de la diana de ácido nucleico, por lo menos el 90% de la secuencia de ADNc de la diana de ácido nucleico, o toda la longitud de la secuencia de ADNc de la diana de ácido nucleico. En algunas realizaciones, la diana de ácido nucleico es un receptor inmunitario. En algunas realizaciones, el receptor inmunitario comprende la cadena ligera del BCR, la cadena pesada del BCR, la cadena alfa del TCR, la cadena beta del TCR, la cadena gamma del TCR, la cadena delta del TCR o cualquier combinación de las mismas. En algunas realizaciones, la secuencia alineada de la diana de ácido nucleico comprende la región determinante de la complementariedad 1 (CDR1), la región determinante de la complementariedad 2 (CDR2), la región determinante de la complementariedad 3 (CDR3), la región variable, la longitud completa de la región variable, o una combinación de las mismas. En algunas realizaciones, la secuencia alineada de la diana de ácido nucleico comprende la región variable, la región de diversidad, la unión de una región de diversidad de región variable y/o la región constante, o cualquier combinación de las mismas.

En algunas realizaciones, obtener la información de secuencia comprende obtener la información de secuencia de la cadena ligera de BCR y la cadena pesada de BCR de una única célula. En algunas realizaciones, la información de secuencia de la cadena ligera de BCR y la cadena pesada de BCR comprende la secuencia de la región determinante de complementariedad 1 (CDR1), la CDR2, la CDR3, o cualquier combinación de las mismas, de la cadena ligera de BCR y/o la cadena pesada de BCR. En algunas realizaciones, el método comprende: emparejar la cadena ligera de BCR y la cadena pesada de BCR de la célula individual sobre la base de la información de secuencia obtenida. En algunas realizaciones, la muestra comprende una pluralidad de células individuales, el método comprendiendo emparejar la cadena ligera de BCR y la cadena pesada de BCR de por lo menos el 50% de dichas células individuales basándose en la información de secuencia obtenida.

En algunas realizaciones, obtener la información de secuencia comprende obtener la información de secuencia de la cadena alfa de TCR y la cadena beta de TCR de una célula individual. En algunas realizaciones, la información de secuencia de la cadena alfa de TCR y la cadena beta de TCR comprende la secuencia de la región determinante de complementariedad 1 (CDR1), la CDR2, la CDR3, o cualquier combinación de las mismas, de la cadena alfa de TCR y/o la cadena beta de TCR. En algunas realizaciones, el método comprende: emparejar la cadena alfa de TCR y la cadena beta de TCR de la célula individual sobre la base en la información de secuencia obtenida. En algunas realizaciones, la muestra comprende una pluralidad de células individuales, el método comprendiendo emparejar la cadena alfa del TCR y la cadena beta del TCR de por lo menos el 50% de dichas células individuales sobre la base de la información de secuencia obtenida.

En algunas realizaciones, obtener la información de secuencia comprende la obtención de la información de secuencia de la cadena gamma del TCR y la cadena delta del TCR de una célula individual. En algunas realizaciones, la información de secuencia de la cadena gamma del TCR y la cadena delta del TCR comprende la secuencia de la región I determinante de la complementariedad 1 (CDR1), la CDR2, la CDR3, o cualquier combinación de las mismas, de la cadena gamma del TCR y/o la cadena delta del TCR. En algunas realizaciones, el método comprende: emparejar la cadena gamma del TCR y la cadena delta del TCR de la célula individual basándose en la información de secuencia obtenida. En algunas realizaciones, la muestra comprende una pluralidad de células individuales, el método comprendiendo emparejar la cadena gamma del TCR y la cadena delta del TCR de por lo menos el 50% de dichas células individuales basándose en la información de secuencia obtenida.

En algunas realizaciones, el complemento de la región de unión a la diana comprende la secuencia complementaria inversa de la región de unión a la diana o la secuencia complementaria de la región de unión a la diana. En algunas realizaciones, el complemento del marcador molecular comprende una secuencia complementaria inversa del marcador molecular o una secuencia complementaria del marcador molecular. En algunas realizaciones, la pluralidad de moléculas de ácido nucleico codificadas con código de barras comprende moléculas de ácido desoxirribonucleico (ADN) codificadas con código de barras, moléculas de ácido ribonucleico (ARN) codificadas con código de barras o una combinación de las mismas. En algunas realizaciones, la diana de ácido nucleico comprende una molécula de ácido nucleico. En algunas realizaciones, la molécula de ácido nucleico comprende ácido ribonucleico (ARN), ARN mensajero (ARNm), microARN, ARN interferente pequeño (ARNip), producto de degradación del ARN, ARN que comprende una cola poli(A), o cualquier combinación de los mismos. En algunas realizaciones, el ARNm codifica un receptor inmunitario. En algunas realizaciones, la diana de ácido nucleico comprende un reactivo de unión a componente celular, y/o la molécula de ácido nucleico está asociada con el reactivo de unión al componente celular. En algunas realizaciones, el método comprende disociar la molécula de ácido nucleico y el reactivo de unión al componente celular.

En algunas realizaciones, por lo menos 10 de la pluralidad de códigos de barras de oligonucleótidos comprenden diferentes secuencias de marcadores moleculares. En algunas realizaciones, cada marcador molecular de la pluralidad de códigos de barras de oligonucleótidos comprende por lo menos 6 nucleótidos. En algunas realizaciones, la pluralidad de códigos de barras de oligonucleótidos está asociada a un soporte sólido. En algunas realizaciones, la pluralidad de códigos de barras de oligonucleótidos asociados con el mismo soporte sólido comprenden cada uno un marcador de muestra idéntico. En algunas realizaciones, cada marcador de muestra de la pluralidad de códigos de barras de oligonucleótidos comprende por lo menos 6 nucleótidos. En algunas realizaciones, los códigos de barras de oligonucleótidos asociados con el mismo soporte sólido comprenden el mismo marcador celular. En algunas realizaciones, los códigos de barras de oligonucleótidos asociados con diferentes soportes sólidos comprenden diferentes marcadores celulares. En algunas realizaciones, la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas comprende cada una un marcador celulary un complemento del marcador celular. En algunas realizaciones, el complemento del marcador celular comprende una secuencia complementaria inversa del marcador celular, o una secuencia complementaria del marcador celular.

En algunas realizaciones, el soporte sólido comprende una partícula sintética, una superficie plana o una combinación de las mismas. En algunas realizaciones, la muestra comprende una célula individual, el método comprende asociar una partícula sintética que comprende la pluralidad de los códigos de barras de oligonucleótidos con la célula individual en la muestra. El método puede comprender lisar la célula individual después de asociar la partícula sintética con la célula individual. En algunas realizaciones, la lisis de la célula individual comprende calentar la muestra, poner en contacto la muestra con un detergente, cambiar el pH de la muestra, o cualquier combinación de los mismos. En algunas realizaciones, la partícula sintética y la célula individual se encuentran en la misma división. En algunas realizaciones, la división es un pocillo o una gotita. En algunas realizaciones, por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos está inmovilizado o parcialmente inmovilizado en la partícula sintética, o por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos está encerrado o parcialmente encerrado en la partícula sintética. En algunas realizaciones, la partícula sintética es perturbable. En algunas realizaciones, la partícula sintética es una partícula de hidrogel perturbable. En algunas realizaciones, la partícula sintética comprende una perla. En algunas realizaciones, la perla comprende una perla de sefarosa, una perla de estreptavidina, una perla de agarosa, una perla magnética, una perla conjugada, una perla conjugada con proteína A, una perla conjugada con proteína G, una perla conjugada con proteína<a>/<g>, una perla conjugada con proteína L, una perla conjugada con oligo(dT), una perla de sílice, una perla similar a la sílice, una microperla antibiotina, una microperla antifluorocromo, o cualquier combinación de las mismas. En algunas realizaciones, la partícula sintética comprende un material seleccionado del grupo que consiste en polidimetilsiloxano (PDMS), poliestireno, vidrio, polipropileno, agarosa, gelatina, hidrogel, paramagnético, cerámica, plástico, vidrio, metilestireno, polímero acrílico, titanio, látex, Sefarosa, celulosa, nylon, silicona, y cualquier combinación de los mismos. En algunas realizaciones, cada uno de la pluralidad de códigos de barras de oligonucleótidos comprende un grupo funcional conector, la partícula sintética comprende un grupo funcional de soporte sólido, y el grupo funcional de soporte y el grupo funcional conector están asociados entre sí. En algunas realizaciones, el grupo funcional conector y el grupo funcional de soporte se seleccionan individualmente del grupo que consiste en C6, biotina, estreptavidina, aminas primarias, aldehídos, cetonas o cualquier combinación de los mismos.

Lo divulgado en la presente incluye kits. En algunas realizaciones, el kit comprende: una pluralidad de códigos de barras de oligonucleótidos, en donde cada uno de la pluralidad de códigos de barras de oligonucleótidos comprende un marcador molecular y una región de unión a la diana, y en donde por lo menos 10 de la pluralidad de códigos de barras de oligonucleótidos comprenden diferentes secuencias de marcador molecular; una transcriptasa inversa; un oligonucleótido de cambio de plantilla que comprende la región de unión a la diana, o una parte de la misma; y una ADN polimerasa que carece de por lo menos una de actividad de exonucleasa 5' a 3' y actividad de exonucleasa de 3' a 5'.

En algunas realizaciones, la transcriptasa inversa comprende una transcriptasa inversa viral, por ejemplo una transcriptasa inversa del virus de la leucemia murina (MLV) o una transcriptasa inversa del virus de la leucemia murina de Moloney (MMLV). En algunas realizaciones, el oligonucleótido de cambio de plantilla comprende uno o más ribonucleótidos 3'. En algunas realizaciones, el oligonucleótido de cambio de plantilla comprende tres ribonucleótidos 3'. En algunas realizaciones, los ribonucleótidos 3' comprenden guanina. El kit puede comprender uno o más de etilenglicol, polietilenglicol, 1,2-propanodiol, dimetilsulfóxido (DMSO), glicerol, formamida, 7-deaza-GTP, acetamida, sal de cloruro de tetrametilamonio, betaína, o cualquier combinación de los mismos.

Lo divulgado en la presente incluye kits. En algunas realizaciones, el kit comprende: una pluralidad de códigos de barras de oligonucleótidos, en donde cada uno de la pluralidad de códigos de barras de oligonucleótidos comprende un marcador molecular y una región de unión a la diana, y en donde por lo menos 10 de la pluralidad de códigos de barras de oligonucleótidos comprenden diferentes secuencias de marcador molecular; una desoxinucleotidil transferasa terminal; y una ADN polimerasa que carece de por lo menos una de la actividad de exonucleasa de 5' a 3' y de la actividad de exonucleasa de 3' a 5'. En algunas realizaciones, la ADN polimerasa comprende un fragmento de Klenow. El kit puede comprender un tampón, un cartucho o ambos. El kit puede comprender uno o más reactivos para una reacción de transcripción inversa y/o una reacción de amplificación. En algunas realizaciones, la región de unión a la diana comprende una secuencia específica de gen, una secuencia de oligo(dT), un multímero aleatorio o cualquier combinación de los mismos. En algunas realizaciones, el código de barras de oligonucleótidos comprende un marcador de muestra idéntico y/o un marcador celular idéntico. En algunas realizaciones, cada marcador de muestra y/o marcador celular de la pluralidad de códigos de barras de oligonucleótidos comprende por lo menos 6 nucleótidos. En algunas realizaciones, cada marcador molecular de la pluralidad de códigos de barras de oligonucleótidos comprende por lo menos 6 nucleótidos.

En algunas realizaciones, por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos está inmovilizado o parcialmente inmovilizado en, o encerrado o parcialmente encerrado en, la partícula sintética. En algunas realizaciones, la partícula sintética es perturbable (por ejemplo, una partícula de hidrogel perturbable). En algunas realizaciones, la partícula sintética comprende una perla. En algunas realizaciones, la perla comprende una perla de sefarosa, una perla de estreptavidina, una perla de agarosa, una perla de hidrogel, una perla magnética, una perla conjugada, una perla conjugada con proteína A, una perla conjugada con proteína G, una perla conjugada con proteína A/G, una perla conjugada con proteína L, una perla conjugada con oligo(dT), una perla de sílice, una perla similar a la sílice, una microperla antibiotina, una microperla antifluorocromo, o cualquier combinación de las mismas. En algunas realizaciones, la partícula sintética comprende un material seleccionado del grupo que consiste en polidimetilsiloxano (PDMS), poliestireno, vidrio, polipropileno, agarosa, gelatina, hidrogel, paramagnético, cerámica, plástico, vidrio, metilestireno, polímero acrílico, titanio, látex, Sefarosa, celulosa, nylon, silicona, y cualquier combinación de los mismos. En algunas realizaciones, cada uno de la pluralidad de códigos de barras de oligonucleótidos comprende un grupo funcional conector, la partícula sintética comprende un grupo funcional de soporte sólido, y el grupo funcional de soporte y el grupo funcional conector están asociados entre sí. En algunas realizaciones, el grupo funcional conector y el grupo funcional soporte se seleccionan individualmente del grupo que consiste en C6, biotina, estreptavidina, aminas primarias, aldehídos, cetonas, y cualquier combinación de los mismos.

BREVE DESCRIPCIÓN DE LOS DIBUJOS

La FIG. 1 ilustra un código de barras ejemplar no limitativo.

La FIG. 2 muestra un flujo de trabajo ejemplar no limitativo de codificación con códigos de barras y recuento digital. La FIG. 3 es una ilustración esquemática que muestra un proceso ejemplar no limitativo para generar una biblioteca indexada de dianas codificadas con códigos de barras en los extremos 3' a partir de una pluralidad de dianas. Las FIGS. 4A-4B muestran una ilustración esquemática de un método ejemplar no limitativo de marcado específico de genes de dianas de ácido nucleico en los extremos 5'.

Las FIGS. 5A-5B muestran una ilustración esquemática de un método ejemplar no limitativo de marcado de dianas de ácido nucleico en los extremos 5' para el análisis del transcriptoma completo.

Las FIGS. 6A-6O muestran ilustraciones esquemáticas de flujos de trabajo ejemplares no limitativos para determinar la secuencia de longitud completa de una diana de ácido nucleico (por ejemplo, un ARNm de receptor inmunitario).

La FIG. 7 es una ilustración esquemática de un flujo de trabajo ejemplar no limitativo para realizar perfiles de expresión de longitud completa.

La FIG. 8 representa una traza ejemplar no limitativa de bioanalizador generada de acuerdo con los métodos proporcionados en la presente.

Las FIGS. 9A-9B muestran esquemas ejemplares no limitativos de la realización de perfiles de expresión de un ARNm de receptor inmune.

Las FIGS. 10A-10D representan datos relacionados con los métodos basados en cebado aleatorio proporcionados en la presente. Se muestran trazas de bioanalizador de productos de TCR (FIGS. 10A-10B) y productos de BCR (FIGS. 10C-10D) obtenidas con un enfoque basado en cebado aleatorio proporcionado en la presente (FIGS. 10A y 10C) en comparación con un método actualmente disponible (FIGS. 10B y 10D).

Las FIGS.11A-11B muestran datos relacionados con los métodos basados en cebado aleatorio proporcionados en la presente. El porcentaje de secuencias VDJ que son de longitud completa (FIG. 11B) y provienen de células (FIG.

11A) se muestra para un enfoque basado en cebado aleatorio proporcionado en la presente (-Pret) en comparación con un método actualmente disponible.

Las FIGS. 12A-12D representan datos relacionados con los métodos basados en cebado aleatorio proporcionados en la presente. Se muestra el emparejamiento de BCR (FIGS. 12A-12B) y el emparejamiento de t Cr (FIGS. 12C-12D) obtenidos con un enfoque basado en cebado aleatorio proporcionado en la presente (FIGS. 12A y 12C) en comparación con un método actualmente disponible (FIGS. 12B y 12D).

DESCRIPCIÓN DETALLADA

En la siguiente descripción detallada se hace referencia a los dibujos acompañantes que forman parte de la misma, En los dibujos, símbolos similares identifican típicamente componentes similares, a menos que el contexto indique lo contrario. No se pretende que las realizaciones ilustrativas descritas en la descripción detallada, los dibujos y las reivindicaciones sean limitativas. Pueden utilizarse otras realizaciones, y pueden introducirse otros cambios, sin apartarse del espíritu o alcance de la materia presentada en la presente. Se entenderá fácilmente que los aspectos de la presente divulgación, como se describen de manera general en la presente y se ilustran en las figuras, pueden disponerse, sustituirse, combinarse, separarse y diseñarse en una amplia variedad de configuraciones diferentes, todas las cuales se contemplan explícitamente en la presente y forman parte de la divulgación de la presente.

La cuantificación de pequeños números de ácidos nucleicos, por ejemplo moléculas de ácido ribonucleótido mensajero (ARNm), es clínicamente importante para determinar, por ejemplo, los genes que se expresan en una célula en diferentes etapas de desarrollo o bajo diferentes condiciones ambientales. Sin embargo, también puede ser muy difícil determinar el número absoluto de moléculas de ácido nucleico (por ejemplo, moléculas de ARNm), especialmente cuando el número de moléculas es muy pequeño. Un método para determinar el número absoluto de moléculas en una muestra es la reacción en cadena de la polimerasa (PCR) digital. Idealmente, la PCR produce una copia idéntica de una molécula en cada ciclo. Sin embargo, la PCR puede tener desventajas como que cada molécula se replica con una probabilidad estocástica, y esta probabilidad varía según el ciclo de<p>C<r>y la secuencia del gen, lo que da como resultado un sesgo de amplificación y mediciones inexactas de la expresión génica. Los códigos de barras estocásticos con marcadores moleculares únicos (también denominados índices moleculares (MIs)) pueden usarse para contar el número de moléculas y corregir el sesgo de amplificación. La codificación con códigos de barras estocásticos, como el ensayo Precise™ (Cellular Research, Inc. (Palo Alto, CA)) y el ensayo Rhapsody™ (Becton, Dickinson and Company (Franklin Lakes, NJ)), pueden corregir el sesgo inducido por la PCR y los pasos de preparación de bibliotecas mediante el uso de marcadores moleculares (ML) para marcar los ARNm durante la transcripción inversa (RT).

El ensayo Precise™ puede utilizar un conjunto no agotable de códigos de barras estocásticos con un gran número, por ejemplo de 6561 a 65536, de secuencias de marcadores moleculares únicas en oligonucleótidos poli(T) para hibridar con todos los ARNm poli(A) de una muestra durante el paso de RT. Un código de barras estocástico puede comprender un sitio de cebado de PCR universal. Durante la RT, las moléculas del gen diana reaccionan aleatoriamente con los códigos de barras estocásticos. Cada molécula diana puede hibridar con un código de barras estocástico resultante para generar moléculas de ácido ribonucleótido complementario (ADNc) codificadas con códigos de barras estocásticos. Después del marcado, las moléculas de ADNc codificadas estocásticamente con códigos de barras a partir de los micropocillos de una placa de micropocillos pueden agruparse en un único tubo para la amplificación por PCR y la secuenciación. Pueden analizarse los datos de secuenciación brutos para producir el número de lecturas, el número de códigos de barras estocásticos con secuencias de marcadores moleculares únicas y el número de moléculas de ARNm.

Lo divulgado en la presente incluye métodos para marcar dianas de ácido nucleico en una muestra. En algunas realizaciones, el método comprende: poner en contacto copias de una diana de ácido nucleico con una pluralidad de códigos de barras de oligonucleótidos, en donde cada código de barras de oligonucleótidos comprende una primera secuencia universal, un marcador molecular, y una región de unión a la diana capaz de hibridar con la diana de ácido nucleico; generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una la región de unión a la diana y un complemento de la región de unión a la diana; hibridar el complemento de la región de unión a la diana de cada molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de uno o más de: (i) un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos, (ii) la propia molécula de ácido nucleico codificada con código de barras, y (iii) una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras; extender los extremos 3'de la pluralidad de moléculas de ácido nucleico codificadas con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas que comprenden cada una el primer marcador molecular y un segundo marcador molecular; amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas usando un cebador específico de la diana capaz de hibridar con una secuencia de la diana de ácido nucleico y un cebador que comprende la primera secuencia universal, generando de este modo una primera pluralidad de amplicones codificados con código de barras que comprenden la secuencia de la diana de ácido nucleico, o una parte de la misma; hibridar cebadores aleatorios con la primera pluralidad de amplicones codificados con código de barras y extender los cebadores aleatorios para generar una pluralidad de productos de extensión, en donde los cebadores aleatorios comprenden una segunda secuencia universal, o un complemento de la misma; y amplificar la pluralidad de productos de extensión usando cebadores capaces de hibridar con la primera secuencia universal y la segunda secuencia universal, o complementos de las mismas, generando de este modo una segunda pluralidad de amplicones codificados con código de barras.

Lo divulgado en la presente incluye métodos para determinar el número de dianas de ácidos nucleicos en una muestra. En algunas realizaciones, el método comprende: poner en contacto copias de una diana de ácido nucleico con una pluralidad de códigos de barras de oligonucleótidos, en donde cada código de barras de oligonucleótidos comprende una primera secuencia universal, un marcador molecular (por ejemplo, un primer marcador molecular), y una región de unión a la diana capaz de hibridar con la diana de ácido nucleico; generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una la región de unión a la diana y un complemento de la región de unión a la diana; hibridar el complemento de la región de unión a la diana de cada molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de uno o más de: (i) un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos, (ii) la propia molécula de ácido nucleico codificada con código de barras, y (iii) una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras; extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas que comprenden cada una el primer marcador molecular y un segundo marcador molecular; amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas usando un cebador específico de la diana capaz de hibridar con una secuencia de la diana de ácido nucleico y un cebador que comprende la primera secuencia universal, generando de este modo una primera pluralidad de amplicones codificados con código de barras que comprenden la secuencia de la diana de ácido nucleico, o una parte de la misma; hibridar cebadores aleatorios con la primera pluralidad de amplicones codificados con código de barras y extender los cebadores aleatorios para generar una pluralidad de productos de extensión, en donde los cebadores aleatorios comprenden una segunda secuencia universal, o un complemento de la misma; amplificar la pluralidad de productos de extensión usando cebadores capaces de hibridar con la primera secuencia universal y la segunda secuencia universal, o complementos de las mismas, generando de este modo una segunda pluralidad de amplicones codificados con código de barras; y determinar el número de copias de la diana de ácido nucleico en la muestra sobre la base del número de primeros marcadores moleculares con secuencias distintas, segundos marcadores moleculares con secuencias distintas, o una combinación de los mismos, asociados con la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos.

Lo divulgado en la presente incluye kits. En algunas realizaciones, el kit comprende: una pluralidad de códigos de barras de oligonucleótidos, en donde cada uno de la pluralidad de códigos de barras de oligonucleótidos comprende un marcador molecular y una región de unión a la diana, y en donde por lo menos 10 de la pluralidad de códigos de barras de oligonucleótidos comprenden diferentes secuencias de marcadores moleculares; una transcriptasa inversa; un oligonucleótido de cambio de plantilla que comprende la región de unión a la diana, o una parte de la misma; y una ADN polimerasa que carece de por lo menos una de la actividad de exonucleasa de 5' a 3' y actividad de exonucleasa de 3' a 5'.

Lo divulgado en la presente incluye kits. En algunas realizaciones, el kit comprende: una pluralidad de códigos de barras de oligonucleótidos, en donde cada uno de la pluralidad de códigos de barras de oligonucleótidos comprende un marcador molecular y una región de unión a la diana, y en donde por lo menos 10 de la pluralidad de códigos de barras de oligonucleótidos comprenden diferentes secuencias de marcadores moleculares; una desoxinucleotidil transferasa terminal; y una ADN polimerasa que carece de por lo menos una de la actividad de exonucleasa de 5' a 3' y actividad de exonucleasa de 3' a 5'.

Definiciones

A menos que se definan de otro modo, los términos técnicos y científicos usados en la presente tienen el mismo significado que el entendido comúnmente por un experto en la técnica a la que pertenece la presente divulgación. Consultar, por ejemplo, Singleton et al., Dictionary of Microbiology and Molecular Biology 2a ed., J. Wiley & Sons (New York, NY 1994); Sambrook et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press (Cold Spring Harbor, NY 1989). A efectos de la presente divulgación, a continuación se definen los siguientes términos.

Como se usa en la presente, el término "adaptador" puede significar una secuencia para facilitar la amplificación o secuenciación de ácidos nucleicos asociados. Los ácidos nucleicos asociados pueden comprender ácidos nucleicos diana. Los ácidos nucleicos asociados pueden comprender uno o más marcadores espaciales, marcadores de diana, marcadores de muestra, marcadores de indexación o secuencias de código de barras (por ejemplo, marcadores moleculares). Los adaptadores pueden ser lineales. Los adaptadores pueden ser adaptadores preadenilados. Los adaptadores pueden ser de cadena doble o sencilla. Uno o más adaptadores pueden estar situados en el extremo 5' o 3' de un ácido nucleico. Cuando los adaptadores comprenden secuencias conocidas en los extremos 5' y 3', las secuencias conocidas pueden ser iguales o diferentes. Un adaptador situado en los extremos 5' y/o 3' de un polinucleótido puede ser capaz de hibridar con uno o más oligonucleótidos inmovilizados en una superficie. En algunas realizaciones, un adaptador puede comprender una secuencia universal. Una secuencia universal puede ser una región de secuencia de nucleótidos que es común para dos o más moléculas de ácido nucleico. Las dos o más moléculas de ácido nucleico también pueden tener regiones de secuencia diferente. Así, por ejemplo, los adaptadores 5' pueden comprender secuencias de ácido nucleico idénticas y/o universales y los adaptadores 3' pueden comprender secuencias idénticas y/o universales. Una secuencia universal que puede estar presente en diferentes miembros de una pluralidad de moléculas de ácido nucleico puede permitir la replicación o amplificación de múltiples secuencias diferentes usando un único cebador universal que sea complementario a la secuencia universal. De manera similar, por lo menos una, dos (por ejemplo, un par) o más secuencias universales que pueden estar presentes en diferentes miembros de una colección de moléculas de ácido nucleico pueden permitir la replicación o amplificación de múltiples secuencias diferentes usando por lo menos uno, dos (por ejemplo, un par) o más cebadores universales únicos que son complementarios a las secuencias universales. Por tanto, un cebador universal incluye una secuencia que puede hibridar con dicha secuencia universal. Las moléculas portadoras de secuencias de ácido nucleico diana pueden modificarse para unir adaptadores universales (por ejemplo, secuencias de ácido nucleico no diana) a uno o ambos extremos de las diferentes secuencias de ácido nucleico diana. El uno o más cebadores universales unidos al ácido nucleico diana pueden proporcionar sitios para la hibridación de cebadores universales. Los uno o más cebadores universales unidos al ácido nucleico diana pueden ser iguales o diferentes entre sí.

Como se usa en la presente, el término "asociado" o "asociado con" puede significar que dos o más especies pueden identificarse como colocalizadas en un punto en el tiempo. Una asociación puede significar que dos o más especies están o estaban dentro de un recipiente similar. Una asociación puede ser una asociación informática. Por ejemplo, puede almacenarse la información digital relativa a dos o más especies y usarse para determinar que una o más de las especies se encontraban colocalizadas en un punto en el tiempo. Una asociación también puede ser una asociación física. En algunas realizaciones, dos o más especies asociadas están "atadas", "unidas" o "inmovilizadas" entre sí o a una superficie sólida o semisólida común. Una asociación puede referirse a medios covalentes o no covalentes para unir marcadores a soportes sólidos o semisólidos como perlas. Una asociación puede ser una unión covalente entre una diana y un marcador. Una asociación puede comprender la hibridación entre dos moléculas (como una molécula diana y un marcador).

Como se usa en la presente, el término "complementario" puede referirse a la capacidad de emparejamiento preciso entre dos nucleótidos. Por ejemplo, si un nucleótido en una posición dada de un ácido nucleico es capaz de formar un enlace de hidrógeno con un nucleótido de otro ácido nucleico, entonces se considera que los dos ácidos nucleicos son complementarios entre sí en esa posición. La complementariedad entre dos moléculas de ácido nucleico de cadena sencilla puede ser "parcial", en la que sólo se unen algunos de los nucleótidos, o puede ser completa cuando hay una complementariedad total entre las moléculas de cadena sencilla. Puede decirse que una primera secuencia de nucleótidos es el "complemento" de una segunda secuencia si la primera secuencia de nucleótidos es complementaria a la segunda secuencia de nucleótidos. Puede decirse que una primera secuencia de nucleótidos es el "complemento inverso" de una segunda secuencia, si la primera secuencia de nucleótidos es complementaria a una secuencia que es inversa (es decir, se invierte el orden de los nucleótidos) de la segunda secuencia. Como se usa en la presente, una secuencia "complementaria" puede referirse a un "complemento" o a un "complemento inverso" de una secuencia. Se entiende de la divulgación que si una molécula puede hibridar con otra molécula puede ser complementaria, o parcialmente complementaria, a la molécula con la que está hibridando.

Como se usa en la presente, el término "recuento digital" puede referirse a un método para estimar un número de moléculas diana en una muestra. El recuento digital puede incluir el paso de determinar un número de marcadores únicos que se han asociado con dianas en una muestra. Esta metodología, que puede ser de naturaleza estocástica, transforma el problema de contar moléculas de uno de localizar e identificar moléculas idénticas a una serie de preguntas digitales de sí/no relativas a la detección de un conjunto de marcadores predefinidos.

Como se usa en la presente, el término "marcador" o "marcadores" puede referirse a códigos de ácidos nucleicos asociados a una diana dentro de una muestra. Un marcador puede ser, por ejemplo, un marcador de ácido nucleico. Un marcador puede ser total o parcialmente amplificable. Un marcador puede ser total o parcialmente secuenciable. Un marcador puede ser una parte de un ácido nucleico nativo que es identificable como distinto. Un marcador puede ser una secuencia conocida. Un marcador puede comprender una unión de secuencias de ácido nucleico, por ejemplo una unión de una secuencia nativa y no nativa. Como se usa en la presente, el término "marcador" puede usarse indistintamente con los términos "índice", "etiqueta" o "marcador-etiqueta". Los marcadores pueden transmitir información. Por ejemplo, en varias realizaciones, los marcadores pueden usarse para determinar la identidad de una muestra, una fuente de una muestra, la identidad de una célula y/o una diana.

Como se usa en la presente, el término "depósitos no agotables" puede referirse a un grupo de códigos de barras (por ejemplo, códigos de barras estocásticos) compuesto por muchos marcadores diferentes. Un depósito no agotable puede incluir un gran número de códigos de barras diferentes, de tal manera que cuando el depósito no agotable se asocia con un grupo de objetivos, es probable que cada objetivo se asocie con un código de barras único. La unicidad de cada molécula diana marcada puede determinarse mediante la estadística de elección aleatoria, y depende del número de copias de moléculas diana idénticas en la colección en comparación con la diversidad de marcadores. El tamaño del conjunto resultante de moléculas diana marcadas puede determinarse por la naturaleza estocástica del proceso de codificación con código de barras, y el análisis del número de códigos de barras detectados permite entonces calcular el número de moléculas diana presentes en la colección o muestra original. Cuando la proporción entre el número de copias de una molécula diana presente y el número de códigos de barras únicos es baja, las moléculas diana marcadas son altamente únicas (es decir, hay una probabilidad muy baja de que se haya marcado más de una molécula diana con un marcador dado).

Como se usa en la presente, el término "ácido nucleico" se refiere a una secuencia de polinucleótidos o a un fragmento de la misma. Un ácido nucleico puede comprender nucleótidos. Un ácido nucleico puede ser exógeno o endógeno a una célula. Un ácido nucleico puede existir en un entorno libre de células. Un ácido nucleico puede ser un gen o un fragmento del mismo. Un ácido nucleico puede ser ADN. Un ácido nucleico puede ser ARN. Un ácido nucleico puede comprender uno o más análogos (por ejemplo, una estructura principal, azúcar o nucleobase alteradas). Algunos ejemplos no limitativos de análogos incluyen: 5-bromouracilo, ácido nucleico peptídico, ácido xeno nucleico, morfolinos, ácidos nucleicos bloqueados, ácidos nucleicos glicólicos, ácidos nucleicos de treosa, dideoxinucleótidos, cordicepina, 7-deaza-GTP, fluoróforos (por ejemplo, rodamina o fluoresceína enlazada al azúcar), nucleótidos que contienen tioles, nucleótidos enlazados a biotina, análogos de bases fluorescentes, islas de CpG, metil-7-guanosina, nucleótidos metilados, inosina, tiouridina, pseudouridina, dihidrouridina, queuosina y wiosina. Los términos "ácido nucleico", "polinucleótido", "polinucleótido diana" y "ácido nucleico diana" pueden usarse indistintamente.

Un ácido nucleico puede comprender una o más modificaciones (por ejemplo, una modificación de base, una modificación de la estructura principal), para proporcionar al ácido nucleico una característica nueva o mejorada (por ejemplo, estabilidad mejorada). Un ácido nucleico puede comprender una etiqueta de afinidad de ácido nucleico. Un nucleósido puede ser una combinación de base-azúcar. La porción de base del nucleósido puede ser una base heterocíclica. Las dos clases más comunes de tales bases heterocíclicas son las purinas y las pirimidinas. Los nucleótidos pueden ser nucleósidos que incluyen además un grupo fosfato enlazado covalentemente a la porción de azúcar del nucleósido. En el caso de los nucleósidos que incluyen un azúcar de pentofuranosilo, el grupo fosfato puede estar enlazado a la fracción hidroxilo 2', 3' o 5' del azúcar. Al formar ácidos nucleicos, los grupos fosfato pueden enlazar covalentemente nucleósidos adyacentes entre sí para formar un compuesto polimérico lineal. A su vez, los extremos respectivos de este compuesto polimérico lineal pueden unirse adicionalmente para formar un compuesto circular; sin embargo, generalmente son adecuados los compuestos lineales. Además, los compuestos lineales pueden tener complementariedad interna de bases de nucleótidos y, por lo tanto, pueden plegarse de manera que produzcan un compuesto total o parcialmente de cadena doble. Dentro de los ácidos nucleicos, los grupos fosfato pueden denominarse comúnmente como formadores de la estructura principal internucleosídica del ácido nucleico. El enlace o estructura principal puede ser un enlace fosfodiéster 3' a 5'.

Un ácido nucleico puede comprender una estructura principal modificada y/o enlaces internucleosídicos modificados. Las estructuras principales modificadas pueden incluir las que conservan un átomo de fósforo en la estructura principal y las que no tienen un átomo de fósforo en la estructura principal. Las estructuras principales de ácidos nucleicos modificados adecuadas que contienen un átomo de fósforo pueden incluir, por ejemplo, fosforotioatos, fosforotioatos quirales, fosforoditioatos, fosfotriesteres, aminoalquilfosfotriesteres, fosfonatos de metilo y otros alquilos, como fosfonatos de 3'-alquileno, fosfonatos de 5'-alquileno, fosfonatos quirales, fosfinatos, fosforamidatos, incluyendo 3'-aminofosforamidato y aminoalquilfosforamidatos, fosforodiamidatos, tionofosforamidatos, tionoalquilfosfonatos, tionoalquilfosfotriesteres, selenofosfatos, y boranofosfatos que tienen enlaces normales 3'-5', análogos con enlaces 2'-5' y aquellos que tienen polaridad invertida en los que uno o más enlaces internucleotídicos son enlaces de 3' a 3', de 5' a 5' o de 2' a 2'.

Un ácido nucleico puede comprender estructuras principales polinucleotídicas que están formadas por enlaces internucleosídicos de alquilo o cicloalquilo de cadena corta, enlaces internucleosídicos de heteroátomos y alquilo o cicloalquilo mixtos, o uno o más enlaces intemucleosídicos de heteroátomos o heterocíclicos de cadena corta. Estos pueden incluir los que tienen enlaces morfolinos (formados en parte de la porción de azúcar de un nucleósido); estructuras principales de siloxano; estructuras principales de sulfuro, sulfóxido y sulfona; estructuras principales de formacetilo y tioformacetilo; estructuras principales de metilen formacetilo y tioformacetilo; estructuras principales de riboacetilo; estructuras principales que contienen alqueno; estructuras principales de sulfamato; estructuras principales de metilenimino y metilenhidrazino; estructuras principales de sulfonato y sulfonamida; estructuras principales de amida; y otras que tienen partes componentes mixtas de N, O, S y CH2.

Un ácido nucleico puede comprender un mimético de ácido nucleico. Se pretende que el término "mimético" pueda incluir polinucleótidos en los que sólo el anillo de furanosa o tanto el anillo de furanosa como el enlace internucleotídico se sustituyen por grupos no furanosa; la sustitución de sólo el anillo de furanosa también puede denominarse sustituto de azúcar. La fracción de base heterocíclica o una fracción de base heterocíclica modificada puede mantenerse para la hibridación con un ácido nucleico diana apropiado. Uno de tales ácidos nucleicos puede ser un ácido nucleico peptídico (PNA). En un PNA, la estructura principal de azúcar de un polinucleótido puede sustituirse por una estructura principal que contenga amida, en particular una estructura principal de aminoetilglicina. Los nucleótidos pueden conservarse y unirse directa o indirectamente a los átomos de nitrógeno aza de la porción amida de la estructura principal. La estructura principal de los compuestos de ANP puede comprender dos o más unidades de aminoetilglicina enlazadas, lo que confiere al ANP una estructura principal que contiene amida. Las fracciones de base heterocíclica pueden unirse directa o indirectamente a los átomos de nitrógeno aza de la porción amida de la estructura principal.

Un ácido nucleico puede comprender una estructura de morfolino. Por ejemplo, un ácido nucleico puede comprender un anillo morfolino de 6 miembros en lugar de un anillo ribosa. En algunas de estas realizaciones, un enlace fosfodiéster puede sustituirse por un fosforodiamidato u otro enlace internucleosídico no fosfodiéster.

Un ácido nucleico puede comprender unidades morfolino (por ejemplo, ácido nucleico de morfolino) enlazadas que tienen bases heterocíclicas unidas al anillo morfolino. Los grupos de enlace pueden enlazar las unidades monoméricas de morfolino en un ácido nucleico de morfolino. Los compuestos oligoméricos no iónicos basados en morfolinos pueden tener menos interacciones no deseadas con las proteínas celulares. Los polinucleótidos basados en morfolinos pueden ser imitadores no iónicos de ácidos nucleicos. Dentro de la clase morfolino pueden unirse una variedad de compuestos usando diferentes grupos de enlace. Otra clase de miméticos de polinucleótidos puede denominarse ácidos nucleicos ciclohexenílicos (CeNA). El anillo de furanosa presente normalmente en una molécula de ácido nucleico puede sustituirse por un anillo de ciclohexenilo. Pueden prepararse y usarse monómeros de fosforamidita protegidos con DMT de CeNA para la síntesis de compuestos oligoméricos mediante química de fosforamidita. La incorporación de monómeros de CeNA en una cadena de ácido nucleico puede aumentar la estabilidad de un híbrido ADN/ARN. Los oligoadenilatos de CeNA pueden formar complejos con complementos de ácido nucleico con una estabilidad similar a la de los complejos nativos. Una modificación adicional puede incluir ácidos nucleicos bloqueados (LNA) en los que el grupo 2'-hidroxilo está enlazado al átomo de carbono 4' del anillo de azúcar formando de este modo un enlace 2'-C, 4'-C-oximetileno formando de este modo una fracción de azúcar bicíclica. El enlace puede ser un grupo metileno (-CH2), que une el átomo de oxígeno 2' y el átomo de carbono 4' en dondenes 1 o 2. El LNA y los análogos del LNA pueden mostrar estabilidades térmicas dúplex muy altas con el ácido nucleico complementario (Tm=+3 a 10° C), estabilidad frente a la degradación 3'-exonucleolítica y buenas propiedades de solubilidad.

Un ácido nucleico también puede incluir modificaciones o sustituciones de nucleobases (a menudo denominadas simplemente "bases"). Como se usan en la presente, las nucleobases "no modificadas" o "naturales" pueden incluir las bases de purina, (por ejemplo, adenina (A) y guanina (G)), y las bases de pirimidina, (por ejemplo, timina (T), citosina (C) y uracilo (U)). Las nucleobases modificadas pueden incluir otras nucleobases sintéticas y naturales, como la 5-metilcitosina (5-me-C), la 5-hidroximetilcitosina, la xantina, la hipoxantina, la 2-aminoadenina, la 6-metil y otros derivados alquílicos de la adenina y la guanina, 2-propil y otros derivados alquílicos de la adenina y la guanina, 2-tiouracilo, 2-tiotimina y 2-tiocitosina, 5-halouracilo y citosina, 5-propinil (-C=C-CH3) uracilo y citosina y otros derivados alquínicos de bases de pirimidina, 6-azo uracilo, citosina y timina, 5-uracilo (pseudouracilo), 4-tiouracilo, 8-halo, 8-amino, 8-tiol, 8-tioalquilo, 8-hidroxilo y otras adeninas y guaninas 8-sustituidas, 5-halo particularmente 5-bromo, 5-trifluorometil y otros uracilos y citosinas 5-sustituidos, 7-metilguanina y 7-metiladenina, 2-F-adenina, 2-aminoadenina, 8-azaguanina y 8-azaadenina, 7-deazaguanina y 7-deazaadenina y 3-deazaguanina y 3-deazaadenina. Las nucleobases modificadas pueden incluir pirimidinas tricíclicas como la fenoxazina citidina(1H-pirimido(5,4-b)(1,4)benzoxazin-2(3H)-ona), fenotiazina citidina (1H-pirimido(5,4-b)(1,4)benzotiazin-2(3H)-ona), abrazaderas G como una fenoxazina citidina sustituida (por ejemplo, 9-(2-aminoetoxi)-H-pirimido(5,4-(b) (1,4)benzoxazin-2(3H)-ona), fenotiazina citidina (1H-pirimido(5,4-b)(1,4)benzotiazin-2(3H)-ona), abrazaderas G como una fenoxazina citidina sustituida (por ejemplo, 9-(2-aminoetoxi)-H-pirimido(5,4-(b) (1,4)benzoxazin-2(3H)-ona), carbazol citidina (2H-pirimido(4,5-b)indol-2-ona), piridoindol citidina (H-pirido(3',2':4,5)pirrolo[2,3-d]pirimidin-2-ona).

Como se usa en la presente, el término "muestra" puede referirse a una composición que comprende dianas. Las muestras adecuadas para el análisis mediante los métodos, dispositivos y sistemas divulgados incluyen células, tejidos, órganos u organismos.

Como se usa en la presente, el término "dispositivo de muestreo" o "dispositivo" puede referirse a un dispositivo que puede tomar una sección de una muestra y/o colocar la sección en un sustrato. Un dispositivo de muestreo puede referirse, por ejemplo, a una máquina de clasificación celular activada por fluorescencia (FACS), una máquina de clasificación celular, una aguja de biopsia, un dispositivo de biopsia, un dispositivo de seccionamiento de tejidos, un dispositivo de microfluidos, una rejilla de cuchillas y/o un micrótomo.

Como se usa en la presente, el término "soporte sólido" puede referirse a superficies sólidas o semisólidas discretas a las que pueden adherirse una pluralidad de códigos de barras (por ejemplo, códigos de barras estocásticos). Un soporte sólido puede abarcar cualquier tipo de esfera, bola, cojinete, cilindro u otra configuración similar sólida, porosa o hueca compuesta de plástico, cerámica, metal o material polimérico (por ejemplo, hidrogel) sobre la que puede inmovilizarse un ácido nucleico (por ejemplo, covalente o no covalentemente). Un soporte sólido puede comprender una partícula discreta que puede ser esférica (por ejemplo, microesferas) o tener una forma no esférica o irregular, como cúbica, cuboide, piramidal, cilíndrica, cónica, oblonga o con forma de disco, y similares. Una perla puede tener una forma no esférica. Una pluralidad de soportes sólidos espaciados en una matriz puede no comprender un sustrato. Con el término "perla" puede usarse indistintamente un soporte sólido.

Como se usa en la presente, el término "código de barras estocástico" puede referirse a una secuencia de polinucleótidos que comprende marcadores de la presente divulgación. Un código de barras estocástico puede ser una secuencia de polinucleótidos que puede usarse para codificar con códigos de barras estocásticos. Los códigos de barras estocásticos pueden usarse para cuantificar objetivos dentro de una muestra. Los códigos de barras estocásticos pueden usarse para controlar los errores que pueden producirse después de asociar un marcador a una diana. Por ejemplo, un código de barras estocástico puede usarse para evaluar errores de amplificación o secuenciación. Un código de barras estocástico asociado a una diana puede denominarse código de barras estocástico-diana o código de barras estocástico-etiqueta-diana.

Como se usa en la presente, el término "código de barras estocástico específico de gen" puede referirse a una secuencia de polinucleótidos que comprende marcadores y una región de unión a la diana que es específica de un gen. Un código de barras estocástico puede ser una secuencia de polinucleótidos que puede usarse para codificar con códigos de barras estocásticos. Los códigos de barras estocásticos pueden usarse para cuantificar dianas dentro de una muestra. Los códigos de barras estocásticos pueden usarse para controlar los errores que pueden producirse después de asociar un marcador a una diana. Por ejemplo, un código de barras estocástico puede usarse para evaluar errores de amplificación o secuenciación. Un código de barras estocástico asociado a una diana puede denominarse código de barras estocástico-diana o código de barras estocástico-etiqueta-diana.

Como se usa en la presente, el término "codificación con códigos de barras estocásticos" puede referirse al marcado aleatorio (por ejemplo, codificación con código de barras) de ácidos nucleicos. La codificación con códigos de barras estocásticos puede usar una estrategia de Poisson recursiva para asociar y cuantificar marcadores asociadas a dianas. Como se usa en la presente, el término "código de barras estocástico" puede usarse indistintamente con "marcado estocástico".

Como se usa aquí, el término "diana" puede referirse a una composición que puede asociarse a un código de barras (por ejemplo, un código de barras estocástico). Las dianas ejemplares adecuadas para el análisis mediante los métodos, dispositivos y sistemas divulgados incluyen oligonucleótidos, ADN, ARN, ARNm, microARN, ARNt y similares. Las dianas pueden ser de cadena sencilla o doble. En algunas realizaciones, las dianas pueden ser proteínas, péptidos o polipéptidos. En algunas realizaciones, las dianas son lípidos. Como se usa en la presente, "diana" puede usarse indistintamente con "especie".

Como se usa en la presente, el término "transcriptasas inversas" puede referirse a un grupo de enzimas que tienen actividad de transcriptasa inversa (es decir, que catalizan la síntesis de ADN a partir de una plantilla de ARN). En general, tales enzimas incluyen, pero no se limitan a, la transcriptasa inversa retroviral, la transcriptasa inversa retrotransposónica, las transcriptasas inversas retroplásmidas, las transcriptasas inversas retrónicas, las transcriptasas inversas bacterianas, las transcriptasas inversas derivadas de intrones del grupo II y mutantes, variantes o derivados de las mismas. Las transcriptasas inversas no retrovirales incluyen transcriptasas inversas de retrotransposones no LTR, transcriptasas inversas de retroplásmidos, transcriptasas inversas de retrones y transcriptasas inversas de intrones del grupo II. Los ejemplos de transcriptasas inversas de intrones del grupo II son la transcriptasa inversa de intrones LI.LtrB deLactococcus lactis,la transcriptasa inversa de intrones TeI4c deThermosynechococcuselongatus o la transcriptasa inversa de intrones GsI-IIC deGeobacillus stearothermophilus.Otras clases de transcriptasas inversas pueden incluir muchas clases de transcriptasas inversas no retrovirales (es decir, retrones, intrones del grupo II y retroelementos generadores de diversidad, entre otras).

Los términos "cebador de adaptador universal", "adaptador cebador universal" o "secuencia de adaptador universal" se usan indistintamente para referirse a una secuencia de nucleótidos que puede usarse para hibridar con códigos de barras (por ejemplo, códigos de barras estocásticos) para generar códigos de barras específicos de genes. Una secuencia de adaptador universal puede, por ejemplo, ser una secuencia conocida que es universal en todos los códigos de barras usados en los métodos de la divulgación. Por ejemplo, cuando se están marcando múltiples dianas usando los métodos divulgados en la presente, cada una de las secuencias específicas de la diana puede enlazarse a la misma secuencia de adaptador universal. En algunas realizaciones, en los métodos divulgados en la presente puede usarse más de una secuencia de adaptador universal. Por ejemplo, cuando se marcan múltiples dianas usando los métodos divulgados en la presente, por lo menos dos de las secuencias específicas de la diana se enlazan a diferentes secuencias de adaptadores universales. Un cebador de adaptador universal y su complemento pueden incluirse en dos oligonucleótidos, uno de los cuales comprende una secuencia específica de la diana y el otro comprende un código de barras. Por ejemplo, una secuencia de adaptador universal puede formar parte de un oligonucleótido que comprenda una secuencia específica de diana para generar una secuencia de nucleótidos que sea complementaria a un ácido nucleico diana. Un segundo oligonucleótido que comprende un código de barras y una secuencia complementaria de la secuencia de adaptador universal puede hibridar con la secuencia de nucleótidos y generar un código de barras específico de la diana (por ejemplo, un código de barras estocástico específico de la diana). En algunas realizaciones, un cebador de adaptador universal tiene una secuencia que es diferente de un cebador de PCR universal usado en los métodos de la presente divulgación.

Códigos de barras

La codificación con códigos de barras, como la codificación con códigos de barras estocástico, se ha descrito en, por ejemplo, la US 2015/0299784, la WO 2015/031691, y Fu et al, Proc Natl Acad Sci U.S.A. 31 de mayo de 2011; 108(22):9026-31. En algunas realizaciones, el código de barras divulgado en la presente puede ser un código de barras estocástico que puede ser una secuencia de polinucleótidos que puede usarse para marcar estocásticamente (por ejemplo, código de barras, etiqueta) una diana. Los códigos de barras pueden denominarse códigos de barras estocásticos si la proporción entre el número de secuencias de código de barras diferentes de los códigos de barras estocásticos y el número de apariciones de cualquiera de las dianas que se van a marcar puede ser, o ser de aproximadamente, 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 11:1, 12:1, 13:1, 14:1, 15:1, 16:1, 17:1, 18:1, 19:1, 20:1, 30:1, 40:1, 50:1,60:1, 70:1, 80:1, 90:1, 100:1, o un número o intervalo entre dos cualesquiera de estos valores. Una diana puede ser una especie de ARNm que comprende moléculas de ARNm con secuencias idénticas o casi idénticas. Los códigos de barras pueden denominarse códigos de barras estocásticos si la proporción entre el número de secuencias de código de barras diferentes de los códigos de barras estocásticos y el número de apariciones de cualquiera de las dianas que se van a marcar es por lo menos, o como máximo, de 1:1,2:1, 3:1,4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 11:1, 12:1, 13:1, 14:1, 15:1, 16:1, 17:1, 18:1, 19:1, 20:1, 30:1,40:1, 50:1,60:1, 70:1, 80:1, 90:1 o 100:1. Las secuencias de códigos de barras estocásticos pueden denominarse marcadores moleculares.

Un código de barras, por ejemplo un código de barras estocástico, puede comprender uno o más marcadores. Los marcadores ejemplares pueden incluir un marcador universal, un marcador celular, una secuencia de código de barras (por ejemplo, un marcador molecular), un marcador de muestra, un marcador de placa, un marcador espacial y/o un marcador preespacial. La FIG. 1 ilustra un código de barras ejemplar 104 con un marcador espacial. El código de barras 104 puede comprender una amina 5' que puede enlazar el código de barras a un soporte sólido 105. El código de barras puede comprender un marcador universal, un marcador de dimensión, un marcador espacial, un marcador celular y/o un marcador molecular. El orden de los diferentes marcadores (incluyendo pero no limitado al marcador universal, el marcador de dimensión, el marcador espacial, el marcador celular y el marcador molecular) en el código de barras puede variar. Por ejemplo, como se muestra en la FIG. 1, el marcador universal puede ser el marcador más 5', y el marcador molecular puede ser el marcador más 3'. El marcador espacial, el marcador de dimensión y el marcador celular pueden estar en cualquier orden. En algunas realizaciones, el marcador universal, el marcador espacial, el marcador de dimensión, el marcador celular y el marcador molecular están en cualquier orden. El código de barras puede incluir una región de unión a la diana. La región de unión a la diana puede interactuar con una diana (por ejemplo, ácido nucleico, ARN, ARNm, ADN diana) en una muestra. Por ejemplo, una región de unión a la diana puede comprender una secuencia oligo(dT) que puede interactuar con colas poli(A) de ARNm. En algunos casos, los marcadores del código de barras (por ejemplo, el marcador universal, el marcador de dimensión, el marcador espacial, el marcador celular y la secuencia del código de barras) pueden estar separados por 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 o más nucleótidos.

Un marcador, por ejemplo el marcador celular, puede comprender un conjunto único de subsecuencias de ácidos nucleicos de longitud definida, por ejemplo de siete nucleótidos cada una (equivalente al número de bits usados en algunos códigos de corrección de errores de Hamming), que pueden diseñarse para proporcionar capacidad de corrección de errores. El conjunto de subsecuencias de corrección de errores comprende siete secuencias de nucleótidos y puede diseñarse de tal manera que cualquier combinación por pares de secuencias en el conjunto muestre una "distancia genética" definida (o número de bases malapareadas); por ejemplo, puede diseñarse un conjunto de subsecuencias de corrección de errores para que muestre una distancia genética de tres nucleótidos. En este caso, la revisión de las secuencias de corrección de errores en el conjunto de datos de secuencia para moléculas de ácido nucleico diana marcadas (descritas más detalladamente a continuación) puede permitir detectar o corregir errores de amplificación o secuenciación. En algunas realizaciones, la longitud de las subsecuencias de ácido nucleico usadas para crear códigos de corrección de errores puede variar, por ejemplo, pueden tener, o tener aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 31, 40, 50, o un número o un intervalo entre dos cualesquiera de estos valores, nucleótidos de longitud. En algunas realizaciones, pueden usarse subsecuencias de ácidos nucleicos de otras longitudes para crear códigos de corrección de errores.

El código de barras puede comprender una región de unión a la diana. La región de unión a la diana puede interactuar con una diana en una muestra. La diana puede ser, o comprender, ácidos ribonucleicos (ARN), ARN mensajeros (ARNm), microARN, ARN interferente pequeño (ARNip), productos de degradación del ARN, ARN que comprenden cada uno una cola poli(A), o cualquier combinación de los mismos. En algunas realizaciones, la pluralidad de dianas puede incluir ácidos desoxirribonucleicos (ADN).

En algunas realizaciones, una región de unión a la diana puede comprender una secuencia oligo(dT) que puede interactuar con colas poli(A) de ARNm. Uno o más de los marcadores del código de barras (por ejemplo, el marcador universal, el marcador de dimensión, el marcador espacial, el marcador celular y las secuencias del código de barras (por ejemplo, el marcador molecular)) pueden estar separados por un espaciador de otro u otros dos de los marcadores restantes del código de barras. El espaciador puede tener, por ejemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, o 20, o más nucleótidos. En algunas realizaciones, ninguno de los marcadores del código de barras está separado por un espaciador.

Marcadores universales

Un código de barras puede comprender uno o más marcadores universales. En algunas realizaciones, el uno o más marcadores universales pueden ser los mismos para todos los códigos de barras del conjunto de códigos de barras unidos a un soporte sólido dado. En algunas realizaciones, el uno o más marcadores universales pueden ser los mismos para todos los códigos de barras unidos a una pluralidad de perlas. En algunas realizaciones, un marcador universal puede comprender una secuencia de ácido nucleico capaz de hibridar con un cebador de secuenciación. Los cebadores de secuenciación pueden usarse para secuenciar códigos de barras que comprenden un marcador universal. Los cebadores de secuenciación (por ejemplo, cebadores de secuenciación universales) pueden comprender cebadores de secuenciación asociados con plataformas de secuenciación de alto rendimiento. En algunas realizaciones, un marcador universal puede comprender una secuencia de ácido nucleico capaz de hibridar con un cebador de PCR. En algunas realizaciones, el marcador universal puede comprender una secuencia de ácido nucleico capaz de hibridar con un cebador de secuenciación y un cebador de PCR. La secuencia de ácido nucleico del marcador universal capaz de hibridar con un cebador de secuenciación o de PCR puede denominarse sitio de unión a cebador. Un marcador universal puede comprender una secuencia que puede usarse para iniciar la transcripción del código de barras. Un marcador universal puede comprender una secuencia que puede usarse para la extensión del código de barras o de una región dentro del código de barras. Un marcador universal puede tener, o tener aproximadamente, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, o un número o un intervalo entre dos cualesquiera de estos valores, nucleótidos de longitud. Por ejemplo, un marcador universal puede comprender por lo menos aproximadamente 10 nucleótidos. Un marcador universal puede tener por lo menos, o como máximo, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200 o 300 nucleótidos de longitud. En algunas realizaciones, un conector escindible o nucleótido modificado puede formar parte de la secuencia del marcador universal para permitir que el código de barras se escinda del soporte.

Marcadores de dimensión

Un código de barras puede comprender uno o más marcadores de dimensión. En algunas realizaciones, un marcador de dimensión puede comprender una secuencia de ácido nucleico que proporciona información sobre una dimensión en la que se produjo el marcado (por ejemplo, marcado estocástico). Por ejemplo, un marcador de dimensión puede proporcionar información sobre el momento en el que se marcó la diana con un código de barras. Un marcador de dimensión puede asociarse a un momento de codificación con código de barras (por ejemplo, codificación con código de barras estocástico) en una muestra. Un marcador de dimensión puede activarse en el momento del marcado. Diferentes marcadores de dimensión pueden activarse en diferentes momentos. El marcador de dimensión proporciona información sobre el orden en el que se codificaron las dianas, grupos de dianas y/o muestras con códigos de barras. Por ejemplo, una población de células puede codificarse con códigos de barras en la fase G0 del ciclo celular. Las células pueden ser pulsadas de nuevo con códigos de barras (por ejemplo, códigos de barras estocásticos) en la fase G1 del ciclo celular. Las células pueden ser pulsadas de nuevo con códigos de barras en la fase S del ciclo celular, y así sucesivamente. Los códigos de barras en cada pulso (por ejemplo, cada fase del ciclo celular), pueden comprender diferentes marcadores de dimensión. De esta manera, el marcador de dimensión proporciona información sobre qué objetivos se marcaron y en qué fase del ciclo celular. Los marcadores de dimensión pueden interrogar muchos momentos biológicos diferentes. Los momentos biológicos ejemplares pueden incluir, entre otros, el ciclo celular, la transcripción (por ejemplo, el inicio de la transcripción) y la degradación de la transcripción. En otro ejemplo, puede marcarse una muestra (por ejemplo, una célula, una población de células) antes y/o después del tratamiento con un fármaco y/o terapia. Los cambios en el número de copias de distintas dianas pueden ser indicativos de la respuesta de la muestra al fármaco y/o terapia.

Un marcador de dimensión puede ser activable. Un marcador de dimensión activable puede activarse en un momento específico. El marcador activable puede activarse, por ejemplo, constitutivamente (por ejemplo, no apagarse). El marcador de dimensión activable puede activarse, por ejemplo, reversiblemente (por ejemplo, el marcador de dimensión activable puede encenderse y apagarse). El marcador de dimensión puede ser activable, por ejemplo, reversiblemente por lo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, o más veces. El marcador de dimensión puede ser activable reversiblemente, por ejemplo, por lo menos 1,2, 3, 4, 5, 6, 7, 8, 9, 10 o más veces. En algunas realizaciones, el marcador de dimensión puede activarse con fluorescencia, luz, un evento químico (por ejemplo, escisión, ligadura de otra molécula, adición de modificaciones (por ejemplo, pegilarse, sumoilarse, acetilarse, metilarse, desacetilarse, desmetilarse), un evento fotoquímico (por ejemplo, fotocaptura), y la introducción de un nucleótido no natural.

El marcador de dimensión puede, en algunas realizaciones, ser idéntico para todos los códigos de barras (por ejemplo, códigos de barras estocásticos) unidos a un soporte sólido dado (por ejemplo, una perla), pero diferente para diferentes soportes sólidos (por ejemplo, perlas). En algunas realizaciones, por lo menos el 60%, 70%, 80%, 85%, 90%, 95%, 97%, 99% o 100% de los códigos de barras en el mismo soporte sólido pueden comprender el mismo marcador de dimensión. En algunas realizaciones, por lo menos el 60% de los códigos de barras en el mismo soporte sólido pueden incluir el mismo marcador de dimensión. En algunas realizaciones, por lo menos el 95% de los códigos de barras en el mismo soporte sólido pueden incluir el mismo marcador de dimensión.

En una pluralidad de soportes sólidos (por ejemplo, cuentas) puede haber tantas como 106 o más secuencias de marcadores de dimensión únicas representadas. Un marcador de dimensión puede tener, o tener aproximadamente 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, o un número o un intervalo entre dos cualesquiera de estos valores, nucleótidos de longitud. Un marcador de dimensión puede tener por lo menos, o como máximo, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200 o 300 nucleótidos de longitud. Un marcador de dimensión puede comprender entre aproximadamente 5 y aproximadamente 200 nucleótidos. Un marcador de dimensión puede comprender entre aproximadamente 10 y aproximadamente 150 nucleótidos. Un marcador de dimensión puede comprender entre aproximadamente 20 y aproximadamente 125 nucleótidos de longitud.

Marcadores espaciales

Un código de barras puede incluir uno o más marcadores espaciales. En algunas realizaciones, un marcador espacial puede comprender una secuencia de ácido nucleico que proporciona información sobre la orientación espacial de una molécula diana asociada al código de barras. Un marcador espacial puede asociarse a una coordenada en una muestra. La coordenada puede ser una coordenada fija. Por ejemplo, una coordenada puede ser fija con respecto a un sustrato. Un marcador espacial puede estar en referencia a una cuadrícula bi- o tridimensional. Una coordenada puede fijarse en referencia a un punto de referencia. El punto de referencia puede ser identificable en el espacio. Un punto de referencia puede ser una estructura de la que puedan obtenerse imágenes. Un punto de referencia puede ser una estructura biológica, por ejemplo un punto de referencia anatómico. Un punto de referencia puede ser un punto de referencia celular, por ejemplo un orgánulo. Un punto de referencia puede ser un punto de referencia no natural, como una estructura con un identificador identificable, como un código de colores, un código de barras, una propiedad magnética, fluorescentes, radiactividad, o un tamaño o forma únicos. Un marcador espacial puede asociarse a una división física (por ejemplo, un pocillo, un recipiente o una gotita). En algunas realizaciones, se usan múltiples marcadores espaciales juntos para codificar una o más posiciones en el espacio.

El marcador espacial puede ser idéntico para todos los códigos de barras unidos a un soporte sólido determinado (por ejemplo, una perla), pero diferente para diferentes soportes sólidos (por ejemplo, perlas). En algunas realizaciones, el porcentaje de códigos de barras en el mismo soporte sólido que comprenden el mismo marcador espacial puede ser, o ser aproximadamente, del 60%, 70%, 80%, 85%, 90%, 95%, 97%, 99%, 100%, o un número o un intervalo entre dos cualesquiera de estos valores. En algunas realizaciones, el porcentaje de códigos de barras en el mismo soporte sólido que comprenden el mismo marcador espacial puede ser como mínimo, o como máximo, del 60%, 70%, 80%, 85%, 90%, 95%, 97%, 99% o 100%. En algunas realizaciones, por lo menos el 60% de los códigos de barras del mismo soporte sólido pueden incluir el mismo marcador espacial. En algunas realizaciones, por lo menos el 95% de los códigos de barras del mismo soporte sólido pueden incluir el mismo marcador espacial.

Puede haber tantos como 106 o más secuencias de marcadores espaciales únicas representadas en una pluralidad de soportes sólidos (por ejemplo, perlas). Un marcador espacial puede tener, o tener aproximadamente, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, o un número o un intervalo entre dos cualesquiera de estos valores, nucleótidos de longitud. Un marcador espacial puede tener por lo menos o como máximo 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200 o 300 nucleótidos de longitud. Un marcador espacial puede comprender entre aproximadamente 5 y aproximadamente 200 nucleótidos, por ejemplo, entre aproximadamente 10 y aproximadamente 150 nucleótidos, o entre aproximadamente 20 y aproximadamente 125 nucleótidos de longitud.

Marcadores celulares

Un código de barras (por ejemplo, un código de barras estocástico) puede comprender uno o más marcadores celulares. En algunas realizaciones, un marcador celular puede comprender una secuencia de ácido nucleico que proporciona información para determinar qué ácido nucleico diana se originó a partir de qué célula. En algunas realizaciones, el marcador celular es idéntico para todos los códigos de barras unidos a un soporte sólido dado (por ejemplo, una perla), pero diferente para diferentes soportes sólidos (por ejemplo, perlas). En algunas realizaciones, el porcentaje de códigos de barras en el mismo soporte sólido que comprenden el mismo marcador celular puede ser, o ser de aproximadamente el 60%, 70%, 80%, 85%, 90%, 95%, 97%, 99%, 100%, o un número o un intervalo entre dos cualesquiera de estos valores. En algunas realizaciones, el porcentaje de códigos de barras en el mismo soporte sólido que comprenden el mismo marcador celular puede ser, o ser de aproximadamente el 60%, 70%, 80%, 85%, 90%, 95%, 97%, 99%, o 100%. Por ejemplo, por lo menos el 60% o por lo menos el 95% de los códigos de barras en el mismo soporte sólido pueden comprender el mismo marcador celular.

Puede haber tantas como 106 o más secuencias de marcadores celulares únicas representadas en una pluralidad de soportes sólidos (por ejemplo, perlas). Un marcador celular puede tener, o tener aproximadamente, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, o un número o un intervalo entre dos cualesquiera de estos valores, nucleótidos de longitud. Un marcador celular puede tener por lo menos, o como máximo, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200 o 300 nucleótidos de longitud. Por ejemplo, un marcador celular puede comprender entre aproximadamente 5 y aproximadamente 200 nucleótidos, entre aproximadamente 10 y aproximadamente 150 nucleótidos, o entre aproximadamente 20 y aproximadamente 125 nucleótidos de longitud.

Secuencias de códigos de barras

Un código de barras puede comprender una o más secuencias de códigos de barras. En algunas realizaciones, una secuencia de código de barras puede comprender una secuencia de ácido nucleico que proporciona información de identificación para el tipo específico de especie de ácido nucleico diana hibridada con el código de barras. Una secuencia de código de barras puede comprender una secuencia de ácido nucleico que proporcione un contador (por ejemplo, que proporcione una aproximación) para la aparición específica de la especie de ácido nucleico diana hibridada con el código de barras (por ejemplo, región de unión a la diana).

En algunas realizaciones, se une un conjunto diverso de secuencias de códigos de barras a un soporte sólido dado (por ejemplo, una perla). En algunas realizaciones, puede haber, o haber aproximadamente, 102, 103, 104, 105, 106, 107, 108, 109, o un número o un intervalo entre dos cualesquiera de estos valores, secuencias de marcadores moleculares únicas. Por ejemplo, una pluralidad de códigos de barras puede comprender aproximadamente 6561 secuencias de códigos de barras con secuencias distintas. Como otro ejemplo, una pluralidad de códigos de barras puede comprender aproximadamente 65536 secuencias de códigos de barras con secuencias distintas. En algunas realizaciones, puede haber por lo menos, o haber como máximo, 102, 103, 104, 105, 106, 107, 108, o 109, secuencias de código de barras únicas. Las secuencias de marcadores moleculares únicas pueden unirse a un soporte sólido determinado (por ejemplo, una perla). En algunas realizaciones, la secuencia de marcador molecular única está parcial o totalmente abarcada por una partícula (por ejemplo, una perla de hidrogel).

En diferentes implementaciones la longitud de un código de barras puede ser diferente. Por ejemplo, un código de barras puede tener, o tener aproximadamente, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, o un número o un intervalo entre dos cualesquiera de estos valores, nucleótidos de longitud. Como otro ejemplo, un código de barras puede tener por lo menos, o como máximo, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200 o 300 nucleótidos de longitud.

Marcadores moleculares

Un código de barras (por ejemplo, un código de barras estocástico) puede comprender uno o más marcadores moleculares. Los marcadores moleculares pueden incluir secuencias de código de barras. En algunas realizaciones, un marcador molecular puede comprender una secuencia de ácido nucleico que proporciona información de identificación para el tipo específico de especie de ácido nucleico diana hibridada con el código de barras. Un marcador molecular puede comprender una secuencia de ácido nucleico que proporciona un contador para la aparición específica de la especie de ácido nucleico diana hibridada con el código de barras (por ejemplo, región de unión a diana).

En algunas realizaciones, se une un conjunto diverso de marcadores moleculares a un soporte sólido dado (por ejemplo, una perla). En algunas realizaciones, puede haber, o haber aproximadamente, 102, 103, 104, 105, 106, 107, 108, 109, o un número o un intervalo entre dos cualesquiera de estos valores, de secuencias de marcadores moleculares únicas. Por ejemplo, una pluralidad de códigos de barras puede comprender aproximadamente 6561 marcadores moleculares con secuencias distintas. Como otro ejemplo, una pluralidad de códigos de barras puede comprender aproximadamente 65536 marcadores moleculares con secuencias distintas. En algunas realizaciones, puede haber por lo menos, o como máximo, 102, 103, 104, 105, 106, 107, 108, o 109, secuencias de marcadores moleculares únicas. Los códigos de barras con secuencias de marcadores moleculares únicas pueden unirse a un soporte sólido dado (por ejemplo, una perla).

Para la codificación con códigos de barras (por ejemplo, codificación con códigos de barras estocásticos) que usa una pluralidad de códigos de barras estocásticos, la proporción entre el número de secuencias de marcadores moleculares diferentes y el número de apariciones de cualquiera de las dianas puede ser, o ser aproximadamente de, 1:1, 21, 3:1,4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 11:1, 12:1, 13:1, 14:1, 15:1, 16:1, 17:1, 18:1, 19:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, o un número o intervalo entre dos cualesquiera de estos valores. Una diana puede ser una especie de ARNm que comprende moléculas de ARNm con secuencias idénticas o casi idénticas. En algunas realizaciones, la proporción entre el número de secuencias de marcadores moleculares diferentes y el número de apariciones de cualquiera de las dianas es por lo menos, o es como máximo, 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, 10:1, 11:1, 12:1, 13:1, 14:1, 15:1, 16:1, 17:1, 18:1, 19:1, 20:1, 30:1,40:1, 50:1, 60:1, 70:1, 80:1, 90:1, o 100:1.

Un marcador molecular puede tener, o tener aproximadamente, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, o un número o un intervalo entre dos cualesquiera de estos valores, nucleótidos de longitud. Un marcador molecular puede tener por lo menos, o como máximo, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200 o 300 nucleótidos de longitud.

Región de unión a la diana

Un código de barras puede comprender una o más regiones de unión a la diana, como sondas de captura. En algunas realizaciones, una región de unión a la diana puede hibridar con una diana de interés. En algunas realizaciones, las regiones de unión a la diana pueden comprender una secuencia de ácido nucleico que hibrida específicamente con una diana (por ejemplo, ácido nucleico diana, molécula diana, por ejemplo, un ácido nucleico celular a analizar), por ejemplo con una secuencia génica específica. En algunas realizaciones, una región de unión a la diana puede comprender una secuencia de ácido nucleico que puede unirse (por ejemplo, hibridar) con una ubicación específica de un ácido nucleico diana específico. En algunas realizaciones, la región de unión a la diana puede comprender una secuencia de ácido nucleico que es capaz de hibridación específica con un saliente de sitio de enzima de restricción (por ejemplo, un saliente de extremo pegajoso de EcoRI). El código de barras puede entonces ligarse a cualquier molécula de ácido nucleico que comprenda una secuencia complementaria al saliente del sitio de restricción.

En algunas realizaciones, una región de unión a la diana puede comprender una secuencia de ácido nucleico diana no específica. Una secuencia de ácido nucleico diana no específica puede referirse a una secuencia que puede unirse a múltiples ácidos nucleicos diana, independientemente de la secuencia específica del ácido nucleico diana. Por ejemplo, la región de unión a la diana puede comprender una secuencia multimérica aleatoria, o una secuencia oligo(dT) que hibrida con la cola poli(A) de las moléculas de ARNm. Una secuencia multimérica aleatoria puede ser, por ejemplo, un dímero, trímero, cuatrámero, pentámero, hexámero, septámero, octámero, nonámero, decámero o una secuencia multimérica superior aleatoria de cualquier longitud. En algunas realizaciones, la región de unión a la diana es la misma para todos los códigos de barras unidos a una perla dada. En algunas realizaciones, las regiones de unión a la diana para la pluralidad de códigos de barras unidos a una perla dada pueden comprender dos o más secuencias de unión a la diana diferentes. Una región de unión a la diana puede tener una longitud de, o de aproximadamente, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50 nucleótidos, o un número o intervalo entre dos cualesquiera de estos valores. Una región de unión a la diana puede tener como máximo aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 45, 50 o más nucleótidos de longitud.

En algunas realizaciones, una región de unión a diana puede comprender un oligo(dT) que puede hibridar con ARNm que comprenden extremos poliadenilados. Una región de unión a la diana puede ser específica de un gen. Por ejemplo, una región de unión a la diana puede configurarse para que hibride con una región específica de una diana. Una región de unión a diana puede tener, o tener aproximadamente, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 2627, 28, 29, 30, o un número o intervalo entre dos cualesquiera de estos valores, nucleótidos de longitud. Una región de unión a la diana puede tener por lo menos, o como máximo, 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 2627, 28, 29, o 30, nucleótidos de longitud. Una región de unión a la diana puede tener aproximadamente 5-30 nucleótidos de longitud. Cuando un código de barras comprende una región de unión a la diana específica de un gen, el código de barras puede denominarse en la presente código de barras específico de un gen.

Propiedad de orientación

Un código de barras estocástico (por ejemplo, un código de barras estocástico) puede comprender una o más propiedades de orientación que pueden usarse para orientar (por ejemplo, alinear) los códigos de barras. Un código de barras puede comprender una fracción para enfoque isoeléctrico. Diferentes códigos de barras pueden comprender diferentes puntos de enfoque isoeléctrico. Cuando estos códigos de barras se introducen en una muestra, la muestra puede someterse a un enfoque isoeléctrico para orientar los códigos de barras de una manera conocida. De esta manera, la propiedad de orientación puede usarse para desarrollar un mapa conocido de códigos de barras en una muestra. Las propiedades de orientación ejemplares pueden incluir, movilidad electroforética (por ejemplo, basada en el tamaño del código de barras), punto isoeléctrico, espín, conductividad y/o autoensamblaje. Por ejemplo, los códigos de barras con una propiedad de orientación de autoensamblaje pueden autoensamblarse en una orientación específica (por ejemplo, nanoestructura de ácido nucleico) tras la activación.

Propiedad de afinidad

Un código de barras (por ejemplo, un código de barras estocástico) puede comprender una o más propiedades de afinidad. Por ejemplo, un marcador espacial puede incluir una propiedad de afinidad. Una propiedad de afinidad puede incluir una fracción química y/o biológica que puede facilitar la unión del código de barras a otra entidad (por ejemplo, un receptor celular). Por ejemplo, una propiedad de afinidad puede comprender un anticuerpo, por ejemplo, un anticuerpo específico para una fracción específica (por ejemplo, receptor) en una muestra. En algunas realizaciones, el anticuerpo puede guiar el código de barras a un tipo de célula o molécula específica. Las dianas en y/o cerca del tipo de célula o molécula específica pueden estar marcadas (por ejemplo, marcadas estocásticamente). En algunas realizaciones, la propiedad de afinidad puede proporcionar información espacial además de la secuencia de nucleótidos del marcador espacial, ya que el anticuerpo puede guiar el código de barras a una ubicación específica. El anticuerpo puede ser un anticuerpo terapéutico, por ejemplo un anticuerpo monoclonal o un anticuerpo policlonal. El anticuerpo puede ser humanizado o quimérico. El anticuerpo puede ser un anticuerpo desnudo o un anticuerpo de fusión.

El anticuerpo puede ser una molécula de inmunoglobulina de longitud completa (es decir, de origen natural o formada por procesos recombinatorios de fragmentos de genes de inmunoglobulina normales) (por ejemplo, un anticuerpo de IgG) o una porción inmunológicamente activa (es decir, de unión específica) de una molécula de inmunoglobulina, como un fragmento de anticuerpo.

El fragmento de anticuerpo puede ser, por ejemplo, una porción de un anticuerpo como F(ab')2, Fab', Fab, Fv, sFv y similares. En algunas realizaciones, el fragmento de anticuerpo puede unirse al mismo antígeno reconocido por el anticuerpo de longitud completa. El fragmento de anticuerpo puede incluir fragmentos aislados que consisten en las regiones variables de los anticuerpos, como los fragmentos "Fv" que consisten en las regiones variables de las cadenas pesada y ligera y moléculas polipeptídicas recombinantes de cadena sencilla en las que las regiones variables ligera y pesada están conectadas por un conector peptídico ("proteínas scFv"). Los anticuerpos ejemplares pueden incluir, entre otros, anticuerpos contra células cancerosas, anticuerpos contra virus, anticuerpos que se unen a receptores de la superficie celular (CD8, CD34, CD45) y anticuerpos terapéuticos.

Cebador de adaptador universal

Un código de barras puede comprender uno o más cebadores de adaptadores universales. Por ejemplo, un código de barras específico de un gen, como un código de barras estocástico específico de un gen, puede comprender un cebador de adaptador universal. Un cebador de adaptador universal puede referirse a una secuencia de nucleótidos que es universal para todos los códigos de barras. Un cebador de adaptador universal puede usarse para construir códigos de barras específicos de genes. Un cebador de adaptador universal puede tener, o tener aproximadamente, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 2627, 28, 29, 30, o un número o intervalo entre dos cualesquiera de estos nucleótidos de longitud. Un cebador de adaptador universal puede tener por lo menos, o como máximo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 2627, 28, 29 o 30 nucleótidos de longitud. Un cebador de adaptador universal puede tener una longitud de 5-30 nucleótidos.

Conector

Cuando un código de barras comprende más de un tipo de marcador (por ejemplo, más de un marcador celular o más de una secuencia de código de barras, como un marcador molecular), los marcadores pueden estar intercalados con una secuencia de marcador de conector. Una secuencia de marcador de conector puede tener por lo menos aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 45, 50 o más nucleótidos de longitud. Una secuencia de marcador de conector puede tener como máximo aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 45, 50 o más nucleótidos de longitud. En algunos casos, una secuencia de marcador de conector tiene 12 nucleótidos de longitud. Una secuencia de marcador de conector puede usarse para facilitar la síntesis del código de barras. El marcador de conector puede comprender un código de corrección de errores (por ejemplo, Hamming).

Soportes sólidos

Los códigos de barras, como los códigos de barras estocásticos, divulgados en la presente pueden, en algunas realizaciones, asociarse a un soporte sólido. El soporte sólido puede ser, por ejemplo, una partícula sintética. En algunas realizaciones, algunas o todas las secuencias de códigos de barras, como marcadores moleculares para códigos de barras estocásticos (por ejemplo, las primeras secuencias de códigos de barras) de una pluralidad de códigos de barras (por ejemplo, la primera pluralidad de códigos de barras) sobre un soporte sólido difieren en por lo menos un nucleótido. Los marcadores celulares de los códigos de barras en el mismo soporte sólido pueden ser iguales. Los marcadores celulares de los códigos de barras en diferentes soportes sólidos pueden diferir en por lo menos un nucleótido. Por ejemplo, los primeros marcadores celulares de una primera pluralidad de códigos de barras en un primer soporte sólido pueden tener la misma secuencia, y los segundos marcadores celulares de una segunda pluralidad de códigos de barras en un segundo soporte sólido pueden tener la misma secuencia. Los primeros marcadores celulares de la primera pluralidad de códigos de barras en el primer soporte sólido y los segundos marcadores celulares de la segunda pluralidad de códigos de barras en el segundo soporte sólido pueden diferir en por lo menos un nucleótido. Un marcador celular puede tener, por ejemplo, aproximadamente 5-20 nucleótidos de longitud. Una secuencia de código de barras puede tener, por ejemplo, aproximadamente 5-20 nucleótidos de longitud. La partícula sintética puede ser, por ejemplo, una perla.

La perla puede ser, por ejemplo, una perla de gel de sílice, una perla de vidrio de poro controlado, una perla magnética, una Dynabead, una perla de sefadex/sefarosa, una perla de celulosa, una perla de poliestireno o cualquier combinación de las mismas. La perla puede comprender un material como polidimetilsiloxano (PDMS), poliestireno, vidrio, polipropileno, agarosa, gelatina, hidrogel, paramagnético, cerámica, plástico, vidrio, metilestireno, polímero acrílico, titanio, látex, sefarosa, celulosa, nailon, silicona, o cualquier combinación de los mismos.

En algunas realizaciones, la perla puede ser una perla polimérica, por ejemplo una perla deformable o una perla de gel, funcionalizada con códigos de barras o códigos de barras estocásticos (como las perlas de gel de 10X Genomics (San Francisco, CA). En algunas implementaciones, una perla de gel puede comprender un gel a base de polímeros. Las perlas de gel pueden generarse, por ejemplo, encapsulando uno o más precursores poliméricos en gotitas. Tras la exposición de los precursores poliméricos a un acelerador (por ejemplo, tetrametiletilendiamina (TMED)), puede generarse una perla de gel.

En algunas realizaciones, la partícula puede ser perturbable (por ejemplo, disoluble, degradable). Por ejemplo, la perla polimérica puede disolverse, fundirse o degradarse, por ejemplo, en una condición deseada. La condición deseada puede incluir una condición ambiental. La condición deseada puede dar como resultado que la perla polimérica se disuelva, funda o degrade de manera controlada. Una perla de gel puede disolverse, fundirse o degradarse debido a un estímulo químico, un estímulo físico, un estímulo biológico, un estímulo térmico, un estímulo magnético, un estímulo eléctrico, un estímulo luminoso o cualquier combinación de los mismos.

Los analitos y/o reactivos, como los códigos de barras de oligonucleótidos, por ejemplo, pueden acoplarse/inmovilizarse a la superficie interior de una perla de gel (por ejemplo, el interior accesible mediante difusión de un código de barras de oligonucleótidos y/o los materiales usados para generar un código de barras de oligonucleótidos) y/o la superficie exterior de una perla de gel o cualquier otra microcápsula descrita en la presente. El acoplamiento/inmovilización puede realizarse mediante cualquier forma de enlace químico (por ejemplo, enlace covalente, enlace iónico) o fenómeno físico (por ejemplo, fuerzas de Van der Waals, interacciones dipolo-dipolo, etc.). En algunas realizaciones, el acoplamiento/inmovilización de un reactivo a una perla de gel o a cualquier otra microcápsula descrita en la presente puede ser reversible como, por ejemplo, a través de una fracción lábil (por ejemplo, a través de un reticulante químico, incluyendo los reticulantes químicos descritos en la presente). Tras la aplicación de un estímulo, la fracción lábil puede escindirse y liberarse el reactivo inmovilizado. En algunas realizaciones, la fracción lábil es un enlace disulfuro. Por ejemplo, en el caso de que un código de barras de oligonucleótidos esté inmovilizado en una perla de gel mediante un enlace disulfuro, la exposición del enlace disulfuro a un agente reductor puede escindir el enlace disulfuro y liberar el código de barras de oligonucleótidos de la perla. La fracción lábil puede incluirse como parte de una perla o microcápsula de gel, como parte de un conector químico que une un reactivo o analito a una perla o microcápsula de gel, y/o como parte de un reactivo o analito. En algunas realizaciones, por lo menos un código de barras de la pluralidad de códigos de barras puede estar inmovilizado en la partícula, parcialmente inmovilizado en la partícula, encerrado en la partícula, parcialmente encerrado en la partícula, o cualquier combinación de los mismos.

En algunas realizaciones, una perla de gel puede comprender una amplia variedad de polímeros diferentes, incluyendo, pero no limitados a: polímeros, polímeros sensibles al calor, polímeros fotosensibles, polímeros magnéticos, polímeros sensibles al pH, polímeros sensibles a la sal, polímeros químicamente sensibles, polielectrolitos, polisacáridos, péptidos, proteínas y/o plásticos. Los polímeros pueden incluir, pero no se limitan a, materiales como poli(N-isopropilacrilamida) (PNIPAAm), poli(sulfonato de estireno) (PSS), poli(alil amina) (PAAm), poli(ácido acrílico) (PAA), poli(etileno imina) (PEI), poli(cloruro de dialildimetil-amonio) (PDADMAC), poli(pirrol) (PPy), poli(vinilpirrolidona) (PVPON), poli(vinilpiridina) (PVP), poli(ácido metacrílico) (PMAA), poli(metacrilato de metilo) (PMMA), poliestireno (PS), poli(tetrahidrofurano) (PTh F), poli(ftaladehído) (Pt Hf ), poli(hexil viologeno) (PHV), poli(L-lisina) (PLL), poli(L-arginina) (PARG), poli(ácido láctico-co-glicólico) (PLGA).

Para desencadenar la alteración, disolución o degradación de las perlas pueden usarse numerosos estímulos químicos. Los ejemplos de estos cambios químicos pueden incluir, pero no se limitan a, cambios en la pared de la perla mediados por el pH, disgregación de la pared de la perla mediante la escisión química de los enlaces cruzados, despolimerización desencadenada de la pared de la perla y reacciones de cambio de la pared de la perla. Para desencadenar la disgregación de las perlas también pueden usarse cambios de volumen.

Los cambios físicos o de volumen de la microcápsula mediante varios estímulos también ofrecen muchas ventajas en el diseño de cápsulas para liberar reactivos. Los cambios físicos o de volumen se producen a escala macroscópica, en la que la ruptura de la perla es el resultado de fuerzas mecanofísicas inducidas por un estímulo. Estos procesos pueden incluir, entre otros, la ruptura inducida por presión, la fusión de la pared de la perla o cambios en la porosidad de la pared de la perla.

También pueden usarse estímulos biológicos para desencadenar la alteración, disolución o degradación de las perlas. En general, los desencadenantes biológicos se parecen a los desencadenantes químicos, pero muchos ejemplos usan biomoléculas, o moléculas que se encuentran comúnmente en los sistemas vivos, como enzimas, péptidos, sacáridos, ácidos grasos, ácidos nucleicos y similares. Por ejemplo, las perlas pueden comprender polímeros con enlaces cruzados peptídicos sensibles a la escisión por proteasas específicas. Más específicamente, un ejemplo puede comprender una microcápsula que comprende enlaces cruzados de péptidos GFLGK. Tras la adición de un desencadenante biológico, como la proteasa catepsina B, los enlaces cruzados peptídicos de la pared de la cubierta se escinden y se libera el contenido de las perlas. En otros casos, las proteasas pueden activarse por calor. En otro ejemplo, las perlas comprenden una pared de la cubierta que comprende celulosa. La adición de la enzima hidrolítica quitosano sirve como desencadenante biológico para la escisión de los enlaces celulósicos, la despolimerización de la pared de la cubierta y la liberación de su contenido interno.

También puede inducirse a las perlas para que liberen su contenido mediante la aplicación de un estímulo térmico. Un cambio de temperatura puede provocar una variedad de cambios en las perlas. Un cambio de calor puede provocar la fusión de una perla de tal manera que se disgregue la pared de la perla. En otros casos, el calor puede aumentar la presión interna de los componentes internos de la perla de tal manera que la perla se rompa o explote. En otros casos más, el calor puede transformar la perla en un estado deshidratado encogido. El calor también puede actuar sobre los polímeros termosensibles de la pared de la perla para provocar la alteración de la perla.

La inclusión de nanopartículas magnéticas en la pared de perlas de las microcápsulas puede permitir la ruptura desencadenada de las perlas, así como guiar las perlas en una matriz. Un dispositivo de la presente divulgación puede incluir perlas magnéticas para ambos propósitos. En un ejemplo, la incorporación de nanopartículas de Fe3O4 en perlas que contienen polielectrolitos desencadena la ruptura en presencia de un estímulo de campo magnético oscilante.

Una perla también puede alterarse, disolverse o degradarse como resultado de la estimulación eléctrica. De manera similar a las partículas magnéticas descritas en la sección anterior, las perlas eléctricamente sensibles pueden permitir tanto la ruptura desencadenada de las perlas como otras funciones como la alineación en un campo eléctrico, la conductividad eléctrica o las reacciones redox. En un ejemplo, las perlas que contienen material eléctricamente sensible se alinean en un campo eléctrico de tal manera que pueda controlarse la liberación de reactivos internos. En otros ejemplos, los campos eléctricos pueden inducir reacciones redox dentro de la propia pared de la perla que pueden aumentar la porosidad.

Para alterar las perlas también puede usarse un estímulo luminoso. Son posibles numerosos activadores luminosos y pueden incluir sistemas que usan varias moléculas, como nanopartículas y cromóforos, capaces de absorber fotones de intervalos específicos de longitudes de onda. Por ejemplo, pueden usarse recubrimientos de óxido metálico como activadores de cápsulas. La irradiación UV de cápsulas de polielectrolito recubiertas con SiO2 puede provocar la disgregación de la pared de la perla. En otro ejemplo más, pueden incorporarse a la pared de la perla materiales fotoactivables, como grupos azobenceno. Tras la aplicación de luz UV o visible, sustancias químicas como estas experimentan una isomerización reversible de cis a trans por absorción de fotones. En este aspecto, la incorporación de interruptores de fotones da como resultado que la pared de una perla pueda disgregarse o volverse más porosa tras la aplicación de un activador luminoso.

Por ejemplo, en un ejemplo no limitativo de codificación con códigos de barras (por ejemplo, codificación con códigos de barras estocásticos) ilustrado en la FIG. 2, después de introducir células como células individuales en una pluralidad de micropocillos de una matriz de micropocillos en el bloque 208, pueden introducirse perlas en la pluralidad de micropocillos de la matriz de micropocillos en el bloque 212. Cada micropocillo puede comprender una perla. Las perlas pueden comprender una pluralidad de códigos de barras. Un código de barras puede comprender una región de amina 5' unida a una perla. El código de barras puede comprender un marcador universal, una secuencia de código de barras (por ejemplo, un marcador molecular), una región de unión a diana o cualquier combinación de las mismas.

Los códigos de barras divulgados en la presente pueden asociarse (por ejemplo, unirse) a un soporte sólido (por ejemplo, una perla). Los códigos de barras asociados con un soporte sólido pueden comprender cada uno una secuencia de código de barras seleccionada de un grupo que comprende por lo menos 100 o 1000 secuencias de códigos de barras con secuencias únicas. En algunas realizaciones, diferentes códigos de barras asociados con un soporte sólido pueden comprender códigos de barras con secuencias diferentes. En algunas realizaciones, un porcentaje de los códigos de barras asociados a un soporte sólido comprende el mismo marcador celular. Por ejemplo, el porcentaje puede ser, o ser de aproximadamente el 60%, 70%, 80%, 85%, 90%, 95%, 97%, 99%, 100%, o un número o un intervalo entre dos cualesquiera de estos valores. Como otro ejemplo, el porcentaje puede ser por lo menos, o ser como máximo del 60%, 70%, 80%, 85%, 90%, 95%, 97%, 99%, o 100%. En algunas realizaciones, los códigos de barras asociados a un soporte sólido pueden tener el mismo marcador celular. Los códigos de barras asociados con diferentes soportes sólidos pueden tener diferentes marcadores celulares seleccionados de un grupo que comprende por lo menos 100 o 1000 marcadores celulares con secuencias únicas.

Los códigos de barras divulgados en la presente pueden asociarse a (por ejemplo, unirse a) un soporte sólido (por ejemplo, una perla). En algunas realizaciones, la codificación con códigos de barras de la pluralidad de dianas en la muestra puede realizarse con un soporte sólido que incluye una pluralidad de partículas sintéticas asociadas con la pluralidad de códigos de barras. En algunas realizaciones, el soporte sólido puede incluir una pluralidad de partículas sintéticas asociadas con la pluralidad de códigos de barras. Los marcadores espaciales de la pluralidad de códigos de barras en diferentes soportes sólidos pueden diferir en por lo menos un nucleótido. El soporte sólido puede, por ejemplo, incluir la pluralidad de códigos de barras en dos dimensiones o en tres dimensiones. Las partículas sintéticas pueden ser perlas. Las perlas pueden ser perlas de gel de sílice, perlas de vidrio de poro controlado, perlas magnéticas, Dynabeads, perlas Sefadex/sefarosa, perlas de celulosa, perlas de poliestireno, o cualquier combinación de las mismas. El soporte sólido puede incluir un polímero, una matriz, un hidrogel, un dispositivo de matriz de agujas, un anticuerpo o cualquier combinación de los mismos. En algunas realizaciones, los soportes sólidos pueden flotar libremente. En algunas realizaciones, los soportes sólidos pueden estar incorporados en una matriz semisólida o sólida. Los códigos de barras pueden no estar asociados a los soportes sólidos. Los códigos de barras pueden ser nucleótidos individuales. Los códigos de barras pueden estar asociados a un sustrato.

Como se usan en la presente, los términos "atado", "unido" e "inmovilizado" se usan indistintamente y pueden referirse a medios covalentes o no covalentes para unir códigos de barras a un soporte sólido. Puede usarse cualquiera de una variedad de soportes sólidos como soporte sólido para unir códigos de barras presintetizados o para la síntesis in situ en fase sólida de códigos de barras.

En algunas realizaciones, el soporte sólido es una perla. La perla puede comprender uno o más tipos de esfera, bola, cojinete, cilindro u otra configuración similar sólida, porosa o hueca que pueda inmovilizar un ácido nucleico (por ejemplo, covalente o no covalentemente). La perla puede estar compuesta, por ejemplo, de plástico, cerámica, metal, material polimérico o cualquier combinación de los mismos. Una perla puede ser, o comprender, una partícula discreta que es esférica (por ejemplo, microesferas) o tener una forma no esférica o irregular, como cúbica, cuboide, piramidal, cilíndrica, cónica, oblonga o en forma de disco, y similares. En algunas realizaciones, una perla puede tener forma no esférica.

Las perlas pueden estar compuestas de una variedad de materiales que incluyen, pero no se limitan a, materiales paramagnéticos (por ejemplo, magnesio, molibdeno, litio y tántalo), materiales superparamagnéticos (por ejemplo, nanopartículas de ferrita (Fe3O4; magnetita)), materiales ferromagnéticos (por ejemplo hierro, níquel, cobalto, algunas aleaciones de los mismos, y algunos compuestos metálicos de tierras raras), cerámica, plástico, vidrio, poliestireno, sílice, metilestireno, polímeros acrílicos, titanio, látex, sefarosa, agarosa, hidrogel, polímero, celulosa, nylon, o cualquier combinación de los mismos.

En algunas realizaciones, la perla (por ejemplo, la perla a la que se unen los marcadores) es una perla de hidrogel. En algunas realizaciones, la perla comprende hidrogel.

Algunas realizaciones divulgadas en la presente incluyen una o más partículas (por ejemplo, perlas). Cada una de las partículas puede comprender una pluralidad de oligonucleótidos (por ejemplo, códigos de barras). Cada uno de la pluralidad de oligonucleótidos puede comprender una secuencia de códigos de barras (por ejemplo, una secuencia de marcador molecular), un marcador celular y una región de unión a diana (por ejemplo, una secuencia oligo(dT), una secuencia específica de gen, un multímero aleatorio o una combinación de los mismos). La secuencia del marcador celular de cada uno de la pluralidad de oligonucleótidos puede ser igual. Las secuencias del marcador celular de los oligonucleótidos en partículas diferentes pueden ser diferentes, de tal manera que puedan identificarse los oligonucleótidos en partículas diferentes. En diferentes implementaciones el número de secuencias de marcadores celulares diferentes puede ser diferente. En algunas realizaciones, el número de secuencias de marcadores celulares puede ser, o ser aproximadamente de 10, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 106, 107, 108, 109, un número o un intervalo entre dos cualesquiera de estos valores, o más. En algunas realizaciones, el número de secuencias de marcadores celulares puede ser como mínimo o como máximo de 10, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 106, 107, 108, o 109. En algunas realizaciones, no más de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, o más de la pluralidad de las partículas incluyen oligonucleótidos con la misma secuencia celular. En algunas realizaciones, la pluralidad de partículas que incluyen oligonucleótidos con la misma secuencia celular puede ser como máximo del 0,1%, 0,2%, 0,3%, 0,4%, 0,5%, 0,6%, 0,7%, 0,8%, 0,9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, o más. En algunas realizaciones, ninguna de la pluralidad de partículas tiene la misma secuencia de marcador celular.

La pluralidad de oligonucleótidos en cada partícula puede comprender diferentes secuencias de códigos de barras (por ejemplo, marcadores moleculares). En algunas realizaciones, el número de secuencias de códigos de barras puede ser, o ser aproximadamente de 10, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000, 106, 107, 108, 109, o un número o un intervalo entre dos cualesquiera de estos valores. En algunas realizaciones, el número de secuencias de códigos de barras puede ser como mínimo o como máximo de 10, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000 , 90000, 100000, 106, 107, 108, o 109. Por ejemplo, por lo menos 100 de la pluralidad de oligonucleótidos comprenden diferentes secuencias de código de barras. Como otro ejemplo, en una sola partícula, por lo menos 100, 500, 1000, 5000, 10000, 15000, 20000, 50000, un número o un intervalo entre dos cualesquiera de estos valores, o más de la pluralidad de oligonucleótidos comprenden secuencias de código de barras diferentes. Algunas realizaciones proporcionan una pluralidad de las partículas que comprenden códigos de barras. En algunas realizaciones, la proporción de una aparición (o una copia o un número) de una diana a marcar y las diferentes secuencias de código de barras puede ser de por lo menos 1:1, 12, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9, 1:10, 1:11, 1:12, 1:13, 1:14, 1:15, 1:16, 1:17, 1:18, 1:19, 1:20, 1:30, 1:40, 1:50, 1:60, 1:70, 1:80, 1:90, o más. En algunas realizaciones, cada uno de la pluralidad de oligonucleótidos comprende además un marcador de muestra, un marcador universal, o ambos. La partícula puede ser, por ejemplo, una nanopartícula o una micropartícula.

El tamaño de las perlas puede variar. Por ejemplo, el diámetro de la perla puede variar de 0,1 micrómetros a 50 micrómetros. En algunas realizaciones, el diámetro de la perla puede ser, o ser de aproximadamente, 0,1, 0,5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40 o 50 micrómetros, o un número o un intervalo entre dos cualesquiera de estos valores.

El diámetro de la perla puede estar relacionado con el diámetro de los pocillos del sustrato. En algunas realizaciones, el diámetro de la perla puede ser, o ser aproximadamente, un 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, o un número o un intervalo entre dos cualesquiera de estos valores, más largo o más corto que el diámetro del pocillo. El diámetro de las perlas puede estar relacionado con el diámetro de una célula (por ejemplo, una célula individual atrapada por un pocillo del sustrato). En algunas realizaciones, el diámetro de la perla puede ser por lo menos, o como máximo, un 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% o 100% más largo o más corto que el diámetro del pocillo. El diámetro de las perlas puede estar relacionado con el diámetro de una célula (por ejemplo, una célula individual atrapada por un pocillo del sustrato). En algunas realizaciones, el diámetro de la perla puede ser, o ser aproximadamente, un 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 250%, 300%, o un número o un intervalo entre dos cualesquiera de estos valores, más largo o más corto que el diámetro de la célula. En algunas realizaciones, el diámetro de las perlas puede ser como mínimo, o como máximo, un 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 250% o 300% más largo o más corto que el diámetro de la célula.

Una perla puede unirse o incorporarse en un sustrato. Una perla puede unirse y/o incorporarse en un gel, hidrogel, polímero y/o matriz. La posición espacial de una perla dentro de un sustrato (por ejemplo, gel, matriz, andamiaje o polímero) puede identificarse usando el marcador espacial presente en el código de barras de la perla, que puede servir como dirección de ubicación.

Los ejemplos de perlas pueden incluir, pero no se limitan a, perlas de estreptavidina, perlas de agarosa, perlas magnéticas, perlas Dynabeads®, microperlas MACS®, perlas conjugadas con anticuerpos (por ejemplo, microperlas antiinmunoglobulina), perlas conjugadas con proteína A, perlas conjugadas con proteína G, perlas conjugadas con proteína A/G, perlas conjugadas con proteína L, perlas conjugadas con oligo(dT), perlas de sílice, perlas similares a la sílice, microperlas antibiotina, microperlas antifluorocromo y perlas magnéticas BcMag™ con terminación de carboxilo.

Una perla puede estar asociada con (por ejemplo, impregnada de) puntos cuánticos o colorantes fluorescentes para hacerla fluorescente en un canal óptico de fluorescencia o en múltiples canales ópticos. Una perla puede asociarse con óxido de hierro u óxido de cromo para hacerla paramagnética o ferromagnética. Las perlas pueden ser identificables. Por ejemplo, pueden obtenerse imágenes de una perla usando una cámara. Una perla puede tener un código detectable asociado con la perla. Por ejemplo, una perla puede comprender un código de barras. Una perla puede cambiar de tamaño, por ejemplo, debido al hinchamiento en una solución orgánica o inorgánica. Una perla puede ser hidrófoba. Una perla puede ser hidrófila. Una perla puede ser biocompatible.

Un soporte sólido (por ejemplo, una perla) puede visualizarse. El soporte sólido puede incluir una etiqueta de visualización (por ejemplo, un colorante fluorescente). Un soporte sólido (por ejemplo, una perla) puede grabarse con un identificador (por ejemplo, un número). El identificador puede visualizarse a través de imagenología de perlas.

Un soporte sólido puede comprender un material insoluble, semisoluble o insoluble. Un soporte sólido puede denominarse "funcionalizado" cuando incluye un conector, un andamiaje, un bloque de construcción u otra fracción reactiva unida al mismo, mientras que un soporte sólido puede ser "no funcionalizado" cuando carece de dicha fracción reactiva unida al mismo. El soporte sólido puede emplearse libre en solución, como en un formato de pocillo de microtitulación; en un formato de flujo continuo, como en una columna; o en una tira reactiva.

El soporte sólido puede comprender una membrana, papel, plástico, superficie recubierta, superficie plana, vidrio, portaobjetos, viruta o cualquier combinación de los mismos. Un soporte sólido puede adoptar la forma de resinas, geles, perlas u otras configuraciones geométricas. Un soporte sólido puede comprender chips de sílice, micropartículas, nanopartículas, placas, matrices, capilares, soportes planos como filtros de fibra de vidrio, superficies de vidrio, superficies metálicas (acero, plata dorada, aluminio, silicio y cobre), soportes de vidrio, soportes de plástico, soportes de silicio, virutas, filtros, membranas, placas de micropocillos, portaobjetos, materiales plásticos, incluyendo placas o membranas multipocillo (por ejemplo, formadas de polietileno, polipropileno, poliamida, polivinilidendifluoruro), y/o obleas, peines, alfileres o agujas (por ejemplo, matrices de alfileres adecuadas para la síntesis o el análisis combinatorios) o perlas en una matriz de fosas o pocillos de nanolitros de superficies planas como obleas (por ejemplo, obleas de silicio), obleas con fosas con o sin fondos filtrantes.

El soporte sólido puede comprender una matriz polimérica (por ejemplo, gel, hidrogel). La matriz polimérica puede ser capaz de permeabilizar el espacio intracelular (por ejemplo, alrededor de orgánulos). La matriz polimérica puede bombearse a través del sistema circulatorio.

Sustratos y matriz de micropocillos

Como se usa en la presente, un sustrato puede referirse a un tipo de soporte sólido. Un sustrato puede referirse a un soporte sólido que puede comprender códigos de barras o códigos de barras estocásticos de la divulgación. Un sustrato puede, por ejemplo, comprender una pluralidad de micropocillos. Por ejemplo, un sustrato puede ser una matriz de pocillos que comprende dos o más micropocillos. En algunas realizaciones, un micropocillo puede comprender una pequeña cámara de reacción de volumen definido. En algunas realizaciones, un micropocillo puede atrapar una o más células. En algunas realizaciones, un micropocillo puede atrapar sólo una célula. En algunas realizaciones, un micropocillo puede atrapar uno o más soportes sólidos. En algunas realizaciones, un micropocillo puede atrapar sólo un soporte sólido. En algunas realizaciones, un micropocillo atrapa una única célula y un único soporte sólido (por ejemplo, una perla). Un micropocillo puede comprender reactivos de códigos de barras de la divulgación.

Métodos de codificación con códigos de barras

La divulgación proporciona métodos para estimar el número de dianas distintas en ubicaciones distintas de una muestra física (por ejemplo, tejido, órgano, tumor, célula). Los métodos pueden comprender colocar códigos de barras (por ejemplo, códigos de barras estocásticos) muy cerca de la muestra, lisar la muestra, asociar distintas dianas con los códigos de barras, amplificar las dianas y/o el recuento digital de las dianas. El método puede comprender además analizar y/o visualizar la información obtenida de los marcadores espaciales de los códigos de barras. En algunas realizaciones, un método comprende visualizar la pluralidad de dianas en la muestra. El mapeo de la pluralidad de dianas en el mapa de la muestra puede incluir generar un mapa bidimensional o un mapa tridimensional de la muestra. El mapa bidimensional y el mapa tridimensional pueden generarse antes o después de codificar con códigos barras (por ejemplo, codificar estocásticamente con códigos de barras) la pluralidad de dianas en la muestra. Visualizar la pluralidad de dianas en la muestra puede incluir mapear la pluralidad de dianas en un mapa de la muestra. Mapear la pluralidad de dianas en el mapa de la muestra puede incluir la generación de un mapa bidimensional o un mapa tridimensional de la muestra. En algunas realizaciones, el mapa bidimensional y el mapa tridimensional pueden generarse antes o después de lisar la muestra. Lisar la muestra antes o después de generar el mapa bidimensional o el mapa tridimensional puede incluir calentar la muestra, poner en contacto la muestra con un detergente, cambiar el pH de la muestra, o cualquier combinación de los mismos.

En algunas realizaciones, codificar con códigos de barras la pluralidad de dianas comprende hibridar una pluralidad de códigos de barras con una pluralidad de dianas para crear dianas codificadas con código de barras (por ejemplo, dianas codificadas estocásticamente con códigos de barras). Codificar con códigos de barras la pluralidad de dianas puede comprender generar una biblioteca indexada de las dianas codificadas con códigos de barras. Generar una biblioteca indexada de las dianas codificadas con códigos de barras puede realizarse con un soporte sólido que comprende la pluralidad de códigos de barras (por ejemplo, códigos de barras estocásticos).

Poner en contacto una muestra y un código de barras

La divulgación proporciona métodos para poner en contacto una muestra (por ejemplo, células) con un sustrato de la divulgación. Una muestra que comprende, por ejemplo, una sección delgada de célula, órgano o tejido, puede ponerse en contacto con códigos de barras (por ejemplo, códigos de barras estocásticos). Las células pueden ponerse en contacto, por ejemplo, por flujo de gravedad en donde las células pueden asentarse y crear una monocapa. La muestra puede ser una sección delgada de tejido. La sección delgada puede colocarse sobre el sustrato. La muestra puede ser unidimensional (por ejemplo, forma una superficie plana). La muestra (por ejemplo, células) puede extenderse por el sustrato, por ejemplo, haciendo crecer/cultivando las células en el sustrato.

Cuando los códigos de barras están muy cerca de las dianas, éstas pueden hibridar con el código de barras. Los códigos de barras pueden ponerse en contacto en una proporción no agotable, de tal manera que cada diana distinta pueda asociarse con un código de barras distinto de la divulgación. Para garantizar una asociación eficaz entre la diana y el código de barras, las dianas pueden reticularse con el código de barras.

Lisis celular

Después de la distribución de células y códigos de barras, las células pueden lisarse para liberar las moléculas diana. La lisis celular puede lograrse mediante cualquiera de una variedad de medios, por ejemplo, mediante medios químicos o bioquímicos, por choque osmótico o mediante lisis térmica, lisis mecánica o lisis óptica. Las células pueden lisarse mediante la adición de un tampón de lisis celular que comprenda un detergente (por ejemplo, SDS, Li dodecil sulfato, Triton X-100, Tween-20 o NP-40), un solvente orgánico (por ejemplo, metanol o acetona) o enzimas digestivas (por ejemplo, proteinasa K, pepsina o tripsina), o cualquier combinación de los mismos. Para aumentar la asociación de una diana y un código de barras, puede alterarse la velocidad de difusión de las moléculas diana, por ejemplo, reduciendo la temperatura y/o aumentando la viscosidad del lisado.

En algunas realizaciones, la muestra puede lisarse usando un papel de filtro. El papel de filtro puede empaparse con un tampón de lisis sobre la parte superior del papel de filtro. El papel de filtro puede aplicarse a la muestra con presión, lo que puede facilitar la lisis de la muestra y la hibridación de las dianas de la muestra con el sustrato.

En algunas realizaciones, la lisis puede llevarse a cabo mediante lisis mecánica, lisis por calor, lisis óptica y/o lisis química. La lisis química puede incluir el uso de enzimas digestivas como la proteinasa K, la pepsina y la tripsina. La lisis puede realizarse mediante la adición de un tampón de lisis al sustrato. Un tampón de lisis puede comprender Tris HCl. Un tampón de lisis puede comprender por lo menos aproximadamente 0,01, 0,05, 0,1, 0,5 o 1 M o más de Tris HCl. Un tampón de lisis puede comprender como máximo aproximadamente 0,01, 0,05, 0,1, 0,5 o 1 M o más de Tris HCL. Un tampón de lisis puede comprender aproximadamente 0,1 M Tris HCl. El pH del tampón de lisis puede ser por lo menos de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más. El pH del tampón de lisis puede ser como máximo de aproximadamente 1,2, 3, 4, 5, 6, 7, 8, 9, 10 o más. En algunas realizaciones, el pH del tampón de lisis es de aproximadamente 7,5. El tampón de lisis puede contener una sal (por ejemplo, LiCl). La concentración de sal en el tampón de lisis puede ser de por lo menos aproximadamente 0,1, 0,5 o 1 M o más. La concentración de sal en el tampón de lisis puede ser como máximo de aproximadamente 0,1, 0,5 o 1 M o más. En algunas realizaciones, la concentración de sal en el tampón de lisis es de aproximadamente 0,5 M. El tampón de lisis puede comprender un detergente (por ejemplo, SDS, Li dodecil sulfato, Triton X, tween, NP-40). La concentración del detergente en el tampón de lisis puede ser de por lo menos aproximadamente un 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6% o 7%, o más. La concentración del detergente en el tampón de lisis puede ser como máximo de aproximadamente un 0,0001%, 0,0005%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 6% o 7%, o más. En algunas realizaciones, la concentración del detergente en el tampón de lisis es de aproximadamente un 1% de Li dodecil sulfato. El tiempo usado en el método para la lisis puede depender de la cantidad de detergente usado. En algunas realizaciones, cuanto más detergente se usa, menos tiempo se necesita para la lisis. El tampón de lisis puede incluir un agente quelante (por ejemplo, EDTA, EGTA). La concentración de un agente quelante en el tampón de lisis puede ser de por lo menos 1, 5, 10, 15, 20, 25 o 30 mM o más. La concentración de un agente quelante en el tampón de lisis puede ser como máximo de aproximadamente 1, 5, 10, 15, 20, 25 o 30 mM o más. En algunas realizaciones, la concentración de agente quelante en el tampón de lisis es de aproximadamente 10 mM. El tampón de lisis puede comprender un reactivo reductor (por ejemplo, beta-mercaptoetanol, DTT). La concentración del reactivo reductor en el tampón de lisis puede ser de por lo menos aproximadamente 1, 5, 10, 15 o 20 mM o más. La concentración del reactivo reductor en el tampón de lisis puede ser como máximo de aproximadamente 1, 5, 10, 15 o 20 mM o más. En algunas realizaciones, la concentración de reactivo reductor en el tampón de lisis es de aproximadamente 5 mM. En algunas realizaciones, un tampón de lisis puede comprender aproximadamente 0,1M TrisHCl, aproximadamente pH 7,5, aproximadamente 0,5M LiCl, aproximadamente un 1% de dodecil sulfato de litio, aproximadamente 10 mM EDTA, y aproximadamente 5 mM DTT.

La lisis puede realizarse a una temperatura de aproximadamente 4, 10, 15, 20, 25 o 30° C. La lisis puede realizarse durante aproximadamente 1, 5, 10, 15 o 20 o más minutos. Una célula lisada puede comprender por lo menos aproximadamente 100000, 200000, 300000, 400000, 500000, 600000 o 700000 o más moléculas de ácido nucleico diana. Una célula lisada puede comprender como máximo aproximadamente 100.000, 200.000, 300.000, 400.000, 500.000, 600.000 o 700.000 o más moléculas de ácido nucleico diana.

Unión de códigos de barras a moléculas de ácido nucleico diana

Tras la lisis de las células y la liberación de moléculas de ácido nucleico de las mismas, las moléculas de ácido nucleico pueden asociarse aleatoriamente con los códigos de barras del soporte sólido colocalizado. La asociación puede comprender la hibridación de la región de reconocimiento de la diana de un código de barras con una porción complementaria de la molécula de ácido nucleico diana (por ejemplo, el oligo(dT) del código de barras puede interactuar con una cola de poli(A) de una diana). Las condiciones de ensayo usadas para la hibridación (por ejemplo, pH del tampón, fuerza iónica, temperatura, etc.) pueden elegirse para promover la formación de híbridos específicos y estables. En algunas realizaciones, las moléculas de ácido nucleico liberadas de las células lisadas pueden asociarse con la pluralidad de sondas del sustrato (por ejemplo, hibridar con las sondas del sustrato). Cuando las sondas comprenden oligo(dT), las moléculas de ARNm pueden hibridar con las sondas y transcribirse inversamente. La porción de oligo(dT) del oligonucleótido puede actuar como cebador para la síntesis de la primera cadena de la molécula de ADNc. Por ejemplo, en un ejemplo no limitativo de codificación con código de barras ilustrado en la FIG. 2, en el bloque 216, las moléculas de ARNm pueden hibridar con códigos de barras en perlas. Por ejemplo, los fragmentos de nucleótidos de cadena sencilla pueden hibridar con las regiones de unión a la diana de los códigos de barras.

La unión puede comprender además la ligación de una región de reconocimiento de diana de un código de barras y una porción de la molécula de ácido nucleico diana. Por ejemplo, la región de unión a la diana puede comprender una secuencia de ácido nucleico que puede ser capaz de hibridación específica a un saliente de sitio de restricción (por ejemplo, un saliente de extremo pegajoso EcoRI). El procedimiento de ensayo puede comprender además tratar los ácidos nucleicos diana con una enzima de restricción (por ejemplo, EcoRI) para crear un saliente de sitio de restricción. A continuación, el código de barras puede ligarse a cualquier molécula de ácido nucleico que comprenda una secuencia complementaria al saliente del sitio de restricción. Puede usarse una ligasa (por ejemplo, T4 ADN ligasa) para unir los dos fragmentos.

Por ejemplo, en un ejemplo no limitativo de codificación con código de barras ilustrado en la FIG. 2, en el bloque 220, las dianas marcadas de una pluralidad de células (o una pluralidad de muestras) (por ejemplo, moléculas de código de barras diana) pueden agruparse posteriormente, por ejemplo, en un tubo. Las dianas marcadas pueden agruparse, por ejemplo, recuperando los códigos de barras y/o las perlas a las que están unidas las moléculas de diana-código de barras.

La recuperación de colecciones basadas en soportes sólidos de moléculas diana-código de barra unidos puede implementarse mediante el uso de perlas magnéticas y un campo magnético aplicado externamente. Una vez agrupadas las moléculas de diana-código de barras, todo el procesamiento posterior puede realizarse en un único recipiente de reacción. El procesamiento posterior puede incluir, por ejemplo, reacciones de transcripción inversa, reacciones de amplificación, reacciones de escisión, reacciones de disociación y/o reacciones de extensión de ácidos nucleicos. Las reacciones de procesamiento posterior pueden realizarse dentro de los micropocillos, es decir, sin agrupar primero las moléculas de ácido nucleico diana marcadas de una pluralidad de células.

Transcripción inversa

La divulgación proporciona un método para crear un conjugado diana-código de barras usando transcripción inversa (por ejemplo, en el bloque 224 de la FIG. 2). El conjugado diana-código de barras puede comprender el código de barras y una secuencia complementaria de todo o parte del ácido nucleico diana (es decir, una molécula de ADNc codificada con código de barras, como una molécula de ADNc codificada estocásticamente con código de barras). La transcripción inversa de la molécula de ARN asociada puede producirse mediante la adición de un cebador de transcripción inversa junto con la transcriptasa inversa. El cebador de transcripción inversa puede ser un cebador oligo(dT), un cebador hexanucleótido aleatorio o un cebador oligonucleótido específico de la diana. Los cebadores oligo(dT) pueden tener una longitud de, o de aproximadamente, 12-18 nucleótidos y se unen a la cola de poli(A) endógena en el extremo 3' del ARNm de mamífero. Los cebadores hexanucleotídicos aleatorios pueden unirse al ARNm en una variedad de sitios complementarios. Los cebadores oligonucleotídicos específicos de la diana típicamente ceban selectivamente el ARNm de interés.

En algunas realizaciones, la transcripción inversa de la molécula de ARN marcada puede producirse mediante la adición de un cebador de transcripción inversa. En algunas realizaciones, el cebador de transcripción inversa es un cebador oligo(dT), un cebador hexanucleótido aleatorio o un cebador oligonucleótido específico de la diana. Generalmente, los cebadores oligo(dT) tienen 12-18 nucleótidos de longitud y se unen a la cola de poli(A) endógena en el extremo 3' del ARNm de mamíferos. Los cebadores hexanucleótidos aleatorios pueden unirse al ARNm en una variedad de sitios complementarios. Los cebadores oligonucleotídicos específicos de la diana típicamente ceban selectivamente el ARNm de interés.

La transcripción inversa puede realizarse repetidamente para producir múltiples moléculas de ADNc marcadas. Los métodos divulgados en la presente pueden comprender realizar por lo menos aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 reacciones de transcripción inversa. El método puede comprender realizar por lo menos aproximadamente 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 o 100 reacciones de transcripción inversa.

Amplificación

Pueden realizarse una o más reacciones de amplificación de ácidos nucleicos (por ejemplo, en el bloque 228 de la FIG. 2) para crear múltiples copias de las moléculas de ácido nucleico diana marcadas. La amplificación puede realizarse de manera multiplexada, en donde se amplifican simultáneamente múltiples secuencias de ácido nucleico diana. La reacción de amplificación puede usarse para añadir adaptadores de secuenciación a las moléculas de ácido nucleico. Las reacciones de amplificación pueden comprender amplificar por lo menos una parte de un marcador de muestra, si lo hay. Las reacciones de amplificación pueden comprender amplificar por lo menos una parte del marcador celular y/o de la secuencia del código de barras (por ejemplo, un marcador molecular). Las reacciones de amplificación pueden comprender amplificar por lo menos una parte de una etiqueta de muestra, un marcador celular, un marcador espacial, una secuencia de código de barras (por ejemplo, un marcador molecular), un ácido nucleico diana, o una combinación de los mismos. Las reacciones de amplificación pueden comprender amplificar el 0,5%, 1%, 2%, 3%,4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%,60%, 65%, 70%, 75%, 80%, 85%, 90%,95%, 97%, 100%,o un intervalo o un número entre dos cualesquiera de estos valores, delapluralidad de ácidos nucleicos. El método puede comprender además llevar a cabo una o más reacciones de síntesis de ADNc para producir una o más copias de ADNc de moléculas de diana-código de barras que comprenden un marcador de muestra, un marcador celular, un marcador espacial y/o una secuencia de código de barras (por ejemplo, un marcador molecular).

En algunas realizaciones, la amplificación puede realizarse usando una reacción en cadena de la polimerasa (PCR). Como se usa en la presente, PCR puede referirse a una reacción para la amplificación in vitro de secuencias específicas de ADN mediante la extensión simultánea de cebadores de cadenas complementarias de ADN. Como se usa en la presente, PCR puede abarcar formas derivadas de la reacción, incluyendo pero no limitadas a, RT-PCR, PCR en tiempo real, PCR anidada, PCR cuantitativa, PCR multiplexada, PCR digital y PCR de ensamblaje.

La amplificación de los ácidos nucleicos marcados puede comprender métodos no basados en PCR. Los ejemplos de métodos no basados en PCR incluyen, entre otros, amplificación por desplazamiento múltiple (MDA), amplificación mediada por transcripción (TMA), amplificación basada en la secuencia del ácido nucleico (NASBA), amplificación por desplazamiento de cadena (SDA), SDA en tiempo real, amplificación de círculo rodante o amplificación de círculo a círculo. Otros métodos de amplificación no basados en PCR incluyen ciclos múltiples de amplificación de transcripción de ARN dependiente de a Dn impulsada por ARN polimerasa o síntesis y transcripción de ADN dirigida por ARN para amplificar dianas de ADN o ARN, una reacción en cadena de ligasa (LCR), y un método de Qp replicasa (Qp), uso de sondas palindrómicas, amplificación por desplazamiento de cadena, amplificación impulsada por oligonucleótidos usando una endonucleasa de restricción, un método de amplificación en el que un cebador hibrida con una secuencia de ácido nucleico y el dúplex resultante se escinde antes de la reacción de extensión y amplificación, amplificación por desplazamiento de cadena usando una polimerasa de ácido nucleico que carece de actividad de exonucleasa 5', amplificación por círculo rodante y amplificación por extensión de ramificaciones (RAM). En algunas realizaciones, la amplificación no produce transcritos circularizados.

En algunas realizaciones, los métodos divulgados en la presente comprenden además llevar a cabo una reacción en cadena de la polimerasa en el ácido nucleico marcado (por ejemplo, ARN marcado, ADN marcado, ADNc marcado) para producir un amplicón marcado (por ejemplo, un amplicón marcado estocásticamente). El amplicón marcado puede ser una molécula de cadena doble. La molécula de cadena doble puede comprender una molécula de cadena doble de ARN, una molécula de cadena doble de ADN o una molécula de ARN hibridada con una molécula de ADN. Una o ambas cadenas de la molécula de cadena doble pueden incluir un marcador de muestra, un marcador espacial, un marcador celular y/o una secuencia de código de barras (por ejemplo, un marcador molecular). El amplicón marcado puede ser una molécula de cadena sencilla. La molécula de cadena sencilla puede comprender ADN, ARN o una combinación de los mismos. Los ácidos nucleicos de la divulgación pueden comprender ácidos nucleicos sintéticos o alterados.

La amplificación puede comprender el uso de uno o más nucleótidos no naturales. Los nucleótidos no naturales pueden incluir nucleótidos fotolábiles o activables. Los ejemplos de nucleótidos no naturales pueden incluir, entre otros, ácido nucleico peptídico (PNA), morfolino y ácido nucleico bloqueado (LNA), así como ácido nucleico de glicol (GNA) y ácido nucleico de treosa (TNA). Los nucleótidos no naturales pueden añadirse a uno o más ciclos de una reacción de amplificación. La adición de los nucleótidos no naturales puede usarse para identificar productos como ciclos específicos o puntos temporales en la reacción de amplificación.

La realización de una o más reacciones de amplificación puede comprender el uso de uno o más cebadores. El uno o más cebadores pueden comprender, por ejemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, o 15 o más nucleótidos. El uno o más cebadores pueden comprender por lo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, o 15 o más nucleótidos. El uno o más cebadores pueden comprender menos de 12-15 nucleótidos. El uno o más cebadores pueden aparearse con por lo menos una parte de la pluralidad de dianas marcadas (por ejemplo, dianas marcadas estocásticamente). El uno o más cebadores pueden aparearse con el extremo 3' o el extremo 5' de la pluralidad de dianas marcadas. El uno o más cebadores pueden aparearse con una región interna de la pluralidad de dianas marcadas. La región interna puede tener por lo menos aproximadamente 50, 100, 150, 200, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490, 500, 510, 520, 530, 540, 550, 560, 570, 580, 590, 600, 650, 700, 750, 800, 850, 900 o 1000 nucleótidos de los extremos 3' de la pluralidad de dianas marcadas. El uno o más cebadores puede comprender un panel fijo de cebadores. El uno o más cebadores pueden comprender por lo menos uno o más cebadores personalizados. El uno o más cebadores puede comprender por lo menos uno o más cebadores de control. El uno o más cebadores puede comprender por lo menos uno o más cebadores específicos de gen.

El uno o más cebadores puede incluir un cebador universal. El cebador universal puede aparearse a un sitio de unión del cebador universal. El uno o más cebadores personalizados pueden aparearse con un primer marcador de muestra, un segundo marcador de muestra, un marcador espacial, un marcador celular, una secuencia de código de barras (por ejemplo, un marcador molecular), una diana o cualquier combinación de los mismos. El uno o más cebadores puede comprender un cebador universal y un cebador personalizado. El cebador personalizado puede estar diseñado para amplificar una o más dianas. Las dianas pueden comprender un subconjunto de los ácidos nucleicos totales en una o más muestras. Las dianas pueden comprender un subconjunto del total de dianas marcadas en una o más muestras. El uno o más cebadores pueden comprender por lo menos 96 o más cebadores personalizados. El uno o más cebadores puede comprender por lo menos 960 o más cebadores personalizados. El uno o más cebadores pueden comprender por lo menos 9600 o más cebadores personalizados. El uno o más cebadores personalizados pueden aparearse con dos o más ácidos nucleicos marcados diferentes. Los dos o más ácidos nucleicos marcados diferentes pueden corresponder a uno o más genes.

En los métodos de la presente divulgación puede usarse cualquier esquema de amplificación. Por ejemplo, en un esquema, la primera ronda de PCR puede amplificar moléculas unidas a la perla usando un cebador específico de gen y un cebador contra la secuencia del cebador 1 de secuenciación universal de Illumina. La segunda ronda de PCR puede amplificar los primeros productos de PCR usando un cebador específico de gen anidado flanqueado por la secuencia del cebador 2 de secuenciación de Illumina, y un cebador contra la secuencia del cebador 1 de secuenciación de Illumina universal. La tercera ronda de PCR añade P5 y P7 e índice de muestra para convertir los productos de PCR en una biblioteca de secuenciación de Illumina. La secuenciación usando secuenciación de 150 pb x 2 puede revelar el marcador celular y la secuencia del código de barras (por ejemplo, el marcador molecular) en la lectura 1, el gen en la lectura 2 y el índice de la muestra en la lectura del índice 1.

En algunas realizaciones, los ácidos nucleicos pueden eliminarse del sustrato usando escisión química. Por ejemplo, puede usarse un grupo químico o una base modificada presente en un ácido nucleico para facilitar su eliminación de un soporte sólido. Por ejemplo, puede usarse una enzima para eliminar un ácido nucleico de un sustrato. Por ejemplo, un ácido nucleico puede eliminarse de un sustrato mediante una digestión con endonucleasas de restricción. Por ejemplo, puede usarse el tratamiento de un ácido nucleico que contiene un dUTP o ddUTP con uracilod-glicosilasa (UDG) para eliminar un ácido nucleico de un sustrato. Por ejemplo, un ácido nucleico puede eliminarse de un sustrato usando una enzima que realiza la escisión de nucleótidos, como una enzima de reparación por escisión de bases, como una endonucleasa apurínica/apirimidínica (AP). En algunas realizaciones, un ácido nucleico puede eliminarse de un sustrato usando un grupo fotoescindible y luz. En algunas realizaciones, puede usarse un conector escindible para eliminar un ácido nucleico del sustrato. Por ejemplo, el conector escindible puede comprender por lo menos uno de biotina/avidina, biotina/estreptavidina, biotina/neutravidina, Ig-proteína A, un conector fotolábil, un grupo conector lábil al ácido o a la base, o un aptámero.

Cuando las sondas son específicas de un gen, las moléculas pueden hibridar con las sondas y transcribirse inversamente y/o amplificarse. En algunas realizaciones, después de sintetizar el ácido nucleico (por ejemplo, transcribirlo inversamente), puede amplificarse. La amplificación puede realizarse de forma multiplex, en donde se amplifican simultáneamente múltiples secuencias de ácidos nucleicos diana. La amplificación puede añadir adaptadores de secuenciación al ácido nucleico.

En algunas realizaciones, la amplificación puede llevarse a cabo en el sustrato, por ejemplo, con amplificación en puente. Los ADNc pueden tener cola de homopolímero para generar un extremo compatible para la amplificación en puente usando sondas oligo(dT) en el sustrato. En la amplificación en puente, el cebador complementario al extremo 3' del ácido nucleico plantilla puede ser el primer cebador de cada par que está unido covalentemente a la partícula sólida. Cuando una muestra que contiene el ácido nucleico plantilla se pone en contacto con la partícula y se realiza un único ciclo térmico, la molécula plantilla puede aparearse con el primer cebador y el primer cebador se alarga en la dirección directa mediante la adición de nucleótidos para formar una molécula dúplex que consiste en la molécula plantilla y una cadena de ADN recién formada que es complementaria a la plantilla. En el paso de calentamiento del siguiente ciclo, puede desnaturalizarse la molécula dúplex, liberando la molécula plantilla de la partícula y dejando la cadena de a Dn complementaria unida a la partícula a través del primer cebador. En la etapa de apareamiento del paso de apareamiento y elongación que sigue, la cadena complementaria puede hibridar con el segundo cebador, que es complementario a un segmento de la cadena complementaria en una ubicación alejada del primer cebador. Esta hibridación puede hacer que la cadena complementaria forme un puente entre el primer y el segundo cebadores, fijado al primer cebador por un enlace covalente y al segundo cebador por hibridación. En la etapa de elongación, el segundo cebador puede alargarse en la dirección inversa mediante la adición de nucleótidos en la misma mezcla de reacción, convirtiendo de este modo el puente en un puente de cadena doble. A continuación comienza el siguiente ciclo, y el puente de cadena doble puede desnaturalizarse para proporcionar dos moléculas de ácido nucleico de cadena sencilla, cada una de las cuales tiene un extremo unido a la superficie de la partícula a través del primer y el segundo cebadores, respectivamente, con el otro extremo de cada uno no unido. En el paso de apareamiento y elongación de este segundo ciclo, cada cadena puede hibridar con un cebador complementario adicional, no usado previamente, en la misma partícula, para formar nuevos puentes de cadena sencilla. Los dos cebadores no usados anteriormente que están ahora hibridados se alargan para convertir los dos nuevos puentes en puentes de cadena doble.

Las reacciones de amplificación pueden comprender amplificar por lo menos el 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97% o 100% de la pluralidad de ácidos nucleicos.

La amplificación de los ácidos nucleicos marcados puede comprender métodos basados en PCR o métodos no basados en PCR. La amplificación de los ácidos nucleicos marcados puede comprender la amplificación exponencial de los ácidos nucleicos marcados. La amplificación de los ácidos nucleicos marcados puede comprender la amplificación lineal de los ácidos nucleicos marcados. La amplificación puede realizarse mediante reacción en cadena de la polimerasa (PCR). La PCR puede referirse a una reacción para la amplificación in vitro de secuencias específicas de ADN mediante la extensión simultánea de cebadores de cadenas complementarias de ADN. La PCR puede abarcar formas derivadas de la reacción, que incluyen pero no se limitan a, RT-PCR, PCR en tiempo real, PCR anidada, PCR cuantitativa, PCR multiplexada, PCR digital, PCR de supresión, PCR semisupresiva y PCR de ensamblaje.

En algunas realizaciones, la amplificación de los ácidos nucleicos marcados comprende métodos no basados en PCR. Ejemplos de métodos no basados en PCR incluyen, pero no se limitan a, amplificación por desplazamiento múltiple (MDA), amplificación mediada por transcripción (TMA), amplificación basada en secuencia de ácido nucleico (NASBA), amplificación por desplazamiento de cadena (SDA), SDA en tiempo real, amplificación de círculo rodante o amplificación de círculo a círculo. Otros métodos de amplificación no basados en PCR incluyen ciclos múltiples de amplificación de transcripción de ARN dependiente de a Dn impulsada por ARN polimerasa o síntesis y transcripción de ADN dirigida por ARN para amplificar dianas de ADN o a Rn , una reacción en cadena de ligasa (LCR), una Qp replicasa (Qp), uso de sondas palindrómicas, amplificación por desplazamiento de cadena, amplificación impulsada por oligonucleótidos usando una endonucleasa de restricción, un método de amplificación en el que un cebador hibrida con una secuencia de ácido nucleico y el dúplex resultante se escinde antes de la reacción de extensión y amplificación, amplificación por desplazamiento de cadena usando una polimerasa de ácido nucleico que carece de actividad de exonucleasa 5', amplificación por círculo rodante y/o amplificación por extensión ramificada (RAM).

En algunas realizaciones, los métodos divulgados en la presente comprenden además realizar una reacción en cadena de la polimerasa anidada en el amplicón amplificado (por ejemplo, diana). El amplicón puede ser una molécula de cadena doble. La molécula de cadena doble puede comprender una molécula de ARN de cadena doble, una molécula de ADN de cadena doble o una molécula de ARN hibridada con una molécula de ADN. Una o ambas cadenas de la molécula de cadena doble pueden comprender una etiqueta de muestra o un marcador de identificador molecular. Alternativamente, el amplicón puede ser una molécula de cadena sencilla. La molécula de cadena sencilla puede comprender ADN, ARN o una combinación de los mismos. Los ácidos nucleicos pueden comprender ácidos nucleicos sintéticos o alterados.

En algunas realizaciones, el método comprende amplificar repetidamente el ácido nucleico marcado para producir múltiples amplicones. Los métodos divulgados en la presente pueden comprender llevar a cabo por lo menos aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, o 20 reacciones de amplificación. Alternativamente, el método comprende realizar por lo menos aproximadamente 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 o 100 reacciones de amplificación.

La amplificación puede comprender además añadir uno o más ácidos nucleicos de control a una o más muestras que comprenden una pluralidad de ácidos nucleicos. La amplificación puede comprender además añadir uno o más ácidos nucleicos de control a una pluralidad de ácidos nucleicos. Los ácidos nucleicos de control pueden comprender un marcador de control.

La amplificación puede comprender el uso de uno o más nucleótidos no naturales. Los nucleótidos no naturales pueden incluir nucleótidos fotolábiles y/o activables. Ejemplos de nucleótidos no naturales incluyen, pero no se limitan a, ácido nucleico peptídico (PNA), morfolino y ácido nucleico bloqueado (LNA), así como ácido nucleico de glicol (GNA) y ácido nucleico de treosa (TNA). Los nucleótidos no naturales pueden añadirse a uno o más ciclos de una reacción de amplificación. La adición de los nucleótidos no naturales puede usarse para identificar productos como ciclos específicos o puntos temporales en la reacción de amplificación.

La realización de una o más reacciones de amplificación puede comprender el uso de uno o más cebadores. El uno o más cebadores pueden comprender uno o más oligonucleótidos. El uno o más oligonucleótidos pueden comprender por lo menos aproximadamente 7-9 nucleótidos. E uno o más oligonucleótidos pueden comprender menos de 12-15 nucleótidos. El uno o más cebadores pueden aparearse con por lo menos una parte de la pluralidad de ácidos nucleicos marcados. El uno o más cebadores pueden aparearse con el extremo 3' y/o el extremo 5' de la pluralidad de ácidos nucleicos marcados. El uno o más cebadores pueden aparearse con una región interna de la pluralidad de ácidos nucleicos marcados. La región interna puede tener por lo menos aproximadamente 50, 100, 150, 200, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490, 500, 510, 520, 530, 540, 550, 560, 570, 580, 590, 600, 650, 700, 750, 800, 850, 900 o 1000 nucleótidos de los extremos 3' de la pluralidad de ácidos nucleicos marcados. El uno o más cebadores puede comprender un panel fijo de cebadores, por lo menos uno o más cebadores personalizados, por lo menos uno o más cebadores de control, o una combinación de los mismos. El uno o más cebadores puede comprender por lo menos uno o más cebadores de genes constitutivos. El uno o más cebadores puede comprender un cebador universal. El cebador universal puede aparearse a un sitio de unión del cebador universal. El uno o más cebadores personalizados pueden aparearse a la primera etiqueta de muestra, la segunda etiqueta de muestra, al marcador identificador molecular, al ácido nucleico o a un producto de los mismos. El uno o más cebadores pueden comprender un cebador universal y un cebador personalizado. El cebador personalizado puede diseñarse para que amplifique uno o más ácidos nucleicos diana. Los ácidos nucleicos diana pueden comprender un subconjunto de los ácidos nucleicos totales en una o más muestras. En algunas realizaciones, los cebadores son las sondas unidas a la matriz de la divulgación.

En algunas realizaciones, la codificación con código de barras (por ejemplo, codificación estocástica con código de barras) de la pluralidad de dianas de la muestra comprende además generar una biblioteca indexada de las dianas codificadas con código de barras (por ejemplo, dianas codificadas estocásticamente con códigos de barras) o fragmentos codificados con código de barras de las dianas. Las secuencias codificadas con códigos de barras de diferentes códigos de barras (por ejemplo, los marcadores moleculares de diferentes códigos de barras estocásticos) pueden ser diferentes entre sí. La generación de una biblioteca indexada de dianas codificadas con códigos de barras incluye la generación de una pluralidad de polinucleótidos indexados a partir de la pluralidad de dianas de la muestra. Por ejemplo, para una biblioteca indexada de dianas codificadas con códigos de barras que comprende una primera diana indexada y una segunda diana indexada, la región del marcador del primer polinucleótido indexado puede diferir de la región del marcador del segundo polinucleótido indexado en, aproximadamente, por lo menos, o como máximo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, o un número o un intervalo entre dos cualesquiera de estos valores, nucleótidos. En algunas realizaciones, la generación de una biblioteca indexada de las dianas codificadas con códigos de barras incluye poner en contacto una pluralidad de dianas, por ejemplo moléculas de ARNm, con una pluralidad de oligonucleótidos que incluyen una región poli(T) y una región de marcador; y llevar a cabo una síntesis de primera cadena usando una transcriptasa inversa para producir moléculas de ADNc marcadas de cadena sencilla que comprenden cada una una región de ADNc y una región de marcador, en donde la pluralidad de dianas incluye por lo menos dos moléculas de ARNm de secuencias diferentes y la pluralidad de oligonucleótidos incluye por lo menos dos oligonucleótidos de secuencias diferentes. Generar una biblioteca indexada de las dianas codificadas con códigos de barras puede comprender además la amplificación de las moléculas de ADNc marcadas de cadena sencilla para producir moléculas de ADNc marcadas de cadena doble; y la realización de PCR anidada en las moléculas de ADNc marcadas de cadena doble para producir amplicones marcados. En algunas realizaciones, el método puede incluir generar un amplicón marcado con adaptador.

La codificación con código de barras (por ejemplo, codificación con código de barras estocástico) puede incluir usar códigos de barras o etiquetas de ácidos nucleicos para marcar moléculas individuales de ácido nucleico (por ejemplo, ADN o ARN). En algunas realizaciones, implica añadir códigos de barras o etiquetas de ADN a moléculas de ADNc a medida que se generan a partir de ARNm. Puede realizarse una PCR anidada para minimizar el sesgo de amplificación de la PCR. Pueden añadirse adaptadores para la secuenciación usando, por ejemplo, secuenciación de próxima generación (NGS). Los resultados de la secuenciación pueden usarse para determinar marcadores celulares, marcadores moleculares y secuencias de fragmentos de nucleótidos de una o más copias de las dianas, por ejemplo en el bloque 232 de la F iG. 2.

La FIG. 3 es una ilustración esquemática que muestra un proceso ejemplar no limitativo de generación de una biblioteca indexada de dianas codificadas con códigos barras (por ejemplo, dianas codificadas estocásticamente con códigos barras), como ARNm codificados con códigos barras o fragmentos de los mismos. Como se muestra en el paso 1, el proceso de transcripción inversa puede codificar cada molécula de ARNm con una secuencia de marcador molecular única, una secuencia de marcador celular y un sitio PCR universal. En particular, las moléculas de ARN 302 pueden transcribirse inversamente para producir moléculas de ADNc marcadas 304, incluyendo una región de ADNc 306, mediante la hibridación (por ejemplo, hibridación estocástica) de un conjunto de códigos de barras (por ejemplo, códigos de barras estocásticos) 310 a la región de cola poli(A) 308 de las moléculas de ARN 302. Cada uno de los códigos de barras 310 puede comprender una región de unión a la diana, por ejemplo una región poli(dT) 312, una región de marcador 314 (por ejemplo, una secuencia de código de barras o una molécula), y una región de PCR universal 316.

En algunas realizaciones, la secuencia del marcador celular puede incluir de 3 a 20 nucleótidos. En algunas realizaciones, la secuencia del marcador molecular puede incluir de 3 a 20 nucleótidos. En algunas realizaciones, cada uno de la pluralidad de los códigos de barras estocásticos comprende además uno o más de un marcador universal y un marcador celular, en donde los marcadores universales son los mismos para la pluralidad de códigos de barras estocásticos en el soporte sólido y los marcadores celulares son los mismos para la pluralidad de códigos de barras estocásticos en el soporte sólido. En algunas realizaciones, el marcador universal puede incluir de 3 a 20 nucleótidos. En algunas realizaciones, el marcador celular comprende de 3 a 20 nucleótidos.

En algunas realizaciones, la región de marcador 314 puede incluir una secuencia de código de barras o un marcador molecular 318 y un marcador celular 320. En algunas realizaciones, la región de marcador 314 puede incluir una o más de un marcador universal, un marcador de dimensión y un marcador celular. La secuencia de código de barras o marcador molecular 318 puede tener, puede tener aproximadamente, puede tener por lo menos, o puede tener como máximo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, o un número o un intervalo entre cualquiera de estos valores, nucleótidos de longitud. El marcador celular 320 puede tener, puede tener aproximadamente, puede tener por lo menos, o puede tener como máximo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, o un número o un intervalo entre cualquiera de estos valores, nucleótidos de longitud. El marcador universal puede tener, puede tener aproximadamente, puede tener por lo menos, o puede tener como máximo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, o un número o un intervalo entre cualquiera de estos valores, de nucleótidos de longitud. Los marcadores universales pueden ser los mismos para la pluralidad de códigos de barras estocásticos en el soporte sólido y los marcadores celulares son los mismos para la pluralidad de códigos de barras estocásticos en el soporte sólido. El marcador de dimensión puede tener, puede tener aproximadamente, puede tener por lo menos, o puede tener como máximo 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, o un número o un intervalo entre cualquiera de estos valores, nucleótidos de longitud.

En algunas realizaciones, la región de marcador 314 puede comprender, comprender aproximadamente, comprender por lo menos, o comprender como máximo, 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, o un número o un intervalo entre cualquiera de estos valores, diferentes marcadores, como una secuencia de código de barras o un marcador molecular 318 y un marcador celular 320. Cada marcador puede tener, tener aproximadamente, puede tener por lo menos, o puede tener como máximo 1, 2, 3, 4, 6, 8, 9, 10, 20, 30, 40, 50, 60, 70, 90, 100, o un número o un intervalo entre cualquiera de estos valores, nucleótidos de longitud. Un conjunto de códigos de barras o códigos de barras estocásticos 310 puede contener, contener aproximadamente, contener por lo menos, o puede tener como máximo, 10, 20, 40, 50, 70, 80, 90, 102, 103, 105, 106, 107, 108, 109, 1010, 1011, 1012, 1013, 1014, 1015, 1020, o un número o un intervalo entre cualquiera de estos valores, códigos de barras o códigos de barras estocásticos 310. Y el conjunto de códigos de barras o códigos de barras estocásticos 310 puede, por ejemplo, contener cada uno una región de marcador único 314. Las moléculas de ADNc marcadas 304 pueden purificarse para eliminar el exceso de códigos de barras o códigos de barras estocásticos 310. La purificación puede comprender la purificación con perlas Ampure.

Como se muestra en el paso 2, los productos del proceso de transcripción inversa del paso 1 pueden agruparse en 1 tubo y amplificarse por PCR con un 1° grupo de cebadores PCR y un 1° cebador de PCR universal. La agrupación es posible gracias a la región de marcador única 314. En particular, las moléculas de ADNc marcadas 304 pueden amplificarse para producir amplicones marcados por PCR anidados 322. La amplificación puede comprender una amplificación por PCR multiplex. La amplificación puede comprender una amplificación por PCR multiplex con 96 cebadores multiplex en un único volumen de reacción. En algunas realizaciones, la amplificación por PCR multiplex puede utilizar, utilizar aproximadamente, utilizar por lo menos, o utilizar como máximo, 10, 20, 40, 50, 70, 80, 90, 102, 103, 104, 105, 106, 107, 108, 109, 1010, 1011, 1012, 1013, 1014, 1015, 1020, o un número o un intervalo entre cualquiera de estos valores, cebadores multiplex en un único volumen de reacción. La amplificación puede comprender usar un 1° conjunto de cebadores de PCR 324 que comprende cebadores personalizados 326A-C dirigidos a genes específicos y un cebador universal 328. Los cebadores personalizados 326 pueden hibridar con una región dentro de la porción de ADNc 306' de la molécula de ADNc marcada 304. El cebador universal 328 puede hibridar con la región de PCR universal 316 de la molécula de ADNc marcada 304.

Como se muestra en el paso 3 de la FIG. 3, los productos de la amplificación por PCR del paso 2 pueden amplificarse con un grupo de cebadores de PCR anidada y un 2° cebador de PCR universal. La PCR anidada puede minimizar el sesgo de amplificación por PCR. En particular, los amplicones marcados por PCR anidada 322 pueden amplificarse adicionalmente por PCR anidada. La PCR anidada puede comprender PCR multiplex con el grupo de cebadores de PCR anidada 330 de cebadores de PCR anidada 332 a-c y un 2° cebador de PCR universal 328' en un único volumen de reacción. El grupo de cebadores de PCR anidada 328 puede contener, contener aproximadamente, contener por lo menos, o contener como máximo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, o un número o un intervalo entre cualquiera de estos valores, cebadores de PCR anidada 330 diferentes. Los cebadores de PCR anidada 332 pueden contener un adaptador 334 e hibridar con una región dentro de la porción de ADNc 306'' del amplicón marcado 322. El cebador universal 328' puede contener un adaptador 336 e hibridar con la región de PCR universal 316 del amplicón marcado 322. Por tanto, el paso 3 produce el amplicón marcado con adaptador 338. En algunas realizaciones, los cebadores de PCR anidada 332 y el 2° cebador de PCR universal 328' pueden no contener los adaptadores 334 y 336. En su lugar, los adaptadores 334 y 336 pueden ligarse a los productos de la PCR anidada para producir el amplicón marcado con adaptador 338.

Como se muestra en el paso 4, los productos de PCR del paso 3 pueden amplificarse por PCR para secuenciación usando cebadores de amplificación de bibliotecas. En particular, los adaptadores 334 y 336 pueden usarse para realizar uno o más ensayos adicionales en el amplicón marcado con adaptador 338. Los adaptadores 334 y 336 pueden hibridar con los cebadores 340 y 342. El uno o más cebadores 340 y 342 pueden ser cebadores de amplificación de PCR. El uno o más cebadores 340 y 342 pueden ser cebadores de secuenciación. El uno o más adaptadores 334 y 336 pueden usarse para la amplificación adicional de los amplicones marcados con adaptador 338. El uno o más adaptadores 334 y 336 pueden usarse para secuenciar el amplicón marcado con adaptador 338. El cebador 342 puede contener un índice de placa 344 para que los amplicones generados usando el mismo conjunto de códigos de barras o códigos de barras estocásticos 310 puedan secuenciarse en una reacción de secuenciación usando secuenciación de próxima generación (NGS).

Codificación con código de barras en los extremos 5' de las dianas de ácidos nucleicos

En la presente se divulgan sistemas, métodos, composiciones y kits para la unión de códigos de barras (por ejemplo, códigos de barras estocásticos) con marcadores moleculares (o índices moleculares) a los extremos 5' de las dianas de ácido nucleico que se están codificando con códigos de barras o marcando (por ejemplo, moléculas de ácido desoxirribonucleico y moléculas de ácido ribonucleico). Los métodos de recuento de transcritos basados en 5' divulgados en la presente pueden complementar o suplementar, por ejemplo, los métodos de recuento de transcritos basados en 3' (por ejemplo, el ensayo Rhapsody™ (Becton, Dickinson and Company (Franklin Lakes, NJ)), solución 3' de células individuales Chromium™ (10X Genomics (San Francisco, CA))). Las dianas de ácido nucleico codificadas con código de barras pueden usarse para la identificación de secuencias, el recuento de transcritos, el análisis de corte y empalme alternativo, el cribado de mutaciones y/o la secuenciación de longitud completa de una manera de alto rendimiento. El recuento de transcritos en el extremo 5' (5' con respecto a las dianas de ácido nucleico marcadas) puede revelar isoformas de corte y empalme alternativas y variantes (incluyendo, pero no limitadas a, variantes de corte y empalme, polimorfismos de un único nucleótido (SNP), inserciones, deleciones, sustituciones) en, o más cerca de, los extremos 5' de las moléculas de ácido nucleico. En algunas realizaciones, el método puede implicar hibridación intramolecular.

Las FIGS. 4A-4B muestran una ilustración esquemática de un método ejemplar no limitativo 400 de marcado específico de genes de dianas de ácido nucleico en los extremos 5'. Un código de barras 420 (por ejemplo, un código de barras estocástico) con una región de unión a la diana (por ejemplo, una cola de poli(dT) 422) puede unirse a transcritos de ARN poli-adenilados 424 a través de la cola de poli(dA) 426, u otras dianas de ácido nucleico, para marcado o codificación con código de barras (por ejemplo, marcado único). Los códigos de barras 420 pueden incluir marcadores moleculares (ML) 428 y marcadores de muestra (SL) 430 para marcar los transcritos 424 y rastrear los orígenes de muestra de los transcritos de ARN 424, respectivamente, junto con una o más secuencias adicionales (por ejemplo, secuencias consenso, como una secuencia adaptadora 432), flanqueando la región de marcador molecular 428/marcador de muestra 430 de cada código de barras 420 para reacciones posteriores. El repertorio de secuencias de los marcadores moleculares en los códigos de barras por muestra puede ser lo suficientemente amplio para el marcado estocástico de los transcritos de ARN.

Después de la síntesis de ADNc en el bloque 402 para generar moléculas de ADNc codificadas con código de barras 434 que comprenden los transcritos de ARN 424 (o una parte de los mismos), puede usarse un método específico del gen para codificar con códigos de barras moleculares 5'. Después de la amplificación específica del gen en el bloque 404, que puede ser opcional, puede añadirse una transferasa terminal y desoxiadenosina trifosfatos (dATP) en el bloque 406 para facilitar la adición de cola 3' de poli(dA) para generar amplicones 436 con una cola de poli(A) 438. Un breve paso de desnaturalización en el bloque 408 permite la separación de las cadenas directa 436m e inversa 436c (por ejemplo, moléculas de ADNc codificadas con código de barras con colas de poli(dA)) del amplicón 436. La cadena inversa 436c del amplicón 436 puede hibridar intramolecularmente a través de su cola de poli(dA) 438 en el extremo 3' y el extremo de la región de poli(dT) 422 en la cadena para formar una horquilla 440 en el bloque 410. A continuación, puede usarse una polimerasa (por ejemplo, un fragmento de Klenow) para extenderse desde la cola de poli(dA) 438 para duplicar el código de barras y formar la cadena inversa 442 codificada con código de barras extendida en el bloque 412. A continuación, puede realizarse una amplificación específica de genes en el bloque 414 (por ejemplo, opcionalmente) para amplificar genes de interés y producir amplicones 444 con códigos de barras en el extremo 5' (en relación con los transcritos de ARN 424) para secuenciación en el bloque 416. En algunas realizaciones, el método 400 incluye una o ambas de amplificación específica de gen de la molécula de ADNc codificada con código de barras 434 en el bloque 404 y la amplificación específica del gen de la cadena inversa codificada con código de barras extendida 442 en el bloque 414.

Las FIGS. 5A-5B muestran una ilustración esquemática de un método 500 ejemplar no limitativo de marcado de dianas de ácido nucleico en los extremos 5' para el análisis del transcriptoma completo. Un código de barras 420 (por ejemplo, un código de barras estocástico) con una región de unión a la diana (por ejemplo, una cola de poli(dT) 422) puede unirse a transcritos de ARN poliadenilados 424 a través de la cola de poli(dA) 426, u otras dianas de ácido nucleico, para el marcado o la codificación con código de barras (por ejemplo, marcado único). Por ejemplo, un código de barras 420 con una región de unión a la diana puede unirse a una diana de ácido nucleico para el marcado o la codificación con código de barras. Un código de barras 420 puede incluir un marcador molecular (ML) 428 y un marcador de muestra (SL) 430. Los marcadores moleculares 428 y los marcadores de muestra 430 pueden usarse para marcar los transcritos 424, o las dianas de ácido nucleico (por ejemplo, oligonucleótidos de anticuerpos, ya estén asociados con anticuerpos o se hayan disociado de anticuerpos) y rastrear los orígenes de muestra de los transcritos 424, respectivamente, junto con una o más secuencias adicionales (por ejemplo, secuencias consenso, como una secuencia adaptadora 432), flanqueando la región de marcador molecular 428/marcador de muestra 430 de cada código de barras 420 para reacciones posteriores. El repertorio de secuencias de los marcadores moleculares 428 en los códigos de barras por muestra puede ser suficientemente amplio para el marcado estocástico de transcritos de ARN 424, o dianas de ácidos nucleicos.

Después de la síntesis de ADNc para generar moléculas de ADNc codificadas con código de barras 434 en el bloque 402, puede usarse una enzima transferasa terminal para la adición de cola A del extremo 3' de las moléculas de ADNc codificadas con código de barras 434 (equivalente al extremo 5' de los transcritos de ARN marcados) para generar moléculas de ADNc 436c cada una con una cola 3' de poli(dA) 438 en el bloque 406. La hibridación intramolecular de las moléculas de ADNc 436c con colas 3' de poli(dA) 438 puede iniciarse (por ejemplo, con un ciclo de calentamiento y enfriamiento, o diluyendo las moléculas de ADNc codificadas con códigos de barras 436c con colas de poli(dA) 438) de tal manera que la nueva cola de poli(dA) 3' 438 se aparea con la cola de poli(dT) 422 de la misma molécula de ADNc marcada para generar una molécula de ADNc codificada con código de barras con una estructura de horquilla 440 en el bloque 410. Puede añadirse una polimerasa (por ejemplo, enzima Klenow) con dNTP para facilitar una extensión 3' más allá de la nueva cola 3' de poli(dA) 438 para duplicar los códigos de barras (por ejemplo, marcadores moleculares 428 que están en los extremos 5' de las moléculas de ADNc marcadas con horquillas 440 en el bloque 412. Puede realizarse una amplificación del transcriptoma completo (WTA) en el bloque 414 usando adaptadores reflejados 432, 432rc o cebadores que contengan secuencias (o subsecuencias) de los adaptadores 432, 432rc. Pueden usarse métodos, como la etiquetación o el cebado aleatorio, para generar fragmentos más pequeños de amplicones 444 con adaptadores de secuenciación (por ejemplo, secuencia P5446 y P7448) para secuenciación en el bloque 418 (por ejemplo, usando un secuenciador Illumina (San Diego, CA, US). En algunas realizaciones, pueden ligarse directamente los adaptadores de secuenciación para otros métodos de secuenciación o secuenciadores (por ejemplo, secuenciadores de Pacific Biosciences de California, Inc. (Menlo Park, CA, US) u Oxford Nanopore Technologies Limited (Oxford, Reino Unido)) para generar amplicones para secuenciación.

Lo divulgado en la presente incluye métodos para determinar los números de una diana de ácido nucleico en una muestra. En algunas realizaciones, el método comprende: poner en contacto copias de una diana de ácido nucleico 424 en una muestra con una pluralidad de códigos de barras de oligonucleótidos 420, en donde cada uno de la pluralidad de códigos de barras de oligonucleótidos 420 comprende una secuencia de marcador molecular 428 y una región de unión a la diana (por ejemplo, una secuencia de poli(dT) 422) capaz de hibridar con la diana de ácido nucleico 424, y en donde por lo menos 10 de la pluralidad de códigos de barras de oligonucleótidos 420 comprenden diferentes secuencias de marcador molecular 428; extender las copias de la diana de ácido nucleico 424 hibridadas con los códigos de barras de oligonucleótidos 420 para generar una pluralidad de moléculas de ácido nucleico 434 que comprenden cada una una secuencia complementaria 450c a por lo menos una parte de la diana de ácido nucleico 424 en el bloque 402; amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras 434 en el bloque 404 para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras amplificadas 436; unir un oligonucleótido que comprende el complemento 438 de la región de unión a la diana 422 a la pluralidad de moléculas de ácido nucleico codificadas con código de barras amplificadas 436 para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras 436c que comprenden cada una la región de unión a la diana 422 y un complemento 438 de la región de unión a la diana en el bloque 406; hibridar la región de unión a la diana 422 y el complemento 438 de la región de unión a la diana 422 dentro de cada una de la pluralidad de moléculas de ácido nucleico codificadas con código de barras 436c para formar una horquilla 440 en el bloque 410; extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras cada una con la horquilla 440 en el bloque 412 para extender la horquilla 440 para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442 que comprenden cada una el marcador molecular 428 y un complemento 428rc del marcador molecular; amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442 en el bloque 414 para generar una pluralidad de moléculas de ácido nucleico marcadas individualmente 444c que comprenden cada una el complemento 428rc del marcador molecular; y determinar el número de la diana de ácido nucleico en la muestra basándose en el número de complementos 428rc de marcadores moleculares con secuencias distintas asociadas con la pluralidad de moléculas de ácido nucleico marcadas individualmente.

En algunas realizaciones, el marcador molecular 428 se hibrida con el complemento 428rc del marcador molecular después de extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras con las horquillas 440. El método puede comprender desnaturalizar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442 antes de amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442 para generar la pluralidad de moléculas de ácido nucleico marcadas individualmente 444c (que pueden formar parte de los amplicones 444c). Poner en contacto copias de la diana de ácido nucleico 424 en la muestra puede comprender poner en contacto copias de una pluralidad de dianas de ácido nucleico 424 con una pluralidad de códigos de barras de oligonucleótidos 420. Extender las copias de la diana de ácido nucleico 424 puede comprender extender las copias de la pluralidad de dianas de ácido nucleico 424 hibridadas con los códigos de barras de oligonucleótidos 420 para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras 436c, cada una de las cuales comprende una secuencia complementaria 450c a por lo menos una parte de una de la pluralidad de dianas de ácido nucleico 424. Determinar el número de la diana de ácido nucleico 424 puede comprender determinar el número de cada una de la pluralidad de dianas de ácido nucleico 424 en la muestra basándose en el número de los complementos 428rc de los marcadores moleculares con secuencias distintas asociadas con moléculas de ácido nucleico marcadas individualmente de la pluralidad de moléculas de ácido nucleico marcadas individualmente 444c que comprenden una secuencia 452c de la cada una de la pluralidad de dianas de ácido nucleico 424. La secuencia 452c de cada una de la pluralidad de dianas de ácido nucleico puede comprender una subsecuencia (incluyendo un complemento o un complemento inverso) de cada una de la pluralidad de dianas de ácido nucleico 424.

Lo divulgado en la presente incluye métodos para determinar el número de dianas en una muestra. En algunas realizaciones, el método comprende: codificar con códigos de barras 402 copias de una diana de ácido nucleico 424 en una muestra usando una pluralidad de códigos de barras de oligonucleótidos 420 para generar una pluralidad de moléculas de ácido nucleico codificadas con códigos de barras 434 cada una de las cuales comprende una secuencia 450c (por ejemplo, una secuencia complementaria, una secuencia complementaria inversa, o una combinación de las mismas) de la diana de ácido nucleico 424, un marcador molecular 428, y una región de unión a la diana (por ejemplo, una región poli(dT) 422), y en donde por lo menos 10 de la pluralidad de códigos de barras de oligonucleótidos 420 comprenden diferentes secuencias de marcador molecular 428; unir 406 un oligonucleótido que comprende un complemento 438 de la región de unión a la diana 422 a la pluralidad de moléculas de ácido nucleico codificadas con código de barras 434 para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras 436 que comprenden cada una la región de unión a la diana 422 y el complemento 438 de la región de unión a la diana 422; hibridar 410 la región de unión a la diana 422 y el complemento 438 de la región de unión a la diana dentro de cada una de la pluralidad de moléculas de ácido nucleico codificadas con código de barras 436c para formar una horquilla 440; extender 412 los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras para extender la horquilla 440 para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442 que comprenden cada una el marcador molecular 428 y un complemento 428rc del marcador molecular; y determinar el número de la diana de ácido nucleico 424 en la muestra basándose en el número de complementos 428rc de marcadores moleculares con secuencias distintas asociadas con la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442.

Lo divulgado en la presente incluye métodos para unir códigos de barras de oligonucleótidos a una diana en una muestra. En algunas realizaciones, el método comprende: codificar con códigos de barras 402 copias de una diana de ácido nucleico 424 en una muestra usando una pluralidad de códigos de barras de oligonucleótidos 420 para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras 434 que comprenden cada una una secuencia 450c de la diana de ácido nucleico 424, un marcador molecular 428, y una región de unión a la diana 422, y en donde por lo menos 10 de la pluralidad de códigos de barras de oligonucleótidos 420 comprenden diferentes secuencias de marcador molecular 428; unir un oligonucleótido que comprende un complemento 438 de la región de unión a la diana 422 a la pluralidad de moléculas de ácido nucleico codificadas con código de barras 434 para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras 436c que comprenden cada una la región de unión a la diana 422 y el complemento 438 de la región de unión a la diana 422; hibridar 410 la región de unión a la diana 422 y el complemento 438 de la región de unión a la diana 422 dentro de cada una de la pluralidad de moléculas de ácido nucleico codificadas con código de barras 436c para formar una horquilla 440; y extender 412 los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras para extender la horquilla 440 para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442 que comprenden cada una el marcador molecular 428 y un complemento 428rc del marcador molecular 428. En algunas realizaciones, el método comprende: determinar el número de la diana de ácido nucleico 424 en la muestra basándose en el número de marcadores moleculares 428 con secuencias distintas, complementos 428rc de los mismos, o una combinación de los mismos, asociados con la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442. Por ejemplo, el número de la diana de ácido nucleico 424 puede determinarse basándose en uno o ambos marcadores moleculares 428 con secuencias distintas, complementos 428rc de los mismos.

En algunas realizaciones, el método comprende: codificar con códigos de barras 402 las copias de la pluralidad de dianas 424 comprende: poner en contacto las copias de la diana de ácido nucleico 424 con la pluralidad de códigos de barras de oligonucleótidos 420, en donde cada uno de la pluralidad de códigos de barras de oligonucleótidos 420 comprende la región de unión a la diana 422 capaz de hibridar con la diana de ácido nucleico 424; y extender 402 las copias de la diana de ácido nucleico 424 hibridadas con los códigos de barras de oligonucleótidos 420 para generar la pluralidad de moléculas de ácido nucleico codificadas con código de barras 434.

En algunas realizaciones, el método comprende: amplificar 404 la pluralidad de moléculas de ácido nucleico codificadas con código de barras 434 para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras amplificadas 436c, en donde unir el oligonucleótido que comprende el complemento 438 de la región de unión a la diana 422 comprende: unir el oligonucleótido que comprende el complemento 438 de la región de unión a la diana a la pluralidad de moléculas de ácidos nucleicos codificadas con código de barras amplificadas para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras 436r que comprenden cada una la región de unión a la diana 422 y un complemento 438 de la región de unión a la diana.

Análisis específico de genes. En algunas realizaciones, el método (por ejemplo, el método 400) comprende: amplificar 414 la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442 o generar una pluralidad de moléculas de ácido nucleico marcadas individualmente 444c, cada una de las cuales comprende el complemento 428rc del marcador molecular 428. Las moléculas de ácido nucleico marcadas individualmente 444c pueden generarse cuando se desnaturalizan los amplicones 444 que las contienen. Determinar el número de la diana de ácido nucleico 424 en la muestra puede comprender: determinar el número de la diana de ácido nucleico 424 en la muestra basándose en el número de complementos 428rc de marcadores moleculares 428 con secuencias distintas asociadas con la pluralidad de moléculas de ácido nucleico marcadas individualmente 444c.

Análisis del Transcriptoma Completo. En algunas realizaciones, el método (por ejemplo, el método 500) comprende: amplificar 414 la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442 para generar copias 444c de la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas. Determinar el número de la diana de ácido nucleico 424 en la muestra comprende: determinar el número de la diana de ácido nucleico 424 en la muestra basándose en el número de complementos 428rc de marcadores moleculares 428 con secuencias distintas asociadas con las copias 444c de la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas. Las copias 444c de la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas pueden formarse cuando se desnaturalizan los amplicones 444 que las contienen.

En algunas realizaciones, la secuencia de la diana de ácido nucleico en la pluralidad de moléculas de ácido nucleico codificadas con código de barras comprende una subsecuencia 452c de la diana de ácido nucleico. La región de unión a la diana puede comprender una secuencia específica de gen. Unir 406 el oligonucleótido que comprende el complemento 438 de la región de unión a la diana 422 puede comprender ligar el oligonucleótido que comprende el complemento 438 de la región de unión a la diana 422 a la pluralidad de moléculas de ácido nucleico codificadas con códigos de barras 434.

En algunas realizaciones, la región de unión a la diana puede comprender una secuencia de poli(dT) 422. La unión del oligonucleótido que comprende el complemento 438 de la región de unión a la diana 422 comprende: añadir una pluralidad de monofosfatos de adenosina a la pluralidad de moléculas de ácido nucleico codificadas con código de barras 434 usando una desoxinucleotidil transferasa terminal.

En algunas realizaciones, extender las copias de la diana de ácido nucleico 424 hibridadas a los códigos de barras de oligonucleótidos 420 puede comprender transcribir inversamente las copias de la diana de ácido nucleico 424 hibridadas a los códigos de barras de oligonucleótidos 420 para generar una pluralidad de moléculas de ácido desoxirribonucleico complementario (ADNc) codificadas con código de barras 434. La extensión de las copias de la diana de ácido nucleico 424 hibridadas con los códigos de barras de oligonucleótidos 420 puede comprender extender 402 las copias de la diana de ácido nucleico 424 hibridadas con los códigos de barras de oligonucleótidos 420 usando una ADN polimerasa que carezca de por lo menos una de la actividad de exonucleasa 5' a 3' y actividad de exonucleasa 3' a 5'. La ADN polimerasa puede comprender un fragmento de Klenow.

En algunas realizaciones, el método comprende: obtener información de secuencia de la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442. Obtener la información de secuencia puede comprender la unión de adaptadores de secuenciación (por ejemplo, el adaptador P5 446 y P7 448) a la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442.

En algunas realizaciones, el complemento 438 de la región de unión a la diana puede comprender la secuencia complementaria inversa de la región de unión a la diana. El complemento 438 de la región de unión a la diana puede comprender la secuencia complementaria de la región de unión a la diana. El complemento 428rc del marcador molecular puede comprender una secuencia complementaria inversa del marcador molecular. El complemento del marcador molecular puede comprender una secuencia complementaria del marcador molecular.

En algunas realizaciones, la pluralidad de moléculas de ácido nucleico codificadas con código de barras 434 puede comprender moléculas de ácido desoxirribonucleico (ADN) codificadas con código de barras. Las moléculas de ácido nucleico codificadas con código de barras 434 pueden comprender moléculas de ácido ribonucleico (ARN) codificadas con código de barras. La diana de ácido nucleico 424 puede comprender una molécula de ácido nucleico. La molécula de ácido nucleico puede comprender ácido ribonucleico (ARN), ARN mensajero (ARNm), microARN, ARN interferente pequeño (ARNip), producto de degradación de ARN, ARN que comprende una cola poli(A), o cualquier combinación de los mismos.

Oligonucleótidos de anticuerpos. En algunas realizaciones, la diana de ácido nucleico puede comprender un reactivo de unión a componentes celulares. Los reactivos de unión celular asociados a dianas de ácido nucleico (por ejemplo, oligonucleótidos de anticuerpos, como oligonucleótidos de indexación de muestras) se han descrito en la US2018/0088112; y la US2018/0346970, presentadas el 27 de marzo de 2018. En algunas realizaciones, la información multiómica, como la genómica, la accesibilidad de la cromatina, la metilómica, la transcriptómica y la proteómica, de células individuales puede obtenerse usando métodos de codificación con códigos de barras 5' de la divulgación. La molécula de ácido nucleico puede asociarse con el reactivo de unión a componentes celulares. El método puede comprender: disociar la molécula de ácido nucleico y el reactivo de unión a componente celular.

En algunas realizaciones, cada marcador molecular 428 de la pluralidad de códigos de barras de oligonucleótidos 420 comprende por lo menos 6 nucleótidos. El código de barras de oligonucleótidos 420 puede comprender un marcador de muestra idéntico 430. Cada marcador de muestra 430 de la pluralidad de códigos de barras de oligonucleótidos 420 puede comprender por lo menos 6 nucleótidos. El código de barras de oligonucleótidos 420 puede comprender un marcador celular idéntico. Cada marcador celular de la pluralidad de códigos de barras de oligonucleótidos 420 puede comprender por lo menos 6 nucleótidos.

En algunas realizaciones, por lo menos una de la pluralidad de moléculas de ácido nucleico codificadas con código de barras 436c se asocia con un soporte sólido cuando hibridan 410 la región de unión a la diana y el complemento de la región de unión a la diana dentro de cada una de la pluralidad de moléculas de ácido nucleico codificadas con código de barras para formar la horquilla. Por lo menos una de la pluralidad de moléculas de ácido nucleico codificadas con código de barras 436c puede disociarse de un soporte sólido al hibridar 410 la región de unión a la diana 422 y el complemento 438 de la región de unión a la diana 422 dentro de cada una de la pluralidad de moléculas de ácido nucleico codificadas con código de barras 436c para formar la horquilla 440. Por lo menos una de la pluralidad de moléculas de ácido nucleico codificadas con código de barras 436c puede asociarse con un soporte sólido cuando hibridan 410 la región de unión a la diana 422 y el complemento 438 de la región de unión a la diana dentro de cada una de la pluralidad de moléculas de ácido nucleico codificadas con código de barras 436c para formar la horquilla 440.

En algunas realizaciones, por lo menos una de la pluralidad de moléculas de ácido nucleico codificadas con código de barras está asociada con un soporte sólido cuando se extienden 412 los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras para extender la horquilla 440 para generar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442 que comprenden cada una el marcador molecular 428 y un complemento 428rc del marcador molecular. Por lo menos una de la pluralidad de moléculas de ácido nucleico codificadas con código de barras puede disociarse de un soporte sólido cuando se extienden 412 los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras para extender la horquilla 440 para generar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442 que comprenden cada una el marcador molecular 428 y un complemento 428rc del marcador molecular. Por lo menos una de la pluralidad de moléculas de ácido nucleico codificadas con código de barras 436c puede asociarse con un soporte sólido cuando se extienden 412 los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras para extender la horquilla 440 para generar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442 que comprenden cada una el marcador molecular 428 y un complemento 428rc del marcador molecular. El soporte sólido puede comprender una partícula sintética 454. El soporte sólido puede comprender una superficie plana o una superficie sustancialmente plana (por ejemplo, un portaobjetos, como un portaobjetos o un cubreobjetos de microscopio).

En algunas realizaciones, por lo menos una de la pluralidad de moléculas de ácido nucleico codificadas con código de barras 436c está en solución cuando hibridan 410 la región de unión a la diana 422 y el complemento 438 de la región de unión a la diana 422 dentro de cada una de la pluralidad de moléculas de ácido nucleico codificadas con código de barras 436c para formar la horquilla 440. Por ejemplo, cuando la concentración de la pluralidad de moléculas de ácido nucleico codificadas con código de barras 436c en solución es suficientemente baja, puede producirse dicha hibridación intramolecular. Por lo menos una de la pluralidad de moléculas de ácido nucleico codificadas con código de barras puede estar en solución cuando se extienden 412 los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras para extender la horquilla 440 para generar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas 442, cada una de las cuales comprende el marcador molecular 428 y un complemento 428rc del marcador molecular.

En algunas realizaciones, la muestra comprende una célula individual, el método comprendiendo asociar una partícula sintética 454 que comprende la pluralidad de los códigos de barras de oligonucleótidos 420 con la célula individual de la muestra. El método puede comprender: lisar la célula individual después de asociar la partícula sintética 454 con la célula individual. Lisar la célula individual puede comprender calentar la muestra, poner en contacto la muestra con un detergente, cambiar el pH de la muestra, o cualquier combinación de los mismos. La partícula sintética y la célula individual pueden estar en el mismo pocillo. La partícula sintética y la célula individual pueden estar en la misma gotita.

En algunas realizaciones, puede inmovilizarse por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos 420 en la partícula sintética 454. Puede inmovilizarse parcialmente por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos 420 en la partícula sintética 454. Puede encerrarse por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos 420 en la partícula sintética 454. Puede encerrarse parcialmente por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos 420 en la partícula sintética 454. La partícula sintética 454 puede ser perturbable. La partícula sintética 454 puede comprender una perla. La perla puede comprender una perla de sefarosa, una perla de estreptavidina, una perla de agarosa, una perla magnética, una perla conjugada, una perla conjugada con proteína A, una perla conjugada con proteína G, una perla conjugada con proteína A/G, una perla conjugada con proteína L, una perla conjugada con oligo(dT), una perla de sílice, una perla similar a sílice, una microperla antibiotina, una microperla antifluorocromo, o cualquier combinación de las mismas. La partícula sintética 454 puede comprender un material seleccionado del grupo que consiste en polidimetilsiloxano (PDMS), poliestireno, vidrio, polipropileno, agarosa, gelatina, hidrogel, paramagnético, cerámica, plástico, vidrio, metilestireno, polímero acrílico, titanio, látex, Sefarosa, celulosa, nylon, silicona, y cualquier combinación de los mismos. La partícula sintética 454 puede comprender una partícula de hidrogel perturbable. Cada uno de la pluralidad de códigos de barras de oligonucleótidos 420 puede comprender un grupo funcional conector. La partícula sintética 454 puede comprender un grupo funcional de soporte sólido. El grupo funcional de soporte y el grupo funcional conector pueden estar asociados entre sí. El grupo funcional conector y el grupo funcional de soporte pueden seleccionarse individualmente del grupo que consiste en C6, biotina, estreptavidina, aminas primarias, aldehídos, cetonas, y cualquier combinación de los mismos.

Kits para codificación con códigos de barras en los extremos 5' de dianas de ácidos nucleicos

Lo divulgado en la presente incluye los kits para unir los códigos de barras de oligonucleótidos 420 a una diana 424 en una muestra, determinar los números de dianas 424 en una muestra, y/o determinar los números de una diana de ácido nucleico 424 en una muestra. En algunas realizaciones, el kit incluye: una pluralidad de códigos de barras de oligonucleótidos 420, en donde cada uno de la pluralidad de códigos de barras de oligonucleótidos 420 comprende un marcador molecular 428 y una región de unión a la diana (por ejemplo, una secuencia de poli(dT) 422), y en donde por lo menos 10 de la pluralidad de códigos de barras de oligonucleótidos 420 comprenden diferentes secuencias de marcador molecular 428; una desoxinucleotidil transferasa terminal o una ligasa; y una ADN polimerasa que carece de por lo menos una de la actividad exonucleasa 5' a 3' y la actividad de exonucleasa 3' a 5'. La ADN polimerasa puede comprender un fragmento de Klenow. El kit puede comprender un tampón y/o un cartucho. El kit puede incluir uno o más reactivos para una reacción de transcripción inversa. El kit puede comprender uno o más reactivos para una reacción de amplificación.

En algunas realizaciones, la región de unión a la diana comprende una secuencia específica de gen, una secuencia oligo(dT), un multímero aleatorio o cualquier combinación de los mismos. El código de barras de oligonucleótidos puede comprender un marcador de muestra idéntico y/o un marcador celular idéntico. Cada marcador de muestra y/o marcador celular de la pluralidad de códigos de barras de oligonucleótidos puede comprender por lo menos 6 nucleótidos. Cada marcador molecular de la pluralidad de códigos de barras de oligonucleótidos puede comprender por lo menos 6 nucleótidos.

En algunas realizaciones, por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos 420 está inmovilizado sobre la partícula sintética 454. Por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos 420 puede estar parcialmente inmovilizado en la partícula sintética 454. Por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos 420 puede estar encerrado en la partícula sintética 454. Por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos 420 puede estar parcialmente encerrado en la partícula sintética 454. La partícula sintética 454 puede ser perturbable. La partícula sintética 454 puede comprender una perla. La perla puede comprender una perla de sefarosa, una perla de estreptavidina, una perla de agarosa, una perla magnética, una perla conjugada, una perla conjugada con proteína A, una perla conjugada con proteína G, una perla conjugada con proteína A/G, una perla conjugada con proteína L, una perla conjugada con oligo(dT), una perla de sílice, una perla similar a la sílice, una microperla antibiotina, una microperla antifluorocromo, o cualquier combinación de las mismas. La partícula sintética puede comprender un material seleccionado del grupo que consiste en polidimetilsiloxano (PDMS), poliestireno, vidrio, polipropileno, agarosa, gelatina, hidrogel, paramagnético, cerámica, plástico, vidrio, metilestireno, polímero acrílico, titanio, látex, Sefarosa, celulosa, nylon, silicona, y cualquier combinación de los mismos. La partícula sintética 454 puede comprender una partícula de hidrogel perturbable. Cada uno de la pluralidad de códigos de barras de oligonucleótidos puede comprender un grupo funcional conector. La partícula sintética 454 puede comprender un grupo funcional de soporte sólido. El grupo funcional de soporte y el grupo funcional conector pueden estar asociados entre sí. El grupo funcional conector y el grupo funcional de soporte pueden seleccionarse individualmente del grupo que consiste en C6, biotina, estreptavidina, aminas primarias, aldehídos, cetonas, y cualquier combinación de los mismos.

Elaboración de perfiles de expresión de longitud completa

La secuenciación de ARN de células individuales de alto rendimiento ha transformado la comprensión de muestras biológicas complejas y heterogéneas. Sin embargo, la mayoría de los métodos sólo permiten el análisis 3' de la información de transcritos de ARNm, lo que puede limitar el análisis de variantes de corte y empalme, sitios de inicio de transcripción alternativos y loci altamente variables debido al reordenamiento, como la unión VDJ de receptores de células T y células B y anticuerpos. Los métodos para determinar las secuencias de una diana de ácido nucleico (por ejemplo, la región V(D)J de un receptor inmunitario) usando codificación con código de barras 5' y/o codificación con código de barras 3' se describen en la US2020/0109437, presentada el 30 de septiembre de 2019. La FIG. 9A es un esquema ejemplar no limitativo de la elaboración de perfiles de expresión 5' de un ARNm de receptor inmunitario. Aunque la elaboración de perfiles de expresión 5' de la región V(D)J de un receptor inmunitario puede mejorar la cobertura TCR/BCR, y puede proporcionar información de la secuencia CDR3, este enfoque puede pasar por alto la región V (indicada por el recuadro punteado en la FIG. 9A). Para las células T y B, los enfoques basados en el cebado C actualmente disponibles pueden leer en V(D)J pero no detectan la región V en sentido ascendente. Por tanto, los métodos actualmente disponibles pueden limitar la capacidad de obtener información de la diana de ácido nucleico de longitud completa (por ejemplo, transcrito que contiene V(D)J). Un problema particular en la técnica es que necesitamos conocer la secuencia VDJ como una lectura más larga porque hay muchos VDJ debido a los numerosos eventos de recombinación posibles. Se necesitan métodos tanto de recuento de secuencias (por ejemplo, V(D)J que contengan transcritos) como de identificación de dichas secuencias (en particular, identificación de secuencias de longitud completa).

En algunas realizaciones, se proporcionan métodos para obtener información V(D)J de longitud completa (por ejemplo, mediante secuenciación Illumina en el sistema Rhapsody) usando un enfoque de cebado aleatorio. Los receptores de células T y B contienen segmentos V, segmentos D (sólo para la cadena beta del TCR y la cadena pesada del BCR), segmentos J, así como una región constante en el extremo de cebado 3' del ARNm. La CDR3, formada por la unión V(D)J, contiene la mayor parte de la diversidad del repertorio y es lo suficientemente corta como para ser secuenciada en la plataforma de lectura corta Illumina. Sin embargo, la información del segmento V de longitud completa también es útil y no puede obtenerse fácilmente sin tecnologías de secuenciación de lectura larga, ya que la capacidad de lectura corta de Illumina limita la capacidad de obtener información V(D)J de longitud completa. Los métodos proporcionados en la presente pueden emplear cebado y extensión aleatorios para generar una biblioteca que contenga tanto amplicones V(D)J de longitud completa así como amplicones más cortos que solo contengan secuencias parciales del segmento V, lo que permitiría a un usuario obtener tanto información CDR3 como la secuencia del segmento V de longitud completa a partir de una única biblioteca y ejecución de secuenciación compatible con los secuenciadores Illumina. Por tanto, algunas realizaciones de los métodos proporcionados en la presente proporcionan secuencias de ARNm de receptor inmunitario de longitud completa.

Los ensayos VDJ 5' actualmente disponibles pueden adquirir información de longitud completa mediante un enfoque de fragmentación, que también es posible en Rhapsody, pero requiere enzimas y reactivos de mayor coste. Además, este enfoque basado en la fragmentación implica más pasos enzimáticos (por ejemplo, fragmentación, reparación de extremos, adición de colas a, ligadura) frente al enfoque de cebado aleatorio que se proporciona en la presente (que implica únicamente cebado y extensión aleatorios). La fragmentación también puede requerir el uso de enzimas para añadir sitios de cebado, mientras que algunas realizaciones de los métodos basados en cebado aleatorio que se proporcionan en la presente no requieren la ligación de sitios de cebado conocidos.

La FIG. 7 es una ilustración esquemática de un flujo de trabajo ejemplar no limitativo para realizar la elaboración de perfiles de expresión de longitud completa. El método puede comprender cebado aleatorio en un producto de PCR enriquecido en TCR/BCR. El producto de PCR enriquecido en TCR/BCR puede ser el producto de una amplificación de las moléculas de ácido nucleico codificadas con código de barras extendidas proporcionadas en la presente (por ejemplo, una primera pluralidad de amplicones codificados con código de barras). El producto de PCR enriquecido de TCR/BCR puede ser el resultado de amplificar una pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas usando un cebador específico de la diana capaz de hibridar con una secuencia de la diana de ácido nucleico y un cebador que comprende una primera secuencia universal. La realización de cebado aleatorio puede generar productos más cortos. El cebado de la cadena de sentido y el cebado de la cadena antisentido pueden generar productos de extensión de cebado aleatorio. El método puede comprender la realización de PCR3. La amplificación por PCR3 de los productos de la cadena de sentido que contienen códigos de barras celulares y UMI puede generar una biblioteca de secuenciación. Sin embargo, no hay amplificación de productos de hebra antisentido sin códigos de barras celulares y UMI. Dependiendo del sitio de unión del cebador aleatorio, puede generarse una variedad de productos de extensión. La FIG. 8 representa un ejemplo no limitativo de traza de bioanalizador generada de acuerdo con los métodos proporcionados en la presente. Por consiguiente, en la presente se proporciona un medio para obtener lecturas más largas de la región V (para identificar el VDJ de una muestra particular). El Illumina lee a partir de la región C, y la longitud de lectura normal es de aproximadamente 150 bo, lo que proporciona datos de secuenciación hasta el final de V (si se comienza con la molécula de ácido nucleico codificada con código de barras ampliada que se proporciona en la presente). Los cebadores de PCR3 pueden añadir adaptadores de secuenciación (por ejemplo, P5 y P7) e índice de muestra (por ejemplo, i5, i7) a través de salientes. El método puede comprender secuenciar y reconstruir bioinformáticamente la V(D)J de longitud completa (por ejemplo, alinear la pluralidad de lecturas de secuenciación como se muestra en la FIG. 9B). En algunas realizaciones, los métodos proporcionados en la presente identifican la diana de ácido nucleico (por ejemplo, transcritos que contienen V(D)J) y cuentan el número de copias de dicha diana de ácido nucleico.

En algunas realizaciones, se proporcionan composiciones, métodos, sistemas y kits para obtener información de diana de ácido nucleico de longitud completa (por ejemplo, transcrito). En algunas realizaciones, las moléculas de ácido nucleico codificadas con código de barras extendidas generadas de acuerdo con los métodos proporcionados en la presente se emplean como plantilla para realizar cebado y extensión aleatorios. En algunas realizaciones, las moléculas de ácido nucleico codificadas con código de barras extendidas se amplifican (por ejemplo, con un cebador específico de la diana y un cebador que comprende una primera secuencia universal) para generar una primera pluralidad de amplicones codificados con código de barras. En algunas realizaciones, la primera pluralidad de amplicones codificados con código de barras se usa como plantilla para realizar el cebado aleatorio y la extensión (por ejemplo, usando cebadores aleatorios que comprenden una segunda secuencia universal, o un complemento de la misma) para generar una pluralidad de productos de extensión. Los cebadores aleatorios pueden unirse a diferentes ubicaciones a lo largo de la secuencia codificante de todos los transcritos y extenderse para generar una pluralidad de productos de extensión (por ejemplo, productos amplificados linealmente). Los productos de extensión pueden comprender ADNc de longitud variable dependiendo del sitio de unión del cebador aleatorio. El producto de extensión puede amplificarse con cebadores de amplificación de la biblioteca de secuenciación para generar una segunda pluralidad de amplicones codificados con código de barras. La amplificación de la biblioteca de secuenciación puede comprender el uso de cebadores directos e inversos de la biblioteca que añaden adaptadores de secuenciación y/o índices de biblioteca a través de salientes. La amplificación de la biblioteca puede añadir adaptadores de secuenciación (por ejemplo, secuencia P5 y P7) e índice de muestra (por ejemplo, i5, i7) a través de salientes en un cebador directo de biblioteca y un cebador inverso de biblioteca. Los métodos pueden comprender la obtención de la información de secuencia de la segunda pluralidad de amplicones codificados con código de barras (o productos de los mismos). La segunda pluralidad de amplicones codificados con código de barras puede secuenciarse y someterse a métodos descendentes de la divulgación. La secuenciación de extremos emparejados usada para generar lecturas de secuenciación de 150 pb x 2 puede revelar el marcador celular, el índice molecular único, la cola de poli(A), y/o el gen (o una secuencia parcial del gen) en la lectura 1, el gen (o una secuencia parcial del gen y/o la cola de poli(A) en la lectura 2, y el índice de la muestra en la lectura de índice 1. La obtención de la información de secuencia de la segunda pluralidad de amplicones codificados con código de barras (o productos de los mismos) puede comprender la obtención de datos de secuenciación que comprenden una pluralidad de lecturas de secuenciación de la segunda pluralidad de amplicones codificados con código de barras (o productos de los mismos). El método puede comprender generar una secuencia de longitud completa de la diana de ácido nucleico alineando cada una de la pluralidad de lecturas de secuenciación.

Los métodos de la divulgación pueden usarse para identificar regiones VDJ de receptores de células B (BCR), receptores de células T (TCR) y anticuerpos. La recombinación VDJ, también conocida como recombinación somática, es un mecanismo de recombinación genética en las primeras etapas de producción de inmunoglobulinas (lg) (por ejemplo, BCR) y receptores de células T (TCR) del sistema inmunitario. La recombinación VDJ puede combinar de manera casi aleatoria segmentos de genes variables (V), diversos (D) y de unión (J). Debido a su aleatoriedad a la hora de elegir diferentes genes, es capaz de codificar de manera diversa proteínas para que coincidan con antígenos de bacterias, virus, parásitos, células disfuncionales como células tumorales y pólenes.

La región VDJ puede comprender un locus grande de 3 Mb que comprende genes variables (V), genes de diversidad (D) y genes de unión (J). Estos son los segmentos que pueden participar en la recombinación VDJ. Puede haber genes constantes que no experimenten recombinación VDJ. El primer evento en la recombinación VDJ de este locus puede ser que uno de los genes D se reordene a uno de los genes J. A continuación, uno de los genes V puede añadirse a este reordenamiento DJ para formar el gen funcional reordenado VDJ que luego codifica el segmento variable de la proteína de cadena pesada. Ambos pasos pueden ser catalizados por enzimas recombinasas, que pueden eliminar el ADN intermedio.

Este proceso de recombinación tiene lugar de manera escalonada en las células B progenitoras para producir la diversidad requerida para el repertorio de anticuerpos. Cada célula B sólo puede producir un anticuerpo (por ejemplo, BCR). Esta especificidad puede lograrse mediante exclusión alélica, de manera que el reordenamiento funcional de un alelo señale que impide la recombinación adicional del segundo alelo.

En algunas realizaciones, la muestra comprende una célula inmunitaria. Una célula inmunitaria puede incluir, por ejemplo, una célula T, una célula B, una célula madre linfoide, una célula progenitora mieloide, un linfocito, un granulocito, un progenitor de células B, un progenitor de células T, una célula asesina natural, una célula Tc, una célula Th, una célula plasmática, una célula de memoria, un neutrófilo, un eosinófilo, un basófilo, un mastocito, un monocito, una célula dendrítica y/o un macrófago, o cualquier combinación de los mismos.

Una célula T puede ser un clon de células T, que puede referirse a células T derivadas de una única célula T o a aquellas que tienen TCR idénticos. Una célula T puede formar parte de una línea de células T que puede incluir clones de células T y poblaciones mixtas de células T con diferentes TCR, todas las cuales pueden reconocer la misma diana (por ejemplo, antígeno, tumor, virus). Las células T pueden obtenerse de numerosas fuentes, incluyendo células mononucleares de sangre periférica, médula ósea, tejido de ganglios linfáticos, tejido de bazo y tumores. Las células T pueden obtenerse a partir de una unidad de sangre extraída de un sujeto, por ejemplo usando separación de Ficoll. Las células de la sangre circulante de un individuo pueden obtenerse por aféresis o leucaféresis. El producto de aféresis puede comprender linfocitos, incluyendo células T, monocitos, granulocitos, células B, otros glóbulos blancos nucleados, glóbulos rojos y plaquetas. Las células pueden lavarse y volverse a suspender en medios para aislar la célula de interés.

Las células T pueden aislarse a partir de linfocitos de sangre periférica lisando los glóbulos rojos y agotando los monocitos, por ejemplo, mediante centrifugación a través de un gradiente PERCOLL™. Una subpoblación específica de células T, como las células T CD28+, CD4+, CDC, CD45RA+ y CD45RO+, puede aislarse aún más mediante técnicas de selección positiva o negativa. Por ejemplo, las células T pueden aislarse por incubación con perlas conjugadas anti-CD3/anti-CD28 (es decir, 3 x 28), como DYNABEADS® M-450 CD3/CD28 T, o XCYTE DYNABEADS™ durante un periodo de tiempo suficiente para la selección positiva de las células T deseadas. Las células inmunitarias (por ejemplo, células T y células B) pueden ser específicas del antígeno (por ejemplo, específicas de un tumor).

En algunas realizaciones, la célula puede ser una célula presentadora de antígeno (APC), como una célula B, una célula B activada de un ganglio linfático, una célula linfoblastoide, una célula B en reposo o una célula B neoplásica, por ejemplo de un linfoma. Una APC puede referirse a una célula B o a una célula dendrítica folicular que exprese por lo menos una de las proteínas de BCRC en su superficie.

Los métodos de la divulgación pueden usarse para rastrear el fenotipo molecular de células T individuales. Los diferentes subtipos de células T pueden distinguirse por la expresión de diferentes marcadores moleculares. Las células T expresan un receptor de células T (TCR) único de un repertorio diverso de TCR. En la mayoría de las células T, el TCR puede estar compuesto por un heterodímero de una cadena a y una p; cada cadena funcional puede ser producto de eventos de recombinación somática del ADN durante el desarrollo de la célula T, lo que permite la expresión de más de un millón de TCR diferentes en un único individuo. Los TCR pueden usarse para definir la identidad de células T individuales, permitiendo el rastreo del linaje para la expansión clonal de células T durante una respuesta inmunitaria. Los métodos inmunológicos de la divulgación pueden usarse de varias maneras, que incluyen pero no se limitan a, identificar el emparejamiento único de cadenas de TCRa y TCRp en células T individuales, cuantificar la expresión de TCR y marcadores a nivel de células individuales, identificar la diversidad de TCR en un individuo, caracterizar el repertorio de TCR expresado en diferentes poblaciones de células T, determinar la funcionalidad de los alelos de las cadenas alfa y beta del TCR e identificar la expansión clonal de células T durante la respuesta inmunitaria.

Emparejamiento de cadenas de receptores de células T

Los receptores de células T (TCR) son moléculas de reconocimiento presentes en la superficie de los linfocitos T. Los receptores de células T que se encuentran en la superficie de las células T pueden estar compuestos por dos subunidades de glicoproteínas denominadas cadenas alfa y beta. Ambas cadenas pueden tener un peso molecular de aproximadamente 40 kDa y poseen un dominio variable y otro constante. Los genes que codifican las cadenas alfa y beta pueden organizarse en bibliotecas de regiones V, D y J a partir de las cuales se forman los genes por reordenación genético. Los TCR pueden reconocer el antígeno que es presentado por una célula presentadora de antígeno como parte de un complejo con una molécula propia específica codificada por un gen de histocompatibilidad. Los genes de histocompatibilidad más potentes se conocen como complejo mayor de histocompatibilidad (MHC). Por tanto, el complejo que reconocen los receptores de células T está formado por un ligando MHC/péptido.

En algunas realizaciones, los métodos, dispositivos y sistemas de la divulgación pueden usarse para secuenciar y emparejar receptores de células T. Los métodos, dispositivos y sistemas de la divulgación pueden usarse para secuenciar cadenas alfa y beta de receptores de células T, emparejar cadenas alfa y beta, y/o determinar la copia funcional de cadenas alfa de receptores de células T. Una única célula puede estar contenida en una única división (por ejemplo, pocillo) con un único soporte sólido (por ejemplo, perla). La célula puede lisarse. La perla puede comprender un marcador estocástico que puede unirse a una ubicación específica dentro de una cadena alfa y/o beta de un TCR. Las moléculas alfa y beta de TCR asociadas con el soporte sólido pueden someterse a los métodos de biología molecular de la divulgación, incluyendo transcripción inversa, amplificación y secuenciación. Las cadenas alfa y beta del TCR que comprenden el mismo marcador celular pueden considerarse procedentes de la misma célula individual, emparejando de este modo las cadenas alfa y beta del TCR.

Emparejamiento de cadena pesada y ligera en repertorios de anticuerpos

Los métodos, dispositivos y sistemas de la divulgación pueden usarse para el emparejamiento de cadenas pesadas y ligeras de receptores de BCR y anticuerpos. Los métodos de la presente divulgación permiten determinar el repertorio de receptores inmunitarios y anticuerpos en un organismo individual o población de células. Los métodos de la presente divulgación pueden ayudar a determinar pares de cadenas polipeptídicas que constituyen receptores inmunitarios. Tanto las células B como las células T expresan receptores inmunitarios; las células B expresan inmunoglobulinas y BCR, y las células T expresan receptores de células T (TCR). Ambos tipos de receptores inmunitarios pueden comprender dos cadenas polipeptídicas. Las inmunoglobulinas pueden comprender cadenas pesadas variables (VH) y ligeras variables (VL). Puede haber dos tipos de TCR: uno que consiste en una cadena alfa y una beta, y otro que consiste en una cadena delta y una gamma. Los polipéptidos de un receptor inmunitario pueden comprender una región constante y una región variable. Las regiones variables pueden ser el resultado de la recombinación y el reordenamiento de unión de extremos de fragmentos de genes en el cromosoma de una célula B o T. En las células B puede producirse una diversificación adicional de las regiones variables por hipermutación somática.

El sistema inmunitario tiene un gran repertorio de receptores, y cualquier par de receptores expresado por un linfocito puede estar codificado por un par de transcripciones separadas y únicas. Puede usarse el conocimiento de las secuencias de pares de cadenas de receptores inmunitarios expresadas en una sola célula para determinar el repertorio inmunitario de un individuo o población de células determinado.

En algunas realizaciones, los métodos, dispositivos y sistemas de la divulgación pueden usarse para secuenciar y emparejar anticuerpos. Los métodos, dispositivos y sistemas de la divulgación pueden usarse para secuenciar cadenas pesadas y ligeras de anticuerpos (por ejemplo, en células B), y/o emparejar las cadenas pesadas y ligeras. Una única célula puede estar contenida en una única división (por ejemplo, pocillo) con un único soporte sólido (por ejemplo, perla). La célula puede lisarse.

La perla puede comprender un marcador estocástico que puede unirse a una ubicación específica dentro de una cadena pesada y/o ligera de un anticuerpo (por ejemplo, en una célula B). Las moléculas de cadena pesada y ligera asociadas con el soporte sólido pueden someterse a los métodos de biología molecular de la divulgación, incluyendo transcripción inversa, amplificación y secuenciación. Las cadenas pesadas y ligeras del anticuerpo que comprenden el mismo marcador celular pueden considerarse procedentes de la misma célula individual, emparejando de este modo las cadenas pesadas y ligeras del anticuerpo.

Métodos de elaboración de perfiles de expresión de longitud completa

En algunas realizaciones se proporcionan métodos de marcado de dianas de ácido nucleico en una muestra. En algunas realizaciones, el método comprende: poner en contacto copias de una diana de ácido nucleico con una pluralidad de códigos de barras de oligonucleótidos, en donde cada código de barras de oligonucleótidos comprende una primera secuencia universal, un marcador molecular (por ejemplo, un primer marcador molecular), y una región de unión a la diana capaz de hibridar con la diana de ácido nucleico; generando una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una la región de unión a la diana y un complemento de la región de unión a la diana; hibridar el complemento de la región de unión a la diana de cada molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de uno o más de: (i) un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos, (ii) la propia molécula de ácido nucleico codificada con código de barras, y (iii) una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras; extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas que comprenden cada una el primer marcador molecular y un segundo marcador molecular; amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas usando un cebador específico de la diana capaz de hibridar con una secuencia de la diana de ácido nucleico y un cebador que comprende la primera secuencia universal, generando de este modo una primera pluralidad de amplicones codificados con código de barras que comprenden la secuencia de la diana de ácido nucleico, o una parte de la misma; hibridar cebadores aleatorios con la primera pluralidad de amplicones codificados con código de barras y extender los cebadores aleatorios para generar una pluralidad de productos de extensión, en donde los cebadores aleatorios comprenden una segunda secuencia universal, o un complemento de la misma; y amplificar la pluralidad de productos de extensión usando cebadores capaces de hibridar con la primera secuencia universal y la segunda secuencia universal, o complementos de las mismas, generando de este modo una segunda pluralidad de amplicones codificados con código de barras. En algunas realizaciones, el método comprende: determinar el número de copias de la diana de ácido nucleico en la muestra basándose en el número de primeros marcadores moleculares con secuencias distintas, segundos marcadores moleculares con secuencias distintas, o una combinación de los mismos, asociados con la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos. En algunas realizaciones, la primera secuencia universal y la segunda secuencia universal son iguales. En algunas realizaciones, la primera secuencia universal y la segunda secuencia universal son diferentes.

En algunas realizaciones se proporcionan métodos para determinar el número de dianas de ácido nucleico en una muestra. En algunas realizaciones, el método comprende: poner en contacto copias de una diana de ácido nucleico con una pluralidad de códigos de barras de oligonucleótidos, en donde cada código de barras de oligonucleótidos comprende una primera secuencia universal, un marcador molecular (por ejemplo, un primer marcador molecular), y una región de unión a la diana capaz de hibridar con la diana de ácido nucleico; generando una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una la región de unión a la diana y un complemento de la región de unión a la diana; hibridar el complemento de la región de unión a la diana de cada molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de uno o más de: (i) un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos, (ii) la propia molécula de ácido nucleico codificada con código de barras, y (iii) una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras; extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas que comprenden cada una el primer marcador molecular y un segundo marcador molecular; amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas usando un cebador específico de la diana capaz de hibridar con una secuencia de la diana de ácido nucleico y un cebador que comprende la primera secuencia universal, generando de este modo una primera pluralidad de amplicones codificados con código de barras que comprendan la secuencia de la diana de ácido nucleico, o una parte de la misma; hibridar cebadores aleatorios con la primera pluralidad de amplicones codificados con código de barras y extender los cebadores aleatorios para generar una pluralidad de productos de extensión, en donde los cebadores aleatorios comprenden una segunda secuencia universal, o un complemento de la misma; amplificar la pluralidad de productos de extensión usando cebadores capaces de hibridar con la primera secuencia universal y la segunda secuencia universal, o complementos de las mismas, generando de este modo una segunda pluralidad de amplicones codificados con código de barras; y determinar el número de copias de la diana de ácido nucleico en la muestra basándose en el número de primeros marcadores moleculares con secuencias distintas, segundos marcadores moleculares con secuencias distintas, o una combinación de los mismos, asociados con la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos.

Determinar el número de copias de la diana de ácido nucleico en la muestra puede comprender: (a) determinar el número de copias de la diana de ácido nucleico en la muestra basándose en el número de segundos marcadores moleculares con secuencias distintas asociadas con la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos, y/o (b) determinar el número de copias de la diana de ácido nucleico en la muestra basándose en el número de primeros marcadores moleculares con secuencias distintas asociadas con la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos. En algunas realizaciones, el método comprende: desnaturalizar la pluralidad de moléculas de ácido nucleico codificadas con código de barras antes de hibridar el complemento de la región de unión a la diana de cada molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de: (i) un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos, (ii) la propia molécula de ácido nucleico codificada con código de barras, y/o (iii) una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras.

El método puede comprender desnaturalizar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas antes de amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas. La secuencia de cada una de la pluralidad de dianas de ácido nucleico puede comprender una subsecuencia de cada una de la pluralidad de dianas de ácido nucleico. La secuencia de la diana de ácido nucleico en la pluralidad de moléculas de ácido nucleico codificadas con código de barras puede comprender una subsecuencia de la diana de ácido nucleico. En algunas realizaciones, el primer marcador molecular se hibrida con el segundo marcador molecular después de extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras. Las moléculas de ácido nucleico codificadas con código de barras extendidas pueden comprender cada una el primer marcador molecular, el segundo marcador molecular, la región de unión a la diana y el complemento de la región de unión a la diana. En algunas realizaciones, el complemento de la región de unión a la diana es complementario a una parte de la región de unión a la diana. La región de unión a la diana puede comprender una secuencia específica de gen, una secuencia poli(dT), o ambas.

Generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una la región de unión a la diana y un complemento de la región de unión a la diana puede comprender: (i) codificar con códigos de barras copias de una diana de ácido nucleico en una muestra usando la pluralidad de códigos de barras de oligonucleótidos para generar una pluralidad de moléculas de ácido nucleico codificadas con códigos de barras que comprenden cada una una secuencia complementaria a por lo menos una parte de la diana de ácido nucleico, un primer marcador molecular y la región de unión a la diana; y (ii) unir un oligonucleótido que comprende un complemento de la región de unión a la diana con la pluralidad de moléculas de ácido nucleico codificadas con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenda cada una la región de unión a la diana y un complemento de la región de unión a la diana.

Generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una la región de unión a la diana y un complemento de la región de unión a la diana puede comprender: (i) codificar con códigos de barras copias de una diana de ácido nucleico en una muestra usando la pluralidad de códigos de barras de oligonucleótidos para generar una pluralidad de moléculas de ácido nucleico codificadas con códigos de barras que comprenden cada una una secuencia complementaria a por lo menos una parte de la diana de ácido nucleico, un primer marcador molecular y la región de unión a la diana; (ii) amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras amplificadas; y (iii) unir un oligonucleótido que comprende un complemento de la región de unión a la diana a la pluralidad de moléculas de ácido nucleico codificadas con código de barras amplificadas para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una la región de unión a la diana y un complemento de la región de unión a la diana.

Codificar con código de barras copias de una diana de ácido nucleico en una muestra puede comprender extender la pluralidad de códigos de barras de oligonucleótidos hibridados a las copias de la diana de ácido nucleico para generar la pluralidad de moléculas de ácido nucleico codificadas con código de barras. Extender la pluralidad de códigos de barras de oligonucleótidos hibridados con las copias de la diana de ácido nucleico puede comprender la transcripción inversa de las copias de la diana de ácido nucleico hibridadas con la pluralidad de códigos de barras de oligonucleótidos. Unir el oligonucleótido que comprende el complemento de la región de unión a la diana puede comprender ligar el oligonucleótido que comprende el complemento de la región de unión a la diana a la pluralidad de moléculas de ácido nucleico codificadas con código de barras y/o moléculas de ácido nucleico codificadas con código de barras amplificadas. En algunas realizaciones, la región de unión a la diana comprende una secuencia poli(dT), y donde la unión del oligonucleótido que comprende el complemento de la región de unión a la diana comprende añadir una pluralidad de monofosfatos de adenosina a la pluralidad de moléculas de ácido nucleico codificadas con código de barras y/o moléculas de ácido nucleico codificadas con código de barras amplificadas usando una desoxinucleotidil transferasa terminal. La generación de una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una la región de unión a la diana y un complemento de la región de unión a la diana puede comprender: extender la pluralidad de códigos de barras de oligonucleótidos hibridados con las copias de la diana de ácido nucleico en presencia de una transcriptasa inversa y un oligonucleótido de cambio de plantilla que comprende la región de unión a la diana, o una parte de la misma, para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una una secuencia complementaria a por lo menos una parte de la diana de ácido nucleico, un primer marcador molecular, la región de unión a la diana y un complemento de la región de unión a la diana. En algunas realizaciones, extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras comprende extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras usando una ADN polimerasa que carece de por lo menos una de la actividad de exonucleasa 5' a 3' y actividad de exonucleasa 3' a 5'. En algunas realizaciones, la ADN polimerasa comprende un fragmento de Klenow.

En diferentes implementaciones el número de ciclos de cebado y extensión aleatorios puede ser diferente. En algunas realizaciones, el número de ciclos de cebado y extensión aleatorios puede comprender, o comprender aproximadamente, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, o un número o intervalo entre dos cualesquiera de estos valores, ciclos de cebado y extensión aleatorios. En algunas realizaciones, el número de ciclos de cebado y extensión aleatorios puede comprender por lo menos, o como máximo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41,42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90 o 100, ciclos de cebado y extensión aleatorios. La extensión de los cebadores aleatorios hibridados con la primera pluralidad de amplicones codificados con código de barras puede comprender usar una ADN polimerasa que carezca de por lo menos una de la actividad de exonucleasa 5' a 3' y actividad de exonucleasa 3' a 5' (por ejemplo, un fragmento de Klenow). En alguna realización, la enzima de extensión es Klenow o Klenow exo-.

Los cebadores aleatorios pueden comprender una secuencia aleatoria de nucleótidos. La secuencia aleatoria de nucleótidos puede tener de aproximadamente 4 a aproximadamente 30 nucleótidos de longitud. En algunas realizaciones, dicha secuencia aleatoria de nucleótidos tiene 6 o 9 nucleótidos de longitud. En diferentes realizaciones la secuencia aleatoria de nucleótidos puede tener diferentes longitudes. En algunas realizaciones, la secuencia aleatoria de nucleótidos dentro de los cebadores aleatorios tiene, o tiene aproximadamente, 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, o un número o intervalo entre dos cualesquiera de estos valores, nucleótidos de longitud. En algunas realizaciones, la secuencia aleatoria de nucleótidos dentro de los cebadores aleatorios tiene por lo menos, o tiene como máximo, 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, nucleótidos de longitud. En diferentes realizaciones los cebadores aleatorios pueden tener diferentes concentraciones durante el paso de cebado aleatorio. En algunas realizaciones, el cebador aleatorio tiene por lo menos, o tiene como máximo, 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 128, o un número o intervalo entre dos cualesquiera de estos valores, uM en concentración durante el cebado aleatorio.

La hibridación del complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de la propia molécula de ácido nucleico codificada con código de barras puede comprender la hibridación intramolecular de la región de unión a la diana y el complemento de la región de unión a la diana dentro de una molécula de ácido nucleico codificada con código de barras para formar una horquilla. En algunas realizaciones, el segundo marcador molecular es el complemento del primer marcador molecular.

La hibridación del complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con la región de unión a la diana de un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos puede comprender la hibridación intermolecular del complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con la región de unión a la diana de un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos. En algunas realizaciones, el segundo marcador molecular es diferente del primer marcador molecular, y en donde el segundo marcador molecular no es un complemento del primer marcador molecular. En algunas realizaciones, el método comprende extender los extremos 3' de los códigos de barras de oligonucleótidos hibridados con el complemento de la región de unión a la diana de la molécula de ácido nucleico codificada con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas que comprenden cada una un complemento del primer marcador molecular y un segundo marcador molecular. En algunas realizaciones, la secuencia del segundo marcador molecular es diferente de la secuencia del primer marcador molecular, en donde el segundo marcador molecular no es un complemento del primer marcador molecular.

La hibridación del complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras puede comprender la hibridación intermolecular del complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras. En algunas realizaciones, la secuencia del segundo marcador moleculares diferente de la secuencia del primer marcador molecular, y en donde el segundo marcador molecular no es un complemento del primer marcador molecular.

En algunas realizaciones, los métodos comprenden la adición (por ejemplo, mediante una reacción de cambio de plantilla) de un complemento de una región de unión a la diana a un extremo (por ejemplo, el extremo 3') de una molécula de ácido nucleico codificada con código de barras. En algunas realizaciones, el método comprende i) hibridación intramolecular y/o ii) hibridación intermolecular de la región de unión a la diana de un código de barras de oligonucleótidos (o un producto del mismo, como, por ejemplo, otra molécula de ácido nucleico codificada con código de barras, o un amplicón del mismo) seguido de extensión para generar una molécula de ácido nucleico codificada con código de barras extendida. Una molécula de ácido nucleico extendida con código de barras puede tener código de barras tanto en el extremo 3' como en el 5'. En algunas realizaciones, la hibridación intramolecular de una molécula codificada con código de barras forma giros de horquilla con transcritos de ARNm de captura en perlas de captura de poli(dT) 3'. Las moléculas de ARNm pueden capturarse en las perlas mediante la unión de la cola de poli(A) a la región de unión a la diana de un código de barras de oligonucleótidos. Después de la hibridación, puede usarse el cambio de plantilla para unir una cola de poli(dA) en el extremo 5' del transcrito capturado. A continuación, la nueva cola de poli(dA) puede hibridar con oligonucleótidos de captura libres (por ejemplo, códigos de barras, como códigos de barras estocásticos) en la misma perla. Después de la extensión, las moléculas de ARNm pueden codificarse con códigos de barras tanto en el extremo 3' como en el 5'. Esto permite la generación de transcritos codificados con códigos de barras tanto en los extremos 3' como 5' que pueden secuenciarse, por ejemplo, en la plataforma de secuenciación Illumina. El acceso a la secuencia 5' codificada con código de barras puede permitir la detección de la región variable del receptor de células T (TCR) y del receptor de células B (BCR), así como variantes de corte y empalme y variaciones de secuencia que se producen en los extremos 5' de los transcritos.

Las FIGS. 6A-6O muestran ilustraciones esquemáticas de flujos de trabajo ejemplares no limitativos para determinar las secuencias de longitud completa de una diana de ácido nucleico (por ejemplo, la región V(D)J de un receptor inmunitario) usando codificación con código de barras 5' y/o codificación con código de barras 3'. Las perlas BD® Rhapsody™ son perlas sólidas codificadas con código de barras que mantienen su integridad a través de una amplia variedad de manipulaciones físicas y químicas. Tras la captura del ARNm en las perlas con poli(A), puede realizarse la transcripción inversa y el cambio de plantilla para añadir una cola de poli(dA) al extremo 3' del ADNc codificado con código de barras. La cola de poli(dA) añadida permite al ADNc unido a la perla autohibridar con regiones de oligo(dT) de códigos de barras (por ejemplo, códigos de barras estocásticos) en la misma perla, formando una estructura de puente-giro. La extensión Klenow del puente-giro puede generar una nueva molécula de ADNc codificado con código de barras procedente del mismo transcrito de ARNm, con la orientación opuesta a la del primer ADNc codificado con código de barras, lo que permite unir los extremos 3' y 5' del código de barras molecular.

El método divulgado en la presente puede permitir la determinación de secuencias de longitud completa basadas en 3' y/o basadas en 5'. Este método puede permitir proporcionar flexibilidad a la determinación de la secuencia. En algunas realizaciones, el método puede permitir la elaboración de perfiles del repertorio inmunitario de tanto células T como células B en un sistema Rhapsody™, para muestras como muestras de ratón y humanas, sin cambiar el protocolo o la configuración del producto aparte de los cebadores usados. En algunas realizaciones, se puede llevar a cabo una elaboración de perfiles de expresión génica de longitud completa de V(D)J basado en 3' y/o 5'. En algunas realizaciones, pueden investigarse tanto los marcadores fenotípicos como la secuencia V(D)J de células T y células B en plataformas de células individuales. En algunas realizaciones, puede capturarse en un único experimento tanto la información 3' como la 5' de sus transcritos. Los métodos divulgados en la presente pueden permitir la detección de V(D)J tanto en células T como en células B (por ejemplo, hipermutación).

Los métodos y sistemas descritos en la presente pueden usarse con métodos y sistemas que usan anticuerpos asociados con (por ejemplo, unidos a o conjugados con) oligonucleótidos (también denominados en la presente AbOs o AbOligos). Las realizaciones de uso de AbOs para determinar los perfiles de expresión de proteínas en células individuales y rastrear orígenes de muestras se han descrito en la Publicación de Solicitud de Patente de Estados Unidos N° 2018/0088112, y la US2018/0346970. En algunas realizaciones, el método divulgado en la presente permite la elaboración de perfiles de V(D)J de longitud completa de células T y células B, dirigido 3', dirigido 5', amplificación del transcriptoma completo (WTA) 3', WTA 5', elaboración de perfiles de expresión de proteínas con AbO, y/o multiplexación de muestras en un único experimento.

Reacciones de cambio de plantilla

Las FIGS. 6A-6O muestran ilustraciones esquemáticas de flujos de trabajo ejemplares no limitativos para determinar las secuencias de longitud completa de una diana de ácido nucleico (por ejemplo, la región V(D)J de un receptor inmune) usando codificación con código de barras 5' y/o codificación con código de barras 3'. Un código de barras (por ejemplo, un código de barras estocástico, un código de barras de oligonucleótidos602) puede comprender una región de unión a la diana (por ejemplo, un poli(dT)604) que puede unirse a dianas de ácido nucleico (por ejemplo, transcritos de ARN poliadenilados606) a través de una cola de poli(dA)608, u otras dianas de ácido nucleico, para el marcado o la codificación con código de barras (por ejemplo, marcado único). La región de unión a la diana puede comprender una secuencia específica de gen, una secuencia oligo(dT), un multímero aleatorio, o cualquier combinación de los mismos. En algunas realizaciones, el código de barras está asociado a un soporte sólido (por ejemplo, una partícula610). Puede asociarse una pluralidad de códigos de barras602con la partícula610. En algunas realizaciones, la partícula es una perla. La perla puede ser una perla polimérica, por ejemplo una perla deformable o una perla de gel, funcionalizada con códigos de barras o códigos de barras estocásticos (como perlas de gel de 10X Genomics (San Francisco, CA)). En algunas implementaciones, una perla de gel puede comprender un gel a base de polímeros. Las perlas de gel pueden generarse, por ejemplo, encapsulando uno o más precursores poliméricos en gotitas. Tras la exposición de los precursores poliméricos a un acelerador (por ejemplo, tetrametiletilendiamina (TEMED)), puede generarse una perla de gel.

La FIG. 6A representa una realización ejemplar no limitativa de la reacción de transcripción inversa600a. Durante la transcripción inversa600a, al alcanzar el final del código de barras de oligonucleótidos602, la actividad de transferasa terminal de una enzima (por ejemplo, una transcriptasa inversa, tal como un virus de la leucemia murina de Moloney (MMLV)) añade unos pocos nucleótidos adicionales (por ejemplo, desoxicitidina, CCC612) al extremo 3' de la cadena de secuencia de ADNc614crecién sintetizada (la secuencia antisentido de la secuencia de ARN614r). Estas bases CCC612pueden funcionar como un sitio de anclaje del oligonucleótido de cambio de plantilla (por ejemplo, oligonucleótido de cambio de plantilla)616, que comprende una secuencia complementaria a la secuencia con cola añadida (por ejemplo, rGrGrG618). El oligonucleótido de cambio de plantilla616puede comprender por lo menos parte de la región de unión a la diana604. Tras el emparejamiento de bases entre el rGrGrG618y el tramo de desoxicitidina añadido612, la enzima "cambia" las cadenas plantilla, desde el oligonucleótido de código de barras602al oligonucleótido de cambio de plantilla616, y continúa la replicación hasta el extremo 5' del oligonucleótido de cambio de plantilla616. Por tanto, el ADNc marcado de primera cadena resultante (por ejemplo, la molécula de ácido nucleico codificada con código de barras620) contiene una secuencia de complemento inverso del oligonucleótido de conmutación de plantilla616y, por lo tanto, puede comprender el complemento (por ejemplo, complemento inverso) de la región de unión a la diana (por ejemplo, poli(dA)608). La molécula de ácido nucleico codificada con código de barras620puede comprender ADNc614c(la secuencia complementaria inversa de la secuencia de ARN614r). La reacción puede realizarse en presencia de uno o más aditivos configurados para reducir la estructura secundaria (por ejemplo, etilenglicol). La molécula de ácido nucleico codificada con código de barras620también puede comprender una serei de marcadores. El código de barras de oligonucleótidos602puede comprender un primer marcador molecular (ML1)622y un marcador de muestra (por ejemplo, marcador de división, marcador celular (CL)624) para marcar los transcritos606y rastrear los orígenes de muestra de los transcritos de ARN606(o dianas de ácido nucleico, como, por ejemplo, oligonucleótidos de anticuerpos, ya estén asociados con anticuerpos o se hayan disociado de anticuerpos), respectivamente, junto con una o más secuencias adicionales que flanquean la primera región de marcador molecular622/marcador celular624de cada código de barras602para reacciones posteriores como, por ejemplo, una primera secuencia universal626(por ejemplo, secuencia de Lectura 1). El repertorio de secuencias de los marcadores moleculares en los códigos de barras de oligonucleótidos por muestra puede ser suficientemente grande para el marcado estocástico de transcritos de ARN. En algunas realizaciones, el marcador de muestra es un marcador de división. En algunas realizaciones, el marcador de muestra es un marcador celular. La molécula de ácido nucleico codificada con código de barras620puede someterse a un paso de desnaturalización600b(por ejemplo, desnaturalización), generando de este modo una molécula de ácido nucleico codificada con código de barras de cadena sencilla621.

En algunas realizaciones, el primer marcador molecular se hibrida con el segundo marcador molecular después de extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras. En algunas realizaciones, las moléculas de ácido nucleico codificadas con código de barras extendidas comprenden cada una el primer marcador molecular, el segundo marcador molecular, la región de unión a la diana y el complemento de la región de unión a la diana. En algunas realizaciones, el complemento de la región de unión a la diana es complementario a una parte de la región de unión a la diana. En algunas realizaciones, la región de unión a la diana comprende una secuencia específica de un gen. En algunas realizaciones, la región de unión a la diana comprende una secuencia poli(dT).

El término "cambio de plantilla" puede referirse a la capacidad de una transcriptasa inversa de cambiar de un plantilla de secuencia de ácido nucleico inicial al extremo 3' de un nuevo plantilla de secuencia de ácido nucleico que tiene poca o ninguna complementariedad con el extremo 3' del ácido nucleico sintetizado a partir del plantilla inicial. Un ejemplo de cambio de plantilla es la capacidad de una transcriptasa inversa de cambiar de una plantilla de secuencia de ácido nucleico/sustrato de cebador inicial al extremo 3' de una plantilla de secuencia de ácido nucleico nueva que tiene poca o ninguna complementariedad con el extremo 3' de la cadena de cebador de ácido nucleico. El cambio de plantilla permite, por ejemplo, preparar una copia de ADN usando una transcriptasa inversa que cambia de una plantilla de secuencia de ácido nucleico inicial al extremo 3' de una nueva plantilla de secuencia de ácido nucleico que tiene poca o ninguna complementariedad con el extremo 3' del ADN sintetizado a partir de la plantilla inicial, permitiendo de este modo la síntesis de un ADN de producto continuo que enlaza directamente una secuencia de adaptador a una secuencia de oligonucleótidos diana sin ligadura. El cambio de plantilla puede comprender la ligación del adaptador, la adición de cola de homopolímeros (por ejemplo, la poliadenilación), el cebador aleatorio o un oligonucleótido con el que pueda asociarse la polimerasa. En cualquiera de las realizaciones mencionadas anteriormente, la plantilla puede usarse para introducir una región de unión a la diana o el complemento de la misma.

En algunas realizaciones, la transcriptasa inversa es capaz de actividad de transferasa terminal. En algunas realizaciones, el oligonucleótido de cambio de plantilla comprende uno o más ribonucleótidos 3'. En algunas realizaciones, el oligonucleótido de cambio de plantilla comprende tres ribonucleótidos 3'. En algunas realizaciones, los ribonucleótidos 3' comprenden guanina. En algunas realizaciones, la transcriptasa inversa comprende una transcriptasa inversa viral. En algunas realizaciones, la transcriptasa inversa viral es una transcriptasa inversa del virus de la leucemia murina (MLV). En algunas realizaciones, la transcriptasa inversa viral es una transcriptasa inversa del virus de la leucemia murina de Moloney (MMLV).

El complemento de una región de unión a la diana puede comprender la secuencia complementaria inversa de la región de unión a la diana o puede comprender la secuencia complementaria de la región de unión a la diana. El complemento de un marcador molecular puede comprender una secuencia complementaria inversa del marcador molecular o puede comprender una secuencia complementaria del marcador molecular. En algunas realizaciones, la pluralidad de moléculas de ácido nucleico codificadas con código de barras puede comprender moléculas de ácido desoxirribonucleico (ADN) codificadas con código de barras y/o moléculas de ácido ribonucleico (ARN) codificadas con código de barras. En algunas realizaciones, la diana de ácido nucleico comprende una molécula de ácido nucleico (por ejemplo, ácido ribonucleico (ARN), ARN mensajero (ARNm), microARN, ARN interferente pequeño (ARNip), producto de degradación de ARN, ARN que comprende una cola de poli(A), o cualquier combinación de los mismos). En algunas realizaciones, el ARNm codifica un receptor inmunitario. La diana de ácido nucleico puede comprender un reactivo de unión a componentes celulares. En algunas realizaciones, la molécula de ácido nucleico se asocia con el reactivo de unión a componentes celulares. El método puede comprender disociar la molécula de ácido nucleico y el reactivo de unión a componente celular. En algunas realizaciones, por lo menos 10 de la pluralidad de códigos de barras de oligonucleótidos comprenden diferentes secuencias de marcadores moleculares. Cada marcador molecular de la pluralidad de códigos de barras de oligonucleótidos puede comprender por lo menos 6 nucleótidos.

En algunas realizaciones, la pluralidad de códigos de barras de oligonucleótidos están asociados con un soporte sólido. La pluralidad de códigos de barras de oligonucleótidos asociados con el mismo soporte sólido puede comprender cada uno un marcador de muestra idéntico. Cada marcador de muestra de la pluralidad de códigos de barras de oligonucleótidos puede comprender por lo menos 6 nucleótidos. La pluralidad de códigos de barras de oligonucleótidos puede comprender cada uno un marcador celular. Cada marcador celular de la pluralidad de códigos de barras de oligonucleótidos puede comprender por lo menos 6 nucleótidos. Los códigos de barras de oligonucleótidos asociados con el mismo soporte sólido pueden comprender el mismo marcador celular. Los códigos de barras de oligonucleótidos asociados con diferentes soportes sólidos pueden comprender diferentes marcadores celulares. La pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas puede comprender cada una un marcador celular y un complemento del marcador celular. El complemento del marcador celular puede comprender una secuencia complementaria inversa del marcador celular o una secuencia complementaria del marcador celular. El método puede comprender extender la pluralidad de códigos de barras de oligonucleótidos hibridados con las copias de la diana de ácido nucleico en presencia de uno o más de etilenglicol, polietilenglicol, 1,2-propanodiol, dimetilsulfóxido (DMSO), glicerol, formamida, 7-deaza-GTP, acetamida, sal de cloruro de tetrametilamonio, betaína, o cualquier combinación de los mismos. En algunas realizaciones, el soporte sólido puede comprender una partícula sintética. En algunas realizaciones, el soporte sólido puede comprender una superficie plana.

La muestra puede comprender una célula individual, y el método puede comprender asociar una partícula sintética que comprende la pluralidad de los códigos de barras del oligonucleótido con la célula individual en la muestra. El método puede comprender lisar la célula individual después de asociar la partícula sintética con la célula individual. La lisis de la célula individual puede comprender calentar la muestra, poner en contacto la muestra con un detergente, cambiar el pH de la muestra, o cualquier combinación de los mismos. En algunas realizaciones, la partícula sintética y la célula individual se encuentran en el mismo pocillo. En algunas realizaciones, la partícula sintética y la célula individual están en la misma gotita. En algunas realizaciones, por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos está inmovilizado en la partícula sintética. En algunas realizaciones, por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos está parcialmente inmovilizado en la partícula sintética. Por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos puede estar encerrado en la partícula sintética. En algunas realizaciones, por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos está parcialmente encerrado en la partícula sintética. En algunas realizaciones, la partícula sintética es perturbable. La partícula sintética puede comprender una perla. La perla puede comprender una perla de sefarosa, una perla de estreptavidina, una perla de agarosa, una perla magnética, una perla conjugada, una perla conjugada con proteína A, una perla conjugada con proteína G, una perla conjugada con proteína A/G, una perla conjugada con proteína L, una perla conjugada con oligo(dT), una perla de sílice, una perla similar a la sílice, una microperla antibiotina, una microperla antifluorocromo, o cualquier combinación de las mismas. La partícula sintética puede comprender un material seleccionado del grupo que consiste en polidimetilsiloxano (PDMS), poliestireno, vidrio, polipropileno, agarosa, gelatina, hidrogel, paramagnético, cerámica, plástico, vidrio, metilestireno, polímero acrílico, titanio, látex, Sefarosa, celulosa, nylon, silicona, y cualquier combinación de los mismos. En algunas realizaciones, la partícula sintética puede comprender una partícula de hidrogel perturbable. Cada uno de la pluralidad de códigos de barras de oligonucleótidos puede comprender un grupo funcional conector, la partícula sintética puede comprender un grupo funcional de soporte sólido, y/o el grupo funcional de soporte y el grupo funcional conector pueden estar asociados entre sí. En algunas realizaciones, el grupo funcional conector y el grupo funcional soporte se seleccionan individualmente del grupo que consiste en C6, biotina, estreptavidina, aminas primarias, aldehídos, cetonas, y cualquier combinación de los mismos.

Hibridación intramolecular de moléculas de ácido nucleico codificadas con código de barras

En algunas realizaciones, la hibridación del complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de la propia molécula de ácido nucleico codificada con código de barras comprende la hibridación intramolecular de la región de unión a la diana y el complemento de la región de unión a la diana dentro de una molécula de ácido nucleico codificada con código de barras para formar una horquilla. En algunas realizaciones, el segundo marcador molecular es el complemento del primer marcador molecular.

El flujo de trabajo puede comprender la hibridación intramolecular de una molécula de ácido nucleico codificada con código de barras de cadena sencilla621como se representa en las ilustraciones esquemáticas ejemplares no limitativas de la FIG. 6B. El flujo de trabajo puede comprender la hibridación intramolecular600c1de la región de unión a la diana604y el complemento de la región de unión a la diana608dentro de una molécula de ácido nucleico codificada con código de barras de cadena sencilla621para formar una horquilla. El flujo de trabajo puede comprender extender600c2el extremo 3' de la horquilla de la molécula de ácido nucleico codificado con código de barras de cadena sencilla621para generar la molécula de ácido nucleico codificado con código de barras extendida620c. La molécula de ácido nucleico codificada con código de barras extendida620cpuede comprender un complemento (por ejemplo, complemento inverso) del primer marcador molecular622rc, un complemento (por ejemplo, complemento inverso) del marcador celular624rc, y/o un complemento (por ejemplo, complemento inverso) de la primera secuencia universal626rc. El flujo de trabajo puede comprender desnaturalizar600c3la molécula de ácido nucleico codificada con código de barras extendida620cpara generar una molécula de ácido nucleico codificada con código de barras extendida de cadena sencilla620cd. En algunas realizaciones, la hibridación intermolecular600c1y/o la extensión600c2se realizan en presencia de un tampón de alta salinidad y/o PEG. En algunas realizaciones, la extensión se lleva a cabo usando una ADN polimerasa que carece de por lo menos una de la actividad de exonucleasa 5' a 3' y actividad de exonucleasa 3' a 5' (por ejemplo, un fragmento de Klenow).

La molécula de ácido nucleico codificada con código de barras extendida de cadena sencilla620cdpuede comprender un código de barras (por ejemplo, un marcador celular y un marcador molecular) tanto en el extremo 5' como en el extremo 3' de una molécula de ácido nucleico diana (por ejemplo, transcrito), permitiendo de este modo un análisis más extenso de la molécula de ácido nucleico diana en comparación con un análisis de una molécula de ácido nucleico diana con sólo un código de barras en un extremo con respecto a la identificación de secuencias, recuento de transcripciones, análisis de corte y empalmen alternativo, cribado de mutaciones y/o secuenciación de longitud completa. La molécula de ácido nucleico codificada con código de barras de cadena sencilla extendida620cdpuede servir como plantilla para una o más reacciones de extensión (por ejemplo, cebado y extensión aleatorios) y/o reacciones de amplificación (por ejemplo, PCR), como, por ejemplo, el esquema ejemplar no limitativo representado en las FIGS.6C-6E. La amplificación o amplificaciones pueden comprender amplificación de ADNc específica de diana (por ejemplo, específica de gen). Por ejemplo, la molécula de ácido nucleico codificada con código de barras extendida de cadena sencilla620cdpuede someterse a una primera ronda de amplificación ("PCR1")600c4empleando un cebador de oligonucleótidos universal646que comprende una secuencia de la primera secuencia universal (o un complemento de la misma) y un cebador específico de la diana (por ejemplo, cebador específico de la diana650), produciendo de este modo una primera pluralidad de amplicones620cas1cada uno de los cuales comprende un marcador molecular (por ejemplo, un primer marcador molecular), un marcador celular, una primera secuencia universal y ADNc antisentido parcial614cas1(cuya longitud depende del sitio de unión del cebador específico de la diana650dentro del ADNc614c). La PCR1600c4puede comprender de 1 a 30 ciclos (por ejemplo, 15 ciclos).

El flujo de trabajo puede comprender un cebado y extensión aleatorios600c5. Los cebadores aleatorios670pueden hibridar con la primera pluralidad de amplicones codificados con código de barras620cas1y los cebadores aleatorios670pueden extenderse para generar una pluralidad de productos de extensión620e2c1y620e2c2. Los cebadores aleatorios670pueden incluir salientes, que pueden incluir, o ser, por ejemplo, una segunda secuencia universal638(o un complemento de la misma, por ejemplo, el complemento inverso638rc) (por ejemplo, la secuencia de Lectura 2, un asa de PCR universal). Los productos de extensión620e2c1pueden comprender una primera secuencia universal, una segunda secuencia universal, un marcador celular y un marcador molecular (por ejemplo, un primer marcador molecular), o complementos de los mismos. Los productos de extensión620e2c1pueden comprender, por ejemplo, ADNc parcial614c2a,614c2b,614c2cy614c2d(la longitud de cada uno de los cuales depende del sitio de unión del cebador aleatorio670dentro del ADNc parcial). Los productos de extensión620e2c2pueden comprender una segunda secuencia universal (o un complemento de la misma). Los productos de extensión620e2c2pueden comprender, por ejemplo, ADNc antisentido parcial614cas2e,614cas2f,614cas2gy614cas2h(la longitud de cada uno de los cuales depende del sitio de unión del cebador aleatorio670dentro del ADNc parcial).

El flujo de trabajo puede comprender la amplificación de bibliotecas ("PCR de bibliotecas")600c6. La PCR de bibliotecas600c6puede comprender la amplificación de bibliotecas de productos de extensión620e2c1con cebadores de amplificación de bibliotecas de secuenciación656y658. Los cebadores de amplificación de bibliotecas de secuenciación656y658pueden aparearse con la primera secuencia universal626y a la segunda secuencia universal638(o complementos de las mismas), respectivamente. La PCR de bibliotecas600c6puede añadir adaptadores de secuenciación (por ejemplo, P5640y P7642) e índice de muestra644(por ejemplo, i5, i7) a través de salientes en los cebadores de amplificación de biblioteca de secuenciación656y658. Los amplicones de PCR de biblioteca620c6pueden unirse a la primera secuencia universal626y a la segunda secuencia universal638(o complementos de las mismas), respectivamente. Los amplicones de PCR de la biblioteca620cL(por ejemplo, la segunda pluralidad de amplicones codificados con código de barras) pueden comprender una gama de longitudes de ADNc (por ejemplo, ADNc antisentido parcial614cas2a,614cas2b,614cas2c,614cas2d) que pueden abarcar colectivamente parte o la totalidad de la secuencia de ARNm de la diana de ácido nucleico. Los amplicones de la biblioteca620cLpueden secuenciarse y someterse a métodos en sentido descendente de la divulgación. La secuenciación600c7mediante secuenciación de 150 bp x 2 puede revelar el marcador celular, el marcador molecular único y/o el gen (o una secuencia parcial del gen) en la lectura 1, el gen (o una secuencia parcial del gen) en la lectura 2, y el índice de la muestra en la lectura de índice 1 y/o la lectura de índice 2. La PCR de bibliotecas600c6puede comprender de 1 a 30 ciclos (por ejemplo, 15 ciclos). El método puede comprender la reconstrucción bioinformática900de la secuencia de longitud completa de la diana de ácido nucleico (por ejemplo, ARNm del receptor inmunitario930) alineando la pluralidad de lecturas de lectura 1910y lectura 2920como se representa en la FIG. 9B.

En algunas realizaciones, puede realizarse elaboración de perfiles de expresión de longitud completa basado en 3' y/o 5' de la región V(D)J de un receptor inmunitario. En algunas realizaciones, pueden investigarse tanto los marcadores fenotípicos como la secuencia o secuencias V(D)J del receptor inmunitario de células T y/o células B en plataformas unicelulares. El método divulgado en la presente puede permitir la detección de V(D)J tanto de células T como de células B (por ejemplo, hipermutación). En algunas realizaciones, se amplifican ambas regiones 3' y 5' de la molécula de ácido nucleico codificada con código de barras extendida620cd. En algunas realizaciones, sólo se amplifica la región 5' de la molécula de ácido nucleico codificada con código de barras extendida620cd. En algunas realizaciones, sólo se amplifica la región 3' de la molécula de ácido nucleico codificada con código de barras extendida620cd. En algunas realizaciones, una o más de las reacciones de amplificación comprenden PCR multiplex. Por ejemplo, las regiones 3' y 5' de la molécula de ácido nucleico codificada con código de barras extendida620cdpueden amplificarse simultáneamente (por ejemplo, PCR multiplex). En algunas realizaciones, el flujo de trabajo comprende PCR multiplex empleando un panel de cebadores de PCR1 específicos de la diana. En algunas realizaciones, las dianas comprenden BCRs, TCRs, y/o transcritos relacionados con la inmunidad.

Hibridación intermolecular de moléculas de ácido nucleico codificadas con código de barras con moléculas de ácido nucleico codificadas con código de barras

En algunas realizaciones, la hibridación del complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras comprende la hibridación intermolecular del complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras. En algunas realizaciones, la secuencia del segundo marcador molecular es diferente de la secuencia del primer marcador molecular, y en donde el segundo marcador molecular no es un complemento del primer marcador molecular.

El flujo de trabajo puede comprender la hibridación intermolecular de la molécula de ácido nucleico codificada con código de barras de cadena sencilla621con una molécula de ácido nucleico codificada con código de barras distinta628como se representa en las ilustraciones esquemáticas ejemplares no limitativas de las FIGS. 6F-6G. La molécula de ácido nucleico codificada con código de barras distinta628puede comprender ADNc630c, el segundo marcador molecular632, el marcador celular624y la primera secuencia universal626. La secuencia del segundo marcador molecular632de la molécula de ácido nucleico codificada con código de barras628puede ser diferente de la secuencia del primer marcador molecular622de la molécula de ácido nucleico codificada con código de barras de cadena sencilla621(por ejemplo, no un complemento). La región de unión a la diana604, el marcador celular624y/o la primera secuencia universal626de la molécula de ácido nucleico codificada con código de barras628pueden ser iguales (o un complemento de las mismas) que la región de unión a la diana604, el marcador celular624y/o la primera secuencia universal626de la molécula de ácido nucleico codificada con código de barras de cadena sencilla621. El flujo de trabajo puede comprender, en algunas realizaciones, la hibridación intermolecular600d1del complemento de la región de unión a la diana608de la molécula de ácido nucleico codificada con código de barras de cadena sencilla621con la región de unión a la diana604de la molécula de ácido nucleico codificada con código de barras628. El flujo de trabajo puede comprender extender600d2el extremo 3' de la molécula de ácido nucleico codificada con código de barras de cadena sencilla621para generar la molécula de ácido nucleico codificada con código de barras extendida620d. La molécula de ácido nucleico codificada con código de barras extendida620dpuede comprender un complemento (por ejemplo, complemento inverso) del segundo marcador molecular632rc, un complemento (por ejemplo, complemento inverso) del marcador celular624rc, y/o un complemento (por ejemplo, complemento inverso) de la primera secuencia universal626rc. El flujo de trabajo puede comprender desnaturalizar600d3la molécula de ácido nucleico codificada con código de barras extendida620dpara generar una molécula de ácido nucleico codificada con código de barras extendida de cadena sencilla620dd. En algunas realizaciones, la hibridación intermolecular600d1y/o la extensión600d2se llevan a cabo en presencia de un tampón de alta salinidad y/o PEG. En algunas realizaciones, la extensión se lleva a cabo usando una ADN polimerasa que carece de por lo menos una de la actividad de exonucleasa 5' a 3' y actividad de exonucleasa 3' a 5' (por ejemplo, un fragmento de Klenow).

La molécula de ácido nucleico codificada con código de barras extendida de cadena sencilla620ddpuede comprender un código de barras (por ejemplo, un marcador celular y un marcador molecular) tanto en el extremo 5' como en el extremo 3' de una molécula de ácido nucleico diana (por ejemplo, transcrito), permitiendo de este modo un análisis más extenso de la molécula de ácido nucleico diana en comparación con un análisis de una molécula de ácido nucleico diana con sólo un código de barras en un extremo con respecto a la identificación de secuencias, recuento de transcritos, análisis de corte y empalme alternativo, cribado de mutaciones y/o secuenciación de longitud completa. La molécula de ácido nucleico con código de barras extendida de cadena sencilla620ddpuede servir como plantilla para una o más reacciones de extensión (por ejemplo, cebado y extensión aleatorios) y/o reacciones de amplificación (por ejemplo, PCR), como, por ejemplo, el esquema ejemplar no limitativo representado en las FIGS.

6H-6J. La amplificación o amplificaciones pueden comprender la amplificación de ADNc específica de diana (por ejemplo, específica de gen). Por ejemplo, la molécula de ácido nucleico codificada con código de barras extendida de cadena sencilla620ddpuede someterse a una primera ronda de amplificación ("PCR1")600d4empleando un cebador de oligonucleótidos universal646que comprende una secuencia de la primera secuencia universal (o un complemento de la misma) y un cebador específico de la diana (por ejemplo, cebador específico de la diana650), produciendo de este modo una primera pluralidad de amplicones620das1cada uno de los cuales comprende un marcador molecular (por ejemplo, un segundo marcador molecular), un marcador celular, una primera secuencia universal y un ADNc antisentido parcial614cas1(cuya longitud depende del sitio de unión del cebador específico de la diana650dentro del ADNc6 l4c). La PCR160od4 puede comprender de 1 a 30 ciclos (por ejemplo, 15 ciclos).

El flujo de trabajo puede comprender un cebado y extensión aleatorios600d5. Los cebadores aleatorios670pueden hibridar la primera pluralidad de amplicones codificados con código de barras620das1y los cebadores aleatorios670pueden extenderse para generar una pluralidad de productos de extensión620e2d1y620e2d2. Los cebadores aleatorios670pueden incluir salientes, que pueden incluir, o ser, por ejemplo, una segunda secuencia universal638(o un complemento de la misma, por ejemplo, el complemento inverso638rc) (por ejemplo, la secuencia de lectura 2, un asa universal de PCR). Los productos de extensión620e2d1pueden comprender una primera secuencia universal, una segunda secuencia universal, un marcador celular y un marcador molecular (por ejemplo, un primer marcador molecular), o complementos de las mismas. Los productos de extensión620e2d1pueden comprender, por ejemplo, ADNc parcial614c2a,614c2b,614c2cy614c2d(la longitud de cada uno de los cuales depende del sitio de unión del cebador aleatorio670dentro del ADNc parcial). Los productos de extensión620e2d2pueden comprender una segunda secuencia universal (o un complemento de la misma). Los productos de extensión620e2d2pueden comprender, por ejemplo, ADNc antisentido parcial614cas2e,614cas2f,614cas2gy614cas2h(la longitud de cada uno de los cuales depende del sitio de unión del cebador aleatorio670dentro del ADNc parcial).

El flujo de trabajo puede comprender la amplificación de bibliotecas ("PCR de bibliotecas")600d6. La PCR de bibliotecas600d6puede comprender la amplificación de bibliotecas de productos de extensión620e2d1con cebadores de amplificación de bibliotecas de secuenciación656y658. Los cebadores de amplificación de bibliotecas de secuenciación656y658pueden aparearse con la primera secuencia universal626y la segunda secuencia universal638(o complementos de las mismas), respectivamente. La PCR de bibliotecas600d6puede añadir adaptadores de secuenciación (por ejemplo, P5640y P7642) e índice de muestra644(por ejemplo, i5, i7) a través de salientes en los cebadores de amplificación de bibliotecas de secuenciación656y658. Los amplicones de PCR de bibliotecas620d6pueden unirse a la primera secuencia universal626y a la segunda secuencia universal638(o complementos de las mismas), respectivamente. Los amplicones de PCR de bibliotecas620dL(por ejemplo, la segunda pluralidad de amplicones codificados con código de barras) pueden comprender una variedad de longitudes de ADNc (por ejemplo, ADNc antisentido parcial614cas2a,614cas2b,614cas2c,614cas2d) que pueden abarcar colectivamente parte o la totalidad de la secuencia de ARNm de la diana de ácido nucleico. Los amplicones de bibliotecas620dLpueden secuenciarse y someterse a métodos en sentido descendente de la divulgación. La secuenciación600d7mediante secuenciación de 150 bp x 2 puede revelar el marcador celular, el marcador molecular único y/o el gen (o una secuencia parcial del gen) en la lectura 1, el gen (o una secuencia parcial del gen) en la lectura 2, y el índice de la muestra en la lectura de índice 1 y/o la lectura de índice 2. La PCR de bibliotecas600d6puede comprender de 1 a 30 ciclos (por ejemplo, 15 ciclos). El método puede comprender la reconstrucción bioinformática900de la secuencia de longitud completa de la diana de ácido nucleico (por ejemplo, ARNm de receptor inmunitario930) alineando la pluralidad de lecturas de lectura 1910y lectura 2920como se representa en la FIG. 9B.

En algunas realizaciones, puede realizarse una elaboración de perfiles de expresión de longitud completa basado en 3' y/o 5' de la región V(D)J de un receptor inmunitario. En algunas realizaciones, pueden investigarse tanto los marcadores fenotípicos como la secuencia o secuencias V(D)J del receptor inmunitario de células T y/o células B en plataformas unicelulares. El método divulgado en la presente puede permitir la detección de V(D)J tanto de células T como de células B (por ejemplo, hipermutación). En algunas realizaciones, se amplifican tanto las regiones 3' como las 5' de la molécula de ácido nucleico codificada con código de barras extendida620dd. En algunas realizaciones, sólo se amplifica la región 5' de la molécula de ácido nucleico codificada con código de barras extendida620dd. En algunas realizaciones, sólo se amplifica la región 3' de la molécula de ácido nucleico codificada con código de barras extendida620dd. En algunas realizaciones, una o más de las reacciones de amplificación comprenden PCR multiplex. Por ejemplo, pueden amplificarse simultáneamente las regiones 3' y 5' de la molécula de ácido nucleico codificada con código de barras extendida620dd(por ejemplo, PCR multiplex). En algunas realizaciones, el flujo de trabajo comprende PCR multiplex empleando un panel de cebadores de PCR1 específicos de diana. En algunas realizaciones, las dianas comprenden BCRs, TCRs, y/o transcritos relacionados con la inmunidad.

Hibridación intermolecular de moléculas de ácido nucleico codificadas con códigos de barras con códigos de barras de oligonucleótidos

En algunas realizaciones, la hibridación del complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos comprende la hibridación intermolecular del complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos. En algunas realizaciones, el segundo marcador molecular es diferente del primer marcador molecular, y en donde el segundo marcador molecular no es un complemento del primer marcador molecular. En algunas realizaciones, el método comprende extender los extremos 3' de los códigos de barras de oligonucleótidos hibridados con el complemento de la región de unión a la diana de la molécula de ácido nucleico codificada con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas que comprenden cada una un complemento del primer marcador molecular y un segundo marcador molecular. En algunas realizaciones, la secuencia del segundo marcador moleculares diferente de la secuencia del primer marcador molecular, en donde el segundo marcador molecular no es un complemento del primer marcador molecular.

El flujo de trabajo puede comprender la hibridación intermolecular de la molécula de ácido nucleico codificada con código de barras de cadena sencilla621con el código de barras de oligonucleótidos distinto634como se representa en las ilustraciones esquemáticas ejemplares no limitativas de las FIGS. 6K-6L. El código de barras de oligonucleótidos distinto634puede comprender el segundo marcador molecular636, el marcador celular624y la primera secuencia universal626. La secuencia del segundo marcador molecular636del código de barras de oligonucleótidos634puede ser diferente de la secuencia del primer marcador molecular622de la molécula de ácido nucleico codificada con código de barras de cadena sencilla62l(por ejemplo, no un complemento). La región de unión a la diana604, el marcador celular624y/o la primera secuencia universal626del código de barras de oligonucleótidos634pueden ser iguales (o un complemento de los mismos) que la región de unión a la diana604, el marcador celular624y/o la primera secuencia universal626de la molécula de ácido nucleico codificada con código de barras de cadena sencilla621. El flujo de trabajo puede comprender, en algunas realizaciones, la hibridación intermolecular600e1del complemento de la región de unión a la diana608de la molécula de ácido nucleico codificada con código de barras de cadena sencilla621con la región de unión a la diana604del código de barras de oligonucleótidos634. El flujo de trabajo puede comprender extender600e2el extremo 3' de la molécula de ácido nucleico codificada con código de barras de cadena sencilla621para generar la molécula de ácido nucleico codificada con código de barras extendida620e1. La molécula de ácido nucleico codificada con código de barras extendida620e1puede comprender un complemento (por ejemplo, complemento inverso) del segundo marcador molecular636rc, un complemento (por ejemplo, complemento inverso) del marcador celular624rc, un complemento (por ejemplo, complemento inverso) de la primera secuencia universal626rc, y/o ADNc614c. El flujo de trabajo puede comprender desnaturalizar600e3la molécula de ácido nucleico codificada con código de barras extendida620e1para generar una molécula de ácido nucleico codificada con código de barras extendida de cadena sencilla620e1d. El flujo de trabajo puede comprender extender600e2el extremo 3' del código de barras de oligonucleótidos634para generar la molécula de ácido nucleico codificada con código de barras extendida620e2. La molécula de ácido nucleico codificada con código de barras extendida620e2puede comprender un complemento (por ejemplo, complemento inverso) del primer marcador molecular622rc, un complemento (por ejemplo, complemento inverso) del marcador celular624rc, un complemento (por ejemplo, complemento inverso) de la primera secuencia universal626rc, y/o ADNc antisentido614cas. El flujo de trabajo puede comprender desnaturalizar600e3la molécula de ácido nucleico codificada con código de barras extendida620e2para generar una molécula de ácido nucleico codificada con código de barras extendida de cadena sencilla620e2d. En algunas realizaciones, la hibridación intermolecular600e1y/o la extensión600e2se llevan a cabo en presencia de un tampón de alta salinidad y/o PEG. En algunas realizaciones, la extensión se lleva a cabo usando una ADN polimerasa que carece de por lo menos una de la actividad de exonucleasa 5' a 3' y actividad de exonucleasa 3' a 5' (por ejemplo, un fragmento de Klenow).

La molécula de ácido nucleico de cadena sencilla620e1dy la molécula de ácido nucleico de cadena sencilla620e2dpueden comprender un código de barras (por ejemplo, un marcador celular y un marcador molecular) tanto en el extremo 5' como en el extremo 3' de una molécula de ácido nucleico diana (por ejemplo, transcrito), permitiendo de este modo un análisis más extenso de la molécula de ácido nucleico diana en comparación con un análisis de una molécula de ácido nucleico diana con sólo un código de barras en un extremo con respecto a la identificación de secuencias, recuento de transcritos, análisis de corte y empalme alternativo, cribado de mutaciones y/o secuenciación de longitud completa. La molécula de ácido nucleico620e1dy la molécula de ácido nucleico620e2dpueden servir como plantilla para una o más reacciones de extensión (por ejemplo, cebado y extensión aleatorios) y/o reacciones de amplificación (por ejemplo, PCR) como, por ejemplo, el esquema ejemplar no limitativo representado en las FIGS.

6M-6O. La amplificación o amplificaciones pueden comprender una o más reacciones de extensión (por ejemplo, cebado y extensión aleatorios) y/o reacciones de amplificación (por ejemplo, PCR). La amplificación o amplificaciones pueden comprender amplificación de ADNc específica de diana (por ejemplo, específica de gen). Por ejemplo, la molécula de ácido nucleico codificada con código de barras extendida de cadena sencilla620e2dpuede someterse a una primera ronda de amplificación ("PCR1")600e4empleando un cebador de oligonucleótidos universal646que comprende una secuencia de la primera secuencia universal (o un complemento de la misma) y un cebador específico de la diana (por ejemplo, cebador específico de la diana650), produciendo de este modo una primera pluralidad de amplicones620eas1cada uno de los cuales comprende un marcador molecular (por ejemplo, un segundo marcador molecular), un marcador celular, una primera secuencia universal y un ADNc antisentido parcial614cas1(cuya longitud depende del sitio de unión del cebador específico de la diana650dentro del ADNc614cas). La PCR1600e4puede comprender 1-30 ciclos (por ejemplo, 15 ciclos).

El flujo de trabajo puede comprender un cebado y extensión aleatorios600e5. Los cebadores aleatorios670pueden hibridarse con la primera pluralidad de amplicones codificados con código de barras y los cebadores aleatorios670pueden extenderse para generar una pluralidad de productos de extensión620e2e1y620e2e2. Los cebadores aleatorios670pueden incluir salientes, que pueden incluir, o ser, por ejemplo, una segunda secuencia universal638(o un complemento de la misma, por ejemplo, el complemento inverso638rc) (por ejemplo, la secuencia de Lectura 2, un asa universal de PCR). Los productos de extensión620e21 pueden comprender una primera secuencia universal, una segunda secuencia universal, un marcador celular y un marcador molecular (por ejemplo, un primer marcador molecular), o complementos de los mismos. Los productos de extensión620e2e1pueden comprender, por ejemplo, ADNc parcial614c2a,614c2b,614c2cy614c2d(la longitud de cada uno de los cuales depende del sitio de unión del cebador aleatorio670dentro del ADNc parcial). Los productos de extensión620e2e2pueden comprender una segunda secuencia universal (o un complemento de la misma). Los productos de extensión620e2e2pueden comprender, por ejemplo, ADNc antisentido parcial614cas2e,614cas2f,614cas2gy614cas2h(la longitud de cada uno de los cuales depende del sitio de unión del cebador aleatorio670dentro del ADNc parcial).

El flujo de trabajo puede comprender la amplificación de bibliotecas ("PCR de bibliotecas")600e6. La PCR de bibliotecas600e6puede comprender la amplificación de bibliotecas de productos de extensión620e2e1con cebadores de amplificación de bibliotecas de secuenciación656y658. Los cebadores de amplificación de bibliotecas de secuenciación656y658pueden aparearse con la primera secuencia universal626y la segunda secuencia universal638(o complementos de las mismas), respectivamente. La PCR de bibliotecas600e6puede añadir adaptadores de secuenciación (por ejemplo, P5640y P7642) e índice de muestra644(por ejemplo, i5, i7) a través de salientes en los cebadores de amplificación de bibliotecas de secuenciación656y658. Los amplicones de PCR de la biblioteca620e2L(por ejemplo, la segunda pluralidad de amplicones codificados con código de barras) pueden comprender una variedad de longitudes de ADNc (por ejemplo, ADNc antisentido parcial614cas2a,614cas2b,614cas2c,614cas2d) que pueden abarcar colectivamente parte o la totalidad de la secuencia de ARNm de la diana de ácido nucleico. Los amplicones de bibliotecas620e2Lpueden secuenciarse y someterse a métodos posteriores de la divulgación. La secuenciación600e7usando secuenciación de 150 bp x 2 puede revelar el marcador celular, el marcador molecular único y/o el gen (o una secuencia parcial del gen) en la lectura 1, el gen (o una secuencia parcial del gen) en la lectura 2, y el índice de la muestra en la lectura de índice 1 y/o la lectura de índice 2. La PCR de biblioteca600e6puede comprender de 1 a 30 ciclos (por ejemplo, 15 ciclos). El método puede comprender la reconstrucción bioinformática900de la secuencia de longitud completa de la diana de ácido nucleico (por ejemplo, ARNm de receptor inmunitario930) alineando la pluralidad de lecturas de lectura 1910y lectura 2920como se representa en la FIG. 9B.

En algunas realizaciones, puede realizarse un perfil de expresión de longitud completa 3' y/o 5' de la región V(D)J de un receptor inmunitario. En algunas realizaciones, pueden investigarse tanto los marcadores fenotípicos como la secuencia o secuencias de V(D)J del receptor inmunitario de células T y/o células B en plataformas unicelulares. El método divulgado en la presente puede permitir la detección de V(D)J tanto de células T como de células B (por ejemplo, hipermutación). En algunas realizaciones, se amplifican las regiones tanto 3' como 5' de la molécula o moléculas de ácido nucleico codificadas con código de barras extendidas620e1dy/o620e2d. En algunas realizaciones, sólo se amplifica la región 5' de la molécula o moléculas de ácido nucleico codificadas con código de barras extendidas620e1dy/o620e2d. En algunas realizaciones, una o más de las reacciones de amplificación comprenden PCR multiplex. Por ejemplo, las regiones 3' y 5' de la molécula o moléculas de ácido nucleico codificadas con código de barras extendidas620e1dy/o620e2dpueden amplificarse simultáneamente (por ejemplo, PCR multiplex). En algunas realizaciones, el flujo de trabajo comprende PCR multiplex empleando un panel de cebadores de PCR1 específicos de la diana. En algunas realizaciones, las dianas comprenden BCRs, TCRs, y/o transcritos relacionados con la inmunidad.

Elaboración de perfiles de repertorios inmunitarios

En algunas realizaciones se proporcionan métodos para la elaboración de perfiles de expresión de longitud completa de la región V(D)J de receptores inmunitarios. En algunas realizaciones, la muestra comprende una célula individual. En algunas realizaciones, la muestra comprende una pluralidad de células, una pluralidad de células individuales, un tejido, una muestra de tumor, o cualquier combinación de los mismos. Una célula individual puede ser una célula inmunitaria. En algunas realizaciones, la célula inmunitaria es una célula B o una célula T. En algunas realizaciones, una célula individual puede comprender una célula tumoral circulante. En algunas realizaciones, cada código de barras de oligonucleótidos puede comprender una primera secuencia universal. En algunas realizaciones, la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas comprende una primera secuencia universal y un complemento de la primera secuencia universal. La amplificación de la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas puede comprender el uso de un cebador específico de la diana capaz de hibridar con una secuencia de la diana de ácido nucleico y un cebador que comprende

la primera secuencia universal. En algunas de tales realizaciones, el cebador específico de la diana hibrida específicamente con un receptor inmunitario. Por ejemplo, el cebador específico de la diana puede hibridar específicamente con una región constante de un receptor inmunitario, una región variable de un receptor inmunitario,

una región de diversidad de un receptor inmunitario, la unión de una región variable y una región de diversidad de un receptor inmunitario, o cualquier combinación de las mismas. El receptor inmunitario puede ser un receptor de células

T (TCR) y/o un receptor de células B (BCR). El TCR puede comprender la cadena alfa del TCR, la cadena beta del

TCR, la cadena gamma del TCR, la cadena delta del TCR, o cualquier combinación de las mismas. El BCR puede comprender la cadena pesada del BCR y/o la cadena ligera del BCR.

El método puede comprender la obtención de información de secuencia de la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos. En algunas realizaciones, la obtención de

la información de secuencia comprende unir adaptadores de secuenciación a la segunda pluralidad de amplicones codificados con código de barras o productos de los mismos. La amplificación de la pluralidad de productos de extensión puede comprender la adición de secuencias de sitios de unión de cebadores de secuenciación y/o adaptadores de secuenciación, secuencias complementarias de los mismos, y/o partes de los mismos, a la pluralidad

de productos de extensión. Los adaptadores de secuenciación pueden comprender la secuencia P5, la secuencia P7, una secuencia complementaria de las mismas o una parte de las mismas. Los cebadores de secuenciación pueden

incluir un cebador de secuenciación de lectura 1, un cebador de secuenciación de lectura 2, una secuencia complementaria de los mismos o una parte de los mismos.

Obtener la información de secuencia puede comprender obtener la información de secuencia de la cadena

ligera de BCR y la cadena pesada de BCR de una única célula. La información de secuencia de la cadena ligera de

BCR y la cadena pesada de BCR puede comprender la secuencia de la región determinante de la complementariedad

1 (CDR1), la CDR2, la CDR3, o cualquier combinación de las mismas, de la cadena ligera de BCR y/o la cadena

pesada de BCR. El método puede comprender emparejar la cadena ligera de BCR y la cadena pesada de BCR de la

célula individual basándose en la información de secuencia obtenida. La muestra puede comprender una pluralidad

de células individuales, y el método puede comprender emparejar la cadena ligera de BCR y la cadena pesada de

BCR de por lo menos el 50% de las células individuales basándose en la información de secuencia obtenida. En algunas realizaciones, el porcentaje de células individuales de una muestra en la que la cadena ligera de BCR y la

cadena pesada de BCR están emparejadas de acuerdo con los métodos proporcionados en la presente puede ser, o

ser aproximadamente, del 0,000000001 %, 0,00000001 %, 0,0000001%, 0,000001%, 0,00001%, 0,0001%, 0,001%, 0,01%, 0,1%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%,

21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%,

41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%,

61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%,

81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, o

un número o intervalo entre dos cualesquiera de estos valores. En algunas realizaciones, el porcentaje de células individuales de una muestra en la que la cadena ligera de BCR y la cadena pesada de BCR están emparejadas de acuerdo con los métodos proporcionados en la presente puede ser como mínimo, o como máximo, del 0,000000001%, 0,00000001%, 0,0000001%, 0,000001%, 0,00001%, 0,0001%, 0,001%, 0,01%, 0,1%, 1%, 2%, 3%, 4%, 5%, 6%, 7%,

8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%,

29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%,

49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%,

69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%,

89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o 100%.

alfa de TCR y la cadena beta de TCR de una célula individual. En algunas realizaciones, la información de secuencia

de la cadena alfa de TCR y la cadena beta de TCR puede comprender la secuencia de la región determinante de la complementariedad 1 (CDR1), la CDR2, la CDR3, o cualquier combinación de las mismas, de la cadena alfa de TCR

y/o la cadena beta de TCR. En algunas realizaciones, el método puede comprender emparejar la cadena alfa de TCR

y la cadena beta de TCR de la célula individual basándose en la información de secuencia obtenida. En algunas realizaciones, la muestra puede comprender una pluralidad de células individuales, y el método puede comprender emparejar la cadena alfa de TCR y la cadena beta de TCR de por lo menos el 50% de las células individuales basándose en la información de secuencia obtenida. En algunas realizaciones, el porcentaje de células individuales

de una muestra en la que la cadena alfa de TCR y la cadena beta de TCR están emparejadas de acuerdo con los métodos proporcionados en la presente puede ser, o ser aproximadamente, del 0,000000001%, 0,00000001%,

%, , , 71%, 72%, 73%, 74%, 75%, 76%,77%,78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, o un número o intervalo entre dos cualesquiera de estos valores. En algunas realizaciones, el porcentaje de células individuales de una muestra en donde la cadena alfa del TCR y la cadena beta del TCR están emparejadas de acuerdo con los métodos proporcionados en la presente puede ser como mínimo, o como máximo, del 0,000000001%, 0,00000001%, 0,0000001%, 0,000001%, 0,00001%, 0,0001%, 0,001%, 0,01%, 0.1%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o 100%.

Obtener la información de secuencia puede comprender obtener la información de secuencia de la cadena gamma del TCR y la cadena delta del TCR de una célula individual. La información de secuencia de la cadena gamma del TCR y la cadena delta del TCR puede comprender la secuencia de la región determinante de la complementariedad 1 (CDR1), la CDR2, la CDR3, o cualquier combinación de las mismas, de la cadena gamma del TCR y/o la cadena delta del TCR. El método puede comprender emparejar la cadena gamma del TCR y la cadena delta del TCR de la célula individual basándose en la información de secuencia obtenida. La muestra puede comprender una pluralidad de células individuales, y el método puede comprender emparejar la cadena gamma del TCR y la cadena delta del TCR de por lo menos el 50% de las células individuales basándose en la información de secuencia obtenida. En algunas realizaciones, el porcentaje de células individuales de una muestra en la que la cadena delta del TCR y la cadena gamma del TCR están emparejadas de acuerdo con los métodos proporcionados en la presente puede ser, o ser aproximadamente, del 0,000000001%, 0,00000001%, 0,0000001%, 0,000001%, 0,00001%, 0,0001%, 0,001%, 0,01%, 0,1%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, o un número o un intervalo entre dos cualesquiera de estos valores. En algunas realizaciones, el porcentaje de células individuales de una muestra en la que la cadena delta del TCR y la cadena gamma del TCR están emparejadas de acuerdo con los métodos proporcionados en la presente puede ser como mínimo, o como máximo, del 0,000000001%, 0,00000001%, 0,0000001%, 0,000001%, 0,00001%, 0,0001%, 0,001%, 0,01%, 0,1%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o 100%.

Obtener la información de secuencia de la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos, puede comprender: obtener datos de secuenciación que comprenden una pluralidad de lecturas de secuenciación de la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos, en donde cada una de la pluralidad de lecturas de secuenciación comprende (1) una secuencia de marcador celular, (2) una secuencia de marcador molecular, y/o (3) una subsecuencia de la diana de ácido nucleico. En algunas realizaciones, el método comprende: para cada secuencia de marcador celular única, que indica una célula individual de la muestra: alinear cada una de la pluralidad de lecturas de secuenciación de la diana de ácido nucleico para generar una secuencia alineada de la diana de ácido nucleico. Como se representa en la FIG.

9B, los datos de secuenciación pueden comprender una pluralidad de lecturas de secuenciación como, por ejemplo, lecturas de Lectura 1910y Lectura 2920. En algunas realizaciones, como resultado del paso de cebado aleatorio, las lecturas de Lectura 19 l0y/o Lectura 2920pueden abarcar colectivamente toda la diana de ácido nucleico (por ejemplo, el transcrito del receptor inmunitario). El método puede comprender la reconstrucción bioinformática900de la secuencia de longitud completa de la diana de ácido nucleico (por ejemplo, el ARNm930del receptor inmunitario) alineando la pluralidad de Lectura 1910y Lectura 2920. Ventajosamente, las composiciones y métodos proporcionados en la presente pueden proporcionar tanto la identificación como el recuento de dianas de ácido nucleico (por ejemplo, transcritos que contienen V(D)J).

En algunas realizaciones, la secuencia alineada de la diana de ácido nucleico comprende por lo menos el 50% de la secuencia de ADNc de la diana de ácido nucleico, por lo menos el 70% de la secuencia de ADNc de la diana de ácido nucleico, por lo menos el 90% de la secuencia de ADNc de la diana de ácido nucleico, o la longitud completa de la secuencia de ADNc de la diana de ácido nucleico. En algunas realizaciones, la secuencia alineada de la diana de ácido nucleico puede ser, o ser aproximadamente, del 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%,22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, o un número o un intervalo entre dos de estos valores, de la secuencia de ADNc de la diana de ácido nucleico. En algunas realizaciones, la secuencia alineada de la diana de ácido nucleico puede ser como mínimo, o como máximo, del 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o 100% de la secuencia de ADNc de la diana de ácido nucleico. La diana de ácido nucleico puede ser un receptor inmunitario.

En algunas realizaciones, la secuencia alineada de la diana de ácido nucleico comprende la región determinante de la complementariedad 1 (CDR1), la región determinante de la complementariedad 2 (CDR2), la región determinante de la complementariedad 3 (CDR3), la región variable, la longitud completa de la región variable, o una combinación de las mismas. La secuencia alineada de la diana de ácido nucleico puede comprender la región variable, la región de diversidad, la unión de una región de diversidad de la región variable y/o la región constante, o cualquier combinación de las mismas. En algunas realizaciones, el método no comprende fragmentación, etiquetación, o ambas.

Kits para la obtener información de la longitud completa de dianas de ácidos nucleicos

Lo divulgado en la presente incluye kits. En algunas realizaciones, el kit comprende: una pluralidad de códigos de barras de oligonucleótidos, en donde cada uno de la pluralidad de códigos de barras de oligonucleótidos comprende un marcador molecular y una región de unión a la diana, y en donde por lo menos 10 de la pluralidad de códigos de barras de oligonucleótidos comprenden diferentes secuencias de marcador molecular; una transcriptasa inversa; un oligonucleótido de cambio de plantilla que comprende la región de unión a la diana, o una parte de la misma; y una ADN polimerasa que carece de por lo menos una de la actividad de exonucleasa de 5' a 3' y actividad de exonucleasa de 3' a 5'. Lo divulgado en la presente incluye kits. En algunas realizaciones, el kit comprende: una pluralidad de códigos de barras de oligonucleótidos, en donde cada uno de la pluralidad de códigos de barras de oligonucleótidos comprende un marcador molecular y una región de unión a la diana, y en donde por lo menos 10 de la pluralidad de códigos de barras de oligonucleótidos comprenden diferentes secuencias de marcador molecular; una desoxinucleotidil transferasa terminal; y una ADN polimerasa que carece de por lo menos una de la actividad de exonucleasa 5' a 3' y actividad de exonucleasa 3' a 5'.

El kit puede comprender cebadores aleatorios. Los cebadores aleatorios pueden comprender una secuencia aleatoria de nucleótidos. La secuencia aleatoria de nucleótidos puede tener de aproximadamente 4 a aproximadamente 30 nucleótidos de longitud. En algunas realizaciones, la ADN polimerasa comprende un fragmento de Klenow. En algunas realizaciones, la transcriptasa inversa comprende una transcriptasa inversa viral. En algunas realizaciones, la transcriptasa inversa viral es una transcriptasa inversa del virus de la leucemia murina (MLV). En algunas realizaciones, la transcriptasa inversa viral es una transcriptasa inversa del virus de la leucemia murina de Moloney (MMLV). En algunas realizaciones, el oligonucleótido de cambio de plantilla comprende uno o más ribonucleótidos 3', por ejemplo tres ribonucleótidos 3'. En algunas realizaciones, los ribonucleótidos 3' comprenden guanina. En algunas realizaciones, el kit comprende uno o más de etilenglicol, polietilenglicol, 1,2-propanodiol, dimetilsulfóxido (DMSO), glicerol, formamida, 7-deaza-GTP, acetamida, sal de cloruro de tetrametilamonio, betaína o cualquier combinación de los mismos.

En algunas realizaciones, el kit comprende un tampón, en algunas realizaciones, el kit comprende un cartucho. En algunas realizaciones, el kit comprende uno o más reactivos para una reacción de transcripción inversa. En algunas realizaciones, el kit comprende uno o más reactivos para una reacción de amplificación. En algunas realizaciones, la región de unión a la diana comprende una secuencia específica de gen, una secuencia de oligo(dT), un multímero aleatorio o cualquier combinación de los mismos. En algunas realizaciones, el código de barras de oligonucleótidos comprende un marcador de muestra idéntico y/o un marcador celular idéntico. En algunas realizaciones, cada marcador de muestra y/o marcador celular de la pluralidad de códigos de barras de oligonucleótidos comprende por lo menos 6 nucleótidos. En algunas realizaciones, cada marcador molecular de la pluralidad de códigos de barras de oligonucleótidos comprende por lo menos 6 nucleótidos. En algunas realizaciones, por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos está inmovilizado en la partícula sintética. En algunas realizaciones, por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos está parcialmente inmovilizado en la partícula sintética. En algunas realizaciones, por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos está encerrado en la partícula sintética. En algunas realizaciones, por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos está parcialmente encerrado en la partícula sintética. En algunas realizaciones, la partícula sintética es perturbable. En algunas realizaciones, la partícula sintética comprende una perla, por ejemplo una perla de Sefarosa, una perla de estreptavidina, una perla de agarosa, una perla magnética, una perla conjugada, una perla conjugada con proteína A, una perla conjugada con proteína G, una perla conjugada con proteína A/G, una perla conjugada con proteína L, una perla conjugada con oligo(dT), una perla de sílice, una perla similar a la sílice, una microperla antibiotina, una microperla antifluorocromo, o cualquier combinación de las mismas. En algunas realizaciones, la partícula sintética comprende un material seleccionado del grupo que consiste en polidimetilsiloxano (PDMS), poliestireno, vidrio, polipropileno, agarosa, gelatina, hidrogel, paramagnético, cerámica, plástico, vidrio, metilestireno, polímero acrílico, titanio, látex, Sefarosa, celulosa, nylon, silicona, y cualquier combinación de los mismos. En algunas realizaciones, la partícula sintética comprende una partícula de hidrogel perturbable. En algunas realizaciones, cada uno de la pluralidad de códigos de barras de oligonucleótidos comprende un grupo funcional conector, la partícula sintética comprende un grupo funcional de soporte sólido, y/o el grupo funcional de soporte y el grupo funcional conector están asociados entre sí. En algunas realizaciones, el grupo funcional conector y el grupo funcional de soporte se seleccionan individualmente del grupo que consiste en C6, biotina, estreptavidina, aminas primarias, aldehídos, cetonas, y cualquier combinación de los mismos.

EJEMPLOS

Algunos aspectos de las realizaciones descritas en la presente se divulgan con más detalle en los siguientes ejemplos, que no se pretende de modo alguno que limiten el alcance de la presente divulgación.

Ejemplo 1

Determinación de secuencias V(D)J de longitud completa basada en cebado aleatorio

Este ejemplo demuestra los métodos basados en cebado aleatorio para la elaboración de perfiles de expresión de longitud completa de dianas de ácido nucleico (por ejemplo, transcritos que contienen V(D)J) proporcionados en la presente. Como se observa en las trazas de bioanalizador de productos de TCR (FIGS. 10A-10B) y productos de b Cr (FIGS. 10C-10D), se obtienen fragmentos más pequeños con un enfoque basado en cebado aleatorio proporcionado en la presente (FIGS. 10A y 10C) en comparación con un método disponible actualmente (FIGS. 10B y 10D). A continuación, se realizó la secuenciación para determinar el porcentaje de secuencias VDJ de longitud completa (FIG. 11B) y procedentes de células (FIG. 11A). De las lecturas que se alinearon con VDJ, se ensamblaron con éxito en un cóntigo, y ese cóntigo es una secuencia VDJ válida (tiene CDR3), el porcentaje mostrado en la FIG. 11A se refiere al número de esas lecturas que provienen de células putativas. En las células putativas, para los cóntigos que fueron identificados como dominantes, en la FIG. 11B el porcentaje de ellos que son de longitud completa se muestra. La longitud completa se determinó en función de si ese cóntigo tiene secuencia identificada para todas las partes principales de la cadena: FR1, CDR1, FR2, CDR2, FR3, CDR3, FR4. Además, como se muestra en las FIGS. 12A-12D, las cadenas emparejadas de longitud completa se encuentran en los tipos celulares correctos (BCR en células B, TCR en células T), con emparejamiento BCR (FIGS. 12A-12B) y emparejamiento TCR (FIGS. 12C-12D) obtenidos con un enfoque basado en cebado aleatorio proporcionado en la presente (FIGS. 12A y 12C) superior a un método actualmente disponible (FIGS. 12B y 12D). Estos resultados proporcionan una prueba de principio para los métodos y composiciones basados en cebado aleatorio proporcionados en la presente.

Aunque en la presente se han divulgado varios aspectos y realizaciones, otros aspectos y realizaciones para los expertos en la técnica serán evidentes. Los varios aspectos y realizaciones divulgados en la presente son con propósitos de ilustración y no se pretende que sean limitativos.

Un experto en la técnica apreciará que, para este y otros procesos y métodos divulgados en al presente, las funciones realizadas en los procesos y métodos pueden implementarse en un orden diferente. Además, los pasos y operaciones esbozados se proporcionan solamente como ejemplos, y algunos de los pasos y operaciones pueden ser opcionales, combinarse en menos pasos y operaciones, o ampliarse en pasos y operaciones adicionales sin restarle valor a la esencia de las realizaciones divulgadas.

Con respecto al uso de sustancialmente cualquier término plural y/o singular en la presente, los expertos en la técnica pueden traducir del plural al singular y/o del singular al plural según sea apropiado para el contexto y/o la aplicación. En la presente pueden expresarse expresamente las varias permutaciones singular/plural en aras de la claridad.

Los expertos en la técnica entenderán que, en general, los términos usados en la presente, y especialmente en las reivindicaciones adjuntas (por ejemplo, los cuerpos de las reivindicaciones adjuntas) se entienden generalmente como términos "abiertos" (por ejemplo, el término "que incluye" debe interpretarse como "que incluye pero no se limita a", el término "que tiene" debe interpretarse como "que tiene por lo menos", el término "incluye" debe interpretarse como "incluye pero no se limita a", etc.). Los expertos en la técnica entenderán además que si se pretende un número específico de una reivindicación introducida, tal intención se enunciará explícitamente en la reivindicación, y en ausencia de tal enunciado no existe tal intención. Por ejemplo, como ayuda para la comprensión, las siguientes reivindicaciones adjuntas pueden contener el uso de las frases introductorias "por lo menos uno" y "uno o más" para introducir los enunciados de las reivindicaciones. Sin embargo, no debe interpretarse el uso de dichas frases en el sentido de que la introducción de un enunciado de reivindicación mediante los artículos indefinidos "un" o "uno" limita cualquier reivindicación particular que contenga dicho enunciado de reivindicación introducido a realizaciones que contengan solo uno de dichos enunciados, incluso cuando la misma reivindicación incluya las frases introductorias "uno o más" o "por lo menos uno" y artículos indefinidos como "un" o "uno" (por ejemplo, "un" y/o "uno" deben interpretarse en el sentido de "por lo menos uno" o "uno o más"); lo mismo ocurre con el uso de artículos definidos usados para introducir los enunciados de las reivindicaciones. Además, incluso si se enuncia explícitamente un número específico de un enunciado de reivindicación introducida, los expertos en la técnica reconocerán que dicho enunciado debe interpretarse en el sentido de que significa por lo menos el número enunciado (por ejemplo, el simple enunciado de "dos enunciados", sin otros modificadores, significa por lo menos dos enunciados, o dos o más enunciados). Además, en aquellos casos en los que se usa una convención análoga a "por lo menos uno de A, B y C, etc.", en general dicha construcción se entiende en el sentido en el que un experto en la técnica entendería la convención (por ejemplo, "un sistema que tenga por lo menos uno de A, B y C" incluiría, pero no se limitaría a, sistemas que tengan A solo, B solo, C solo, A y B juntos, A y C juntos, B y C juntos, y/o A, B y C juntos, etc.). En aquellos casos en los que se usa una convención análoga a "por lo menos uno de A, B o C, etc.", en general dicha construcción se entiende en el sentido en el que un experto en la técnica entendería la convención (por ejemplo, "un sistema que tiene por lo menos uno de A, B o C" incluiría, pero no se limitaría a, sistemas que tienen A solo, B solo, C solo, A y B juntos, A y C juntos, B y C juntos, y/o A, B y C juntos, etc.). Los expertos en la técnica entenderán además que debe entenderse que prácticamente cualquier palabra y/o frase disyuntiva que presente dos o más términos alternativos, ya sea en la descripción, las reivindicaciones o los dibujos, contempla las posibilidades de incluir uno de los términos, cualquiera de los términos, o ambos términos. Por ejemplo, se entenderá que la frase "A o B" incluye las posibilidades de "A" o "B" o "A y B".

Además, cuando las características o aspectos de la divulgación se describen en términos de grupos de Markush, los expertos en la técnica reconocerán que la divulgación también se describe de este modo en términos de cualquier miembro individual o subgrupo de miembros del grupo de Markush.

Como comprenderá un experto en la técnica, para todos y cada uno de los propósitos, como por ejemplo para proporcionar una descripción escrita, todos los intervalos divulgados en la presente también abarcan todos y cada uno de los posibles subintervalos y combinaciones de subintervalos de los mismos. Cualquier intervalo enumerado puede reconocerse fácilmente como suficientemente descriptivo y permite descomponer el mismo intervalo en mitades, tercios, cuartos, quintos, décimos, etc., por lo menos iguales. A modo de ejemplo no limitativo, cada intervalo analizado en la presente puede descomponerse fácilmente en un tercio inferior, un tercio medio y un tercio superior, etc. Como también comprenderá un experto en la técnica, todos los términos como "hasta", "por lo menos" y similares incluyen el número mencionado y se refieren a intervalos que pueden descomponerse posteriormente en subintervalos, como se ha analizado anteriormente. Finalmente, como comprenderá un experto en la técnica, un intervalo incluye cada miembro individual. Así, por ejemplo, un grupo que tiene 1-3 células se refiere a grupos que tienen 1 ,2 o 3 células. De manera similar, un grupo que tiene 1-5 células se refiere a grupos que tienen 1, 2, 3, 4, o 5 células, y demás.

De lo anterior, se apreciará que se han descrito en la presente varias realizaciones de la presente divulgación con propósitos ilustrativos, y que pueden realizarse varias modificaciones. Por consiguiente, no se pretende que las varias realizaciones divulgadas en la presente sean limitativas, siendo que su verdadero alcance está indicado por las reivindicaciones siguientes.

Claims

REIVINDICACIONES

1. Un método para marcar dianas de ácido nucleico en una muestra, que comprende:

poner en contacto copias de una diana de ácido nucleico con una pluralidad de códigos de barras de oligonucleótidos, en donde cada código de barras de oligonucleótidos comprende una primera secuencia universal, un marcador molecular y una región de unión a la diana capaz de hibridar con la diana de ácido nucleico; generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras, cada una de las cuales comprende la región de unión a la diana y un complemento de la región de unión a la diana;

hibridar el complemento de la región de unión a la diana de cada molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de una o más de:

(i) un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos, (ii) la propia molécula de ácido nucleico codificada con código de barras, y

(iii) una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras;

extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas, cada una de las cuales comprende el primer marcador molecular y un segundo marcador molecular;

amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas usando un cebador específico de la diana capaz de hibridar con una secuencia de la diana de ácido nucleico y un cebador que comprende la primera secuencia universal, generando de este modo una primera pluralidad de amplicones codificados con código de barras que comprenden la secuencia de la diana de ácido nucleico, o una parte de la misma;

hibridar cebadores aleatorios con la primera pluralidad de amplicones codificados con código de barras y extender los cebadores aleatorios para generar una pluralidad de productos de extensión, en donde los cebadores aleatorios comprenden una segunda secuencia universal, o un complemento de la misma; y

amplificar la pluralidad de productos de extensión usando cebadores capaces de hibridar con la primera secuencia universal y la segunda secuencia universal, o complementos de las mismas, generando de este modo una segunda pluralidad de amplicones codificados con código de barras.

2. El método de la reivindicación 1, que comprende: determinar el número de copias de la diana de ácido nucleico en la muestra basándose en el número de primeros marcadores moleculares con secuencias distintas, segundos marcadores moleculares con secuencias distintas, o una combinación de los mismos, asociados con la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos, opcionalmente en donde determinar el número de copias de la diana de ácido nucleico en la muestra comprende:

(a) determinar el número de copias de la diana de ácido nucleico en la muestra basándose en el número de segundos marcadores moleculares con secuencias distintas asociados con la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos, y/o

(a) determinar el número de copias de la diana de ácido nucleico en la muestra basándose en el número de primeros marcadores moleculares con secuencias distintas asociados a la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos.

3. El método de cualquiera de las reivindicaciones 1-2, en donde:

(a) el método comprende desnaturalizar la pluralidad de moléculas de ácido nucleico codificadas con código de barras antes de hibridar el complemento de la región de unión a la diana de cada molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de: (i) un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos, (ii) la propia molécula de ácido nucleico codificada con código de barras, y/o (iii) una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras;

(b) el método comprende desnaturalizar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas antes de amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas;

(c) la secuencia de cada una de la pluralidad de dianas de ácido nucleico comprende una subsecuencia de cada una de la pluralidad de dianas de ácido nucleico;

(d) la secuencia de la diana de ácido nucleico en la pluralidad de moléculas de ácido nucleico codificadas con código de barras comprende una subsecuencia de la diana de ácido nucleico;

(e) el primer marcador molecular se hibrida con el segundo marcador molecular después de extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras;

(f) las moléculas de ácido nucleico codificadas con código de barras extendidas comprenden cada una el primer marcador molecular, el segundo marcador molecular, la región de unión a la diana y el complemento de la región de unión a la diana;

(g) el complemento de la región de unión a la diana es complementario a una parte de la región de unión a la diana; (h) la región de unión a la diana comprende una secuencia específica del gen, una secuencia poli(dT), o ambas; y/o

(j) generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras, cada una de las cuales comprende la región de unión a la diana y un complemento de la región de unión a la diana comprende:

(i) codificar con códigos de barras copias de una diana de ácido nucleico en una muestra usando la pluralidad de códigos de barras de oligonucleótidos para generar una pluralidad de moléculas de ácido nucleico codificadas con códigos de barras, cada una de las cuales comprendiendo una secuencia complementaria a por lo menos una parte de la diana de ácido nucleico, un primer marcador molecular y la región de unión a la diana; y

unir un oligonucleótido que comprende un complemento de la región de unión a la diana a la pluralidad de moléculas de ácido nucleico codificadas con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprende cada una la región de unión a la diana y un complemento de la región de unión a la diana; o

(ii) codificar con códigos de barras copias de una diana de ácido nucleico en una muestra usando la pluralidad de códigos de barras de oligonucleótidos para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras, cada una de las cuales comprendiendo una secuencia complementaria a por lo menos una parte de la diana de ácido nucleico, un primer marcador molecular y la región de unión a la diana; amplificar la pluralidad de moléculas de ácido nucleico codificadas con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras amplificadas; y

unir un oligonucleótido que comprende un complemento de la región de unión a la diana a la pluralidad de moléculas de ácido nucleico codificadas con código de barras amplificadas para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras, cada una de las cuales comprende la región de unión a la diana y un complemento de la región de unión a la diana.

4. El método de la reivindicación 3(j), en donde:

(a) codificar con códigos de barras copias de una diana de ácido nucleico en una muestra comprende extender la pluralidad de códigos de barras de oligonucleótidos hibridados con las copias de la diana de ácido nucleico para generar la pluralidad de moléculas de ácido nucleico codificadas con código de barras, opcionalmente en donde extender la pluralidad de códigos de barras de oligonucleótidos hibridados con las copias de la diana de ácido nucleico comprende transcribir inversamente las copias de la diana de ácido nucleico hibridadas con la pluralidad de códigos de barras de oligonucleótidos; y/o

(b) unir el oligonucleótido que comprende el complemento de la región de unión a la diana comprende ligar el oligonucleótido que comprende el complemento de la región de unión diana a la pluralidad de moléculas de ácido nucleico codificadas con código de barras y/o moléculas de ácido nucleico codificadas con código de barras amplificadas; y/o

(c) la región de unión a la diana comprende una secuencia de poli(dT), y en donde unir el oligonucleótido que comprende el complemento de la región de unión a la diana comprende añadir una pluralidad de monofosfatos de adenosina a la pluralidad de moléculas de ácido nucleico codificadas con código de barras y/o moléculas de ácido nucleico codificadas con código de barras amplificadas usando una desoxinucleotidil transferasa terminal.

5. El método de cualquiera de las reivindicaciones 1-4, en donde generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprenden cada una la región de unión a la diana y un complemento de la región de unión a la diana comprende: extender la pluralidad de códigos de barras de oligonucleótidos hibridados con las copias de la diana de ácido nucleico en presencia de una transcriptasa inversa y un oligonucleótido de cambio de plantilla que comprende la región de unión a la diana, o una parte de la misma, para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras que comprende cada una una secuencia complementaria a por lo menos una parte de la diana de ácido nucleico, un primer marcador molecular, la región de unión a la diana y un complemento de la región de unión a la diana, opcionalmente en donde:

(a) la transcriptasa inversa es capaz de desarrollar una actividad de transferasa terminal;

(b) el oligonucleótido de cambio de plantilla comprende uno o más ribonucleótidos 3', y opcionalmente tres ribonucleótidos 3', opcionalmente en donde los ribonucleótidos 3' comprenden guanina; y/o

(c) la transcriptasa inversa comprende una transcriptasa inversa viral, opcionalmente una transcriptasa inversa del virus de la leucemia murina (MLV) o una transcriptasa inversa del virus de la leucemia murina de Moloney (MMLV).

6. El método de cualquiera de las reivindicaciones 1-5, en donde:

(a) hibridar el complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de la propia molécula de ácido nucleico codificada con código de barras comprende la hibridación intramolecular de la región de unión a la diana y el complemento de la región de unión a la diana dentro de una molécula de ácido nucleico codificada con código de barras para formar una horquilla, opcionalmente en donde el segundo marcador molecular es el complemento del primer marcador molecular; y/o

(b) hibridar el complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos comprende la hibridación intermolecular del complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con la región de unión a la diana de un código de barras de oligonucleótidos de la pluralidad de códigos de barras de oligonucleótidos, opcionalmente en donde:

(i) el segundo marcador molecular es diferente del primer marcador molecular, y en donde el segundo marcador molecular no es un complemento del primer marcador molecular; y/o

(ii) el método comprende extender los extremos 3' de los códigos de barras de oligonucleótidos hibridados con el complemento de la región de unión a la diana de la molécula de ácido nucleico codificada con código de barras para generar una pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas, cada una de las cuales comprendiendo un complemento del primer marcador molecular y un segundo marcador molecular, opcionalmente en donde la secuencia del segundo marcador molecular es diferente de la secuencia del primer marcador molecular, en donde el segundo marcador molecular no es un complemento del primer marcador molecular.

7. El método de cualquiera de las reivindicaciones 1-6, en donde:

(a) hibridar el complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras comprende la hibridación intermolecular del complemento de la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras con la región de unión a la diana de una molécula de ácido nucleico codificada con código de barras diferente de la pluralidad de moléculas de ácido nucleico codificadas con código de barras, opcionalmente, en donde la secuencia del segundo marcador molecular es diferente de la secuencia del primer marcador molecular, y en donde el segundo marcador molecular no es un complemento del primer marcador molecular;

(b) la muestra comprende una célula individual, una pluralidad de células, una pluralidad de células individuales, un tejido, una muestra tumoral, o cualquier combinación de los mismos, opcionalmente en donde una célula individual comprende una célula inmunitaria o una célula tumoral circulante, opcionalmente la célula inmunitaria es una célula B o una célula T;

(c) el cebador específico de la diana hibrida específicamente con un receptor inmunitario, opcionalmente el cebador específico de la diana hibrida específicamente con una región constante de un receptor inmunitario, una región variable de un receptor inmunitario, una región de diversidad de un receptor inmunitario, la unión de una región variable y una región de diversidad de un receptor inmunitario, o una combinación de las mismas, opcionalmente en donde el receptor inmunitario es un receptor de células T (TCR) y/o un receptor de células B (BCR); opcionalmente el TCR comprende la cadena alfa del TCR, la cadena beta del TCR, la cadena gamma del TCR, la cadena delta del TCR, o cualquier combinación de las mismas; y además opcionalmente el receptor del BCR comprende la cadena pesada del BCR y/o la cadena ligera del BCR;

(d) extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras comprende extender los extremos 3' de la pluralidad de moléculas de ácido nucleico codificadas con código de barras usando una ADN polimerasa que carece de por lo menos una de la actividad de exonucleasa 5' a 3' y la actividad de exonucleasa 3' a 5', y opcionalmente la ADN polimerasa comprende un fragmento de Klenow; y/o (e) amplificar la pluralidad de productos de extensión comprende la adición de secuencias de sitios de unión de cebadores de secuenciación y/o adaptadores de secuenciación, secuencias complementarias de los mismos, y/o partes de los mismos, a la pluralidad de productos de extensión; opcionalmente los adaptadores de secuenciación comprenden la secuencia P5, la secuencia P7, una secuencia complementaria de las mismas, o una parte de las mismas; y además opcionalmente los cebadores de secuenciación comprenden un cebador de secuenciación de Lectura 1, un cebador de secuenciación de Lectura 2, una secuencia complementaria de los mismos, o una parte de los mismos.

8. El método de una cualquiera de las reivindicaciones 1-7, que comprende obtener información de secuencia de la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos, y opcionalmente obtener la información de secuencia comprende unir adaptadores de secuenciación a la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos, opcionalmente en donde:

(a) obtener información sobre la secuencia de la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos, comprende:

obtener datos de secuenciación que comprenden una pluralidad de lecturas de secuenciación de la segunda pluralidad de amplicones codificados con código de barras, o productos de los mismos,

en donde cada una de la pluralidad de lecturas de secuenciación comprende (1) una secuencia de marcador celular, (2) una secuencia de marcador molecular, y/o (3) una subsecuencia de la diana de ácido nucleico; y opcionalmente

(b) el método comprende:

para cada secuencia de marcador celular única, que indica una única célula de la muestra:

alinear cada una de la pluralidad de lecturas de secuenciación de la diana de ácido nucleico para generar una secuencia alineada de la diana de ácido nucleico; y opcionalmente

(c) la secuencia alineada de la diana de ácido nucleico comprende por lo menos el 50% de la secuencia de ADNc de la diana de ácido nucleico, por lo menos el 70% de la secuencia de ADNc de la diana de ácido nucleico, por lo menos el 90% de la secuencia de ADNc de la diana de ácido nucleico, o la longitud completa de la secuencia de ADNc de la diana de ácido nucleico.

9. El método de cualquiera de las reivindicaciones 1-7, en donde la diana de ácido nucleico es un receptor inmunitario, opcionalmente el receptor inmunitario comprende la cadena ligera de BCR, la cadena pesada de BCR, la cadena alfa de TCR, la cadena beta de TCR, la cadena gamma de TCR, la cadena delta de TCR, o cualquier combinación de las mismas, opcionalmente en donde:

(a) la secuencia alineada de la diana de ácido nucleico comprende la región determinante de la complementariedad 1 (CDR1), la región determinante de la complementariedad 2 (CDR2), la región determinante de la complementariedad 3 (CDR3), la región variable, la longitud completa de la región variable, o una combinación de las mismas;

(b) la secuencia alineada de la diana de ácido nucleico comprende la región variable, la región de diversidad, la unión de una región de diversidad de región variable y/o la región constante, o cualquier combinación de las mismas; y/o

(c) el método no comprende la fragmentación, la etiquetación o ambas.

10. El método de la reivindicación 8 o 9, en donde:

(a) obtener la información de secuencia comprende obtener la información de secuencia de la cadena ligera de BCR y la cadena pesada de BCR de una célula individual, opcionalmente en donde:

(i) la información de la secuencia de la cadena ligera de BCR y la cadena pesada de BCR comprende la secuencia de la región determinante de la complementariedad 1 (CDR1), la CDR2, la CDR3, o cualquier combinación de las mismas, de la cadena ligera de BCR y/o la cadena pesada de BCR;

(ii) el método comprende emparejar la cadena ligera de<b>C<r>y la cadena pesada de BCR de la célula individual basándose en la información de secuencia obtenida; y/o

(iii) la muestra comprende una pluralidad de células individuales, el método comprende emparejar la cadena ligera de BCR y la cadena pesada de BCR de por lo menos el 50% de dichas células individuales basándose en la información de secuencia obtenida; y/o

(b) obtener la información de secuencia comprende obtener la información de secuencia de la cadena alfa de TCR y la cadena beta de TCR de una célula individual, opcionalmente en donde:

(i) la información de la secuencia de la cadena alfa del TCR y la cadena beta del TCR comprende la secuencia de la región determinante de la complementariedad 1 (CDR1), la CDR2, la CDR3, o cualquier combinación de las mismas, de la cadena alfa del TCR y/o la cadena beta del TCR ;

(ii) el método comprende emparejar la cadena alfa del TCR y la cadena beta del TCR de la célula individual basándose en la información de secuencia obtenida; y/o

(iii) la muestra comprende una pluralidad de células individuales, el método comprendiendo emparejar la cadena alfa del TCR y la cadena beta del TCR de por lo menos el 50% de dichas células individuales basándose en la información de secuencia obtenida; y/o

(c) obtener la información de secuencia comprende obtener la información de secuencia de la cadena gamma del TCR y de la cadena delta del TCR de una célula individual, opcionalmente en donde:

(i) la información de secuencia de la cadena gamma del TCR y la cadena delta del TCR comprende la secuencia de la región determinante de la complementariedad 1 (CDR1), la CDR2, la CDR3, o cualquier combinación de las mismas, de la cadena gamma del TCR y/o la cadena delta del TCR;

(ii) el método comprende emparejar la cadena gamma del TCR y la cadena delta del TCR de la célula individual basándose en la información de secuencia obtenida; y/o

(iii) la muestra comprende una pluralidad de células individuales, el método comprendiendo emparejar la cadena gamma del TCR y la cadena delta del TCR de por lo menos el 50% de dichas células individuales basándose en la información de secuencia obtenida.

11. El método de cualquiera de las reivindicaciones 1-10, en donde:

(a) el complemento de la región de unión a la diana comprende la secuencia complementaria inversa de la región de unión a la diana o la secuencia complementaria de la región de unión a la diana;

(b) el complemento del marcador molecular comprende una secuencia complementaria inversa del marcador molecular o una secuencia complementaria del marcador molecular;

(c) la pluralidad de moléculas de ácido nucleico codificadas con código de barras comprende moléculas de ácido desoxirribonucleico (ADN) codificadas con código de barras, moléculas de ácido ribonucleico (ARN) codificadas con código de barras o una combinación de las mismas;

(d) la diana de ácido nucleico comprende una molécula de ácido nucleico, opcionalmente la molécula de ácido nucleico comprende ácido ribonucleico (ARN), ARN mensajero (ARNm), microARN, ARN interferente pequeño (ARNip), producto de degradación de ARN, ARN que comprende una cola poli(A), o cualquier combinación de los mismos, y además opcionalmente el ARNm codifica un receptor inmunitario, opcionalmente en donde la diana de ácido nucleico comprende un reactivo de unión a componente celular, y/o la molécula de ácido nucleico se asocia con el reactivo de unión a componente celular, comprendiendo opcionalmente disociar la molécula de ácido nucleico y el reactivo de unión a componente celular;

(e) por lo menos 10 de la pluralidad de códigos de barras de oligonucleótidos comprenden diferentes secuencias de marcadores moleculares;

(f) cada marcador molecular de la pluralidad de códigos de barras de oligonucleótidos comprende por lo menos 6 nucleótidos; y/o

(g) la pluralidad de códigos de barras de oligonucleótidos está asociada a un soporte sólido, opcionalmente en donde:

(i) el soporte sólido comprende una partícula sintética, una superficie plana o una combinación de las mismas; y/o

(ii) la pluralidad de códigos de barras de oligonucleótidos asociados al mismo soporte sólido comprenden cada uno un marcador de muestra idéntico, opcionalmente en donde cada marcador de muestra de la pluralidad de códigos de barras de oligonucleótidos comprende por lo menos 6 nucleótidos; y/o

(h) la pluralidad de códigos de barras de oligonucleótidos comprende cada uno un marcador celular, opcionalmente en donde:

(i) cada marcador celular de la pluralidad de códigos de barras de oligonucleótidos comprende por lo menos 6 nucleótidos;

(ii) los códigos de barras de oligonucleótidos asociados al mismo soporte sólido comprenden el mismo marcador celular;

(iii) los códigos de barras de oligonucleótidos asociados a diferentes soportes sólidos comprenden diferentes marcadores celulares; y/o

(iv) la pluralidad de moléculas de ácido nucleico codificadas con código de barras extendidas comprende cada una un marcador celular y un complemento del marcador celular, opcionalmente en donde el complemento del marcador celular comprende una secuencia complementaria inversa del marcador celular, o una secuencia complementaria del marcador celular; y/o

(i) el método comprende extender la pluralidad de códigos de barras de oligonucleótidos hibridados con las copias de la diana de ácido nucleico en presencia de uno o más de etilenglicol, polietilenglicol, 1,2-propanediol, dimetilsulfóxido (DMSO), glicerol, formamida, 7-deaza-GTP, acetamida, sal de cloruro de tetrametilamonio, betaína, o cualquier combinación de los mismos.

12. El método de cualquiera de las reivindicaciones 1-11, en donde la muestra comprende una célula individual, el método comprendiendo asociar una partícula sintética que comprende la pluralidad de los códigos de barras de oligonucleótidos con la célula individual de la muestra.

13. El método de la reivindicación 12, en donde:

(a) el método comprende lisar la célula individual después de asociar la partícula sintética con la célula individual, opcionalmente lisar la célula individual comprende calentar la muestra, poner en contacto la muestra con un detergente, cambiar el pH de la muestra, o cualquier combinación de los mismos;

(b) la partícula sintética y la célula individual se encuentran en la misma división, y opcionalmente la división es un pocillo o una gotita;

(c) por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos está inmovilizado o parcialmente inmovilizado en la partícula sintética, o por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos está encerrado o parcialmente encerrado en la partícula sintética;

(d) la partícula sintética es perturbable, opcionalmente una partícula de hidrogel perturbable;

(e) la partícula sintética comprende una perla, opcionalmente la perla comprende una perla de sefarosa, una perla de estreptavidina, una perla de agarosa, una perla magnética, una perla conjugada, una perla conjugada con proteína A, una perla conjugada con proteína G una perla conjugada con proteína A/G, una perla conjugada con proteína L, una perla conjugada con oligo(dT), una perla de sílice, una perla similar a sílice, una microperla antibiotina, una microperla antifluorocromo o cualquier combinación de las mismas;

(f) la partícula sintética comprende un material seleccionado del grupo que consiste en polidimetilsiloxano (PDMS), poliestireno, vidrio, polipropileno, agarosa, gelatina, hidrogel, paramagnético, cerámica, plástico, vidrio, metilestireno, polímero acrílico, titanio, látex, Sefarosa, celulosa, nylon, silicona, y cualquier combinación de los mismos; y/o

(g) cada uno de la pluralidad de códigos de barras de oligonucleótidos comprende un grupo funcional conector, en donde la partícula sintética comprende un grupo funcional de soporte sólido, y en donde el grupo funcional de soporte y el grupo funcional conector están asociados entre sí, y opcionalmente el grupo funcional conector y el grupo funcional de soporte se seleccionan individualmente del grupo que consiste en C6, biotina, estreptavidina, aminas primarias, aldehídos, cetonas, y cualquier combinación de los mismos.

14. Un kit que comprende:

una pluralidad de códigos de barras de oligonucleótidos, en donde cada uno de la pluralidad de códigos de barras de oligonucleótidos comprende un marcador molecular y una región de unión a la diana, y en donde por lo menos 10 de la pluralidad de códigos de barras de oligonucleótidos comprenden secuencias de marcadores moleculares diferentes;

una transcriptasa inversa;

una ADN polimerasa que carece de por lo menos una de la actividad de exonucleasa 5' a 3' y actividad de exonucleasa 3' a 5';

cebadores aleatorios; y

un oligonucleótido de cambio de plantilla que comprende la región de unión a la diana, o una parte de la misma.

15. El kit de la reivindicación 14, en donde

(a) la transcriptasa inversa comprende una transcriptasa inversa viral, y opcionalmente la transcriptasa inversa viral es una transcriptasa inversa del virus de la leucemia murina (MLV) o una transcriptasa inversa del virus de la leucemia murina de Moloney (MMLV);

(b) el oligonucleótido de cambio de plantilla comprende uno o más ribonucleótidos 3', opcionalmente tres ribonucleótidos 3', opcionalmente en donde los ribonucleótidos 3' comprenden guanina;

(c) el kit comprende uno o más de etilenglicol, polietilenglicol, 1,2-propanodiol, dimetilsulfóxido (DMSO), glicerol, formamida, 7-deaza-GTP, acetamida, sal de cloruro de tetrametilamonio, betaína, o cualquier combinación de los mismos;

(d) la ADN polimerasa comprende un fragmento de Klenow;

(e) el kit comprende un tampón, un cartucho o ambos;

(f) el kit comprende uno o más reactivos para una reacción de transcripción inversa y/o una reacción de amplificación;

(g) la región de unión a la diana comprende una secuencia específica de gen, una secuencia oligo(dT), un multímero aleatorio o cualquier combinación de los mismos;

(h) el código de barras de oligonucleótidos comprende un marcador de muestra idéntico y/o un marcador celular idéntico, opcionalmente en donde cada marcador de muestra y/o marcador celular de la pluralidad de códigos de barras de oligonucleótidos comprende por lo menos 6 nucleótidos;

(i) cada marcador molecular de la pluralidad de códigos de barras de oligonucleótidos comprende por lo menos 6 nucleótidos;

(j) por lo menos uno de la pluralidad de códigos de barras de oligonucleótidos está inmovilizado o parcialmente inmovilizado en, o encerrado o parcialmente encerrado en, la partícula sintética;

(k) la partícula sintética es perturbable, opcionalmente una partícula de hidrogel perturbable;

(l) la partícula sintética comprende una perla, opcionalmente la perla comprende una perla de sefarosa, una perla de estreptavidina, una perla de agarosa, una perla magnética, una perla conjugada, una perla conjugada con proteína A, una perla conjugada con proteína G una perla conjugada con proteína A/G, una perla conjugada con proteína L, una perla conjugada con oligo(dT), una perla de sílice, una perla similar a la sílice, una microperla antibiotina, una microperla antifluorocromo o cualquier combinación de las mismas;

(m) la partícula sintética comprende un material seleccionado del grupo que consiste en polidimetilsiloxano (PDMS), poliestireno, vidrio, polipropileno, agarosa, gelatina, hidrogel, paramagnético, cerámica, plástico, vidrio, metilestireno, polímero acrílico, titanio, látex, Sefarosa, celulosa, nailon, silicona y cualquier combinación de los mismos; y/o

(n) cada uno de la pluralidad de códigos de barras de oligonucleótidos comprende un grupo funcional conector, en donde la partícula sintética comprende un grupo funcional de soporte sólido, y en donde el grupo funcional de soporte y el grupo funcional conector están asociados entre sí, y opcionalmente el grupo funcional conector y el grupo funcional de soporte se seleccionan individualmente del grupo que consiste en C6, biotina, estreptavidina, aminas primarias, aldehídos, cetonas, y cualquier combinación de los mismos.