ES2906186T3

ES2906186T3 - Método para la preparación de nanoporo y usos del mismo

Info

Publication number: ES2906186T3
Application number: ES13775787T
Authority: ES
Inventors: Jingyue Ju; Shiv Kumar; Chuanjuan Tao; Minchen Chien; James J Russo; John J Kasianovicz; Joseph W F Robertson
Original assignee: Government Of Us Secretary Of Commerce; Columbia University in the City of New York; United States Department of Commerce
Current assignee: Government Of Us Secretary Of Commerce; Columbia University in the City of New York; United States Department of Commerce
Priority date: 2012-04-09
Filing date: 2013-04-08
Publication date: 2022-04-13
Anticipated expiration: 2033-04-08
Also published as: EP2836604A4; US11795191B2; JP6456816B2; CN104379761A; US20150111759A1; US20190309008A1; WO2013154999A2; US10246479B2; WO2013154999A3; EP2836604B1; EP2836604A2; JP2015521030A; CN104379761B; CN107082792A; CA2869753A1

Abstract

Un método para determinar la secuencia de nucleótidos de un ADN o ARN monocatenario, el método comprende: (a) poner en contacto el ADN o ARN monocatenario con un sistema de medida de conductancia que comprende: (i) un primer y segundo compartimento con una primera y segunda solución de electrolito separadas por una barrera física, barrera que tiene al menos un poro con un diámetro en la escala nanométrica; (ii) un medio para aplicar un campo eléctrico a través de la barrera; (iii) un medio para medir un cambio en el campo eléctrico; (iv) al menos una polimerasa unida al poro adyacente a la entrada del poro, y opcionalmente (v) más de una enzima fosfatasa unida al poro y un compuesto que tiene la estructura **(Ver fórmula)** en donde la etiqueta comprende un oligonucleótido, en donde R1 es OH, en donde R2 es H u OH, en donde X es O, NH, S, o CH2, en donde Z es O, S, o BH3, en donde la base es adenina, guanina, citosina, timina o un derivado de una de estas bases, y en donde n es 1, 2, 3, o 4, y opcionalmente en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto, en donde el ADN o ARN monocatenario está en una solución de electrolito en contacto con la polimerasa unida al poro y en donde el ADN o ARN monocatenario tiene un cebador hibridado a una porción del mismo, en condiciones que permiten que la polimerasa catalice la incorporación del compuesto al cebador si es complementario al residuo de nucleótido del ADN o ARN monocatenario que está inmediatamente 5' respecto a un residuo de nucleótido del ADN o ARN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ADN o ARN, en donde si el compuesto no se incorpora, repetir iterativamente el contacto con diferentes compuestos hasta que un compuesto se incorpore, con la condición de que (1) el tipo de base en el compuesto es diferente del tipo de base en cada uno de los compuestos previos, y (2) el tipo de etiqueta en el compuesto es diferente del tipo de etiqueta en cada uno de los compuestos previos, en donde la incorporación del compuesto produce la liberación de un polifosfato que tiene una etiqueta unida al mismo, opcionalmente en donde la enzima fosfatasa unida al poro corta la etiqueta del polifosfato para liberar la etiqueta; (b) determinar qué compuesto se ha incorporado al cebador para formar el producto de extensión de ADN o ARN en la etapa (a) aplicando un campo eléctrico a través de la barrera y midiendo un cambio electrónico a través del poro resultante de la translocación de la etiqueta generada en la etapa (a) a través del poro, y detectar la etiqueta con ayuda de al menos un electrodo, en donde detectar dicha etiqueta con la ayuda del electrodo comprende: (i) pasar una corriente iónica a través de dicha primera solución de electrolito, dicho poro, y dicha segunda solución de electrolito con un potencial eléctrico entre dicha primera y dicha segunda solución de electrolito; (ii) medir la corriente iónica que pasa a través de dicho poro y registrar la duración de cambios en la corriente iónica como una serie temporal de conductancia, en donde dicha serie temporal de conductancia abarca periodos de tiempo cuando dicho poro está sin obstruir por dicha etiqueta y también periodos de tiempo cuando dicha etiqueta produce pulsos de conductancia reducida; y (iii) delinear segmentos de la serie temporal de conductancia en regiones estadísticamente consistentes con el nivel de conductancia de poro sin obstruir, pulsos de conductancia reducida, y segmentos estadísticamente estacionarios en pulsos individuales de conductancia reducida; en donde el cambio electrónico es diferente para cada tipo de etiqueta, identificando de esta manera el residuo de nucleótido en el ADN o ARN monocatenario complementario al compuesto incorporado; y (c) realizar iterativamente las etapas (a) y (b) para cada residuo de nucleótido del ADN o ARN monocatenario que se secuencia, determinando mediante ello la secuencia de nucleótidos del ADN o ARN monocatenario.

Description

DESCRIPCIÓN

Método para la preparación de nanoporo y usos del mismo

Antecedentes

La secuenciación de ácidos nucleicos es el proceso para determinar la base de ácido nucleico de un ácido nucleico. Tal información de secuencia puede ser útil en diagnosticar y/o tratar un sujeto. Por ejemplo, la secuencia de un ácido nucleico de un sujeto se puede usar para identificar, diagnosticar y potencialmente desarrollar tratamientos para enfermedades genéticas. Como otro ejemplo, la investigación en patógenos puede llevar al tratamiento para enfermedades contagiosas.

Hay métodos disponibles que se pueden usar para secuenciar un ácido nucleico. Tales métodos, sin embargo, son caros y pueden no proporcionar información de secuencia en un periodo de tiempo y con una precisión que pueden ser necesarios para diagnosticar y/o tratar un sujeto. Los métodos para secuenciar un ácido nucleico se describen, en las publicaciones de patente WO 01/94609, WO2009/054922, WO2004/071155, US2011/0174625 y WO2011/038241.

Compendio

Los métodos de secuenciación de ácidos nucleicos que implican que una molécula monocatenaria de ácido nucleico pase a través de un nanoporo pueden tener insuficiente sensibilidad. Las bases de ácido nucleico que comprenden la molécula de ácido nucleico (por ejemplo, adenina (A), citosina (C), guanina (G), timina (T) y/o uracilo (U)) pueden no proporcionar una señal suficientemente distinta entre sí. En particular, las purinas (es decir, A y G) son de un tamaño, forma y carga similares entre sí y proporcionan una señal insuficientemente distinta en algunos casos. Además, las pirimidinas (es decir, C, T y U) son de un tamaño, forma y carga similares entre sí y proporcionan una señal insuficientemente distinta en algunos casos. Se reconoce en el presente documento la necesidad de métodos mejorados para la identificación de moléculas de ácido nucleico y secuenciación de ácidos nucleicos.

En un aspecto, la presente invención se refiere a un método para determinar la secuencia de nucleótidos de un ADN o ARN monocatenario, el método comprende:

(a) poner en contacto el ADN o ARN monocatenario con

un sistema de medida de conductancia que comprende: (i) un primer y un segundo compartimento con una primera y una segunda solución de electrolito separadas por una barrera física, barrera que tiene al menos un poro con un diámetro en la escala nanométrica; (ii) un medio para aplicar un campo eléctrico a través de la barrera; (iii) un medio para medir un cambio en el campo eléctrico; (iv) al menos una polimerasa unida al poro adyacente a la entrada del poro, y opcionalmente (v) más de una enzima fosfatasa unida al poro y

un compuesto que tiene la estructura:

en donde la etiqueta comprende un oligonucleótido, en donde Rⁱes OH, en donde R²es H u OH, en donde X es O, NH, S, o CH², en donde Z es O, S, o BH³, en donde la base es adenina, guanina, citosina, timina o un derivado de una de estas bases, y en donde n es 1, 2, 3, o 4, y opcionalmente en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto,

en donde el ADN o ARN monocatenario está en una solución de electrolito en contacto con la polimerasa unida al poro y en donde el ADN o ARN monocatenario tiene un cebador hibridado a una porción del mismo, en condiciones que permiten que la polimerasa catalice la incorporación del compuesto en el cebador si es complementario al residuo de nucleótido del ADN o ARN monocatenario que está inmediatamente 5' respecto a un residuo de nucleótido del ADN o ARN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ADN o ARN,

en donde si el compuesto no se incorpora, repetir iterativamente el contacto con diferentes compuestos hasta que un compuesto se incorpore, con la condición de que (1) el tipo de base en el compuesto es diferente del tipo de base en cada uno de los compuestos previos, y (2) el tipo de etiqueta en el compuesto es diferente del tipo de etiqueta en cada uno de los compuestos previos,

en donde la incorporación del compuesto produce la liberación de un polifosfato que tiene una etiqueta unida al mismo,

opcionalmente, en donde la enzima fosfatasa unida al poro corta la etiqueta del polifosfato para liberar la etiqueta;

(b) determinar qué compuesto se ha incorporado al cebador para formar el producto de extensión de ADN o ARN en la etapa (a) aplicando un campo eléctrico a través de la barrera y midiendo un cambio electrónico a través del poro resultante de la translocación de la etiqueta generada en la etapa (a) a través del poro, y detectar la etiqueta con ayuda de al menos un electrodo, en donde detectar dicha etiqueta con la ayuda del electrodo comprende:

(i) pasar una corriente iónica a través de dicha primera solución de electrolito, dicho poro, y dicha segunda solución de electrolito con un potencial eléctrico entre dicha primera y dicha segunda solución de electrolito; (ii) medir la corriente iónica que pasa a través de dicho poro y registrar la duración de cambios en la corriente iónica como una serie temporal de conductancia, en donde dicha serie temporal de conductancia abarca periodos de tiempo cuando dicho poro está sin obstruir por dicha etiqueta y también periodos de tiempo cuando dicha etiqueta produce pulsos de conductancia reducida; y

(iii) delinear segmentos de la serie temporal de conductancia en regiones estadísticamente consistentes con el nivel de conductancia de poro sin obstruir, pulsos de conductancia reducida, y segmentos estadísticamente estacionarios en pulsos individuales de conductancia reducida;

en donde el cambio electrónico es diferente para cada tipo de etiqueta, identificando de esta manera el residuo de nucleótido en el ADN o ARN monocatenario complementario al compuesto incorporado; y

(c) realizar iterativamente las etapas (a) y (b) para cada residuo de nucleótido del ADN o ARN monocatenario que se secuencia,

determinando mediante ello la secuencia de nucleótidos del ADN o ARN monocatenario.

Un aspecto de la presente divulgación proporciona un método para secuenciar una molécula de ácido nucleico, el método comprende: (a) proporcionar un chip que comprende una pluralidad de nanoporos individualmente direccionables, en donde un nanoporo individualmente direccionable de dicha pluralidad de nanoporos individualmente direccionables comprende un nanoporo en una membrana que está dispuesta adyacente a un electrodo, en donde dicho nanoporo está unido a una ácido nucleico polimerasa, y en donde cada nanoporo individualmente direccionable está adaptado para detectar una etiqueta que se libera de un nucleótido etiquetado tras la polimerización de dicho nucleótido etiquetado; (b) dirigir dicha molécula de ácido nucleico adyacente a o en la proximidad a dicho nanoporo; (c) con la ayuda de dicha polimerasa, polimerizar nucleótidos a lo largo de dicha molécula de ácido nucleico para generar una hebra que es complementaria a al menos una porción de dicha molécula de ácido nucleico, en donde durante la polimerización se libera una etiqueta de un nucleótido individual de dichos nucleótidos, y en donde dicha etiqueta liberada fluye a través o en la proximidad a dicho nanoporo; y (d) detectar la etiqueta con la ayuda de dicho electrodo, en donde la etiqueta se detecta posterior a que se libere de dicho nucleótido individual. En algunos aspectos, dicha detección de (d) además comprende identificar dicha etiqueta. En algunos casos, el método además comprende correlacionar dicha etiqueta identificada con un tipo de dicho nucleótido individual. En algunos casos, el método además comprende generar, con la ayuda de un procesador de ordenador, una secuencia de ácido nucleico de la molécula de ácido nucleico basada en la evaluación de las etiquetas detectadas durante la polimerización.

Otro aspecto de la presente divulgación proporciona un método para secuenciar ácidos nucleicos, el método comprende: (a) ligar una horquilla de ácido nucleico a un extremo de una molécula de ácido nucleico bicatenario; (b) disociar la molécula de ácido nucleico bicatenario y la horquilla para formar un molde de ácido nucleico monocatenario; (c) extender un cebador hibridado al molde de ácido nucleico monocatenario usando nucleótidos etiquetados, en donde una etiqueta asociada con un nucleótido individual se libera tras la extensión; y (d) detectar la etiqueta liberada con la ayuda de un nanoporo, determinando de esta manera la secuencia de ácido nucleico de la molécula de ácido nucleico bicatenario. En algunos casos, el método además comprende dirigir la etiqueta liberada del nucleótido individual a través del nanoporo. En algunos casos, el método además comprende dirigir la etiqueta liberada del nucleótido individual a una localización adyacente al nanoporo.

Otro aspecto de la presente divulgación proporciona un método para secuenciar ácidos nucleicos, el método comprende: (a) polimerizar nucleótidos etiquetados a una primera velocidad, en donde una etiqueta asociada con un nucleótido individual se libera tras la polimerización; y (b) detectar la etiqueta liberada pasando la etiqueta a través de un nanoporo a una segunda velocidad, donde la segunda velocidad es mayor que o igual a la primera velocidad.

Otro aspecto de la presente divulgación proporciona un método para secuenciar ácidos nucleicos, el método comprende: (a) polimerizar nucleótidos etiquetados, en donde una etiqueta asociada con un nucleótido individual se libera tras la polimerización; y (b) detectar la etiqueta liberada con la ayuda de un nanoporo. En algunos casos, el método además comprende dirigir la etiqueta liberada del nucleótido individual a través del nanoporo. En algunos casos, el método además comprende dirigir la etiqueta liberada del nucleótido individual a una localización adyacente al nanoporo.

Otro aspecto de la presente divulgación proporciona un método para secuenciar ácidos nucleicos, que comprende detectar, con ayuda de un nanoporo, la incorporación de un nucleótido a una molécula de ácido nucleico, en donde la molécula de ácido nucleico no pasa a través del nanoporo.

Otro aspecto de la presente divulgación proporciona un método para secuenciar ácidos nucleicos, que comprende detectar un subproducto de un suceso de incorporación de un nucleótido individual con la ayuda de un nanoporo.

Un método para secuenciar una molécula de ácido nucleico, que comprende distinguir entre sucesos de incorporación de nucleótidos individuales con una precisión de más de 4 a.

Otro aspecto de la presente divulgación proporciona un método para secuenciar ácidos nucleicos, el método comprende: (a) proporcionar una matriz de nanoporos, en donde un nanoporo individual en dicha matriz está acoplado a una ácido nucleico polimerasa; y (b) polimerizar nucleótidos etiquetados con la polimerasa, en donde un nucleótido etiquetado individual comprende una etiqueta, y en donde la etiqueta se libera y detecta con la ayuda del nanoporo.

Otro aspecto de la presente divulgación proporciona un nucleótido etiquetado, en donde el nucleótido comprende una etiqueta capaz de ser cortada en un suceso de polimerización del nucleótido y detectarse con la ayuda de un nanoporo en un chip que comprende una matriz de nanoporos.

Otro aspecto de la presente divulgación proporciona un sistema para secuenciar una molécula de ácido nucleico, que comprende: (a) un chip que comprende una pluralidad de nanoporos individualmente direccionables, en donde un nanoporo individualmente direccionable de dicha pluralidad de nanoporos individualmente direccionables comprende al menos un nanoporo en una membrana dispuesta adyacente a un electrodo, en donde cada nanoporo individualmente direccionable está adaptado para ayudar en la detección de una etiqueta liberada de un nucleótido etiquetado tras la incorporación de dicho nucleótido etiquetado en una hebra de ácido nucleico que es complementaria a dicha molécula de ácido nucleico; y (b) un procesador de ordenador acoplado a dichos nanoporos individualmente direccionables, en donde dicho procesador de ordenador está programado para ayudar en caracterizar una secuencia de ácido nucleico de dicha molécula de ácido nucleico basado en señales eléctricas recibidas de dicha pluralidad de nanoporos individualmente direccionables, en donde una señal eléctrica individual está asociada con una etiqueta que se libera de un nucleótido etiquetado después de la incorporación de dicho nucleótido etiquetado en una hebra de ácido nucleico que es complementaria a dicha molécula de ácido nucleico.

Otro aspecto de la presente divulgación proporciona un método para secuenciar una molécula de ácido nucleico, el método comprende proporcionar una matriz de sitios individualmente direccionables a una densidad de al menos aproximadamente 50o sitios por mm2, cada sitio tiene un nanoporo unido a una ácido nucleico polimerasa, y, en un sitio determinado de la matriz, polimerizar nucleótidos etiquetados con una polimerasa, en donde tras la polimerización una etiqueta se libera y detecta por un nanoporo en el sitio determinado. En algunos casos, el método además comprende dirigir la generación, con ayuda de un procesador, de una secuencia de ácido nucleico de la molécula de ácido nucleico basado en las etiquetas detectadas.

Otro aspecto de la presente divulgación proporciona un sistema de medida de la conductancia que comprende: (a) un primer y un segundo compartimento con una primera y una segunda solución de electrolito separados por una barrera física, barrera que tiene al menos un poro con diámetro en la escala nanométrica; (b) un medio para aplicar un campo eléctrico a través de la barrera; (c) un medio para medir un cambio en el campo eléctrico; (d) al menos una polimerasa unida al poro; y (e) más de una enzima fosfatasa unida al poro.

Otro aspecto de la presente divulgación proporciona un compuesto que tiene la estructura:

en donde la etiqueta comprende uno o más de etilenglicol, un aminoácido, un hidrato de carbono, un péptido, un colorante, un compuesto quimioluminiscente, un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, un hexanucleótido, un ácido alifático, un ácido aromático, un alcohol, un grupo tiol, un grupo ciano, un grupo nitro, un grupo alquilo, un grupo alquenilo, un grupo alquinilo, un grupo azido, o una combinación de los mismos, en donde Rⁱes OH, en donde R²es H u OH, en donde X es O, NH, S, o CH², en donde Z es O, S, o BH³, en donde la base es adenina, guanina, citosina, timina, uracilo o un derivado de una de estas bases, y en donde n es 1, 2, 3, o 4, y en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto.

Otro aspecto de la presente divulgación proporciona una composición que comprende cuatro tipos diferentes de un compuesto que tiene la estructura:

en donde la etiqueta comprende uno o más de etilenglicol, un aminoácido, un hidrato de carbono, un péptido, un colorante, un compuesto quimioluminiscente, un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, un hexanucleótido, un ácido alifático, un ácido aromático, un alcohol, un grupo tiol, un grupo ciano, un grupo nitro, un grupo alquilo, un grupo alquenilo, un grupo alquinilo, un grupo azido, o una combinación de los mismos, en donde R¹es OH, en donde R²es H u OH, en donde X es O, NH, S, o CH², en donde Z es O, S, o BH³, en donde n es 1, 2, 3, o 4, en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto, en donde la base de un primer tipo de compuesto es adenina o un derivado de la misma, la base de un segundo tipo de compuesto es guanina o un derivado de la misma, la base de un tercer tipo de compuesto es citosina o un derivado de la misma, y la base de un cuarto tipo de compuesto es timina o un derivado de la misma o uracilo o un derivado del mismo, y en donde la etiqueta en cada tipo de compuesto es diferente de la etiqueta en cada uno de los otros tres tipos de compuesto.

En algunos casos, la composición además comprende un quinto tipo de compuesto que se diferencia de cada uno de los cuatro tipos de compuesto en la base y en la etiqueta, en donde la base del quinto tipo de compuesto es uracilo o un derivado del mismo si la base del cuarto tipo de compuesto es timina o un derivado de la misma, o en donde la base del quinto tipo de compuesto es timina o un derivado de la misma si la base del cuarto tipo de compuesto es uracilo o un derivado del mismo.

Otro aspecto de la presente divulgación proporciona un método para determinar la identidad de un compuesto que comprende: (a) poner en contacto el compuesto con un sistema de medida de la conductancia que comprende: (i) un primer y un segundo compartimento con una primera y una segunda solución de electrolito separados por una barrera física, barrera que tiene al menos un poro con diámetro en la escala nanométrica; (ii) un medio para aplicar un campo eléctrico a través de la barrera; (iii) un medio para medir un cambio en el campo eléctrico; y (b) registrar el cambio en el campo eléctrico cuando el compuesto se transloca a través del poro en donde el cambio en el campo eléctrico es el resultado de la interacción entre el compuesto, el electrolito, y el poro, y es indicativo del tamaño, carga, y composición del compuesto, permitiendo de esta manera una correlación entre el cambio y valores predeterminados para determinar la identidad del compuesto. En algunos casos, el método además comprende una etapa de tratar el compuesto con una enzima fosfatasa antes de la etapa (a).

Otro aspecto de la presente divulgación proporciona un método para determinar si un compuesto es una etiqueta o un precursor de la etiqueta que comprende: (a) poner en contacto el compuesto con un sistema de medida de la conductancia que comprende: (i) un primer y un segundo compartimento con una primera y una segunda solución de electrolito separados por una barrera física, barrera que tiene al menos un poro con diámetro en la escala nanométrica; (ii) un medio para aplicar un campo eléctrico a través de la barrera; (iii) un medio para medir un cambio en el campo eléctrico; (b) registrar el cambio en el campo eléctrico cuando el compuesto se transloca a través del poro; y (c) comparar el cambio en el campo eléctrico con valores predeterminados correspondientes a la etiqueta y al precursor de la etiqueta, determinando de esta manera si el compuesto es la etiqueta o el precursor de la misma. En algunos casos, el método además comprende una etapa de ajustar el sesgo de la corriente del campo eléctrico en la etapa (a).

Otro aspecto de la presente divulgación proporciona un método para determinar la secuencia de nucleótidos de un ADN monocatenario, método que comprende: (a) poner en contacto el ADN monocatenario con un sistema de medida de la conductancia que comprende: (i) un primer y un segundo compartimento con una primera y una segunda solución de electrolito separados por una barrera física, barrera que tiene al menos un poro con diámetro en la escala nanométrica; (ii) un medio para aplicar un campo eléctrico a través de la barrera; (iii) un medio para medir un cambio en el campo eléctrico; (iv) al menos una polimerasa unida al poro; y (v) más de una enzima fosfatasa unida al poro, y una composición que comprende cuatro tipos diferentes de un compuesto que tiene la estructura:

en donde la etiqueta comprende uno o más de etilenglicol, un aminoácido, un hidrato de carbono, un péptido, un colorante, un compuesto quimioluminiscente, un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, un hexanucleótido, un ácido alifático, un ácido aromático, un alcohol, un grupo tiol, un grupo ciano, un grupo nitro, un grupo alquilo, un grupo alquenilo, un grupo alquinilo, un grupo azido, o una combinación de los mismos, en donde R¹es OH, en donde R²es H u OH, en donde X es O, NH, S, o CH², en donde Z es O, S, o BH³, en donde n es 1,2, 3, o 4, en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto, en donde la base de un primer tipo de compuesto es adenina o un derivado de la misma, la base de un segundo tipo de compuesto es guanina o un derivado de la misma, la base de un tercer tipo de compuesto es citosina o un derivado de la misma, y la base de un cuarto tipo de compuesto es timina o un derivado de la misma, y en donde la etiqueta en cada tipo de compuesto es diferente de la etiqueta en cada uno de los otros tres tipos de compuesto, en donde el ADN monocatenario está en una solución de electrolito en contacto con la polimerasa unida al poro y en donde el ADN monocatenario tiene un cebador hibridado a una porción del mismo, en condiciones que permiten que la polimerasa catalice la incorporación de uno de los compuestos en el cebador si el compuesto es complementario al residuo de nucleótido del a Dn monocatenario inmediatamente 5' respecto a un residuo de nucleótido del ADN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ADN, en donde la incorporación del compuesto produce la liberación de un polifosfato que tiene la etiqueta unida al mismo; (b) determinar qué compuesto se ha incorporado al cebador para formar el producto de extensión de ADN en la etapa (a) aplicando un campo eléctrico a través de la barrera y midiendo un cambio electrónico a través del poro resultante de que la etiqueta generada en la etapa (a) se transloca a través del poro, en donde el cambio electrónico es diferente para cada tipo de etiqueta, identificando de esta manera el residuo de nucleótido en el ADN monocatenario complementario al compuesto incorporado; y (c) realizar repetidamente la etapa (b) para cada residuo de nucleótido del ADN monocatenario que se secuencia, determinando de esta manera la secuencia de nucleótidos del ADN monocatenario.

Otro aspecto de la presente divulgación proporciona un método para determinar la secuencia de nucleótidos de un ADN monocatenario, el método comprende: (a) poner en contacto el ADN monocatenario con un sistema de medida de la conductancia que comprende: (i) un primer y un segundo compartimento con una primera y una segunda solución de electrolito separados por una barrera física, barrera que tiene al menos un poro con diámetro en la escala nanométrica; (ii) un medio para aplicar un campo eléctrico a través de la barrera; (iii) un medio para medir un cambio en el campo eléctrico; (iv) al menos una polimerasa unida al poro; y (v) más de una enzima fosfatasa unida al poro, y un compuesto que tiene la estructura:

en donde la etiqueta comprende uno o más de etilenglicol, un aminoácido, un hidrato de carbono, un péptido, un colorante, un compuesto quimioluminiscente, un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, un hexanucleótido, un ácido alifático, un ácido aromático, un alcohol, un grupo tiol, un grupo ciano, un grupo nitro, un grupo alquilo, un grupo alquenilo, un grupo alquinilo, un grupo azido, o una combinación de los mismos, en donde R¹es OH, en donde R²es H u OH, en donde X es O, NH, S, o CH², en donde Z es O, S, o BH³, en donde la base es adenina, guanina, citosina, timina, o un derivado de una de estas bases, en donde n es 1, 2, 3, o 4, y en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto, en donde el ADN monocatenario está en una solución de electrolito en contacto con la polimerasa unida al poro y en donde el ADN monocatenario tiene un cebador hibridado a una porción del mismo, en condiciones que permiten que la polimerasa catalice la incorporación del compuesto en el cebador si es complementario al residuo de nucleótido del ADN monocatenario inmediatamente 5' respecto a un residuo de nucleótido del ADN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ADN, en donde si el compuesto no se incorpora, repetir iterativamente el contacto con diferentes compuestos hasta que un compuesto se incorpore, con la condición de que (1) el tipo de base en el compuesto es diferente del tipo de base en cada uno de los compuestos previos, y (2) el tipo de etiqueta en el compuesto es diferente del tipo de etiqueta en cada uno de los compuestos previos, en donde la incorporación del compuesto produce la liberación de un polifosfato que tiene la etiqueta unida al mismo, en donde la enzima fosfatasa unida al poro corta la etiqueta del polifosfato para liberar la etiqueta; (b) determinar qué compuesto se ha incorporado al cebador para formar el producto de extensión de ADN en la etapa (a) aplicando un campo eléctrico a través de la barrera y midiendo un cambio electrónico a través del poro resultante de que la etiqueta generada en la etapa (a) se transloca a través del poro, en donde el cambio electrónico es diferente para cada tipo de etiqueta, identificando de esta manera el residuo de nucleótido en ADN monocatenario complementario al compuesto incorporado; y (c) realizar iterativamente las etapas (a) y (b) para cada residuo de nucleótido del ADN monocatenario que se secuencia, determinando de esta manera la secuencia de nucleótidos del ADN monocatenario.

Otro aspecto de la presente divulgación proporciona un método para determinar la secuencia de nucleótidos de un ARN monocatenario, método que comprende: (a) poner en contacto el ARN monocatenario con un sistema de medida de la conductancia que comprende: (i) un primer y un segundo compartimento con una primera y una segunda solución de electrolito separados por una barrera física, barrera que tiene al menos un poro con diámetro en la escala nanométrica; (ii) un medio para aplicar un campo eléctrico a través de la barrera; (iii) un medio para medir un cambio en el campo eléctrico; (iv) al menos una polimerasa unida al poro; y (v) más de una enzima fosfatasa unida al poro, y una composición que comprende cuatro tipos diferentes de un compuesto que tiene la estructura:

en donde la etiqueta comprende uno o más de etilenglicol, un aminoácido, un hidrato de carbono, un péptido, un colorante, un compuesto quimioluminiscente, un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, un hexanucleótido, un ácido alifático, un ácido aromático, un alcohol, un grupo tiol, un grupo ciano, un grupo nitro, un grupo alquilo, un grupo alquenilo, un grupo alquinilo, un grupo azido, o una combinación de los mismos, en donde Rⁱes OH, en donde R²es H u OH, en donde X es O, NH, S, o CH², en donde Z es O, S, o BH³, en donde n es 1,2, 3, o 4, en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto, en donde la base de un primer tipo de compuesto es adenina o un derivado de la misma, la base de un segundo tipo de compuesto es guanina o un derivado de la misma, la base de un tercer tipo de compuesto es citosina o un derivado de la misma, y la base de un cuarto tipo de compuesto es uracilo o un derivado del mismo, y en donde la etiqueta en cada tipo de compuesto es diferente de la etiqueta en cada uno de los otros tres tipos de compuesto, en donde el ARN monocatenario está en una solución de electrolito en contacto con la polimerasa unida al poro y en donde el ARN monocatenario tiene un cebador hibridado a una porción del mismo, en condiciones que permiten que la polimerasa catalice la incorporación de uno de los compuestos en el cebador si el compuesto es complementario al residuo de nucleótido del a Rn monocatenario inmediatamente 5' respecto a un residuo de nucleótido del ARN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ARN, en donde la incorporación del compuesto produce la liberación de un polifosfato que tiene la etiqueta unida al mismo, en donde la enzima fosfatasa unida al poro corta la etiqueta del polifosfato para liberar la etiqueta; (b) determinar qué compuesto se ha incorporado al cebador para formar el producto de extensión de ARN en la etapa (a) aplicando un campo eléctrico a través de la barrera y midiendo un cambio electrónico a través del poro resultante de que la etiqueta generada en la etapa (a) se transloca a través del poro, en donde el cambio electrónico es diferente para cada tipo de etiqueta, identificando de esta manera el residuo de nucleótido en el ARN monocatenario complementario al compuesto incorporado; y (c) realizar repetidamente la etapa (b) para cada residuo de nucleótido del ARN monocatenario que se secuencia, determinando de esta manera la secuencia de nucleótidos del ARN monocatenario.

Otro aspecto de la presente divulgación proporciona un método para determinar la secuencia de nucleótidos de un ARN monocatenario, el método comprende: (a) poner en contacto el ARN monocatenario con un sistema de medida de la conductancia que comprende: (i) un primer y un segundo compartimento con una primera y una segunda solución de electrolito separados por una barrera física, barrera que tiene al menos un poro con diámetro en la escala nanométrica; (ii) un medio para aplicar un campo eléctrico a través de la barrera; (iii) un medio para medir un cambio en el campo eléctrico; (iv) al menos una polimerasa unida al poro; y (v) más de una enzima fosfatasa unida al poro, y un compuesto que tiene la estructura:

en donde la etiqueta comprende uno o más de etilenglicol, un aminoácido, un hidrato de carbono, un péptido, un colorante, un compuesto quimioluminiscente, un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, un hexanucleótido, un ácido alifático, un ácido aromático, un alcohol, un grupo tiol, un grupo ciano, un grupo nitro, un grupo alquilo, un grupo alquenilo, un grupo alquinilo, un grupo azido, o una combinación de los mismos, en donde R¹es OH, en donde R²es H u OH, en donde X es O, NH, S, o CH², en donde Z es O, S, o BH³, en donde la base es adenina, guanina, citosina, uracilo, o un derivado de una de estas bases, en donde n es 1,2, 3, o 4, y en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto, en donde el ARN monocatenario está en una solución de electrolito en contacto con la polimerasa unida al poro y en donde el ARN monocatenario tiene un cebador hibridado a una porción del mismo, en condiciones que permiten que la polimerasa catalice la incorporación del compuesto en el cebador si es complementario al residuo de nucleótido del ARN monocatenario inmediatamente 5' respecto a un residuo de nucleótido del ADN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ARN, en donde si el compuesto no se incorpora, repetir iterativamente el contacto con diferentes compuestos hasta que un compuesto se incorpore, con la condición de que (1) el tipo de base en el compuesto es diferente del tipo de base en cada uno de los compuestos previos, y (2) el tipo de etiqueta en el compuesto es diferente del tipo de etiqueta en cada uno de los compuestos previos, en donde la incorporación del compuesto produce la liberación de un polifosfato que tiene la etiqueta unida al mismo, en donde la enzima fosfatasa unida al poro corta la etiqueta del polifosfato para liberar la etiqueta; (b) determinar qué compuesto se ha incorporado al cebador para formar el producto de extensión de ARN en la etapa (a) aplicando un campo eléctrico a través de la barrera y midiendo un cambio electrónico a través del poro resultante de que la etiqueta generada en la etapa (a) se transloca a través del poro, en donde el cambio electrónico es diferente para cada tipo de etiqueta, identificando de esta manera el residuo de nucleótido en el ARN monocatenario complementario al compuesto incorporado; y (c) realizar iterativamente las etapas (a) y (b) para cada residuo de nucleótido del ARN monocatenario que se secuencia, determinando de esta manera la secuencia de nucleótidos del ARN monocatenario.

Otro aspecto de la presente divulgación proporciona un sistema de medida de la conductancia que comprende: (a) una barrera eléctricamente resistente que separa al menos una primera y una segunda solución de electrolito; (b) dicha barrera eléctricamente resistente comprende al menos un poro con un diámetro en la escala nanométrica; (c) al menos un compuesto con una etiqueta en al menos una de dichas primera y segunda soluciones de electrolito; (d) dicho al menos un poro está configurado para permitir que una corriente iónica sea conducida a través de dichas primera y segunda soluciones de electrolito por un potencial aplicado; (e) dicho al menos un poro comprende un rasgo configurado para cortar la etiqueta del compuesto para liberar la etiqueta; y (f) un medio de medir la corriente iónica y un medio de registrar su evolución temporal como una serie temporal, incluyendo periodos de tiempo cuando el al menos un poro está sin obstruir por la etiqueta y también periodos de tiempo cuando la etiqueta produce pulsos de conductancia reducida. En algunos casos, la etiqueta tiene un tiempo de residencia en el poro que es mayor que las limitaciones del ancho de banda de la corriente iónica y el ruido de descarga de la corriente de dicho medio de medir la corriente iónica.

Otro aspecto de la presente divulgación proporciona un método para delinear segmentos de una serie temporal de conductancia en regiones estadísticamente consistentes con el nivel de conductancia del poro sin obstruir, y pulsos de conductancia reducida, y también segmentos estadísticamente estacionarios en pulsos individuales de conductancia reducida, dicha serie temporal de conductancia se genera con un sistema de medida de conductancia que comprende: una barrera eléctricamente resistente que separa al menos una primera y una segunda solución de electrolito; dicha barrera eléctricamente resistente comprende al menos un poro con un diámetro en la escala nanométrica; al menos un compuesto con una etiqueta en al menos una de dichas primera y segunda soluciones de electrolito; dicho al menos un poro está configurado para permitir que una corriente iónica sea conducida a través de dichas primera y segunda soluciones de electrolito por un potencial aplicado; dicho al menos un poro comprende un rasgo configurado para cortar la etiqueta del compuesto para liberar la etiqueta; y un medio de medir la corriente iónica y un medio de registrar dicha serie temporal de conductancia, incluyendo periodos de tiempo cuando el al menos un poro está sin obstruir por dicha etiqueta y también periodos de tiempo cuando la etiqueta produce pulsos de conductancia reducida; dicho método para delinear segmentos de una serie temporal de conductancia se selecciona del grupo que consiste en: (a) una decodificación de Viterbi de la secuencia del estado de probabilidad máxima de una densidad continua de un modelo oculto de Markov estimado de la serie temporal de conductancia sin procesar; (b) una delineación de las regiones de pulsos de conductancia reducida a través de la comparación a un umbral para la desviación del nivel de conductancia del poro abierto; y (c) un medio para caracterizar pulsos de conductancia reducida estimando las tendencias centrales de los niveles de la corriente iónica para cada segmento, o por medida de las tendencias centrales y duración de los segmentos juntos, la medida de la tendencia central del segmento se selecciona del grupo que consiste en; (i) un parámetro medio de un componente gaussiano de un primer GMM estimado de la serie temporal de conductancia como parte de un modelo oculto de Markov de densidad continua; (ii) una media aritmética; (iii) una media truncada; (iv) una mediana; y (v) un estimador de máximo a posteriori de la localización de la muestra, o un estimador de la probabilidad máxima de la localización de la muestra.

En algunos casos, el método además comprende al menos uno: (a) un estimado de probabilidad máxima de un segundo modelo de mezcla gaussiano basado en las medidas de la tendencia central de los segmentos de conductancia; (b) un pico que se encuentra por medio de interpolación y alisado de la densidad de probabilidad empírica de los estimados de las tendencias centrales de los segmentos de la serie temporal de conductancia y que encuentra raíces de las derivadas de las funciones de interpolación; y (c) otro medio de localizar los modos de estimador de distribución multimodal.

Otro aspecto de la presente divulgación proporciona un método para determinar al menos un parámetro de un compuesto en una solución que comprende las etapas de: colocar un primer fluido en un primer depósito; colocar un segundo fluido en un segundo depósito; al menos uno de dicho primer y dicho segundo fluido comprende al menos un compuesto, en donde el compuesto es un nucleótido etiquetado o una etiqueta cortada de un nucleótido etiquetado; dicho primer fluido en dicho primer depósito está separado de dicho segundo fluido en dicho segundo depósito con una barrera eléctricamente resistente; dicha barrera eléctricamente resistente comprende al menos un poro; pasar una corriente iónica a través de dicho primer fluido, dicho al menos un poro y dicho segundo fluido con un potencial eléctrico entre dicho primer y dicho segundo fluido; medir la corriente iónica que pasa a través de dicho al menos un poro y la duración de los cambios en la corriente iónica; la medida de corriente iónica se puede llevar a cabo durante un periodo de tiempo suficiente para medir una reducción en la corriente iónica producida por el compuesto que interacciona con dicho al menos un poro; y determinar al menos un parámetro del compuesto analizando matemáticamente los cambios en la corriente iónica y la duración de los cambios en la corriente iónica durante el periodo de tiempo; dicho análisis matemático comprende al menos una etapa seleccionada del grupo que consiste en: (a) un parámetro medio de un componente gaussiano de un primer GMM estimado de la serie temporal de conductancia como parte de un modelo oculto de Markov de densidad continua; (b) extracción de media de sucesos; (c) asignación de estado de sucesos de probabilidad máxima; (d) detección de umbral y promedio; (e) análisis de ventana deslizante; (f) una media aritmética; (g) una media truncada; (h) una mediana; e (i) un estimador de máximo a posteriori de la localización de la muestra, o un estimador de la probabilidad máxima de la localización de la muestra.

Otro aspecto de la presente divulgación proporciona un nucleótido etiquetado, en donde el nucleótido comprende una etiqueta que puede ser cortada en un suceso de polimerización de nucleótidos y detectada con la ayuda de un nanoporo.

Un aspecto adicional de la presente divulgación proporciona un método para secuenciar ácidos nucleicos, el método comprende proporcionar una matriz de sitios individualmente direccionables, cada sitio tiene un nanoporo unido a una ácido nucleico polimerasa, y, en un sitio determinado de dicha matriz, polimerizar nucleótidos etiquetados con una polimerasa, en donde una etiqueta se libera y detecta por un nanoporo en dicho sitio determinado.

Breve descripción de los dibujos

La figura 1 muestra esquemáticamente las etapas del método.

Las figuras 2A, 2B y 2C muestran ejemplos de detectores de nanoporos, donde la figura 2A tiene el nanoporo dispuesto sobre el electrodo, la figura 2B tiene el nanoporo insertado en una membrana sobre un pocillo y la figura 2C tiene el nanoporo sobre un electrodo sobresaliente.

La figura 3 ilustra un método para secuenciar ácidos nucleicos.

La figura 4 muestra un ejemplo de una señal generada por el paso de etiquetas a través de un nanoporo.

La figura 5 muestra una matriz de detectores de nanoporos.

La figura 6 muestra un ejemplo de una molécula etiqueta unida al fosfato de un nucleótido.

La figura 7 muestra ejemplos de localizaciones de etiqueta alternativas.

La figura 8 muestra un ejemplo de nucleótidos etiquetados.

La figura 9 muestra ETIQUETA-polifosfato detectable y ETIQUETA detectable.

La figura 10 muestra un método para preparar una hebra molde.

La figura 11 muestra una configuración de chip ejemplar que comprende un nanoporo.

La figura 12 muestra una configuración de matriz de célula de chip de prueba ejemplar.

La figura 13 muestra circuitería analógica de célula ejemplar.

Las figuras 14A y 14B muestran ejemplos de circuitos ultracompactos.

La figura 15 muestra un ejemplo de síntesis de análogos de nucleótidos cumarina-PEG-dG4P.

La figura 16 muestra un ejemplo de caracterización de las etiquetas liberadas por MALDI-TOF MS; las etiquetas cumarina-PEG-NH²generadas por hidrólisis ácida de cumarina-PEG16-dG4P que da cumarina-PEG16-NH²(azul), cumarina-PEG20-dG4P que da cumarina-PEG20-NH²(verde), cumarina-PEG24-dG4P que da cumarina-PEG24-NH²(naranja) y cumarina-PEG36-dG4P que da cumarina-PEG36-NH²(rojo), son idénticas a las correspondientes etiquetas liberadas generadas en reacciones de extensión por polimerasa después de tratamiento con fosfatasa alcalina, como se muestra por análisis de MALDI-TOF-MS; una imagen compuesta de cuatro espectros de MS obtenidos por separado; se muestran las estructuras de las etiquetas de cumarina-PEG-NH².

La figura 17 muestra un ejemplo de discriminación de etiquetas liberadas en nanoporos de proteína a nivel de detección de molécula única; cuatro compuestos cumarina-PEGn-NH (n = 16, 20, 24 y 36), derivados de los cuatro nucleótidos comparables por hidrólisis ácida, se juntaron y diluyeron en KCl 4 M, Tris 10 mM, pH 7,2 para medida de nanoporo; (Izquierda) los datos de la serie temporal indican que cuando estas etiquetas de PEG entran un único canal iónico de a-hemolisina, producen bloqueos de corriente que son característicos de su tamaño; a la derecha un histograma del bloqueo de corriente medio causado por moléculas individuales muestra resolución basal con un ancho de banda de medida de 10 kHz; las barras coloreadas arriba representan la distribución 6 a de los datos (asumiendo distribuciones gaussianas para cada una de las cuatro etiquetas de PEG que pueden representar cada uno de los cuatro nucleótidos de ADN), lo que sugiere que se puede discriminar una única base con una precisión mejor que 1 en 300.000 sucesos, representado en esta figura usando designaciones A, C, G y T, que se pueden producir cuando los cuatro nucleótidos diferentes con cuatro PEG de longitud diferente se usan para secuenciar ADN.

La figura 18 muestra un sistema informático configurado para controlar un secuenciador.

La figura 19 muestra un histograma de lecturas de corriente de célula.

La figura 20 muestra un gráfico de corriente medida en pico-amperios frente al tiempo medido en segundos para 4 etiquetas diferentes.

La figura 21 muestra el autoensamblaje de la proteína a-hemolisina en una bicapa lipídica para formar un canal iónico y un tramo de ácido nucleico pasa a través (arriba), con las correspondientes firmas electrónicas generadas (abajo) (Vercouture et al. 2001 y Deamer et al. 2002).

La figura 22 muestra estructuras de nucleótidos desoxirribonucleótido adenosina trifosfato, desoxirribonucleótido guanosina trifosfato, desoxirribonucleótido citosina trifosfato, y desoxirribonucleótido timidina trifosfato.

La figura 23 muestra estructuras de cuatro nucleósidos-5'-polifosfato etiquetados en fosfato.

La figura 24 muestra la síntesis de nucleósidos-5'-trifosfatos etiquetados en fosfato.

La figura 25 muestra la síntesis de nucleósidos-5'-tetrafosfatos etiquetados en fosfato.

La figura 26 muestra la síntesis de nucleósidos-5'-pentafosfatos etiquetados en fosfato terminal.

La figura 27 muestra a) unión oligo-3' a 5'-fosfato, b) unión oligo-5' a 5'-fosfato, c) fracción detectable después de la reacción de la polimerasa.

La figura 28(A) muestra la síntesis de nucleósidos-5'-trifosfato de base modificada.

La figura 28(B) muestra el corte de nucleósidos-5'-trifosfato de base modificada con TCEP.

La figura 29 muestra la síntesis de nucleósidos-5'-trifosfato 3'-0-modificados; (A) dNTP unidos a 3'-0-2-nitrobencilo; (B) dNTP unidos a 3'-0-azidometilo; (C) fracción detectable después de la extensión con polimerasa y corte con TCEP; y (D) fracción detectable después de la extensión con polimerasa y corte con UV.

La figura 30 muestra la reacción de extensión de ADN usando análogos de nucleótidos modificados en fosfato. La figura 31 muestra la reacción de extensión de ADN usando análogos de nucleótidos etiquetados en la base. La figura 32 muestra la reacción de extensión de ADN usando análogos de nucleótidos marcados en 2'- o 3'-OH.

La figura 33 muestra un esquema de la secuenciación de ADN por nanoporo con nucleótidos modificados, particularmente aplicable a secuenciación en tiempo real de molécula única que implica la adición de todos los 4 nucleótidos y polimerasa al mismo tiempo para entrar en contacto con la molécula de molde única.

La figura 34 muestra nucleósidos fosfato modificados en fosfato, base, 2' y 3' con posibles enlazadores y etiquetas; BASE = adenina, guanina, timina, citosina, uracilo, 5-metil C, 7-deaza-A, 7-deaza-G o sus derivados de los mismos; R¹y R²= H, OH, F, NH², N³, u OR'; n = 1-5; A = O, S, CH², CHF, CFF, NH; Z = O, S, BH³; X = enlazador que une fosfato o el 2'-O o 3'-O o la base a la fracción detectable y puede contener O, N, o S, átomos de P (el enlazador también puede ser una fracción detectable, directa o indirectamente, tal como aminoácidos, péptidos, proteínas, hidratos de carbono, PEG de diferente longitud y peso molecular, colorantes orgánicos o inorgánicos, colorantes fluorescentes o fluorogénicos, fármacos, oligonucleótidos, etiquetas de masa, etiquetas quimioluminiscentes y puede contener cargas positivas o negativas); Y = etiquetas o fracción detectable, tal como compuestos alifáticos u orgánicos aromáticos con uno o más anillos, colorantes, proteínas, hidratos de carbono, PEG de diferente longitud y peso molecular, fármacos, oligonucleótidos, etiquetas de masa, etiquetas fluorescentes, etiquetas quimioluminiscentes y pueden contener cargas positivas o negativas.

La figura 35 muestra estructuras de nucleótidos marcados con PEG-fosfato y ejemplos de posibles PEG con diferentes grupos reactivos para reaccionar con grupos funcionales.

La figura 36 muestra ejemplos no limitantes, específicos de grupos reactivos en los fosfatos terminales, que también pueden estar unidos con cambios apropiados a una fracción de base de nucleósido, y grupos con los que los grupos pueden reaccionar para formar etiquetas.

La figura 37 muestra un esquema de matriz de nanoporos para secuenciación por síntesis de ADN paralela masiva. La figura 38 muestra la síntesis de nucleótidos marcados con PEG-fosfato.

La figura 39 muestra espectros de masa MALDI-TOF de los productos de extensión de ADN generados por incorporación de los análogos de nucleótidos marcados con PEG-fosfato (dG4P-PEG); los productos individuales mostrados en los espectros indican que el dG4P-PEG24 y dG4P-PEG37 se incorporan a una eficacia de casi el 100%. La figura 40 muestra las distribuciones de profundidad de bloqueo relativas para nanoporo de a-hemolisina en presencia de PEG que contienen 49, 37, 24 o 16 monómeros de óxido de etileno a potencial aplicado de 40 mV; las cuatro especies se identifican fácilmente.

La figura 41 muestra (A) separación y distribución de masa de unidades mixtas de poli (etilenglicol) (PEG) a través de un único nanoporo; y (B) selección de 4 unidades de PEG distintas con separación de línea base como etiquetas para las cuatro bases, A, C, G, y T; también se muestra las estructuras de los PEG lineales y ramificados.

La figura 42 muestra la síntesis de PEG-trifosfatos cargados (la carga se puede ajustar basado en los requisitos). La figura 43 muestra la síntesis nucleósidos-5'-trifosfato etiquetados en fosfato.

La figura 44 muestra la síntesis nucleósidos-5'-tetrafosfato etiquetados en fosfato.

La figura 45 muestra la síntesis nucleósidos-5'-pentafosfato etiquetados en fosfato terminal.

La figura 46 muestra la plataforma de medida de nanoporo integrada en CMOS: (A) una micrografía del chip preamplificador de CMOS de ocho canales con una imagen de un canal amplificador con el electrodo del lado cis integrado; (B) diagrama que muestra la integración de dos chip con un nanoporo de estado sólido; (C) diagrama que muestra la sección transversal del chip y cómo el nanoporo se graba directamente en el chip en una implementación de un chip; el empaquetamiento se produce con un pocillo independiente en el lado cis; y una imagen de MET de un nanoporo de 3,5 nm de diámetro.

La figura 47 muestra el rendimiento eléctrico de la electrónica de nanoporo integrada en CMOS (A) espectro de ruido de corriente basal referido a la entrada para Cf = 0,15 pF, filtro Bessel de 4 polos 1 MHz, f^s= 4 MS/s. También se muestra la toma de señal abierta medida en un Axopatch 200B en modo célula entera con p = 1, filtro Bessel de 4 polos 100 kHz, f^s= 250 kS/s (B) ruido de fondo del nuevo amplificador con un nanoporo unido comparado con el mismo nanoporo medido por el Axopatch 200B.

La figura 48 muestra el anclaje de la polimerasa en la vecindad del nanoporo; un pocillo ayuda a restringir la difusión; L indica la distancia crítica desde la abertura del poro a la que los movimientos moleculares debido a difusión y electroforesis son iguales.

La figura 49 muestra la síntesis de nucleósidos-5'-polifosfato marcados con etiqueta.

La figura 50 muestra la síntesis de PEG-nucleótidos 3'-0-bloqueados.

La figura 51 muestra la secuenciación por síntesis con PEG-nucleótidos y detección por nanoporo (muchas copias de la misma molécula de ADN inmovilizadas en una perla y adición de un PEG-nucleótido cada vez); usar el mismo PEG unido a todos los cuatro nucleótidos; añadir un PEG-nucleótido cada vez, lee al menos una base por ciclo si se incorpora el nucleótido correcto.

La figura 52 muestra la secuenciación por síntesis con PEG-nucleótidos 3'-0-bloqueados y detección por nanoporo (muchas copias de la misma molécula de ADN inmovilizadas en una perla y adición de los cuatro PEG-nucleótidos 3'-O-bloqueados al mismo tiempo); añadir todos los cuatro nucleótidos unidos a PEG de diferente tamaño, 3'-bloqueados (dNTP-PEG 3'-bloqueados) juntos; detección del nucleótido incorporado basado en la señal de bloqueo de los PEG liberados; el grupo 3'-bloqueante se elimina por tratamiento con TECP y sigue el ciclo para secuenciar correctamente el molde incluyendo regiones homopoliméricas.

La figura 53 muestra un esquema para una matriz de alta densidad paralela masiva de micropocillos para realizar el proceso de secuenciación. Cada pocillo contiene un molde de ADN diferente y dispositivo de nanoporo.

La figura 54 muestra las estructuras de cuatro moléculas de cumarina-PEG-dG4P.

La figura 55 muestra la caracterización de cuatro nucleótidos cumarina-PEGⁿ-dG4P (n = 16, 20, 24, 36) por MALDI-TOF MS; además de picos del producto de longitud completa y picos de sal relacionados, hay un segundo pico principal a la izquierda en cada espectro (cumarina-PEGⁿ-NH²) que representa el corte del enlace N-P entre el polifosfato y el enlazador aminoheptano debido a la naturaleza ácida de la matriz usada para el análisis de MALDI-TOF MS.

La figura 56 muestra la estructura del molde-bucle-cebador usado para las reacciones de SBS; la C en la “hebra molde” permite la adición por polimerasa de dGMP a la “hebra cebador” y la liberación de etiquetas de cumarina-PEG-trifosfato de los nucleótidos cumarina-PEG-dG4P.

La figura 57 muestra dos métodos para generar etiquetas cumarina-PEGⁿ-NH²; el tratamiento directo de los análogos de nucleótido (cumarina-PEGⁿ-dG4P, n = 16, 20, 24, 36) (arriba) con ácido acético al 10% da las etiquetas cumarina-PEGⁿ-NH²que son idénticas a las etiquetas liberadas por la polimerasa (inferior derecha) después de tratamiento con fosfatasa alcalina; las etiquetas cumarina-PEGⁿ-NH²(inferior izquierda) se caracterizan después a nivel de molécula individual por firmas de bloqueo de corriente de nanoporo.

La figura 58 muestra la medida de MALDI-TOF MS de los productos de extensión obtenidos con los cuatro nucleótidos cumarina-PEG-dG4P; un cebador molde-bucle, en el que el molde contenía una C en la siguiente posición, se usó junto con uno de los cuatro nucleótidos modificados con PEG-etiqueta para la reacción de la polimerasa; en cada caso, 2'-dGMP se incorpora en el ADN, produciendo un producto de extensión del cebador de una única base.

Descripción detallada

El término “nanoporo”, como se usa en el presente documento, en general se refiere a un poro, canal o paso formado o proporcionado de otra manera en una membrana. Un nanoporo puede estar definido por una molécula (por ejemplo, proteína) en una membrana. Una membrana puede ser una membrana orgánica, tal como una bicapa lipídica, o una membrana sintética, tal como una membrana formada de un material polimérico. El nanoporo puede estar dispuesto adyacente o en proximidad a un circuito sensor, tal como, por ejemplo, un semiconductor complementario de óxido metálico (CMOS) o circuito transistor de efecto campo (FET). Un nanoporo puede tener una anchura o diámetro característico en el orden de 0,1 nanómetros (nm) a aproximadamente 1000 nm. Algunos nanoporos son proteínas. La alfa hemolisina es un ejemplo de un nanoporo de proteína.

El término “ácido nucleico”, como se usa en el presente documento, en general se refiere a una molécula que comprende una o más subunidades de ácido nucleico. Un ácido nucleico puede incluir una o más subunidades seleccionadas de adenosina (A), citosina (C), guanina (G), timina (T) y uracilo (U). En algunos ejemplos, un ácido nucleico es ácido desoxirribonucleico (ADN) o ácido ribonucleico (ARN), o derivados de los mismos. Un ácido nucleico puede ser monocatenario o bicatenario.

Los artículos “un”, “una”, “el” y “la” son no limitantes. Por ejemplo, “el método” incluye la definición más amplia del significado de la frase, que puede ser más de un método.

Un “derivado” de adenina, guanina, citosina, timina o uracilo, incluye una 7-deaza-purina y una 5-metil-pirimidina. Otros ejemplos incluyen 7-deaza-adenina, 7-deaza-guanina, y 5-metil-citosina.

Como se usa en el presente documento, “alquilo” incluye grupos hidrocarburo alifáticos tanto ramificados como de cadena lineal que tienen el número especificado de átomos de carbono y pueden estar sin sustituir o sustituidos. Por tanto, C1-Cn como en “alquilo de C1-Cn” se define para incluir grupos que tengan 1 ,2 ... n-1, o n carbonos en una organización lineal o ramificada. Por ejemplo, un “alquilo de C1-C5” se define para que incluya grupos que tienen 1, 2, 3, 4, o 5 carbonos en una organización lineal o ramificada, y específicamente incluye metilo, etilo, n-propilo, isopropilo, n-butilo, t-butilo, y pentilo.

Como se usa en el presente documento, “alquenilo” se refiere a un radical hidrocarburo no aromático, lineal o ramificado, que contiene al menos 1 doble enlace carbono a carbono, y pueden estar presentes hasta el máximo número posible de dobles enlaces carbono-carbono no aromáticos, y pueden estar sin sustituir o sustituidos. Por ejemplo, “alquenilo de C2-C5” significa un radical alquenilo que tiene 2, 3, 4, o 5 átomos de carbono, y hasta 1, 2, 3, o 4 dobles enlaces carbono-carbono, respectivamente. Los grupos alquenilo incluyen etenilo, propenilo, y butenilo.

El término “alquinilo” se refiere a un radical hidrocarburo, lineal o ramificado, que contiene al menos 1 triple enlace carbono a carbono, y pueden estar presentes hasta el máximo número posible de triples enlaces carbono-carbono no aromáticos, y pueden estar sin sustituir o sustituidos. Por ejemplo, “alquinilo de C2-C5” significa un radical alquinilo que tiene 2 o 3, átomos de carbono, y 1 triple enlace carbono-carbono, o que tiene 4 o 5 átomos de carbono y hasta 2 triples enlaces carbono-carbono. Los grupos alquinilo incluyen etinilo, propinilo, y butinilo.

El término “sustituido” se refiere a un grupo funcional como se ha descrito anteriormente tal como un alquilo, o un hidrocarbilo, en el que al menos un enlace a un átomo de hidrógeno contenido en el mismo está sustituido por un enlace a átomo no hidrógeno o no carbono, siempre que se mantengan las valencias normales y que la(s) sustitución(es) produzca(n) un compuesto estable. Los grupos sustituidos también incluyen grupos en los que uno o más enlaces a un átomo de carbono(s) o hidrógeno(s) está sustituido por uno o más enlaces, incluyendo dobles o triples enlaces, a un heteroátomo. Los ejemplos no limitantes de sustituyentes incluyen los grupos funcionales descritos anteriormente, y, por ejemplo, N, por ejemplo, para formar-CN.

Se entiende que los sustituyentes y los patrones de sustitución en los compuestos usados en la presente invención los puede seleccionar un experto en la materia para proporcionar compuestos que son químicamente estables y que se pueden sintetizar fácilmente usando, por ejemplo, los métodos enunciados posteriormente, a partir de materiales de partida fácilmente disponibles. Si un sustituyente está él mismo sustituido con más de un grupo, se entiende que estos múltiples grupos pueden estar en el mismo carbono o en diferentes carbonos, siempre que se produzca una estructura estable.

Al elegir los compuestos usados en la presente invención, un experto en la materia reconocerá que varios sustituyentes, es decir, R1, R2, etc., se tienen que elegir en conformidad con los principios de la conectividad de estructuras químicas.

En las estructuras de compuestos representadas en el presente documento, los átomos de hidrógeno, excepto en los azúcares ribosa y desoxirribosa, en general no se muestran. Sin embargo, se entiende que existen suficientes átomos de hidrógeno en los átomos de carbono representados para satisfacer la regla del octeto.

Como se usa en el presente documento, y a menos que se indique otra cosa, cada uno de los siguientes términos tienen las definiciones expuestas: A - adenina; C - citosina; ADN - ácido desoxirribonucleico; G - guanina; ARN -ácido ribonucleico; T -tim ina; U - uracilo, dNPP - desoxirribonucleótido polifosfato; y rNPP - ribonucleótido polifosfato.

Un ácido nucleico puede incluir cualquier molécula de ácido nucleico, incluyendo, sin limitación, ADN, ARN e híbridos o variantes de los mismos. Un ácido nucleico puede ser monocatenario o bicatenario. En una forma de realización, las bases del ácido nucleico que forman moléculas de ácido nucleico pueden ser las bases A, C, G, T y U, así como derivados de las mismas. Los derivados de estas bases se ejemplifican en PCR Systems, Reagents and Consumables (Perkin Elmer Catalogue 199-1997, Roche Molecular Systems, Inc., Branchburg, Nueva Jersey, EE UU).

Un nucleótido polifosfato, tal como un desoxirribonucleótido polifosfato (“dNPP”) o un ribonucleótido polifosfato (“rNPP”), es un nucleótido que comprende múltiples, es decir, tres, cuatro, cinco, seis o más fosfatos de una manera lineal unidos a su átomo de carbono del azúcar 5'. Un análogo de nucleótido polifosfato es un análogo de tal desoxirribonucleótido polifosfato o de tal ribonucleótido polifosfato como se define en el presente documento, que se diferencia del mismo por tener una etiqueta unida al mismo en una posición especificada. Tales análogos son incorporables a un cebador o hebra de extensión de ácido nucleico, tal como hebra de extensión de ADN, poniéndolos en contacto con una ácido nucleico polimerasa apropiada en las condiciones de polimerización de ácidos nucleicos apropiadas.

En una forma de realización, el dNPP es un desoxinucleótido trifosfato.

Como se usa en el presente documento, un tetranucleótido, un pentanucleótido o un hexanucleótido, abarca 4, 5 o 6, respectivamente, residuos monómeros de ácido nucleico unidos por enlaces fosfodiéster, en donde el residuo terminal libre puede ser un nucleótido o un nucleósido. En una forma de realización, el residuo terminal libre es un nucleósido y los otros residuos son nucleótidos.

“Sustrato sólido” significará cualquier medio adecuado presente en la fase sólida al que se puede fijar un ácido nucleico. Los ejemplos no limitantes incluyen chips, pocillos, perlas, estructuras de nanoporos y columnas. En una forma de realización no limitante el sustrato sólido puede estar presente en una solución, incluyendo una solución de electrolito acuosa.

“Hibridar” significará el apareamiento de un ácido nucleico monocatenario a otro ácido nucleico (tal como un cebador) basado en el principio bien entendido de complementariedad de secuencia. En una forma de realización el otro ácido nucleico es un ácido nucleico monocatenario. La propensión para hibridación entre ácidos nucleicos depende de la temperatura y la fuerza iónica de su medio, la longitud de los ácidos nucleicos y el grado de complementariedad. El efecto de estos parámetros en la hibridación se describe en, por ejemplo, Sambrook J, Fritsch EF, Maniatis T., Molecular cloning: a laboratory manual, Cold Spring Harbor Laboratory Press, Nueva York (1989). Como se usa en el presente documento, la hibridación de una secuencia cebadora, o de un producto de extensión de ADN, a otro ácido nucleico significará suficiente apareamiento de modo que el cebador, o producto de extensión de ADN, respectivamente, es extensible por la creación de un enlace fosfodiéster con un nucleótido o análogo de nucleótido disponible capaz de formar un enlace fosfodiéster, con el mismo.

Como se usa en el presente documento, a menos que se especifique otra cosa, una base que es “diferente de” otra base o una lista de bases enumeradas significará que la base tiene una estructura diferente de la otra base o bases. Por ejemplo, una base que es “diferente de” adenina, timina y citosina, puede incluir una base que es guanina o una base que es uracilo.

“Cebador” como se usa en el presente documento (una secuencia cebadora) en un oligonucleótido corto, habitualmente sintetizado químicamente, de longitud apropiada, por ejemplo, aproximadamente 18-24 bases, suficiente para hibridar con un ADN diana (por ejemplo, un ADN monocatenario) y permitir la adición de un residuo de nucleótido al mismo, o la síntesis de oligonucleótido o polinucleótido a partir del mismo, en condiciones adecuadas. En una forma de realización el cebador es un cebador de ADN, es decir, un cebador que consiste en, o que en gran parte consiste en, residuos de desoxirribonucleótidos. Los cebadores se diseñan para tener una secuencia que es el complemento inverso de una región de un ADN molde/diana con la que hibrida el cebador. La adición de un residuo de nucleótido al extremo 3' de un cebador por formación de un enlace fosfodiéster produce un producto de extensión de ADN. La adición de un residuo de nucleótido al extremo 3' del producto de extensión de ADN por formación de un enlace fosfodiéster produce un producto de extensión de ADN adicional.

Métodos y sistemas para la identificación y secuenciación de ácidos nucleicos

En el presente documento se describen métodos, dispositivos y sistemas para secuenciar ácidos nucleicos usando un nanoporo. Los métodos pueden detectar de forma precisa sucesos de incorporación de nucleótidos individuales, tal como tras la incorporación de un nucleótido en una hebra en crecimiento que es complementaria al molde. Una enzima (por ejemplo, ADN polimerasa) puede incorporar nucleótidos a una cadena polinucleotídica en crecimiento, en donde el nucleótido añadido es complementario a la hebra de ácido nucleico molde correspondiente, que hibrida con la hebra en crecimiento (por ejemplo, reacción en cadena de la polimerasa (PCR)). Estos sucesos de incorporación de nucleótidos liberan etiquetas de los nucleótidos, que pasan a través de un nanoporo y se detectan. De esta manera, la base incorporada se puede identificar (es decir, A, C, G, T o U) porque se libera una etiqueta única de cada tipo de nucleótido (es decir, A, C, G, T o U).

Los sucesos de incorporación de nucleótidos se pueden detectar en tiempo real (es decir, según se producen) y con la ayuda de un nanoporo. En algunos casos, una enzima (por ejemplo, ADN polimerasa) unida a o en proximidad al nanoporo puede facilitar el flujo de una molécula de ácido nucleico a través o adyacente a un nanoporo. Un suceso de incorporación de nucleótido, o la incorporación de una pluralidad de nucleótidos, puede liberar una o más moléculas de etiquetas (también “etiquetas” en el presente documento), que se pueden detectar por un nanoporo según las etiquetas fluyen a través o adyacentes al nanoporo. En algunos casos, una enzima unida a o en la proximidad del nanoporo puede ayudar en detectar etiquetas u otros subproductos liberados tras la incorporación de uno o más nucleótidos.

Los métodos descritos en el presente documento pueden ser métodos de molécula única. Es decir, la señal que se detecta está generada por una única molécula (es decir, incorporación de nucleótido único) y no está generada de una pluralidad de moléculas clonales. El método puede no requerir amplificación de ADN.

Los sucesos de incorporación de nucleótidos se pueden producir de una mezcla que comprende una pluralidad de nucleótidos (por ejemplo, desoxirribonucleótido trifosfato (dNTP donde N es adenosina (A), citidina (C), timidina (T), guanosina (G) o uridina (U)). Los sucesos de incorporación de nucleótidos no se producen necesariamente de una solución que comprende un único tipo de nucleótido (por ejemplo, dATP). Los sucesos de incorporación de nucleótidos no se producen necesariamente de soluciones alternantes de una pluralidad de nucleótidos (por ejemplo, dATP, seguido por dCTP, seguido por dGTP, seguido por dTTP, seguido por dATP).

La secuenciación de ADN es una tecnología fundamental para la biología. Se han desarrollado varios métodos analíticos para detectar ADN o ARN a nivel de molécula única usando tecnologías microscópicas químicas o físicas (Perkins et al. 1994, Rief et al. 1999, Smith et al. 1996, y Vercoutere et al. 2001).

En los últimos años, tecnologías sensoras de iones tal como canal iónico, que se basa en la detección del ion hidrógeno (H+) liberado cuando un nucleótido se incorpora en una hebra de ADN por una polimerasa (Rothberg et al. 2011), se han explorado para detectar hebras individuales de ADN o ARN (Kasianowicz 2003 & 2004, Chandler et al. 2004, Deamer et al. 2002, Berzukov et al. 2001, y Henrickson et al. 2000).

En algunos casos, un canal de a-hemolisina, una exotoxina secretada por una bacteria, se puede usar para detectar ácidos nucleicos a nivel de molécula única (Kasianowicz et al. 1996, publicación de patente WO2009/020682). Una proteína a-hemolisina es un polipéptido monomérico que se autoensambla en una membrana de bicapa lipídica para formar un poro heptamérico, con un vestíbulo de 2,6 nm de diámetro y una apertura limitante de 1,5 nm de diámetro (el punto más estrecho del nanoporo) (Meller et al. 2000, Akeson et al. 1999, y Deamer et al. 2002). La apertura limitante del nanoporo permite que moléculas de ácido nucleico monocatenario, pero no bicatenario (diámetro ~2,0 nm) pasen a través. En una solución salina iónica acuosa tal como KCl, cuando se aplica un voltaje apropiado a través de la membrana, el poro formado por un canal de a-hemolisina conduce una corriente iónica suficientemente fuerte y estable. Los ácidos nucleicos polianiónicos son dirigidos a través del poro por el campo eléctrico aplicado, bloqueando o reduciendo así la corriente iónica que de otra manera puede ser libre. Este proceso de paso genera una firma electrónica (Figura 21) (Vercoutere et al. 2001 y Deamer et al. 2002). Una molécula de ácido nucleico particular, cuando entra y pasa a través del nanoporo genera una firma característica que la distingue de otras moléculas de ácido nucleico. La duración del bloqueo es proporcional a la longitud del ácido nucleico, y la potencia de la señal está relacionada con las propiedades estéricas y electrónicas de los nucleótidos, es decir, la identidad de las cuatro bases (A, C, G y T). Por tanto, un diagrama de sucesos específico, que es un gráfico de tiempo de translocación frente a la corriente de bloqueo, se obtiene y usa para distinguir la longitud y la composición de polinucleótidos por técnicas de registro de canal único basado en parámetros característicos tal como corriente de translocación, duración de la translocación, y su correspondiente dispersión en el diagrama (Meller et al. 2000).

También se ha mostrado que un nanoporo de proteína con un adaptador covalentemente unido puede identificar de forma precisa nucleósidos 5-monofosfato sin marcar (dAMP, dGMP, dCMP & dTMP) con gran precisión (Clarke et al.

2009). Por ejemplo, el adaptador aminociclodextrina se ha unido covalentemente en el poro de a-hemolisina con éxito. Cuando un dNMP es capturado y dirigido a través del poro en una membrana de bicapa lipídica, la corriente iónica a través del poro se reduce a uno de cuatro niveles, cada uno representa uno de los cuatro dNMP (A, G, C, o T). Además, Robertson et al. (2007) han demostrado recientemente que cuando una molécula de poli(etilenglicol) (PEG) entra un poro de a-hemolisina individual, produce distintos estados de conductancia dependientes de la masa con tiempos de residencia medios característicos. El espectro de masa basado en conductancia claramente resuelve las unidades repetidas de etilenglicol, y el tiempo de residencia aumenta con la masa del PEG.

Aunque el enfoque de corriente de nanoporo muestra promesa como un método de detección de ADN, el fin más exigente de secuencia base a base precisa no se ha logrado todavía.

Los métodos para secuenciar ácidos nucleicos pueden incluir recuperar una muestra biológica que tiene el ácido nucleico que se va a secuenciar, extraer o aislar de otra manera la muestra de ácido nucleico de la muestra biológica, y en algunos casos preparar la muestra de ácido nucleico para secuenciar.

La figura 1 ilustra esquemáticamente un método para secuenciar una muestra de ácido nucleico. El método comprende aislar la molécula de ácido nucleico de una muestra biológica (por ejemplo, muestra de tejido, muestra de fluido), y preparar la muestra de ácido nucleico para secuenciar. En algunos casos, la muestra de ácido nucleico se extrae de una célula. Algunas técnicas ejemplares para extraer ácidos nucleicos son usar lisozima, sonicación, extracción, altas presiones o cualquier combinación de las mismas. El ácido nucleico es un ácido nucleico sin células en algunos casos y no requiere extracción de una célula.

En algunos casos, una muestra de ácido nucleico se puede preparar para secuenciación mediante un proceso que implica eliminar proteínas, restos de pared celular y otros componentes de la muestra de ácido nucleico. Hay muchos productos comerciales disponibles para lograr esto, tal como, por ejemplo, columnas de centrifugación. También se pueden usar precipitación con etanol y centrifugación.

La muestra de ácido nucleico se puede dividir (o fracturar) en una pluralidad de fragmentos, que puede facilitar la secuenciación del ácido nucleico, tal como con la ayuda de un dispositivo que incluye una pluralidad de nanoporos en una matriz. Sin embargo, fracturar la(s) molécula(s) de ácido nucleico que se va(n) a secuenciar puede no ser necesario.

En algunos casos, se determinan secuencias largas (es decir, pueden no requerirse métodos de “secuenciación aleatoria”). Cualquier longitud adecuada de secuencia de ácido nucleico se puede determinar. Por ejemplo, al menos aproximadamente 400, aproximadamente 500, aproximadamente 600, aproximadamente 700, aproximadamente 800, aproximadamente 800, aproximadamente 1000, aproximadamente 1500, aproximadamente 2000, aproximadamente 2500, aproximadamente 3000, aproximadamente 3500, aproximadamente 4000, aproximadamente 4500, aproximadamente 5000, aproximadamente 6000, aproximadamente 7000, aproximadamente 8000, aproximadamente 9000, aproximadamente 10000, aproximadamente 20000, aproximadamente 40000, aproximadamente 60000, aproximadamente 80000, o aproximadamente 100000, y similares bases se pueden secuenciar. En algunos casos, al menos 400, al menos 500, al menos 600, al menos 700, al menos 800, al menos 800, al menos 1000, al menos 1500, al menos 2000, al menos 2500, al menos 3000, al menos 3500, al menos 4000, al menos 4500, al menos 5000, al menos 6000, al menos 7000, al menos 8000, al menos 9000, al menos 10000, al menos 20000, al menos 40000, al menos 60000, al menos 80000, o al menos 100000, y similares bases se secuencian. En algunos casos las bases secuenciadas son contiguas. En algunos casos, la muestra de ácido nucleico se puede dividir antes de la secuenciación.

Secuenciación con nanoporo y detección molecular

En el presente documento se proporcionan sistemas y métodos para secuenciar una molécula de ácido nucleico con la ayuda de un nanoporo. El nanoporo puede estar formado o de otra manera embebido en una membrana dispuesta adyacente a un electrodo sensor de un circuito sensor, tal como un circuito integrado. El circuito integrado puede ser un circuito integrado específico de aplicación (ASIC). En algunos ejemplos, el circuito integrado es un transistor de efecto de campo o un semiconductor de óxido de metal complementario (CMOS). El circuito sensor puede estar situado en un chip u otro dispositivo que tiene el nanoporo, o fuera del chip o dispositivo, tal como en una configuración fuera de chip. El semiconductor puede ser cualquier semiconductor, incluyendo, sin limitación, semiconductores del grupo IV (por ejemplo, silicio) o del grupo III-V (por ejemplo, arseniuro de galio).

En algunos casos, según fluye un ácido nucleico o etiqueta a través del nanoporo, el circuito sensor detecta una señal eléctrica asociada con el ácido nucleico o etiqueta. El ácido nucleico puede ser una subunidad de una hebra mayor. La etiqueta puede ser un subproducto de un suceso de incorporación de nucleótido. Una señal detectada se puede recoger y almacenar en una localización de memoria, y usar después para construir una secuencia del ácido nucleico. La señal recogida se puede procesar para explicar cualquier anomalía en la señal detectada, tal como errores.

La figura 2 muestra ejemplos de un detector (o sensor) de nanoporo que tiene control de temperatura, como se puede preparar según el método descrito en la Publicación de la Solicitud de patente en EE UU No. 2011/0193570. Con referencia a la figura 2A, el detector de nanoporo comprende un electrodo superior 201 en contacto con una solución conductora (por ejemplo, solución de sal) 207. Un electrodo conductor inferior 202 está cerca, adyacente, o en proximidad a un nanoporo 206, que está insertado en una membrana 205. En algunos casos, el electrodo conductor inferior 202 está embebido en un semiconductor 203 en el que está embebido circuitería eléctrica en un sustrato semiconductor 204. Una superficie del semiconductor 203 se puede tratar para que sea hidrofóbica. Una muestra que se detecta va a través del poro en el nanoporo 206. El sensor del chip semiconductor se coloca en un paquete 208 y este, a su vez, está en la vecindad de un elemento de control de la temperatura 209. El elemento de control de la temperatura 209 puede ser un dispositivo calentador y/o enfriador termoeléctrico (por ejemplo, dispositivo de Peltier). Múltiples detectores de nanoporo pueden formar una matriz de nanoporos.

Con referencia a la figura 2B, donde números similares representan elementos similares, la membrana 205 puede estar dispuesta sobre un pocillo 210, donde el sensor 202 forma parte de la superficie del pocillo. La figura 2C muestra un ejemplo en el que el electrodo 202 sobresale de la superficie del semiconductor tratada 203.

En algunos ejemplos, la membrana 205 se forma en el electrodo conductor inferior 202 y no en el semiconductor 203. La membrana 205 en tal caso puede formar interacciones de acoplamiento con el electrodo conductor inferior 202. En algunos casos, sin embargo, la membrana 205 se forma en el electrodo conductor inferior 202 y el semiconductor 203. Como una alternativa, la membrana 205 se puede formar en el semiconductor 203 y no en el electrodo conductor inferior 202, pero se puede extender sobre el electrodo conductor inferior 202.

Secuenciación indirecta con nanoporos

Los nanoporos se pueden usar para secuenciar moléculas de ácido nucleico indirectamente, opcionalmente con detección eléctrica. La secuenciación indirecta puede ser cualquier método donde una molécula de ácido nucleico polimerizada tal como ADN o ARN no pasa a través del nanoporo. La molécula de ácido nucleico puede estar al menos parcialmente localizada en el vestíbulo del nanoporo, pero no en el poro (es decir, la porción más estrecha) del nanoporo. La molécula de ácido nucleico puede pasar en cualquier distancia adecuada de y/o proximidad al nanoporo, opcionalmente en una distancia de modo que las etiquetas liberadas de los sucesos de incorporación de nucleótidos sean detectadas por el nanoporo.

Los subproductos de los sucesos de incorporación de nucleótidos se pueden detectar por el nanoporo. “Sucesos de incorporación de nucleótidos” son la incorporación de un nucleótido a una cadena de polinucleótidos en crecimiento. Un subproducto puede estar correlacionado con la incorporación de un tipo de nucleótido determinado. Los sucesos de incorporación de nucleótidos en general están catalizados por una enzima, tal como ADN polimerasa, y usan interacciones de pares de bases con una molécula molde para elegir entre los nucleótidos disponibles para la incorporación en cada localización.

En algunos casos, el subproducto pasa a través del nanoporo y/o genera una señal detectable en el nanoporo. Las moléculas de etiqueta liberadas son un ejemplo de subproductos. En algunos casos, los subproductos son protones (es decir, un cambio de pH). En otros casos, los subproductos son fosfatos (por ejemplo, fosfatos liberados durante los sucesos de incorporación de nucleótidos). Por ejemplo, cada uno de los diferentes tipos de nucleótidos puede comprender un número diferente de fosfatos, y la detección de los fosfatos liberados permite determinar la identidad del nucleótido incorporado.

Un ejemplo del método se representa en la figura 3. Aquí, la hebra de ácido nucleico 300 pasa de un lado a otro o en proximidad al (pero no a través como se indica por la flecha en 301) nanoporo 302. Una enzima 303 (por ejemplo, ADN polimerasa) extiende una hebra de ácido nucleico en crecimiento 304 por incorporación de un nucleótido cada vez usando una primera molécula de ácido nucleico como molde 300 (es decir, la enzima cataliza sucesos de incorporación de ácidos nucleicos).

La enzima 303 puede estar unida al nanoporo 302. Los métodos adecuados para unir la enzima al nanoporo incluyen entrecruzamiento tal como la formación de enlaces disulfuro intramoleculares. El nanoporo y la enzima también pueden ser una proteína de fusión, que está codificada por una única cadena polipeptídica. Los métodos para producir proteínas de fusión pueden incluir fusionar la secuencia codificante para la enzima en el mismo marco de lectura y adyacente a la secuencia codificante para el nanoporo (sin un codón de terminación entremedias) y expresar esta secuencia de fusión desde un único promotor. En algunos casos, también se unen enzimas fosfatasas al nanoporo.

En algunos casos, la ADN polimerasa es 9°N polimerasa o una variante de la misma, ADN polimerasa I de E. Coli, ADN polimerasa del bacteriófago T4, Sequenase, Taq ADN polimerasa, 9°N polimerasa (exo-)A485L/Y409V o ADN polimerasa de Phi29 (ADN polimerasa de 929).

Secuenciación con nanoporos de moléculas de etiqueta

Una muestra de ácido nucleico se puede secuenciar usando nucleótidos etiquetados o análogos de nucleótidos. En algunos ejemplos, un método para secuenciar una molécula de ácido nucleico comprende (a) polimerizar nucleótidos etiquetados, en donde una etiqueta asociada con un nucleótido individual se libera tras la polimerización, y (b) detectar la etiqueta liberada con la ayuda de un nanoporo.

En algunos casos, el método además comprende detectar la etiqueta liberada de un nucleótido individual a través del nanoporo. La etiqueta liberada puede estar dirigida por cualquier técnica adecuada, en algunos casos con la ayuda de una enzima (o motor molecular). Alternativa, la etiqueta liberada se puede dirigir a través del nanoporo sin el uso de una enzima. Por ejemplo, la etiqueta se puede dirigir por una diferencia de voltaje a través del nanoporo como se describe en el presente documento.

Con referencia continuada a la figura 3, la enzima saca de un conjunto de nucleótidos (círculos llenos en la indicación 305) unidos a moléculas diana (círculos abiertos en la indicación 305). Cada tipo de nucleótido está unido a una molécula de etiqueta diferente de modo que cuando las etiquetas se liberan y pasan a través del nanoporo 306, se pueden diferenciar entre sí basado en la señal que se genera en el nanoporo.

La figura 4 muestra un ejemplo de señales diferentes que se generan por diferentes etiquetas según se detectan por el nanoporo. Se detectan cuatro intensidades de señal (401, 402, 403 y 404) diferentes. Estas pueden corresponder a cuatro etiquetas diferentes. Por ejemplo, la etiqueta presentada al nanoporo y/o liberada por la incorporación de adenosina (A) puede generar una señal con una amplitud 401. Una etiqueta presentada al nanoporo y/o liberada por la incorporación de citosina (C) puede generar una señal con una amplitud mayor 403; una etiqueta presentada al nanoporo y/o liberada por la incorporación de guanina (G) puede generar una señal con una amplitud incluso mayor 404; y una etiqueta presentada al nanoporo y/o liberada por la incorporación de timina (T) puede generar una señal con una amplitud aun mayor 402. La señal puede volver a un nivel basal 405 entre detecciones en algunos casos.

La velocidad de los sucesos de incorporación de nucleótidos en general es más lenta que (o igual a) la velocidad a la que las moléculas de etiqueta liberadas durante los sucesos de incorporación de nucleótidos pasan a través y/o son detectadas por el nanoporo. En general, la velocidad de sucesos de incorporación de nucleótidos no es mayor que la velocidad que las moléculas de etiqueta liberadas durante los sucesos de incorporación de nucleótidos pasan a través y/o son detectadas por el nanoporo (es decir, de otra manera los sucesos de incorporación de nucleótidos no se detectan con precisión y/o en la secuencia correcta).

Matrices de nanoporos para secuenciación

La figura 5 muestra que una pluralidad de moléculas de ácido nucleico se puede secuenciar en una matriz de detectores de nanoporo. Aquí, cada localización de nanoporo (por ejemplo, 501) comprende un nanoporo, opcionalmente unido a una enzima polimerasa y/o enzimas fosfatasas. También hay en general un sensor en cada localización de la matriz como se describe en otro sitio en el presente documento.

En algunos ejemplos, se proporciona una matriz de nanoporos unidos a un ácido nucleico polimerasa, y los nucleótidos etiquetados se polimerizan con la polimerasa. Durante la polimerización, una etiqueta se libera y detecta por el nanoporo. La matriz de nanoporos puede tener cualquier número adecuado de nanoporos. En algunos casos, la matriz comprende aproximadamente 200, aproximadamente 400, aproximadamente 600, aproximadamente 800, aproximadamente 1000, aproximadamente 1500, aproximadamente 2000, aproximadamente 3000, aproximadamente 4000, aproximadamente 50000, aproximadamente 10000, aproximadamente 15000, aproximadamente 20000, aproximadamente 40000, aproximadamente 60000, aproximadamente 80000, aproximadamente 100000, aproximadamente 200000, aproximadamente 400000, aproximadamente 600000, aproximadamente 800000, aproximadamente 1000000, y similar nanoporos. En algunos casos, la matriz comprende al menos 200, al menos 400, al menos 600, al menos 800, al menos 1000, al menos 1500, al menos 2000, al menos 3000, al menos 4000, al menos 50000, al menos 10000, al menos 15000, al menos 20000, al menos 40000, al menos 60000, al menos 80000, al menos 100000, al menos 200000, al menos 400000, al menos 600000, al menos 800000, al menos 1000000, y similar nanoporos. Los nanoporos pueden ser individualmente direccionables. En algunos casos, la matriz puede incluir nanoporos individualmente direccionables a una densidad de al menos aproximadamente 500, 600, 700, 800, 900, 1000, 10.000, 100.000 o 1.000.000 de nanoporos individualmente direccionables por mm2

En algunos casos, una única etiqueta se libera tras la incorporación de un único nucleótido y se detecta por un nanoporo. En otros casos, se libera una pluralidad de etiquetas tras la incorporación de una pluralidad de nucleótidos. Un sensor nanoporo adyacente a un nanoporo puede detectar una etiqueta liberada individual, o una pluralidad de etiquetas liberadas. Una o más señales asociadas con una pluralidad de etiquetas liberadas se puede detectar y procesar para dar una señal promediada.

Las etiquetas se pueden detectar por el sensor como una función del tiempo. Las etiquetas detectadas con el tiempo se pueden usar para determinar la secuencia del ácido nucleico de una muestra de ácido nucleico, tal como con la ayuda de un sistema de ordenador (véase, por ejemplo, la figura 18) que se programa para registrar datos del sensor y generar información de secuencia de los datos.

Precisión de secuenciación

Los métodos proporcionados en el presente documento pueden distinguir de forma precisa entre sucesos de incorporación de nucleótidos individuales (por ejemplo, sucesos de molécula únicas). Los métodos pueden distinguir de forma precisa entre sucesos de incorporación de nucleótidos individuales en un único pase -es decir, sin tener que resecuenciar una molécula de ácido nucleico determinada.

Un método para la secuenciación de ácidos nucleicos comprende distinguir entre sucesos de incorporación de nucleótidos individuales con una precisión de más de aproximadamente 4 a. En algunos casos, los sucesos de incorporación de nucleótidos se detectan con ayuda de un nanoporo. Las etiquetas asociadas con los nucleótidos se pueden liberar tras la incorporación y las etiquetas pasan a través del nanoporo. Una etiqueta diferente puede estar asociada con y/o liberada de cada tipo de nucleótido (por ejemplo, A, C, T, G) y se detecta según pasa a través del nanoporo. Los errores incluyen, pero no están limitados a, (a) no poder detectar una etiqueta, (b) identificar mal una etiqueta, (c) detectar una etiqueta donde no hay etiqueta, (d) detectar etiquetas en el orden incorrecto (por ejemplo, dos etiquetas se liberan en un primer orden, pero pasan una a otra y se detectan en un segundo orden), (e) una etiqueta que no se ha liberado de un nucleótido se detecta como que se libera, o cualquier combinación de las mismas. En algunas formas de realización, la precisión de distinguir entre sucesos de incorporación de nucleótidos individuales es el 100% restado por la tasa a la que se producen errores (es decir, tasa de errores).

La precisión de distinguir entre sucesos de incorporación de nucleótidos individuales es cualquier porcentaje adecuado. La precisión de distinguir entre sucesos de incorporación de nucleótidos individuales puede ser aproximadamente el 93%, aproximadamente el 94%, aproximadamente el 95%, aproximadamente el 96%, aproximadamente el 97%, aproximadamente el 98%, aproximadamente el 99%, aproximadamente el 99,5%, aproximadamente el 99,9%, aproximadamente el 99,99%, aproximadamente el 99,999%, aproximadamente el 99,9999%, y similares. En algunos casos, la precisión de distinguir entre sucesos de incorporación de nucleótidos individuales puede ser al menos el 93%, al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98%, al menos el 99%, al menos el 99,5%, al menos el 99,9%, al menos el 99,99%, al menos el 99,999%, al menos el 99,9999%, y similares. En algunos casos, la precisión de distinguir entre sucesos de incorporación de nucleótidos individuales se describe en unidades sigma (a). Sigma es una variable estadística que algunas veces se usa en gestión de empresas y estrategia de fabricación para describir tasas de errores tal como el porcentaje de productos sin defectos. Aquí, los valores de sigma se pueden usar de forma intercambiable con precisión según la relación como sigue: 4 a es precisión del 99,38%, 5 a es precisión del 99,977%, y 6 a es precisión del 99,99966%.

Distinguir entre sucesos de incorporación de nucleótidos individuales, según los métodos descritos en el presente documento, se puede usar para determinar de forma precisa una secuencia de ácido nucleico. En algunos casos, la determinación de la secuencia de ácido nucleico de un ácido nucleico (por ejemplo, ADN y ARN) incluye errores. Los errores ejemplares incluyen, pero no están limitados a deleciones (no poder detectar un ácido nucleico), inserciones (detectar un ácido nucleico donde no está realmente presente ninguno) y sustituciones (detectar el ácido nucleico incorrecto). La precisión de secuenciación de ácido nucleico se puede determinar alineando la secuencia del ácido nucleico medida con la secuencia verdadera del ácido nucleico (por ejemplo, según técnicas bioinformáticas) y determinando el porcentaje de posiciones de ácido nucleico que son deleciones, inserciones y/o sustituciones. Los errores son cualquier combinación de deleciones, inserciones y sustituciones. La precisión varía del 0% al 100%, siendo el 100% una determinación completamente correcta de la secuencia del ácido nucleico. De forma similar, la tasa de error es el 100% - la precisión y varía del 0% al 100%, siendo la tasa de error del 0% una determinación completamente correcta de la secuencia del ácido nucleico.

La precisión de la secuenciación del ácido nucleico realizada según los métodos y/o usando los dispositivos descritos en el presente documento es alta. La precisión es cualquier valor adecuadamente alto. En algunos casos, la precisión es aproximadamente el 95%, aproximadamente el 95,5%, aproximadamente el 96%, aproximadamente el 96,5%, aproximadamente el 97%, aproximadamente el 97,5%, aproximadamente el 98%, aproximadamente el 98,5%, aproximadamente el 99%, aproximadamente el 99,5%, aproximadamente el 99,9%, aproximadamente el 99,99%, aproximadamente el 99,999%, aproximadamente el 99,9999%, y similares. En algunos casos, la precisión es al menos el 95%, al menos el 95,5%, al menos el 96%, al menos el 96,5%, al menos el 97%, al menos el 97,5%, al menos el 98%, al menos el 98,5%, al menos el 99%, al menos el 99,5%, al menos el 99,9%, al menos el 99,99%, al menos el 99,999%, al menos el 99,9999%, y similares. En algunos casos, la precisión es entre aproximadamente el 95% y aproximadamente el 99,9999%, entre aproximadamente el 97% y aproximadamente el 99,9999%, entre aproximadamente el 99% y aproximadamente el 99,9999%, entre aproximadamente el 99,5% y aproximadamente el 99,9999%, entre aproximadamente el 99,9% y aproximadamente el 99,9999%, y similares.

La alta precisión se puede lograr realizando múltiples pases (es decir, secuenciar una molécula de ácido nucleico una pluralidad de veces, por ejemplo, pasando el ácido nucleico a través o en proximidad de un nanoporo y secuenciar las bases del ácido nucleico de la molécula de ácido nucleico). Los datos de múltiples pases se pueden combinar (por ejemplo, deleciones, inserciones y/o sustituciones en un primer pase se corrigen usando datos de otros pases repetidos). El método proporciona alta precisión con pocos pases (también denominados lecturas, multiplicidad de cobertura de secuenciación). El número de pases es cualquier número adecuado, y no necesita ser un número entero. En algunas formas de realización, la molécula de ácido nucleico se secuencia 1 vez, 2 veces, 3 veces, 4 veces, 5 veces, 6 veces, 7 veces, 8 veces, 9 veces, 10 veces, 12 veces, 14 veces, 16 veces, 18 veces, 20 veces, 25 veces, 30 veces, 35 veces, 40 veces, 45 veces, 50 veces, y similar. En algunas formas de realización, la molécula de ácido nucleico se secuencia como mucho 1 vez, como mucho 2 veces, como mucho 3 veces, como mucho 4 veces, como mucho 5 veces como mucho, 6 veces, como mucho 7 veces, como mucho 8 veces, como mucho 9 veces, como mucho 10 veces, como mucho 12 veces, como mucho 14 veces, como mucho 16 veces, como mucho 18 veces, como mucho 20 veces, como mucho 25 veces, como mucho 30 veces, como mucho 35 veces, como mucho 40 veces, como mucho 45 veces, como mucho 50 veces, y similar. En algunas formas de realización, la molécula de ácido nucleico se secuencia entre aproximadamente 1 vez y 10 veces, entre aproximadamente 1 vez y 5 veces, entre aproximadamente 1 vez y 3 veces, y similar. El nivel de precisión se puede lograr combinando datos recogidos de como mucho 20 pases. En algunas formas de realización, el nivel de precisión se logra combinando datos recogidos de como mucho 10 pases. En algunas formas de realización, el nivel de precisión se logra combinando datos recogidos de como mucho 5 pases. En algunos casos, el nivel de precisión se logra en un único pase.

La tasa de error es cualquier tasa adecuadamente baja. En algunos casos, la tasa de error es aproximadamente el 10%, aproximadamente el 5%, aproximadamente el 4%, aproximadamente el 3%, aproximadamente el 2%, aproximadamente el 1%, aproximadamente el 0,5%, aproximadamente el 0,1%, aproximadamente el 0,01%, aproximadamente el 0,001%, aproximadamente el 0,0001%, y similar. En algunos casos, la tasa de error es como mucho el 10%, como mucho el 5%, como mucho el 4%, como mucho el 3%, como mucho el 2%, como mucho el 1%, como mucho el 0,5%, como mucho el 0,1%, como mucho el 0,01%, como mucho el 0,001%, como mucho el 0,0001%, y similar.

Preparación del molde

El método puede implicar secuenciar una hebra de ácido nucleico molde añadiendo nucleótidos etiquetados a una hebra complementaria a la hebra molde y detectar moléculas de etiqueta liberadas en un nanoporo.

La figura 10 muestra un método para preparar el molde de ácido nucleico. En este caso, la molécula de ácido nucleico que se va a secuenciar es bicatenaria y comprende una hebra sentido 1001 y una hebra antisentido 1002. Una horquilla de ácido nucleico 1003 se puede ligar al extremo 3' de la hebra sentido y el extremo 5' de la hebra antisentido.

Las hebras de la molécula de ácido nucleico se pueden disociar para formar una molécula molde monocatenaria que comprende la hebra sentido 1004, la horquilla 1005 y la hebra antisentido 1006. Este ácido nucleico monocatenario se puede secuenciar como se describe en el presente documento.

En algunos casos, el método presente para preparar el molde de ácido nucleico permite secuenciar tanto la hebra sentido como la hebra antisentido en una única carrera de secuenciación. Esto puede producir dos conjuntos de datos redundantes (es decir, cada posición de par de bases de ácido nucleico se secuencia dos veces) que puede producir una determinación más precisa de la secuencia que secuenciar solo una hebra de la molécula de ácido nucleico bicatenario original.

Configuración del dispositivo

La figura 11 es un diagrama esquemático de un dispositivo de nanoporo 100 (o sensor) que se puede usar para secuenciar un ácido nucleico y/o detectar una molécula de etiqueta como se describe en el presente documento. El nanoporo que contiene la bicapa lipídica se puede caracterizar por una resistencia y una capacitancia. El dispositivo de nanoporo 100 incluye una bicapa lipídica 102 formada sobre una superficie compatible con bicapa lipídica 104 de un sustrato sólido conductor 106, donde la superficie compatible con bicapa lipídica 104 puede estar aislada por superficies incompatibles con bicapa lipídica 105 y el sustrato sólido conductor 106 puede estar eléctricamente aislado por materiales aislantes 107, y donde la bicapa lipídica 102 puede estar rodeada por lípido amorfo 103 formado en la superficie incompatible con la bicapa lipídica 105. La bicapa lipídica 102 puede estar embebida con una única estructura de nanoporo 108 que tiene un nanoporo 110 suficientemente grande para el paso de las moléculas de etiqueta que se caracterizan y/o iones pequeños (por ejemplo, Na+, K+, Ca2+, Cl-) entre los dos lados de la bicapa lipídica 102. Una capa de moléculas de agua 114 puede estar adsorbida en la superficie compatible con la bicapa lipídica 104 y emparedada entre la bicapa lipídica 102 y la superficie compatible con la bicapa lipídica 104. La película acuosa 114 adsorbida en la superficie compatible con la bicapa lipídica hidrofílica 104 puede fomentar el ordenamiento de moléculas lipídicas y facilitar la formación de bicapa lipídica en la superficie compatible con la bicapa lipídica 104. Una cámara de muestra 116 que contiene una solución de la molécula de ácido nucleico 112 y nucleótidos etiquetados se puede proporcionar sobre la bicapa lipídica 102. La solución puede ser una solución acuosa que contiene electrolitos y tamponada a una concentración óptima de iones y mantenida a un pH óptimo para mantener el nanoporo 110 abierto. El dispositivo incluye un par de electrodos 118 (incluyendo un nodo negativo 118a y un nodo positivo 118b) acoplados a una fuente de voltaje variable 120 para proporcionar estímulo eléctrico (por ejemplo, voltaje de polarización) a través de la bicapa lipídica y para detectar características eléctricas de la bicapa lipídica (por ejemplo, resistencia, capacitancia y flujo de corriente iónica). La superficie del electrodo positivo 118b es o forma parte de la superficie compatible con la bicapa lipídica 104. El sustrato sólido conductor 106 puede estar acoplado a o formar una parte de uno de los electrodos 118. El dispositivo 100 también puede incluir un circuito eléctrico 122 para controlar la estimulación eléctrica y para procesar la señal detectada. En algunas formas de realización, la fuente de voltaje variable 120 está incluida como una parte del circuito eléctrico 122. La circuitería eléctrica 122 puede incluir amplificador, integrador, filtro de ruido, lógica de control de retroalimentación, y/o varios otros componentes. La circuitería eléctrica 122 puede ser circuitería eléctrica integrada, integrada en un sustrato de silicio 128 y puede además estar acoplada a un procesador de ordenador 124 acoplado a una memoria 126.

La superficie compatible con la bicapa lipídica 104 se puede formar de varios materiales que son adecuados para la transducción de iones y formación de gas para facilitar la formación de la bicapa lipídica. En algunas formas de realización, se pueden usar materiales hidrofílicos conductores o semiconductores porque permiten mejor detección de un cambio en las características eléctricas de la bicapa lipídica. Los materiales de ejemplo incluyen Ag-AgCl, Au, Pt o silicio dopado u otros materiales semiconductores. En algunos casos, el electrodo no es un electrodo sacrificial.

La superficie incompatible con la bicapa lipídica 105 puede estar formada de varios materiales que no son adecuados para la formación de bicapa lipídica y son típicamente hidrofóbicos. En algunas formas de realización, materiales hidrofóbicos no conductores son preferidos, ya que aíslan eléctricamente las regiones de bicapa lipídica además de separar las regiones de la bicapa lipídica entre sí. Los materiales incompatibles con la bicapa lipídica de ejemplo incluyen, por ejemplo, nitruro de silicio (por ejemplo, Si3N4) y teflón.

En un ejemplo, el dispositivo de nanoporo 100 de la figura 11 es un dispositivo de nanoporo de alfa hemolisina (aHL) que tiene una única proteína alfa hemolisina (aHL) 108 embebida en una bicapa lipídica de difitanoilfosfatidilcolina (DPhPC) 102 formada sobre una superficie de Pt compatible con la bicapa lipídica 104 recubierta en un material de aluminio 106. La superficie de Pt compatible con la bicapa lipídica 104 está aislada por superficies de nitruro de silicio incompatibles con bicapa lipídica 105, y el material de aluminio 106 está eléctricamente aislado por materiales de nitruro de silicio 107. El aluminio 106 está acoplado a la circuitería eléctrica 122 que está integrada en un sustrato de silicio 128. Un electrodo de plata-cloruro de plata colocado en el chip o que se extiende hacia abajo desde una placa de cobertura 128 entra en contacto con una solución acuosa que contiene moléculas de ácido nucleico.

El nanoporo de aHL es un ensamblaje de siete péptidos individuales. La entrada o vestíbulo del nanoporo de aHL tiene aproximadamente 26 angstroms de diámetro, que es lo suficientemente ancho para acomodar una porción de una molécula de ADNbc. Desde el vestíbulo, el nanoporo de aHL primero se ensancha y después se estrecha a un barril que tiene un diámetro de aproximadamente 15 angstroms, que es lo suficientemente ancho para permitir que una molécula de ADNmc (o las moléculas de etiqueta liberadas) pase a través, pero no lo suficientemente ancho para permitir que una molécula de ADNbc pase a través.

Además de DPhPC, la bicapa lipídica del dispositivo de nanoporo se puede ensamblar de varios otros materiales anfifílicos adecuados, seleccionados en base a varias consideraciones, tal como el tipo de nanoporo usado, el tipo que molécula que se caracteriza, y varias características físicas, químicas y/o eléctricas de la bicapa lipídica formada, tal como estabilidad y permeabilidad, resistencia y capacitancia de la bicapa lipídica formada. Los materiales anfifílicos de ejemplo incluyen varios fosfolípidos tal como palmitoil-oleil-fosfatidil-colina (POPC) y dioleil-fosfatidil-metiléster (DOPME), difitanoilfosfatidilcolina (DPhPC) dipalmitoilfosfatidilcolina (DPPC), fosfatidilcolina, fosfatidiletanolamina, fosfatidilserina, ácido fosfatídico, fosfatidilinositol, fosfatidilglicerol, y esfingomielina.

Además del nanoporo de aHL mostrado anteriormente, el nanoporo puede ser de varios otros tipos de nanoporos. Los ejemplos incluyen Y-hemolisina, leucocidina, melitina, y varios otros nanoporos naturales, naturales modificados y sintéticos. Un nanoporo adecuado se puede seleccionar basado en varias características de la molécula de analito tal como el tamaño de la molécula de analito en relación al tamaño del poro del nanoporo. Por ejemplo, el nanoporo de aHL tiene un tamaño de poro restrictivo de aproximadamente 15 angstroms.

Altas densidades de matriz

La matriz de detectores de nanoporo puede tener una alta densidad de sitios discretos. Por ejemplo, un gran número de sitios por unidad de área (es decir, densidad) permite la construcción de dispositivos más pequeños, que son portátiles, de bajo coste, o tienen otras características ventajosas. Un gran número de sitios que comprenden un nanoporo y un circuito sensor puede permitir que se secuencie un gran número de moléculas de ácido nucleico a la vez. Tal sistema puede aumentar el rendimiento y/o disminuir el coste de secuenciar una muestra de ácido nucleico.

Una muestra de ácido nucleico se puede secuenciar usando un sensor (o detector) que tiene un sustrato con una superficie que comprende sitios discretos, cada sitio individual tiene un nanoporo, una polimerasa y opcionalmente al menos una enzima fosfatasa unida al nanoporo y un circuito sensor adyacente al nanoporo. El sistema puede además comprender una célula de flujo en comunicación fluida con el sustrato, la célula de flujo adaptada para administrar uno 0 más reactivos a dicho sustrato.

La superficie comprende cualquier densidad adecuada de sitios discretos (por ejemplo, una densidad adecuada para secuenciar una muestra de ácido nucleico en una cantidad determinada o para un coste determinado). La superficie puede tener una densidad de sitios discretos mayor que o igual a aproximadamente 500 sitios por 1 mm2. En algunas formas de realización, la superficie tiene una densidad de sitios discretos de aproximadamente 200, aproximadamente 300, aproximadamente 400, aproximadamente 500, aproximadamente 600, aproximadamente 700, aproximadamente 800, aproximadamente 900, aproximadamente 1000, aproximadamente 2000, aproximadamente 3000, aproximadamente 4000, aproximadamente 5000, aproximadamente 6000, aproximadamente 7000, aproximadamente 8000, aproximadamente 9000, aproximadamente 10000, aproximadamente 20000, aproximadamente 40000, aproximadamente 60000, aproximadamente 80000, aproximadamente 100000, o aproximadamente 500000 sitios por 1 mm2. En algunas formas de realización, la superficie tiene una densidad de sitios discretos de al menos 200, al menos 300, al menos 400, al menos 500, al menos 600, al menos 700, al menos 800, al menos 900, al menos 1000, al menos 2000, al menos 3000, al menos 4000, al menos 5000, al menos 6000, al menos 7000, al menos 8000, al menos 9000, al menos 10000, al menos 20000, al menos 40000, al menos 60000, al menos 80000, al menos 100000, o al menos 500000 sitios por 1 mm2.

Medida de corriente

Un chip de secuenciación basado en nanoporo puede incorporar un gran número de células que operan autónomamente o individualmente direccionables configuradas como una matriz. Un dispositivo de nanoporo puede incluir una matriz de nanoporos individualmente direccionables. Cada nanoporo individualmente direccionable puede incluir un electrodo individualmente direccionable. Por ejemplo, una matriz de un millón de células puede estar construida de 1000 filas de células por 1000 columnas de células. Esta matriz puede permitir la secuenciación paralela de moléculas de ácido nucleico midiendo la diferencia de conductancia cuando las etiquetas liberadas tras los sucesos de incorporación de nucleótidos pasan a través del nanoporo, por ejemplo. Además, esta implementación de circuitería permite que las características de conductancia del complejo poro-molecular se determine que puede ser extremadamente valioso en distinguir etiquetas específicas.

En algunos casos, se puede medir la corriente a un voltaje aplicado. Con el fin de lograr esto, se puede aplicar un potencial deseado al electrodo, y el potencial deseado se puede mantener posteriormente a lo largo de la medida. En una implementación, se puede usar una topología de integrador opamp para este fin como se describe en el presente documento. El integrador mantiene el potencial de voltaje en el electrodo por medio de retroalimentación capacitiva. El circuito integrador puede proporcionar linealidad destacada, emparejamiento célula a célula, y características de compensación. El integrador opamp típicamente requiere un gran tamaño con el fin de lograr el rendimiento requerido. Una topología de integrador más compacta se describe en el presente documento.

En algunos casos, un potencial de voltaje “Vliquid” se puede aplicar a la cámara que proporciona un potencial eléctrico común (por ejemplo, 350 mV) para todas las células en el chip. El circuito integrador puede inicializar el electrodo (que es eléctricamente la placa superior del condensador integrador) a un potencial mayor del potencial líquido común. Por ejemplo, polarizar a 450 mV puede dar un potencial positivo de 100 mV entre electrodo y líquido. Este potencial de voltaje positivo puede producir que una corriente fluya del electrodo al contacto de la cámara de líquido. En este caso, los portadores son: (a) iones K+ que fluyen a través del poro desde el lado del electrodo (trans) de la bicapa al lado del depósito de líquido (cis) de la bicapa y (b) iones cloro (Cl-) en el lado trans que reaccionan con el electrodo de plata según la siguiente reacción electroquímica: Ag Cl— > AgCl e-.

En algunos casos, el K+ fluye fuera de la célula encerrada (del lado trans al cis de la bicapa) mientras que Cl- se convierte a cloruro de plata. El lado del electrodo de la bicapa se puede volver desalinizado como resultado del flujo de corriente. En algunos casos, un material esponjoso líquido o matriz de plata/cloruro de plata puede servir como un depósito para suministrar iones Cl- en la reacción inversa que se produce en el contacto de la cámara eléctrica para completar el circuito.

En algunos casos, los electrones fluyen finalmente en el lado superior del condensador integrador que crea la corriente eléctrica que se mide. La reacción electroquímica convierte la plata a cloruro de plata y la corriente seguirá fluyendo solo siempre que haya plata disponible para convertir. El suministro limitado de plata produce una vida de electrodo dependiente de la corriente en algunos casos. En algunas formas de realización, se usan materiales de electrodo que no se gastan (por ejemplo, platino).

Circuitería de la célula

Un ejemplo de circuitería de célula se muestra en la figura 14B. Un voltaje aplicado Va se aplica a un opamp 1400 delante de una puerta transportadora de corriente MOSFET 1401. También se muestran aquí un electrodo 1402 y la resistencia del ácido nucleico y/o etiqueta detectada por el dispositivo 1403.

Un voltaje aplicado Va puede operar la puerta transportadora de corriente 1401. El voltaje resultante en el electrodo es entonces Va-Vt donde Vt es el voltaje umbral del MOSFET. En algunos casos, esto produce control limitado del voltaje real aplicado al electrodo ya que un voltaje umbral del MOSFET puede variar considerablemente sobre el proceso, voltaje, temperatura, e incluso entre dispositivos en un chip. Esta variación de Vt puede ser mayor a niveles de corriente bajos donde efectos de fuga subumbral pueden ponerse en marcha. Por tanto, con el fin de proporcionar mejor control del voltaje aplicado, se puede usar un opamp en una configuración de retroalimentación de seguimiento con el dispositivo transportador de corriente. Esto asegura que el voltaje aplicado al electrodo es Va, independiente de la variación del voltaje umbral del MOSFET.

Otro ejemplo de circuitería de célula se muestra en la figura 13 e incluye un integrador, comparador y lógica digital para desplazar en bits de control y simultáneamente desplazar el estado de la salida del comparador. La circuitería de la célula se puede adaptar para uso con sistemas y métodos proporcionados en el presente documento. Las líneas B0 a B1 pueden salir del registro de desplazamiento. Las señales analógicas son compartidas por todas las células en un banco mientras que las líneas digitales pueden estar unidas por cadena margarita de célula a célula.

La lógica digital de la célula comprende el registro de desplazamiento de datos (DSR) de 5 bit, registros de carga paralela (PLR) de 5 bit, lógica de control, y circuito integrador analógico. Usando la señal LN, los datos de control desplazados al DSR se cargan en paralelo al PLR. Estos 5 bits controlan la lógica de tiempo “romper antes de hacer” digital que controla los interruptores en la célula. Además, la lógica digital tiene un pestillo de ajuste-reajuste (SR) para registrar el cambio de la salida del comparador.

La arquitectura administra una velocidad de muestra variable que es proporcional a la corriente de la célula individual. Una corriente mayor puede producir más muestras por segundo que una corriente menor. La resolución de la medida de corriente está relacionada con la corriente que se mide. Una pequeña corriente se puede medir con resolución más fina que una gran corriente, que puede ser un beneficio sobre sistemas de medida de resolución fijada. Hay una entrada analógica que permite al usuario ajustar las velocidades de las muestras cambiando la oscilación de voltaje del integrador. Puede ser posible aumentar la velocidad de la muestra con el fin de analizar procesos biológicamente rápidos o ralentizar la velocidad de la muestra (y mediante ello ganar precisión) con el fin de analizar procesos biológicamente lentos.

La salida del integrador se inicializa al voltaje LVB (baja corriente de polarización) y se integra hasta el voltaje CMP. Se genera una muestra cada vez que la salida del integrador oscila entre estos dos niveles. Por tanto, cuanto mayor sea la corriente, más rápido oscila la salida del integrador y por tanto más rápida la velocidad de la muestra. Similarmente, si el voltaje CMP se reduce, la oscilación de salida del integrador necesaria para generar una nueva muestra se reduce y por tanto la velocidad de la muestra aumenta. Así simplemente reducir la diferencia de voltaje entre LVB y CMP proporciona un mecanismo para aumentar la velocidad de la muestra.

Un chip de secuenciación basado en nanoporo puede incorporar un gran número de células que operan de forma autónoma o individualmente direccionables configuradas en una matriz. Por ejemplo, una matriz de un millón de células puede estar construida de 1000 filas de células por 1000 columnas de células. Esta matriz puede permitir la secuenciación paralela de moléculas de ácido nucleico midiendo la diferencia de conductancia cuando las etiquetas liberadas tras los sucesos de incorporación de nucleótidos son detectadas por el nanoporo, por ejemplo. Además, esta implementación de circuito permite que las características de conductancia del complejo poro-molecular se determinen que puede ser extremadamente valioso en distinguir entre etiquetas.

Las estructuras de célula electrónica nanoporo/bicapa integrada pueden aplicar voltajes apropiados con el fin de realizar medidas de corriente. Por ejemplo, puede ser necesario tanto (a) controlar el potencial de voltaje del electrodo como (b) seguir la corriente del electrodo simultáneamente con fin de funcionar correctamente.

Además, puede ser necesario controlar las células independientemente entre sí. El control independiente de una célula se puede requerir con el fin de gestionar un gran número de células que podrían estar en diferentes estados físicos. El control preciso del estímulo de onda de voltaje lineal por partes aplicado al electrodo se puede usar para pasar entre los estados físicos de la célula.

Con el fin de reducir el tamaño y la complejidad del circuito puede ser suficiente proporcionar lógica para aplicar dos voltajes separados. Esto permite dos agrupamientos independientes de células y que se aplique el correspondiente estímulo de transición de estado. Las transiciones de estado son de naturaleza estocástica con una probabilidad relativamente baja de aparición. Por tanto, puede ser muy útil poder asegurar el voltaje de control apropiado y posteriormente realizar una medida para determinar si se ha producido la transición de estado deseada. Por ejemplo, se puede aplicar el voltaje apropiado a una célula y después medir la corriente para determinar si se ha formado una bicapa. Las células se dividen en dos grupos: (a) las que han formado una bicapa y ya no necesitan tener el voltaje aplicado. Estas células pueden tener una oscilación de 0 V aplicada con el fin de realizar la operación nula (NOP) -es decir, estar en el mismo estado y (b) las que no han formado una bicapa. Estas células tendrán aplicado otra vez el voltaje eléctrico de formación de bicapa.

Una simplificación y reducción del tamaño del circuito sustanciales se puede lograr al constreñir los voltajes aplicados permisibles a dos y células que pasan iterativamente en lotes entre los estados físicos. Por ejemplo, se puede lograr una reducción en al menos un factor de 1,1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, o 100 al constreñir los voltajes aplicados permisibles.

Aun otra implementación de la invención usando un circuito de medida compacto se muestra en la figura 14A. En algunos casos, el circuito de medida compacto se puede usar para lograr las altas densidades de matriz descritas en el presente documento. Este circuito también está diseñado para aplicar un voltaje al electrodo mientras simultáneamente se miden corrientes de bajo nivel.

La célula opera como un integrador ultra compacto (UCI) y la operación básica se describe aquí. La célula está eléctricamente conectada a un electrodo electroquímicamente activo (por ejemplo, AgCl) a través de la conexión Electrod-Sense (ELSNS). El transistor NMOS M11 realiza dos funciones independientes: (1) opera como un seguidor de fuente para aplicar un voltaje al nodo ELSNS dado por (Vg1-Vt1) y (2) opera como un transportador de corriente para mover electrones del condensador C1 al nodo ELSNS (y viceversa).

En algunos casos, se puede aplicar un potencial de voltaje controlado al electrodo ELSNS y esto se puede variar simplemente cambiando el voltaje en la puerta del seguidor de la fuente de electrodo M11. Además, cualquier corriente de la clavija de fuente M11 se propaga de forma directa y precisa a la clavija de drenaje M11 donde se puede acumular en el condensador C0. Por tanto, M11 y C0 actúan juntos como un integrador ultracompacto. Este integrador se puede usar para determinar la corriente procedente/hundida a/del electrodo midiendo el cambio en voltaje integrado en el condensador según lo siguiente: I*t = C*V, donde I es corriente, t es tiempo, C es capacitancia y V es cambio de voltaje.

En algunos casos, el cambio de voltaje se mide en un intervalo fijado t (Por ejemplo, cada 1 ms).

El transistor M2 se puede configurar como un seguidor de fuente con el fin de tamponar el voltaje del condensador y proporcionar una representación de impedancia baja del voltaje integrado. Esto previene compartir carga del cambio de voltaje en el condensador.

El transistor M3 se puede usar como un dispositivo de acceso a filas con la salida de voltaje analógica AOUT conectada como una columna compartida con muchas otras células. Solo se permite una única fila de la señal AOUT conectada a columna de modo que se mide el voltaje de una única célula.

En una implementación alternativa el transistor M3 se puede omitir al conectar el drenaje del transistor M2 a un “rail desviado” seleccionable por fila.

El transistor M4 se puede usar para reiniciar la célula a un voltaje de partida predeterminado del que el voltaje está integrado. Por ejemplo, aplicar un alto voltaje (ej: a VDD = 1,8 V) tanto a RST como RV arrastrará el condensador a un valor precargado de (VDD - Vt5). El valor de partida exacto puede variar tanto de célula a célula (debido a la variación Vt de M4 y M2) así como de medida a medida debido al ruido térmico del interruptor de reinicio (ruido sqrt(KTC)). Como resultado se usa una técnica de muestreo doble correlacionado (CDS) para medir el voltaje de partida del integrador y el voltaje final para determinar el cambio de voltaje real durante el periodo de integración.

Nótese también que el drenaje del transistor M4 puede estar conectado a un voltaje controlado RV (voltaje de reinicio). En operación normal este puede estar dirigido a VDD, sin embargo, también puede estar dirigido a un bajo voltaje. Si el “drenaje” de M4 está de hecho dirigido a tierra que el flujo que corriente se puede invertir (es decir, la corriente puede fluir de desde el electrodo al circuito a través de M1 y M4 y la noción de fuente y drenaje se pueden cambiar). En algunos casos, cuando se opera el circuito en este modo el voltaje negativo aplicado al electrodo (con respecto a la referencia líquida) está controlado por este voltaje RV (asumiendo que Vg1 y Vg5 son al menos un umbral mayor que RV). Por tanto, se puede usar un voltaje de tierra en RV para aplicar un voltaje negativo al electrodo (por ejemplo, para lograr electroporación o formación de bicapa).

Un convertidor de analógico a digital (ADC, no mostrado) mide el voltaje AOUT inmediatamente después del reinicio y otra vez después del periodo de integración (realiza medida de CDS) con el fin de determinar la corriente integrada durante un periodo de tiempo fijado. Y se puede implementar ADC por columna o usar un transistor separado para cada columna como un mux analógico para compartir un único ADC entre múltiples columnas. Este factor mux de columnas se puede variar dependiendo de los requisitos para ruido, precisión, y rendimiento.

En cualquier momento determinado, cada célula puede estar en uno de cuatro estados físicos diferentes: (1) cortocircuito a líquido, (2) bicapa formada (3) bicapa poro (4) bicapa poro moléculas de ácido nucleico y/o etiquetas.

En algunos casos, se aplica un voltaje con el fin de mover células entre estados. La operación NOP se usa para dejar una célula en un estado deseado particular mientras las otras células se estimulan con un potencial aplicado para moverlas de un estado a otro.

Esto se puede lograr al tener dos (o más) voltajes diferentes que se pueden aplicar al voltaje de portal del seguidor de fuente M1 que se usa indirectamente para controlar el voltaje aplicado al electrodo con respecto al potencial líquido. Por tanto, el transistor M5 se usa para aplicar el voltaje A mientras el transistor M6 se usa para aplicar el voltaje B. Por tanto, juntos M5 y M6 operan como un mux analógico estando dirigidos SELA o SELB altos para seleccionar el voltaje.

Puesto que cada célula puede estar en un posible estado diferente y puesto que SELA y SELB son complementarios se puede usar un elemento de memoria en cada célula para seleccionar entre voltaje A o B. Este elemento de memoria puede ser un elemento dinámico (condensador) que se refrescó en cada ciclo o un simple elemento de memoria tramposo-cerrojo (inversor con acoplamiento cruzado).

Estructura de chip de prueba opamp

En algunos ejemplos, un chip de prueba incluye una matriz de 264 sensores organizados en cuatro grupos separados (también conocidos como bancos) de 66 células sensores cada uno. Cada grupo está a su vez dividido en tres “columnas” con 22 “células” sensoras en cada columna. El nombre “célula” se da a propósito que idealmente se forma una célula virtual consistente en una capa bilipídica y nanoporo insertado encima de cada uno de los 264 sensores en la matriz (aunque el dispositivo puede operar con éxito con solo una fracción de las células sensoras así pobladas).

Hay una única almohadilla I/O analógica que aplica un potencial de voltaje al líquido contenido en un cilindro conductor montado en la superficie del dado. Este potencial “líquido” se aplica al lado superior del poro y es común a todas las células en una matriz detectora. El lado inferior del poro tiene un electrodo expuesto y cada célula sensora puede aplicar un potencial de lado inferior distinto a su electrodo. La corriente se mide después entre la conexión líquida superior y cada conexión de electrodo de la célula en el lado inferior del poro. La célula sensora mide la corriente que viaja a través del poro modulada por la molécula de etiqueta que pasa en el poro.

En algunos casos, cinco bits controlan el modo de cada célula sensora. Con referencia continuada a la figura 12, cada una de las 264 células en la matriz se pueden controlar individualmente. Se aplican valores por separado a un grupo de 66 células. El modo de cada una de las 66 células en un grupo está controlado por desplazamiento en serie en 330 (66 * 5 bits/células) valores digitales a un registro de desplazamiento de datos (DSR). Estos valores se desplazan en la matriz usando las clavijas KIN (reloj), DIN (entrada de datos) con un par de clavijas separadas para cada grupo de 66 células.

Por tanto, se usan 330 relojes para desplazar 330 bits en el registro de desplazamiento DSR. Un segundo registro de carga paralelo (PLR) de 330 bit se carga en paralelo desde este registro de desplazamiento cuando el correspondiente LIN<i> (entrada de carga) se asegura alto. Al mismo tiempo que el PLR se carga en paralelo el valor de estado de la célula se carga en el DSR.

Una operación completa puede consistir en 330 relojes para desplazar 330 bits de datos al DSR, un único ciclo de reloj con señal LIN asegurada alta, seguido por 330 ciclos de reloj para leer los datos de estado capturados desplazados fuera del DSR. La operación se segmenta de modo que 330 bits nuevos se pueden desplazar al DSR simultáneamente mientras que los 330 bits se leen fuera de la matriz. Por tanto, a una frecuencia de reloj de 50 MHz el tiempo de ciclo para una lectura es 331/50 MHz = 6,62 us.

Nucleótidos etiquetados

En algunos casos un nucleótido etiquetado comprende una etiqueta que puede ser cortada en un suceso de polimerización de un nucleótido y detectada con la ayuda de un nanoporo. La etiqueta puede estar unida al 5'-fosfato del nucleótido. En algunos casos, la etiqueta no es un fluoróforo. La etiqueta puede ser detectable por su carga, forma, tamaño o cualquier combinación de los mismos. Las etiquetas ejemplares incluyen varios polímeros. Cada tipo de nucleótido (es decir, A, C, G, T) en general comprende una etiqueta única.

Las etiquetas pueden estar localizadas en cualquier posición adecuada en el nucleótido. La figura 6 proporciona un ejemplo de un nucleótido etiquetado. Aquí, R¹es en general OH y R²es H (es decir, para ADN) u OH (es decir, para ARN), aunque otras modificaciones son aceptables. En la figura 6, X es cualquier enlazador adecuado. En algunos casos, el enlazador es cortable. Los ejemplos de enlazadores incluyen sin limitación, O, NH, S o CH². Los ejemplos de grupos químicos adecuados para la posición Z incluyen O, S, o BH³. La base es cualquier base adecuada para incorporación a un ácido nucleico incluyendo adenina, guanina, citosina, timina, uracilo, o un derivado de las mismas. También son aceptables bases universales en algunos casos.

El número de fosfatos (n) es cualquier valor entero adecuado (por ejemplo, un número de fosfatos de modo que el nucleótido se pueda incorporar a la molécula de ácido nucleico). En algunos casos, todos los tipos de nucleótidos etiquetados tienen el mismo número de fosfatos, pero esto no se requiere. En algunas aplicaciones, hay una etiqueta diferente para cada tipo de nucleótido y el número de fosfatos no se usa necesariamente para distinguir las varias etiquetas. Sin embargo, en algunos casos más de un tipo de nucleótido (por ejemplo, A, C, T, G o U) tienen la misma molécula de etiqueta y la capacidad para distinguir un nucleótido de otro se determina al menos en parte por el número de fosfatos (con varios tipos de nucleótidos que tienen un diferente valor de n). En varias formas de realización, el valor para n es 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o mayor.

Las etiquetas adecuadas se describen posteriormente. En algunos casos, la etiqueta tiene una carga que es de signo inverso relativo a la carga del resto del compuesto. Cuando la etiqueta está unida, la carga del compuesto global puede ser neutra. La liberación de la etiqueta puede producir dos moléculas, una etiqueta cargada y un nucleótido cargado. La etiqueta cargada pasa a través de un nanoporo y se detecta en algunos casos.

Se muestran más ejemplos de nucleótidos etiquetados en la figura 7. La etiqueta puede estar unida a la molécula de azúcar, la molécula de base, o cualquier combinación de las mismas. Con referencia a la figura 7, Y es una etiqueta y X es un enlazador cortable. Además, R¹, si está presente, es en general OH, -OCH²N³u -O-2-nitrobencilo, y R², si está presente, es en general H. Además, Z es en general O, S, o BH³, y n es cualquier número entero incluyendo 1, 2, 3, o 4. En algunos casos, A es O, S, CH2, CHF, CFF o NH.

Con referencia continuada a la figura 7, el tipo de base en cada análogo de dNPP es en general diferente del tipo de base en cada uno de los otros tres análogos de dNPP, y el tipo de etiqueta en cada análogo de dNPP es en general diferente del tipo de etiqueta en cada uno de los otros tres análogos de dNPP. Las bases adecuadas incluyen, pero no están limitadas a adenina, guanina, citosina, uracilo o timina, o un derivado de cada una de las mismas. En algunos casos, la base es una de 7-deazaguanina, 7-deazaadenina o 5-metilcitosina.

En casos donde R¹es -O-CH²N³, los métodos opcionalmente además comprenden tratar el análogo de dNPP incorporado de modo que se limine el -CH²N³y produzca un grupo OH unido a la posición 3' permitiendo de esta manera la incorporación de un análogo de dNPP adicional.

En casos donde R¹es -O-2-nitrobencilo, los métodos opcionalmente además comprenden tratar el análogo de dNPP incorporado de modo que se limine el -2-nitrobencilo y produzca un grupo OH unido a la posición 3' permitiendo de esta manera la incorporación de un análogo de dNPP adicional.

Etiquetas ejemplares

Una etiqueta puede ser cualquier grupo químico o molécula que se pueda detectar en un nanoporo. En algunos casos, una etiqueta comprende uno o más de etilenglicol, un aminoácido, un hidrato de carbono, un péptido, un colorante, un compuesto quimioluminiscente, un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, un hexanucleótido, un ácido alifático, un ácido aromático, un alcohol, un grupo tiol, un grupo ciano, un grupo nitro, un grupo alquilo, un grupo alquenilo, un grupo alquinilo, un grupo azido, o una combinación de los mismos.

También se contempla que la etiqueta además comprenda el número apropiado de lisinas o argininas para equilibrar el número de fosfatos en el compuesto.

En algunos casos, la etiqueta es un polímero. Polietilenglicol (PEG) es un ejemplo de un polímero y tiene la estructura como sigue:

Se puede usar cualquier número de unidades de etilenglicol (W). En algunos casos, W es un número entero entre 0 y 100. En algunos casos, el número de unidades de etilenglicol es diferente para cada tipo de nucleótido. En una forma de realización, los cuatro tipos de nucleótidos comprenden etiquetas que tienen 16, 20, 24 o 36 unidades de etilenglicol. En algunos casos, la etiqueta además comprende una fracción identificable adicional, tal como un colorante basado en cumarina.

En algunos casos, una etiqueta comprende múltiples cadenas de PEG. En un ejemplo, una etiqueta tiene la estructura como sigue:

en donde R es NH², OH, COOH, CHO, SH, o N³, y W es un número entero de 0 a 100.

En algunos casos una etiqueta se elige de las moléculas (dCp)m, (dGp)m, (dAp)m, y (dTp)m. La figura 8 muestra estas moléculas unidas a un nucleótido. Aquí, 'm' es, independientemente, un número entero de 0 a 100, y en donde cuando m es 0 el fosfato terminal del dNPP está unido directamente al átomo de O en 3' del nucleósido mostrado en el lado izquierdo de la estructura. En algunos casos, el valor de n es diferente en cada tipo de base.

En algunos casos, una etiqueta es un hidrocarbilo, sustituido o sin sustituir, tal como alquilo, alquenilo, alquinilo, y que tiene una masa de 3000 dalton o menos.

Como se usa en el presente documento, “alquilo” incluye grupos hidrocarburo alifáticos tanto ramificados como de cadena lineal que tienen el número especificado de átomos de carbono y pueden estar sin sustituir o sustituidos. Como se usa en el presente documento, “alquenilo” se refiere a un radical hidrocarburo no aromático, lineal o ramificado, que contiene al menos 1 doble enlace carbono a carbono, y pueden estar presentes hasta el máximo número posible de dobles enlaces carbono-carbono no aromáticos, y pueden estar sin sustituir o sustituidos. El término “alquinilo” se refiere a un radical hidrocarburo, lineal o ramificado, que contiene al menos 1 triple enlace carbono a carbono, y pueden estar presentes hasta el máximo número posible de triples enlaces carbono-carbono no aromáticos, y pueden estar sin sustituir o sustituidos. El término “sustituido” se refiere a un grupo funcional como se ha descrito anteriormente tal como un alquilo, o un hidrocarbilo, en el que al menos un enlace a un átomo de hidrógeno contenido en el mismo está sustituido por un enlace a átomo no hidrógeno o no carbono, siempre que se mantengan las valencias normales y que la(s) sustitución(es) produzca(n) un compuesto estable. Los grupos sustituidos también incluyen grupos en los que uno o más enlaces a un átomo de carbono(s) o hidrógeno(s) está sustituido por uno o más enlaces, incluyendo dobles o triples enlaces, a un heteroátomo.

Los ejemplos no limitantes de nucleótidos etiquetados incluyen compuestos que tienen las estructuras:

en donde 'R' es un hidrocarbilo sustituido o sin sustituir, hasta 3000 dalton, y en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina.

Ejemplos no limitantes adicionales de nucleótidos etiquetados incluyen compuestos que tienen la estructura:

en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina.

en donde m es un número entero de 1-50, y en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina.

Métodos para unir etiquetas

Cualquier método adecuado para unir las etiquetas se puede usar. En un ejemplo, las etiquetas se pueden unir al fosfato terminal al (a) poner en contacto un nucleótido trifosfato con diciclohexilcarbodiimida/dimetilformamida en condiciones que permiten la producción de un trimetafosfato cíclico; (b) poner en contacto el producto resultante de la etapa a) con un nucleófilo de modo que se forme un compuesto funcionalizado con -OH o -NH2; y (c) hacer reaccionar el producto de la etapa b) con un etiqueta que tiene un grupo -COR unido a la misma en condiciones que permiten que la etiqueta se una indirectamente al fosfato terminal formando de esta manera el análogo nucleótido trifosfato. En algunos casos, el nucleófilo es H²N-R-OH, H²N-R-NH², R'S-R-OH, R'S-R-NH², o

En algunos casos, el método comprende, en la etapa b), poner en contacto el producto resultante de la etapa a) con un compuesto que tiene la estructura:

y posteriormente o al mismo tiempo poner en contacto el producto con NH4OH de modo que se forme un compuesto que tiene la estructura:

El producto de la etapa b) se puede hacer reaccionar después con una etiqueta que tiene un grupo -COR unido a la misma en condiciones que permiten que la etiqueta se una indirectamente al fosfato terminal formando de esta manera el análogo nucleótido trifosfato que tiene la estructura:

en donde R¹es OH, en donde R²es H u OH, en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina.

Liberación de etiquetas

Una etiqueta se puede liberar de cualquier manera. En algunos casos, la etiqueta está unida a polifosfato (por ejemplo, figura 6) y la incorporación del nucleótido a una molécula de ácido nucleico produce la liberación de un polifosfato que tiene la etiqueta unida al mismo. La incorporación puede estar catalizada por al menos una polimerasa, opcionalmente unida al nanoporo. En algunos casos, al menos una enzima fosfatasa está también unida al poro. La enzima fosfatasa puede cortar la etiqueta del polifosfato para liberar la etiqueta. En algunos casos, las enzimas fosfatasas se colocan de modo que el pirofosfato producido por la polimerasa en una reacción de polimerasa interaccione con las enzimas fosfatasas antes de entrar al poro.

En algunos casos, la etiqueta no está unida a polifosfato (véase, por ejemplo, la figura 7). En estos casos, la etiqueta está unida por un enlazador cortable (X). Los métodos para la producción de análogos de nucleótidos cortablemente bloqueado y/o cortablemente unido se divulgan en la patente en EE UU No. 6.664.079.

El enlazador puede ser cualquier enlazador adecuado y cortarse en cualquier manera adecuada. Los enlazadores pueden ser fotoescindibles. En una forma de realización, se usa luz UV para cortar fotoquímicamente enlazadores y fracciones cortables fotoquímicamente. En una forma de realización, el enlazador fotoescindible es una fracción 2-nitrobencilo.

El grupo -CH²N³se puede tratar con TCEP (tris(2-carboxietil)fosfina) de modo que se elimine del átomo de O en 3' de un análogo de dNPP o análogo de rNPP, creando de esta manera un grupo 3' OH.

Detección de etiquetas

Las etiquetas pueden fluir a través de un nanoporo después de que se liberen del nucleótido. En algunos casos, se aplica un voltaje para arrastrar las etiquetas a través del nanoporo. Al menos aproximadamente el 85%, al menos el 90%, al menos el 95%, al menos el 99%, al menos el 99,9 o al menos el 99,99% de las etiquetas liberadas se pueden translocar a través del nanoporo.

En algunos casos del método, una polimerasa saca de un conjunto de nucleótidos etiquetados que comprende una pluralidad de bases diferentes (por ejemplo, A, C, G, T y/o U). También es posible poner en contacto iterativamente la polimerasa con los varios tipos de bases etiquetadas. En este caso, puede no ser necesario que cada tipo de nucleótido tenga una base única, pero el ciclo entre diferentes tipos de bases añade coste y complejidad al proceso en algunos casos, no obstante, esta forma de realización está abarcada en la presente invención.

La figura 9 muestra que la incorporación del nucleótido etiquetado en una molécula de ácido nucleico (por ejemplo, usando polimerasa para extender un cebador emparejado por bases a un molde) libera una ETIQUETA-polifosfato detectable. En algunos casos, la ETIQUETA-polifosfato se detecta según pasa a través del nanoporo. Es incluso posible distinguir el nucleótido basado en el número de fosfatos que comprende el polifosfato (por ejemplo, incluso cuando las ETIQUETAS son idénticas). No obstante, cada tipo de nucleótido en general tiene una etiqueta única.

Con referencia a la figura 9, el compuesto ETIQUETA-polifosfato se puede tratar con fosfatasa (por ejemplo, fosfatasa alcalina) antes de pasar la etiqueta a través de un nanoporo y medir la corriente iónica.

La etiqueta se puede detectar en el nanoporo (al menos en parte) debido a su carga. En algunos casos, el compuesto etiqueta es un compuesto alternativamente cargado que tiene una primera carga neta y, después de una reacción química, física o biológica, una segunda carga neta diferente. En algunos casos, la magnitud de la carga en la etiqueta es la misma que la magnitud de la carga en el resto del compuesto. En una forma de realización, la etiqueta tiene una carga positiva y la eliminación de la etiqueta cambia la carga del compuesto.

En algunos casos, según pasa la etiqueta a través del nanoporo, puede generar un cambio electrónico. En algunos casos el cambio electrónico es un cambio en la amplitud de corriente, un cambio en conductancia del nanoporo, o cualquier combinación de los mismos.

El nanoporo puede ser biológico o sintético. También se contempla que el nanoporo sea proteinaceo, por ejemplo, en donde el poro es una proteína alfa hemolisina. Un ejemplo de un nanoporo sintético es un poro de estado sólido o grafeno.

En algunos casos, enzimas polimerasas y/o enzimas fosfatasas están unidas al nanoporo. Proteínas de fusión o entrecruzamientos de disulfuro son ejemplos de métodos para unir a un nanoporo proteinaceo. En el caso de un nanoporo de estado sólido, la unión a la superficie cerca del nanoporo puede ser a través de enlaces biotinaestreptavidina. En un ejemplo la ADN polimerasa está unida a una superficie sólida a través de superficie de oro modificada con una monocapa autoensamblada de alcanotiol funcionalizada con grupos amino, en donde los grupos amino están modificados a ésteres NHS para unión a grupos amino en la ADN polimerasa.

Un aspecto de la presente divulgación proporciona un método para secuenciar una molécula de ácido nucleico. En algunas formas de realización, dicho procesador de ordenador está en una estación de trabajo que está en proximidad a dicho chip. En algunos casos, la etiqueta pasa a través del nanoporo. En algunas formas de realización, la etiqueta pasa adyacente al nanoporo. En algunas formas de realización, la velocidad de polimerización es menor que la velocidad del paso de la etiqueta a través o adyacente al nanoporo. En algunos casos, dicho electrodo está adaptado para suministrar un estímulo eléctrico a través de dicha membrana. El chip puede tener características y propiedades divulgadas en, por ejemplo, la patente en EE UU No. 8.324.914.

En algunas formas de realización, dicha membrana tiene una capacitancia mayor de aproximadamente 5 fF/pm2 medida a través de dicha membrana. En algunos casos, dicha membrana tiene una resistencia mayor que o igual a aproximadamente 500 MQ medida a través de dicha membrana. En algunas formas de realización, dicha membrana tiene una resistencia menor que o igual a aproximadamente 1 GQ a través de dicha membrana. En algunos casos, dicha resistencia se mide con la ayuda de electrodos opuestos dispuestos adyacentes a dicha membrana. En algunas formas de realización, dicha resistencia se mide con la ayuda de electrodos opuestos dispuestos adyacentes a dicha membrana.

En algunos casos, cada nanoporo individualmente direccionable se adapta para regular el flujo molecular. En algunos casos, cada nanoporo individualmente direccionable se adapta para detectar dicha etiqueta tras el flujo molecular de dicha etiqueta del mismo a través o adyacente a dicho nanoporo. En algunos casos, dicho electrodo es individualmente direccionable. En algunos casos, dicho electrodo está acoplado a un circuito integrado que procesa una señal detectada con la ayuda de dicho electrodo.

En algunos casos, dicho circuito integrado comprende un controlador lógico. En algunos casos, dicho electrodo es parte de un circuito integrado que procesa una señal detectada con la ayuda de dicho electrodo.

En algunos casos, dicha membrana es una bicapa lipídica. En algunos casos, la membrana es una bicapa lipídica de difitanoilfosfatidilcolina (DPhPC). En algunos casos, el nanoporo es un nanoporo de alfa-hemolisina. En algunos casos, dicha membrana muestra: (i) una capacitancia mayor de aproximadamente 5 fF/pm2 o una resistencia menor que o igual a aproximadamente 1 GQ a través de dicha membrana, o (ii) una capacitancia mayor de aproximadamente 5 fF/pm2 y una resistencia menor que o igual a aproximadamente 1 GQ a través de dicha membrana. En algunos casos, dicha membrana está dispuesta adyacente a una superficie compatible de membrana. En algunos casos, dicha pluralidad de nanoporos individualmente direccionables está a una densidad de al menos aproximadamente 500, 600, 700, 800, 900, 1000, 10.000, 100.000 o 1.000.000 de nanoporos individualmente direccionables por mm2.

En algunos casos, cada tipo de nucleótido comprende una etiqueta única. En algunos casos, la etiqueta está inicialmente unida al fosfato 5' del nucleótido individual. En algunos casos, el cebador hibrida con una posición específica en el molde de ácido nucleico monocatenario.

Otro aspecto de la presente divulgación proporciona un método para secuenciación de ácidos nucleicos, que comprende detectar, con ayuda de un nanoporo, la incorporación de un nucleótido en una molécula de ácido nucleico, en donde la molécula de ácido nucleico no pasa a través del nanoporo. En algunos casos, las etiquetas asociadas con los nucleótidos se liberan tras la incorporación, y en donde después de ser liberadas las etiquetas pasan a través del nanoporo.

En algunos casos, los sucesos de incorporación de nucleótidos se detectan con una precisión de al menos 4 a. En algunos casos, los sucesos de incorporación de nucleótidos se detectan con una precisión de al menos 5 a. En algunos casos, los sucesos de incorporación de nucleótidos se detectan con una precisión de al menos 6 a.

Otro aspecto de la presente divulgación proporciona un método para la secuenciación de ácidos nucleicos, que comprende detectar un subproducto de un suceso de incorporación de un nucleótido individual con la ayuda de un nanoporo. En algunos casos, el nucleótido no se detecta directamente por dicho nanoporo. En algunos casos, el subproducto del suceso de incorporación de nucleótido es una molécula de etiqueta que se libera tras dicho suceso de incorporación de nucleótido individual. En algunos casos, la molécula de etiqueta pasa a través del nanoporo. Un método para secuenciar una molécula de ácido nucleico, que comprende distinguir entre sucesos de incorporación de nucleótidos individuales con una precisión mayor de 4 a. En algunos casos, la precisión es mayor que 5 a. En algunos casos, la precisión es mayor que 6 a. En algunos casos, los sucesos de incorporación de nucleótidos se detectan con la ayuda de un nanoporo. En algunos casos, dicho nanoporo es un nanoporo individualmente direccionable. En algunos casos dicho nanoporo está en una membrana que está dispuesta adyacente a un electrodo. En algunos casos, dicho electrodo es una matriz de electrodos a una densidad de al menos aproximadamente 500 electrodos por mm2. En algunos casos, dichos sucesos de incorporación de nucleótidos individuales comprenden la incorporación de un nucleótido en una hebra de ácido nucleico que es complementaria a dicha molécula de ácido nucleico, en donde dicho nucleótido comprende una etiqueta que se libera tras la incorporación de dicho nucleótido en dicha hebra de ácido nucleico, y en donde dicha etiqueta pasa a través o adyacente a dicho nanoporo después de ser liberada de dicho nucleótido. En algunos casos, dicha etiqueta se detecta con la ayuda de dicho electrodo después de ser liberada de dicho nucleótido.

Otro aspecto de la presente divulgación proporciona un método para secuenciación de ácidos nucleicos, el método comprende: (a) proporcionar una matriz de nanoporos, en donde un nanoporo individual en dicha matriz está acoplado a una ácido nucleico polimerasa; y (b) polimerizar nucleótidos etiquetados con la polimerasa, en donde un nucleótido etiquetado individual comprende una etiqueta, y en donde la etiqueta se libera y detecta con la ayuda del nanoporo. En algunos casos, la etiqueta pasa adyacente al nanoporo después de ser liberada. En algunos casos, la etiqueta pasa a través del nanoporo después de ser liberada. En algunos casos, la velocidad de polimerización es menor que el paso de la etiqueta a través del nanoporo. En algunos casos, los nanoporos son individualmente direccionables.

Otro aspecto de la presente divulgación proporciona un nucleótido etiquetado, en donde el nucleótido comprende una etiqueta que puede ser cortada en un suceso de polimerización de nucleótido y detectada con la ayuda de un nanoporo en un chip que comprende una matriz de nanoporos. En algunos casos, la etiqueta está unida al fosfato 5' del nucleótido. En algunos casos, la etiqueta no es un fluoróforo. En algunos casos, la etiqueta es detectable por su carga, forma, tamaño, o cualquier combinación de las mismas.

Otro aspecto de la presente divulgación proporciona un sistema para secuenciar una molécula de ácido nucleico. En algunos casos, dicho electrodo está adaptado para suministrar un estímulo eléctrico a través de dicha membrana. En algunos casos dicha membrana tiene una capacitancia mayor de aproximadamente 5 fF/pm2 medida a través de dicha membrana. En algunos casos, dicha membrana tiene una resistencia mayor que o igual a aproximadamente 500 MQ medida a través de dicha membrana. En algunos casos, dicha membrana tiene una resistencia menor que o igual a aproximadamente 1 GQ a través de dicha membrana. En algunos casos, dicha resistencia se mide con la ayuda de electrodos opuestos dispuestos adyacentes a dicha membrana. En algunos casos, cada nanoporo individualmente direccionable se adapta para regular el flujo molecular. En algunos casos, cada nanoporo individualmente direccionable se adapta para regular el flujo molecular con ayuda de un estímulo eléctrico aplicado a dicho nanoporo. En algunos casos dicho procesador de ordenador está en una estación de trabajo que está en proximidad a dicho chip. En algunos casos dicho procesador de ordenador está comprendido en dicho chip. En algunos casos, dicho nanoporo individualmente direccionable se adapta para detectar dicha etiqueta tras el flujo molecular de dicha etiqueta del mismo a través o adyacente a dicho nanoporo. En algunos casos, dicho electrodo es individualmente direccionable. En algunos casos, dicho electrodo está acoplado a un circuito integrado que procesa una señal detectada con la ayuda de dicho electrodo. En algunos casos, dicho circuito integrado comprende un controlador lógico. En algunos casos, dicho electrodo es parte de un circuito integrado que procesa una señal detectada con la ayuda de dicho electrodo.

En algunos casos, dicha membrana es una bicapa lipídica. En algunos casos, el nanoporo es un nanoporo de alfahemolisina. En algunos casos, la membrana es una bicapa lipídica de difitanoilfosfatidilcolina (DPhPC). En algunos casos, dicha membrana está dispuesta adyacente a una superficie compatible de membrana. En algunos casos, dicha pluralidad de nanoporos individualmente direccionables está a una densidad de al menos aproximadamente 500 nanoporos individualmente direccionables por mm2. En algunos casos, dicha densidad de al menos aproximadamente 1000 nanoporos individualmente direccionables por mm2.

Otro aspecto de la divulgación proporciona un método para secuenciar una molécula de ácido nucleico, el método comprende proporcionar una matriz de sitios individualmente direccionables a una densidad de al menos aproximadamente 500 sitios por mm2, cada sitio tiene un nanoporo unido a una ácido nucleico polimerasa, y, en un sitio determinado de la matriz, polimerizar nucleótidos etiquetados con una polimerasa, en donde tras la polimerización una etiqueta se libera y detecta por un nanoporo en el sitio determinado. En algunos casos, el método además comprende dirigir generando, con la ayuda de un procesador, una secuencia de ácido nucleico de la molécula de ácido nucleico basada en las etiquetas detectadas. En algunos casos, la etiqueta pasa a través del nanoporo. En algunos casos, la etiqueta pasa adyacente al nanoporo. En algunos casos, la velocidad de polimerización es menor que el paso de la etiqueta a través o adyacente al nanoporo.

Métodos y sistemas para la secuenciación de etiquetas

Otro aspecto de la presente divulgación proporciona un sistema de medida de conductancia que comprende un primer y un segundo compartimento con una primera y una segunda solución de electrolitos separados por una barrera física, barrera que tiene al menos un poro con un diámetro en la escala nanométrica. El sistema puede además incluir un medio para aplicar un campo eléctrico a través de la barrera, un medio para medir un cambio en el campo eléctrico, al menos una polimerasa unida al poro, y una o más enzimas fosfatasas unidas al poro.

En una forma de realización del sistema, el poro tiene un diámetro desde aproximadamente 1 a 10 nm. En otra forma de realización, la polimerasa y las enzimas fosfatasas están covalentemente unidas al poro. En una forma de realización adicional, más enzimas fosfatasas que polimerasas están unidas al poro.

En una forma de realización del sistema, las enzimas fosfatasas están colocadas de modo que el polifosfato producido por la polimerasa en una reacción de polimerasa interacciona con las enzimas fosfatasas antes de entrar en el poro.

En otra forma de realización, la velocidad de interacción entre las enzimas fosfatasas y el polifosfato es más rápida que, o igual a, la velocidad de la polimerasa produciendo el polifosfato.

En otra forma de realización, cada uno del primer y el segundo compartimento tiene una carga eléctrica. También se contempla que el interior del poro tenga una carga negativa.

En aún otra forma de realización del sistema, el poro es biológico o sintético. También se contempla que el poro sea proteinaceo, por ejemplo, en donde el poro es una proteína alfa hemolisina.

En una forma de realización adicional del sistema, el poro es un poro de estado sólido o grafeno.

También se contempla que el sistema comprenda una matriz de poros que tiene cada uno características sustancialmente idénticas, o una matriz de poros de diferentes diámetros, o una matriz de poros en donde diferentes campos eléctricos se aplican a través de la barrera.

Se contempla además que el sistema de medida de la conductancia esté integrado con electrónica CMOS, o que el poro o matriz de poros esté integrado directamente en una matriz CMOS como se muestra en la figura 46.

Un compuesto que tiene la estructura:

en donde la etiqueta comprende uno o más de etilenglicol, un aminoácido, un hidrato de carbono, un péptido, un colorante, un compuesto quimioluminiscente, un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, un hexanucleótido, un ácido alifático, un ácido aromático, un alcohol, un grupo tiol, un grupo ciano, un grupo nitro, un grupo alquilo, un grupo alquenilo, un grupo alquinilo, un grupo azido, o una combinación de los mismos, en donde R¹es OH, en donde R²es H u OH, en donde X es O, NH, S, o CH², en donde Z es O, S, o BH³, en donde la base es adenina, guanina, citosina, uracilo, o un derivado de una de las bases, en donde n es 1, 2, 3, o 4, y en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto.

En una forma de realización del compuesto, la magnitud de la carga en la etiqueta es la misma que la magnitud de la carga en el resto del compuesto.

En otra forma de realización del compuesto, la etiqueta comprende múltiples unidades de etilengMcol, preferiblemente 16, 20, 24 o 36 unidades de etilenglicol.

En una forma de realización adicional del compuesto, la etiqueta además comprende una fracción identificable adicional, tal como un colorante basado en cumarina.

En una forma de realización, la etiqueta tiene una carga positiva. En otra forma de realización, la eliminación de la etiqueta cambia la carga del compuesto.

Una composición que comprende cuatro tipos diferentes de un compuesto que tiene la estructura:

en donde la etiqueta comprende uno o más de etilenglicol, un aminoácido, un hidrato de carbono, un péptido, un colorante, un compuesto quimioluminiscente, un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, un hexanucleótido, un ácido alifático, un ácido aromático, un alcohol, un grupo tiol, un grupo ciano, un grupo nitro, un grupo alquilo, un grupo alquenilo, un grupo alquinilo, un grupo azido, o una combinación de los mismos, en donde R¹es OH, en donde R²es H u OH, en donde X es O, NH, S, o CH², en donde Z es O, S, o BH³, en donde n es 1, 2, 3, o 4, y en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto, en donde la base de un primer tipo de compuesto es adenina o un derivado de la misma, la base de un segundo tipo de compuesto es guanina o un derivado de la misma, la base de un tercer tipo de compuesto es citosina o un derivado de la misma, y la base de un cuarto tipo de compuesto es timina o un derivado de la misma o uracilo o un derivado de la misma, y en donde la etiqueta en cada tipo de compuesto es diferente de la etiqueta en cada uno de los otros tres tipos de compuesto.

Un método para secuenciación de ácidos nucleicos, el método comprende proporcionar una matriz de sitios individualmente direccionables, cada sitio tiene un nanoporo unido a una ácido nucleico polimerasa, y, en un sitio determinado de dicha matriz, polimerizar nucleótidos etiquetados con una polimerasa, en donde una etiqueta se libera y detecta por un nanoporo en dicho sitio determinado.

En una forma de realización, la etiqueta pasa a través del nanoporo. En otra forma de realización, la velocidad de polimerización es más lenta que la velocidad del paso de la etiqueta a través del nanoporo.

Un método para secuenciación de ácidos nucleicos, el método comprende: (a) polimerizar nucleótidos etiquetados a una primera velocidad, en donde una etiqueta asociada con un nucleótido individual se libera tras la polimerización; y (b) detectar la etiqueta liberada pasándola a través de un nanoporo a una segunda velocidad, donde la segunda velocidad es más rápida que la primera velocidad.

En una forma de realización, cada tipo de nucleótido comprende una etiqueta única. En otra forma de realización, la etiqueta está inicialmente unida al fosfato 5' del nucleótido individual.

Un método para secuenciación de ácidos nucleicos, el método comprende: (a) polimerizar nucleótidos etiquetados, en donde una etiqueta asociada con un nucleótido individual se libera tras la polimerización; y (b) detectar la etiqueta liberada con la ayuda de un nanoporo.

En una forma de realización, el método además comprende dirigir la etiqueta liberada de un nucleótido individual a través del nanoporo. En otra forma de realización, cada tipo de nucleótido comprende una etiqueta única. En una forma de realización adicional, la etiqueta está inicialmente unida al fosfato 5' del nucleótido individual.

Un método para secuenciación de ácidos nucleicos, que comprende detectar, con la ayuda de un nanoporo, la incorporación de un nucleótido en una molécula de ácido nucleico, en donde dicha molécula de ácido nucleico no pasa a través del nanoporo.

En una forma de realización, las etiquetas asociadas con los nucleótidos se liberan tras la incorporación y las etiquetas pasan a través del nanoporo. En otra forma de realización, los sucesos de incorporación de nucleótidos se detectan con una precisión de al menos 4 a.

Un método para secuenciación de ácidos nucleicos, que comprende detectar un subproducto de un suceso de incorporación de un nucleótido individual con la ayuda de un nanoporo.

En una forma de realización, el nucleótido no se detecta directamente. En otra forma de realización, el subproducto del suceso de incorporación del nucleótido es una molécula de etiqueta liberada. En una forma de realización adicional, la molécula de etiqueta pasa a través del nanoporo.

Un método para secuenciación de ácidos nucleicos, que comprende distinguir entre sucesos de incorporación de nucleótidos individuales con una precisión mayor de 4 a, 5 a, o 6 a.

En una forma de realización, los sucesos de incorporación de nucleótidos se detectan con ayuda de un nanoporo. En otra forma de realización, las etiquetas asociadas con los nucleótidos se liberan tras la incorporación y las etiquetas pasan a través del nanoporo.

Un método para secuenciación de ácidos nucleicos, el método comprende proporcionar una matriz de nanoporos unidos a una ácido nucleico polimerasa y polimerizar nucleótidos etiquetados con la polimerasa, en donde la etiqueta se libera y detecta por el nanoporo.

Un nucleótido etiquetado, en donde el nucleótido comprende una etiqueta que se puede ser cortada en un suceso de polimerización de nucleótidos y detectada con la ayuda de un nanoporo.

En una forma de realización, la etiqueta está unida al fosfato 5' del nucleótido. En otra forma de realización, la etiqueta no es un fluoróforo. En una forma de realización adicional, la etiqueta es detectable por su carga, forma, tamaño o una combinación de las mismas.

Un método para determinar la identidad de un compuesto que comprende: (a) poner en contacto el compuesto con un sistema de medida de conductancia que comprende: (i) un primer y un segundo compartimento con una primera y una segunda solución de electrolitos separados por una barrera física, barrera que tiene al menos un poro con un diámetro en la escala nanométrica; (ii) un medio para aplicar un campo eléctrico a través de la barrera; (iii) un medio para medir un cambio en el campo eléctrico; (b) registrar el cambio en el campo eléctrico cuando el compuesto se transloca a través del poro en donde el cambio en el campo eléctrico es el resultado de interacción entre el compuesto, el electrolito, y el poro, y es indicativo del tamaño, carga, y composición del compuesto, permitiendo de esta manera la correlación entre el cambio y valores predeterminados para determinar la identidad del compuesto.

En una forma de realización, el método además comprende una etapa de tratar el compuesto con una enzima fosfatasa antes de la etapa (a).

Un método para determinar si un compuesto es una etiqueta o un precursor de la etiqueta que comprende: (a) poner en contacto el compuesto con un sistema de medida de conductancia que comprende: (i) un primer y un segundo compartimento con una primera y una segunda solución de electrolitos separados por una barrera física, barrera que tiene al menos un poro con un diámetro en la escala nanométrica; (ii) un medio para aplicar un campo eléctrico a través de la barrera; (iii) un medio para medir un cambio en el campo eléctrico; registrar el cambio en el campo eléctrico cuando el compuesto se transloca a través del poro; y comparar el cambio en el cambio eléctrico con valores predeterminados correspondientes a la etiqueta y el precursor de etiqueta, determinando de esta manera si el compuesto es la etiqueta o el precursor de la etiqueta.

En una forma de realización, el método además comprende una etapa de ajustar la oscilación de corriente del campo eléctrico en la etapa (a).

Un método para determinar la secuencia de nucleótidos de un ADN monocatenario, el método comprende:

(a) poner en contacto el ADN monocatenario con un sistema de medida de la conductancia que comprende: (i) un primer y un segundo compartimento con una primera y una segunda solución de electrolito separados por una barrera física, barrera que tiene al menos un poro con diámetro en la escala nanométrica; (ii) un medio para aplicar un campo eléctrico a través de la barrera; (iii) un medio para medir un cambio en el campo eléctrico; (iv) al menos una polimerasa unida al poro; y (v) más de una enzima fosfatasa unida al poro, y una composición que comprende cuatro tipos diferentes de un compuesto que tiene la estructura:

en donde la etiqueta comprende uno o más de etilenglicol, un aminoácido, un hidrato de carbono, un péptido, un colorante, un compuesto quimioluminiscente, un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, un hexanucleótido, un ácido alifático, un ácido aromático, un alcohol, un grupo tiol, un grupo ciano, un grupo nitro, un grupo alquilo, un grupo alquenilo, un grupo alquinilo, un grupo azido, o una combinación de los mismos, en donde R¹es OH, en donde R²es H u OH, en donde X es O, n H, S, o CH², en donde Z es O, S, o BH³, en donde n es 1, 2, 3, o 4, en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto, en donde la base de un primer tipo de compuesto es adenina o un derivado de la misma, la base de un segundo tipo de compuesto es guanina o un derivado de la misma, la base de un tercer tipo de compuesto es citosina o un derivado de la misma, y la base de un cuarto tipo de compuesto es timina o un derivado de la misma, y en donde la etiqueta en cada tipo de compuesto es diferente de la etiqueta en cada uno de los otros tres tipos de compuesto, en donde el ADN monocatenario está en una solución de electrolito en contacto con la polimerasa unida al poro y en donde el ADN monocatenario tiene un cebador hibridado a una porción del mismo, en condiciones que permiten que la polimerasa catalice la incorporación de uno de los compuestos en el cebador si el compuesto es complementario al residuo de nucleótido del ADN monocatenario inmediatamente 5' respecto a un residuo de nucleótido del ADN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ADN, en donde la incorporación del compuesto produce la liberación de un polifosfato que tiene la etiqueta unida al mismo, en donde la enzima fosfatasa unida al poro corta la etiqueta del polifosfato para liberar la etiqueta;

(b) determinar qué compuesto se ha incorporado al cebador para formar el producto de extensión de ADN en la etapa (a) aplicando un campo eléctrico a través de la barrera y midiendo un cambio electrónico a través del poro resultante de que la etiqueta generada en la etapa (a) se transloca a través del poro, en donde el cambio electrónico es diferente para cada tipo de etiqueta, identificando de esta manera el residuo de nucleótido en ADN monocatenario complementario al compuesto incorporado; y

(c) realizar repetidamente la etapa (b) para cada residuo de nucleótido del ADN monocatenario que se secuencia, determinando de esta manera la secuencia de nucleótidos del ADN monocatenario.

(a) poner en contacto el ADN monocatenario con un sistema de medida de la conductancia que comprende: (i) un primer y un segundo compartimento con una primera y una segunda solución de electrolito separados por una barrera física, barrera que tiene al menos un poro con diámetro en la escala nanométrica; (ii) un medio para aplicar un campo eléctrico a través de la barrera; (iii) un medio para medir un cambio en el campo eléctrico; (iv) al menos una polimerasa unida al poro; y (v) más de una enzima fosfatasa unida al poro, y un compuesto que tiene la estructura:

en donde la etiqueta comprende uno o más de etilenglicol, un aminoácido, un hidrato de carbono, un péptido, un colorante, un compuesto quimioluminiscente, un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, un hexanucleótido, un ácido alifático, un ácido aromático, un alcohol, un grupo tiol, un grupo ciano, un grupo nitro, un grupo alquilo, un grupo alquenilo, un grupo alquinilo, un grupo azido, o una combinación de los mismos, en donde R¹es OH, en donde R²es H u OH, en donde X es O, NH, S, o CH², en donde Z es O, S, o BH³, en donde la base es adenina, guanina, citosina, timina, o un derivado de una de estas bases, en donde n es 1, 2, 3, o 4, y en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto,

en donde el ADN monocatenario está en una solución de electrolito en contacto con la polimerasa unida al poro y en donde el ADN monocatenario tiene un cebador hibridado a una porción del mismo, en condiciones que permiten que la polimerasa catalice la incorporación del compuesto en el cebador si es complementario al residuo de nucleótido del ADN monocatenario inmediatamente 5' respecto a un residuo de nucleótido del ADN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ADN,

en donde si el compuesto no se incorpora, repetir iterativamente el contacto con diferentes compuestos hasta que un compuesto se incorpore, con la condición de que (1) el tipo de base en el compuesto es diferente del tipo de base de los compuestos previos, y (2) el tipo de etiqueta en el compuesto es diferente del tipo de etiqueta en cada uno de los compuestos previos,

en donde la incorporación del compuesto produce la liberación de un polifosfato que tiene la etiqueta unida al mismo,

en donde la enzima fosfatasa unida al poro corta la etiqueta del polifosfato para liberar la etiqueta;

(c) realizar iterativamente las etapas (a) y (b) para cada residuo de nucleótido del ADN monocatenario que se secuencia, determinando de esta manera la secuencia de nucleótidos del ADN monocatenario

Un método para determinar la secuencia de nucleótidos de un ARN monocatenario, el método comprende:

(a) poner en contacto el ARN monocatenario con un sistema de medida de la conductancia que comprende: (i) un primer y un segundo compartimento con una primera y una segunda solución de electrolito separados por una barrera física, barrera que tiene al menos un poro con diámetro en la escala nanométrica; (ii) un medio para aplicar un campo eléctrico a través de la barrera; (iii) un medio para medir un cambio en el campo eléctrico; (iv) al menos una polimerasa unida al poro; y (v) más de una enzima fosfatasa unida al poro, y una composición que tiene cuatro tipos diferentes de un compuesto que tiene la estructura:

en donde la etiqueta comprende uno o más de etilenglicol, un aminoácido, un hidrato de carbono, un péptido, un colorante, un compuesto quimioluminiscente, un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, un hexanucleótido, un ácido alifático, un ácido aromático, un alcohol, un grupo tiol, un grupo ciano, un grupo nitro, un grupo alquilo, un grupo alquenilo, un grupo alquinilo, un grupo azido, o una combinación de los mismos, en donde R¹es OH, en donde R²es H u OH, en donde X es O, n H, S, o CH², en donde Z es O, S, o BH³, en donde n es 1,2, 3, o 4, y en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto, en donde la base de un primer tipo de compuesto es adenina o un derivado de la misma, la base de un segundo tipo de compuesto es guanina o un derivado de la misma, la base de un tercer tipo de compuesto es citosina o un derivado de la misma, y la base de un cuarto tipo de compuesto es uracilo o un derivado de la misma, y en donde la etiqueta en cada tipo de compuesto es diferente de la etiqueta en cada uno de los otros tres tipos de compuesto,

en donde el ARN monocatenario está en una solución de electrolito en contacto con la polimerasa unida al poro y en donde el ARN monocatenario tiene un cebador hibridado a una porción del mismo, en condiciones que permiten que la polimerasa catalice la incorporación de uno de los compuestos en el cebador si el compuesto es complementario al residuo de nucleótido del ARN monocatenario inmediatamente 5' respecto a un residuo de nucleótido del ARN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ARN,

(b) determinar qué compuesto se ha incorporado al cebador para formar el producto de extensión de ARN en la etapa (a) aplicando un campo eléctrico a través de la barrera y midiendo un cambio electrónico a través del poro resultante de que la etiqueta generada en la etapa (a) se transloca a través del poro, en donde el cambio electrónico es diferente para cada tipo de etiqueta, identificando de esta manera el residuo de nucleótido en el ARN monocatenario complementario al compuesto incorporado; y

(c) realizar repetidamente la etapa (b) para cada residuo de nucleótido del ARN monocatenario que se secuencia, determinando de esta manera la secuencia de nucleótidos del ARN monocatenario.

Un método para determinar la secuencia de nucleótidos de un ARN monocatenario, el método comprende: (a) poner en contacto el ARN monocatenario con un sistema de medida de la conductancia que comprende: (i) un primer y un segundo compartimento con una primera y una segunda solución de electrolito separados por una barrera física, barrera que tiene al menos un poro con diámetro en la escala nanométrica; (ii) un medio para aplicar un campo eléctrico a través de la barrera; (iii) un medio para medir un cambio en el campo eléctrico; (iv) al menos una polimerasa unida al poro; y (v) más de una enzima fosfatasa unida al poro, y un compuesto que tiene la estructura:

en donde la etiqueta comprende uno o más de etilenglicol, un aminoácido, un hidrato de carbono, un péptido, un colorante, un compuesto quimioluminiscente, un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, un hexanucleótido, un ácido alifático, un ácido aromático, un alcohol, un grupo tiol, un grupo ciano, un grupo nitro, un grupo alquilo, un grupo alquenilo, un grupo alquinilo, un grupo azido, o una combinación de los mismos, en donde R¹es OH, en donde R²es H u OH, en donde X es O, n H, S, o CH², en donde Z es O, S, o BH³, en donde la base es adenina, guanina, citosina, uracilo, o un derivado de una de estas bases, en donde n es 1, 2, 3, o 4, y en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto,

en donde el ARN monocatenario está en una solución de electrolito en contacto con la polimerasa unida al poro y en donde el ARN monocatenario tiene un cebador hibridado a una porción del mismo, en condiciones que permiten que la polimerasa catalice la incorporación del compuesto en el cebador si es complementario al residuo de nucleótido del ARN monocatenario inmediatamente 5' respecto a un residuo de nucleótido del ARN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ARN,

(c) realizar iterativamente las etapas (a) y (b) para cada residuo de nucleótido del ARN monocatenario que se secuencia, determinando de esta manera la secuencia de nucleótidos del ARN monocatenario.

En una forma de realización del método, más enzimas fosfatasas que polimerasa están unidas al poro. En una forma de realización, el ADN o ARN monocatenario se obtiene desnaturalizando un ADN o ARN bicatenario, cualquiera que sea aplicable. En otra forma de realización, múltiples copias del mismo ADN o ARN monocatenario están inmovilizadas en una perla. También se contempla que la secuencia de nucleótidos del ADN o ARN monocatenario se determine usando múltiples copias del mismo ADN o ARN monocatenario.

En otra forma de realización, se realiza una etapa de lavado después de cada iteración de la etapa (b) para eliminar compuesto no incorporado del contacto con el ADN o ARN monocatenario. En una forma de realización adicional, se contempla una etapa después de cada iteración de la etapa (b) para determinar la identidad de una fracción identificable adicional unida a la etiqueta.

En una forma de realización del método, al menos el 85%, 90%, 95%, o 99% de las etiquetas liberadas se translocan a través del nanoporo.

En una forma de realización, el compuesto comprende además un terminador reversible, opcionalmente, el método además comprende una etapa de eliminar el terminador reversible después de cada iteración de la etapa (b), en donde el terminador reversible se elimina por medios biológicos, medios químicos, medios físicos, o por irradiación con luz.

En otra forma de realización, el interior del poro tiene una carga que es de signo inverso relativa a la carga de la etiqueta o del polifosfato que tiene la etiqueta unida al mismo.

En aún otra forma de realización, cada uno del primer y el segundo compartimento del sistema de medida de conductancia tiene una carga, opcionalmente, las cargas del primer y el segundo compartimento son de polaridad opuesta. También se contempla que las cargas del primer y el segundo compartimento sean ajustables.

En una forma de realización adicional, la velocidad de translocación de la etiqueta a través del poro en la etapa (b) se determina en base a la carga de la etiqueta y las cargas del primer y el segundo compartimento.

En aún una forma de realización adicional, cada del primer y el segundo compartimento tiene una carga de modo que en la etapa (b) la etiqueta se transloca a través del poro a una velocidad que es más rápida que, o igual a, la velocidad a la que la etiqueta o el polifosfato que tiene la etiqueta unida al mismo se libera en la etapa (a).

Un sistema de medida de conductancia que comprende:

una barrera eléctricamente resistente que separa al menos una primera y una segunda solución de electrolitos; dicha barrera eléctricamente resistente comprende al menos un poro con un diámetro en la escala nanométrica; al menos un compuesto con una etiqueta en al menos una de dichas primera y segunda soluciones de electrolitos; dicho al menos un poro está configurado para permitir que una corriente iónica se dirija a través de dichas primera y segunda soluciones de electrolitos por un potencial aplicado;

dicho al menos un poro comprende un rasgo configurado para cortar la etiqueta del compuesto para liberar la etiqueta; y

un medio de medir la corriente iónica y un medio de registrar su evolución temporal como una serie temporal, incluyendo periodos de tiempo cuando el al menos un poro está sin obstruir por la etiqueta y también periodos de tiempo cuando la etiqueta produce pulsos de conductancia reducida.

En una forma de realización del sistema, la etiqueta tiene un tiempo de residencia en el poro que es mayor que las limitaciones de ancho de banda de la corriente iónica y ruido de descarga de dicho medio de medir la corriente iónica.

Un método para delinear segmentos de una serie temporal de conductancia en regiones estadísticamente consistentes con el nivel de conductancia del poro sin obstruir, y pulsos de conductancia reducida, y también segmentos estadísticamente estacionaria en los pulsos individuales de conductancia reducida, dicha serie de tiempo de conductancia se genera con un sistema de medida de conductancia que comprende:

un medio de medir la corriente iónica y un medio de registrar su evolución temporal como una serie temporal, incluyendo periodos de tiempo cuando el al menos un poro está sin obstruir por la etiqueta u también periodos de tiempo cuando la etiqueta produce pulsos de conductancia reducida;

dicho método para delinear segmentos de una serie de tiempo de conductancia se selecciona del grupo que consiste en:

(a) una decodificación de Viterbi de la secuencia del estado de probabilidad máxima de una densidad continua de un modelo oculto de Markov estimado de la serie temporal de conductancia sin procesar;

(b) una delineación de las regiones de pulsos de conductancia reducida a través de la comparación a un umbral para la desviación del nivel de conductancia del poro abierto; y

(c) un medio para caracterizar pulsos de conductancia reducida estimando las tendencias centrales de los niveles de la corriente iónica para cada segmento, o por medida de las tendencias centrales y duración de los segmentos juntos, la medida de la tendencia central del segmento se selecciona del grupo que consiste en: (i) un parámetro medio de un componente gaussiano de un primer GMM estimado de la serie temporal de conductancia como parte de un modelo oculto de Markov de densidad continua; (ii) una media aritmética; (iii) una media truncada; (iv) una mediana; y (v) un estimador de Máximo a posteriori de la localización de la muestra, o un estimador de la probabilidad máxima de la localización de la muestra.

En otra forma de realización, el método además comprende al menos uno: (a) un estimado de probabilidad máxima de un segundo modelo de mezcla gaussiano basado en las medidas de la tendencia central de los segmentos de conductancia; (b) un pico que se encuentra por medio de interpolación y alisado de la densidad de probabilidad empírica de los estimados de las tendencias centrales de los segmentos de la serie temporal de conductancia y que encuentra raíces de las derivadas de las funciones de interpolación; y (c) otro medio de localizar los modos de estimador de distribución multimodal.

Un método para determinar al menos un parámetro de un compuesto en una solución que comprende las etapas de: colocar un primer fluido en un primer depósito;

colocar un segundo fluido en un segundo depósito, al menos uno de dicho primer y dicho segundo fluido comprende al menos un compuesto, en donde el compuesto es un nucleótido etiquetado o una etiqueta cortada de un nucleótido etiquetado; dicho primer fluido en dicho primer depósito está separado de dicho segundo fluido en dicho segundo depósito con una barrera eléctricamente resistente; dicha barrera eléctricamente resistente comprende al menos un poro;

pasar una corriente iónica a través de dicho primer fluido, dicho al menos un poro y dicho segundo fluido con un potencial eléctrico entre dicho primer y dicho segundo fluido;

medir la corriente iónica que pasa a través de dicho al menos un poro y la duración de los cambios en la corriente iónica; la medida de corriente iónica se puede llevar a cabo durante un periodo de tiempo suficiente para medir una reducción en la corriente iónica producida por el compuesto que interacciona con dicho al menos un poro; y determinar al menos un parámetro del compuesto analizando matemáticamente los cambios en la corriente iónica y la duración de los cambios en la corriente iónica durante el periodo de tiempo; dicho análisis matemático comprende al menos una etapa seleccionada del grupo que consiste en: (a) un parámetro medio de un componente gaussiano de un primer GMM estimado de la serie de tiempo de conductancia como parte de un modelo oculto de Markov de densidad continua; (b) extracción de media de sucesos; (c) Asignación de estado de sucesos de probabilidad máxima; (d) detección de umbral y promedio; (e) análisis de ventana deslizante; (f) una media aritmética; (g) una media truncada; (h) una mediana; e (i) un estimador de máximo a posteriori de la localización de la muestra, o un estimador de la probabilidad máxima de la localización de la muestra.

En una forma de realización del método, el compuesto se trata con fosfatasa antes de medir la reducción en la corriente iónica. En otra forma de realización, el compuesto es un compuesto alternativamente cargado que tiene una primera carga neta y, después de una reacción química, física o biológica, una segunda carga neta.

En otra forma de realización, el análisis matemático se selecciona del grupo que consiste en GMM, detección de umbral y promediar, y análisis de ventana deslizante.

En una forma de realización adicional, el al menos un parámetro se selecciona del grupo que consiste en la concentración, tamaño, carga y composición del compuesto.

Se contempla que una forma de realización del método comprenda una etapa de calibrar el sistema de medida de conductancia.

En una forma de realización, la precisión del método es mayor de 4a, 5a, o 6a.

Un nucleótido etiquetado, en donde el nucleótido comprende una etiqueta que puede ser cortada en un suceso de polimerización de nucleótidos y detectada con la ayuda de un nanoporo.

En una forma de realización, la etiqueta está unida al fosfato 5' del nucleótido. En otra forma de realización, la etiqueta no es un fluoróforo. En una forma de realización adicional, la etiqueta es detectable por su carga, forma, tamaño o cualquier combinación de las mismas.

En una forma de realización del sistema de medida de conductancia, la primera y segunda soluciones de electrolitos son iguales.

En una forma de realización del método, la primera y segunda soluciones de electrolitos son iguales.

Un método para la secuenciación de ácidos nucleicos, el método comprende proporcionar una matriz de sitios individualmente direccionables, cada sitio tiene un nanoporo unido a una ácido nucleico polimerasa, y, en un sitio determinado de dicha matriz, polimerizar nucleótidos etiquetados con una polimerasa, en donde una etiqueta se libera y detecta por una nanoporo endicho sitio determinado.

Un método para determinar la secuencia de nucleótidos de un ADN monocatenario que comprende:

(a) poner en contacto el ADN monocatenario, en donde el ADN monocatenario está en una solución de electrolitos en contacto con un nanoporo en una membrana y en donde el ADN monocatenario tiene un cebador hibridado a una porción del mismo, con una ADN polimerasa y cuatro análogos de desoxirribonucleótidos polifosfato (dNPP) al menos uno de los cuales puede hibridar con cada uno de un nucleótido de A, T, G o C en el ADN que se secuencia en condiciones que permiten a la ADN polimerasa catalizar la incorporación de uno de los análogos de dNPP en el cebador si es complementario al residuo de nucleótido del ADN monocatenario que está inmediatamente 5' de un residuo de nucleótido del ADN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ADN, en donde cada uno de los cuatro análogos de dNPP tiene la estructura:

en donde la base es adenina, guanina, citosina, timina o uracilo, o un derivado de una o más de estas bases, en donde R¹es OH, en donde R²es H, en donde X es O, NH, S o CH², en donde n es 1,2, 3, o 4, en donde Z es O, S, o BH³, y

con la condición de que (i) el tipo de base en cada análogo de dNPP es diferente del tipo de base en cada uno de los otros tres análogos de dNPP, y (ii) o bien el valor de n en cada análogo de dNPP es diferente del valor de n de cada uno de los otros tres análogos de dNPP, o el valor de n de cada uno de los cuatro análogos de dNPP es igual y el tipo de etiqueta en cada análogo de dNPP es diferente del tipo de etiqueta en cada uno de los otros tres análogos de dNPP, en donde la incorporación del análogo de dNPP produce la liberación de un polifosfato que tiene la etiqueta unida al mismo; y

(b) identificar qué análogo de dNPP se ha incorporado al cebador para formar el producto de extensión de ADN en la etapa (a) aplicando un voltaje a través de la membrana y midiendo un cambio electrónico a través del nanoporo resultante de que el polifosfato que tiene la etiqueta unida al mismo generado en la etapa (a) se transloca a través del nanoporo, en donde el cambio electrónico es diferente para cada valor de n, o para tipo de etiqueta diferente, cualquiera que sea aplicable, permitiendo de esta manera identificar el residuo de nucleótido en el ADN monocatenario complementario al análogo de dNPP incorporado; y

(c) realizar repetidamente la etapa (b) para cada residuo de nucleótido del ADN monocatenario que se secuencia, en donde en cada iteración de la etapa (b) identifica qué análogo de dNPP se ha incorporado al producto de extensión de ADN en la etapa (a), en donde el análogo de dNPP está localizado inmediatamente 5' de un residuo de nucleótido del ADN monocatenario hibridado al residuo de nucleótido 3' terminal del producto de extensión de ADN, determinando de esta manera la secuencia de nucleótidos del ADN monocatenario.

(a) poner en contacto el ADN monocatenario, en donde el ADN monocatenario está en una solución de electrolitos en contacto con un nanoporo en una membrana y en donde el ADN monocatenario tiene un cebador hibridado a una porción del mismo, con una ADN polimerasa y un análogo de desoxirribonucleótido polifosfato (dNPP) que puede hibridar con un nucleótido de A, T, G o C en el ADN que se secuencia en condiciones que permiten a la ADN polimerasa catalizar la incorporación del análogo de dNPP en el cebador si es complementario al residuo de nucleótido del ADN monocatenario que está inmediatamente 5' de un residuo de nucleótido del ADN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ADN, en donde el análogo de dNPP tiene la estructura:

en donde la base es adenina, guanina, citosina, uracilo o timina, o un derivado de una de estas bases, en donde R¹es -OH, -O-CH²N³, o -O-2-nitrobencilo, en donde R²es H, en donde X es O, NH, S o CH², en donde n es 1, 2, 3, o 4, en donde Z es O, S, o BH³, y

en donde si el análogo de dNPP no se incorpora, repetir iterativamente el contacto con un análogo de dNPP diferente hasta que se incorpore un análogo de dNPP, con la condición de que (i) el tipo de base en cada análogo de dNPP es diferente del tipo de base en cada uno de los otros tres análogos de dNPP, y (ii) o bien el valor de n en cada análogo de dNPP es diferente del valor de n de cada uno de los otros tres análogos de dNPP, o el valor de n de cada uno de los cuatro análogos de dNPP es igual y el tipo de etiqueta en cada análogo de dNPP es diferente del tipo de etiqueta en cada uno de los otros tres análogos de dNPP, en donde la incorporación del análogo de dNPP produce la liberación de un polifosfato que tiene la etiqueta unida al mismo;

(c) realizar repetidamente las etapas (a) y (b) para cada residuo de nucleótido del ADN monocatenario que se secuencia, en donde en cada iteración de la etapa (a) el análogo de dNPP se incorpora al producto de extensión de ADN si es complementario al residuo de nucleótido del ADN monocatenario que está localizado inmediatamente 5' de un residuo de nucleótido del ADN monocatenario hibridado al residuo de nucleótido 3' terminal del producto de extensión de ADN, determinando de esta manera la secuencia de nucleótidos del ADN monocatenario.

(a) poner en contacto el ADN monocatenario, en donde el ADN monocatenario está en una solución de electrolitos en contacto con un nanoporo en una membrana y en donde el ADN monocatenario tiene un cebador hibridado a una porción del mismo, con una ADN polimerasa y cuatro análogos de desoxirribonucleótidos polifosfato (dNPP) al menos uno de los cuales puede hibridar con cada uno de un nucleótido de A, T, G o C en el ADN que se secuencia en condiciones que permiten a la ADN polimerasa catalizar la incorporación de uno de los análogos de dNPP en el cebador si es complementario al residuo de nucleótido del ADN monocatenario que está inmediatamente 5' de un residuo de nucleótido del ADN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ADN, en donde cada uno de los cuatro análogos de dNPP tiene la estructura elegida de las siguientes:

en donde la base es adenina, guanina, citosina, uracilo o timina, o un derivado de una o más de estas bases, en donde Y es una etiqueta, Ri, si está presente, es OH, en donde R2, si está presente, es H, en donde X es un enlazador cortable, en donde Z es O, S, o BH3, en donde n es 1, 2, 3, o 4, en donde A es O, S, CH2, CHF, CFF, o NH, y

con la condición de que (i) el tipo de base en cada análogo de dNPP es diferente del tipo de base en cada uno de los otros tres análogos de dNPP, y (ii) el tipo de etiqueta en cada análogo de dNPP es diferente del tipo de etiqueta en cada uno de los otros tres análogos de dNPP;

(b) cortar la etiqueta del análogo de dNPP incorporado en la etapa (a);

(c) identificar qué análogo de dNPP se ha incorporado al cebador para formar el producto de extensión de ADN en la etapa (a) aplicando un voltaje a través de la membrana y midiendo un cambio electrónico a través del nanoporo resultante de que la etiqueta cortada en la etapa (b) se transloca a través del nanoporo, en donde el cambio electrónico es diferente para cada tipo de etiqueta diferente, permitiendo de esta manera identificar el residuo de nucleótido en el ADN monocatenario complementario al análogo de dNPP incorporado; y

(d) realizar repetidamente las etapas (b) y (c) para cada residuo de nucleótido del ADN monocatenario que se secuencia, en donde en cada iteración de la etapa (c) se identifica qué análogo de dNPP se ha incorporado al producto de extensión de ADN en la etapa (a) inmediatamente 5' de un residuo de nucleótido del ADN monocatenario hibridado al residuo de nucleótido 3' terminal del producto de extensión de ADN, determinando de esta manera la secuencia de nucleótidos del ADN monocatenario.

(a) poner en contacto el ADN monocatenario, en donde el ADN monocatenario está en una solución de electrolitos en contacto con un nanoporo en una membrana y en donde el ADN monocatenario tiene un cebador hibridado a una porción del mismo, con una ADN polimerasa y un análogo de desoxirribonucleótido polifosfato (dNPP) que puede hibridar con un nucleótido de A, T, G o C en el ADN que se secuencia en condiciones que permiten a la ADN polimerasa catalizar la incorporación del análogo de dNPP en el cebador si es complementario al residuo de nucleótido del ADN monocatenario que está inmediatamente 5' de un residuo de nucleótido del ADN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ADN, en donde el análogo de dNPP tiene la estructura elegida de las siguientes:

en donde la base es adenina, guanina, citosina, uracilo o timina, o un derivado de una o más de estas bases, en donde Y es una etiqueta, Rⁱ, si está presente, es OH, -OCH²N³, u -O-2-nitrobencilo, en donde R², si está presente, es H, en donde X es un enlazador cortable, en donde Z es O, S, o BH³, en donde n es 1, 2, 3, o 4, en donde A es O, S, CH2, CHF, CFF, o NH, y

en donde si el análogo de dNPP no se incorpora, repetir iterativamente el contacto con un análogo de dNPP diferente hasta que se incorpore un análogo de dNPP,

con la condición de que (i) el tipo de base en cada análogo de dNPP es diferente del tipo de base en cada uno de los otros análogos de dNPP, y (ii) el tipo de etiqueta en cada análogo de dNPP es diferente del tipo de etiqueta en cada uno de los otros análogos de dNPP;

(b) cortar la etiqueta del análogo de dNPP incorporado en la etapa (a); y

(c) identificar qué análogo de dNPP se ha incorporado al cebador para formar el producto de extensión de ADN en la etapa (a) aplicando un voltaje a través de la membrana y midiendo un cambio electrónico a través del nanoporo resultante de que la etiqueta cortada en la etapa (b) se transloca a través del nanoporo, en donde el cambio electrónico es diferente para cada tipo de etiqueta diferente, permitiendo de esta manera identificar el residuo de nucleótido en el ADN monocatenario complementario al análogo de dNPP incorporado;

(d) realizar repetidamente las etapas (a) a (c) para cada residuo de nucleótido del ADN monocatenario que se secuencia, en donde en cada iteración de la etapa (a) el análogo de dNPP se incorpora al producto de extensión de ADN si es complementario la residuo de nucleótido del ADN monocatenario que está inmediatamente 5' de un residuo de nucleótido del ADN monocatenario hibridado al residuo de nucleótido 3' terminal del producto de extensión de ADN, determinando de esta manera la secuencia de nucleótidos del ADN monocatenario.

En algunos casos un nucleótido etiquetado comprende una etiqueta que puede ser cortada en un suceso de polimerización de nucleótidos y detectada con ayuda de un nanoporo. La etiqueta puede estar unida al fosfato 5' del nucleótido. En algunos casos, la etiqueta no es un fluoróforo. La etiqueta puede ser detectable por su carga, forma, tamaño o cualquier combinación de las mismas. Las etiquetas ejemplares incluyen varios polímeros. Cada tipo de nucleótido (es decir, A, C, G, T) en general comprende una etiqueta única.

Las etiquetas pueden estar localizadas en cualquier posición adecuada en el nucleótido. La figura 34 proporciona algunos ejemplos no limitantes de un nucleótido etiquetado. En el primer diagrama, R¹es en general OH y R²es H (es decir, para ADN) u OH (es decir, para ARN), aunque otras modificaciones son aceptables. En la figura 34, X es cualquier enlazador adecuado. En algunos casos, el enlazador es cortable. Los ejemplos de enlazadores incluyen sin limitación, O, NH, S o CH². Los ejemplos de grupos químicos adecuados para la posición Z incluyen O, S, o BH³. La base es cualquier base adecuada para incorporación en un ácido nucleico incluyendo adenina, guanina, citosina, timina, uracilo, o un derivado de las mismas. También son aceptables bases universales en algunos casos.

También se muestran ejemplos adicionales de nucleótidos etiquetados en la figura 34. Como se muestra del segundo al cuarto diagramas la etiqueta puede estar unida a la molécula de azúcar, la molécula de base, o cualquier combinación de las mismas. Con referencia a la figura 34, Y es una etiqueta y X es un enlazador cortable. Además, R¹, si está presente, es en general OH, -OCH²N³o -O-2-nitrobencilo, y R², si está presente, es en genera1H. Además, Z es en general O, S, o BH³, y n es cualquier número entero incluyendo 1, 2, 3, o 4. En algunos casos, A es O, S, CH2, CHF, CFF o NH.

Con referencia continuada a la figura 34, el tipo de base en cada análogo de dNPP es en general diferente del tipo de base en cada uno de los otros tres análogos de dNPP, y el tipo de etiqueta en cada análogo de dNPP es en general diferente del tipo de etiqueta en cada uno de los otros tres análogos de dNPP. Las bases adecuadas incluyen, pero no están limitadas a adenina, guanina, citosina, uracilo o timina, o un derivado de cada una de las mismas. En algunos casos, la base es una de 7-deazaguanina, 7-deazaadenina o 5-metilcitosina.

En casos donde R¹es -O-CH²N³, los métodos opcionalmente además comprenden tratar el análogo de dNPP incorporado de modo que se elimine el -CH²N³y produzca un grupo OH unido a la posición 3' permitiendo de esta manera la incorporación de un análogo de dNPP adicional.

En casos donde Rⁱes -O-2-nitrobencilo, los métodos opcionalmente además comprenden tratar el análogo de dNPP incorporado de modo que se limine el 2-nitrobencilo y produzca un grupo OH unido a la posición 3' permitiendo de esta manera la incorporación de un análogo de dNPP adicional.

Una etiqueta puede ser cualquier grupo químico o molécula que se pueda detectar en un nanoporo. En una forma de realización de los métodos, la etiqueta comprende uno o más de etilenglicol, un aminoácido, un hidrato de carbono, un péptido, un colorante, un compuesto quimioluminiscente, un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, un hexanucleótido, un ácido alifático, un ácido aromático, un alcohol, un grupo tiol, un grupo ciano, un grupo nitro, un grupo alquilo, un grupo alquenilo, un grupo alquinilo, un grupo azido, o una combinación de los mismos.

En una forma de realización de los métodos, la base se selecciona del grupo que consiste en adenina, guanina, citosina, timina, 7-deazaguanina, 7-deazaadenina, o 5-metilcitosina.

En una forma de realización, los métodos además comprenden una etapa de lavado después de cada iteración de la etapa (b) para eliminar los análogos de dNPP no incorporados del contacto con el ADN monocatenario.

En una forma de realización, los métodos además comprenden una etapa de lavado después de cada iteración de la etapa (c) para eliminar los análogos de dNPP no incorporados del contacto con el ADN monocatenario.

En una forma de realización, los métodos, el ADN monocatenario, la solución de electrolitos, y el nanoporo en la membrana están localizados en un único envase.

En una forma de realización de los métodos, en donde R¹es -O-CH²N³, los métodos opcionalmente además comprenden tratar el análogo de dNPP incorporado de modo que se elimine el -CH²N³y produzca un grupo OH unido a la posición 3' permitiendo de esta manera la incorporación de un análogo de dNPP adicional.

En una forma de realización de los métodos, en donde R¹es -O-2-nitrobencilo, los métodos opcionalmente además comprenden tratar el análogo de dNPP incorporado de modo que se limine el 2-nitrobencilo y produzca un grupo OH unido a la posición 3' permitiendo de esta manera la incorporación de un análogo de dNPP adicional.

En una forma de realización de los métodos, los análogos de dNPP tienen las siguientes estructuras:

en donde Ri es OH, en donde R2 es H u OH, en donde Z es O, S, o BH3, y en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina.

En una forma de realización de los métodos la etiqueta es un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, o un hexanucleótido, en donde la base del mononucleótido, el dinucleótido, el trinucleótido, el tetranucleótido, el pentanucleótido, o el hexanucleótido es el mismo tipo de bases que la base del análogo de dNPP.

En una forma de realización de los métodos la etiqueta se elige de las siguientes:

en donde en cada estructura n es, independientemente, 1, 2, 3, o 4, y m es, independientemente, un número entero de 0 a 100, y en donde cuando m es 0 el fosfato terminal del dNPP está unido directamente al átomo de O en 3' del nucleósido mostrado en el lado izquierdo de la estructura, y en donde el valor de n es diferente para cada tipo de base.

En una forma de realización de los métodos, m es un número entero de 0 a 50. En una forma de realización de los métodos, m es un número entero de 0 a 10.

Se proporcionan varios ejemplos no limitantes de nucleótidos etiquetados. En la divulgación el análogo de dNPP tiene la estructura:

en donde R es un hidrocarbilo sustituido o sin sustituir, hasta 3000 dalton, y en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina.

En la divulgación el análogo de dNPP tiene la estructura:

En la divulgación el análogo de dNPP tiene la estructura:

En la divulgación, el análogo de dNPP tiene la estructura:

En una forma de realización de los métodos el cambio electrónico es un cambio en la amplitud de corriente.

En una forma de realización de los métodos el cambio electrónico es un cambio en la conductancia del nanoporo.

En una forma de realización de los métodos el nanoporo es biológico. En una forma de realización de los métodos el nanoporo es proteinaceo. En una forma de realización de los métodos el nanoporo comprende alfa hemolisina. En una forma de realización de los métodos el nanoporo es grafeno. En una forma de realización de los métodos el nanoporo es un nanoporo de estado sólido. En una forma de realización de los métodos el nanoporo está en una membrana de estado sólido.

En una forma de realización de los métodos el ADN monocatenario, el cebador, o la ADN polimerasa están unidos a una superficie sólida.

En otra forma de realización de los métodos el nanoporo es parte de una matriz de nanoporos.

Cualquier método adecuado para unir las etiquetas se puede usar. En un ejemplo, las etiquetas se pueden unir al fosfato terminal al (a) poner en contacto un nucleótido trifosfato con diciclohexilcarbodiimida/dimetilformamida en condiciones que permiten la producción de un trimetafosfato cíclico; (b) poner en contacto el producto resultante de la etapa a) con un nucleófilo de modo que se forme un compuesto funcionalizado con -OH o -NH²; y (c) hacer reaccionar el producto de la etapa b) con un etiqueta que tiene un grupo -COR unido al mismo en condiciones que permiten que la etiqueta se una indirectamente al fosfato terminal formando de esta manera el análogo nucleótido trifosfato.

En algunos casos, el nucleófilo es H²N-R-OH, H²N-R-NH², R'S-R-OH, R'S-R-NH², o

y posteriormente o al mismo tiempo poner en contacto el producto con NH⁴OH de modo que se forme un compuesto que tiene la estructura:

en donde Rⁱes OH, en donde R²es H u OH, en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina.

En particular es un proceso para producir un análogo de nucleótido trifosfato, en donde el análogo de nucleótido trifosfato se diferencia de un nucleótido trifosfato por tener una etiqueta unida al fosfato terminal del mismo, que comprende: (a) poner en contacto un nucleótido trifosfato con diciclohexilcarbodiimida/dimetilformamida en condiciones que permiten la producción de un trimetafosfato cíclico; y (b) poner en contacto el producto resultante de la etapa a) con una etiqueta que tiene un grupo hidroxilo o amino a la misma en condiciones que permiten la apertura nucleófila del trimetafosfato cíclico de modo que la etiqueta se una al fosfato terminal formando de esta manera el análogo nucleótido trifosfato.

Un proceso para producir un análogo de nucleótido trifosfato, en donde el análogo de nucleótido trifosfato se diferencia de un nucleótido trifosfato por tener una etiqueta unida al fosfato terminal del mismo, que comprende: (a) poner en contacto un nucleótido trifosfato con diciclohexilcarbodiimida/dimetilformamida en condiciones que permiten la producción de un trimetafosfato cíclico; (b) poner en contacto el producto resultante de la etapa a) con un nucleófilo de modo que se forme un compuesto funcionalizado con -OH o -NH²; y (c) hacer reaccionar el producto de la etapa b) con un etiqueta que tiene un grupo -COR unido a la misma en condiciones que permiten que la etiqueta se una indirectamente al fosfato terminal formando de esta manera el análogo nucleótido trifosfato.

En un aspecto del proceso presente, el nucleófilo es H²N-R-OH, H²N-R-NH², R'S-R-OH, R'S-R-NH², o

En un aspecto el proceso inmediato comprende en la etapa b), poner en contacto el producto resultante de la etapa a) con un compuesto que tiene la estructura:

y después NH⁴OH de modo que se forme un compuesto que tiene la estructura:

y hacer reaccionar producto de la etapa b) con una etiqueta que tiene un grupo -COR unido a la misma en condiciones que permiten que la etiqueta se una indirectamente al fosfato terminal formando de esta manera el análogo nucleótido trifosfato que tiene la estructura:

en donde R1 es OH, en donde R2 es H u OH, en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina.

Un proceso para producir un análogo de nucleótido tetrafosfato, en donde el análogo de nucleótido tetrafosfato se diferencia de un nucleótido tetrafosfato por tener una etiqueta unida al fosfato terminal del mismo, que comprende:

(a) poner en contacto un nucleótido trifosfato con 1,1'-carbonildiimidazol/dimetilformamida en condiciones que permiten la formación de la siguiente estructura:

en donde Ri es OH, en donde R2 es H u OH, en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina; y

(b) poner en contacto el producto resultante de la etapa a) con una etiqueta que tiene un grupo monofosfato unido a la misma en condiciones que permiten la formación del análogo de nucleótido tetrafosfato.

en donde Rⁱes OH, en donde R²es H u OH, en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina;

(b) poner en contacto el producto resultante de la etapa a) con ácido fosfórico en condiciones que permiten la formación de un nucleótido tetrafosfato;

(c) poner en contacto el nucleótido tetrafosfato con 1) carbonildiimidazol/dimetilformamida; 2) un nucleófilo y después 3) NH⁴OH de modo que se forme un compuesto un compuesto funcionalizado con -OH o -NH²; y

(d) poner en contacto el producto de la etapa c) con una etiqueta que tiene un grupo -COR unida a la misma en condiciones que permiten que la etiqueta se una indirectamente a un fosfato terminar formando de esta manera el análogo de nucleótido tetrafosfato.

En un aspecto del proceso inmediato el nucleófilo es H2N-R-OH, H2N-R-NH2, R'S-R-OH, R'S-R-Nhh, o

En un aspecto el proceso inmediato comprende en la etapa b), poner en contacto el nucleótido tetrafosfato con 1)

carbonildiimidazol/dimetilformamida; 2) un compuesto que tiene la estructura: y 3) ^{N H 4 O H}de modo que se forme un compuesto que tiene la estructura:

y poner en contacto el producto de la etapa b) con una etiqueta que tiene un grupo -COR unida a la misma en condiciones que permiten que la etiqueta se una indirectamente a un fosfato terminar formando de esta manera el análogo de nucleótido tetrafosfato que tiene la estructura:

en donde Ri es OH, en donde R2 es H u OH, en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina.

Un proceso para producir un análogo de nucleótido tetrafosfato, en donde el análogo de nucleótido tetrafosfato se diferencia de un nucleótido tetrafosfato por tener una etiqueta unida al fosfato terminal del mismo, que comprende: (a) poner en contacto un nucleótido trifosfato con 1,1'-carbonildiimidazol/dimetilformamida en condiciones que permiten la formación de la siguiente estructura:

(b) poner en contacto el producto resultante de la etapa a) con ácido fosfórico en condiciones que permiten la formación de un nucleótido tetrafosfato; y

(c) poner en contacto el nucleótido tetrafosfato con carbonildiimidazol/dimetilformamida y una etiqueta que tiene un grupo hidroxilo o amino unida a la misma de modo que se forme un compuesto que tiene la estructura:

Un proceso para producir un análogo de nucleótido pentafosfato, en donde el análogo de nucleótido pentafosfato se diferencia de un nucleótido pentafosfato por tener una etiqueta unida al fosfato terminal del mismo, que comprende: (a) poner en contacto un nucleótido trifosfato con 1,1'-carbonildiimidazol/dimetilformamida en condiciones que permiten la formación de la siguiente estructura:

en donde R1 es OH, en donde R2 es H u OH, en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina; y

(b) poner en contacto el producto resultante de la etapa a) con una etiqueta que tiene un grupo pirofosfato unido a la misma en condiciones que permiten la formación del análogo de nucleótido pentafosfato.

Un proceso para producir un análogo de nucleótido pentafosfato, en donde el análogo de nucleótido pentafosfato se diferencia de un nucleótido pentafosfato por tener una etiqueta unida al fosfato terminal del mismo, que comprende:

en donde R1 es OH, en donde R2 es H u OH, en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina;

(b) poner en contacto el producto resultante de la etapa a) con un grupo pirofosfato en condiciones que permiten la formación de un nucleótido pentafosfato; y

(c) poner en contacto el nucleótido pentafosfato con carbonildiimidazol/dimetilformamida y una etiqueta que tiene un grupo hidroxilo o amino unida a la misma de modo que se forme el análogo de nucleótido pentafosfato.

Un proceso para producir un análogo de nucleótido hexafosfato, en donde el análogo de nucleótido hexafosfato se diferencia de un nucleótido hexafosfato por tener una etiqueta unida al fosfato terminal del mismo, que comprende:

(b) poner en contacto el producto resultante de la etapa a) con una etiqueta que tiene un grupo trifosfato unido a la misma en condiciones que permiten la formación del análogo de nucleótido hexafosfato.

(b) poner en contacto el producto resultante de la etapa a) con un grupo trifosfato en condiciones que permiten la formación de un nucleótido hexafosfato; y

(c) poner en contacto el nucleótido hexafosfato con carbonildiimidazol/dimetilformamida y una etiqueta que tiene un grupo hidroxilo o amino unida a la misma de modo que se forme el análogo de nucleótido hexaafosfato.

Un compuesto que tiene la estructura:

en donde la etiqueta es etilenglicol, un aminoácido, un hidrato de carbono, un colorante, mononucleótido, dinucleótido, trinucleótido, tetranucleótido, pentanucleótido o hexanucleótido, en donde R1 es OH, en donde R2 es H u OH, en donde X es O, NH, S o CH2, en donde Z es O, S, o BH3, en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina, y en donde n es 1,2, 3, o 4.

En una forma de realización, R2 es H. En una forma de realización, R2 es OH.

En algunos casos, una etiqueta se elige de las moléculas (dCp)m, (dGp)m, (dAp)m, y (dTp)m. La figura 27(a) muestra algunos ejemplos de estas moléculas unidas de un nucleótido. Por ejemplo, un compuesto que tiene la estructura:

en donde en cada estructura n es, independientemente, 1, 2, 3, o 4, y m es, independientemente, un número entero de 0 a 100, y en donde cuando m es 0 el fosfato terminal del dNPP está unido directamente al átomo de O en 3' del nucleósido mostrado en el lado izquierdo de la estructura, en donde R¹es -OH u -O-CH²N³, y R²es H u OH. En algunos casos, el valor de n es diferente para cada tipo de base.

En una forma de realización, m es de 0 a 50. En una forma de realización, m es de 0 a 10. En una forma de realización, R¹es -OH. En una forma de realización, R²es -H. En una forma de realización, R²es -OH.

Un compuesto que tiene la estructura:

en donde m es un número entero de 0 a 100, y en donde el compuesto comprende un único tipo de base, y en donde la base es adenina, guanina, citosina, uracilo o timina, o un derivado de estas bases.

En una forma de realización, m es de 0 a 50. En una forma de realización, m es de 0 a 10.

En una forma de realización el compuesto tiene la estructura:

en donde m es un número entero de 0 a 100.

Un compuesto que tiene la estructura:

Un compuesto que tiene la estructura:

en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina, y R es un hidrocarbilo sustituido o sin sustituir, hasta 3000 dalton.

Un compuesto que tiene la estructura:

en donde la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina, y m es un número entero de 1-50.

Un compuesto que tiene la estructura:

en donde n es 1 o 2 y la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina. Un compuesto que tiene la estructura:

en donde Rⁱes -OH o -O-CH²N³, y R²es H u OH.

Un método para determinar la secuencia de nucleótidos de un ARN monocatenario que comprende:

(a) poner en contacto el ARN monocatenario, en donde el ARN monocatenario está en una solución de electrolitos en contacto con un nanoporo en una membrana y en donde el ARN monocatenario tiene un cebador hibridado a una porción del mismo, con una ARN polimerasa y cuatro análogos de ribonucleótido polifosfato (rNPP) al menos uno de los cuales puede hibridar con cada uno de un nucleótido de A, U, G, o C en el ARN que se secuencia en condiciones que permiten que la ARN polimerasa catalice la incorporación de uno de los análogos de rNPP en el cebador si es complementario a un residuo de nucleótido que está inmediatamente 5' de un residuo de nucleótido del ARN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme una producto de extensión de ARN, en donde cada uno de los cuatro análogos de rNPP tiene la estructura:

en donde la base es adenina, guanina, citosina, timina o uracilo, o un derivado de una o más de estas bases, en donde R¹es OH, en donde R²es H, en donde X es O, NH, S o CH², en donde n es 1, 2, 3, o 4, en donde Z es O, S, o BH³, y con la condición de que (i) el tipo de base en cada análogo de rNPP es diferente del tipo de base en cada uno de los otros tres análogos de rNPP, y (ii) o bien el valor de n en cada análogo de rNPP es diferente del valor de n de cada uno de los otros tres análogos de rNPP, o el valor de n de cada uno de los cuatro análogos de rNPP es igual y el tipo de etiqueta en cada análogo de rNPP es diferente del tipo de etiqueta en cada uno de los otros tres análogos de rNPP, en donde la incorporación del análogo de rNPP produce la liberación de un polifosfato que tiene la etiqueta unida al mismo; y

(b) identificar qué análogo de rNPP se ha incorporado al cebador para formar el producto de extensión de ARN en la etapa (a) aplicando un voltaje a través de la membrana y midiendo un cambio electrónico a través del nanoporo resultante de que el polifosfato que tiene la etiqueta unida al mismo generado en la etapa (a) se transloca a través del nanoporo, en donde el cambio electrónico es diferente para cada valor de n, o para tipo de etiqueta diferente, cualquiera que sea aplicable, permitiendo de esta manera identificar el residuo de nucleótido en el ADN monocatenario complementario al análogo de rNPP incorporado; y

(c) realizar repetidamente la etapa (b) para cada residuo de nucleótido del ARN monocatenario que se secuencia, en donde en cada iteración de la etapa (b) se identifica qué análogo de rNPP se ha incorporado al producto de extensión de ARN en la etapa (a), en donde el análogo de rNPP está localizado inmediatamente 5' de un residuo de nucleótido del ARN monocatenario hibridado al residuo de nucleótido 3' terminal del producto de extensión de ARN, determinando de esta manera la secuencia de nucleótidos del ARN monocatenario.

(a) poner en contacto el ARN monocatenario, en donde el ARN monocatenario está en una solución de electrolitos en contacto con un nanoporo en una membrana y en donde el ARN monocatenario tiene un cebador hibridado a una porción del mismo, con una ARN polimerasa y un análogo de ribonucleótido polifosfato (rNPP) que puede hibridar con un nucleótido de A, U, G o C en el a Rn que se secuencia en condiciones que permiten a la ARN polimerasa catalizar la incorporación del análogo de rNPP en el cebador si es complementario al residuo de nucleótido del ARN monocatenario que está inmediatamente 5' de un residuo de nucleótido del ARN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ARN, en donde el análogo de dNPP tiene la estructura:

en donde la base es adenina, guanina, citosina, uracilo o timina, o un derivado de una de estas bases, en donde R¹es -OH, -O-CH²N³, o -O-2-nitrobencilo, en donde R²es H, en donde X es O, NH, S o CH², en donde n es 1, 2, 3, o 4, en donde Z es O, S, o BH³, y en donde si el análogo de rNPP no se incorpora, repetir iterativamente el contacto con un análogo de rNPP diferente hasta que se incorpore un análogo de rNPP, con la condición de que (i) el tipo de base en cada análogo de rNPP es diferente del tipo de base en cada uno de los otros tres análogos de rNPP, y (ii) o bien el valor de n en cada análogo de rNPP es diferente del valor de n de cada uno de los otros tres análogos de rNPP, o el valor de n de cada uno de los cuatro análogos de rNPP es igual y el tipo de etiqueta en cada análogo de rNPP es diferente del tipo de etiqueta en cada uno de los otros tres análogos de rNPP, en donde la incorporación del análogo de rNPP produce la liberación de un polifosfato que tiene la etiqueta unida al mismo;

(b) identificar qué análogo de rNPP se ha incorporado al cebador para formar el producto de extensión de ARN en la etapa (a) aplicando un voltaje a través de la membrana y midiendo un cambio electrónico a través del nanoporo resultante de que el polifosfato que tiene la etiqueta unida al mismo generado en la etapa (a) se transloca a través del nanoporo, en donde el cambio electrónico es diferente para cada valor de n, o para tipo de etiqueta diferente, cualquiera que sea aplicable, permitiendo de esta manera identificar el residuo de nucleótido en el ARN monocatenario complementario al análogo de rNPP incorporado; y

(c) realizar repetidamente las etapas (a) y (b) para cada residuo de nucleótido del ARN monocatenario que se secuencia, en donde en cada iteración de la etapa (a) el análogo de rNPP se incorpora al producto de extensión de ARN si es complementario al residuo de nucleótido del ARN monocatenario que está localizado inmediatamente 5' de un residuo de nucleótido del ARN monocatenario hibridado al residuo de nucleótido 3' terminal del producto de extensión de ARN, determinando de esta manera la secuencia de nucleótidos del ARN monocatenario.

En un aspecto el análogo de dNPP tiene la estructura:

en donde n es 1 o 2 y la base es adenina, guanina, citosina, timina, uracilo, una 7-deazapurina o una 5-metilpirimidina.

En una forma de realización el nanoporo biológico está integrado con electrónica CMOS. En otra forma de realización el nanoporo de estado sólido está integrado con electrónica CMOS.

En una forma de realización la unión a la superficie sólida es través de enlaces biotina-estreptavidina. En otra forma de realización la ADN polimerasa está unida a una superficie sólida a través de superficie de oro modificada con una monocapa autoensamblada de alcanotiol funcionalizado con grupos amino, en donde los grupos amino están modificados a ésteres NHS para unión a grupos amino en la ADN polimerasa.

En una forma de realización el análogo de dNPP es un nucleósido polifosfato etiquetado en el fosfato terminal. En una forma de realización adicional, cada tipo de análogo de dNPP tiene una etiqueta de polietilenglicol que se diferencia en el tamaño de las etiquetas de polietilenglicol de cada uno de los otros tres tipos de análogos de dNPP.

En algunos casos, la etiqueta es un polímero. Polietilenglicol (PEG) es un ejemplo de un polímero. En un aspecto la etiqueta tiene la estructura como sigue:

en donde W es un número entero entre 0 y 100. Se puede usar cualquier número de unidades de etilenglicol (W). En algunos casos, W es un número entero entre 0 y 100. En algunos casos, el número de unidades de etilenglicol es diferente para cada tipo de nucleótido. En una forma de realización, los cuatro tipos de nucleótidos comprenden etiquetas que tienen 16, 20, 24 o 36 unidades de etilenglicol. En algunos casos, la etiqueta además comprende una fracción identificable adicional, tal como un colorante basado en cumarina.

En algunos casos, una etiqueta comprende múltiples cadenas de PEG. Un ejemplo de tal etiqueta tiene la estructura como sigue:

Una composición que comprende al menos cuatro análogos de desoxinucleótidos polifosfato (dNPP), cada uno tiene una estructura seleccionada de las estructuras mostradas en las reivindicaciones 74 y 75, en donde cada uno de los cuatro análogos de dNPP comprende un tipo de base que es diferente del tipo de base de los otros tres análogos de dNPP.

En una forma de realización, cada uno de los cuatro análogos de dNPP tiene una etiqueta de polietilenglicol que diferente en tamaño de las etiquetas de polietilenglicol de cada uno de los otros tres análogos de dNPP.

En una forma de realización la carga neta del nucleósido polifosfato etiquetado es neutra. En otra forma de realización, la etiqueta liberada tiene una carga positiva.

En una forma de realización, el método además comprende una etapa de tratar con fosfatasa alcalina después de la etapa b), en donde la fosfatasa alcalina hidroliza grupos fosfato libres en la etiqueta-pirofosfato liberado.

En otra forma de realización múltiples copias del ADN monocatenario se inmovilizan en una perla.

Un método como se muestra en la figura 51 para determinar la secuencia de nucleótidos de múltiples copias de la misma molécula de ADN monocatenario que comprende:

(a) tratar el ADN monocatenario en una solución de electrolitos en contacto con un nanoporo en una membrana y en donde el ADN tiene un cebador hibridado a una porción del mismo, con una ADN polimerasa y sucesivamente con cada uno de cuatro análogos de desoxirribonucleótidos etiquetados que pueden hibridar con un nucleótido de A, T, G, o C en el ADN que se secuencia en condiciones que permiten a la ADN polimerasa catalizar la incorporación del análogo al final de un producto de extensión del cebador si es complementario al residuo de nucleótido del ADN que se secuencia inmediatamente 5' de un residuo de nucleótido del ADN monocatenario que se secuencia hibridado al residuo de nucleótido 3' terminal del cebador, en donde si el análogo no se incorpora, repetir iterativamente el contacto con un análogo diferente hasta que se incorpore un análogo, con la condición de que (i) el tipo de base en cada análogo es diferente del tipo de base en cada uno de los otros análogos, y (ii) el tipo de etiqueta en cada análogo es diferente del tipo de etiqueta en cada uno de los otros análogos, en donde la incorporación del análogo produce la liberación de la etiqueta;

(b) identificar el análogo que se ha incorporado en el producto de extensión en la etapa (a) aplicando un voltaje a través de la membrana y midiendo un cambio eléctrico a través del nanoporo resultante de la etiqueta unida al análogo; y

(c) realizar repetidamente las etapas (a) y (b), para obtener de esta manera la secuencia de nucleótidos del ADN monocatenario.

Un método como se muestra en la figura 52 para determinar la secuencia de nucleótidos de múltiples copias de la misma molécula de ADN monocatenario que comprende:

(a) tratar el ADN monocatenario en una solución de electrolitos en contacto con un nanoporo en una membrana y en donde el ADN tiene un cebador hibridado a una porción del mismo, con una ADN polimerasa y cuatro análogos de desoxirribonucleótidos 3'-bloqueados al menos uno de los cuales puede hibridar con cada uno de un nucleótido de A, T, G, o C en el ADN que se secuencia en condiciones que permiten a la ADN polimerasa catalizar la incorporación del análogo al final de un producto de extensión del cebador si es complementario al residuo de nucleótido del ADN que se secuencia inmediatamente 5' de un residuo de nucleótido del ADN monocatenario que se secuencia hibridado al residuo de nucleótido 3' terminal del cebador, en donde cada análogo comprende un terminador reversible, con la condición de que (i) el tipo de base en cada análogo es diferente del tipo de base en cada uno de los otros tres análogos, y (ii) el tipo de etiqueta en cada análogo es diferente del tipo de etiqueta en cada uno de los otros tres análogos, en donde la incorporación del análogo produce la liberación de la etiqueta; (b) identificar el análogo que se ha incorporado en el producto de extensión en la etapa (a) aplicando un voltaje a través de la membrana y midiendo un cambio eléctrico a través del nanoporo resultante de la etiqueta unida al análogo;

(c) eliminar el terminador reversible del análogo que se ha incorporado en el producto de extensión en la etapa (a);

y

(d) realizar repetidamente las etapas (b) y (c), para obtener de esta manera la secuencia de nucleótidos del ADN monocatenario.

En una forma de realización, el nanoporo está integrado en un dado CMOS como se muestra en la figura 46.

Se contempla que el nanoporo tenga una carga negativa o alternativamente, tenga una carga que es de signo opuesto a la carga de la etiqueta o el polifosfato que tiene la etiqueta unida al mismo.

En una forma de realización, la velocidad de incorporación del análogo de nucleótido por la polimerasa es menor que, o alternativamente, es la misma que, la velocidad de translocación de la etiqueta o el polifosfato que tiene la etiqueta unida al mismo a través del nanoporo.

La invención además comprende obtener el ADN o ARN monocatenario que se va a secuenciar a partir de un ADN o ARN bicatenario antes de la etapa (a).

En una forma de realización, la polimerasa está unida al nanoporo.

Se contempla que la etiqueta sea detectable basada en tamaño, longitud, forma, masa, carga, o cualquier combinación de las mismas.

Se contempla que varias formas de realización del sistema de medida de conductancia también sean aplicables al método para determinar la secuencia de nucleótidos, y viceversa.

La presente divulgación también proporciona un compuesto que tiene la estructura de cualquiera de los compuestos mostrados en las figuras y/o esquemas de la presente solicitud.

La presente divulgación también proporciona un análogo de dNPP que comprende una etiqueta que tiene la estructura de cualquiera de las etiquetas mostradas en las figuras y/o esquemas de la presente solicitud.

En un aspecto, la etiqueta es un hidrocarbilo, sustituido o sin sustituir, tal como un alquilo, alquenilo, alquinilo, y que tiene una masa de 3000 dalton o menos.

En una forma de realización el ADN monocatenario, ARN, cebador o sonda está unido a un sustrato sólido a través de química de cicloadición azida 1,3-dipolar-alquino. En una forma de realización el ADN, ARN, cebador o sonda está unido a un sustrato sólido a través de una molécula de polietilenglicol. En una forma de realización el ADN, ARN, cebador o sonda está marcado con alquino. En una forma de realización el ADN, ARN, cebador o sonda está unido a un sustrato sólido a través de una molécula de polietilenglicol y el sustrato sólido está funcionalizado con azida. En una forma de realización el ADN, ARN, cebador o sonda está inmovilizado en el sustrato sólido a través de un enlace azido, un enlace alquinilo, o interacción biotina-estreptavidina. La inmovilización de ácidos nucleicos se describe en Immobilization of DNA on Chips II, editado por Christine Wittmann (2005), Springer Verlag, Berlín. En una forma de realización el ADN es ADN monocatenario. En una forma de realización el ARN es ARN monocatenario.

En una forma de realización el sustrato sólido está en forma de un chip, una perla, un pocillo, un tubo capilar, un portaobjetos, una oblea, un filtro, una fibra, un medio poroso, un nanotubo poroso, o una columna. Esta invención también proporciona el método inmediato, en donde el sustrato sólido es un metal, oro, plata, cuarzo, sílice, un plástico, polipropileno, un vidrio, o diamante. Esta invención también proporciona el método inmediato, en donde el sustrato sólido es una sustancia no metálica porosa a la que se une o impregna un metal o combinación de metales. La superficie sólida puede estar en diferentes formas incluyendo los ejemplos no limitantes de un chip, una perla, un tubo, una matriz, un nanotubo. La superficie sólida puede estar hecha de materiales comunes para micromatrices de ADN, incluyendo los ejemplos no limitantes de vidrio o nailon. La superficie sólida, por ejemplo, perlas/microperlas, puede estar a su vez inmovilizada a otra superficie sólida tal como un chip.

En una forma de realización las muestras de ácido nucleico, ADN, ARN, cebador o sonda están separadas en compartimentos discretos, pocillos o depresiones en una superficie o en un envase.

Esta invención también proporciona el método inmediato, en donde aproximadamente 1000 o menos copias de la muestra de ácido nucleico, ADN, ARN, cebador o sonda, están unidas a la superficie sólida. Esta invención también proporciona el método inmediato, en donde 2x107, 1x107, 1x106 o 1x104 o menos copias de la muestra de ácido nucleico, ADN, ARN, cebador o sonda, están unidas a la superficie sólida.

En una forma de realización la muestra de ácido nucleico inmovilizado, ADN, ARN, cebador o sonda está inmovilizada a alta densidad. Esta invención también proporciona el método inmediato, en donde más o hasta 1x107, 1x108, 1x109 copias de la muestra de ácido nucleico, Ad N, ARN, cebador o sonda, están unidas al sustrato sólido.

En una forma de realización la ADN polimerasa es 9°N polimerasa o una variante de la misma, ADN polimerasa I de E. coli, ADN polimerasa del bacteriófago T4, Sequenase, ADN polimerasa Taq o 9°N polimerasa (exo-)A485L/Y409V.

En una forma de realización de los métodos o de las composiciones descritas en el presente documento, el ADN es monocatenario. En una forma de realización de los métodos o de las composiciones descritas en el presente documento, el ARN es monocatenario, Phi29, o variantes del mismo.

En una forma de realización de los métodos descritos para secuenciación de ARN, la polimerasa es una ARN polimerasa, transcriptasa inversa o polimerasa apropiada para polimerización de ARN.

Los enlazadores pueden ser fotoescondibles. En una forma de realización se usa luz UV para cortar fotoquímicamente los enlazadores y fracciones fotoquímicamente cortables. En una forma de realización, el enlazador fotoescindible es una fracción 2-nitrobencilo.

El grupo -CH²N³se puede tratar con TCEP (tris(2-carboxietil)fosfina) para eliminarlo del átomo de O en 3' de un análogo de dNPP, o análogo de rNPP, creando de esta manera un grupo 3' OH.

Una etiqueta se puede liberar de cualquier manera. En algunos casos, la etiqueta está unida a polifosfato (por ejemplo, figura 34) y la incorporación del nucleótido a una molécula de ácido nucleico produce la liberación de un polifosfato que tiene la etiqueta unida al mismo. La incorporación puede estar catalizada por al menos una polimerasa, opcionalmente unida al nanoporo. En algunos casos, al menos una enzima fosfatasa está también unida al poro. La enzima fosfatasa puede cortar la etiqueta del polifosfato para liberar la etiqueta. En algunos casos, las enzimas fosfatasas se colocan de modo que el pirofosfato producido por la polimerasa en una reacción de polimerasa interaccione con las enzimas fosfatasas antes de entrar al poro.

En algunos casos, la etiqueta no está unida a polifosfato (véase, por ejemplo, la figura 34). En estos casos, la etiqueta está unida por un enlazador cortable (X). Los métodos para la producción de análogos de nucleótidos cortablemente bloqueado y/o cortablemente unido se divulgan en la patente en EE UU No. 6.664.079.

El enlazador puede ser cualquier enlazador adecuado y cortarse en cualquier manera adecuada. Por ejemplo, los enlazadores pueden ser fotoescindibles. En una forma de realización, se usa luz que no es dañina para ADN para cortar fotoquímicamente enlazadores y fracciones cortables fotoquímicamente. En una forma de realización, el enlazador fotoescindible es una fracción 2-nitrobencilo. En otra forma de realización, el grupo -CH²N³se puede tratar con TCEP (tris(2-carboxietil)fosfina) de modo que se elimine del átomo de O en 3' de un análogo de dNPP o análogo de rNPP, creando de esta manera un grupo 3' OH.

Un “residuo de nucleótido” es un único nucleótido en el estado que existe después de ser incorporado a, y por tanto convirtiéndose en un monómero de, un polinucleótido. Por tanto, un residuo de nucleótido es un monómero de nucleótido de un polinucleótido, por ejemplo ADN, que está unido a un monómero de nucleótido adyacente del polinucleótido mediante un enlace fosfodiéster en la posición 3' de su azúcar y está unido a un segundo monómero de nucleótido adyacente mediante su grupo fosfato, con las excepciones que (i) un residuo de nucleótido 3' terminal solo está unido a un monómero de nucleótido adyacente del polinucleótido por un enlace fosfodiéster de su grupo fosfato, y (ii) un residuo de nucleótido 5' terminal solo está unido a un monómero de nucleótido adyacente del polinucleótido por un enlace fosfodiéster de la posición 3' de su azúcar.

Debido a las reglas de emparejamiento de bases bien entendidas, determinar la identidad (de la base) del análogo de dNPP (o análogo de rNPP) incorporado a un cebador o producto de extensión de ADN (o producto de extensión de ARN) midiendo la señal eléctrica única de la etiqueta que se transloca a través del nanoporo, y de esta manera la identidad del análogo de dNPP (o análogo de rNPP) que se incorporó, permite la identificación del residuo de nucleótido complementario en el polinucleótido monocatenario al que el cebador o producto de extensión de ADN (o producto de extensión de ARN) hibrida. Por tanto, si el análogo de dNPP que se incorporó comprende una adenina, una timina, una citosina o una guanina, entonces el residuo de nucleótido complementario en el ADN monocatenario se identifica como una timina, una adenina, una guanina o una citosina, respectivamente. La purina adenina (A) se empareja con la pirimidina timina (T). La pirimidina citosina (C) se empareja con la purina guanina (G). Similarmente, con respecto a ARN, si el análogo de rNPP que se incorporó comprende una adenina, un uracilo, una citosina o una guanina, entonces el residuo de nucleótido complementario en el ARN monocatenario se identifica como un uracilo, una adenina, una guanina o una citosina, respectivamente.

La incorporación a un oligonucleótido o polinucleótido (tal como un cebador o hebra de extensión de ADN) de un análogo de dNPP o rNPP significa la formación de un enlace fosfodiéster entre el átomo de carbono 3' del residuo del nucleótido 3' terminal del polinucleótido y el átomo de carbono 5' del análogo de dNPP o análogo de rNPP, respectivamente.

Como se usa en el presente documento, a menos que se especifique otra cosa, una base (por ejemplo, de un análogo de nucleótido polifosfato) que es diferente del tipo de base de una molécula referenciada, por ejemplo, otro análogo de nucleótido polifosfato, significa que la base tiene una estructura química diferente de las otras base o bases de referencia. Por ejemplo, una base que es diferente de adenina puede incluir una base que es guanina, una base que es uracilo, una base que es citosina, y una base que es timina. Por ejemplo, una base que es diferente de adenina, timina y citosina, puede incluir una base que es guanina y una base que es uracilo.

Como se usa en el presente documento, a menos que se especifique otra cosa, una etiqueta (por ejemplo, de un análogo de nucleótido polifosfato) que es diferente del tipo de etiqueta de una molécula referenciada, por ejemplo, otro análogo de nucleótido polifosfato, significa que la etiqueta tiene una estructura química diferente de las otras etiqueta o etiquetas de referencia.

En algunos casos del método, una polimerasa saca de un conjunto de nucleótidos etiquetados que comprende una pluralidad de bases diferentes (por ejemplo, A, C, G, T y/o U). También es posible poner en contacto iterativamente la polimerasa con los varios tipos de bases etiquetadas. En este caso, puede no ser necesario que cada tipo de nucleótido tenga una base única, pero el ciclado entre diferentes tipos de bases añade coste y complejidad al proceso en algunos casos, no obstante, esta forma de realización está abarcada en la presente invención.

Con referencia a la figura 28, el compuesto ETIQUETA-polifosfato se puede tratar con fosfatasa (por ejemplo, fosfatasa alcalina) antes de pasar la etiqueta a través de un nanoporo y medir la corriente iónica.

“Nanoporo”, como se usa en el presente documento, en general se refiere a un poro, canal o paso formado o proporcionado de otra manera en una membrana. “Nanoporo” incluye, por ejemplo, una estructura que comprende (a) un primer y un segundo compartimento separados por una barrera física, barrera que tiene al menos un poro con un diámetro, por ejemplo, de aproximadamente 1 a 10 nm, y (b) un medio para aplicar un campo eléctrico a través de la barrera de modo que una molécula cargada tal como ADN, nucleótido, análogo de nucleótido, o etiqueta, pueda pasar del primer compartimento a través del poro al segundo compartimento. El nanoporo idealmente además comprende un medio para medir la firma electrónica de una molécula que pasa a través de su barrera. La barrera del nanoporo puede ser sintética o natural en parte. Una barrera/membrana puede ser una membrana orgánica, tal como una bicapa lipídica, o una membrana sintética, tal como una membrana formada de un material polimérico. Las barreras pueden incluir, por ejemplo, bicapas lipídicas que tienen en las mismas alfa-hemolisina, canales de proteínas oligoméricos tal como porinas, y péptidos sintéticos y similares. Las barreras también pueden incluir placas inorgánicas que tienen uno o más agujeros de un tamaño adecuado. El nanoporo puede estar dispuesto adyacente o en proximidad a un circuito sensor, tal como, por ejemplo, un semiconductor complementario de óxido metálico (CMOS) o circuito transistor de efecto campo (FET). Un nanoporo puede tener una anchura o diámetro característico en el orden de 0,1 nanómetros (nm) a aproximadamente 1000 nm. El nanoporo puede ser biológico o sintético. También se contempla que el nanoporo sea proteinaceo, alfa hemolisina es un ejemplo de un nanoporo de proteína. Un ejemplo de un nanoporo sintético es un poro de estado sólido o grafeno. En el presente documento “nanoporo”, “barrera de nanoporo”, y el “poro” en la barrera de nanoporo algunas veces se usan de forma equivalente.

En algunos casos, enzimas polimerasas y/o enzimas fosfatasas están unidas al nanoporo. Proteínas de fusión o entrecruzamientos de disulfuro son ejemplos de métodos para unir a un nanoporo proteinaceo. En el caso de un nanoporo de estado sólido, la unión a la superficie cerca del nanoporo puede ser a través de enlaces de biotinaestreptavidina. n un ejemplo, la ADN polimerasa está unida a una superficie sólida a través de una superficie de oro modificada con una monocapa autoensamblada de alcanotiol funcionalizada con grupos amino, en donde los grupos amino están modificados a ésteres NHS para unión a los grupos amino en la ADN polimerasa.

En el presente documento se describen métodos, dispositivos y sistemas para secuenciar ácidos nucleicos usando un nanoporo. Los métodos pueden detectar de forma precisa sucesos de incorporación de nucleótidos individuales, tal como tras la incorporación de un nucleótido en una hebra en crecimiento que es complementaria a un molde. Una enzima (por ejemplo, ADN polimerasa) puede incorporar nucleótidos a una cadena polinucleotídica en crecimiento, en donde el nucleótido añadido es complementario a la correspondiente hebra de ácido nucleico del molde que está hibridada con la hebra en crecimiento (por ejemplo, reacción en cadena de la polimerasa (PCR)). Estos sucesos de incorporación de nucleótidos liberan etiquetas de los nucleótidos que pasan a través de un nanoporo y son detectados. De esta manera, la base incorporada se puede identificar (es decir, A, C, G, T o U) porque una etiqueta única se libera de cada tipo de nucleótido (es decir, A, C, G, T o U).

Los sucesos de incorporación de nucleótidos se pueden detectar en tiempo real (es decir, según se producen) y con la ayuda de un nanoporo. En algunos casos, una enzima (por ejemplo, ADN polimerasa) unida a o en proximidad al nanoporo puede facilitar el flujo de una molécula de ácido nucleico a través de un nanoporo. Un suceso de incorporación de nucleótido, o la incorporación de una pluralidad de nucleótidos, puede liberar una o más moléculas de etiqueta (también “etiquetas” en el presente documento), que se pueden detectar por un nanoporo según las etiquetas fluyen a través del nanoporo. En algunos casos, una enzima unida a o en proximidad al nanoporo puede ayudar en detectar etiquetas u otros subproductos liberados tras la incorporación de uno o más nucleótidos.

Los métodos descritos en el presente documento pueden ser métodos de molécula única. Es decir, la señal que se detecta se genera por una única molécula (es decir, incorporación de nucleótido único) y no está generada de una pluralidad de moléculas clonales. El método puede no requerir amplificación de ADN.

Los sucesos de incorporación de ácido nucleicos se pueden producir de una mezcla que comprende una pluralidad de nucleótidos (por ejemplo, desoxirribonucleótido trifosfato (dNTP donde N es adenosina (A), citidina (C), timidina (T), guanosina (G) o uridina (U)). Los sucesos de incorporación de nucleótidos no se producen necesariamente de soluciones alternantes de una pluralidad de nucleótidos (por ejemplo, dATP, seguido por dCTP, seguido por dGTP, seguido por dTTP, seguido por dATP).

Los dispositivos de nanoporos y sistemas de la presente divulgación se pueden combinar con o modificar por otros dispositivos de nanoporos, tal como los descritos en las patentes en EE UU No. 7.005.264 B2; 7.846.738; 6.617.113; 6.746.594; 6.673.615; 6.627.067; 6.464.842; 6.362.002; 6.267.872; 6.015.714; 5.795.782; y publicaciones en EE UU No. 2004/0121525, 2003/0104428, y 2003/0104428.

En una forma de realización de las moléculas y los métodos divulgados en el presente documento la etiqueta está unida al resto de la molécula por un enlazador químico que es cortable.

En una forma de realización el nanoporo está en una membrana de estado sólido. En una forma de realización la membrana es una membrana de nitruro de silicio. En una forma de realización el nanoporo es un bioporo. En una forma de realización el poro es proteinaceo. En una forma de realización el poro es un poro de alfa-hemolisina. En una forma de realización el poro es un poro de grafeno.

En una forma de realización el ADN, ARN o ácido nucleico monocatenario está localizado en un lado de la membrana en el que el nanoporo está localizado y la membrana está localizada en una solución de electrolitos conductora.

Donde se proporciona un intervalo de valores, a menos que el contexto claramente dicte otra cosa, se entiende que cada número entero intermedio del valor, y cada décimo de cada número entero intermedio del valor, a menos que el contexto claramente dicte otra cosa, entre el límite superior e inferior de ese intervalo, y cualquier otro valor manifestado o intermedio en ese intervalo manifestado, está abarcado en la invención. Los límites superior e inferior de estos intervalos menores pueden estar independientemente incluidos en los intervalos menores, y también están abarcados en la invención, sometidos a cualquier límite específicamente excluido en el intervalo manifestado. Donde el intervalo manifestado incluye uno o ambos límites, los intervalos que excluyen (i) cualquiera o (ii) ambos de esos límites incluidos también están incluido en la invención.

Todas las combinaciones de los varios elementos descritos en el presente documento están dentro del ámbito de la invención. Todas las subcombinaciones de los varios elementos descritos en el presente documento también están dentro del ámbito de la invención.

En el presente documento se proporcionan sistemas y métodos para secuenciar una molécula de ácido nucleico con la ayuda de un nanoporo. El nanoporo puede estar formado o de otra forma embebido en una membrana dispuesta adyacente a un circuito sensor, tal como un transistor de efecto campo o un semiconductor complementario de óxido metálico (CMOS). En algunos casos, según un ácido nucleico o etiqueta fluye a través del nanoporo, el circuito sensor detecta una señal eléctrica asociada con el ácido nucleico o etiqueta. El ácido nucleico puede ser una subunidad de una hebra más grande. La etiqueta puede ser un subproducto de un suceso de incorporación de un ácido nucleico u otra interacción entre un ácido nucleico etiquetado y el nanoporo o una especie adyacente al nanoporo, tal como una enzima que corta la etiqueta de un ácido nucleico.

Los subproductos de los sucesos de incorporación de nucleótidos se pueden detectar por el nanoporo. “Sucesos de incorporación de nucleótidos” son la incorporación de un nucleótido a una cadena de polinucleótido en crecimiento. Un subproducto puede estar correlacionado con la incorporación de un tipo de nucleótido determinado. Los sucesos de incorporación de nucleótidos en general están catalizados por una enzima, tal como ADN polimerasa, y usan interacciones de pares de bases con una molécula molde para elegir entre los nucleótidos disponibles para la incorporación en cada localización.

En algunos casos, la ADN polimerasa es 9°N polimerasa o una variante de la misma, ADN polimerasa I de E. Coli, ADN polimerasa del bacteriófago T4, Sequenasa, Taq ADN polimerasa, 9°N polimerasa (exo-)A485L/Y409V o ADN polimerasa de Phi29 (ADN polimerasa de 929).

En algunos casos, una única etiqueta se libera tras la incorporación de un único nucleótido y es detectada por un nanoporo. En otros casos, una pluralidad de etiquetas se libera tras la incorporación de una pluralidad de nucleótidos. Un sensor de nanoporo adyacente a un nanoporo puede detectar una etiqueta individual liberada o una pluralidad de etiquetas liberadas. Se puede detectar y procesar una o más señales asociadas con una pluralidad de etiquetas liberadas para dar una señal promediada.

Los métodos proporcionados en el presente documento pueden distinguir con precisión entre sucesos de incorporación de nucleótidos individuales (por ejemplo, sucesos de molécula única). Los métodos pueden distinguir con precisión entre sucesos de incorporación de nucleótidos individuales es un único pase -es decir, sin tener que resecuenciar una molécula de ácido nucleico determinada.

Un método para secuenciación de ácidos nucleicos comprende distinguir entre sucesos de incorporación de nucleótidos individuales con una precisión de más de aproximadamente 4 a. En algunos casos, los sucesos de incorporación de nucleótidos se detectan con ayuda de un nanoporo. Las etiquetas asociadas con los nucleótidos se pueden liberar tras la incorporación y las etiquetas pasan a través del nanoporo. Una etiqueta diferente puede estar asociada con y/o liberada de cada tipo de nucleótido (por ejemplo, A, C, T, G) y se detecta según pasa a través del nanoporo. Los errores incluyen, pero no están limitados a, (a) no poder detectar una etiqueta, (b) identificar mal una etiqueta, (c) detectar una etiqueta donde no hay etiqueta, (d) detectar etiquetas en el orden incorrecto (por ejemplo, dos etiquetas se liberan en un primer orden, pero pasan una a otra y se detectan en un segundo orden), (e) una etiqueta que no se ha liberado de un nucleótido se detecta como que se libera, o cualquier combinación de las mismas. En algunas formas de realización, la precisión de distinguir entre sucesos de incorporación de nucleótidos individuales es el 100% restado por la tasa a la que se producen errores (es decir, tasa de errores).

La precisión de distinguir entre sucesos de incorporación de nucleótidos individuales es cualquier porcentaje adecuado. En algunos casos, la precisión de distinguir entre sucesos de incorporación de nucleótidos individuales se describe en unidades sigma (a). Sigma es una variable estadística que algunas veces se usa en gestión de empresas y estrategia de fabricación para describir tasas de errores tal como el porcentaje de productos sin defectos. Aquí, los valores de sigma se pueden usar de forma intercambiable con precisión según la relación como sigue: 4 a es precisión del 99,38%, 5 a es precisión del 99,977%, y 6 a es precisión del 99,99966%.

El método puede implicar secuenciar una hebra de ácido nucleico molde añadiendo nucleótidos etiquetados a una hebra complementaria a la hebra molde y detectar las moléculas de etiqueta liberadas en un nanoporo. Los métodos divulgados en el presente documento se pueden combinar con otros métodos de secuenciación, tal como, por ejemplo, los descritos en la patente en EE UU No. 5.470.724.

Otro aspecto de la presente divulgación proporciona un sistema de medida de la conductancia que comprende: (a) un primer y segundo compartimento con una primera y segunda solución de electrolito separadas por una barrera física, barrera que tiene al menos un poro con un diámetro en la escala nanométrica; (b) un medio para aplicar un campo eléctrico a través de la barrera; (c) un medio para medir cambio en el campo eléctrico; (d) al menos una polimerasa unida al poro adyacente a la entrada del poro, y (e) más de una enzima fosfatasa unida al poro.

En algunos casos, el poro tiene un diámetro desde aproximadamente 1 a 10 nm. En algunos casos, la polimerasa y las enzimas fosfatasas están covalentemente unidas al poro. En algunos casos, más enzimas fosfatasas que polimerasas están unidas al poro. En algunos casos, las enzimas fosfatasas están colocadas de modo el polifosfato producido por la polimerasa en una reacción de polimerasa interacciona con las enzimas fosfatasas antes de entrar al poro. En algunos casos, la velocidad de interacción entre las enzimas fosfatasas y el polifosfato es más rápida que, o igual a, la velocidad de la polimerasa produciendo el polifosfato.

En algunos casos, cada uno del primer y segundo compartimentos tiene una carga eléctrica. En algunos casos, el interior del poro tiene una carga negativa. En algunos casos, el poro es biológico o sintético. En algunos casos, el poro es proteinaceo. En algunos casos, el poro es proteína alfa hemolisina. En algunos casos, el poro es un poro de estado sólido. En algunos casos, el poro está formado de grafeno.

En algunos casos, el sistema de medida de conductancia además comprende una matriz de poros que cada uno tiene características sustancialmente idénticas. En algunos casos, el sistema de medida de conductancia además comprende una matriz de poros de diferentes diámetros. En algunos casos, el sistema de medida de conductancia además comprende una matriz de poros, en donde los poros están configurados para aplicar diferentes campos eléctricos a través de la barrera.

En algunos casos, el sistema de medida de conductancia está integrado con electrónica CMOS. En algunos casos, el poro o matriz de poros está directamente integrado en una matriz CMOS como se muestra en la figura 46.

en donde la etiqueta comprende uno o más de etilenglicol, un aminoácido, un hidrato de carbono, un péptido, un colorante, un compuesto quimioluminiscente, un mononucleótido, un dinucleótido, un trinucleótido, un tetranucleótido, un pentanucleótido, un hexanucleótido, un ácido alifático, un ácido aromático, un alcohol, un grupo tiol, un grupo ciano, un grupo nitro, un grupo alquilo, un grupo alquenilo, un grupo alquinilo, un grupo azido, o una combinación de los mismos, en donde Rⁱes OH, en donde R²es H u OH, en donde X es O, NH, S, o CH², en donde Z es O, S, o BH³, en donde la base es adenina, guanina, citosina, uracilo, o un derivado de una de estas bases, en donde n es 1,2, 3, o 4, y en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto.

En algunos casos, la magnitud de la carga en la etiqueta es la misma que la magnitud de la carga en el resto del compuesto. En algunos casos, la etiqueta comprende múltiples unidades de etilenglicol. En algunos casos, la etiqueta comprende 16, 20, 24 o 36 unidades de etilenglicol. En algunos casos, la etiqueta además comprende una fracción identificable adicional. En algunos casos, la fracción identificable adicional es un colorante basado en cumarina. En algunos casos, la etiqueta tiene una carga positiva. En algunos casos, la eliminación de la etiqueta cambia la carga del compuesto. En algunos casos, la etiqueta además comprende el número apropiado de lisinas o argininas para equilibrar el número de fosfatos en el compuesto.

Otro aspecto de la presente divulgación proporciona un método para determinar la secuencia de nucleótidos de un ADN o ARN monocatenario. En algunos casos, más enzimas fosfatasas que polimerasas están unidas al poro. En algunos casos, el ADN o ARN monocatenario se obtiene desnaturalizando un ADN o ARN bicatenario, cualquiera que sea aplicable. En algunos casos, múltiples copias del ADN o ARN monocatenario se inmovilizan en una perla. En algunos casos, la secuencia de nucleótidos del ADN o ARN monocatenario se determina usando múltiples copias del mismo ADN o ARN monocatenario. En algunos casos, el método comprende además una etapa de lavado después de cada iteración de la etapa (b) para eliminar el compuesto no incorporado del contacto con el ADN o ARN monocatenario. En algunos casos, el método comprende además una etapa después de cada iteración de la etapa (b) para determinar la identidad de la fracción identificable adicional unida a la etiqueta. En algunos casos, al menos el 85-99% de las etiquetas liberadas se transloca a través del poro. En algunos casos, el compuesto además comprende un terminador reversible. En algunos casos, el método además comprende una etapa de eliminar el terminador reversible después de cada iteración de la etapa (b). En algunos casos, el terminador reversible se elimina por medios biológicos, medios químicos, medios físicos, o por irradiación de luz. En algunos casos, el interior del poro tiene una carga que es de signo inverso a la carga de la etiqueta o del polifosfato que tiene la etiqueta unida al mismo. En algunos casos, cada uno del primer y segundo compartimentos del sistema de medida de la conductancia tiene una carga. En algunos casos, las cargas del primer y segundo compartimentos son de polaridad opuesta. En algunos casos, las cargas del primer y segundo compartimentos son ajustables. En algunos casos, la velocidad de translocación de la etiqueta a través del poro en la etapa (b) se determina basado en la carga de la etiqueta y las cargas del primer y segundo compartimentos. En algunos casos, cada uno del primer y segundo compartimentos del sistema de medida de la conductancia tiene una carga de modo que en la etapa (b) la etiqueta se transloca a través del poro a una velocidad que es más rápida que, o igual a, la velocidad a la que la etiqueta o el polifosfato que tiene la etiqueta unida al mismo se libera en la etapa (b).

Otro aspecto de la presente divulgación proporciona un método para determinar al menos un parámetro de un compuesto en una solución. En algunos casos, el compuesto se trata con fosfatasa antes de medir la reducción en la corriente iónica. En algunos casos, el compuesto es un compuesto alternativamente cargado que tiene una primera carga neta y, después de una reacción química, física o biológica, una segunda carga neta diferente. En algunos casos, el análisis matemático se selecciona del grupo que consiste en GMM, detección umbral y promedio, y análisis de ventana móvil. En algunos casos, el al menos un parámetro se selecciona del grupo que consiste en la concentración, tamaño, carga, y composición del compuesto.

En algunos casos, el método además comprende una etapa de calibrar el sistema de medida de la conductancia. En algunos casos, la precisión es mayor de 4a. En algunos casos, la precisión es mayor de 5a. En algunos casos, la precisión es mayor de 6a.

Aspectos describen métodos y sistemas de medida de la conductancia que implican la primera y segunda soluciones de electrolitos y/o un primer y segundo fluidos. En algunos casos, la primera y segunda soluciones de electrolitos son iguales. En algunos casos, el primer y segundo fluidos son iguales.

Detección por nanoporo y etiquetas

La invención divulgada en el presente documento se refiere al uso de nucleótidos modificados para análisis de moléculas individuales de ADN (o ARN, mutatis mutandis) usando nanoporos. Las modificaciones se pueden hacer en varias posiciones de un nucleótido, es decir, el fosfato terminal, la base, y/o el OH en 2' o 3' para formar un análogo de nucleótido. Después de una reacción de extensión de polimerasa en un complejo molde-cebador, el pirofosfato con etiqueta unida pasa a través de un nanoporo y se sigue el bloqueo de corriente resultante para determinar la base de nucleótido añadido. Si la modificación o etiqueta está en la fracción de la base o el OH en 2'/3' de la fracción de azúcar del nucleótido, entonces después de la incorporación por la ADN/ARN polimerasa, el enlazador-etiqueta se corta de la base/azúcar por medios químicos o fotoquímicos y se el enlazador-etiqueta liberado pasa a través de un nanoporo para identificar el nucleótido añadido.

Se diseñan y sintetizan nucleósidos-5-polifosfato que portan diferente número de grupos fosfato como enlazadores y se modifican con etiquetas unidas al fosfato terminal de los nucleótidos. Después de la incorporación por la ADN/ARN polimerasa en una reacción de extensión molde-cebador, el polifosfato (di-, tri-, tetra-, penta-, etc.) unido a etiqueta liberado se puede detectar usando un nanoporo para producir datos de secuencia. Opcionalmente, los polifosfatos con etiqueta también se pueden tratar con fosfatasa alcalina para proporcionar etiquetas libres. Usando cuatro etiquetas diferentes que son distintas y específicas para cada base de nucleótido, se puede determinar la secuencia del ADN o ARN molde.

Se proporcionan nucleótidos que portan diferente número de grupos fosfato o etiquetas para la síntesis de nucleótidos modificados, que son sustratos eficaces en reacciones de polimerasa. El polifosfato unido a etiqueta liberado se detecta usando un nanoporo para determinar condiciones para el diseño y la modificación de los nucleótidos para lograr distintas señales de bloqueo.

También se proporcionan nucleótidos que portan enlazador-etiqueta unido a la fracción de base del nucleótido, y/o el 2'/3'-OH de la fracción de azúcar, para reacción de ADN polimerasa para generar producto de extensión de ADN con base única marcada con enlazador-etiqueta. Estos nucleótidos son buenos sustratos para ADN/ARN polimerasa comúnmente usadas. El enlazador-etiqueta unido al producto de ADN extendido se corta por medios químicos o fotoquímicos para generar el cebador listo para extensión adicional usando los nucleótidos modificados. El enlazadoretiqueta liberado se pasa a través del nanoporo y se identifica basado en la diferencia en tamaño, forma y carga en la etiqueta para producir datos de secuencia.

Como se divulga en el presente documento, estas herramientas moleculares facilitan la secuenciación de moléculas únicas usando nanoporo en resolución de base individual.

Aquí se divulgan varias mejoras al enfoque de nanoporo: 1) lograr discriminación precisa y obvia de las cuatro bases (A, C, G y T) que hacen las moléculas de ácido nucleico; 2) aumentar y diferenciar la potencia de las señales de detección; 3) desarrollar un método eficaz para percibir y procesar las señales de bloqueo electrónico generadas; 4) controlar la velocidad de translocación de ácidos nucleicos a través del poro, tal como ralentizar el movimiento de etiquetas para mejorar la capacidad de discriminación base a base; y 5) diseñar y hacer nanoporos sintéticos nuevos y más eficaces para diferenciar los cuatro nucleótidos diferentes en el ADN.

Las estructuras de los cuatro nucleótidos se muestran en la figura 22. A y G son purinas, mientras que C y T son pirimidinas. El tamaño molecular global de A y G es muy similar, mientras que el tamaño de C y T es similar. Se ha mostrado que los nanoporos son capaces de distinguir entre purinas y pirimidinas (Akeson et al. 1999 y Meller et al.

2000), pero no son capaces de distinguir entre purinas individuales, A y G, o entre pirimidinas individuales, C y T.

Estudios previos han mostrado modificaciones de nucleósidos-5-trifosfato, incluyendo introducir más grupos fosfato para producir tetra-, penta- o hexa-fosfatos, introducir un colorante directamente al fosfato terminal, o unir un enlazador entre el fosfato terminal y el colorante (Kumar et al., 2006 y 2008, Reynolds et al., 2008). Los tetra- y penta-fosfatos son mejores sustratos de ADN polimerasa, y se han desarrollado nucleótidos hexa-fosfato marcados con colorante (Kumar et al. 2005; Sood et al. 2005; Eid et al. 2009).

Se divulgan análogos de nucleótidos que se diseñan para aumentar la discriminación de cada nucleótido por modificación de los nucleótidos en la fracción fosfato terminar en el presente documento. Se sintetizan nucleósidos-5-polifosfato y diferentes etiquetas (tal como, poli(etilenglicol)es (PEG) de diferente longitud/masa, aminoácidos, hidratos de carbono, oligonucleótidos, colorantes o moléculas orgánicas/inorgánicas) se unen al grupo fosfato terminal. Después de reacciones de extensión de polimerasa, se generan fracciones polifosfato unidas a etiqueta (Figura 9) y se produce una señal diferente específica para cada base cuando las fracciones polifosfato unidas a etiqueta pasan a través del nanoporo. Estas modificaciones aumentan la discriminación de las bases por el nanoporo debido diferencias de tamaño, masa o carga aumentadas de las unidades de polifosfato etiquetadas entre los cuatro nucleótidos (A, G, C y T).

La velocidad de translocación del ADN a través del poro está reducida debido al volumen de los polifosfatos unidos a etiquetas liberados, aunque no se necesita reducir la velocidad de translocación de las etiquetas a través del nanoporo siempre que las etiquetas se puedan diferenciar. Por tanto, la precisión y fiabilidad requeridas para la secuenciación base a base se vuelven alcanzables. Otros parámetros analíticos en la secuenciación por nanoporos, tal como la concentración del polinucleótido, magnitud del voltaje aplicado, temperatura y valor de pH de la solución, se optimizan con el fin de lograr los resultados más precisos y fiables para la detección y análisis de la cadena de ADN.

Los enfoques de moléculas individuales para secuenciar permiten la posibilidad de derivar haplotipos para estudios genéticos y permitir la secuenciación directa de los ARNm. Entre los potenciales enfoques de moléculas individuales para descodificar la secuencia de moléculas de ADN o ARN está el uso de nanoporos biológicos o sintéticos como detectores de las bases de ADN individuales.

El enfoque existente de secuenciación por síntesis (SBS) usa terminadores reversibles de nucleótidos fluorescentes cortables (CF-NRT) (Guo et al. 2010). El método de SBS se basa en la capacidad para parar después de cada adición de nucleótido durante la reacción de la polimerasa y el uso específico de fluoróforos para discriminar entre las 4 bases. Sin embargo, una limitación principal de SBS para secuenciación de molécula única es el requisito para detectores fluorescentes caros y software de imagenología rápido. El método y proceso divulgados en el presente documento aprovecha las ventajas de la SBS, especialmente su alta precisión, con la velocidad y sensibilidad del nanoporo como un detector de impedancia de corriente iónica.

Mientras que mucha investigación ha ido a pasar ADN a través de nanoporos, con la esperanza de discriminar cada base según pasa a través debido a su efecto variable en la corriente iónica, esto ha sido muy difícil de lograr debido tanto a la velocidad de transmisión como al efecto de rodear bases que puede contribuir sus propios efectos en iones y contraiones que pasan a través de los poros (Timp et al. 2010). El uso de ciclodextrinas u otras estructuras con forma de anillo en la luz de los poros de proteína ayuda a proporcionar un mecanismo de trinquete para ralentizar el tiempo de tránsito (Astier et al. 2006), pero la capacidad para reconocer absolutamente cada base para secuenciarla según pasa permanece un reto. Una estrategia alternativa que usa exonucleasa para permitir que un nucleótido cada vez atraviese el poro ha llevado a discriminación de bases individuales (Clarke et al. 2009). Sin embargo, todavía hay dificultad en controlar el tiempo de reacción de la exonucleasa para diferentes longitudes de ADN y nucleótido y la velocidad a la que los iones liberados llegan al poro con este enfoque.

La reacción de polimerasa misma muestra alta procesividad y velocidades estables de incorporación de bases. En efecto, se han usado reacciones de polimerasa para controlar el movimiento de hebras de ADN a través de nanoporos para discriminación de bases directa (Benner et al. 2007, Cockroft et al. 2008, Hurt et al. 2009). Durante la reacción de polimerasa, hay liberación de una fracción de pirofosfato (PPi). Por tanto, si se une una etiqueta diferente al trifosfato para cada uno de los cuatro nucleótidos, estos se pueden discriminar según se liberan y pasan a través de un nanoporo apropiado para determinación de la secuencia de ADN. Estos análogos de pirofosfato relativamente pequeños, o moléculas equivalentes con grupos positivamente cargados adicionales, pueden alcanzar el poro extremadamente rápido. La velocidad de incorporación de nucleótido por polimerasas es aproximadamente 1000 nucleótidos por segundo, es decir, un milisegundo por adición de base, mientras que la velocidad de transporte a través del nanoporo es 1 molécula por microsegundo. Por tanto, con fluídica e ingeniería apropiadas, no hay problemas de desfasamiento para secuenciar ADN con nuestro enfoque, ni hay dificultades con la decodificación de tramos de homopolímeros. Se ha mostrado que se puede discriminar entre un amplio intervalo de tamaño de polietilenglicoles que se diferencian en tan poco como una o dos unidades de carbono por el efecto que tienen en bloquear corrientes en nanoporos (Reiner et al. 2010, Robertson et al. 2007), una resolución esencialmente equivalente a la obtenida por un espectrómetro de masas. Por tanto, como se describe posteriormente, se unen cadenas de PEG de diferente longitud al fosfato terminal de dATP, dCTP, dGTP y dTTP. Según se incorpora cada nucleótido específico durante la reacción de la polimerasa, un grupo fosfato específicamente etiquetado se libera en el nanoporo, dando una señal de bloqueo de corriente distinta para indicar qué nucleótido se incorpora. La velocidad de secuenciación es extremadamente rápida, limitada solo por la velocidad de la reacción de la polimerasa. Como un enfoque alternativo para etiquetar nucleótidos, también se utilizan diferentes longitudes de cadena de fosfato (por ejemplo, tri-, tetra-, y penta-fosfatos).

Además, también se usan nanoporos de estado sólido que tienen ventajas en términos de mejor control sobre y flexibilidad de fabricación, que asegura así el transporte vectorial rápido de polifosfatos etiquetados, pero no de los precursores de nucleótidos o el ADN hacia y a través de los nanoporos o nanocanales. Para lograr esto, se incorporan dos importantes características de diseño. Primero, los precursores (nucleótidos polifosfato etiquetados) se sintetizan con una carga neutra global, mientras que los fosfatos etiquetados cortados tienen una carga positiva global. Al utilizar una corriente que atrae iones positivos, los nanoporos solo necesitan discriminar las cuatro moléculas etiquetadas liberadas alternativas. La carga diferencial en los precursores y productos se logran al incorporar en las etiquetas un número de lisinas y argininas (cargadas positivamente) que equilibran exactamente el número de fosfatos (cargados negativamente). Después de la incorporación del a-fosfato en el cebador en crecimiento, hay una lisina más que fosfato en el producto liberado. Opcionalmente, se puede usar fosfatasa alcalina para cortar todos los fosfatos para producir una etiqueta PEG con una carga positiva más fuerte. Segundo, para asegurar que los fosfatos liberados se mueven inmediatamente a través del poro más cercano, la ADN polimerasa está inmovilizada a la entrada del poro, por ejemplo, a través de enlace biotina-estreptavidina. Según la cadena de ADN pasa a través de la polimerasa, los productos etiquetados liberados solo tienen que difundir la misma distancia corta para alcanzar el nanoporo.

También es importante reconocer que las ventajas del mecanismo de transducción bioelectrónico sobre enfoques ópticos. Para técnicas de transducción óptica de molécula individual, la señal de un único fluoróforo típicamente es < 2500 fotones/segundo (correspondiente a niveles de corriente detectados en el orden de 502 fA) a niveles altos de ruido corto, que requiere óptica compleja para intentar recoger cada fotón emitido, haciendo el escalado de las plataformas a mayores densidades difícil. Las reacciones de síntesis se deben ralentizar a 1 Hz para permitir tiempos de integración suficientes paras señales ópticas débiles, ruidosas. Los desafíos para las técnicas ópticas han abierto la posibilidad para enfoques de detección bioelectrónica, que tienen niveles de señal significativamente mayores (típicamente más de tres órdenes de magnitud mayor), lo que permite la posibilidad para detección de ancho de banda alta con el codiseño apropiado de transductor, detector y amplificador. Los niveles de señal para nanoporos pueden ser tan altos como 100 pA de alfa-hemolisina (Kasianowicz et al. 1996), 300 pA para MspA (Derrington et al. 2010), y más de 4 nA de nanoporos de estado sólido (Wanunu et al. 2010).

Se ha dirigido un esfuerzo significativo hacia el desarrollo de tecnología de nanoporo como un mecanismo de transducción bioelectrónica (Benner et al. 2007, Deamer et al. 2002, Kasianowicz et al. 1996, Branton 2008, Branton et al. 2008, Chen 2004, Gershow et al. 2007, Nealy 2007, Matysiak et al. 2006). Dos atributos esenciales de este sensor electrónico le dan sensibilidad de molécula única. El primero es la geometría muy localizada (nanoescala) de sensibilidad de carga en el poro mismo. El diámetro de un poro puede ser 2-3 nm, y debido a cribado de la carga de electrolito la corriente medida es muy insensible a fuentes de carga más de unos pocos nanómetros del poro. Segundo, el sensor de nanoporo proporciona una ganancia mediante el efecto de carga de movimiento comparativamente lento que un biopolímero tiene en una concentración cercana de iones de sal de mayor movilidad. Sin embargo, los nanoporos están extremadamente limitados por el tiempo relativamente corto que las biomoléculas pasan en la región sensible a carga del poro. Esto se aborda directamente mediante el uso de etiquetas, que se pueden optimizar para producir altos niveles de señal y sucesos de translocación más largos. Al mismo tiempo, la cointegración con CMOS de estos poros se explota para mejorar drásticamente los anchos de banda limitados por ruido para detección en un dispositivo de nanoporo. Tanto poros de estado sólido como biológicos están soportados por esta plataforma. Esta integración de estado sólido, junto con microfuídica asociada, también permite de forma única el aumento a escala de este diseño para grandes matrices con electrónica integrada para detección.

Sistemas informáticos

Los sistemas y métodos de secuenciación de ácidos nucleicos de la divulgación se pueden regular con la ayuda de sistemas informáticos. La figura 18 muestra un sistema 1800 que comprende un sistema informático 1801 acoplado a un sistema de secuenciación de ácidos nucleicos 1802. El sistema informático 1801 puede ser un servidor o una pluralidad de servidores. El sistema informático 1801 se puede programar para regular la preparación y procesamiento de la muestra, y la secuenciación de ácidos nucleicos por el sistema de secuenciación 1802. El sistema de secuenciación 1802 puede ser un secuenciador (o detector) basado en nanoporo, como se describe en otro sitio en el presente documento.

El sistema informático se puede programar para implementar los métodos de la invención. El sistema informático 1801 incluye una unidad procesadora central (CPU, también “procesador” en el presente documento) 1805, que puede ser un procesador de núcleo único o multinúcleo, o una pluralidad de procesadores para el procesamiento paralelo. El sistema informático 1801 también incluye memoria 1810 (por ejemplo, memoria de acceso aleatorio, memoria de lectura solo, memoria flash), unidad de almacenamiento electrónico 1815 (por ejemplo, disco duro), interfaz de comunicación 1820 (por ejemplo, adaptador de red) para comunicar con uno o más otros sistemas, y dispositivos periféricos 1825, tal como caché, otra memoria, adaptadores de almacenamiento de datos y/o monitor. La memoria 1810, unidad de almacenamiento 1815, interfaz 1820 y dispositivos periféricos 1825 están en comunicación con la CPU 1805 a través de un bus de comunicación (líneas sólidas), tal como una placa madre. La unidad de almacenamiento 1815 puede ser una unidad de almacenamiento de datos (o depósito de datos) para almacenar datos. El sistema informático 1801 puede estar operativamente acoplado a una red de ordenadores (“red”) con la ayuda de la interfaz de comunicaciones 1820. La red puede ser la Internet, una internet y/o extranet, o una intranet y/o extranet que está en comunicación con la Internet. La red puede incluir uno o más servidores informáticos, que pueden permitir computación distribuida.

Los métodos de la invención se pueden implementar por medio de código (o software) ejecutable por máquina (o procesador informático) almacenado en una localización de almacenamiento electrónica del sistema informático 1801, tal como, por ejemplo, en la memoria 1810 o unidad de almacenamiento electrónico 1815. Durante el uso, el código se puede ejecutar por el procesador 1805. En algunos casos, el código se puede recuperar de la unidad de almacenamiento 1815 y almacenar en la memoria 1810 para acceso fácil por el procesador 1805. En algunas situaciones, la unidad de almacenamiento electrónico 1815 se puede excluir, y las instrucciones ejecutables por la máquina se almacenan en la memoria 1810.

El código puede estar precompilado y configurado para uso con una máquina que tiene un procesador adaptado para ejecutar el código, o se puede compilar durante el tiempo de carrera. El código se puede suministrar en un lenguaje de programación que se puede seleccionar para permitir que el código se ejecute de una manera precompilada o según se compila.

El sistema informático 1801 se puede adaptar para almacenar información de perfil del usuario, tal como, por ejemplo, un nombre, dirección física, dirección de correo electrónico, número de teléfono, gestión de mensajería instantánea (IM), información educacional, información de trabajo, gustos y/o antipatías sociales, y otra información de potencial relevancia para el usuario u otros usuarios. Tal información de perfil se puede almacenar en la unidad de almacenamiento 1815 del sistema informático 1801.

Aspectos de los sistemas y métodos proporcionados en el presente documento, tal como el sistema informático 1801, se pueden representar en programación. Varios aspectos de la tecnología se pueden pensar como “productos” o “artículos de manufactura” típicamente en forma de código ejecutable por máquina (o procesador) y/o datos asociados que se portan o representan en un tipo de medio legible por máquina. El código ejecutable por máquina se puede almacenar en una unidad de almacenamiento electrónico, tal como memoria (por ejemplo, ROM, RAM) o un disco duro. Los medios de tipo “almacenamiento” pueden incluir cualquiera o todos de la memoria tangible de los ordenadores, procesadores, o similares, o módulos asociados de los mismos, tal como varias memorias semiconductoras, unidades de cinta, unidades de disco y similares, que pueden proporcionar almacenamiento no transitorio en cualquier momento para la programación de software. Todo o partes del software se pueden comunicar en momentos a través de Internet o varias otras redes de telecomunicación. Tales comunicaciones, por ejemplo, pueden permitir la carga del software de un ordenador o procesador a otro, por ejemplo, de un servidor de gestión u ordenador huésped a la plataforma informática de un servidor de aplicación. Por tanto, otro tipo de medio que puede llevar los elementos de software incluye ondas ópticas, eléctricas y electromagnéticas, tal como las usadas a través de interfaces físicas entre dispositivos locales, a través de redes fijas por cable y ópticas y sobre varios enlaces aéreos. Los elementos físicos que portan tales ondas, tal como enlaces por cable o inalámbricos, enlaces ópticos o similares, también se pueden considerar medios que portan el software. Como se usa en el presente documento, a menos que se restrinja a medios “almacenamiento” no transitorios, tangibles, términos tal como “medio legible por” ordenador o máquina se refiere a cualquier medio que participa en proporcionar instrucciones a un procesador para ejecución.

Por tanto, un medio legible por máquina, tal como un código ejecutable por ordenador, puede tomar muchas formas, incluyendo, pero no limitado a, un medio de almacenamiento tangible, un medio de onda portador o medio de transmisión físico. Los medios de almacenamiento no volátiles incluyen, por ejemplo, discos ópticos o magnéticos, tal como cualquiera de los dispositivos de almacenamiento en cualquier ordenador o similar, tal como se puede usar para implementar las bases de datos, etc., mostrado en los dibujos. Los medios de almacenamiento volátiles incluyen memoria dinámica, tal como la memoria principal de tal plataforma informática. Los medios de transmisión tangibles incluyen cables coaxiales; alambre de cobre y fibra óptica, incluyendo los cables que comprenden un bus en un sistema informático. Los medios de transmisión de onda portadora pueden tomar la forma de señales eléctricas o electromagnéticas, u ondas acústicas o lumínicas tal como las generadas durante comunicaciones de datos de radiofrecuencia (RF) e infrarrojo (IR). Las formas comunes de medios legibles por ordenador, por tanto, incluyen, por ejemplo: un disquete, un disco flexible, un disco duro, cinta magnética, y otros medios magnéticos, un CD-ROM, DVD o DVD-ROM, cualquier otro medio óptico, cinta de papel de tarjetas perforadas, cualquier otro medio de almacenamiento físico con patrones de agujeros, una RAM, una ROM, una PROM y EPr Om , FLASH-EPROM, cualquier otro chip o cartucho de memoria, una onda portadora que transporta datos o instrucciones, cables, enlaces que transportan tal onda portadora, o cualquier otro medio del que un ordenador puede leer un código de programación y/o datos. Muchos de estas formas de medios legibles por ordenador pueden estar implicadas en trasportar una o más secuencias de una o más instrucciones a un procesador para ejecución.

Los sistemas y métodos proporcionados en el presente documento se pueden combinar con, o modificar por, otros sistemas y métodos, tal como, por ejemplo, los sistemas y métodos descritos en la publicación de patente PCT No. WO/2012/083249.

Ejemplos

Ejemplo 1

I. Diseño y síntesis de nucleótidos modificados

El efecto del volumen del polifosfato etiquetado en las señales de bloqueo electrónico generadas por un nanoporo se determina usando varios nucleótidos unidos a fosfato con etiquetas o grupos de diferentes tamaños unidas al fosfato terminal del nucleótido. Las estructuras de cuatro nucleósido-5'-polifosfato etiquetados en fosfato se muestran en la figura 23. Primero, se sintetiza una serie de nucleósidos-5'-tri-, tetra-, penta- y hexa-fosfato. En estos nucleótidos, el fosfato terminal está unido a través de un enlazador mediante el cual se unen etiquetas diferentes, por ejemplo, etilenglicoles u otras moléculas de diferente longitud y masa que aumentan el volumen o carga del polifosfato liberado. Estos nucleótidos en ensayan con nanoporo para determinar que etiquetas o grupos voluminosos unidos al fosfato terminal se correlacionan con una diferencia más drástica en la señal de bloqueo electrónica entre diferentes bases.

1) Nucleósidos-polifosfato modificados en fosfato terminal

a. Nudeósidos-5’-trífosfato etiquetados en fosfato terminal

Como se muestra en la figura 24, los nucleósidos-5'-trifosfato etiquetados en fosfato terminal se pueden sintetizar haciendo reaccionar el correspondiente dNTP con DCC/DMF para dar trimetafosfato cíclico que se puede abrir con nucleófilos apropiados para dar nucleósido-5'-trifosfato unido a etiqueta o enlazador. Esto se puede usar en una reacción de extensión molde-cebador y el pirofosfato unido a etiqueta liberado se puede leer usando nanoporo. Alternativamente, el enlazador unido al fosfato se puede hacer reaccionar con etiqueta-éster NHS para proporcionar nucleósido-5'-trifosfato unido a etiqueta alternativo.

b. Nudeósidos-5’-tetrafosfato etiquetados en fosfato terminal

Para la síntesis de nucleósidos-5'-tetrafosfato etiquetados en fosfato terminal, el correspondiente trifosfato se hace reaccionar primero con CDI en DMF para activar el grupo fosfato terminal que después se hace reaccionar con ácido fosfórico o etiqueta-monofosfato para dar el tetrafosfato (Figura 25). El fosfato terminal en el tetrafosfato se puede activar además con CDI seguido por reacción con nucleófilos apropiados para proporcionar un tetrafosfato unido a enlazador que se puede usar además para unir etiquetas de diferente masa, longitud o volumen, tal como m-dPEG-éster NHS, también mostrado en la figura 25.

c. Nudeósidos-5’-penta- y hexafosfato etiquetados en fosfato terminal

La síntesis de nucleósidos-5'-penta- y hexafosfato etiquetados en fosfato terminal sigue el mismo principio como se muestra en la figura 26. Se pueden preparar o bien de trifosfatos activados o los tetrafosfatos haciendo reaccionar con ácido fosfórico, pirofosfato o fosfatos unidos a etiqueta. Alternativamente, se puede unir un enlazador a penta- o hexa fosfato seguido por reacción con ésteres NHS activados.

d. Nucleósidos-polifosfato unidos a oligo-etiqueta

Hay un número de problemas con el actual enfoque a secuenciación con nanoporo tal como el reconocimiento de las bases según pasan a través del nanoporo y la velocidad o ritmo de transporte que permite que se registre el reconocimiento de la nucleobase. El ADN pasa a través de un nanoporo de alfa-hemolisina a una velocidad de 1-5 js , que es demasiado rápido para registrar para experimentos de secuenciación de molécula única. Se ha hecho algún progreso para superar estos problemas mediante una variedad de estrategias de ingeniera de proteínas incluyendo el uso de frenos moleculares (oligonucleótidos cortos unidos covalentemente) (Bayley, H. 2006).

Como se divulga en el presente documento, se pueden unir oligonucleótidos cortos al fosfato terminal de un nucleósido polifosfato por reacción del fosfato terminal activado con el 3'-OH o el 5'-OH del oligonucleótido. Alternativamente, el 3'- o 5'-fosfato del oligonucleótido se puede activar con CDI o imidazol/DCC y hacer reaccionar con nucleósidos-5'-polifosfato. Las estructuras de nucleósidos fosfato unidos a oligo (oligo-3' a 5'-fosfato; oligo-5' a 5'-fosfato) se muestran en la figura 27(a) y 27(b), respectivamente. El subproducto de la reacción de polimerasa que se sigue al pasar a través del nanoporo se muestra en la figura 27(c).

La velocidad de migración a través del nanoporo del subproducto de la reacción de polimerasa se puede controlar uniendo oligonucleótidos de diferente longitud a diferentes nucleósidos-5'-polifosfato. Por ejemplo, si el nucleósido dA tiene 1 o 2 unidades oligo-dA unidas, dT puede tener 3 unidades oligo-dT, dC puede tener 4 unidades oligo-dC, y dG puede tener 5 unidades oligo-dG. Se pueden usar diferentes combinaciones del número de oligos para cada nucleótido para controlar el transporte y tiempo de retención en un nanoporo.

El transporte y tiempo de retención en un nanoporo también se pueden controlar añadiendo diferente número de grupos fosfato a los nucleótidos. Por tanto, la carga y masa pueden variar para cada nucleótido polifosfato.

Ejemplos de estructura de enlazador etiqueta

Se proporcionan ejemplos específicos de grupos reactivos en los fosfatos terminales o la fracción de base de nucleósido y grupos con los que los grupos pueden reaccionar en la tabla 1. Los grupos reactivos con los que pueden reaccionar pueden estar presentes o en el enlazador o en la etiqueta.

TABLA 1

Posibles sustituyentes reactivos y grupos funcionales reactivos con los mismos

Grupos reactivos Grupos funcionales Ésteres succinimidílicos Amino primario, amino secundario

Anhidridos, haluros ácidos Grupos amino e hidroxilo

Carboxilo Amino, hidroxi, tioles

Aldehído, Isotiocianato & Isocianatos Grupos amino

Vinilsulfona & Diclorotriacina Grupos amino

Haloacetamidas Tioles, imidazoles

Maleimidas Tioles, hidroxi, amino

Tioles Tioles, maleimida, haloacetamida

Fosforamiditas, P. activado Grupos hidroxi, amino, tiol

Azido Alquino

Las etiquetas que pueden ser detectadas por nanoporo están incluidas junto con esto, pero de ningún modo están limitadas a este grupo de compuestos. Un experto en la materia puede cambiar el/los grupo(s) funcional(es) para conseguir una etiqueta adecuada.

Las etiquetas pueden incluir compuestos alifáticos, aromáticos, arilo, heteroarilo con uno o más anillos de 4-8 miembros y opcionalmente pueden estar sustituidas con grupos halo, hidroxi, amino, nitro, alcoxi, ciano, alquilo, arilo, heteroarilo, ácido aldehido, azido, alquenilo, alquinilo, u otros. Estos incluyen polietilenglicoles (PEG), hidratos de carbono, aminoácidos, péptidos, colorantes fluorescentes, fluorogénicos (no fluorescentes, pero se vuelven fluorescentes después de la eliminación del grupo protector) cromogénicos (incoloros, pero se vuelven coloreados después de la eliminación del grupo protector), compuesto quimioluminiscentes, nucleósidos, nucleósidos-mono, di o polifosfato, oligonucleótidos, compuestos arilo, heteroarilo o alifáticos. Se dan algunos ejemplos en la figura 35.

La estructura de nucleótidos marcados con PEG-fosfato y algunos ejemplos de posibles PEG con diferentes grupos reactivos para reaccionar con grupos funcionales se ejemplifican en la figura 36.

Algunos otros ejemplos de los colorantes o compuesto que se pueden usar para unir al fosfato terminal o la fracción de base de los nucleótidos se proporcionan aquí. En modo alguno, estos son los únicos compuestos que se pueden usar. Estos se enumeran aquí como ejemplo y un experto en la materia puede conseguir un enlazador-etiqueta adecuado que se puede unir al nucleótido y detectar por el nanoporo.

Otros ejemplos de etiquetas adecuadas son:

Colorantes fluorescentes: colorantes de xantina, colorantes Bodipy, colorantes de cianina Compuestos quimioluminiscentes: compuestos de 1,2-dioxetano (Tropix Inc., Bedford, Ma ). Aminoácidos & péptidos: aminoácidos naturales o modificados y polímeros de los mismos. Hidratos de carbono: glucosa, fructosa, galactosa, manosa, etc. NMP & NDP: nucleósidos-monofosfato, nucleósidos-difosfato. Ácidos alifáticos o aromáticos, alcoholes, tioles, sustituidos con halógenos, ciano, nitro, alquilo, alquenilo, alquinilo, azido u otros tales grupos.

2) Nucleósidos-5'-trifosfato modificados en la base

Se sintetizan una variedad de terminadores reversibles de nucleótidos (NRT) para secuenciación por síntesis (SBS) de ADN en donde un enlazador cortable une un colorante fluorescente a la base del nucleótido y el 3'-OH del nucleótido se bloquea con un pequeño grupo terminador reversible (Ju et al. 2006, Guo et al. 2008 & 2010). Usando estos NRT, la síntesis de ADN se para de forma reversible en cada posición. Después de registrar la señal fluorescente de la base incorporada, las fracciones cortables de los nucleótidos incorporados se eliminan y el ciclo se repite.

El mismo tipo de nucleótidos también se puede usar para secuenciación de ADN por nanoporo. Como se muestra en la figura 28(A), se puede sintetizar un pequeño grupo bloqueador en 3'-OH y una etiqueta unida en la base enlazados a través de un enlazador cortable. Después de la reacción de extensión de la polimerasa, tanto el grupo 3'-O-bloqueador como la etiqueta de la base se cortan y la etiqueta liberada se puede usar para pasar a través del nanoporo y seguir la señal de bloqueo. Se pueden usar cuatro etiquetas diferentes (por ejemplo, polietilenglicoles (PEG) de diferentes longitud y peso molecular, como se muestra en la figura 28(A)), una para cada una de las cuatro bases, diferenciando así las señales de bloqueo.

Alternativamente, el grupo 3'-O-bloqueador no se usa porque se ha mostrado que un grupo voluminoso o base de nucleótido puede prevenir que la ADN polimerasa añada más de un nucleótido cada vez (Harris et al. 2008). Como se muestra en la figura 28(B), un dNMP voluminoso se introduce mediante un enlazador cortable. Por tanto, se introducen diferentes dNMP mediante un enlazador según el dNTP original. Por ejemplo, con el nucleótido dTTP, se introduce un dTMP (para dATP, un dAMP; para dGTP, un dGMP y para dCTP, un dCMP se introduce). Después de la incorporación por polimerasa y corte con TCEP, se generan dNMP modificados que se pasan a través del canal del nanoporo y se detectan por métodos apropiados.

3) Nucleósidos-5'-trifosfato modificados en 2'- o 3'-OH

Se puede llevar a cabo la síntesis de los cuatro nucleósidos-5'-trifosfato 3'-modificados (Guo et al. 2008, Li et al. 2003, Seo et al. 2004). dNTP unidos a 3'-0-2-nitrobencilo y 3'-O-azidometilo (Figura 29A y 29B, respectivamente) son buenos sustratos para ADN polimerasas. Después de la incorporación por ADN/ARN polimerasa en una reacción de secuenciación, estos nucleótidos 3'-O-etiquetados terminan la síntesis después de extensión de una única base debido al grupo bloqueador en el 3'-OH. Es posible extensión adicional solo después del corte del grupo bloqueador de la posición 3'-O. El grupo 3'-0-2-nitrobencilo se puede cortar eficazmente por luz UV y el 3'-O-azidometilo por tratamiento con TCEP para generar el grupo OH libre para extensión adicional. El producto cortado de la reacción (Figura 29C o 29D) se sigue para bloqueo electrónico al pasar a través del nanoporo y registrar la señal. Se sintetizan cuatro dNTP protegidos sustituidos con nitrobencilo diferentes y cuatro dNTP sustituidos con azidometilo diferentes, uno para cada una de las cuatro bases de ADN.

II. Extensión de ADN usando nucleótidos modificados

1) Nucleótidos etiquetados en fosfato

Se usan los nucleósidos polifosfato etiquetados en fosfato terminal descritos anteriormente en reacciones de polimerasa para generar productos de extensión. Como se muestra en la figura 30, después de una reacción de polimerasa, se obtiene el subproducto liberado del nucleótido etiquetado en fosfato, etiqueta-polifosfato, y el ADN extendido está libre de modificaciones. La etiqueta-polifosfato liberada se usa después en un nanoporo manipulado mediante técnicas de registro de canal único para análisis de secuenciación. Las etiquetas-polifosfatos liberadas también se pueden tratar con fosfatasa alcalina para proporcionar etiquetas libres que también se pueden detectar. Usando cuatro etiquetas diferentes para los cuatro nucleótidos (A, T, G & C) para generar cuatro polifosfatos etiquetados diferentes que se diferencian en masa, carga o volumen, se puede determinar la secuencia del ADN.

2) Nucleótidos etiquetados en la base con enlazadores cortables

Se sintetizan nucleótidos trifosfato etiquetados en la base para secuenciación por síntesis (SBS) de ADN y secuenciación de molécula única (Gao et al. 2008 y 2010). La adición de grandes grupos voluminosos en la posición 5 de pirimidinas (C & T) y la posición 7 de 7-deazapurinas (G & A) puede bloquear la adición de más de un nucleótido en una reacción de ADN polimerasa. Se sintetizan nucleótidos modificados con un enlazador cortable, un grupo voluminosos, y diferentes cargas unidas a la base del nucleótido. Los nucleótidos modificados también pueden tener un pequeño grupo bloqueador en el 3'-OH de los nucleótidos. Estos nucleótidos modificados se usan en una reacción de extensión por polimerasa. Como se muestra en la figura 31, después de la extensión con el nucleótido apropiado, el enlazador y la etiqueta de la base del nucleótido y del azúcar 3'-O, si está bloqueado, se cortan por medios químicos o fotoquímicos y el enlazador-etiqueta liberado se usa en un nanoporo manipulado mediante técnicas de registro de canal único para análisis de secuenciación.

3) Nucleótidos 2'- o 3'-etiquetados con enlazadores cortables

También se puede añadir un enlazador y una etiqueta al 2'- o 3'-OH de los nucleótidos. Después de una reacción de extensión con polimerasa, el enlazador-etiqueta se corta del producto extendido por reacción química, fotoquímica o enzimática para liberar el 3'-OH libre para extensión adicional. Como se muestra en la figura 32, el enlazador-etiqueta liberado se usa después en un nanoporo manipulado mediante técnicas de registro de canal único para análisis de secuenciación.

III. Estudio de secuenciación de ADN usando nanoporo

Se evalúa la discriminación de diferentes nucleótidos en secuenciación de ADN usando nanoporo según la estrategia mostrada en las figuras 30-32. Para validar la capacidad de un nanoporo para distinguir los cuatro enlazadoresetiquetas diferentes en ADN, se realiza una serie de experimentos como se muestra en la figura 33. La ADN/ARN polimerasa se puede unir al nanoporo y un molde que se va a secuenciar se añade junto con el cebador. También puede estar inmovilizado o el molde de ADN o el cebador encima del nanoporo y posteriormente formar un complejo molde-cebador tras la adición de una ADN polimerasa. A este complejo molde-cebador, se añaden cuatro nucleótidos etiquetados de forma diferente juntos o secuencialmente. Después de la incorporación catalizada por polimerasa del nucleótido correcto, el nucleótido añadido libera el polifosfato unido a etiqueta (en caso de nucleótidos marcados en fosfato terminal) que después pasa a través del nanoporo para generar la señal eléctrica que se va a registrar y usar para identificar la base añadida. Opcionalmente, la etiqueta-polifosfato liberado también se puede tratar con fosfatasa alcalina para proporcionar etiqueta libre que también se puede detectar al pasar por el nanoporo. Cada etiqueta genera una firma de bloqueo electrónico diferente debido a la diferencia en tamaño, masa o carga. En el caso de nucleótidos modificados en la base o 2'/3'-modificados, después de la extensión por ADN/ARN polimerasa, la etiqueta del cebador extendido se corta por medios químicos, fotoquímicos o enzimáticos y la firma electrónica de la etiqueta liberada se sigue. La forma, tamaño, masa, carga u otras propiedades de la etiqueta se pueden ajustar según los requisitos.

Como se divulga en el presente documento, se distinguen y caracterizan señales de cada uno de los nucleótidos (Figura 34) y las transiciones entre nucleótidos de diferentes identidades. La magnitud y duración de las firmas de bloqueo en el diagrama de sucesos se analizan y comparan con diagramas conocidos. Por tanto, con estos diseños químicos racionales y modificaciones de los elementos básicos del ADN, el uso de nanoporo se optimiza para descifrar la secuencia de ADN a nivel de molécula individual con resolución de base única.

Para implementar esta novedosa estrategia para secuenciación de ADN, se puede construir una matriz de nanoporos en una superficie plana para realizar secuenciación de ADN paralela masiva como se muestra en la figura 37. La matriz de nanoporos también se puede construir en un chip de silicio u otras superficies. El nanoporo se puede construir de la proteína con bicapas lipídicas u otras capas (poro de alfa-hemolisina, porina A de Mycobacterium smegnatis, MspA) (Derrington et al. 2010) o pueden ser nanoporos de estado sólido sintéticos fabricados en nitruro de silicio, óxido de silicio u óxidos metálicos (Storm et. al. 2005; Wanunu et al. 2008) o un híbrido entre un poro de estado sólido y -hemolisina (Hall et al. 2010).

La figura 37 muestra un esquema de una matriz de nanoporos para secuenciación de ADN paralela masiva por síntesis. Los nanoporos pueden detectar cada subproducto de adición de nucleótido catalizada por ADN/ARN polimerasa (etiqueta unida al fosfato o la base y/o 2', 3'-OH de la fracción de azúcar) según pasa a través del nanoporo. Las propiedades eléctricas de diferentes etiquetas distinguirán las bases, basado en su propiedad de bloqueo en los nanoporos. La matriz de nanoporos mostrada en la figura 37 puede cada uno leer la misma secuencia o diferente secuencia. Aumentar el número de veces que se lee cada secuencia producirá mejor calidad de los datos de secuencia resultantes.

Ejemplo 2

I. Síntesis de desoxiguanosina-5'-tetrafosfatos marcados con PEG (dG4P-PEG):

Se sintetizan desoxiguanosina-5'-tetrafosfatos marcados con PEG (dG4P-PEG) según la figura 38. Primero, 2'-desoxiguanosina trifosfato (dGTP) reacciona con CDI en DMF para activar el grupo fosfato terminal que después se hace reaccionar con fosfato de dubutilamonio para dar el tetrafosfato. El fosfato terminal en este tetrafosfato se activa adicionalmente con EDAC en tampón imidazol 0,1 M seguido por reacción con diaminoheptano para proporcionar un tetrafosfato unido a amino que se hace reaccionar adicionalmente con mPEG-ésteres NHS para proporcionar los cuatro PEG-dG4P requeridos. Después de la incorporación por polimerasa, la carga neta en el PEG liberado es -3 (PEG-NH-trifosfato).

II. Ensayo de nucleótidos modificados en reacciones de extensión de base única.

Los dG4P-PEG se caracterizan por espectroscopia de masas MALDI-TOF como se muestra en la tabla II.

Los dG4P-PEG son excelentes sustratos para ADN polimerasa en extensión de cebador. Los espectros de masas de MALDI-TOF de los productos de extensión de ADN se muestran en la figura 39.

Ejemplo 3

Detección de molécula única por nanoporo de los PEG usados para marcar los nucleótidos

El poli(etilenglicol) es un polímero no electrolito que se une débilmente a cationes (por ejemplo, se une a iones K+ a una Kd ~ 2 M). Por tanto, la carga neta en el polímero depende de la concentración de catión móvil y de la presencia de otras fracciones que estén químicamente unidas a él. Se ha demostrado que un único poro de a-hemolisina puede fácilmente distinguir entre polímeros PEG de diferente tamaño a una resolución mejor que monómero, es decir, mejor que 44 g/mol (Reiner et al. 2010; Robertson et al. 2007). Ese nivel de discriminación se hace posible porque el polímero reduce la conductancia del poro debido a la exclusión de volumen (la conductancia del poro disminuye al aumentar el tamaño del polímero) y al unirse a cationes móviles que de otra manera pueden fluir libremente a través del poro (Reiner et al. 2010). Además, el tiempo de residencia del polímero en el poro es muy sensible a la carga del polímero, que para PEG, escala en proporción a la longitud del polímero. Un nanoporo debería ser capaz de distinguir entre PEG de diferentes tamaños que están químicamente unidos a otras fracciones. Los PEG (PEG 16, 24, 37 y 49) para marcar nucleótidos se ensayan en nanoporo y generan distintas firmas de bloqueo electrónico al nivel de molécula única como se muestra en la figura 40.

Para investigar el efecto del volumen de los polifosfatos diversamente etiquetados en las señales de bloqueo electrónico generadas en el nanoporo, se sintetizan varios nucleótidos unidos a fosfato con etiquetas de polietilenglicol (PEG) de diferente tamaño unidas al fosfato terminal del nucleótido. Primero, como se muestra en la figura 23, se sintetiza una serie de nucleósidos-5'-tri-, tetra-, y penta-fosfato con el fosfato terminal unido a través de un enlazador al que se pueden unir diferentes etiquetas, por ejemplo, PEG de diferente longitud y masa u otras moléculas para aumentar el tamaño molecular o modificar la carga del polifosfato liberado. Después se ensayan estos nucleótidos en reacciones de polimerasa acopladas con detección por nanoporo para ver qué etiquetas o grupos voluminosos unidos al fosfato terminal producen diferencias más drásticas en señales de bloqueo electrónicas entre diferentes bases.

I. Cribar y seleccionar 4 etiquetas PEG con distintas señales de bloqueo de nanoporo

Recientemente, se ha mostrado que cuando una molécula de polietilenglicol (PEG) entra en un poro de a-hemolisina individual, provoca distintos estados de conductancia dependientes de la masa con tiempos de residencia medios característicos (Robertson et al. 2007). La figura 41A muestra que el espectro de masa basado en conductancia claramente resuelve las unidades de repetición de etilenglicol, y el tiempo de residencia aumenta con la masa de PEG.

I.a Ensayo de PEG para firmas de bloqueo de nanoporo

Se seleccionan PEG con diferentes longitudes y pesos moleculares (comercialmente disponibles de Quanta Biodesign Ltd u otros proveedores) y se siguen las señales de bloqueo del nanoporo, como se describe en el ejemplo 2. Como se muestra en la figura 41A los PEG de 28-48 unidades de etilenglicol los distingue claramente el nanoporo. Por tanto, se seleccionan PEG con un amplio intervalo de unidades de etilenglicol que muestran señales de bloqueo de nanoporo muy distintas como etiquetas para marcar los nucleótidos A, C, G y T. Se muestran ejemplos en la figura 41B. También se evalúan PEG ramificados como etiquetas ya que estos se pueden modificar con cargas positivas de una manera más directa. Las estructuras de algunos PEG lineales y ramificados se muestran en la parte inferior de la figura 41.

I.b Diseño y síntesis de PEG marcados con fosfato seleccionados en I.a

En la secuenciación por nanoporo, las señales de bloqueo de la corriente en el nanoporo se generan por los PEG-fosfatos liberados durante la reacción de la polimerasa. Por tanto, se diseñan y sintetizan PEG marcados con fosfato con enlazadores cargados positivamente, y se ensayan estas moléculas con nanoporos orgánicos (por ejemplo, ahemolisina) y sintéticos (fase sólida) para evaluar sus señales de bloqueo de la corriente. Los PEG seleccionados se convierten a sus trifosfatos como se muestra en la figura 42. Por ejemplo, amino-butanol protegido con Fmoc se puede convertir al correspondiente trifosfato haciendo reaccionar primero con oxicloruro de fósforo seguido por reacción con pirofosfato de tributilamonio en una reacción en un recipiente. El trifosfato después de la purificación se activa con DCC/DMF o CDI/DMF para proporcionar trifosfato activado que reacciona con el grupo OH de los PEG para generar PEG-trifosfato. El mismo esquema es aplicable para PEG tanto lineales, así como ramificados. Estos PEG fosfatos se ensayan en nanoporos para optimizar las condiciones para generar distintas señales de bloqueo de la corriente.

Los enlazadores de poliaminoácido (polilisina, poliarginina, polilisina interrumpida) se sintetizan por estrategias sintéticas de péptidos estándar; si se construye un enlace éster a la cadena de polifosfato, debe ser posible usar fosfatasa alcalina para cortarlo, lo que produce etiquetas más fuertemente positivas para interrogación de nanoporos. También se pueden incorporar cargas positivas en las cadenas de PEG.

I.c Diseño y síntesis de una biblioteca de nudeósidos-5’-trifosfato etiquetados en fosfato terminal

Se diseñan y sintetizan nucleósidos-5'-tri-, tetra- y penta-fosfato etiquetados en fosfato terminal. Estas moléculas se ensayan en la reacción de la polimerasa y las óptimas se seleccionan para detección en nanoporo. Se ha mostrado que nucleósidos-5'-tri-, tetra-y penta-fosfato etiquetados en fosfato terminal con una variedad de etiquetas, incluyendo pequeñas o grandes polilisinas, aminoácidos, una variedad de colorantes cargados negativa o positivamente, tal como colorantes de transferencia de energía, y unidades de etilenglicol son aceptados por ADN polimerasas como excelentes sustratos para extensión de cebador (Kumar et al. 2006 y 2008; Sood et al. 2005; y Eid et al. 2009).

I.c.1 Diseño y síntesis de nudeósidos-5’-trifosfato etiquetados en fosfato terminal

Como se muestra en la figura 43, se sintetizan nucleósidos-5'-trifosfato etiquetados en fosfato terminal haciendo reaccionar el correspondiente dNTP con DCC/DMF para dar un trimetafosfato cíclico que se puede abrir con nucleófilos para generar un nucleósido-5'-trifosfato unido a etiqueta o enlazador. Además, el enlazador unido al fosfato se puede hacer reaccionar con PEG-ésteres NHS para proporcionar nucleósidos-5'-trifosfato unidos a PEG alternativos. El nucleósido-5'-trifosfato etiquetado en fosfato terminal resultante se usa en la reacción de extensión de molde-cebador y al pirofosfato unido a etiqueta liberado se detecta y diferencia por sus parámetros de bloqueo de la corriente de nanoporo específicos.

I.c.2 Diseño y síntesis de nudeósidos-5’-tetrafosfato etiquetados en fosfato terminal

Para la síntesis de nucleósidos-5'-tetrafosfato etiquetados en fosfato terminal, el correspondiente trifosfato se hacer reaccionar primero con CDI en DMF para activar el grupo fosfato terminal que después se hace reaccionar con ácido fosfórico o etiqueta-monofosfato para dar el tetrafosfato como se muestra en la figura 44. El fosfato terminal en el tetrafosfato se puede activar adicionalmente con EDAC en tampón imidazol 0,1 M seguido por reacción con un nucleófilo apropiado para proporcionar un tetrafosfato unido a enlazador que se puede usar para unir etiquetas de diferente masa, longitud o carga, tal como m-PEG-ésteres NHS. En este caso, se usan cuatro trimetillisinas para neutralizar la carga de cuatro fosfatos. Después de la incorporación por polimerasa, la carga neta en el PEG liberado es 1 o, si se trata con fosfatasa alcalina, 4, que puede ser detectado por el nanoporo.

I.c.3 Diseño y síntesis de nudeósidos-5’-pentafosfato etiquetados en fosfato terminal

La síntesis de nucleósidos-5'-pentafosfato etiquetados en fosfato terminal sigue el mismo principio que se muestra en la figura 45. Se pueden preparar a partir de trifosfatos o tetrafosfatos activados haciéndolos reaccionar con ácido fosfórico, pirofosfato o fosfatos unidos a etiqueta. Alternativamente, se puede unir un enlazador al pentafosfato seguido por reacción con éster NHS activados.

Los nucleósidos polifosfato etiquetados en el fosfato terminal descritos anteriormente se usan en la reacción de polimerasa para generar productos de extensión. Según el esquema mostrado en la figura 30, se evalúa el rendimiento de los nucleósidos polifosfato etiquetados en el fosfato terminal. Primero se realiza una reacción de extensión de base única y se caracteriza el producto de extensión de ADN por espectrometría de masas de MALDI-TOF para evaluar la eficacia de incorporación. Después de establecer condiciones de reacción optimizadas, se inmoviliza el molde en perlas magnéticas y se repite la reacción de extensión de base única, después de lo cual los polifosfato-etiqueta liberados se aíslan de la solución para detección usando un único nanoporo. Esta reacción se realiza continuamente para evaluar todos los 4 nucleótidos (A, C, G y T) y sus correspondientes etiquetas liberadas detectadas por el nanoporo. La reacción de la polimerasa continua con los nucleótidos polifosfato-etiqueta y la clara distinción del polifosfato-etiqueta liberado por el nanoporo establece la viabilidad del enfoque.

Como se muestra en la figura 30, después de la reacción de la polimerasa, se obtiene el subproducto liberado del nucleótido etiquetado en fosfato (etiqueta-polifosfato) y la hebra de ADN extendida está de cualquier modificación.

Esto es ventajoso porque cualquier cicatriz que permanece en las cadenas de ADN en crecimiento pueden afectar su capacidad para ser reconocidas por la polimerasa con adiciones de nucleótidos crecientes, terminando finalmente síntesis de ADN adicional. El polifosfato unido a etiqueta liberado se ensaya en el nanoporo para evaluar la sensibilidad y precisión de secuenciación. En experimentos iniciales, se ensaya las señales de bloqueo de las etiquetas antes de correr las reacciones de SBS. La secuencia del ADN puede determinar si diferentes etiquetas para los cuatro nucleótidos se usan para generar cuatro diferentes polifosfatos etiquetados que se diferencian en masa, carga o volumen y dan 4 señales de bloqueo distintas.

II. Detección de los fosfatos etiquetados liberados por nanoporos de proteínas

Se usa un único nanoporo de a-hemolisina para detectar PEG que están unidos a nucleótidos unidos a través de un enlazador multifosfato y el mismo polímero después que la fracción nucleótido/ribosa se haya cortado por la reacción de ADN polimerasa. Cada una de las cuatro bases diferentes del ADN se une a un polímero de PEG con una longitud única. Por tanto, se identifica cada base que se elimina del PEG por la polimerasa. Puesto que los nucleótidos sin reaccionar no pueden separarse de los polifosfatos etiquetados liberados, especialmente en situaciones en tiempo real, se aprovecha la extrema sensibilidad del método a carga molecular para discriminar entre el producto de reacción liberado y el material de partida. Se mide la conductancia de a-hemolisina individual usando soportes de vidrio cónicos (White et al. 2006 y 2007) que permiten la recogida de datos a 100 kHz y ruido RMS de ~4 pA. Se mide la profundidad de bloqueo y las distribuciones del tiempo de residencia tanto de nucleótidos etiquetados como productos etiquetados en una amplia gama de potenciales transmembrana para determinar las condiciones óptimas para la discriminación de nucleótidos y para extender nuestro entendimiento teórico actual de interacciones PEG-nanoporo (Robertson et al.

2007) a moléculas con cargas fijadas. La caracterización y entendimiento teórico permiten la identificación no ambigua de los nucleótidos incorporados en polinucleótidos por la polimerasa. Por tanto, con estos diseños químicos racionales y modificaciones de los componentes esenciales del ADN, se optimiza el uso de nanoporos para descifrar el ADN a nivel de molécula única con resolución de base individual en nanoporos de proteína o sintéticos.

Ejemplo 4

Fabricación de un nanoporo de estado sólido único para secuenciación de molécula única

La transición de un nanoporo de proteína a un nanoporo de estado sólido hace posible la fabricación de matrices de nanoporos de alta densidad, una etapa clave para dar un secuenciador de ADN electrónico de molécula única de alto rendimiento. Aquí, se desarrolla una plataforma de nanoporo de estado sólido único integrada para caracterizar los nucleótidos etiquetados en la reacción de la polimerasa basado en el conocimiento ganado del nanoporo de proteína.

Plataforma de nanoporo integrada

Desarrollamos electrónica CMOS de bajo ruido integrada especializada, que cuando se integra con nanoporos de estado sólido, proporcionan ventajas de rendimiento significativas sobre técnicas de medida “estándar” que emplean amplificadores electrofisiológicos externos, tal como el Axopatch 200B. Estas ventajas vienen de explotar la retroalimentación capacitiva (mas que resistiva) en un diseño de amplificador de integración personalizado. La corriente CC, que es característica de esta y otras interfaces bioelectrónicas, se elimina con una fuente de corriente de bajo ruido que opera en un bucle de servosistema de CC. Las capacitancias de entrada del amplificador reducidas y las capacitancias parasíticas reducidas asociadas con cointegración de rendimiento de ruido a altas frecuencias, que permite anchos de banda que se acercan a 1 MHz para poros de estado sólido. Tal alta resolución temporal, cuando se combina con las etiquetas desarrolladas, proporcionará alta flexibilidad para ajustar esta plataforma para rendimiento de alta sensibilidad y tiempo real.

Uso de este circuito integrado de nanoporo integrado con CMOS (CNP) en una configuración en un chip o dos chips como se muestra en la figura 46. En el primer caso, el poro se empaqueta junto con el CNP como se muestra en la figura 46B. En el último, el poro se fabrica directamente en el CNP como se muestra en la figura 46C con fluídica en ambos lados del chip. En ambos casos, el electrodo cis, que conecta a la entrada del amplificador, se integra directamente en la superficie del CNP. La configuración de un chip tiene la ventaja de ser fácilmente escalable a una plataforma multiplexada al coste de complejidad de fabricación adicional. La capacidad de post-procesar dados CMOS fabricados (que no tienen más de 5 mm en un lado) es una capacidad única establecida durante los últimos cinco años (Huang et al. 2011, Lei et al. 2008 y Levine et al. 2009). Este enfoque completamente aprovecha flujos de proceso de fundición existentes más que requerir nuevo desarrollo de proceso.

El enfoque de fabricación de un chip procede al adaptar técnicas de fabricación de nanoporos de estados sólido estándar (Rosenstein et al. 2001). En áreas del dado reservadas para los sensores, todos los metales se han bloqueado, dejando una espesa pila alternante de relleno de vidrio y capas de protección de nitruro de silicio. La mayoría de la pila dieléctrica se graba usando un plasma de CHF3 inductivamente acoplado. Después de depositar y estampar una máscara de grabado de Si3N4 PECVD en la parte trasera del dado, se hacen aberturas localizadas en el sustrato de silicio usando un grabado de hidróxido de potasio anisotrópico. Una corta inmersión en ácido fluorhídrico tamponado se usa después para aislar una única capa de 50 nm de nitruro de silicio de la pila dieléctrica original como una membrana suspendida. Por último, los nanoporos se perforan a través de estas membranas de nitruro con un microscopio electrónico de transmisión de alta resolución.

El ruido medido de este sistema se muestra en la figura 47A, junto una medida del ruido basal para una configuración comparable del Axopatch 200B. Para el mayor ancho de banda soportado por el Axopatch (B = 100 kHz), el amplificador integrado tiene un ruido de fondo de 3,2 pArms, comparado con 9 pArms para el Axopatch. Al mayor ancho de banda caracterizado para el amplificador integrado (B = 1 MHz), el nivel de ruido es 27 pArms, en contraste con 247 pArms modelado extrapolando la respuesta del Axopatch más allá de su intervalo soportado (un ruido menor en aproximadamente un factor de diez). Como punto de comparación, para una señal de 1 nA, solo aproximadamente 6250 iones son transportados a través del poro en 1 us. Un nivel de ruido referido de entrada de 27 pAVrms para el amplificador integrado permite la resolución de tan pocos como 150 iones en este intervalo.

También es importante indicar que este rendimiento eléctrico superior se obtiene con un amplificador integrado que consume un área de solo 0,2 mm2 en un chip CMOS comparado con un amplificador Axopatch montado en una rejilla, lo que demuestra la significancia de la electrónica innovadora. Cuando se conecta un nanoporo a la entrada del amplificador, la introducción de ruido 1/f y capacitancia de membrana sube el espectro del ruido por encima del nivel basal de toma de señal abierta. La figura 47b muestra un espectro de ruido típico en este caso, que demuestra ruidos de fondo de solo 10 pArms y 163 pArms para anchos de banda de 100 kHz y 1 MHz, respectivamente. Las comparaciones medidas se muestran con el Axopatch hasta 100 kHz para el mismo nanoporo. A 100 kHz, hay una reducción de más de un factor de dos en la potencia del ruido referido de entrada para el CNP. Si el Axopatch se puede medir a mayores anchos de banda, puede haber una diferencia de potencia de ruido de un factor de seis a 1 MHz.

Esta plataforma también permite la integración de nanoporos biológicos, proporcionando incluso más flexibilidad. Los nanoporos biológicos se crean en membranas lipídicas (típicamente 1,2-dioleil-sn-glicero-3-fosfocolina (DOPC)) formadas sobre un agujero en una membrana de teflón entre dos células fluidas. La superficie debe ser suficientemente hidrofílica para que la membrana se forme de vesículas unilamelares. La conductancia entre las dos cámaras de la célula se sigue mientras se añade proteína de membrana a una de las células, que inmediatamente se enjuaga una vez que se detecta la incorporación. Las membranas usadas para fabricar los nanoporos también se pueden usar como soportes sólidos para bicapas lipídicas con la perforación de agujeros mayores en las membranas, sobre los que se forma la bicapa lipídica (Clarke et al. 2009; Benner et al., 2007; Hou et al., 2009; y Wang et al. 2011). Las membranas lipídicas bicapa planares (BLM) se han manipulado con diferentes canales de proteína en soportes sólidos estampados con agujeros nanoestampados (~100 nm de diámetro), así como anclándolos directamente en oro mediante un ensamblaje de monocapa autoensamblada (Axelrod et al., 1976, Bultmann et al. 1991, Dutta et al. 2010, Jenkins et al. 2001, Nam et al. 2006, Palegrosdemange et al. 1991, Shen et al. 2009, Srinivasan et al. 2001, Yang et al. 2003, Yin et al. 2005). Además, se ha mostrado que la formación de BLM contiguas con un coeficiente de difusión de 4 |jm2/s en sustratos nanoestampados; BLM formadas en ensamblajes SAM-oro dieron un coeficiente de 0,8 jm 2/s. Ambos están en el intervalo de difusión ideal 0,1-10 jm 2/s representativo de BLM bien formadas (Axelrod et al., 1976, Bultmann et al. 1991). Las caracterizaciones eléctricas de estas BLM indican una membrana de alta impedancia con una resistencia de 1,4 GW-mm2, lo que la hace susceptible para análisis eléctrico adicional de nanoporos biológicos formados en la membrana (Oliver et al. 1994, Shi et al. 2000, Wiehelman 1988).

Inmovilización de polimerasa a superficies que portan nanoporos

El tamaño de la polimerasa es aproximadamente 5 nm x 5 nm. Una polimerasa se coloca cerca de la entrada a cada nanoporo. Para lograr esto para los nanoporos de estado sólido, es necesario que (1) una posición única en la superficie se modifique con grupos funcionales durante la fabricación de CMOS para unir la polimerasa; (2) que los sitios sean suficientemente pequeños que solo se pueda unir una molécula de polimerasa; (3) que estén suficientemente separados que haya poca posibilidad de difusión de los polifosfatos etiquetados liberados a un canal cercano; y (4) que el agente entrecruzador sea suficientemente flexible que la enzima esté funcionalmente intacta. El anclaje de la polimerasa se logra combinando un punto de unión estampado con el uso de una concentración apropiada de solución de polimerasa durante la incubación de modo que como mucho una molécula de enzima se una.

El establecimiento del punto de anclaje apropiado para la polimerasa se logra explotando enfoques de fabricación existentes para nanoporos de estado sólido. Típicamente, para maximizar las señales de transducción, estos poros se crean adelgazando una membrana de Si3N4 soportada usando litografía con haz de electrones para definir una ventana que posteriormente se adelgaza con un grabado de plasma (por ejemplo, SF6). El nanoporo se perfora después en la región adelgazada usando ablación con haz de electrones. El pocillo creado por esta ventana (Figura 48) crea un lugar natural para anclar la polimerasa, garantizando gran proximidad a la entrada del nanoporo. Antes de grabar la ventana adelgazada, la membrana original se puede aumentar con una capa epitaxial enterrada de material de unión. Una vez la ventana se graba, esta se puede convertir en una región flanco selectiva para unión de la polimerasa. Los materiales de unión incluyen dióxido de silicio u oro. Puede haber selectividad limitada con dióxido de silicio, sin embargo, porque un óxido también se puede formar en la superficie de nitruro de silicio en las condiciones apropiadas.

En principio, con superficies de dióxido de silicio, se pueden usar enlaces de biotina-estreptavidina (Korlach et al.2008 y 2010), utilizando moléculas de PEG biotiniladas en los parches de sílice e incubar polimerasa marcada terminalmente con biotina en presencia de estreptavidina. El resto de la superficie se pasiva con ácido polivinilfosfónico. Debido a las preocupaciones generadas anteriormente, es preferible en su lugar modificar la superficie de oro con monocapa autoensamblada de alcanotiol (SAM) funcionalizada con grupos amino (Love et al. 2005). Estos se pueden modificar fácilmente a ésteres NHS para unión a grupos amino en la polimerasa. El espesor y homogeneidad de la capa se determina por elipsometría o microscopía de fuerza atómica.

Desarrollo de nucleótidos 5’-modifícados con enlazadores cargados positivamente

Se genera un sistema para la rápida difusión de las etiquetas liberadas hacia los poros mientras los nucleótidos precursores y ADN son repelidos por los poros. Los nucleótidos etiquetados se manipulan de modo que después de la incorporación al ADN, la etiqueta liberada del nucleósido tiene una carga positiva acumulada mientras los nucleósidos con etiqueta intactos permanecen neutros. Esto permite dirigir activamente la etiqueta liberada específicamente a través del canal de detección, si el canal está negativamente cargado según los métodos (Wanunu et al. 2007). Como todas las otras moléculas libres presentes en una mezcla de reacción (cebadores, nucleótidos sin reaccionar, molde), diferentes de la etiqueta, están negativamente cargadas, solo la etiqueta liberada que porta carga positiva es atraída al canal, aumentando la especificidad de detección y reduciendo el ruido. Se puede usar un número diferente de grupos cargados en diferentes etiquetas, dependiendo de la base del nucleótido específica. Por tanto, la carga acumulada de la etiqueta junto con su tamaño se puede usar para discriminación de bases. Después de la incorporación y liberación de la etiqueta, si se juzga que el polifosfato enmascara la carga positiva, se puede eliminar usando reacciones secundarias (por ejemplo, fosfatasa alcalina inmovilizada en un segundo sitio posterior en el poro). La etiqueta cargada positivamente se puede dirigir al canal negativamente cargado para detección y reconocimiento.

Difusión y deriva

Un aspecto crítico de este sistema de secuenciación es la captura fiable y oportuna de cada etiqueta liberada por nucleótido por el nanoporo adyacente. Las condiciones se deben manipular de modo que las etiquetas se capturen rápidamente y en el orden correcto. Además, la velocidad de captura de etiquetas no incorporadas se debe minimizar, y la interferencia de canales adyacentes debe ser despreciable. Crear el pocillo a la entrada del poro (como se muestra en la figura 48) ayuda a este proceso, que también depende de la estrecha proximidad de la polimerasa a la abertura del nanoporo. El análisis de los procesos de captura de nanoporos en general considera un proceso radialmente simétrico rodeando el poro. La geometría dicta que, en ausencia de un campo eléctrico, una molécula tiende a difundir más lejos de un poro, en oposición a la atracción electrostática. Con un gradiente de voltaje, existe una distancia crítica L a la que el movimiento molecular debido a difusión y electroforesis son iguales (Gershow et al. 2007). Esta distancia crítica es una función de la corriente iónica (I) y conductividad de electrolitos (a), así como la constante de difusión (D) y la movilidad (u) de la molécula de analito, L = — 2 n a - D. La captura es un proceso estadístico, pero aproximadamente el 50% de las moléculas a una distancia L es capturada. Esta probabilidad aumenta para distancias más cortas, y supera el 90% para d<L/3. Durante este proceso, las moléculas típicamente son capturadas en una escala de tiempo en el [2

orden de tcaptura = —. Al colocar la polimerasa a L/3 del nanoporo, casi todas las moléculas son capturadas. También asegura que tcaptura es significativamente más rápido que la velocidad de incorporación de la polimerasa, para capturar bases en el orden correcto.

Un valor aproximado para el coeficiente de difusión de moléculas de PEG de 25 unidades es D = 3e-10 m2/s (Shimada et al. 2005), que está en el mismo orden de magnitud que un fragmento de ADNmc de longitud similar (Nkodo et al.

2001). Asumiendo la validez de la relación de Nernst-Einstein (aunque esto no es siempre cierto para polímeros), la movilidad se puede estimar como una función de la constante de difusión y la carga neta (Q), ^ « — Kb T . Para estas estimaciones, entonces, con I = 5 nA en KCl 1 M - véase la siguiente tabla.

Ejemplo 5

Fabricar una matriz de nanoporos de estado sólido

Además de rendimiento mejorado, solo con la electrónica integrada es posible producir matrices de nanoporos masivamente paralelas. Esto implica la topología de un chip mostrada en la figura 46C en la que los nanoporos se integran directamente en la matriz CMOS con fluídica en cada lado del chip. El enfoque para integrar múltiples poros también se muestra en la figura 46C. En este caso, se usan pocillos de fotorresistente SU-8 para aislar nanoporos individuales uno de otro. Este es un enfoque similar al de Rothberg et al. 2011. En Rothberg et al., sin embargo, los pocillos aun pueden permanecer “conectados” por el depósito de solución encima del chip. En el caso presente, puesto que es necesario el aislamiento eléctrico entre los depósitos cis, se usa una caperuza de PDMS para sellar los pocilios para medida después de la introducción de los reactivos como se muestra en la figura 46C. Se integran 64 nanoporos de estado sólido en el mismo dado de 5 mm por 5 mm. El diseño de amplificador integrador de corriente, que puede tener que duplicarse en cada sitio de poro, tiene solo 250 um por 150 um, pero se tiene que dejar espacio adicional para la fabricación del poro mismo. Según las técnicas de fabricación se desarrollan más para reducir el área del chip, esto se puede escalar fácilmente a una matriz de 16 por 16 electrodos.

Ejemplo 6

Pirosecuenciación usando nucleótido etiquetado en fosfato y detección con nanoporo

La pirosecuenciación es un método de secuenciación por síntesis (SBS) que se basa en la detección de pirofosfato que se libera cuando un nucleótido se incorpora en la hebra de ADN en crecimiento en la reacción de polimerasa (Ronaghi et al. 1998). En este enfoque, cada uno de los cuatro dNTP se añade secuencialmente con una mezcla de enzimas, sustratos, y los componentes habituales de la reacción de la polimerasa. Si el nucleótido añadido es complementario a la primera base disponible en el molde, el nucleótido se incorporará y se liberará un pirofosfato. Mediante una cascada de enzimas, el pirofosfato liberado se convierte en ATP, y después de vuelve una señal lumínica visible por la luciferasa de luciérnaga. Por otra parte, a el nucleótido añadido no se incorpora, no se producirá luz y el nucleótido simplemente se degradará por la enzima apirasa. La pirosecuenciación se ha aplicado con éxito a la detección de polimorfismo de nucleótido único (SNP) y secuenciación de ADN. Se desarrolló una plataforma de secuenciación comercial que combina pirosecuenciación y amplificación de molde de ADN en microperlas individuales para secuenciación de a Dn de alto rendimiento (Margulies et al. 2005). Sin embargo, hay dificultades inherentes en pirosecuenciación para determinar el número de nucleótidos incorporados en regiones homopoliméricas (por ejemplo, una cadena de varias T en una fila) del molde. Además de esto, hay otros aspectos de la pirosecuenciación que todavía necesitan mejora. Por ejemplo, cada uno de los cuatro nucleótidos se tiene que añadir y detectar por separado. La acumulación de nucleótidos sin degradar y otros componentes también puede disminuir la precisión del método cuando se secuencia un molde de ADN largo.

Este es un enfoque de pirosecuenciación modificado que se basa en la detección de etiqueta o etiqueta-fosfato liberadas durante la reacción de la polimerasa. En este enfoque, se usan nucleótidos etiquetados en fosfato en reacción catalizada por polimerasa en un complejo molde-cebador. Tras la incorporación de nucleótidos etiquetados, la fracción fosfato-etiqueta se libera, que se puede detectar pasando a través de un nanoporo. Se puede usar la misma etiqueta en cada nucleótido o se puede usar una etiqueta de diferente peso molecular y longitud (tal como PEG). Se ha mostrado que se pueden resolver polietilenglicoles (PEG) de diferente longitud y masa a sensibilidad de molécula única cuando se pasan a través del nanoporo de hemolisina (Robertson et al. 2009).

También se puede usar un canal de a-hemolisina para detectar ácidos nucleicos a nivel de molécula única (Kasianowicz et al. 1996). El polipéptido monomérico se autoensambla en una bicapa lipídica para formar un poro heptamérico, con una apertura limitante de 1,5 nm de diámetro. En una solución salina iónica acuosa, el poro formado por el canal de a-hemolisina conduce una corriente iónica fuerte y constante cuando se aplica un voltaje apropiado a través de la membrana. La apertura limitante del nanoporo permite que atraviesen moléculas de ácido nucleico monocatenarias lineales, pero no bicatenarias (diámetro ~ 2,0 nm). Los ácidos nucleicos polianiónicos son dirigidos a través del poro por el campo eléctrico aplicado, que bloquea o reduce la corriente iónica. Este paso genera una firma electrónica única. Por tanto, un diagrama de sucesos específico, que es el gráfico de tiempo de translocación frente a corriente de bloqueo, se obtendrá y usará para distinguir la longitud y la composición de polinucleótidos por técnicas de registro de canal único basadas en parámetros característicos tal como corriente de translocación, duración de la translocación, y su correspondiente dispersión en el diagrama. Se seleccionan cuatro etiquetas PEG, que se ha mostrado que dan señales de bloqueo de la corriente distintas en nanoporos, para acoplar con cuatro nucleótidos (A, C, G, T) en el fosfato terminal. Estos novedosos análogos de nucleótidos se usan en una reacción de polimerasa y se usan nanoporos para detectar las etiquetas liberadas para descodificar las bases incorporadas como se muestra en la figura 33.

Hay varias ventajas a este enfoque:

1) Evita el uso de muchas enzimas diferentes (ahorra coste y complejidad).

2) Adición de nucleósido polifosfato unido a etiqueta individual secuencialmente o todos los cuatro nucleótidos con diferentes etiquetas unidas a cada nucleótido.

3) Uso de PEG como etiquetas que se pueden detectar por nanoporo a una resolución de unidad única.

4) Secuenciación con detección de molécula única en tiempo real ya que la etiqueta pasa a través del nanoporo.

5) Secuenciación masivamente paralela, bajo coste y alto rendimiento.

Como se muestra en la figura 33, la ADN polimerasa se inmoviliza al nanoporo y se añade el molde-cebador junto con los nucleótidos etiquetados con PEG. En la incorporación del nucleótido etiquetado con PEG correcto, los PEG-fosfatos liberados pasan a través del nanoporo y la señal de bloqueo electrónico se mide. PEG de diferentes longitudes tienen diferentes señales de bloqueo, por tanto, se pueden usar 4 PEG diferentes para 4 nucleótidos diferentes.

Los nucleótidos se pueden añadir uno cada vez, si se añade el nucleótido correcto da una señal de bloqueo distinta. Sin embargo, si el nucleótido no es complementario a la base del ácido nucleico molde, no se incorporará y por tanto no se detectará señal. En una manera masiva paralela se puede construir una matriz de alta densidad de micro/nano pocillos para realizar el proceso bioquímico. Cada micro/nano-pocillo contiene un molde de ADN diferente y dispositivo de nanoporo. Los PEG liberados se detectan a sensibilidad de molécula individual.

Los métodos generales para la síntesis de nucleósidos-5'-polifosfatos marcados con etiqueta se muestran en la figura 49. Se pueden sintetizar nucleósidos-5'-tri, tetra-, penta- o hexa-fosfato marcados en el fosfato terminal empezando de los correspondientes nucleósidos-5'-trifosfatos (NTP). Por tanto, el trifosfato primero se activa con DCC/DMF que se puede hacer reaccionar directamente con la etiqueta-nucleófilo para el NTP unido a la etiqueta o se puede hacer reaccionar con un nucleófilo enlazador al que se puede hacer reaccionar una etiqueta-NHS o etiqueta apropiadamente activada para proporcionar NTP unido a etiqueta-enlazador. Para ls síntesis de nucleósidos tetrafosfato (N4P) o pentafosfatos (N5P) unidos a etiqueta, el trifosfato activado primero se hace reaccionar con ácido fosfórico o pirofosfato para dar tetra- y penta-fosfato, respectivamente, que se pueden hacer reaccionar con el nucleófilo enlazador seguido por reacción con las etiquetas activadas apropiadas.

La síntesis de nucleótidos marcados con PEG se discute anteriormente en los ejemplos 2 y 3. Los nucleótidos marcados con PEG tienen -3, -4, -5 o -6 cargas basado en el uso de tri-, tetra-, penta- o hexa-fosfato. Después de reacción de extensión del cebador catalizada por la polimerasa, la carga neta en los PEG-etiquetas liberados será una menos (-1) que el PEG-nucleótido de partida lo que es suficiente para distinguir por la señal de bloqueo iónico del nanoporo (el PEG-nucleótido sin reaccionar también es más voluminoso que los PEG-fosfatos liberados, por tanto, señal de bloqueo iónico diferente). Alternativamente, si está presente fosfatasa alcalina en la mezcla de reacción, el PEG liberado será neutro (los grupos fosfato libres son hidrolizados por la fosfatasa alcalina). Los PEG-etiquetas liberados también se pueden hacer cargados positivamente como se muestra posteriormente de modo que pueden ser fácilmente detectados por nanoporos. Similarmente, también se pueden hacer muy negativamente cargados.

Síntesis de nucleósidos polifosfato unidos a etiqueta positivamente cargados

Los nucleósidos polifosfato unidos a etiqueta positivamente cargados se sintetizan como se muestra en la figura 44. Primero, un aminoácido trimetil-(lisina)ⁿ-glicina (K((Me)³)ⁿ-Gly) se hace reaccionar con el PEG-éster NHS y después se activa para formar PEG-K((Me)³)ⁿ-Gly-éster NHS. Este éster activado se hace reaccionar con el nucleósidopolifosfato terminado en amino mostrado en las figuras 38 y 44. La carga neta en el nucleósido-tetrafosfato es neutra, pero después de la incorporación por polimerasa, el PEG liberado tiene una carga positiva 1 y si se añade una fosfatasa alcalina a la mezcla de reacción, la carga neta en el PEG liberado es 4. Por tanto, la etiqueta liberada se puede separar fácilmente e identificar al pasar a través del nanoporo.

Síntesis de nucleósidos-polifosfato unidos a PEG 3'-bloqueados para secuenciación por síntesis con detección con nanoporo

La síntesis de nucleósidos-polifosfato 3'-bloqueados esencialmente sigue la misma ruta que se muestra para nucleósidos polifosfato unidos a etiqueta, excepto que el nucleósido-5'-trifosfato de partida es dNTP 3'-0-bloqueado. Como se muestra en la figura 50, 3'-O-azidometil-dNTP (6) se hacer reaccionar primero con CDI o DCC/DMF seguido por reacción con ácido fosfórico (tetrafosfato) o pirofosfato (pentafosfatos). Este se hace reaccionar con después de purificación con el nucleófilo apropiado para proporcionar un fosfato terminado en amino que se hace reaccionar después con el PEG-éster n Hs apropiado (neutro, con carga positiva o carga negativa) para proporcionar el nucleósido-polifosfato unido a PEG 3'-0-bloqueado.

Esquema de secuenciación con PEG-nucleótidos y detección con nanoporo (muchas copias de una molécula de ADN se inmovilizan en una perla y adición secuencial de un PEG-nucleótido cada vez).

Como se muestra en la figura 51, las moléculas de ADN se inmovilizan en una perla. Por tanto, cada perla tiene muchas copias de la misma molécula de ADN. La perla se añade a un micro/nano-pocillo que está unido a un nanoporo. El ADN forma el complejo con la ADN polimerasa que o bien está unida al nanoporo o se añade al micro/nano pocillo junto con el nucleótido unido a PEG. Los nucleótidos se pueden añadir uno cada vez, si se añade el nucleótido correcto se incorpora y se libera un PEG-etiqueta que da una señal de bloqueo distinta cuando pasa a través del nanoporo. Sin embargo, si el nucleótido no es complementario a la base del ácido nucleico molde, no se incorporará y por tanto no se detectará señal. En este caso, se puede usar PEG de la misma longitud y peso molecular en los cuatro nucleótidos, o, si se desea, también se pueden usar cuatro PEG diferentes. Por tanto, la adición de base de ácido nucleico se puede detectar fácilmente por la señal de bloqueo del nanoporo a sensibilidad de molécula única.

Secuenciación por síntesis con PEG-nucleótidos 3'-0-bloqueados y detección por nanoporo (muchas copias de una molécula de ADN se inmovilizan en una perla y adición simultanea de los cuatro PEG-nucleótidos 3'-O-bloqueados).

Las regiones homopoliméricas del ADN se pueden secuenciar corregidas usando este enfoque. Por tanto, si el grupo 3'-OH del nucleótido está bloqueado por una fracción reversible, la síntesis de ADN parará después de la adición de solo un nucleótido. La síntesis puede seguir después de la eliminación del grupo bloqueador para generar un grupo 3'-OH libre. Como se muestra en la figura 52 se pueden añadir los cuatro 3'-O-azidometil-nudeótidos unidos a PEG de diferente tamaño al micro/nano-pocillo de reacción y cuando un nucleótido correcto se incorpora, el PEG-etiqueta liberado se lee al pasar a través del nanoporo y detectar la señal iónica. Puesto que el grupo 3'-OH está bloqueado solo un nucleótido se añade cada vez. Este grupo 3'-O-bloqueado puede ser cortado por tratamiento con TCEP y por tanto el grupo OH libre está listo para incorporación de nucleótido adicional. Por adición repetida de nucleótido y corte, la región homopolimérica se puede secuenciar de forma correcta y fácil.

Pirosecuenciación masivamente paralela usando nanoporos

Como se muestra en la figura 53, en una manera masiva paralela se pueden construir matrices de alta densidad de micropocillos para realizar el proceso bioquímico. Cada micro/nano-pocillo contiene un molde de ADN diferente y dispositivo de nanoporo. Los PEG liberados se detectan a sensibilidad de molécula individual.

Resumen del experimento:

1) Cualquier etiqueta de diferente tamaño, longitud, peso molecular, carga unida el fosfato terminal del nucleótido que se puede detectar por nanoporo después de la incorporación por polimerasa.

2) Etiqueta unida a los tri-, tetra-, penta-, hexa-fosfatos.

3) Detección electrónica.

4) Grupo de moléculas de ADN unidas a la perla o superficie sólida y sensibilidad de detección de molécula única (alta densidad y alta sensibilidad).

5) Región homopolimérica fácilmente secuenciada usando nucleótidos 3'-O-bloqueados unidos a etiqueta.

6) Añadir una etiqueta-nucleótido por ciclo.

7) Añadir los cuatro nucleótidos reversiblemente etiquetados juntos para secuenciar regiones homopoliméricas. 8) Alta sensibilidad, precisión y velocidad.

9) Secuenciación masiva paralela.

Ejemplo 7

Espectrometría de masa/tamaño de molécula única en solución usando nanoporo

Método

Se formaron membranas de bicapa lipídica planares sin solvente de difitanoil fosfatidilcolina (1,2-difitanoil-sn-glicero-3-fosfocolina; Avanti Polar Lipids, Alabaster, Ala.) en pentano (J. T. Baker, Phillipsburg, N.J.) en un agujero de ~70 pm de diámetro en una división de teflón de 25 pm de espesor que separa dos cámaras de Teflón idénticas. El agujero se pretrató con una solución de hexadecano 1:400 vol/vol (Aldrich, St. Louis, Mo.) en pentano. Ambas cámaras contenían KCl 4 M (Mallinckrodt, Paris, Ky.), 2-amino-2-hidroximetil-1,3-propanodiol 5 mM (Tris; Schwarz/Mann Biotech, Cleveland, Ohio), ajustada a pH 7,5 con ácido cítrico concentrado (Fluka, Buchs, Suiza).

Se formaron canales individuales añadiendo ~ 0,25 pg de a-hemolisina (List Biological Laboratories, Campbell, Calif.) a la solución en un lado de la división. Después de formarse un único canal, la primera cámara se enjuagó rápidamente con tampón reciente para prevenir incorporación adicional al canal. A menos que se indique de otra manera, los datos se obtuvieron con una potencial aplicado de -40 mV con dos electrodos de Ag/AgCl separados del electrolito masivo por puentes salinos Vycor (KCl 3 M). La corriente se midió usando un amplificador de pinzamiento zonal Axopatch 200B (Molecular Devices, Sunnyvale, Calif.) y filtrada a 10 kHz con un filtro Bessel de cuatro polos antes de la digitalización a 50 kHz.

La toxina a-hemolisina puede formar al menos dos confórmeros que tienen diferentes niveles de conductancia y propiedades de activación. Solo el confórmero de mayor conductancia se usó aquí, que tiene una conductancia aproximadamente óhmica de 3,75 nS entre ± 50 mV (datos no mostrados). Se añadió PEG (PEG 1500 polidisperso; Fluka; o PEG 1294 monodisperso; Polypure; Oslo, Noruega) a la segunda cámara de soluciones madre de 12 mg/ml en electrolito a una concentración final de 0,045 mg/ml.

Se obtuvieron espectros de masa MALDI-TOF de las muestras de PEG con un Voyager DE-STR (PerSeptive Biosystems, Framingham, Mass.) usando el modo reflectrón. Se produjo la desorción/ionización por irradiación con luz UV pulsada (337 nm) de un láser de nitrógeno. El instrumento se operó a 25 kV en el modo ion positivo usando un tiempo de retraso de extracción ajustado a 600 ns. Los espectros finales se promediaron de 100 disparos mientras se movía el laser sobre la superficie de la muestra ajustada la potencia del láser ligeramente por encima del umbral para la aparición de cada espectro. Las muestras se prepararon de soluciones de PEG al 1% p/p en agua destilada. La solución de matriz era acetonitrilo:agua 1:1 saturada con ácido retinoico todo trans (Sigma, St. Louis, Mo.) con ácido fluoroacético al 0,1% (Matheson, Joliet, Ill.) añadido. La muestra y matriz se mezclaron 1:1 a un volumen total de 2 pl antes de secar.

Discusión

En ausencia de analito, la corriente iónica causada por un potencial CC está bien definida. El ruido intrínseco en la corriente iónica puede estar causado en parte por el movimiento browniano de iones en el nanoporo y la capacitancia de la barrera resistiva. La adición de analito (por ejemplo, poli(etilenglicol)) produce disminuciones transitorias bien definidas en la conductancia. Cada pulso puede corresponder a la presencia de una única molécula de PEG en el nanoporo. Las reducciones de corriente cubren un intervalo de solo ~ 50 picoamperios para una muestra de PEG-1500 polidisperso (masa molecular media ~ 1500 g/mol).

Los polímeros no electrolitos producen reducciones bien definidas en la corriente iónica ya que se reparten en un nanoporo solitario en una membrana de bicapa lipídica. La corriente iónica, a través de un canal de a-hemolisina bañado por una solución sin polímero es quiescente. La adición de PEG polidisperso (M^r= 1.500 g/mol) produce pulsos de conductancia reducida en la corriente persistentes.

Un único nanoporo discrimina entre polímeros con diferentes masas moleculares. La diferencia entre los estados de conductancia causados por PEG polidisperso (M^r= 1.500 g/mol) y monodisperso (M^r= 1.294 g/mol, n = 29) es enseguida aparente. Los datos de serie temporal contenían ~500 y ~700 sucesos para muestras de PEG poli- y monodisperso, respectivamente. Los histogramas de todos los puntos de la corriente iónica reflejan las naturalezas distintas de las dos muestras de polímero. Los histogramas de corriente iónica para cada muestra se calcularon de >10⁵sucesos de pulsos de conductancia reducida. Los pulsos de conductancia reducida de corriente iónica de larga duración, pequeños cerca de ceo en la serie temporal de PEG monodisperso están causados lo más probablemente por impurezas en las muestras de PEG. Estos sucesos son de larga duración, pero pocos en número.

La calibración del espectro de masa o tamaño se puede lograr por varias técnicas. Por ejemplo, repetir el experimento basado en conductancia usando un analito de tamaño estándar permite la asignación del pico de PEG 1294 g/mol en la muestra polidispersa indicada como los datos de muestra polidispersa. Los picos vecinos en el histograma basado en conductancia están causados por moléculas de PEG que se diferencian en una única unidad de etilenglicol (es decir, CH²-CH²-O). Una comparación de la distribución de tamaño basado en conductancia con un espectro de masas de MALDI-TOF de la misma muestra de PEG polidisperso demuestra precisión de este método.

Ejemplo 8

Secuenciación de molécula única usando nucleótidos polifosfato etiquetados y nanoporos

Hay una necesidad significativa para secuenciar de forma precisa moléculas de ADN y ARN individuales para medicina personalizada. Una novedosa estrategia de secuenciación por síntesis (SBS) basada en nanoporo se describe en el presente documento que diferencia de forma precisa a nivel de molécula única cuatro etiquetas de tamaño diferente que están inicialmente unidas al 5'-fosfato de cada nucleótido. Según se incorpora cada nucleótido a la hebra de ADN en crecimiento durante la reacción de la polimerasa, su etiqueta se libera por formación de enlace fosfodiéster entre el a-fosfato del nucleótido etiquetado y el grupo 3'-OH del nucleótido previo. Las etiquetas liberadas entran en un nanoporo en el orden en que se liberan, y efectúan una firma de bloqueo de la corriente iónica única debido a su tamaño, forma, y carga, determinando de esta manera la secuencia de ADN electrónicamente a nivel de molécula única con resolución de base única. Como un ejemplo no limitante, cuatro etiquetas de PEG-cumarina de diferente longitud se unen al fosfato terminal de 2'-desoxiguanosina-5'-tetrafosfato. Se observa la incorporación eficaz de estos nucleótidos modificados durante la reacción de polimerasa, y discriminación de etiqueta mejor que 6a entre las cuatro etiquetas basado en el grado al que las diferentes etiquetas reducen la corriente iónica del nanoporo. El enfoque molecular descrito aquí acoplado con polimerasa covalentemente unida a los nanoporos en un formato de matriz da una plataforma de s Bs basada en nanoporo de molécula única.

Métodos

Síntesis de análogos de nucleótidos cumarina-PEG-dG4P

Todos los nucleótidos se purifican por HPLC de fase inversa en una columna de 150 x 4,6 mm (Supelco), fase móvil: A, Et³N 8,6 mM/1,1,1,3,3,3-hexafluoro-2-propanol 100 mM en agua (pH 8,1); B: metanol. La elución se realiza desde A al 100% isocrático durante 10 min seguido por un gradiente lineal de B al 0-50% durante 20 min y después B al 50% isocrático durante otros 30 min.

A. Síntesis de cumarina-PEGn-dG4P:

La síntesis de cumarina-PEGⁿ-dG4P implica tres etapas como se muestra en el esquema de la figura 15.

A.1 Síntesis de 2’-desoxiguanosina-5’-tetrafosfato (dG4P):

Primero se lleva a cabo la síntesis de 2'-dG4P empezando de 2'-dGTP. 300 umoles de 2'-GTP (sal trietilamonio) se convierten a la sal tributilamonio usando 1,5 mmol (5 eq) de tributilamina en piridina anhidra (5 ml). La solución resultante se concentra a sequedad y se coevapora con 5 ml de DMF anhidra (x2). El dGTP (sal tributilamonio) se disuelve en 5 ml de DMF anhidra, y se añaden 1,5 mmol de 1,1-carbonildiimidazol. La reacción se agita durante 6 h, después de lo cual se añaden 12 ul de metanol y se sigue agitando durante 30 min. A esta solución, se añaden 1,5 mmol de ácido fosfórico (sal tributilamonio, en d Mf ) y la mezcla de reacción se agita durante la noche a temperatura ambiente.

La mezcla de reacción se diluye con agua y se purifica en una columna de Sephadex-A25 usando gradiente de TEAB de 0,1 M a 1 M (pH 7,5). El dG4P eluye al final del gradiente. Las fracciones apropiadas se combinan y purifican adicionalmente por HPLC de fase inversa para proporcionar 175 umol del tetrafosfato puro (dG4P). ³¹P-RMN: 8, -10,7 (d, 1P, a-P), -11,32 (d, 1P, 8-P), -23,23 (dd, 2P, p, y-P); ESI-MS (modo -vo): Calc. 587,2; determinada 585,9 (M-2).

A. 2 Síntesis de dG4P-heptil-NH2:

A 80 umol de dG4P en 2 ml de agua y 3,5 ml de 1-metilimidazol-HCl (pH 6) 0,2 M añadido 154 mg EDAC y 260 mg diaminoheptano. El pH de la solución resultante se ajusta a 6 con HCl conc. y se agita a temperatura ambiente durante la noche. Esta solución se diluye con agua y purifica por cromatografía de intercambio iónico en Sephadex-A25 seguido por HPC de fase inversa para dar ~ 20 jm ol de dG4P-NH². Esto se confirma por datos de ESI-Ms (modo -vo): calc.

699,1; determinado (698,1, M-1).

B. Síntesis de cumarina-PEG-ácidos y ésteres NHS:

Los amino-dPEG-ácidos comercialmente disponibles (Amino-d(PEG)16, 20, 24, 36-ácidos; Quanta Biodesign) se hacen reaccionar con 6-metoxicumarina-éster NHS para proporcionar el correspondiente cumarina-(PEG)ⁿ-ácido. Se disuelve amino-PEG-ácido (1 eq) en tampón carbonato-bicarbonato (pH 6,8), seguido por adición de cumarina-NHS (1 eq) en DMF, y la mezcla de reacción se agita durante la noche. La cumarina-PEG-ácido se purifica por cromatografía de gel de sílice usando una mezcla de CH²Cl²-MeOH (5-15%) y las fracciones apropiadas se combinan. Estos compuestos se analizan por ¹H RMN y análisis de MALDI-TOF MS.

Datos de MALDI-TOF MS:

* La diferencia en los valores observados debido a la presencia de sal de sodio.

Los cumarina-PEG-ácidos se convierten a los correspondientes ésteres NHS por reacción con 1,5 eq de carbonato de disuccinimidilo (DSC) y 2 eq de trietilamina en DMF anhidra durante 2 h. El éster NHS resultante, que se mueve ligeramente más alto que el ácido en placas de gel de sílice, se purifica por cromatografía en gel de sílice usando una mezcla de CH²Cl²-MeOH (5-15%) y se usa en la siguiente etapa.

C. Cumarina-PEGⁿ-dG4P:

dG4P-heptil-NH2 de la etapa A anterior se absorbe en tampón carbonato-bicarbonato 0,1 M (pH 8,6) y a esto se añade solución agitada de uno de los compuestos cumarina-PEG-NHS (en DMF). la mezcla resultante se agita durante la noche a temperatura ambiente y después se purifica en un cartucho de gel de sílice (MeOH al 15-25% en CH²O ²para eliminar cumarina-ácido o -NHS sin reaccionar y después isopropanol/NH⁴OH/H²O 6:4:1). Esto se purifica adicionalmente dos veces por HPLC de fase inversa para proporcionar cumarina-PEG-dG4P puro. La estructura se confirma por análisis en MALDI-TOF MS. Cumarina-PEG16-dG4P: tiempo de retención, 31,7 min; cumarina-PEG20-dG4P: tiempo de retención, 32,2 min; cumarina-PEG24-dG4P: tiempo de retención, 33,0 min; cumarina-PEG36-dG4P: tiempo de retención, 34,3 min.

Datos de MALDI-TOF MS:

Reacciones de extensión de ADN polimerasa usando cumarina-PEGn-dG4P:

Se realizan reacciones de extensión usando un molde-cebador en bucle (5'-GATCGCGCCGCGCCTTGGCGCGGCGC-3', M.W. 7966), en el que la siguiente base complementaria en el molde es una C, lo que permite la extensión de un única G (Figura 56). Cada reacción de extensión se lleva a cabo en un ciclador térmico GeneAmp PCR System 9700 (Applied Biosystems) a 65°C durante 25 minutos en reacciones de 20 |jl consistentes en molde-cebador en bucle 3 jM , tampón Therminator y 1X (KCl 50 mM, Tris-HCl 20 mM, MgSO45 mM, IGEPAL CA-630 al 0,02% (pH 9,2 @25°c )), 2 unidades de ADN polimerasa Therminator y (New England Biolabs) y 15 jM de uno de los nucleótidos cumarina-PEG-dG4P. Los productos de extensión del ADN se precipitan con etanol, se purifican a través de columnas C18 ZipTip (Millipore), y se caracterizan por MALDI-TOF MS usando un instrumento ABI Voyager. Como se muestra en la figura 58, se obtienen cuatro productos idénticos (peso molecular esperado 8.295).

Las reacciones de extensión con polimerasa para cada cumarina-PEGⁿ-dG4P se repiten y los productos (cumarina-PEGⁿ-trifosfato, Figura 57) se tratan con fosfatasa alcalina (1U a 37°C durante 15 min) para dar las etiquetas cumarina-PEGⁿ-NH². Estas se extraen en diclorometano y se caracterizan por análisis de MALDI-TOF-MS.

Hidrólisis ácida de cumarina-PEG-dG4P (Figura 57):

Se añade ácido acético a los nucleótidos cumarina-PEG-dG4P a una concentración final del 10%, y la solución se agita vigorosamente durante la noche para asegurar la hidrólisis del enlace N-P entre el 8 fosfato y la heptilamina. La solución se seca usando un CentriVap y se resuspende en un volumen apropiado de agua. Se recoge una alícuota de 1 |jl para caracterización por espectrometría de masa MALDI-TOF, y una segunda alícuota se mide a 260 nm y 250 nm usando un espectrofotómetro NanoDrop ND-1000.

Los compuestos cumarina-PEG-amina resultantes tienen el tamaño esperado medido por MALDI-TOF MS (véase la figura 16 y la siguiente tabla).

Medidas de nanoporo:

Formación de membranas y canales

Se insertan canales individuales de a-hemolisina en membranas bicapas lipídicas planares sin solvente (BLM) (Montal et al. 1972) fabricadas a través de un agujero de ~80 jm de diámetro en una división de Teflón de 25 jm de espesor que separa dos pocillos con soluciones de electrolitos como se ha descrito previamente (Rainer et al. 2010). Se usa KCl 4 M, Tris 10 mM titulado a pH 7,2 con ácido cítrico a lo largo del experimento. Las membranas se forman humedeciendo primero la división con hexadecano/pentano al 1% v/v. Se extiende difitanoil fosfatidilcolina (DPhyPC) 10 mg/ml en pentano en ambas interfases de solución aire-electrolito con los niveles de solución bien por debajo del agujero en la división de Teflón. Después de 10 min, los niveles de solución se suben por encima del agujero espontáneamente para formar una membrana. Se inyectan aproximadamente 0,5 j l de a-hemolisina 0,5 mg/ml en la solución inmediatamente adyacente a la membrana y la corriente iónica se observa hasta que un único canal se inserta en la membrana. Los contenidos de la cámara cis se intercambian después con solución de electrolito sin proteína para mantener un único canal.

Se añaden moléculas de cumarina-PEGⁿ-NH²(n = 16, 20, 24 y 36) al lado trans del poro (definido como el lado barril p del canal) a una concentración final entre 0,4 jmol/l y 1 jmol/l de cada componente. La corriente iónica se registra entre dos Ag/AgCl emparejados (KCl 3 M) a un potencial fijado (-40 mV) durante aproximadamente 15 min para lograr estadística de cómputo suficiente. Los datos se registran con un filtro Bessel de 4 polos a 10 kHz sobremuestreo a 50 kHz.

Análisis de datos

Los datos se analizan fuera de línea con un programa interno escrito en LabVIEW (National Instruments) como se ha descrito previamente (Rodrigues et al. 2008). Brevemente, los bloqueos se localizan con un detector de sucesos basado en un algoritmo de umbral sencillo ajustado a 5 a del ruido de corriente en el estado abierto. Cuando se detecta un suceso, los puntos en el tiempo de subida y tiempo de declive se desechan (~60 js y 20 js , respectivamente). La profundidad de bloqueo media se calcula a partir de los puntos restantes y la corriente del canal abierto se calcula a partir de la media de 0,8 ms de los datos del canal abierto separados 0,2 ms del umbral. Los datos se describen como un cociente de las medias (<i>/<i^abierto>) y el espectro del nanoporo se calcula como un histograma de estos valores.

Discusión

En 1996, Kasianowicz y col. (Kasianowicz et al. 1996) demostraron por primera vez que el canal de a-hemolisina (aHL) se puede usar para detectar ácidos nucleicos a nivel de molécula individual. El canal de aHL tiene una apertura limitante de 1,5 nm de diámetro (Song et al. 1996, Bezrukov et al. 1996; Krasilnikov 2002; Kasianowicz 1995) y su regulación dependiente de voltaje se puede controlar, de modo que el poro permanece abierto indefinidamente, (Kasianowicz 1995) lo que lo hace un candidato ideal para detección y discriminación basada en nanoporo. Los ácidos nucleicos polianiónicos monocatenarios individuales son dirigidos a través del poro por el campo eléctrico aplicado, y los polinucleótidos producen reducciones transitorias bien definidas en la conductancia del poro. (Kasianowicz et al.

1996; Vercoutere et al. 2001; Deamer et al. 2002; Kasianowicz 2004) Puesto que el tiempo de residencia del polinucleótido en el poro es proporcional a la longitud de contorno del ARN o ADN, se sugiere que un nanoporo puede ser capaz de secuenciar ADN de una manera de cinta perforada si las cuatro bases pueden ser discriminadas entre sí. (Kasianowicz et al. 1996) Hacia ese fin, (Kasianowicz 1996; Kasianowicz et al. 2008; Kasianowicz et al. 2002) un canal de aHL con un adaptador covalentemente unido en el poro se usa para identificar nucleósidos-5'-monofosfato sin marcar (Clarke et al. 2009). Sin embargo, no se ha documentado un sistema de exonucleasa-nanoporo completo basado en este concepto para secuenciar ADN.

A pesar de la capacidad de los nanoporos para detectar y caracterizar algunas propiedades físicas del ADN a nivel de molécula individual, el fin más exigente de secuenciación base a base precisa pasando un ADN monocatenario a través de un poro no se ha realizado aún. Oxford Nanopore Technologies anunció recientemente la capacidad de lograr secuenciación de hebra en un nanoporo a resolución de 3 bases con una tasa de error del 4% (AGBT Meeting, 2012). Otro grupo describió secuenciación de hebra con resolución de base individual con un nanoporo, pero tuvo dificultad en determinar correctamente secuencias de homopolímero (Manrao et al. 2012).

El canal de aHL nativo tiene la capacidad inherente para discriminación molecular de alta resolución. Por ejemplo, puede discriminar entre iones H⁺y D⁺acuosos, (Kasianowicz et al. 1995) y Robertson et al. (2007) recientemente demostraron que el canal puede separar fácilmente moléculas de poli(etilenglicol) (PEG) a nivel de monómero. En el último estudio, un espectro de masa molecular o tamaño estimado de la corriente media producida por las moléculas de PEG individuales resuelve fácilmente las unidades de repetición de etilenglicol. Además, el tiempo de residencia medio del polímero en el poro aumenta con la masa de PEG (Robertson et al. 2007; Reiner et al. 2010). Basado en estas observaciones y el hecho que la ADN polimerasa puede reconocer análogos de nucleótidos con modificación extensa en el grupo fosfato 5'-terminal como sustratos eficaces (Kumar, 2005, 2006, 2008; Sood et al. 2005; Eid et al.

2009) se desarrolla un novedoso enfoque de secuenciación de ADN de molécula individual que pueda identificar bases individuales por la detección y diferenciación de un subproducto liberado (por ejemplo, etiquetas de PEG de diferente longitud de la reacción de la ADN polimerasa, Figura 9) en lugar de los nucleótidos mismos.

En este enfoque, durante la formación del enlace fosfodiéster en la reacción de la polimerasa, el corte del enlace a-p fosfato en el nucleótido incorporado libera la etiqueta. Un ejemplo de una secuencia de reacción de cuatro bases con diferentes etiquetas para cada base se muestra en la figura 30. Una matriz de tales nanoporos, uno de los cuales se muestra gráficamente en la figura 33, cada uno con una polimerasa covalentemente unida adyacente a uno de las entradas del poro, permite secuenciación por síntesis (SBS) de molécula individual. La adición de cada nucleótido se determina por el efecto de la etiqueta liberada en la conductancia del nanoporo.

Este sistema de SBS basado en etiqueta del 5'-fosfato ofrece una ventaja sobre la secuenciación de hebra mediante nanoporos en que la velocidad de tránsito a través del poro ya no es un problema, porque la velocidad de extensión de la polimerasa y liberación es más lenta que el tiempo de tránsito de la etiqueta a través del poro. Esto también puede eliminar problemas de sincronización inherentes a los métodos de secuenciación de hebra. La síntesis e incorporación eficaz de nucleótidos con etiquetas unidas al 5'-fosfato que poseen cuatro PEG de diferente longitud y una fracción de cumarina se describe. Cuatro patrones de bloqueo de corriente distintos de las etiquetas liberadas en un poro de a-hemolisina a nivel de molécula individual se demuestran, estableciendo la viabilidad del enfoque SBS electrónico de molécula única.

Diseño, síntesis y caracterización de nucleótidos marcados con PEG

Los cuatro 2'-desoxiguanosina-5'-tetrafosfatos etiquetados en 5'-fosfato (Figura 54) se sintetizan según el esquema sintético generalizado mostrado en la figura 15 (véase Métodos, anteriormente para detalles). Primero, 2'-desoxiguanosina-5'-trifosfato (dGTP) se convierte a 2'-desoxiguanosina-5'-tetrafosfato (dG4P) y después se añade un enlazador diaminoheptano al fosfato terminal del tetrafosfato, con el fin de unir etiquetas de PEG de diferente longitud. En un conjunto separado de reacciones, el éster N-hidroxisuccinimidílico de 6-metoxi-cumarina se hace reaccionar con una de cuatro moléculas de amino-PEG-COOH con 16, 20, 24 o 36 unidades de etilenglicol, para producir moléculas de cumarina-PEGⁿ-COOH, que posteriormente se convierten a los correspondientes ésteres NHS. Estos se hacen reaccionar con la dG4P-heptilamina (dG4P-NH²) para generar los cuatro análogos de nucleótidos finales, abreviados cumarina-PEGⁿ-dG4P (Figura 54). La fracción de cumarina se usa para seguir la purificación de los intermedios y los análogos de nucleótidos finales. La síntesis de las moléculas esperadas se confirma por espectrometría de masas de MALDI-TOF (Figura 55).

Los nucleótidos cumarina-PEG-dG4P se emplean en reacciones de extensión por polimerasa usando la variante Therminator y de ADN polimerasa. Se diseña un cebador-bucle-molde donde la siguiente base complementaria es una C, que permite que se añada dGMP al cebador de ADN (Figura 56). Se libera cumarina-PEG-trifosfato durante la reacción (Figura 57). MALDI-TOF-MS confirmó que en efecto cada uno de los cuatro análogos de dG4P dieron el producto de extensión correcto con eficacia de incorporación del 100%, como se muestra por la aparición de un pico a 8.290 dalton (Figura 58). La ausencia de un pico de cebador a 7.966 dalton sugiere que la reacción siguió esencialmente hasta terminación.

Toda la incorporación representaba los análogos de cumarina-PEG-dG4P, y no potencial dGTP o dG4P residual, ya que las moléculas se purifican dos veces en un sistema de HPLC que separa estas moléculas de forma eficaz con una diferencia en el tiempo de retención de más de 10 min entre los dos compuestos. Para excluir adicionalmente esta posibilidad, los análogos de cumarina-PEG-dG4P purificados se tratan con fosfatasa alcalina, que puede degradar cualquier tri- o tetra-fosfato contaminante al nucleósido libre, y se usan los cumarina-PEG-nucleótidos repurificados por HPLC resultantes en reacciones de extensión. De forma importante, las cadenas extendidas contienen nucleótidos naturales sin modificaciones, lo que permite que la SBS siga durante longitudes extensas.

Las etiquetas liberadas de las reacciones de polimerasa son cumarina-PEG-trifosfato (cumarina-PEG-P³, Figura 57). Para reducir la complejidad de la carga en las etiquetas, las etiquetas liberadas se tratan con fosfatasa alcalina, dando etiquetas cumarina-PEG-NH², que se analizan para sus efectos de bloqueo de la corriente del nanoporo. Al desarrollar adicionalmente el sistema de SBS basado en nanoporo, los cumarina-PEG-P³liberados se tratan con fosfatasa alcalina, que como la polimerasa, se puede unir a una entrada de los nanoporos, para generar etiquetas cumarina-PEG-NH², u optimizar las condiciones para usar nanoporo para detectar directamente las etiquetas cargadas liberadas. En el estudio objeto, con el fin de obtener grandes cantidades de material para ensayar por MALDI-TOF MS y nanoporos de proteínas, se producen versiones sintéticas de las etiquetas liberadas esperadas (cumarina-PEG-NH²) por hidrólisis ácida de los cuatro análogos de cumarina-PEG-nucleótido para cortar el enlace P-N entre el polifosfato y la fracción heptilamina (Figura 57).

Ejemplo 9

Caracterización de las etiquetas liberadas por MALDI-TOF MS

Las moléculas de cumarina-PEG-NH²esperadas se confirmaron por análisis de MALDI-TOF-MS, después de purificación por HPLC (Figura 16). Los resultados de MALDI-TOF-MS indican que las etiquetas de cumarina-PEG-NH²generadas por hidrólisis ácida son idénticas a las etiquetas liberadas producidas durante la reacción de polimerasa después de tratamiento con fosfatasa alcalina.

Con referencia a la figura 16, las etiquetas de cumarina-PEG-NH²generadas por hidrólisis ácida de cumarina-PEG16-dG4P que da cumarina-PEG16-NH², cumarina-PEG20-dG4P que da cumarina-PEG20-NH², cumarina-PEG24-dG4P que da cumarina-PEG24-NH², y cumarina-PEG36-dG4P que da cumarina-PEG36-NH², son idénticas a las correspondientes etiquetas liberadas producidas durante la reacción de polimerasa después de tratamiento con fosfatasa alcalina, como muestra el análisis de MALDI-TOF-MS. Se muestra una imagen compuesta de cuatro espectros de MS obtenidos por separado. Las estructuras de las etiquetas de cumarina-PEG-NH²se muestran debajo.

Ejemplo 10

Discriminación de etiquetas liberadas en nanoporos de proteína a molécula individual

Con referencia a la figura 17, cuatro compuestos de cumarina-PEG-NH²(n = 16, 20, 24 y 36), derivados de los cuatro nucleótidos comparables por hidrólisis ácida, se juntaron y diluyeron en KCl 4 M, Tris 10 mM, pH 7,2 para medida de nanoporo. Los datos de la serie temporal en la izquierda indican que cuando estas etiquetas PEG entran en un único canal iónico de a-hemolisina, producen bloqueos de corriente que son característicos de su tamaño. Un histograma a la derecha muestra el bloqueo de corriente medio producido por moléculas individuales muestra resolución basal con un ancho de banda de medida de 10 kHz. Las barras de colores encima representan la distribución 6 a de los datos (asumiendo distribuciones gaussianas para cada una de las cuatro etiquetas PEG que pueden representar cada uno de los cuatro nucleótidos del ADN), lo que sugiere que una única base se puede discriminar con una precisión mejor que 1 en 300.000 sucesos, representado en esta figura usando designaciones A, C, G y T, que se puede producir cuando cuatro nucleótidos diferentes con cuatro PEG de diferente longitud se usan para secuenciación de a Dn .

Para demostrar el enfoque SBS de molécula individual electrónico, se ensayaron cuatro etiquetas de cumarina-PEGⁿ-NH²liberadas para sus efectos de bloqueo de la corriente en un nanoporo de aHL (Figura 17). La distribución de frecuencia relativa del histograma de sucesos de bloqueo (<¡>/<iab¡erto>), muestra cuatro picos bien separados y distintos para las cuatro etiquetas de cumarina-PEGⁿ-NH²(n = 36, 34, 20 y 16 de izquierda a derecha respectivamente en la figura 17, inferior derecha).

Para subrayar la amplia separación de los picos, y ofrecer evidencia clara de que la detección de un nucleótido específico se puede lograr por la señal de bloqueo única proporcionada por su PEG liberado, los picos se ajustan con funciones gaussianas únicas y se muestran las correspondientes distribuciones de error 6 a (rectángulos de color en la parte superior de la figura 17, inferior derecha). Moléculas de cumarina-PEG-NH²aplicadas por separado se caracterizan con el poro (datos no mostrados), que confirmó la identidad de los picos relacionados con PEG mostrados en esta figura.

Como se describe aquí, un único canal iónico de aHL puede separar moléculas individuales basado en su tamaño, y resuelve fácilmente una mezcla de PEG mejor que a tamaño de una unidad de monómero única (es decir, < 44 g/mol). Esta alta resolución surge de las interacciones entre el polímero de PEG, el electrolito (cationes móviles) y cadenas laterales de aminoácidos que recubren la luz del canal de aHL. Estas interacciones permiten que el poro se use como un sensor de escala nanométrica que es específico al tamaño, carga y propiedad química de un analito.

Aquí, tal análisis se extiende a PEG con diferentes grupos químicos en cualquier extremo. El registro de corriente del único canal iónico en la figura 17, superior e inferior izquierda, ilustra los bloqueos producidos por las cuatro moléculas de cumarina-PEGⁿ-NH²de diferentes tamaños, una cada vez. Como con PEG sin modificar, cada uno de los bloqueos de corriente es unimodal (es decir, descrito bien con distribuciones gaussianas y valores medios bien definidos).

Para discriminar de forma precisa entre las cuatro bases (A, C, G y T) para secuenciación con nanoporo, se necesita adoptar una o más de las siguientes estrategias: 1) aumentar y diferenciar la potencia de las señales de detección; 2) desarrollar un método eficaz para discernir y procesar las señales de bloqueo electrónicas generadas; 3) controlar la velocidad de translocación de ácidos nucleicos a través del poro, por ejemplo, ralentizando el movimiento de ADN para secuenciación de hebra; y 4) diseñar y hacer nanoporos sintéticos nuevos y más eficaces. Como se demuestra aquí, transformar el problema de resolver bases individuales al de discriminar entre cuatro etiquetas únicas esencialmente resuelve los primeros tres problemas.

Aquí, se demuestra un enfoque novedoso para aumentar la discriminación de cuatro nucleótidos modificándolos en la fracción de fosfato terminal. Kumar y col. primero describieron la modificación de nculeósidos-5'-trifosfato, introduciendo más grupos fosfato para producir tetra- y penta-fosfatos e introducir un colorante directamente al fosfato terminal o uniendo un enlazador entre el fosfato terminal y el colorante (Kumar et al. 2006, 2008). Se mostró que tetray penta-fosfatos son mejores sustratos de ADN polimerasa, y nucleótidos fosfato marcados con fluoróforos se han usado mucho para secuenciación de ADN (Kumar et al. 2005; Sood et al. 2005; Eid et al. 2009; Sims et al. 2011).

El sistema de SBS de nanoporo de molécula única, que se muestra esquemáticamente en la figura 33, representa la ADN polimerasa unida en gran proximidad a la entrada del nanoporo y un molde que se va a secuenciar se añade junto con el cebador. A este complejo molde-cebador, se añaden juntos cuatro nucleótidos diferentemente etiquetados. Después de que la polimerasa catalice la incorporación del nucleótido correcto, el polifosfato unido a etiqueta se libera y pasa a través del nanoporo para generar una señal de bloqueo de corriente, identificando de esta manera la base añadida. Cada etiqueta genera una firma de bloqueo electrónico diferente debido a diferente tamaño, masa o carga.

Las propiedades físicas y químicas de la etiqueta se pueden ajustar adicionalmente para optimizar la eficacia de captura y precisión de medida. Por ejemplo, la inserción de un enlazador con carga positiva consistente en cuatro lisinas o argininas entre el polifosfato y el PEG produce precursores con una carga neutra y etiquetas liberadas con una carga positiva neta. Al usar la magnitud y signo apropiados del potencial, las etiquetas liberadas, pero no los sustratos nucleótidos, se transportan a través del poro.

Se puede lograr discriminación adicional de sustrato y producto mediante la inclusión de varias moléculas de fosfatasa alcalina covalentemente unidas adyacente a la polimerasa en el borde de cada nanoporo, que asegura una carga incluso más alta en las etiquetas. Es importante que cada etiqueta liberada en una reacción de polimerasa se mantenga en el orden apropiado. Por tanto, son necesarias varias enzimas fosfatasas por cada molécula de polimerasa debido a las velocidades de recambio similares para las dos enzimas.

A pesar de todas estas precauciones, algunos nucleótidos sin reaccionar pueden entrar en el poro. Por tanto, la capacidad para discriminar entre etiquetas cortadas y nucleótidos sin reaccionar es importante; se deben diferenciar fácilmente debido a sus diferencias significativas en tamaño y carga, una capacidad inherente del sistema de nanoporo.

El método descrito en el presente documento se puede aplicar a nanoporos de proteína (por ejemplo, aHL, porina A de Mycobacterium smegmatis, MspA), (Derrington et al. 2010) o nanoporos de estado sólido. (Garaj et al. 2010; Hall et al. 2010; Merchant et al. 2010; Schneider et al. 2010; Storm et al. 2005; Wanunu et al. 2008) Estas estrategias proporcionan nanoporos con diferentes propiedades que son apropiados para detectar una biblioteca de etiquetas. Para implementar esta novedosa estrategia para secuenciación de ADN, se puede construir una matriz de nanoporos³⁷en una superficie plana para facilitar secuenciación de ADN masivamente paralela.

En conclusión, se demuestra una plataforma de secuenciación de ADN de molécula única basado en SBS y nanoporo que aprovecha etiquetas liberables novedosas en los sustratos nucleótidos para la reacción de la polimerasa. Tal plataforma es capaz de lecturas largas, precisas, y secuenciación de ADN de molécula única electrónica de muy alto rendimiento.

Ejemplo 11

Síntesis de análogos de nucleótidos cumarina-PEG-dG4P

Síntesis de cumarina-PEGn-dG4P:

A.1 Síntesis de 2’-desoxiguanosina-5’-tetrafosfato (dG4P):

La mezcla de reacción se diluye con agua y se purifica en una columna de Sephadex-A25 usando gradiente de TEAB de 0,1 M a 1 M (pH 7,5). El dG4P eluye al final del gradiente. Las fracciones apropiadas se combinan y purifican adicionalmente por HPLC de fase inversa para proporcionar 175 umol del tetrafosfato puro (dG4P). ³¹P-RMN: 8, -10,7 (d, 1P, 8-P), -11,32 (d, 1P, a-P), -23,23 (dd, 2P, p, y-P); ESI-MS (modo -vo): Calc. 587,2; determinada 585,9 (M-2).

A.2 Síntesis de dG4P-heptil-NH2:

A 80 umol de dG4P en 2 ml de agua y 3,5 ml de 1-metilimidazol-HCl (pH 6) 0,2 M añadido 154 mg EDAC y 260 mg diaminoheptano. El pH de la solución resultante se ajusta a 6 con HCl conc. y se agita a temperatura ambiente durante la noche. Esta solución se diluye con agua y purifica por cromatografía de intercambio iónico en Sephadex-A25 seguido por HPC de fase inversa para dar ~ 20 pmol de dG4P-NH². Esto se confirma por datos de ESI-Ms (modo -vo): calc.

699,1; determinado (698,1, M-1).

B) Síntesis de cumarina-PEG-ácidos y ásteres NHS:

Los amino-dPEG-ácidos comercialmente disponibles (Amino-d(PEG)16, 20, 24, 36-ácidos; Quanta Biodesign) se hacen reaccionar con 6-metoxicumarina-éster NHS para proporcionar el correspondiente cumarina-(PEG)ⁿ-ácido. Se disuelve amino-PEG-ácido (1 eq) en tampón carbonato-bicarbonato (pH 6,8), seguido por adición de cumarina-NHS (1 eq) en DMF, y la mezcla de reacción se agita durante la noche. El cumarina-PEG-ácido se purifica por cromatografía de gel de sílice usando una mezcla de CH²Cl²-MeOH (5-15%) y las fracciones apropiadas se combinan. Estos compuestos se analizan por ¹H RMN y análisis de MALDI-TOF-MS.

Datos de MALDI-TOF MS:

C) Cumarina-PEGⁿ-dG4P:

dG4P-heptil-NH2 de la etapa A) anterior se absorbe en tampón carbonato-bicarbonato 0,1 M (pH 8,6) y a esto se añade solución agitada de uno de los compuestos cumarina-PEG-NHS (en DMF). la mezcla resultante se agita durante la noche a temperatura ambiente y después se purifica en un cartucho de gel de sílice (MeOH al 15-25% en CH²Cl²para eliminar cumarina-ácido o -NHS sin reaccionar y después isopropanol/NH⁴OH/H²O 6:4:1). Esto se purifica adicionalmente dos veces por HPLC de fase inversa para proporcionar cumarina-PEG-dG4P. La estructura se confirma por análisis en MALDI-TOF MS. Cumarina-PEG16-dG4P: tiempo de retención, 31,7 min; cumarina-PEG20-dG4P: tiempo de retención, 32,2 min; cumarina-PEG24-dG4P: tiempo de retención, 33,0 min; cumarina-PEG36-dG4P: tiempo de retención, 34,3 min.

Datos de MALDI-TOF MS:

Ejemplo 12

Caracterización de las etiquetas liberadas por MALDI-TOF MS

Con referencia a la figura 16, las etiquetas de cumarina-PEG-NH²generadas por hidrólisis ácida de cumarina-PEG16-dG4P que da cumarina-PEG16-NH², cumarina-PEG20-dG4P que da cumarina-PEG20-NH², cumarina-PEG24-dG4P que da cumarina-PEG24-NH², y cumarina-PEG36-dG4P que da cumarina-PEG36-NH², son idénticas a las correspondientes etiquetas liberadas producidas durante la reacción de polimerasa después de tratamiento con fosfatasa alcalina, como muestra el análisis de MALDI-TOF-MS. Se muestra una imagen compuesta de cuatro espectros de MS obtenidos por separado. Las estructuras de las etiquetas de cumarina-PEG-NH²se muestran a la derecha.

Ejemplo 13

Con referencia a la figura 17, cuatro compuestos de cumarina-PEG-NH²(n = 16, 20, 24 y 36), derivados de los cuatro nucleótidos comparables por hidrólisis ácida, se juntaron y diluyeron en KCl 4 M, Tris 10 mM, pH 7,2 para medida con nanoporo. Los datos de la serie temporal en la izquierda indican que cuando estas etiquetas PEG entran en un único canal iónico de a-hemolisina, producen bloqueos de corriente que son característicos de su tamaño. Un histograma a la derecha muestra el bloqueo de corriente medio producido por moléculas individuales muestra resolución basal con un ancho de banda de medida de 10 kHz. Las barras de colores encima representan la distribución 6 a de los datos (asumiendo distribuciones gaussianas para cada una de las cuatro etiquetas PEG que pueden representar cada uno de los cuatro nucleótidos del ADN), lo que sugiere que una única base se puede discriminar con una precisión mejor que 1 en 300.000 sucesos, representado en esta figura usando designaciones A, C, G y T, que se puede producir cuando cuatro nucleótidos diferentes con cuatro PEG de diferente longitud se usan para secuenciación de a Dn .

Como se describe aquí, un único canal iónico de aHL puede separar moléculas individuales basado en su tamaño, y resuelve fácilmente una mezcla de PEG a mejor que el tamaño de una unidad de monómero única (es decir, < 44 g/mol). Esta alta resolución surge de las interacciones entre el polímero de PEG, el electrolito (cationes móviles) y cadenas laterales de aminoácidos que recubren la luz del canal de aHL. Estas interacciones permiten que el poro se use como un sensor de escala nanométrica que es específico al tamaño, carga y propiedad química de un analito.

Ejemplo 14

Detección de etiquetas

El dispositivo se usa para detectar 4 niveles de corriente distintos para 4 moléculas de etiqueta diferentes. Como se ve en la figura 19, cada una de las etiquetas se puede distinguir de cualquiera de las otras tres (es decir, el histograma muestra cuatro picos distintos marcados en el gráfico con la correspondiente etiqueta).

Cada molécula de etiqueta es un homopolímero “T” de aproximadamente 30 bases de longitud, biotinilado en el extremo 3' con 2 regiones en la hebra potencialmente modificadas. En cada molécula de 30 bases de longitud, las regiones modificadas son; desde el extremo 3', posiciones de base 11, 12 y 13 y posiciones 17, 18 y 19. Como se usa en el presente documento “x” es un sitio abásico (sin base) y “T” es timina. Las cuatro etiquetas son:

(a) Etiqueta falsa XXX-XXX que tiene una secuencia, estreptavidina-biotina-10T-xxx-3T-xxx-11T

(b) Etiqueta falsa TTT-XXX que tiene una secuencia, estreptavidina-biotina-10T-TTT-3T-xxx-11T

(c) Etiqueta 30T que tiene una secuencia estreptavidina-biotina-30T

(d) Etiqueta falsa iFluorT que tiene una secuencia, estreptavidina-biotina-10T-TTT-3T-T-IfluorT-T-11T, donde la T en posición 18 que está marcada con fluorescencia

Los resultados son para un poro en una matriz que captura múltiples moléculas de una solución durante el tiempo. Las condiciones de detección con KCl 1 M, tamponado con HEPES 20 mM, pH 7,5 a temperatura ambiente. Cada molécula se captura y mantiene en el poro mientras se aplica un voltaje. El voltaje aplicado se aumenta a 160 mV, se captura una nueva molécula, y el voltaje se reduce por debajo de 0 V y la molécula etiquetada se cae del poro. El ciclo se repite después. Cuatro moléculas de etiqueta diferentes están en la mezcla de muestra a la vez.

Como se muestra en la figura 20, el eje horizontal del gráfico es tiempo (medido en segundos) frente a corriente (medida en pico amperios (pA)) en el eje vertical. La onda de voltaje aplicado no se muestra. La onda de voltaje aplicado empieza por debajo de 0 V y rápidamente aumenta a 160 mV y se mantiene ahí durante aproximadamente 2,3 segundos. El voltaje después de disminuye por debajo de 0 V. Las lecturas de corriente siguen el voltaje aplicado siendo plana la corriente de una molécula capturada mientras el voltaje aplicado está a 160 mV y después disminuye según disminuye el voltaje.

Como se muestra en la figura 19, las bandas claras vistas durante la aplicación de 160 mV se vuelven conectadas o ligeramente en forma de mancha en el histograma porque la corriente durante la disminución también se representa. A pesar de esto, se pueden ver bandas de captura distintas, repetibles para cada molécula de etiqueta.

Referencias:

1. AGBT Meeting, Marco Island, FL, 2012 y 17 Feb. comunicado de prensa de Oxford Nanopore Technologies (http://www.nanoporetech.com/news/press-releases/view/39)

2. Akeson, M., Branton, D., Kasianowicz, J.J., Brandin, E. y Deamer, D.W. Microsecond time-scale discrimination between polycytidylic acid and polyadenylic acid segments within single RNA molecules. Biophys. J. 1999, 77, 3227-3233.

3. Aksimentiev, A. et al., Microscopic Kinetics of DNA Translocation through Synthetic Nanopores. Biophysical Journal 200487, 2086-2097.

4. Astier, Y., Braha, O. & Bayley, H. Toward single molecule DNA sequencing: direct identification of ribonucleoside and deoxyribonucleoside 5'-monophosphates by using an engineered protein nanopore equipped with a molecular adapter. J Am Chem Soc 128, 1705-10 (2006).

5. Axelrod, D., Koppel, D.E., Schlessinger, J., Elson, E. & Webb, W.W. Mobility measurement by analysis of fluorescence photobleaching recovery kinetics. Biophysical Journal 16, 1055-1069 (1976).

6. Bailey, H. Sequencing single molecules of DNA. Curr. Opinion Chem Biol. 2006, 10, 628-637.

7. Benner, S. et al. Sequence-specific detection of individual DNA polymerase complexes in real time using a nanopore. Nat Nanotechnol 2, 718-24 (2007).

8. Bezrukov S.M., Vodyanoy, I., Brutyan, R.A. & Kasianowicz, J.J. Dynamics and free energy of polymers partitioning into a nanoscale pore. Macromolecules 29, 8517-22 (1996)

9. Bezrukov, S.M., y Kasianowicz, J.J. Neutral polymers in the nanopore of alamethicin and alpha-hemolysin.

Biologicheskie Membrany 2001, 18, 453-457.

10. Bokhari, S.H. y Sauer, J.R., A Parallel Graph Decomposition Algorithm for DNA Sequencing with Nanopores.

Bioinformatics 200521(7), 889-896.

11. Branton, D. Nanopore sequencing. Nat. Biotechnol. 26, 1146-1153 (2008).

12. Branton, D. et al. The potential and challenges of nanopore sequencing. Nat Biotechnol 26, 1146-53 (2008).

13. Bultmann, T., Vaz, W.L., Melo, E.C., Sisk, R.B. & Thompson, T.E. Fluid-phase connectivity and translational diffusion in a eutectic, two-component, two-phase phosphatidylcholine bilayer. Biochemistry 30, 5573-9 (1991).

14. Chandler, E.L., Smith, A.L., Burden, L.M., Kasianowicz y Burden, D.L. Membrane Surface Dynamics of DNA-Threaded Nanopores Revealed by Simultaneous Single-Molecule Optical and Ensemble Electrical Recording. Langmuir 2004, 20, 898-905.

15. Chen, P. Probing single DNA molecule transport using fabricated nanopores. Nano Lett. 4, 2293-2298 (2004).

16. Clarke, J., Wu, H., Jayasinghe, L., Patel, A., Reid, S. and Bayley, H. Continuous base identification for singlemolecule nanopore d Na sequencing. Nat. Biotech. 2009, 1-6.

17. Cockroft, S.L., Chu, J., Amorin, M. & Ghadiri, M.R. A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution. J Am Chem Soc 130, 818-20 (2008).

18. Deamer, D.W. y Branton, D. Characterization of nucleic acids by nanopore analysis. Acc. Chem. Res. 2002, 35(10), 817-825.

19. Deamer, D.W. Nanopore Analysis of Nucleic Acids Bound to Exonucleases and Polymerases, Annual Review of Biophysics, Vol. 39: 79-90 (Fecha de publicación del volumen Junio 2010).

20. Derrington, I.M. et al. Nanopore DNA sequencing with MspA. Proc Natl Acad Sci U S A 107, 16060-5 (2010).

Dutta, D., Pulsipher, A. & Yousaf, M.N. Selective Tethering of Ligands and Proteins to a MicrofluidicaNy Patterned Electroactive Fluid Lipid Bilayer Array. Langmuir 26, 9835-9841 (2010).

Eid, J., Fehr, A., Gray, J., Luong, K., Lyle, J., Otto, G. et al. Real-time DNA sequencing from single polymerase molecules. Science 2009, 323, 133-138.

Fologea, D. et al., Slowing DNA Translocation in a Solid State Nanopore. Nano Letters 20055(9), 1734-1737.

Fologea, D. et al., Detecting Single Stranded DNA with a Solid State Nanopore. Nano Letters 20055(10), 1905 1909.

Garaj, S. et al. Graphene as a subnanometre trans-electrode membrane. Nature 467, 190-3 (2010).

Gershow, M. & Golovchenko, J.A. Recapturing and trapping single molecules with a solid state nanopore. Nature Nanotechnology 2, 775-779 (2007).

Guo, J; Xu, N., Li, Z., Zhang, S.; Wu, J., Kim, D. H., Marma, M. S., Meng, Q., Cao, H., Li, X., Shi, S., Yu, L., Kalachikov, S., Russo, J. J., Turro, N. J., Ju, J.. Four-color DNA sequencing with 3'-0-modified nucleotide reversible terminators and chemically cleavable fluorescent di deoxynucleotides. Proc. Natl. Acad. Sci. USA 2008, 105(27), 9145-9150

Guo, J., Yu, L., Turro, N. J., y Ju, J. An integrated system for DNA sequencing by synthesis using novel nucleotide analogues. Accounts of Chemical Research 2010, 43(4), 551-563.

Hall, A.R. et al. Hybrid pore formation by directed insertion of alpha-haemolysin into solid-state nanopores. Nat Nanotechnol 5, 874-7 (2010).

Harris, T. D., Buzby, P. J. et al. Single-molecule DNA sequencing of a viral genome. Science 2008, 320, 106-109. Healy, K. Nanopore-based single-molecule DNA analysis. Nanomedicine (Lond) 2, 459-81 (2007).

Heng, J.B. et al., Stretching DNA Using the Electric Field in a Synthetic Nanopore. Nano Letters 20055(10), 1883 1888.

Heng, J.B. et al., The Electromechanics of DNA in a synthetic Nanopore. Biophysical Journal 2006, 90, 1098 1106.

Henrickson, S.E., Misakian, M., Robertson, B. and Kasianowicz, J.J. Driven asymmetric DNA transport in a nanometer-scale pore. Physical Review Letters 2000, 85, 3057-3060.

Hou, X. et al. A biomimetic potassium responsive nanochannel: G-quadruplex DNA conformational switching in a synthetic nanopore. JAm Chem Soc 131, 7800-5 (2009).

Huang, T.C. et al. Gene expression analysis with an integrated CMOS microarray by time-resolved fluorescence detection. Biosens Bioelectron 26, 2660-5 (2011).

Hurt, N., Wang, H., Akeson, M. & Lieberman, K.R. Specific nucleotide binding and rebinding to individual DNA polymerase complexes captured on a nanopore. JAm Chem Soc 131, 3772-8 (2009).

Jenkins, A.T.A., Neumann, T. & Offenhausser, A. Surface plasmon microscopy measurements of lipid vesicle adsorption on a micropatterned self-assembled monolayer. Langmuir 17, 265-267 (2001).

Ju, J., Kim, D. H., Bi, L., Meng, Q., Bi, X., Li, Z., Li, X., Marma, M. S., Shundi, S., Wu, J., Edwards, J. R., Romu, A., and Turro, N. J. Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators. Proc. Natl. Acad. Sci. USA 2006, 103(52), 19635-19640

Kasianowicz, J.J. & Bezrukov, S.M. Protonation dynamics of the alpha-toxin ion channel from spectral analysis of pH-dependent current fluctuations. Biophys J 69, 94-105 (1995).

Kasianowicz, J.J., Brandin, E., Branton, D. and Deamer, D.W. Characterization of individual polynucleotide molecules using a membrane channel. Proc. Natl. Acad. Sci. USA 1996, 93, 13770-13773.

Kasianowicz, J.J., Henrickson, S.E., Weetall, H.H. & Robertson, B. Simultaneous multianalyte detection with a nanometer-scale pore. Anal Chem 73, 2268-72 (2001).

Kasianowicz, J.J., et al. Physics of DNA threading through a nanometer pore and applications to simultaneous multianalyte sensing. en Structure and Dynamics of Confined Polymers, ed. Kasianowicz, J.J., Kellemayer, M.S.Z. & Deamer, D.W., Nato Science Series, Kluwer Academic Publishers, The Netherlands 87, 141-64 (2002)

Kasianowicz, J.J. Nanometer-scale pores: potential applications for DNA characterization and analyte detection. Disease Markers 2003, 18, 185-191.

Kasianowicz, J.J. Nanopore. Flossing with DNA. Nature Materials 2004, 3, 355-356.

Korlach, J. et al. Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nanostructures. Proc Natl Acad Sci USA 105, 1176-81 (2008).

Korlach, J. et al. Real-time DNA sequencing from single polymerase molecules. Methods Enzymol 472, 431-55 (2010).

Krasilnikov, O.V. Sizing channels with neutral polymers. in Structure and Dynamics of Confined Polymers, ed. Kasianowicz, J.J., Kellemayer, M.S.Z. & Deamer, D.W., Nato Science Series, Kluwer Academic Publishers, The Netherlands 87, 97-116 (2002)

Kumar, S, y Sood, A. Labeled Nucleoside Polyphosphates. patente en EE UU 7.041.812 (2006)

Kumar, S., McDougall, M., Sood, A., Nelson, J., Fuller, C., Macklin, J. y Mitsis, P. Terminal Phosphate-Labeled Nucleotides with New Linkers. Patente en EE UU 7.393.640 (2008)

Kumar, S., Sood, A., Wegener, J., Finn, P., Nampalli, S., Nelson, J., Sekher, A., Mitsis, P., Macklin, J. y Fuller, C. W. Terminal Phosphate Labeled Nucleotides: Synthesis, Applications and Linker effect on incorporation by DNA Polymerases. Nucleosides, Nucleotides & Nucleic Acids (2005) 24 (5-7), 401-408

Lee S.E., Sidorov A., Gourlain T., Mignet N., Thorpe S.J., Brazier J.A., Dickman M.J., Hornby D.P., Grasby, J.A. y Williams, D.M. Enhancing the catalytic repertoire of nucleic acids: a systematic study of linker length and rigidity. Nucleic Acids Research 2001,29(7), 1565-1573.

Lei, N., Watson, B.O., MacLean, J.N., Yuste, R. & Shepard, K.L. A 256-by-56 CMOS Microelectrode Array for Extracellular Neural Stimulation of Acute Brain Slices. en Solid-State Circuits Conference, 2008. ISSCC 2008. Digest of Technical Papers. IEEE International 148-603 (2008).

Levine, P.M., Gong, P., Levicky, R. & Shepard, K.L. Real-time, multiplexed electrochemical DNA detection using an active complementary metal-oxide-semiconductor biosensor array with integrated sensor electronics. Biosens Bioelectron 24, 1995-2001 (2009).

Li, Z., Bai, X., Ruparel, H., Kim, S., Turro, N.J. and Ju, J. A photocleavable fluorescent nucleotide for DNA sequencing and analysis. Proc. Natl. Acad. Sci. USA 2003, 100, 414-419.

Love, J.C., Estroff, L.A., Kriebel, J.K., Nuzzo, R.G. & Whitesides, G.M. Self-assembled monolayers of thiolates on metals as a form of nanotechnology. Chem Rev 105, 1103-69 (2005).

Manrao, E.A., et al. Reading DNA at single-nucleotide resolution with a mutant MspA nanopore and phi29 DNA polymerase. Nat Biotechnol, Advance Online Publication (2012)

Margulies, M. et al. Genome Sequencing in Open Microfabricated High Density Picoliter Reactors. Nature 437: 376-380 (2005).

Mathe, J. et al., Nanopore Unzipping of Individual Hairpin Molecules. Biophysical Journal 200487, 3205-3212. Matysiak, S., Montesi, A., Pasquali, M., Kolomeisky, A.B. & Clementi, C. Dynamics of polymer translocation through nanopores: theory meets experiment. Phys Rev Lett 96, 118103 (2006).

McNally, B. et al. Optical recognition of converted DNA nucleotides for single-molecule DNA sequencing using nanopore arrays. Nano Lett 10, 2237-44 (2010).

Meller, A., Nivon, L., Brandin, E., Golovchenko, J. and Branton, D. Rapid nanopore discrimination between single polynucleotide molecules. Proc. Natl. Acad. Sci. USA 2000, 97, 1079-1084.

Meller, A. et al., Single Molecule Measurements of DNA Transport Through a Nanopore. Electrophoresis 2002 23, 2583-2591.

Merchant, C.A. et al. DNA translocation through graphene nanopores. Nano Lett 10, 2915-21 (2010).

Montal, M. & Mueller, P. Formation of bimolecular membranes from lipid monolayers and a study of their electrical properties. Proc Natl Acad Sci USA 69, 3561-3566 (1972)

Nam, J.M., Nair, P.M., Neve, R.M., Gray, J.W. & Groves, J.T. A fluid membrane-based soluble ligand-display system for live-cell assays. ChemBioChem 7, 436-440 (2006).

Nkodo, A.E. et al. Diffusion coefficient of DNA molecules during free solution electrophoresis. ELECTROPHORESIS 22, 2424-2432 (2001).

Oliver, A.E. & Deamer, D.W. Alpha-Helical Hydrophobic Polypeptides Form Proton-Selective Channels in Lipid Bilayers. Biophysical Journal 66, 1364-1379 (1994).

Palegrosdemange, C., Simon, E.S., Prime, K.L. & Whitesides, G.M. Formation of Self-Assembled Monolayers by Chemisorption of Derivatives of Oligo(Ethylene Glycol) of Structure Hs(Ch2)11(Och2ch2)Meta-Oh on Gold. Journal of the American Chemical Society 113, 12-20 (1991).

Perkins, T.T., Quake, S.R., Smith, D.E. and Chu, S. Relaxation of a single DNA molecule observed by optical microscopy. Science 1994, 264, 822-826.

Reiner, J.E., Kasianowicz, J.J., Nablo, B.J. & Robertson, J.W. Theory for polymer analysis using nanopore-based single-molecule mass spectrometry. Proc Nail Acad Sci USA 107, 12080-5 (2010).

Reynolds, B., Miller, R., Williams, J., & Anderson, J. (2008). Synthesis and stability of novel terminal phosphatelabeled nucleotides. Nucleosides, Nucleotides and Nucleic Acids,27(1), 18-30.

Rief, M., Clausen-Schaumann, H. and Gaub, H.E. Sequence-dependent mechanics of single DNA molecules. Nat. Struct. Biol. 1999, 6, 346-349.

Robertson, J. W. F., Rodrigues, C. W., Stanford, V. M., Rubinson, K. A., Krasilnikov, 0. V. and Kasianowicz, J. J. Single-molecule mass spectrometry in solution using a solitary nanopore. Proc. Natl. Acad. Sci. USA 2007, 104, 8207-8211.

Rodrigues, C.G. et al. Mechanism of KC1 enhancement in detection of nonionic polymers by nanopore sensors. Biophys J 95, 5186-5192 (2008)

Ronaghi M., Uhlen, M. & Nyren, P. A sequencing method based on real-time pyrophosphate. Science 281, 363 365 (1998)

Rosenstein, J., V. Ray, M. Drndic, y K.L. Shepard. Solid-state nanopores integrated with low-noise preamplifiers for high-bandwidth d Na analysis. in Life Science Systems and Applications Workshop (LiSSA), 2011IEEE/NIH (2011).

Rosenstein, J., Ray, V., Drndic, M. & Shepard, K.L. Nanopore DNA sensors in CMOS with on-chip low-noise preamplifiers. en Solid-State Sensors, Actuators and Microsystems Conference (TRANSDUCERS), 2011 16th International 874-877 (2011).

Rothberg, J.M. et al. An integrated semiconductor device enabling non-optical genome sequencing. Nature 475, 348-352 (2011).

Sauer-Budge, A.F. et al., Unzipping Kinetics of Doubel Stranded DNA in a Nanopore. Physical Review Letters 200390(23), 238101-1 - 238101-4.

Schneider, G.F. et al. DNA translocation through graphene nanopores. Nano Lett 10, 3163-7 (2010).

Seo, T.S., Bai, X., Ruparel, H., Li, Z., Turro, N.J. and Ju, J. Photocleavable fluorescent nucleotides for DNA sequencing on a chip constructed by site-specific coupling chemistry. Proc. Natl. Acad. Sci. USA 2004, 101, 5488 5493.

Shapovalov, G. and Lester, H. A. Getting transitions in bacterial ion channels measured at 3 microseconds resolution. J. Gen. Physiol. 2004, 124, 151-161.

Shen, K., Tsai, J., Shi, P. & Kam, L.C. Self-aligned supported lipid bilayers for patterning the cell-substrate interface. J Am Chem Soc 131, 13204-5 (2009).

Shi, H. & Ratner, B.D. Template recognition of protein-imprinted polymer surfaces. Journal of Biomedical Materials Research 49, 1-11 (2000).

Shimada, K., Kato, H., Saito, T., Matsuyama, S. & Kinugasa, S. Precise measurement of the self-diffusion coefficient for poly(ethylene glycol) in aqueous solution using uniform oligomers. Journal of Chemical Physics 122(2005).

Sims, PA., Greenleaf, W.J., Duan, H. & Xie, X.S. Fluorogenic DNA sequencing in PDMS microreactors. Nat Methods 8, 575-80 (2011)

Smith, S.B., Cui, Y. y Bustamante, C. Overstretching B-DNA: the elastic response of individual double-stranded and single-stranded DNA molecules. Science 1996, 271, 795-799.

Song, L., et al. Structure of staphylococcal alpha-hemolysin, a heptameric transmembrane pore. Science 274, 1859-66 (1996)

Sood, A., Kumar, S., Wegener, J., Nampalli, S., Nelson, J., Macklin, J. y Fuller, C. W. Terminal Phosphate Labeled Nucleotides with improved substrate properties for Nucleic Acid Assays. J. Am. Chem. Soc. 2005, 127(8), 2394 2395.

Srinivasan, M.P., Ratto, T.V., Stroeve, P. & Longo, M.L. Patterned supported bilayers on self-assembled monolayers: Confinement of adjacent mobile bilayers. Langmuir 17, 7951-7954 (2001).

Storm, A.J. et al. Fast DNA translocation through a solid-state nanopore. Nano Lett 5, 1193-1197 (2005).

Timp, W. et al. Nanopore Sequencing: Electrical Measurements of the Code of Life. IEEE Trans Nanotechnol 9, 281-294 (2010).

Wang, H. et al., DNA heterogeneity and Phosphorylation unveiled by Single-Molecule Electrophoresis. PNAS 2004 101(37), 13472-13477.

Wang, Y., Zheng, D., Tan, Q., Wang, M.X. & Gu, L.Q. Nanopore-based detection of circulating microRNAs in lung cancer patients. Nat Nanotechnol 6, 668-74 (2011).

Wanunu, M. & Meller, A. Chemically modified solid-state nanopores. Nano Lett 7, 1580-5 (2007).

Wanunu, M., Sutin, J., McNally, B., Chow, A. & Meller, A. DNA translocation governed by interactions with solidstate nanopores. Biophys J95, 4716-25 (2008).

Wanunu, M. et al. Rapid electronic detection of probe-specific microRNAs using thin nanopore sensors. Nat Nanotechnol 5, 807-14 (2010).

White, R.J. et al. Ionic conductivity of the aqueous layer separating a lipid bilayer membrane and a glass support. Langmuir 22, 10777-83 (2006).

White, R.J. et al. Single ion-channel recordings using glass nanopore membranes. J Am Chem Soc 129, 11766 75 (2007).

Wiehelman, K. Investigation of the bicinchoninic acid protein assay: identification of the groups responsible for color formation. Analytical Biochemistry 175(1988).

Yang, T.L., Baryshnikova, O.K., Mao, H.B., Holden, M.A. & Cremer, P.S. Investigations of bivalent antibody binding on fluid-supported phospholipid membranes: The effect of hapten density. Journal of the American Chemical Society 125, 4779-4784 (2003).

Yin, P. Tethered Bilayer Membrane Sensors with Small Transmembrane Peptide Ion Channels - Recent Developments, Future Research and Potential Applications. en Advances in Planar Lipid Bilayers and Liposomes, Vol. Volume 2 (ed. Ottova-Leitmannova, A.) 49-76 (Academic Press, 2005).

Vercoutere, W., Winters-Hilt, S., Olsen, H., Deamer, D., Haussler, D. y Akeson, M. Rapid discrimination among individual DNA hairpin molecules at single-nucleotide resolution using an ion channel. Nat. Biotech 2001, 19, 248 252.

Claims

REIVINDICACIONES

Un método para determinar la secuencia de nucleótidos de un ADN o ARN monocatenario, el método comprende:

(a) poner en contacto el ADN o ARN monocatenario con

un sistema de medida de conductancia que comprende: (i) un primer y segundo compartimento con una primera y segunda solución de electrolito separadas por una barrera física, barrera que tiene al menos un poro con un diámetro en la escala nanométrica; (ii) un medio para aplicar un campo eléctrico a través de la barrera; (iii) un medio para medir un cambio en el campo eléctrico; (iv) al menos una polimerasa unida al poro adyacente a la entrada del poro, y opcionalmente (v) más de una enzima fosfatasa unida al poro y

un compuesto que tiene la estructura

en donde la etiqueta comprende un oligonucleótido, en donde Rⁱes OH, en donde R²es H u OH, en donde X es O, NH, S, o CH², en donde Z es O, S, o BH³, en donde la base es adenina, guanina, citosina, timina o un derivado de una de estas bases, y en donde n es 1,2, 3, o 4, y opcionalmente en donde la etiqueta tiene una carga que es de signo inverso relativa a la carga en el resto del compuesto,

en donde el ADN o ARN monocatenario está en una solución de electrolito en contacto con la polimerasa unida al poro y en donde el ADN o ARN monocatenario tiene un cebador hibridado a una porción del mismo, en condiciones que permiten que la polimerasa catalice la incorporación del compuesto al cebador si es complementario al residuo de nucleótido del ADN o ARN monocatenario que está inmediatamente 5' respecto a un residuo de nucleótido del ADN o ARN monocatenario hibridado al residuo de nucleótido 3' terminal del cebador, de modo que se forme un producto de extensión de ADN o ARN,

en donde si el compuesto no se incorpora, repetir iterativamente el contacto con diferentes compuestos hasta que un compuesto se incorpore, con la condición de que (1) el tipo de base en el compuesto es diferente del tipo de base en cada uno de los compuestos previos, y (2) el tipo de etiqueta en el compuesto es diferente del tipo de etiqueta en cada uno de los compuestos previos,

en donde la incorporación del compuesto produce la liberación de un polifosfato que tiene una etiqueta unida al mismo,

opcionalmente en donde la enzima fosfatasa unida al poro corta la etiqueta del polifosfato para liberar la etiqueta;

(b) determinar qué compuesto se ha incorporado al cebador para formar el producto de extensión de ADN o ARN en la etapa (a) aplicando un campo eléctrico a través de la barrera y midiendo un cambio electrónico a través del poro resultante de la translocación de la etiqueta generada en la etapa (a) a través del poro, y detectar la etiqueta con ayuda de al menos un electrodo, en donde detectar dicha etiqueta con la ayuda del electrodo comprende:

(i) pasar una corriente iónica a través de dicha primera solución de electrolito, dicho poro, y dicha segunda solución de electrolito con un potencial eléctrico entre dicha primera y dicha segunda solución de electrolito;

(ii) medir la corriente iónica que pasa a través de dicho poro y registrar la duración de cambios en la corriente iónica como una serie temporal de conductancia, en donde dicha serie temporal de conductancia abarca periodos de tiempo cuando dicho poro está sin obstruir por dicha etiqueta y también periodos de tiempo cuando dicha etiqueta produce pulsos de conductancia reducida; y (iii) delinear segmentos de la serie temporal de conductancia en regiones estadísticamente consistentes con el nivel de conductancia de poro sin obstruir, pulsos de conductancia reducida, y segmentos estadísticamente estacionarios en pulsos individuales de conductancia reducida;

en donde el cambio electrónico es diferente para cada tipo de etiqueta, identificando de esta manera el residuo de nucleótido en el ADN o ARN monocatenario complementario al compuesto incorporado; y (c) realizar iterativamente las etapas (a) y (b) para cada residuo de nucleótido del ADN o ARN monocatenario que se secuencia,

determinando mediante ello la secuencia de nucleótidos del ADN o ARN monocatenario
2. El método de la reivindicación 1, en donde el compuesto tiene la estructura:

en donde en cada estructura n es, independientemente, 1, 2, 3, o 4, y m es, independientemente, un número entero de 0 a 100, y en donde cuando m es 0 el fosfato terminal del dNTP está unido directamente al átomo de O en 3' del nucleósido mostrado en el lado de la izquierda de la estructura, en donde R1 es -OH, y R2 es H u OH.
3. El método de la reivindicación 2, en donde m es de 0 a 50.
4. El método de la reivindicación 2 o la reivindicación 3, en donde R2 es -H.
5. El método de la reivindicación 2 o la reivindicación 3, en donde R2 es -OH.
6. El método de cualquiera de las reivindicaciones 1-5, en donde n es cuatro.
7. El método de cualquiera de las reivindicaciones 1-6, en donde el primer y segundo compartimentos tienen una carga que es ajustable.
8. El método de cualquiera de las reivindicaciones 1-7, en donde la barrera física es una bicapa lipídica.
9. El método de la reivindicación 8, en donde se proporciona un par de electrodos en la etapa a).
10. El método de la reivindicación 9, en donde un electrodo del par de electrodos es o forma parte de una superficie compatible con bicapa lipídica.
11. El método de la reivindicación 9 o la reivindicación 10, en donde el par de electrodos están acoplados a una fuente de voltaje variable para proporcionar el campo eléctrico.
12. El método de cualquiera de las reivindicaciones 9-11, en donde el par de electrodos detecta las características eléctricas de la bicapa lipídica.