CAMPO DA INVENÇÃO
[0001] A presente invenção refere-se a métodos e composições relacionadas à modulação de resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. Em algumas modalidades preferenciais, a presente invenção fornece composições e métodos para o uso de um ou mais genes ou proteínas cas para modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. Em algumas modalidades, a presente invenção fornece métodos e composições que encontram uso no desenvolvimento e uso de combinações de cepas e rotações de culturas iniciadoras. Em modalidades adicionais, a presente invenção fornece métodos para marcação e/ou identificação de bactérias. Em algumas modalidades preferenciais, a presente invenção fornece métodos para o uso dos loci de CRISPR para determinar a virulência potencial de um fago contra uma célula e o uso de CRISPR-cas para modular a sequência gênica de um fago de nível de virulência aumentado. Ainda em modalidades adicionais, a presente invenção fornece meios e composições para o desenvolvimento e uso de fagos como agentes de biocontrole.
ANTECEDENTES DA INVENÇÃO
[0002] Culturas, e culturas iniciadoras, em particular, são usadas extensivamente na indústria alimentícia na produção de produtos fermentados incluindo produtos lácteos (por exemplo, iogurte, leitelho e queijo), embutidos, produtos de padaria, vinho e produtos vegetais. A preparação de culturas é trabalho intensivo, ocupando muito espaço e equipamento, e há um risco considerável de contaminação com bactérias e/ou fagos deteriorantes durante as etapas de propagação. A falha de culturas bacterianas devido à infecção e multiplicação de bacteriófago (fago) é um grande problema no uso industrial de culturas bacterianas. Há muitos tipos diferentes de fagos e novas cepas continuam a emergir. Além disso, há uma necessidade de métodos e composições para rastrear bactérias usadas em tais culturas. De fato, apesar de avanços no desenvolvimento de culturas, há uma necessidade contínua de melhorar culturas para uso na indústria.
SUMÁRIO DA INVENÇÃO
[0003] A presente invenção fornece métodos e composições relacionadas à modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. Em algumas modalidades preferenciais, a presente invenção fornece composições e métodos para o uso de um ou mais genes ou proteínas cas para modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. Em algumas modalidades, a presente invenção fornece métodos e composições que encontram uso no desenvolvimento e uso de combinações de cepas e rotações de culturas iniciadoras. Em modalidades adicionais, a presente invenção fornece métodos para marcação e/ou identificação de bactérias. Em algumas modalidades preferenciais, a presente invenção fornece métodos para o uso de loci de CRISPR para determinar a virulência potencial de um fago contra uma célula e o uso de CRISPR-cas para modular a sequência genética de um fago de nível de virulência aumentado. Ainda em modalidades adicionais, a presente invenção fornece meios e composições para o desenvolvimento e uso de fagos como agentes de biocontrole.
[0004] A presente invenção fornece métodos para geração de pelo menos uma cepa variante resistente a bacteriófago, compreendendo as etapas de: (a) exposição de uma cepa bacteriana parental compreendendo pelo menos uma porção de um locux de CRISPR a pelo menos uma sequência de ácido nucleico para produzir uma mistura de bactérias compreendendo pelo menos uma cepa variante resistente a bacteriófago compreendendo um locux de CRISPR modificado; (b) seleção de uma cepa variante resistente a bacteriófago a partir da mistura de bactérias; (c) seleção de cepas variantes resistentes a bacteriófago compreendendo um fragmento de ácido nucleico adicional no locux de CRISPR modificado a partir das cepas resistentes a bacteriófago selecionadas na etapa (b); e (d) isolamento de pelo menos uma cepa variante resistente a bacteriófago, em que a cepa compreende um fragmento de ácido nucleico adicional no locux de CRISPR modificado. Em algumas modalidades preferenciais, os métodos compreendem ainda a etapa de comparação do locux de CRISPR ou uma porção do mesmo da cepa bacteriana parental e o locux de CRISPR modificado da cepa variante resistente a bacteriófago para identificar cepas variantes resistentes a bacteriófago compreendendo pelo menos um fragmento de ácido nucleico adicional no locux de CRISPR modificado que está ausente do locux de CRISPR da cepa bacteriana parental. Em algumas modalidades particularmente preferenciais, os métodos compreendem ainda a etapa de seleção de cepas variantes resistentes a bacteriófago compreendendo um fragmento de ácido nucleico adicional no locux de CRISPR modificado. Em algumas modalidades, a cepa bacteriana parental é exposta a duas ou mais sequências de ácidos nucleicos. Em algumas modalidades preferenciais, a cepa bacteriana parental é simultaneamente exposta a duas ou mais sequências de ácidos nucleicos, enquanto em algumas modalidades alternativas, a cepa bacteriana parental é sequencialmente exposta a duas ou mais sequências de ácidos nucleicos. Em algumas modalidades particularmente preferenciais, a cepa bacteriana parental é exposta à sequência de ácido nucleico através da infecção por pelo menos um bacteriófago compreendendo a sequência de ácido nucleico. Em algumas modalidades adicionais preferenciais, pelo menos um bacteriófago é selecionado a partir do grupo de famílias de vírus compostas de: Corticoviridae, Cystoviridae, Inoviridae, Leviviridae, Microviridae, Myoviridae, Podoviridae, Siphoviridae e Tectiviridae. Em algumas modalidades preferenciais adicionais, pelo menos um bacteriófago é um bacteriófago que ocorre naturalmente, enquanto em outras modalidades preferenciais, pelo menos um bacteriófago é um bacteriófago transformado obtido através de pressão seletiva usando uma cepa bacteriana resistente a bacteriófago. Ainda em modalidades adicionais preferenciais, a cepa bacteriana parental é exposta ao ácido nucleico através de um mecanismo natural de absorção de ácido nucleico. Em algumas modalidades, o mecanismo natural de absorção de ácido nucleico compreende competência natural. Em algumas modalidades adicionais, o mecanismo natural de absorção de ácido nucleico da cepa bacteriana por conjugação ou transformação. Ainda em outras modalidades, a cepa resistente a bacteriófago é um mutante insensível a bacteriófago. Ainda em modalidades adicionais, a cepa bacteriana parental é um mutante insensível a bacteriófago. Em algumas modalidades adicionais, a extremidade 5' e/ou a extremidade 3' do locux de CRISPR da cepa bacteriana parental é comparada ao locux de CRISPR modificado da cepa variante resistente a bacteriófago. Ainda em algumas modalidades adicionais, as extremidades 5' e/ou 3' de pelo menos da primeira repetição de CRISPR ou pelo menos do primeiro CRISPR espaçadora do locux de CRISPR da cepa bacteriana parental é comparado ao locux de CRISPR modificado da cepa variante resistente a bacteriófago. Ainda em modalidades adicionais, a cepa variante resistente a bacteriófago compreende pelo menos um fragmento de ácido nucleico adicional no locux de CRISPR modificado. Em algumas modalidades adicionais, pelo menos uma porção do locux de CRISPR da cepa bacteriana parental e pelo menos uma porção do locux de CRISPR modificado da cepa variante resistente a bacteriófago são comparadas pela amplificação de pelo menos uma porção do locux de CRISPR e pelo menos uma porção do locux de CRISPR modificado, para produzir uma sequência do locux de CRISPR amplificada e uma sequência modificada amplificada do locux de CRISPR. Ainda em modalidades adicionais, a amplificação é conduzida usando a reação em cadeia da polimerase. Em algumas modalidades preferenciais, pelo menos uma porção do locux de CRISPR da cepa bacteriana parental e pelo menos uma porção do locux de CRISPR modificado da cepa variante resistente a bacteriófago são comparadas por sequenciamento de pelo menos uma porção do locux de CRISPR e pelo menos uma porção do locux de CRISPR modificado. Em algumas modalidades particularmente preferenciais, os métodos compreendem ainda a etapa de sequenciamento da sequência do locux de CRISPR amplificada e da sequência do locux de CRISPR modificada amplificada. Em algumas modalidades adicionais, o fragmento de ácido nucleico adicional no locux de CRISPR modificado é uma unidade espaçadora de repetição adicional. Em algumas modalidades preferenciais, a unidade espaçadora de repetição adicional compreende pelo menos aproximadamente 44 nucleotídeos. Em algumas modalidades alternativas preferenciais, unidade espaçadora de repetição adicional está compreendida entre aproximadamente 44 e aproximadamente 119 nucleotídeos. Entretanto, não se destina que a presente invenção seja limitada a estas faixas de tamanho específicas, já que outros tamanhos encontram uso na presente invenção, como descrito neste pedido. Em algumas modalidades, a unidade espaçadora de repetição adicional compreende pelo menos uma sequência nucleotídica que tem identidade de pelo menos aproximadamente 95% a uma repetição de CRISPR no locux de CRISPR da cepa bacteriana parental. Em algumas modalidades adicionais, a unidade espaçadora de repetição adicional compreende pelo menos uma sequência nucleotídica que tem identidade de pelo menos aproximadamente 95% a uma sequência nucleotídica no genoma de pelo menos um bacteriófago. Em algumas modalidades particularmente preferenciais, a cepa bacteriana parental é uma cepa industrialmente útil. Em algumas modalidades adicionais, a cepa bacteriana parental é suscetível à infecção por pelo menos um bacteriófago. Em algumas modalidades ainda preferenciais, a cepa bacteriana parental compreende uma cultura selecionada a partir de culturas iniciadoras, culturas probióticas e culturas de suplemento dietético. Em algumas modalidades preferenciais, a cepa bacteriana parental compreende uma cepa obtida a partir de uma cultura. Em algumas modalidades particularmente preferenciais, a cultura é uma cultura iniciadora, uma cultura probiótica e/ou uma cultura de suplemento dietético. Ainda em modalidades adicionais, a cepa bacteriana parental é selecionada a partir de Escherichia, Shigella, Salmonella, Erwinia, Yersinia, Bacillus, Vibrio, Legionella, Pseudomonas, Neisseria, Bordetella, Helicobacter, Listeria, Agrobacterium, Staphylococcus, Streptococcus, Enterococcus, Clostridium, Corynebacterium, Mycobacterium, Treponema, Borrelia, Francisella, Brucella, Campylobacter, Klebsiella, Frankia, Bartonella, Rickettsia, Shewanella, Serratia, Enterobacter, Proteus, Providencia, Brochothrix, Bifidobacterium, Brevibacterium, Propionibacterium, Lactococcus, Lactobacillus, Pediococcus, Leuconostoc e Oenococcus.
[0005] A presente invenção também fornece pelo menos uma cepa variante resistente a bacteriófago obtida usando os métodos apresentados neste pedido. Em algumas modalidades preferenciais, a presente invenção fornece cepas variantes resistentes a bacteriófago, em que a cepa variante resistente a bacteriófago é uma cepa industrialmente útil. Em algumas modalidades preferenciais, a cepa variante resistente a bacteriófago compreende uma cepa industrialmente útil que é pelo menos um componente de uma cultura iniciadora, cultura probiótica, cultura de suplemento dietético e/ou outras culturas úteis.
[0006] A presente invenção também fornece composições compreendendo uma cepa variante resistente a bacteriófago produzida usando os métodos apresentados neste pedido. Em algumas modalidades, a presente invenção fornece composições compreendendo pelo menos duas cepas variantes resistentes a bacteriófago produzidas usando os métodos apresentados neste pedido. A presente invenção também fornece alimentos e/ou rações compreendendo pelo menos uma destas composições. A presente invenção também fornece métodos para preparação de alimento e/ou ração compreendendo adição de pelo menos uma destas composições a alimento ou ração. A presente invenção também fornece culturas iniciadoras, culturas probióticas, culturas de suplemento dietético e outras culturas úteis compreendendo pelo menos uma destas composições. A presente invenção também fornece métodos de fermentação compreendendo adição de pelo menos uma destas composições a uma cultura iniciadora. Em algumas modalidades, a presente invenção fornece métodos de fermentação compreendendo adição de pelo menos uma destas composições a um meio de fermentação, sob condições tais que a fermentação dos componentes do meio de fermentação ocorra. Em algumas modalidades, a fermentação não é afetada pela presença de bacteriófagos. Em algumas modalidades, o meio de fermentação é um produto alimentício. Em algumas modalidades preferenciais, o produto alimentício é um produto lácteo. Em algumas modalidades particularmente preferenciais, o produto lácteo é leite. Em algumas modalidades adicionais, pelo menos duas composições diferentes compreendendo duas ou mais cepas variantes resistentes a bacteriófago são sequencialmente expostas ao meio de fermentação.
[0007] A presente invenção também fornece métodos para redução da população de bacteriófago prejudicial em um meio de fermentação compreendendo exposição de um meio de fermentação a pelo menos uma cepa variante resistente a bacteriófago produzida usando os métodos apresentados neste pedido, sob condições tais que a população de bacteriófago seja reduzida.
[0008] A presente invenção também fornece métodos para geração de pelo menos uma cepa variante resistente a bacteriófago, compreendendo as etapas de: (a) exposição de uma cepa bacteriana parental compreendendo pelo menos uma porção de um locux de CRISPR a pelo menos uma sequência de ácido nucleico para produzir uma mistura de bactérias compreendendo pelo menos uma cepa variante resistente a bacteriófago compreendendo um locux de CRISPR modificado; (b) seleção de uma cepa variante resistente a bacteriófago a partir da mistura de bactérias; (c) comparação do locux de CRISPR ou uma porção do mesmo da cepa bacteriana parental e o locux de CRISPR modificado da cepa variante resistente a bacteriófago para identificar cepas variantes resistentes a bacteriófago compreendendo pelo menos um fragmento de ácido nucleico adicional no locux de CRISPR modificado que está ausente no locux de CRISPR da cepa bacteriana parental; (d) seleção de linhagens variantes resistentes a bacteriófago compreendendo um fragmento de ácido nucleico adicional no locux de CRISPR modificado; (e) análise de pelo menos um fragmento de ácido nucleico adicional no locux de CRISPR modificado para identificar pelo menos uma cepa variante resistente a bacteriófago; e (f) isolamento de pelo menos uma cepa variante resistente a bacteriófago.
[0009] A presente invenção também fornece métodos para geração de mutantes de CRISPR para escape de fago compreendendo: (a) obtenção: pelo menos um fago parental e uma cepa bacteriana resistente ao fago compreendendo pelo menos um locux de CRISPR, em que o locux de CRISPR compreende uma sequência de ácido nucleico que é pelo menos aproximadamente 95% idêntica a pelo menos uma sequência protoespaçadora no genoma de pelo menos um fago parental; (b) exposição de pelo menos um fago parental à cepa bacteriana resistente ao fago, sob condições tais que pelo menos uma variante de fago seja produzida; e (c) seleção de pelo menos uma variante de fago, em que pelo menos uma variante de fago exibe a capacidade de infectar a cepa bacteriana resistente ao fago e é um mutante de CRISPR para escape de fago. Em algumas modalidades, a cepa bacteriana resistente ao fago é uma linhagem variante resistente a bacteriófago obtida usando os métodos apresentados neste pedido. Em algumas modalidades, os métodos compreendem ainda a etapa de comparação de pelo menos uma porção de pelo menos uma sequência protoespaçadora e um motivo de CRISPR posicionado próximo a pelo menos uma sequência protoespaçadora no fago variante com pelo menos uma sequência protoespaçadora e motivo de CRISPR do fago parental. Ainda em modalidades adicionais, os métodos compreendem ainda a etapa de seleção de fagos variantes que infectam a cepa bacteriana resistente ao fago, em que os fagos variantes compreendem os mutantes de CRISPR para escape de fago, e em que a CRISPR para escape de fagos compreende pelo menos uma mutação em pelo menos uma sequência protoespaçadora e/ou no motivo dos mutantes de CRISPR para escape de fago. Ainda em modalidades adicionais, os métodos são iterativamente repetidos uma ou mais vezes usando os mutantes de CRISPR para escape de fago e cepa bacteriana de CRISPR resistente ao fago diferente compreendendo pelo menos um locux de CRISPR, em que o locux de CRISPR compreende uma sequência de ácido nucleico que é pelo menos aproximadamente 95% idêntica a pelo menos uma sequência protoespaçadora no genoma dos mutantes de CRISPR para escape de fago. Ainda em modalidades adicionais, pelo menos um bacteriófago é selecionado a partir do grupo de famílias de vírus compostas de: Corticoviridae, Cystoviridae, Inoviridae, Leviviridae, Microviridae, Myoviridae, Podoviridae, Siphoviridae e Tectiviridae. Em algumas modalidades preferenciais, a cepa bacteriana resistente ao fago é selecionada a partir de Escherichia, Shigella, Salmonella, Erwinia, Yersinia, Bacillus, Vibrio, Legionella, Pseudomonas, Neisseria, Bordetella, Helicobacter, Listeria, Agrobacterium, Staphylococcus, Enterococcus, Clostridium, Campylobacter, Corynebacterium, Mycobacterium, Treponema, Borrelia, Francisella, Brucella, Klebsiella, Frankia, Bartonella, Rickettsia, Shewanella, Serratia, Enterobacter, Proteus, Providencia, Brochothrix, Bifidobacterium, Brevibacterium, Propionibacterium, Lactococcus, Lactobacillus, Pediococcus, Leuconostoc, Streptococcus e Oenococcus.
[00010] A presente invenção também fornece mutantes de CRISPR para escape de fago obtidos usando os métodos apresentados neste pedido. Em algumas modalidades, os mutantes de CRISPR para escape de fago compreendem duas ou mais mutações presentes em pelo menos duas sequências protoespaçadoras e/ou no motivo de CRISPR.
[00011] A presente invenção também fornece mutantes de CRISPR para escape de fago , em que o genoma dos mutantes de CRISPR para escape de fago é construído geneticamente para compreender mutações em pelo menos um protoespaçador e/ou no motivo de CRISPR. Em algumas modalidades, pelo menos um motivo de CRISPR é transformado nos mutantes de CRISPR para escape de fago, enquanto em algumas modalidades alternativas, pelo menos um motivo de CRISPR é deletado nos mutantes de CRISPR para escape de fago. A presente invenção também fornece composições compreendendo pelo menos um mutante de CRISPR para escape de fago.
[00012] A presente invenção também fornece métodos para controle de populações bacterianas em um produto compreendendo exposição de composições compreendendo pelo menos um mutante de CRISPR para escape de fago em um meio de fermentação, em que o meio de fermentação contém pelo menos uma população de bactérias indesejáveis, sob condições tais que a população das bactérias indesejáveis seja reduzida, e o meio de fermentação seja usado para gerar o produto. Em algumas modalidades, o produto é selecionado a partir de alimentos, rações, cosméticos, produtos de cuidado pessoal, produtos de cuidado da saúde, produtos veterinários e suplementos dietéticos. Em algumas modalidades adicionais, os métodos são repetidos pelo menos uma vez e as composições diferentes e/ou composições compreendendo mutantes de CRISPR para escape de fago diferentes são usadas em rotação.
[00013] Em algumas modalidades, a presente invenção fornece métodos e composições para o uso de um ou mais genes ou proteínas cas para modulação da resistência em uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. Em algumas modalidades adicionais, a presente invenção fornece composições e métodos para o uso de uma sequência de ácido nucleico recombinante compreendendo pelo menos um gene cas e pelo menos duas repetições de CRISPR em conjunto com pelo menos uma CRISPR espaçadora, em que pelo menos uma CRISPR espaçadora é heteróloga a pelo menos um gene cas e/ou pelo menos duas repetições de CRISPR para modular a resistência contra um ácido nucleico-alvo ou produto de transcrição do mesmo. Ainda em modalidades adicionais, a presente invenção fornece pelo menos uma sequência de ácido nucleico compreendendo pelo menos um gene cas.
[00014] Ainda em modalidades adicionais, a presente invenção fornece pelo menos uma sequência de ácido nucleico compreendendo pelo menos um gene cas e pelo menos duas repetições de CRISPR. Em algumas modalidades, a presente invenção fornece uma sequência de ácido nucleico compreendendo pelo menos um gene cas e pelo menos uma CRISPR espaçadora. Ainda em modalidades adicionais, a presente invenção fornece uma sequência de ácido nucleico compreendendo pelo menos um gene cas, pelo menos uma CRISPR espaçadora e pelo menos duas repetições de CRISPR. Em modalidades adicionais, a presente invenção fornece uma sequência de ácido nucleico recombinante compreendendo pelo menos um gene cas e pelo menos duas repetições de CRISPR em conjunto com pelo menos uma CRISPR espaçadora, em que a CRISPR espaçadora é heteróloga a pelo menos um gene cas e/ou a pelo menos duas repetições de CRISPR.
[00015] A presente invenção também fornece construtos compreendendo uma ou mais das sequências de ácidos nucleicos descritas neste pedido. Ainda em modalidades adicionais, a presente invenção fornece vetores compreendendo uma ou mais das sequências de ácidos nucleicos ou um ou mais dos construtos descritos neste pedido. Ainda em modalidades adicionais, a presente invenção fornece células compreendendo a sequência de ácido nucleico ou o construto ou o vetor descrito neste pedido.
[00016] A presente invenção também fornece métodos para modulação (por exemplo, conferindo ou aumentando) da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo compreendendo as etapas de: (i) identificação de uma sequência (por exemplo, uma sequência conservada) em um organismo (em algumas modalidades, esta é uma sequência que é essencial para a função ou sobrevivência do organismo); (ii) preparação de uma CRISPR espaçadora que é homóloga à sequência identificada; (iii) preparação de um ácido nucleico (por exemplo, um ácido nucleico recombinante) compreendendo pelo menos um gene cas e pelo menos duas repetições de CRISPR em conjunto com a CRISPR espaçadora; e (iv) introdução do ácido nucleico em uma célula, portanto, para produzir a célula resistente ao ácido nucleico- alvo ou produto de transcrição do mesmo.
[00017] A presente invenção também fornece métodos para modulação (por exemplo, conferindo ou aumentando) da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo compreendendo as etapas de: (i) identificação de uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras em um organismo resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo; (ii) preparação de um ácido nucleico recombinante compreendendo pelo menos um gene ou proteína cas e pelo menos duas repetições de CRISPR em conjunto com um ou mais espaçadores identificados; e (iii) introdução do ácido nucleico recombinante em uma célula, portanto, para produzir a célula resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo.
[00018] A presente invenção também fornece métodos para modulação (por exemplo, conferindo ou aumentando) da resistência de uma célula compreendendo pelo menos um ou mais genes ou proteínas cas e duas ou mais repetições de CRISPR contra um ácido nucleico-alvo ou um produto de transcrição do mesmo compreendendo as etapas de: (i) identificação de uma ou mais CRISPR espaçadoras em um organismo resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo; e (ii) modificação da sequência de uma ou mais CRISPR espaçadora(s) na célula tal que a CRISPR espaçadora(s) tenha homologia a CRISPR espaçadora(s) no organismo.
[00019] A presente invenção também fornece métodos para modulação (por exemplo, reduzindo ou diminuindo) da resistência de uma célula compreendendo pelo menos um ou mais genes ou proteínas cas e duas ou mais repetições de CRISPR contra um ácido nucleico-alvo ou um produto de transcrição do mesmo compreendendo as etapas de: (i) identificação de uma ou mais CRISPR espaçadoras em um organismo que é substancialmente resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo; e (ii) modificação da sequência de pelo menos uma ou mais CRISPR espaçadora(s) na célula tal que a CRISPR espaçadora(s) tenha um grau reduzido de homologia ao espaçador(es) no organismo.
[00020] A presente invenção também fornece métodos para modulação (por exemplo, reduzindo ou diminuindo) da resistência de uma célula compreendendo pelo menos um ou mais genes ou proteínas cas e duas ou mais repetições de CRISPR contra um ácido nucleico-alvo ou um produto de transcrição do mesmo compreendendo modificação de um ou mais genes ou proteínas cas e/ou duas ou mais repetições de CRISPR na célula.
[00021] A presente invenção também fornece métodos para identificação de uma CRISPR espaçadora ou pseudo CRISPR espaçadora para uso na modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo compreendendo as etapas de: (i) preparação de uma célula compreendendo pelo menos duas repetições CRISPR e pelo menos um gene ou proteína cas; (ii) identificação de pelo menos uma CRISPR espaçadora ou pseudo CRISPR espaçadoras em um organismo que é substancialmente resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo; (iii) modificação da sequência da CRISPR espaçadora na célula, tal que a CRISPR espaçadora tenha homologia ao espaçador do organismo; e (iv) determinação se a célula modula a resistência contra o ácido nucleico-alvo ou produto de transcrição do mesmo, em que a modulação da resistência da célula contra o ácido nucleico-alvo ou produto de transcrição do mesmo é indicativa que a CRISPR espaçadora modula a resistência da célula.
[00022] A presente invenção também fornece métodos para identificação de um gene cas para uso na modulação da resistência de uma célula contra um ácido nucleico-alvo ou produto de transcrição do mesmo compreendendo as etapas de: (i) preparação de uma célula compreendendo pelo menos uma CRISPR espaçadora e pelo menos duas repetições de CRISPR; (ii) engenharia da célula tal que compreenda pelo menos um gene cas; e (iii) determinação se a célula modula a resistência contra o ácido nucleico-alvo ou produto de transcrição do mesmo, em que a modulação da resistência da célula contra o ácido nucleico-alvo ou produto de transcrição do mesmo é indicativa que o gene cas pode ser usado para modular a resistência da célula.
[00023] A presente invenção também fornece métodos para identificação de uma repetição de CRISPR para uso na modulação da resistência de uma célula contra um ácido nucleico-alvo ou produto de transcrição do mesmo compreendendo as etapas de: (i) preparação de uma célula compreendendo pelo menos uma CRISPR espaçadora e pelo menos um gene cas; (ii) engenharia da célula tal que contenha a repetição de CRISPR; e (iii) determinação se a célula modula a resistência contra o ácido nucleico-alvo ou produto de transcrição do mesmo, em que a modulação da resistência da célula contra o ácido nucleico-alvo ou produto de transcrição do mesmo é indicativa que a repetição de CRISPR pode ser usada para modular a resistência.
[00024] A presente invenção também fornece métodos para identificação de uma combinação funcional de um gene cas e uma repetição de CRISPR compreendendo as etapas de: (a) determinação das sequências do gene cas e a repetição de CRISPR; (b) identificação de um ou mais grupos de genes cas como determinado por análise de comparação de sequência; (c) identificação de um ou mais grupos de repetições de CRISPR; e (d) combinação daqueles genes cas e sequências de repetição de CRISPR que estão incluídos no mesmo grupo, em que a combinação do gene cas e sequências de repetição de CRISPR no mesmo grupo é indicativa que a combinação é uma combinação funcional.
[00025] A presente invenção também fornece métodos para modulação do lisotipo de uma célula bacteriana compreendendo um ou mais genes ou proteínas cas e duas ou mais repetições de CRISPR compreendendo as etapas de: (i) identificação de uma ou mais pseudo CRISPR espaçadoras na sequência genômica de um bacteriófago contra o qual a resistência deve ser modulada; e (ii) modificação da sequência de uma ou mais CRISPR espaçadoras da célula bacteriana tal que a CRISPR espaçadora(s) da célula bacteriana tenha homologia ao pseudo CRISPR espaçadora(s) do bacteriófago contra o qual a resistência deve ser modulada.
[00026] A presente invenção também fornece métodos para modulação (por exemplo, conferindo ou aumentando) da resistência de uma célula bacteriana contra um bacteriófago compreendendo as etapas de: (i) identificação de uma sequência (por exemplo, uma sequência conservada) em um bacteriófago (preferencialmente, uma sequência essencial para a função ou sobrevivência do bacteriófago); (ii) preparação de uma CRISPR espaçadora que é homóloga à sequência identificada; (iii) preparação de um ácido nucleico compreendendo pelo menos um gene cas e pelo menos duas repetições de CRISPR em conjunto com a CRISPR espaçadora; e (iv) introdução do ácido nucleico na célula bacteriana, portanto, para produzir a célula bacteriana resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo.
[00027] A presente invenção também fornece métodos para modulação (por exemplo, conferindo ou aumentando) da resistência de uma célula bacteriana contra um ácido nucleico-alvo ou produto de transcrição em um bacteriófago da mesma compreendendo as etapas de: (i) identificação de uma ou mais pseudo CRISPR espaçadoras em um genoma de bacteriófago que é capaz de fornecer resistência no ácido nucleico-alvo ou produto de transcrição do mesmo; (ii) preparação de um ácido nucleico recombinante compreendendo pelo menos um gene cas e pelo menos duas repetições de CRISPR em conjunto com uma ou mais pseudo CRISPR espaçadoras identificadas; e (iii) introdução do ácido nucleico recombinante na célula bacteriana, portanto, para produzir a célula bacteriana resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo.
[00028] A presente invenção também fornece métodos para modulação da resistência de uma célula bacteriana compreendendo um ou mais genes ou proteínas cas e duas ou mais repetições de CRISPR contra um ácido nucleico-alvo ou produto de transcrição do mesmo em um bacteriófago compreendendo as etapas de: (i) identificação de uma ou mais pseudo CRISPR espaçadoras em um bacteriófago que é capaz de fornecer resistência em um ácido nucleico-alvo ou produto de transcrição do mesmo; (ii) identificação de uma ou mais CRISPR espaçadoras em uma célula bacteriana na qual a resistência deve ser modulada; e (iii) modificação da sequência da CRISPR espaçadora(s) na célula bacteriana na qual a resistência deve ser modulada tal que a CRISPR espaçadora(s) tenha um grau mais alto de homologia à pseudo CRISPR espaçadora(s) do bacteriófago contra o qual a resistência deve ser modulada.
[00029] A presente invenção também fornece métodos para determinação da resistência de uma célula contra um ácido nucleico- alvo ou um produto de transcrição do mesmo compreendendo identificação de uma ou mais combinações de repetição cas CRISPR funcionais e uma ou mais CRISPR espaçadoras na célula.
[00030] A presente invenção também fornece células usando obtidas ou obtidas usando o método(s) fornecido neste pedido. Em algumas modalidades, a presente invenção fornece CRISPR espaçadoras ou pseudo CRISPR espaçadoras obtidas ou obteníveis pelo método(s) descrito neste pedido.
[00031] Em algumas modalidades, a presente invenção fornece genes cas obtidos ou obteníveis pelo método(s) descrito neste pedido. Em algumas modalidades adicionais, a presente invenção fornece repetições de CRISPR obtidas ou obteníveis pelo método(s) descrito neste pedido. Ainda em modalidades adicionais, a presente invenção fornece combinações funcionais obtidas ou obteníveis pelo método(s) descrito neste pedido. Ainda em modalidades adicionais, a presente invenção fornece loci de CRISPR recombinantes compreendendo pelo menos uma CRISPR espaçadora ou pseudo CRISPR espaçadora, e/ou pelo menos um gene cas, e/ou pelo menos uma repetição de CRISPR e/ou uma combinação funcional.
[00032] Em algumas modalidades, a presente invenção fornece métodos para o uso de células, pelo menos uma CRISPR espaçadora ou pseudo CRISPR espaçadora, pelo menos um gene cas, pelo menos uma repetição de CRISPR, ou uma combinação funcional dos mesmos para modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo.
[00033] Em algumas modalidades adicionais, a presente invenção fornece culturas celulares compreendendo pelo menos uma célula, pelo menos uma CRISPR espaçadora ou pseudo CRISPR espaçadora, pelo menos um gene cas, pelo menos uma repetição de CRISPR ou uma combinação funcional para modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. Ainda em modalidades adicionais, a presente invenção fornece produtos alimentícios e/ou ração compreendendo culturas fornecidas neste pedido. Em algumas modalidades adicionais, a presente invenção fornece processos para preparação de um produto alimentício e/ou ração compreendendo culturas fornecidas neste pedido. Ainda em modalidades adicionais, a presente invenção fornece produtos alimentícios e/ou ração obtidos ou obteníveis pelos métodos fornecidos neste pedido. Em algumas modalidades preferenciais, a presente invenção fornece métodos para o uso das culturas fornecidas neste pedido para preparação de produtos alimentícios e/ou ração.
[00034] A presente invenção fornece ainda sequências nucleotídicas compreendendo ou consistindo das sequências apresentadas em quaisquer das SEQ ID NOS:7 a 10 e SEQ ID NOS:359 a 405, bem como variantes, fragmentos, homólogos e derivados dos mesmos. A presente invenção também fornece aminoácidos codificados pelas sequências nucleotídicas apresentadas neste pedido. Ainda em modalidades adicionais, a presente invenção fornece construtos e/ou vetores compreendendo uma ou mais das sequências nucleotídicas fornecidas neste pedido. A presente invenção também fornece células hospedeiras compreendendo pelo menos um dos construtos e/ou sequências nucleotídicas pedido.
[00035] Em algumas modalidades, um ou mais genes ou proteínas cas são usados em combinação com duas ou mais repetições de CRISPR. Em algumas modalidades adicionais, um ou mais genes ou proteínas cas e/ou duas ou mais repetições de CRISPR são derivados da mesma célula. Em algumas modalidades adicionais, um ou mais genes ou proteínas cas e duas ou mais repetições de CRISPR naturalmente coocorrem na mesma célula. Ainda em algumas modalidades adicionais, um ou mais genes ou proteínas cas são usados em combinação com uma ou mais CRISPR espaçadoras.
[00036] Em algumas modalidades, a CRISPR espaçadora(s) é derivada de um organismo diferente daquela célula a partir da qual um ou mais genes ou proteínas cas e/ou duas ou mais repetições de CRISPR são derivadas. Em algumas modalidades, o espaçador é obtido a partir de uma célula que é resistente a um ácido nucleico-alvo. Em algumas modalidades, a CRISPR espaçadora é uma sequência de ácido nucleico sintética. Em algumas modalidades adicionais, a CRISPR espaçadora(s) tem homologia ao ácido nucleico-alvo. Em algumas modalidades, a CRISPR espaçadora(s) tem identidade de 100% ao ácido nucleico-alvo durante pelo menos o tamanho do núcleo da CRISPR espaçadora.
[00037] Em algumas modalidades, um ou mais genes ou proteínas cas são usados em combinação com pelo menos uma ou mais CRISPR espaçadoras e pelo menos duas ou mais repetições de CRISPR. Em algumas modalidades, ácido nucleico-alvo ou produto de transcrição do mesmo é derivado a partir do DNA do bacteriófago. Ainda em modalidades adicionais, ácido nucleico-alvo ou produto de transcrição do mesmo é derivado a partir de pelo menos um plasmídeo. Em algumas modalidades adicionais, ácido nucleico-alvo ou produto de transcrição do mesmo é derivado a partir de pelo menos um elemento genético móvel de DNA. Em algumas modalidades, o ácido nucleico-alvo ou produto de transcrição do mesmo é derivado a partir de um elemento transponível e/ou uma sequência de inserção. Em algumas modalidades alternativas, ácido nucleico-alvo ou produto de transcrição do mesmo é derivado a partir de um gene de resistência antibiótico/antimicrobiano. Em algumas modalidades adicionais, o ácido nucleico-alvo ou produto de transcrição do mesmo é derivado a partir de um ácido nucleico que codifica pelo menos um fator de virulência. Em algumas modalidades preferenciais, o fator de virulência compreende toxinas, internalinas, hemolisinas e/ou outros fatores de virulência.
[00038] Em algumas modalidades da presente invenção, um ou mais genes cas e duas ou mais repetições de CRISPR são derivadas da mesma célula. Em algumas modalidades alternativas, um ou mais genes cas e duas ou mais repetições de CRISPR naturalmente coocorrem na mesma célula. Ainda em modalidades adicionais, as CRISPR espaçadoras são derivadas de um organismo diferente daquela célula da qual um ou mais genes cas e/ou duas ou mais repetições de CRISPR são derivados. Em algumas modalidades, a célula é uma célula-recipiente ou uma célula-hospedeira.
[00039] Em algumas modalidades, um ou mais genes ou proteínas cas e/ou duas ou mais repetições de CRISPR são derivados da mesma célula. Em algumas modalidades, os espaçadores são derivados de um organismo diferente daquela célula compreendendo um ou mais genes ou proteínas cas e/ou duas ou mais repetições de CRISPR.
[00040] Em algumas modalidades, um ou mais genes ou proteínas cas e duas ou mais repetições de CRISPR naturalmente coocorrem na mesma célula.
[00041] Em algumas modalidades, a modificação compreende a inserção de uma ou mais CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras na célula. Em algumas modalidades, a modificação compreende construção genética da CRISPR espaçadora da célula. Em algumas modalidades, o espaçador da célula tem homologia de 100% à CRISPR espaçadora ou pseudo CRISPR espaçadora do organismo. Em algumas modalidades, todo ou parte do espaçador na célula é modificado. Em algumas modalidades, a modificação compreende a modificação de um espaçador recombinante. Em algumas modalidades, a modificação ocorre através de mutação espontânea ou mutagênese. Em algumas modalidades, pelo menos uma ou mais CRISPR espaçadora(s) na célula são deletadas. Em algumas modalidades, pelo menos uma ou mais repetição(ões) de CRISPR na célula são deletadas. Em algumas modalidades, um ou mais genes cas são deletados. Em algumas modalidades, CRISPR e/ou um ou mais genes cas são deletados. Em algumas modalidades, um ou mais genes ou proteínas cas e/ou duas ou mais repetições de CRISPR na célula são deletados. Em algumas modalidades, as sequências nucleotídicas do gene cas e repetição de CRISPR são derivadas das mesmas ou diferentes cepas. Em algumas modalidades, as sequências nucleotídicas do gene cas e a repetição de CRISPR são derivadas da mesmas ou diferentes espécies.
[00042] Em algumas modalidades, as sequências nucleotídicas do gene cas e a repetição de CRISPR são derivadas dos mesmos ou diferentes gêneros. Em algumas modalidades, as sequências nucleotídicas do gene cas e a repetição de CRISPR são derivadas dos mesmos ou diferentes organismos.
[00043] Em algumas modalidades da presente invenção, o ácido nucleico-alvo no bacteriófago é uma sequência de ácido nucleico altamente conservada. Em algumas modalidades, o ácido nucleico- alvo no bacteriófago codifica uma proteína de especificidade para o hospedeiro. Em algumas modalidades adicionais, o ácido nucleico- alvo no bacteriófago codifica uma proteína que é essencial para sobrevivência, replicação ou crescimento do bacteriófago. Em algumas modalidades, o ácido nucleico-alvo no bacteriófago codifica uma helicase, uma primase, uma cabeça ou cauda estrutural proteica, uma proteína com um domínio conservado (por exemplo, holina, lisina, etc.) ou pelo menos uma sequência conservada entre genes de fago importantes.
[00044] Em algumas modalidades, o método para determinação da resistência de uma célula a um ácido nucleico-alvo ou um produto de transcrição do mesmo compreende a etapa adicional de comparação da sequência de uma ou mais CRISPR espaçadoras na célula com a sequência do ácido nucleico-alvo. Em algumas modalidades alternativas, o método para determinação da resistência de uma célula a um ácido nucleico-alvo ou um produto de transcrição do mesmo compreende a etapa adicional de determinação do perfil de resistência da célula.
[00045] Em algumas modalidades, a cultura é uma cultura iniciadora ou uma cultura probiótica.
[00046] A presente invenção também fornece "bactérias marcadas" que são resistentes ao fago (isto é, "mutantes insensíveis a bacteriófago"; "BIMs"). Em algumas modalidades, a presente invenção fornece bactérias compreendendo uma ou mais sequências que se originam de pelo menos um genoma de bacteriófago que está/estão integrado no locux de CRISPR das bactérias. Esta sequência derivada do fago fornece uma marcação, que é identificável pela sua posição e/ou sequência e/ou sequência adjacente.
[00047] Em algumas modalidades alternativas, a presente invenção fornece sequências duplicadas (por exemplo, repetições duplicadas de CRISPR) que se originam de uma bactéria parental e também estão integradas iterativamente, sequencialmente, simultaneamente ou substancialmente simultaneamente junto com a sequência que se origina a partir do genoma de bacteriófago.
[00048] Além disso, a presente invenção fornece métodos que facilitam a integração de uma ou mais sequências de bacteriófago diferentes no locux de CRISPR da cepa bacteriana. Em algumas modalidades, a integração de sequências de bacteriófago diferentes no locux de CRISPR da cepa bacteriana é um evento randômico. Em algumas modalidades alternativas, a integração de sequências de bacteriófago diferentes no locux de CRISPR da cepa bacteriana não é um evento randômico. Dessa forma, não é sempre o mesmo locux do genoma do bacteriófago que é integrado no locux de CRISPR da bactéria. Entretanto, uma vez que é integrado é mantido e dessa forma torna-se uma marcação robusta para marcar e/ou rastrear a bactéria. Consequentemente, uma ou mais sequências que se originam do genoma de bacteriófago não são somente novas para o locux de CRISPR da bactéria parental, mas são também uma marcação que é única para cada bactéria. Por isso, é fornecido neste pedido métodos para marcação (por exemplo, marcação) e/ou identificação de bactérias.
[00049] Em algumas modalidades, os métodos da presente invenção são "naturais" e não resultam na produção de organismos geneticamente modificados. Em algumas modalidades preferenciais, a presente invenção fornece métodos para marcação de bactérias compreendendo as etapas de: (a) exposição de uma bactéria parental a um bacteriófago; (b) seleção de um mutante insensível a bacteriófago; (c) comparação de um locux de CRISPR ou uma porção do mesmo da bactéria parental e o mutante insensível a bacteriófago; e (d) seleção de uma bactéria marcada compreendendo um fragmento de DNA adicional no locux de CRISPR que não está presente na bactéria parental.
[00050] A presente invenção também fornece bactérias marcadas obtidas usando os métodos da presente invenção. Em algumas modalidades, a presente invenção fornece culturas celulares compreendendo pelo menos uma cepa bacteriana marcada. Ainda em modalidades adicionais, a presente invenção fornece alimento e/ou ração compreendendo bactérias marcadas, incluindo, mas não limitadas a culturas celulares compreendendo tais bactérias marcadas.
[00051] A presente invenção também fornece métodos para preparação de alimento e/ou ração compreendendo pelo menos uma cepa bacteriana marcada. Em algumas modalidades, os métodos compreendem adição de pelo menos uma cepa bacteriana ou cultura celular marcada a alimento e/ou ração.
[00052] A presente invenção também fornece métodos para geração de variantes de CRISPR compreendendo as etapas de: (a) exposição de uma bactéria parental a um bacteriófago; (b) seleção de uma bactéria resistente a bacteriófago (isto é, "um mutante insensível a bacteriófago"); (c) comparação do locux de CRISPR ou uma porção do mesmo da bactéria parental e o mutante insensível a bacteriófago; (d) seleção de uma bactéria marcada compreendendo um fragmento de DNA adicional no locux de CRISPR que não está presente na bactéria parental; e (e) isolamento e/ou clonagem e/ou sequenciamento do fragmento de DNA adicional. A presente invenção também fornece as variantes de CRISPR produzidas usando os métodos apresentados neste pedido. Em algumas modalidades particularmente preferenciais, as variantes de CRISPR são cepas mutantes resistentes ao fago que têm um locux de CRISPR modificado com um espaçador adicional.
[00053] Em algumas modalidades adicionais, a presente invenção também fornece métodos para o uso de pelo menos uma sequência nucleotídica obtida ou obtenível a partir de um bacteriófago para marcação e/ou identificação de bactérias, em que a sequência nucleotídica está integrada no locux de CRISPR da bactéria parental.
[00054] Ainda em modalidades adicionais, a presente invenção fornece métodos para o uso de pelo menos uma sequência nucleotídica para marcação e/ou identificação de uma bactéria, em que a sequência nucleotídica é obtida ou obtenível por: (a) exposição de uma bactéria parental a um bacteriófago; (b) seleção de um mutante insensível a bacteriófago; (c) comparação de um locux de CRISPR ou uma porção do mesmo da bactéria parental e do mutante insensível a bacteriófago; e (d) seleção de uma bactéria marcada compreendendo um fragmento de DNA adicional no locux de CRISPR que não está presente na bactéria parental. Ainda em modalidades adicionais, a presente invenção fornece métodos para identificação de uma bactéria marcada compreendendo a etapa de seleção da bactéria para um fragmento de DNA adicional em um locux de CRISPR da bactéria também é fornecido em um aspecto adicional da presente invenção.
[00055] Ainda em modalidades adicionais, a presente invenção fornece métodos para identificação de bactérias marcadas compreendendo as etapas de: (a) seleção das bactérias para um fragmento de DNA adicional em um locux de CRISPR; (b) determinação da sequência nucleotídica do fragmento de DNA adicional; (c) comparação da sequência nucleotídica do fragmento de DNA adicional a um banco de dados de bactérias marcadas obtidas ou obteníveis pelo método da presente invenção; e (d) identificação de uma sequência nucleotídica no banco de dados de bactérias marcadas que combina com o fragmento de DNA adicional.
[00056] Em algumas modalidades preferenciais, a extremidade 5' e/ou a extremidade 3' do locux de CRISPR da bactéria parental é comparado às bactérias marcadas. Em algumas modalidades preferenciais alternativas, pelo menos a primeira repetição de CRISPR ou a primeira CRISPR espaçadora (por exemplo, o primeiro núcleo de CRISPR espaçadora) na extremidade 5' do locux de CRISPR é comparada. Ainda em modalidades adicionais, pelo menos a última repetição de CRISPR ou a última CRISPR espaçadora (por exemplo, o último núcleo da CRISPR espaçadora) na extremidade 3' do locux de CRISPR é/são comparada(s).
[00057] Em algumas modalidades preferenciais, os métodos da presente invenção compreendem a etapa de seleção de uma bactéria marcada compreendendo um fragmento de DNA adicional na extremidade 5' e/ou na extremidade 3' do locux de CRISPR que não está presente na bactéria parental. Em algumas modalidades alternativas, os métodos compreendem ainda a exposição da bactéria parental a dois ou mais bacteriófagos simultaneamente ou sequencialmente. Ainda em modalidades adicionais, o locux de CRISPR ou uma porção do mesmo da bactéria parental e o mutante insensível a bacteriófago são comparados pela amplificação do locux de CRISPR ou uma porção do mesmo da bactéria parental e/ou do mutante insensível a bacteriófago. Em algumas modalidades particularmente preferenciais, a amplificação é realizada usando PCR. Em algumas modalidades alternativas, o locux de CRISPR ou uma porção do mesmo da bactéria parental e o mutante insensível a bacteriófago são comparados pelo sequenciamento do locux de CRISPR ou uma porção do mesmo da bactéria parental e/ou do mutante insensível a bacteriófago. Em algumas modalidades preferenciais, o locux de CRISPR ou uma porção do mesmo da bactéria parental e do mutante insensível a bacteriófago são comparados pela amplificação e então sequenciamento do locux de CRISPR ou uma porção do mesmo da bactéria parental e/ou do mutante insensível a bacteriófago. Em algumas modalidades preferenciais alternativas, o fragmento de DNA adicional é de pelo menos 44 nucleotídeos em tamanho. Em algumas modalidades preferenciais adicionais, as bactérias marcadas compreendem dois ou três ou mais fragmentos de DNA adicionais são selecionadas. Ainda em modalidades adicionais, o fragmento de DNA adicional compreende pelo menos uma sequência nucleotídica que tem a identidade de pelo menos aproximadamente 95%, ou preferencialmente, identidade de 100% a uma repetição de CRISPR no locux de CRISPR da bactéria parental. Ainda em modalidades adicionais, o fragmento de DNA adicional compreende pelo menos uma sequência nucleotídica que tem identidade de pelo menos aproximadamente 95%, e em algumas modalidades, identidade preferencialmente de aproximadamente 100% a uma sequência nucleotídica no genoma do bacteriófago usado para a seleção da bactéria marcada. Em algumas modalidades, a presente invenção também fornece pelo menos um fragmento de DNA adicional que compreende uma primeira sequência nucleotídica e uma segunda sequência nucleotídica em que pelo menos uma das sequências nucleotídicas tem identidade de pelo menos aproximadamente 95%, ou em algumas modalidades preferenciais, identidade de aproximadamente 100% a uma sequência nucleotídica no genoma do bacteriófago usado para a seleção das bactérias marcadas.
[00058] Em algumas modalidades, a presente invenção fornece bactérias parentais que são adequadas para uso como culturas iniciadoras, culturas probióticas e/ou suplementos dietéticos. Em algumas modalidades, as bactérias parentais são selecionadas de qualquer gênero adequado, incluindo, mas não limitado a Escherichia, Shigella, Salmonella, Erwinia, Yersinia, Bacillus, Vibrio, Legionella, Pseudomonas, Neisseria, Bordetella, Helicobacter, Listeria, Agrobacterium, Staphylococcus, Streptococcus, Enterococcus, Clostridium, Corynebacterium, Mycobacterium, Treponema, Borrelia, Francisella, Brucella, Bifidobacterium, Brevibacterium, Propionibacterium, Lactococcus, Lactobacillus, Pediococcus, Leuconostoc e Oenococcus. Em algumas modalidades, o bacteriófago é selecionado a partir de uma família de vírus adequada, incluindo, mas não limitado a Corticoviridae, Cystoviridae, Inoviridae, Leviviridae, Microviridae, Myoviridae, Podoviridae, Siphoviridae e Tectiviridae. Em algumas modalidades, a presente invenção fornece culturas celulares que são selecionadas a partir de culturas iniciadoras, culturas probióticas e/ou suplementos dietéticos. Em algumas modalidades particularmente preferenciais, a presente invenção fornece métodos para identificação de bactérias marcadas, compreendendo a etapa de comparação de pelo menos um fragmento de DNA adicional a um banco de dados de sequência de bacteriófago e/ou um banco de dados de sequência bacteriana.
[00059] A presente invenção também fornece cepas de S. thermophilus compreendendo uma sequência obtida ou obtenível a partir de um bacteriófago, em que a sequência compreende a CRISPR espaçadora da cepa de Streptococcus thermophilus DGCC7778, mencionada neste pedido como SEQ ID NO:680 (caacacattcaacagattaatgaagaatac; SEQ ID NO:680).
[00060] Ainda em modalidades adicionais, a presente invenção fornece cepas de S. thermophilus compreendendo uma sequência obtida ou obtenível a partir de um bacteriófago, em que a sequência compreende SEQ ID NO:680 a jusante (por exemplo, diretamente a jusante) da primeira repetição de CRISPR em pelo menos um locux de CRISPR.
[00061] Em modalidades adicionais, a presente invenção fornece cepas de S. thermophilus compreendendo uma sequência obtida ou obtenível a partir de um bacteriófago, em que a sequência compreende CRISPR espaçadora (5'-3') da cepa de Streptococcus thermophilus DGCC7778 (tccactcacgtacaaatagtgagtgtactc; SEQ ID NO:681). Ainda em modalidades adicionais, a presente invenção fornece cepas de S. thermophilus compreendendo uma sequência obtida ou obtenível a partir de um bacteriófago, em que a sequência compreende SEQ ID NO:681 a jusante (por exemplo, diretamente a jusante) da primeira repetição de CRISPR em pelo menos um locux de CRISPR.
[00062] Ainda em modalidades adicionais, a presente invenção fornece cepas de S. thermophilus compreendendo uma sequência obtida ou obtenível a partir de um bacteriófago, em que a sequência compreende SEQ ID NO:683:
[00063] Sequência de CRISPRl (5'-3') da cepa de Streptococcus thermophilus DGCC7710-RH1. caaggacagttattgattttataatcactatgtgggtataaaaacgtcaaaatttcatttgag GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtcaacaattgcaacatcttataacccactt GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtgtttgacagcaaatcaagattcgaattgt GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaatgacgaggagctattggcacaacttaca GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACcgatttgacaatctgctgaccactgttatc GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACacacttggeaggcttattactcaacagcga GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACCCgttCCttgttCttttgttgtatCttttC GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACttcattcttccgtttttgtttgcgaatcct GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACgctggcgaggaaacgaacaaggcctcaaca GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACcatagagtggaaaactagaaacagattcaa GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACataatgccgttgaattacacggcaaggtca GTTTTTGTAC TCTCAAGATTTAAGTAACTGTACAACgag cgag c t cgaa a t a a t c 11 a a 11 a caa g GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACg 11 cgc t agcg t c a tgt gg t aac g t a 111 a GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACggcgtcccaatcctgattaatacttactcg GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaacacagcaagacaagaggatgatgctatg GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACcgacacaagaacgtatgcaagagttcaag GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACacaattcttcatccggtaactgctcaagtg GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaattaagggcatagaaagggagacaacatg GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAAC cgatatttaaaatcattttcataacttcat GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACgcagtatcagcaagcaagctgttagttact GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACataaactatgaaattttataatttttaaga GTTTTTGTACTCTCAAGATTTAAGTAAC TGTACAACa ataatttatggtatagcttaatatcattg GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtgcatcgagcacgttcgagtttaccgtttc GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtctatatcgaggtcaactaacaattatgct GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACa atcgCtcaaattctgttttaggtacattt GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaatcaatacgacaagagttaaaatggcctt GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACgc c t ag c tgt c c aa t c ca c ga a eg t gga t g GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACC aaccaacggcaacagctactttttacagt GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACataactgaaggataggagcttgtaaagtct GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtaatgctacatctcaaaggatgatcccaga GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaagtagttgatgacctctacaatggtttat GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACacctagaagcatttgagcgtatattgattg GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaa t tttgccccttctttgccccttgactag GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACa ccattagcaatcatttgtgcccattgagt GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAGTTtgattcaacataaaaagccagttcaattg aacttggcttt (SEQ ID NO:683)
[00064] Ainda em modalidades adicionais, a presente invenção fornece cepas de S. thermophilus compreendendo uma sequência obtida ou obtenível a partir de um bacteriófago, em que a sequência compreende SEQ ID NO:683 a jusante (por exemplo, diretamente a jusante) da primeira repetição de CRISPR em pelo menos um locux de CRISPR. Cepas de S. thermophilus compreendendo uma sequência obtida ou obtenível a partir de um bacteriófago, em que a sequência compreende SEQ ID NO:685 (isto é, 5'- TACGTTTGAAAAGAATATCAAATCAATGA-3').
[00065] Ainda em modalidades adicionais, a presente invenção fornece cepas de S. thermophilus compreendendo uma sequência obtida ou obtenível a partir de um bacteriófago, em que a sequência compreende SEQ ID NO:685 a jusante (por exemplo, diretamente a jusante) da primeira repetição de CRISPR em pelo menos um locux de CRISPR.
[00066] Em algumas modalidades, a presente invenção fornece métodos e composições que encontram uso no desenvolvimento e uso de combinações de cepa e rotações de culturas iniciadoras. Em algumas modalidades adicionais, o uso de uma ou mais CRISPR de BIMs simultaneamente em uma cultura iniciadora (isto é, uma combinação de BIMs) é fornecida. Em algumas modalidades adicionais, o uso de uma ou mais CRISPR de BIMs em um esquema de rotação é fornecido. Em algumas modalidades adicionais, o uso de uma ou mais combinações de CRISPR de BIMs em um esquema de rotação é fornecido.
[00067] A presente invenção também fornece meios para analisar CRISPRs do organismo-alvo, a fim de permitir comparações entre sequências espaçadoras contra o genoma de fago de biocontrole. Em algumas modalidades, a presente invenção fornece meios de predizer a virulência de fago e a seleção de pelo menos um fago de biocontrole contra pelo menos um micro-organismo-alvo.
[00068] A presente invenção também fornece métodos e composições para utilizar CRISPR-cas (isto é, mutagênese natural, em algumas modalidades preferenciais) para construir pelo menos uma CRISPR variante resistente ao fago de pelo menos um micro- organismo-alvo que então será usado para gerar o fago mutante que dribla a resistência CRISPR-cas através da mutação no fago correspondente a uma sequência selecionada a partir de sequências espaçadoras, sequências pseudoespaçadoras, sequência proximal, motivos de reconhecimento, etc., para aumentar a virulência do fago. Em algumas modalidades preferenciais, fagos com virulência aumentada encontram uso como agentes de biocontrole.
[00069] Em algumas modalidades, a presente invenção fornece composições e métodos adequados para a produção de fago tendo virulência aumentada, quando comparada ao fago parental. Em algumas modalidades, pelo menos um espaçador clonado é introduzido em um locux de CRISPR-cas ativo, para produzir uma variante de célula resistente ao fago para uso na geração do fago mutante. Em algumas modalidades preferenciais, os métodos compreendem a introdução de uma sequência que serve como um alvo específico de uma sequência genômica de fago (por exemplo, uma região que é altamente suscetível como um espaçador-alvo ou sequência de reconhecimento para incorporação no hospedeiro do espaçador). Em algumas modalidades adicionais, a presente invenção fornece métodos e composições para construção direta do fago, tal que a sequência genômica correspondente ao espaçador é consequentemente mutada.
[00070] A presente invenção também fornece métodos para dirigir a evolução de um dado fago usando a CRISPR de resistência ao fago adquirida de uma cepa hospedeira correspondente para criar um mais virulento, por isso eficaz, agente de biocontrole.
DESCRIÇÃO DOS DESENHOS
[00071] A figura 1 fornece uma apresentação esquemática que a integração de uma CRISPR espaçadora no locux de CRISPR de S. thermophilus fornece resistência contra um bacteriófago ao qual a CRISPR espaçadora mostra identidade. A DGCC7710 parental é sensível ao fago, e o BIM DGCC7710RH1 é resistente ao fago. O BIM DGCC7710RH1 tem um novo espaçador (Sn) no locux de CRISPR, que mostra identidade de 100% à sequência do fago. Como mostrado na etapa (B), a cepa é desafiada com o fago 858 e um mutante resistente ao fago é selecionado. Como mostrado na etapa (C), o locux de CRISPR I do mutante tem um espaçador adicional que compartilha identidade de 100% com a região 31.921 a 31.950 bp do fago.
[00072] A figura 2 fornece uma apresentação esquemática que a integração de uma CRISPR espaçadora no locux de CRISPR de S. thermophilus fornece resistência contra um bacteriófago ao qual a CRISPR espaçadora mostra identidade. A DGCC7710 parental é sensível ao fago, e o BIM DGCC7710RH2 é resistente ao fago. O BIM DGCC7710RH2 tem um novo espaçador (Sn) no locux de CRISPR, que mostra identidade de 100% à sequência do fago. Como mostrado na etapa (B), a cepa é desafiada com o fago 858 e um mutante resistente ao fago é selecionado. Como mostrado na etapa (C), o experimento foi independentemente repetido e outro mutante foi selecionado. O locux de CRISPR I do mutante tem um espaçador adicional (diferente daquele em RH1) que compartilha identidade de 100% com a região 17.125 a 17.244 bp do fago.
[00073] A figura 3 fornece uma representação gráfica ilustrando a preparação do construto CAS1KO no qual o gene cas1 é interrompido por recombinação homóloga.
[00074] A figura 4 fornece uma representação gráfica da preparação do construto RT usando uma enzima de restrição para gerar o construto RT a partir do construto S1S2. Há sítios de restrição BglI nas repetições que permitem à porção "média" do construto ser cortada. Seguinte a digestão enzimática, uma ligase foi usada para juntar as duas porções das extremidades, dessa forma gerando um novo construto que tem RT, mas sem espaçadores.
[00075] A figura 5 fornece uma representação gráfica da integração do construto RT.
[00076] A figura 6 fornece uma representação gráfica ilustrando a construção do construto S1S2 usando iniciadores específicos e reações PCR iterativas. O primeiro painel ilustra todos os iniciadores usados e a configuração das duas primeiras reações de PCR (reação #1 com iniciadores P1 e P2 e reação #2 com iniciadores P2 e P3). O segundo painel mostra os produtos de PCR obtidos a partir das duas primeiras reações de PCR, com o produto da reação #1 à esquerda e o produto da reação #2 à direita. O terceiro painel mostra a terceira reação de PCR, usando uma combinação dos produtos dos dois primeiros PCRs como o molde para a terceira reação de PCR, e o iniciador P1 da primeira reação junto com iniciador P4 da segunda reação. O quarto painel mostra o produto de PCR3, que tecnicamente gera o construto S1S2.
[00077] A figura 7 fornece uma representação gráfica dos detalhes do desenho do iniciador dos iniciadores 2 e 3, que contêm sequências- chave para o experimento, derivado de espaçadores idênticos às sequências do fago (os produtos de PCR derivados a partir destes iniciadores de PCR gerarão os espaçadores que fornecerão essencialmente resistência aos fagos).
[00078] A figura 8 fornece uma representação gráfica da integração do construto S1S2.
[00079] A figura 9 fornece uma representação gráfica mostrando um resumo do locux de CRISPR1 de S. thermophilus, os espaçadores recentemente adquiridos em mutantes resistentes ao fago, e sensibilidade ao fago correspondente. O locux de CRISPR1 de DGCC7710 (WT/tipo selvagem) está acima. A região de repetição/espaçadora de WT está no meio: repetições (losangos pretos), espaçadores (caixas numeradas cinzas), líder (L, caixa branca) e repetição terminal (T, losango preto). Abaixo, o conteúdo do espaçador no lado líder do locux nos mutantes resistentes ao fago é detalhado à esquerda, com espaçadores recentemente adquiridos (caixas brancas, S1-S14). À direita, a sensibilidade de cada cepa aos fagos 858 e 2972 é representada como um histograma da eficiência de plaqueamento (EOP), que é a taxa de contagem de placa de uma cepa mutante para aquelas de tipo selvagem.
[00080] A figura 10 fornece a construção da CRISPR espaçadora, inativação do gene cas e sensibilidade ao fago correspondente. I, mutante WTΦ858+S1S2; II, mutante WTΦ858+S1S2ΔCRISPR1 onde CRISPR1 foi deletada; III, mutante WTΦ858+S1S2::pR onde CRISPR1 foi deslocada e substituída com uma única repetição; IV, WTΦ2972+S4::pS1S2, mutante da cepa WTΦ2972+S4 onde CRISPRl foi deslocada e substituída com uma versão contendo S1 e S2; V, WTΦ858+S1S2::pcas5- com cas5 inativado; VI, WTΦ858+S1S2::pcas7- com cas7 inativado. pORI indica o plasmídeo integrado (12). A sensibilidade ao fago de cada cepa aos fagos 858 e 2972 é representada abaixo como um histograma da eficiência de plaqueamento (EOP).
[00081] A figura 11 fornece uma apresentação esquemática da construção do construto de S1S2.
[00082] A figura 12 fornece uma apresentação esquemática da construção de WTΦ858+SlS2ΔCRISPR1.
[00083] A figura 13 fornece um alinhamento da CRISPR espaçadora Sl com a região genômica correspondente do fago 858 e os dois fagos mutantes que driblaram a resistência de CRISPR da cepa WTΦ858+S1S2.
[00084] A figura 14 fornece uma representação esquemática da construção de um primeiro nível de variante resistente ao fago. Cada variante tem um espaçador adicional único na sua CRISPR. Espaçadores adicionais não são relacionados com cada um dos outros (por exemplo, cada um tem uma sequência diferente). Todos os espaçadores originam-se do fago P.
[00085] A figura 15 fornece uma representação esquemática do segundo nível de variantes resistentes ao fago apresentando resistência aumentada aos fagos. Variantes finais (A1.n e A2.n) originam-se da cepa A e têm uma integração sequencial de espaçadores adicionais em sua CRISPR, com todos os espaçadores que são diferentes de cada um dos outros e originam-se do fago P.
[00086] A figura 16 fornece uma representação esquemática do segundo nível de variantes resistentes ao fago apresentando resistência aumentada aos fagos. A variante final (A1pqr) origina-se da cepa A e tem uma integração sequencial de espaçadores adicionais em sua CRISPR originando-se de 3 fagos diferentes (por exemplo, de fago P, Q e R).
[00087] A figura 17 fornece uma representação esquemática do locux de CRISPR1 (painel A) e do locux de CRISPR3 (painel B) de cepas de S. thermophilus descritas nos Exemplos 7 ao Exemplo 16. Os nomes das cepas são dados no lado esquerdo da Figura. As flechas pretas representam repetições de CRISPR, "R" representa Repetição e "RT" representa Repetição Terminal. As flechas cinzas numeradas de 1 a 32 na parte A e de 1 a 12 na parte B representam CRISPRl espaçadoras e CRISPR3 espaçadoras, respectivamente, como estão em DGCC7710. As flechas brancas numeradas de S4 a S35 representam espaçadores adicionais CRISPR específicos para as cepas descritas.
[00088] A figura 18 fornece uma apresentação esquemática de uma modalidade da presente invenção, na qual uma sequência de direcionamento e uma repetição de CRISPR estão integradas em uma extremidade do locux de CRISPR. No painel A, o locux de CRISPR e elementos, incluindo repetições (R), espaçadores (S), líder a montante e reboque a jusante, com a repetição terminal (RT) adjacente ao reboque, e genes cas na vizinhança (4 genes cas denominados cas1 a cas4 neste pedido, não-desenhado na escala) são indicados. Os genes cas podem estar na extremidade, ou divididos e presentes em ambas as extremidades. Além disso, genes cas podem ser localizados em quaisquer das duas fitas de DNA. O Painel B mostra a sequência de fago, com um fragmento da sequência (Sn) que é usado como um espaçador adicional (por exemplo, sequência de direcionamento). O Painel C mostra a inserção de um novo espaçador (Sn) (por exemplo, sequência de direcionamento) em uma extremidade do locux de CRISPR (perto do líder neste exemplo na extremidade 5' do locux de CRISPR), entre duas repetições. O Painel D fornece uma comparação do conteúdo de locux de CRISPR entre a parental e a bactéria mutante (por exemplo, bactéria marcada), com um novo espaçador (Sn) (por exemplo, sequência de direcionamento) integrado em uma extremidade do locux de CRISPR (perto do líder neste exemplo), entre repetições. O novo espaçador (Sn) constitui a sequência de direcionamento que é específica para a bactéria mutante (por exemplo, bactéria marcada). Em algumas modalidades, o uso deste método resulta na adição de um ou mais espaçadores da sequência de fago.
[00089] A figura 19 fornece uma apresentação esquemática de uma modalidade da presente invenção, na qual duas sequências de marcação e duas repetições de CRISPR estão integradas em uma extremidade do locux de CRISPR. No Painel A, (A) locux e elementos de CRISPR, incluindo repetições (R), espaçadores (S), líder a montante e reboque a jusante, com a repetição terminal (RT) adjacente ao reboque, e genes cas na vizinhança (4 genes cas denominados cas1 a cas4 neste pedido, não desenhado na escala) são indicados. Os genes cas podem estar na extremidade, ou divididos e presentes em ambas as extremidades. Genes cas podem estar localizados em quaisquer das duas fitas de DNA. O Painel B mostra a sequência de fago em preto, com dois fragmentos da sequência (Sn e Sn') sendo usados como espaçadores adicionais (por exemplo, sequências de marcação). O Painel C mostra a inserção dos novos espaçadores (por exemplo, sequências de marcação) (Sn e Sn') na mesma extremidade do locux de CRISPR (perto do líder neste exemplo na extremidade 5'), cada um dos quais está entre duas repetições. O Painel B fornece uma comparação do conteúdo de locux de CRISPR entre a parental e a bactéria mutante (por exemplo, bactéria marcada), com dois novos espaçadores (Sn e Sn') integrados na mesma extremidade do locux de CRISPR (perto do líder neste exemplo na extremidade 5'), com cada um localizado entre repetições. Os novos espaçadores Sn e Sn' constituem a sequência de direcionamento que é específica para o mutante. Em algumas modalidades, este método resulta na adição de um ou mais espaçadores da sequência de fago.
[00090] A figura 20 fornece um gráfico mostrando a evolução da contagem de fago em leite contendo 107 pfu/ml de D2972 durante a fermentação com DGCC7710 (losangos pretos) ou com DGCC9836 (quadrados abertos). O leite foi 10% de leite em pó (p/v) em água. A temperatura de incubação foi 42°C.
[00091] A figura 21 fornece um gráfico mostrando a evolução da contagem de fago acumulada em WTphi2972+S20 e WTphi2972+S21 em leite contendo 107 pfu/ml de D2972 durante a fermentação inoculada com WTphi2972+S20 (tracejado) ou com WTphi2972+S21 (cinza claro) ou com ambos WTphi2972+S20 e WTphi2972+S21 (cinza escuro). O leite foi 10% de leite em pó (p/v) em água. A temperatura de incubação foi 420C.
[00092] A figura 22 fornece um símbolo ("Web Logo") para o motivo de CRISPR1 NNAGAAW (SEQ ID NO:696).
[00093] A figura 23 fornece um alinhamento de CRISPR protoespaçadoras selecionadas e regiões flanqueadoras e web logo para o motivo de CRISPR3 NGGNG (SEQ ID NO:723). Nesta Figura, S42 DGCC7710phi2972+S40phi3821+S41S42 (SEQ ID NO:724), S41 DGCC7710phi2972+S40phi3821+S41S42, (SEQ ID NO:699) S41 DGCC7710phi858+S1S2deltaCRISPR1phi848+S43 (SEQ ID NO:700), e S78 LMD- 9phi4241+S78 (SEQ ID NO: 701) são fornecidos.
DESCRIÇÃO DA INVENÇÃO
[00094] A presente invenção fornece métodos e composições relacionadas à modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. Em algumas modalidades preferenciais, a presente invenção fornece composições e métodos para o uso de um ou mais genes ou proteínas cas para modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. Em algumas modalidades, a presente invenção fornece métodos e composições que encontram uso no desenvolvimento e uso de combinações de cepa e rotações de culturas iniciadoras. Em modalidades adicionais, a presente invenção fornece métodos para marcação e/ou identificação de bactérias. Em algumas modalidades preferenciais, a presente invenção fornece métodos para o uso de loci de CRISPR para determinar a virulência potencial de um fago contra uma célula e o uso de CRISPR-cas para modular a sequência genética de um fago de nível de virulência aumentado. Ainda em modalidades adicionais, a presente invenção fornece meios e composições para o desenvolvimento e o uso de fagos como agentes de biocontrole.
[00095] Streptococcus thermophilus é uma espécie bacteriana Gram-positiva G+C baixo que é uma espécie-chave explorada na formulação de sistemas de cultura láctea para a produção de iogurte e queijo. Análises genômicas comparativas de cepas de S. thermophilus estreitamente relacionadas revelaram anteriormente que polimorfismo genético ocorre principalmente em loci hipervariáveis, tais como operons eps e rps, bem como dois loci de repetições palindrômicas curtas agrupadas regularmente espaçadas (CRISPR) (Vide, por exemplo, Jansen et al., Mol. Microbiol., 43: 1565 [2002]; Bolotin et al., Microbiol., 151:2551 [2005]; e Bolotin et al., Nat. Biotechnol., 22:1554 [2004]). Como descrito neste pedido em maiores detalhes, loci de CRISPR tipicamente consistem de várias repetições diretas não- contíguas separadas por intervalos de sequências variáveis chamadas espaçadores, e são muitas vezes adjacentes a genes cas (associados a CRISPR). Embora a função de loci de CRISPR não tenha sido estabelecida biologicamente, análises in silico dos espaçadores revelaram homologia de sequência com elementos estranhos, incluindo bacteriófagos e sequências plasmídicas (Vide, por exemplo, Bolotin et al., Microbiol., supra; Mojica et al., supra; e Pourcel et al., supra). Com base exclusivamente em análises in silico, várias hipóteses foram apresentadas propondo papéis para CRISPR e genes cas, que incluem o fornecimento de imunidade contra elementos genéticos estranhos através de um mecanismo com base em RNA de interferência (Vide, Makarova et al., Biol. Direct., 1:7 [2006]). Entretanto, não é destinado que a presente invenção seja limitada a qualquer mecanismo e/ou meios de ação particulares.
[00096] Estratégias atuais usadas na indústria para minimizar a infecção por bacteriófagos e a falha resultante de culturas bacterianas, inclui o uso de: (i) culturas iniciadoras mistas; e (ii) uso de alternância de cepas tendo diferentes perfis de suscetibilidade ao fago (isto é, rotação de cepa). Tradicionalmente, culturas iniciadoras usadas na indústria láctea são misturas de cepas bacterianas de ácidos lácticos. A composição complexa das culturas iniciadoras variadas assegura que certo nível de resistência ao ataque de fago é fornecido. Entretanto, subcultura repetida de culturas de cepas mistas leva a modificações imprevisíveis na distribuição das cepas individuais e eventualmente muitas vezes à dominância da cepa indesejada. Isto por sua vez pode levar à suscetibilidade aumentada a ataque de fago e risco de falhas de fermentação.
[00097] A rotação de cepas bacterianas selecionadas que são sensíveis aos fagos diferentes é outra abordagem atualmente usada para limitar o desenvolvimento de fago. Entretanto, é difícil e complicado identificar e selecionar um número suficiente de cepas que tenham perfis de tipo de fago diferentes para fornecer um programa de rotação eficiente e fiável. Além disso, o uso contínuo de cepas necessita de monitorização cuidadosa para novos fagos contagiosos e a necessidade de substituir rapidamente uma cepa infectada com uma cepa bacteriana resistente. Em centros de produção onde as grandes quantidades de volume de culturas iniciadoras são preparadas muito antes do uso, uma resposta tão rápida não é normalmente possível. Dessa forma, são feitas várias tentativas para melhorar a resistência de culturas para uso na indústria.
[00098] Além disso, embora fosse útil ter culturas iniciadoras que são marcadas tal que a sua origem possa ser determinada, isto não foi feito. De fato, embora seja factível inserir um oligonucleotídeo sintético em uma cepa para marcá-la ou etiquetá-la, usando tecnologias de DNA recombinante, a cepa marcada seria considerada um organismo geneticamente modificado e pode ficar em oposição a questões reguladoras em aplicações comerciais. Dessa forma, há uma necessidade na técnica por métodos naturais e composições adequadas para introdução de uma sequência única em bactérias que possam ser usadas para identificar e/ou rastrear bactérias.
[00099] Bacteriófagos são indiscutivelmente a entidade biológica mais abundante no planeta (Vide, Breitbart and Rohwer, Trends Microbiol., 13:278 [2005]). Sua distribuição ubíqua e abundância têm um impacto importante na ecologia microbiana e evolução de genomas bacterianos (Vide, Chibani-Chennoufi et al., J. Bacterid., 186:3677 [2004]). Consequentemente, as bactérias desenvolveram vários mecanismos de defesa natural que visam etapas diversas do ciclo de vida do fago, notavelmente bloqueando adsorção, prevenindo injeção de DNA, restringindo a entrada de DNA e sistemas de infecção abortivos. Estas barreiras antivirais também podem ser construídas e manipuladas para controlar melhor populações de fago (Vide, por exemplo, Chibani-Chennoufi et al., supra; e Sturino and Klaenhammer, Nat. Rev. Microbiol., 4:395 [2006]).
[000100] Bactérias numerosas foram selecionadas por seres humanos e usadas extensivamente para processos de biotecnologia e fermentação. Infelizmente, as bactérias domesticadas usadas em aplicações industriais são muitas vezes suscetíveis a ataque de fago, incluindo aqueles gêneros e espécies largamente usados como culturas lácteas (Vide, Brussow, Ann. Rev. Microbiol., 55:283 [2001]). Consequentemente, a indústria desenvolveu várias estratégias para combater o fago com base na diversidade de cepa, mutantes insensíveis a bacteriófago, e plasmídeos que carregam mecanismos de resistência ao fago.
Definições
[000101] A menos que definido de outra maneira neste pedido, todos os termos técnicos e científicos usados neste pedido têm a mesma significação que comumente entendido por um versado ordinário na técnica à qual esta invenção pertence. Embora quaisquer métodos e materiais similares ou equivalentes àqueles descritos neste pedido encontrem uso na prática do que é descrito neste pedido, métodos e materiais exemplares são descritos neste pedido. Como usado neste pedido, os termos singulares "um", "uma", "o" e "a" incluem a referência plural a menos que o contexto claramente indique de outra maneira. A menos que de outra maneira indicada, ácidos nucleicos são escritos da esquerda para direita em orientação 5' a 3'; sequências de aminoácidos são escritas da esquerda para direita em orientação amino a carbóxi, respectivamente. Deve ser entendido que esta invenção não é limitada à determinada metodologia, protocolos e reagentes descritos, como estes podem variar, dependendo do contexto são usados por aqueles versados na técnica.
[000102] É destinado que toda limitação numérica máxima dada em todas as partes deste Pedido de Patente inclui toda limitação numérica menor, como se tais limitações numéricas menores fossem expressamente escritas neste pedido. Toda limitação numérica mínima dada em todas as partes deste Pedido de Patente incluirá toda limitação numérica maior, como se tais limitações numéricas maiores fossem expressamente escritas neste pedido. Toda faixa numérica dada em todas as partes deste Pedido de Patente incluirá toda faixa numérica mais estreita que está incluída em tal faixa numérica mais larga, como se tais faixas numéricas mais estreitas fossem todas expressamente escritas neste pedido.
[000103] Como usado neste pedido, o termo "que ocorre naturalmente" refere-se a elementos e/ou processos que ocorrem na natureza.
[000104] Como usado neste pedido, os termos "construto", "conjugado", "cassete" e "híbrido", incluem uma sequência nucleotídica diretamente ou indiretamente ligada a outra sequência (por exemplo, uma sequência regulatória, tal como um promotor). Em algumas modalidades, a presente invenção fornece construtos compreendendo uma sequência nucleotídica operacionalmente ligada a tal sequência regulatória. O termo "operacionalmente ligado" refere-se a uma justaposição em que os componentes descritos estão em uma relação que os permite funcionar em sua maneira desejada. Uma sequência regulatória "operacionalmente ligada" a uma sequência de codificação é ligada de tal modo que a expressão da sequência de codificação é realizada sob condição compatível com às sequências controle. Como usado neste pedido, o termo "sequências regulatórias" inclui promotores e potencializadores e outros sinais de regulação de expressão. Como usado neste pedido, o termo "promotor" é usado no sentido normal da técnica, por exemplo, um sítio de ligação de RNA polimerase. Em algumas modalidades, os construtos compreendem ou expressam um marcador, que permite a seleção do construto de sequência nucleotídica em, por exemplo, uma bactéria. Vários marcadores existem que podem ser usados, por exemplo, aqueles marcadores que fornecem a resistência antibiótica/antimicrobiana.
[000105] Em algumas modalidades, o construto compreende um vetor (por exemplo, um plasmídeo). Em algumas modalidades adicionais, a presente invenção fornece vetores compreendendo um ou mais dos construtos ou sequências descritas neste pedido. Como usado neste pedido, o termo "vetor" inclui vetores de expressão, vetores de transformação e vetores de transporte. O termo "vetor de transformação" significa um construto capaz de ser transferido de uma entidade a outra entidade, que pode ser da mesma espécie ou pode ser de uma espécie diferente. Os construtos que são capazes de ser transferidos de uma espécie a outra são às vezes tratados como "vetores de transporte". Em algumas modalidades, os vetores são transformados em uma célula-hospedeira adequada como descrito neste pedido. Em algumas modalidades, os vetores são plasmídeos ou vetores de fago fornecidos com uma origem de replicação, opcionalmente um promotor para a expressão do polinucleotídeo, e opcionalmente um regulador do promotor. Em algumas modalidades, os vetores contêm uma ou mais sequências nucleotídicas de marcador selecionável. Os sistemas de seleção mais adequados para micro-organismos industriais são aqueles formados pelo grupo de marcadores de seleção que não necessitam de uma mutação no organismo hospedeiro. Em algumas modalidades, os vetores são usados in vitro (por exemplo, para a produção de RNA ou usados para transfectar ou transformar uma célula-hospedeira). Em algumas modalidades, polinucleotídeos são incorporados em um vetor recombinante (tipicamente um vetor replicável), tal como um vetor de clonagem ou expressão. O vetor encontra uso na replicação do ácido nucleico em uma célula-hospedeira compatível.
[000106] A introdução de um ácido nucleico (por exemplo, um fago, construto ou vetor) em uma célula pode ser efetuada por vários métodos. Por exemplo, em algumas modalidades, transdução, transformação, transfecção por fosfato de cálcio, transfecção mediada por DEAE-dextrana, transfecção mediada por lipídio catiônico, eletroporação, transdução ou infecção podem encontrar uso. De fato, qualquer método adequado conhecido na técnica encontra uso na presente invenção. Em algumas modalidades, células contendo ácido nucleico exógeno (introduzido por meio de fago, construto, ou um vetor) são selecionadas para usar qualquer método adequado conhecido na técnica.
[000107] Ensinamentos na transformação de células são bem documentados na técnica, por exemplo, vide Sambrook et al. (Molecular Cloning: A Laboratory Manual, 2a edição, 1989, Cold Spring Harbor Laboratory Press) e Ausubel et al., Current Protocols in Molecular Biology (1995), John Wiley & Sons, Inc.
[000108] No contexto de introdução de um ácido nucleico em uma célula, em algumas modalidades, é preferencial que o termo "introdução" signifique uma ou mais de transformação, transfecção, conjugação ou transdução. Em algumas modalidades particularmente preferenciais, cepas bacterianas (por exemplo, cepas bacterianas parentais, cepas bacterianas variantes, etc.) são "expostas" a pelo menos um fago, tal que o ácido nucleico de fago seja introduzido nas células da cepa bacteriana.
[000109] Como usado neste pedido, os termos "sequência de ácido nucleico", "sequência nucleotídica" e "ácido nucleico" se referem a qualquer sequência de ácido nucleico, incluindo DNA, RNA, genômica, sintética, recombinante (por exemplo, cDNA). É destinado que os termos englobem sequências de dupla fita e/ou fita simples, se representando a fita de senso ou antissenso ou combinações das mesmas. As sequências de ácidos nucleicos recombinantes são preparadas pelo uso de quaisquer técnicas de DNA recombinante adequadas. Em algumas modalidades, como descrito neste pedido, as sequências de ácidos nucleicos fornecidas incluem sequências gênicas que codificam CRISPR, Cas, e outras sequências. De fato, como usado no contexto, a presente invenção engloba sequências de ácidos nucleicos que codificam várias sequências CRISPR, incluindo, mas não limitadas a espaçadores, pseudoespaçadores, líderes, etc., bem como sequências cas, e outras sequências de ácidos nucleicos bacterianas e de fago ("bacteriófago").
[000110] Os termos "codificação de molécula de ácido nucleico", "codificação de sequência de ácido nucleico", "codificação de sequência de DNA" e "codificação de DNA," se referem à ordem ou sequência de desoxirribonucleotídeos ao longo de uma fita de ácido desoxirribonucleico. A ordem destes desoxirribonucleotídeos determina a ordem de aminoácidos ao longo da cadeia polipeptídica (proteína). A sequência de DNA codifica dessa forma para a sequência de aminoácido.
[000111] Como usado neste pedido no contexto de introdução de uma sequência de ácido nucleico em uma célula, o termo "introduzido" refere-se a qualquer método adequado para transferir a sequência de ácido nucleico para a célula. Tais métodos para introdução incluem, mas não são limitados a fusão de protoplasto, transfecção, transformação, conjugação e transdução. Em algumas modalidades particularmente preferenciais, o ácido nucleico é introduzido em células-recipientes na infecção das células pelo bacteriófago(s).
[000112] Em algumas modalidades, as sequências de ácidos nucleicos e ácidos nucleicos fornecidos neste pedido são isolados ou substancialmente purificados. Por "isolado" ou "substancialmente purificado" é destinado que as moléculas de ácidos nucleicos, ou fragmentos biologicamente ativos ou variantes, homólogos, ou derivados dos mesmos são substancialmente ou essencialmente livres de componentes normalmente encontrados em associação com o ácido nucleico em seu estado natural. Tais componentes incluem, mas não são limitados a outro material celular, meios de cultura, materiais de produção recombinante, e vários produtos químicos usados para sintetizar quimicamente os ácidos nucleicos.
[000113] Em algumas modalidades, uma sequência de ácido nucleico "isolada" ou ácido nucleico é tipicamente livres de sequências de ácidos nucleicos que flanqueiam o ácido nucleico de interesse no DNA genômico do organismo do qual o ácido nucleico foi derivado (por exemplo, sequências de codificação presentes nas extremidades 5' ou 3'). Entretanto, a molécula pode incluir algumas bases adicionais ou porções que não afetam deleteriamente as características básicas da composição.
[000114] Como usado neste pedido, o termo "modificação" refere-se a modificações feitas no ácido nucleico e/ou sequências de aminoácidos. Em algumas modalidades, modificações são realizadas usando métodos de engenharia genética (por exemplo, recombinante), enquanto em outras modalidades, as modificações são feitas usando mecanismos genéticos que ocorrem naturalmente. É destinado que toda ou parte de uma sequência será modificada usando os métodos da presente invenção. Em algumas modalidades preferenciais, os ácidos nucleicos modificados incluem uma ou mais CRISPR espaçadoras que ocorrem naturalmente ou produzidos recombinantemente, genes ou proteínas cas, repetições de CRISPR, loci de CRISPR, bem como ácidos nucleicos de bacteriófago. Qualquer método adequado conhecido na técnica encontra uso na presente invenção, incluindo mas não limitado a uso de PCR, clonagem, mutagênese sítio dirigida, etc. De fato, os conjuntos comercialmente disponíveis encontram uso na presente invenção. Em algumas modalidades, oligonucleotídeos sintéticos são usados. Em algumas modalidades, métodos, tais como recombinação homóloga, encontram uso (por exemplo, para inserção ou deleção de CRISPR espaçadoras). Em algumas modalidades, a engenharia genética inclui ativação de uma ou mais sequências de ácidos nucleicos (por exemplo, loci de CRISPR, repetições de CRISPR, espaçadores de CRISPR, genes ou proteínas cas, combinações funcionais de genes ou proteínas cas e repetições de CRISPR, ou combinações dos mesmos).
[000115] Em algumas modalidades, uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras são inseridas em pelo menos um locux de CRISPR. Em algumas modalidades adicionais, a modificação não interrompe um ou mais genes cas de pelo menos um locux de CRISPR. Em outras modalidades, um ou mais genes cas permanecem intactos. Em algumas modalidades adicionais, a modificação não interrompe uma ou mais repetições de CRISPR de pelo menos um locux de CRISPR. Em algumas modalidades, uma ou mais repetições de CRISPR permanecem intactas. Em algumas modalidades adicionais, uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras são inseridas em ou dentro de pelo menos um locux de CRISPR. Em algumas modalidades adicionais, uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras são inseridas na extremidade 5' de pelo menos um locux de CRISPR.
[000116] Em algumas modalidades, a modificação compreende a inserção de pelo menos uma CRISPR espaçadora ou pseudo CRISPR espaçadoras em uma célula (por exemplo, uma célula-recipiente). Em algumas outras modalidades, a modificação compreende a inserção de uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras (em, por exemplo, para modificar ou substituir) um aou mais CRISPR espaçadoras de uma célula-recipiente. Em algumas modalidades, as CRISPR espaçadoras da célula são as mesmas, enquanto em outras modalidades, são diferentes. Em algumas modalidades, a modificação compreende a inserção de pelo menos uma CRISPR espaçadora ou pseudo CRISPR espaçadora de um organismo doador em uma célula-recipiente. Em algumas modalidades adicionais, a modificação compreende a inserção de uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras de um organismo doador em uma célula-recipiente sob condições adequadas para modificar ou substituir uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras da célula-recipiente. Em algumas modalidades, uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras de um organismo doador são inseridas em uma ou mais, preferencialmente, duas ou mais repetições de CRISPR da célula. Em algumas modalidades preferenciais, pelo menos uma combinação de repetição-cas de CRISPR funcional permanece intacta na célula.
[000117] Em algumas modalidades adicionais, a inserção ocorre adjacente a uma ou mais (preferencialmente duas ou mais) CRISPR espaçadoras ou pseudo espaçadoras. Como usado neste pedido, o termo "adjacente" significa "próximo a" em seu sentido mais amplo e inclui "diretamente adjacente". Dessa maneira, em algumas modalidades, uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras de um organismo são inseridas "diretamente adjacentes" a uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras da célula-recipiente, (isto é, CRISPR espaçadora(s) ou pseudo CRISPR espaçadora(s) são inseridas tal que não haja nenhum nucleotídeo interveniente entre os espaçadores).
[000118] Em algumas modalidades adicionais, CRISPR espaçadora(s) ou pseudo CRISPR espaçadora(s) são inseridas tal que haja pelo menos aproximadamente 2, aproximadamente 3, aproximadamente 4, aproximadamente 5, aproximadamente 6, aproximadamente 7, aproximadamente 8, aproximadamente 9, aproximadamente 10, aproximadamente 15, aproximadamente 20, aproximadamente 25, aproximadamente 30, aproxi-madamente 35, aproximadamente 40, aproximadamente 45, aproximadamente 50, aproximadamente 55, aproximadamente 60, aproximadamente 65, aproximadamente 70, aproximadamente 75, aproximadamente 80, apro-ximadamente 85, aproximadamente 90, aproximadamente 95, aproximada- mente 100, aproximadamente 200, aproximadamente 300, aproximadamente 400, aproximadamente 500, aproximadamente 600, aproximadamente 700, aproximadamente 800, aproximadamente 900, aproximadamente 1000, aproximadamente 10.000, aproximadamente 100.000, ou aproximadamente 1.000.000 ou mais nucleotideos intervenientes entre os espacadores.
[000119] Em algumas modalidades adicionais, o nucleotídeo interveniente menciona-se como uma "sequência líder". Estes termos são usados intercambiavelmente neste pedido. A sequência líder pode ser de um tamanho diferente em bactérias diferentes. Em algumas modalidades, a sequência líder é pelo menos aproximadamente 20, aproximadamente 25, aproximadamente 40, aproximadamente 55, aproximadamente 70, aproximadamente 85, aproximadamente 30, aproximadamente 45, aproximadamente 60, aproximadamente 75, aproximadamente 90, aproximadamente 35 aproximadamente 50 aproximadamente 65 aproximadamente 80 aproximadamente 95 aproximadamente 100, aproximadamente 200, aproximadamente 300, aproximadamente 400, ou aproximadamente 500 ou mais nucleotídeos em tamanho. Em algumas modalidades preferenciais, a sequência líder está entre o último gene cas (na extremidade 3') e a primeira repetição de CRISPR (na extremidade 5') do locux de CRISPR. Em algumas modalidades, a sequência líder está entre aproximadamente 20 a 500 nucleotídeos em tamanho.
[000120] Em algumas modalidades, uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras de um organismo doador são inseridas adjacentes a um ou mais genes cas de uma célula-recipiente, em que os genes cas são os mesmos ou diferentes. Em algumas modalidades adicionais, uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras de um organismo doador são inseridas adjacentes aos mesmos espaçadores ou diferentes da célula-recipiente.
[000121] Em outra modalidade, uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras - tais como uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras de um organismo doador - são cada uma inseridas adjacentes às mesmas ou diferentes repetições de CRISPR da célula. Em outra modalidade, uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras - tais como uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras de um organismo doador - são cada uma inseridas adjacentes aos mesmos ou diferentes genes cas da célula-recipiente.
[000122] Em algumas modalidades adicionais, a sequência de uma ou mais CRISPR espaçadora(s) de um organismo doador é fornecida sob condições que a célula-recipiente é modificada tal que a CRISPR espaçadora tenha a homologia à CRISPR espaçadora ou pseudo CRISPR espaçadora do organismo doador. Em algumas modalidades, a CRISPR espaçadora tem homologia de 100% ao CRISPR espaçadora do organismo doador.
[000123] Em algumas modalidades, a CRISPR espaçadora(s) ou pseudo CRISPR espaçadoras compreendem DNA ou RNA de origem genômica, sintética ou recombinante. Em algumas modalidades, a CRISPR espaçadora(s) ou pseudo CRISPR espaçadoras são dupla fita, enquanto em outras modalidades, são de fita simples, se representando a fita de senso ou antissenso ou combinações das mesmas. É contemplado que a CRISPR espaçadora(s) ou pseudo CRISPR espaçadoras são preparadas pelo uso de técnicas de DNA recombinante (por exemplo, DNA recombinante), como descrito neste pedido.
[000124] Em algumas modalidades, a modificação compreende a inserção de uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras de um organismo doador que é substancialmente resistente a um ácido nucleico-alvo ou um produto de transcrição do mesmo em um ou mais loci de CRISPR de uma célula substancialmente sensível. Em algumas modalidades, a inserção ocorre em ou entre uma combinação funcional de pelo menos duas repetições de CRISPR e pelo menos um gene cas em uma célula substancialmente sensível. Em algumas modalidades, a modificação compreende a modificação (por exemplo, mutação) do DNA de uma célula-recipiente (por exemplo, DNA plasmidial ou DNA genômico), tal que um ou mais genes cas são criados no DNA da célula. Em algumas modalidades, os genes cas são clonados em um construto, um plasmídeo ou um vetor, etc., que é então transformado na célula, usando qualquer método adequado.
[000125] Em algumas modalidades, a modificação compreende modificação (por exemplo, mutação) do DNA de uma célula-recipiente (por exemplo, tal como DNA plasmidial ou DNA genômico), tal que uma ou mais, preferencialmente, duas ou mais repetições de CRISPR são criadas no DNA da célula. Em algumas modalidades, as repetições de CRISPR são clonadas em um construto, um plasmídeo ou um vetor, etc., que é então transformado na célula, usando qualquer método adequado.
[000126] Em algumas modalidades adicionais, a modificação compreende a modificação (por exemplo, mutação) do DNA de uma célula-recipiente (por exemplo, DNA plasmidial ou DNA genômico), tal que uma ou mais combinações funcionais de repetições de cas- CRISPR são criadas no DNA da célula. Em algumas modalidades, combinações funcionais de repetição cas-CRISPR podem ser clonadas em um construto, um plasmídeo ou um vetor, que é então transformado na célula, usando qualquer método adequado.
[000127] Em algumas modalidades, a modificação compreende a modificação (por exemplo, mutação) do DNA de uma célula-recipiente (por exemplo, DNA plasmidial ou DNA genômico), tal que uma ou mais CRISPR espaçadoras são criadas no DNA da célula. Em algumas modalidades, as CRISPR espaçadoras podem ser clonadas em um construto, um plasmídeo ou um vetor, que então é transformado na célula, usando qualquer método adequado. Em algumas modalidades preferenciais, uma CRISPR espaçadora é flanqueada por duas repetições de CRISPR (isto é, uma CRISPR espaçadora tem pelo menos uma repetição de CRISPR em cada lado).
[000128] Em algumas modalidades, a modificação compreende a inserção de uma ou mais CRISPR espaçadoras (por exemplo, CRISPR espaçadoras heterólogas) na vizinhança de (por exemplo, adjacente/diretamente adjacente) um ou mais genes cas e/ou a sequência líder. Dessa maneira, em algumas modalidades, a organização do locux de CRISPR que ocorre naturalmente é mantida após inserção de uma ou mais CRISPR espaçadoras.
[000129] Como usado neste pedido, o termo "ácido nucleico-alvo" refere-se a qualquer sequência de ácido nucleico ou produto de transcrição do mesmo, contra o qual a resistência em uma célula (por exemplo, uma célula-recipiente) é modulada. Em algumas modalidades, a resistência é dirigida contra sequência de ácido nucleico-alvo per se. Vantajosamente, isto confere resistência a uma célula contra um organismo doador do qual o ácido(s) nucleico alvo é derivável. Dessa maneira, em algumas modalidades, a inserção de uma pseudo CRISPR espaçadora derivada de um bacteriófago ou uma CRISPR espaçadora(s) que é/são complementar ou homóloga a uma ou mais pseudo CRISPR espaçadora(s) em uma célula-recipiente confere resistência ao bacteriófago. Dessa maneira, em algumas modalidades preferenciais, a inserção entre duas repetições de CRISPR de uma pseudo CRISPR espaçadora derivada de um bacteriófago ou CRISPR espaçadora(s) que é/são complementar ou homóloga a uma ou mais pseudo CRISPR espaçadora(s) em uma célula-recipiente conferem resistência ao bacteriófago. Em um aspecto adicional, é fornecido um método para modular a resistência de uma célula-recipiente contra um ácido nucleico-alvo ou um produto de transcrição do mesmo.
[000130] A presente invenção também fornece métodos para determinação do perfil de resistência de uma célula contra um ácido nucleico-alvo. Como usado neste pedido, o termo "perfil de resistência" significa uma ou mais entidades contra as quais a célula é sensível ou resistente. Consequentemente, em algumas modalidades, o perfil de resistência de uma célula reflete que a célula é resistente a um primeiro bacteriófago, sensível a um segundo bacteriófago, resistente a um primeiro elemento genético móvel, e sensível a um primeiro gene de resistência antibiótico, etc.
[000131] Em algumas modalidades, um ou mais genes ou proteínas cas, uma ou mais repetições de CRISPR, um ou mais genes cas, uma ou mais combinações funcionais de repetição de cas-CRISPR, uma ou mais CRISPR espaçadoras e/ou uma ou mais CRISPR espaçadoras etc., em uma célula são detectados e/ou sequenciados para predizer/determinar o perfil de resistência provável de uma determinada célula. Em algumas outras modalidades, uma ou mais CRISPR espaçadoras em uma célula são detectadas ou sequenciadas para predizer/determinar o perfil de resistência provável de uma determinada célula. Métodos de detecção adequados incluem, mas não são limitados a PCR, hibridização DNA-DNA, hibridização DNA- RNA, microarranjos de DNA, etc. De fato, é destinado que qualquer método adequado encontrará uso na presente invenção. Em modalidades adicionais, o perfil de resistência provável de uma determinada célula bacteriana a um ou mais bacteriófagos é usado como um preditor lisotípico para seleção microbiana. Em algumas modalidades adicionais, um ou mais genes Cas e/ou uma ou mais repetições de CRISPR são sequenciadas além de uma ou mais CRISPR espaçadoras, a fim de verificar a compatibilidade da combinação de repetição do gene cas CRISPR ou identificar novos pares de combinações cas/repetição compatíveis.
[000132] Como usado neste pedido, o termo "modulação da resistência" refere-se a supressão, redução, diminuição, indução, conferência, restauração, elevação, aumento ou de outra maneira afetar a resistência de uma célula a um ácido nucleico-alvo, como tomado no contexto.
[000133] Como usado neste pedido, o termo "resistência" não se significa implicar que uma célula é 100% resistente a um ácido nucleico-alvo ou um produto de transcrição do mesmo, mas inclui células que são tolerantes ao ácido nucleico-alvo ou um produto de transcrição do mesmo.
[000134] Como usado neste pedido o termo "resistência ao ácido nucleico-alvo ou produto de transcrição do mesmo" significa que a resistência é conferida contra uma célula ou um organismo (por exemplo, fago) que compreende ou produz o ácido nucleico-alvo ou produto de transcrição do mesmo. Em algumas modalidades, o componente mínimo necessário para conferir imunidade ou resistência contra um ácido nucleico-alvo ou produto de expressão do mesmo é pelo menos um gene cas (ou uma proteína Cas) e pelo menos duas repetições de CRISPR flanqueando um espaçador.
[000135] Em algumas modalidades, a presente invenção fornece métodos para modulação (por exemplo, conferindo ou aumentando) da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo compreendendo as etapas de: identificação de uma sequência (por exemplo, uma sequência conservada) em um organismo (preferencialmente, uma sequência essencial para a função ou sobrevivência do organismo); preparação de uma CRISPR espaçadora que compreende uma sequência homóloga (por exemplo, 100% idêntica), à sequência identificada; preparação de um ácido nucleico compreendendo pelo menos um gene cas e pelo menos duas repetições de CRISPR em conjunto com a CRISPR espaçadora; e (iv) transformação de uma célula com o ácido nucleico, portanto, para produzir a célula resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo.
[000136] Como usado neste pedido, o termo "sequência conservada" no contexto de identificação de uma sequência conservada em um organismo não necessariamente tem que ser conservada no seu sentido mais estrito, como conhecimento de uma sequência de um dado organismo é suficiente. Além disso, a sequência não precisa ser parte de uma entidade essencial. Entretanto, em algumas modalidades, a sequência conservada é uma sequência que é essencial para função e/ou sobrevivência e/ou replicação e/ou infectividade e similares de um organismo ou uma célula. Em algumas modalidades, a sequência conservada compreende uma helicase, uma primase, uma cabeça ou cauda estrutural proteica, uma proteína com um domínio conservado (por exemplo, holina, lisina e outros), ou sequências conservadas entre genes de fago importantes.
[000137] Em algumas modalidades adicionais, a presente invenção fornece métodos para modulação (por exemplo, conferindo ou aumentando) da resistência de uma célula contra um ácido nucleico- alvo ou um produto de transcrição do mesmo compreendendo as etapas de: identificação de uma ou mais CRISPR espaçadoras em um organismo resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo; preparação de um ácido nucleico recombinante compreendendo pelo menos um gene ou proteína cas e pelo menos duas repetições de CRISPR em conjunto com um ou mais espaçadores identificados; e transformação de uma célula com o ácido nucleico recombinante, portanto, para produzir a célula-recipiente resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo.
[000138] Em algumas modalidades, a presente invenção fornece métodos para modulação (por exemplo, conferindo ou aumentando) da resistência de uma célula compreendendo pelo menos um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR contra um ácido nucleico-alvo ou um produto de transcrição do mesmo compreendendo as etapas de: identificação de uma ou mais CRISPR espaçadoras em um organismo resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo; e modificação da sequência de uma ou mais CRISPR espaçadora(s) na célula tal que CRISPR espaçadora(s) tenha homologia à CRISPR espaçadora(s) no organismo. Em algumas modalidades, uma ou mais CRISPR espaçadoras em uma célula-recipiente são modificadas (por exemplo, construídas geneticamente) tal que CRISPR espaçadora(s) tem homologia a uma ou mais CRISPR espaçadora(s) em um organismo doador que é substancialmente resistente a um ácido nucleico-alvo ou um produto de transcrição do mesmo, a fim de produzir a célula resistente ao ácido nucleico-alvo. Em algumas modalidades preferenciais, um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR na célula são uma combinação funcional como descrito neste pedido.
[000139] Os métodos de engenharia genética incluem quaisquer métodos adequados conhecidos na técnica, incluindo, mas não limitados a, adição (por exemplo, inserção), deleção (por exemplo, remoção) ou modificação (por exemplo, mutação) da sequência de uma ou mais CRISPR espaçadoras e/ou uma ou mais pseudo CRISPR espaçadoras em uma célula, tal que a CRISPR espaçadora tem homologia (por exemplo, homologia aumentada após engenharia genética) a uma ou mais CRISPR espaçadoras de um organismo doador. Esta etapa de engenharia resulta em uma célula que foi substancialmente sensível a um ácido nucleico-alvo ou um produto de transcrição do mesmo que é substancialmente resistente ao ácido nucleico-alvo ou um produto de transcrição do mesmo.
[000140] Em algumas modalidades adicionais, a presente invenção fornece métodos para diminuição ou redução da resistência de uma célula-recipiente compreendendo pelo menos um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR contra um ácido nucleico-alvo ou um produto de transcrição do mesmo.
[000141] Em algumas modalidades, os métodos compreendem etapas de: identificação de uma ou mais CRISPR espaçadoras em um organismo que é substancialmente resistente ao ácido nucleico-alvo ou um produto de transcrição do mesmo; e modificação da sequência de uma ou mais CRISPR espaçadora(s) na célula tal que CRISPR espaçadora(s) tenha um grau reduzido de homologia à CRISPR espaçadora(s) no organismo.
[000142] Em outras modalidades, os métodos para modulação (por exemplo, diminuição) da resistência de uma célula compreendendo um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR contra um ácido nucleico-alvo ou produto de transcrição do mesmo compreendem etapas de: identificação de uma CRISPR espaçadora ou uma pseudo CRISPR espaçadora em um organismo compreendendo um ácido nucleico-alvo ou produto de transcrição do mesmo contra o qual a resistência deve ser modulada; e identificação da CRISPR espaçadora no organismo no qual a resistência deve ser modulada; e (iii) adaptação da sequência do CRISPR espaçadora no organismo no qual a resistência deve ser modulada tal que a CRISPR espaçadora tenha um grau menor de homologia à CRISPR espaçadora ou pseudo CRISPR espaçadora do organismo compreendendo o ácido nucleico-alvo ou produto de transcrição do mesmo contra o qual a resistência deve ser modulada.
[000143] Uma ou mais CRISPR espaçadoras em uma célula substancialmente resistente são construídas a fim de produzir a célula sensível a um ácido nucleico-alvo. Os métodos de engenharia genética que encontram uso incluem, mas não são limitados a, adição (por exemplo, inserção), deleção (por exemplo, remoção) ou modificação de uma ou mais combinações de repetição-cas de CRISPR funcionais ou porções ou fragmentos dos mesmos na célula substancialmente resistente e/ou adição (por exemplo, inserção), deleção (por exemplo, remoção) ou modificação de uma ou mais CRISPR espaçadoras ou porções ou fragmentos das mesmas na célula substancialmente resistente. Esta etapa de engenharia resulta em uma célula que foi substancialmente resistente a um ácido nucleico-alvo ou um produto de transcrição do mesmo que fica substancialmente sensível a um ácido nucleico-alvo ou um produto de transcrição do mesmo.
[000144] Em algumas modalidades, a fim de conferir sensibilidade a uma célula, é contemplado que uma ou mais CRISPR espaçadoras, um ou mais genes ou proteínas cas, uma ou mais, preferencialmente, duas ou mais repetições de CRISPR, e/ou um ou mais combinações funcionais de repetições-cas CRISPR a partir de uma célula substancialmente resistente será removida, deletada ou modificada tal que a resistência não seja mais conferida. Em algumas modalidades, as células que são sensíveis a um ácido nucleico-alvo ou um produto de transcrição do mesmo são preparadas tal que seus níveis em uma dada cultura (por exemplo, uma cultura iniciadora) possam ser modulados (por exemplo, reduzidos) como desejado. Dessa maneira, em algumas modalidades, culturas iniciadoras compreendendo duas ou mais cepas bacterianas são desenvolvidas tal que todos os membros da cultura sejam sensíveis ao mesmo agente (por exemplo, o mesmo bacteriófago). Dessa maneira, quando chega a hora que já não seja mais desejado que a cultura esteja viva, a cultura é contatada com o mesmo agente único a fim de matar todos os membros da cultura. Em algumas modalidades, as sensibilidades de células são moduladas por um ou mais agentes (por exemplo, fagos), tal que o agente mata somente uma certa proporção das células em uma dada cultura (por exemplo, aproximadamente 10, aproximadamente 20, aproximadamente 30, aproximadamente 40, aproximadamente 50, aproximadamente 60, aproximadamente 70, aproximadamente 80, aproximadamente 90, ou aproximadamente 95% das células na cultura).
[000145] Em algumas modalidades, uma célula-recipiente é construída tal que compreenda uma CRISPR espaçadora ou uma sequência correspondente a uma pseudo CRISPR espaçadora, por meio disso produzindo a célula resistente a um ácido nucleico-alvo ou produto de transcrição do mesmo. Apropriadamente, a célula é construída tal que a CRISPR espaçadora ou sequência correspondente à pseudo CRISPR espaçadora seja usada em conjunto com uma combinação de repetição de gene-CRISPR cas funcional, como descrito neste pedido.
[000146] Em algumas modalidades, uma célula que é resistente a um ácido nucleico-alvo ou produto de transcrição do mesmo é projetada tal que a CRISPR espaçadora conferindo imunidade contra o ácido nucleico-alvo ou produto de transcrição do mesmo é inserido em uma célula compreendendo uma combinação de repetição de gene- CRISPR cas funcional, por meio disso produzindo a célula resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo.
[000147] Em algumas modalidades adicionais, a sequência de uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras de uma célula que é resistente a um ácido nucleico-alvo ou produto de transcrição do mesmo é determinado. Uma célula-recipiente então é construída tal que compreenda a sequência da CRISPR espaçadora e uma combinação de repetição de gene-CRISPR cas funcional, por meio disso produzindo a célula resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo.
[000148] Em algumas modalidades adicionais, uma CRISPR espaçadora de uma célula-recipiente e uma combinação de repetição de gene-CRISPR cas funcional da mesma ou diferente célula (por exemplo, a mesma ou diferente célula-recipiente) são preparados. Uma célula-recipiente adicional então é construída tal que compreende a sequência de CRISPR espaçadora e combinação de repetição de gene-CRISPR cas funcional que por meio disso produzindo a célula resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo.
[000149] Em algumas modalidades, a resistência é dirigida contra um produto de transcrição da sequência de ácido nucleico-alvo (por exemplo, um transcrito da sequência-alvo de ácido nucleico, especialmente um RNA ou mRNA), um transcrito (por exemplo, um transcrito de RNA de senso ou antissenso), ou um produto de transcrição polipeptídico.
[000150] Em algumas modalidades, isto confere resistência a uma célula contra um organismo doador a partir do qual o produto de transcrição é derivado.
[000151] Em algumas modalidades, a sequência nucleotídica alvo compreende DNA ou RNA de origem genômica, sintética ou recombinante. Em algumas modalidades adicionais, a sequência nucleotídica é dupla fita, enquanto em outra modalidade é de fita simples, se representar a fita de senso ou antissenso ou combinações das mesmas. Ainda em modalidades adicionais, a sequência nucleotídica é preparada pelo uso de técnicas de DNA recombinante (por exemplo, DNA recombinante). Ainda em modalidades adicionais, a sequência nucleotídica é a mesma como uma forma que ocorre naturalmente, enquanto em outras modalidades é derivada da mesma. Ainda em modalidades adicionais, a sequência-alvo de ácido nucleico é derivada de um gene. Em algumas outras modalidades, a sequência-alvo de ácido nucleico é derivada de um variante, homólogo, fragmento ou derivado de um gene. Em algumas modalidades preferenciais, a sequência nucleica-alvo é ou é derivada de bacteriófago. Em algumas modalidades, a sequência nucleica-alvo é derivada do DNA plasmidial. Em algumas modalidades, a sequência nucleica-alvo é derivada de um elemento genético móvel. Em algumas modalidades adicionais, a sequência nucleica-alvo é derivada de um elemento transponível ou uma sequência de inserção. Ainda em modalidades adicionais, a sequência nucleica-alvo é derivada de um gene que confere resistência. Em algumas modalidades adicionais, a sequência nucleica-alvo é derivada de um gene que confere resistência a um antibiótico ou antimicrobiano. Em algumas modalidades, a sequência nucleica-alvo é derivada de um fator de virulência. Em algumas modalidades adicionais, a sequência nucleica- alvo é derivada de uma toxina, uma internalina ou uma hemolisina.
[000152] Em algumas modalidades, a sequência nucleica-alvo ou um produto de transcrição da mesma é derivada de uma ou mais bactérias. Dessa maneira, em algumas modalidades preferenciais, a resistência de células bacterianas é modulada usando os métodos e composições da presente invenção. Em algumas modalidades preferenciais, a sequência nucleotídica alvo é derivada de um gene associado à resistência à transferência de plasmídeo em bactérias. Em algumas modalidades, uma ou mais CRISPR espaçadoras na célula são modificadas tal que a CRISPR espaçadora da célula tenha homologia ao CRISPR espaçadora e/ou pseudo CRISPR espaçadora contida no DNA plasmidial da célula bacteriana, por meio disso fornecendo resistência contra o plasmídeo(s) particular. Dessa maneira, a transferência de DNA estranho na célula é prevenida. Em algumas modalidades preferenciais, determinadas regiões no DNA plasmidial são direcionadas, para fornecer a imunidade contra o DNA plasmidial. Por exemplo, em algumas modalidades, as sequências na origem de replicação do plasmídeo ou sequências nos genes de codificação das proteínas de codificação são direcionados.
[000153] Em algumas modalidades, a presente invenção fornece métodos compreendendo etapas de: identificação de uma CRISPR espaçadora e/ou pseudo CRISPR espaçadora derivada do DNA plasmidial de uma célula bacteriana contra a qual a resistência deve ser modulada; e modificação da sequência de uma CRISPR espaçadora na célula na qual a resistência deve ser modulada, tal que a CRISPR espaçadora da célula tem homologia à CRISPR espaçadora e/ou pseudo CRISPR espaçadora contida no DNA plasmidial da célula bacteriana.
[000154] Ainda em modalidades adicionais, a presente invenção fornece métodos para conferir resistência a uma célula contra a transferência de plasmídeo, compreendendo etapas de: identificação de uma CRISPR espaçadora e/ou pseudo CRISPR espaçadora derivada de DNA plasmidial; identificação de uma ou mais combinações genéticas cas-repetição de CRISPR funcionais em uma célula que é substancialmente sensível ao plasmídeo; e a engenharia de um ou mais loci de CRISPR na célula substancialmente sensível tal que compreenda uma ou mais CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras a partir do plasmídeo, por meio disso produzindo a célula resistente.
[000155] Em algumas modalidades, a sequência nucleotídica alvo é derivada de um gene associado com resistência a um ou mais elementos genéticos móveis. Em algumas modalidades, determinadas CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras derivadas de um ou mais elementos genéticos móveis são adicionados em um locux de CRISPR de uma célula para fornecer resistência contra elementos genéticos móveis (por exemplo, elementos transponíveis e sequências de inserção), dessa forma prevenindo transferência de DNA estranho e deriva genética. Em algumas modalidades, determinadas regiões nos transposons e sequências de inserção são direcionadas para fornecer imunidade contra elementos genéticos móveis. Por exemplo, em algumas modalidades-alvo incluem, mas não são limitados a transposons conjugados (Tn916), transposons de classe II (Tn501), sequências de inserção (IS26) e genes de transposase.
[000156] Em algumas modalidades, a presente invenção fornece métodos compreendendo etapas de: identificação de uma CRISPR espaçadora e/ou pseudo CRISPR espaçadora derivada de um ou mais elementos genéticos móveis de uma célula contra a qual a resistência deve ser modulada; e modificação da sequência de uma CRISPR espaçadora em uma célula na qual a resistência deve ser modulada tal que a CRISPR espaçadora e/ou pseudo CRISPR espaçadora da célula tenham homologia ao CRISPR espaçadora contido no elemento(s) genético móvel da célula.
[000157] Ainda em algumas modalidades adicionais, a presente invenção fornece métodos para conferir resistência a uma célula contra um ou mais elementos genéticos móveis compreendendo etapas de: identificação de uma CRISPR espaçadora e/ou pseudo CRISPR espaçadora derivada de um ou mais elementos genéticos móveis; identificação de uma ou mais combinações funcionais de repetição-cas CRISPR em uma célula que é substancialmente sensível a um ou mais elementos genéticos móveis; e engenharia de um ou mais loci de CRISPR na célula substancialmente sensível tal que compreendam ou tenham homologia a uma ou mais CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras de um ou mais elementos genéticos móveis para produzir a célula resistente.
[000158] Em algumas modalidades, a sequência nucleotídica alvo é derivada de um gene associado com a resistência a antibióticos e/ou antimicrobianos. Como usado neste pedido, o termo "antimicrobiano" refere-se a qualquer composição que mata ou inibe o crescimento ou reprodução de micro-organismos. É destinado que o termo englobe antibióticos (isto é, composições produzidas por outros micro-organismos), bem como composições sinteticamente produzidas. Genes de resistência antimicrobiana incluem, mas não são limitados a blatem, blarob, blashv, aadB, aacCl, aacC2, aacC3, aacA4, mecA, vanA, vanH, vanX, satA, aacA-aphH, vat, vga, msrA sul e/ou int. Genes de resistência antimicrobiana incluem aqueles que são obtidos a partir de espécies bacterianas que incluem mas não são limitadas aos gêneros Escherichia, Klebsiella, Pseudomonas, Proteus, Streptococcus, Staphylococcus, Enterococcus, Haemophilus e Moraxella. Os genes de resistência antimicrobiana também incluem aqueles que são obtidos a partir de espécies bacterianas que incluem mas não são limitadas a Escherichia coli, Klebsiella pneumoniae, Pseudomonas aeruginosa, Proteus mirabilis, Streptococcus pneumoniae, Staphylococcus aureus, Staphylococcus epidermidis, Enterococcus faecalis, Staphylococcus saprophyticus, Streptococcus pyogenes, Haemophilus influenzae e Moraxella catarrhalis. Em algumas modalidades, determinadas CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras derivadas de genes de codificação de resistência antimicrobiana são adicionadas em um locux de CRISPR de uma célula-recipiente, sob condições tais que a transferência de genes de resistência seja prevenida. Dessa maneira, o risco de aquisição de genes de resistência antimicrobiana (isto é, marcadores) é reduzido. Em algumas modalidades, alvos também incluem vanR, (isto é, resistência à vancomicina), tetR (isto é, resistência à tetraciclina) e/ou fatores de resistência que fornecem resistência à beta-lactamase.
[000159] Em algumas modalidades, a presente invenção fornece métodos compreendendo etapas de: identificação de uma ou mais CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras derivadas de uma célula que compreende um ou mais genes ou marcadores de resistência antimicrobiana; e modificação da sequência de CRISPR espaçadora em uma célula que não compreende ou não expressa os genes de resistência antimicrobiana ou marcadores tais que a CRISPR espaçadora da célula tenha homologia a uma ou mais CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras contidas na célula que compreende um ou mais genes ou marcadores de resistência antimicrobiana.
[000160] Ainda em algumas modalidades adicionais, a presente invenção fornece métodos para modulação da aquisição de marcadores de resistência antimicrobiana em uma célula compreendendo etapas de: identificação de uma ou mais CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras derivadas de uma célula que compreende um ou mais genes ou marcadores de resistência antimicrobiana; identificação de um ou mais loci de CRISPR em uma célula que não compreende ou não expressa genes ou marcadores de resistência antimicrobiana; e modificação da sequência da CRISPR espaçadora na célula que não compreende ou não expressa genes ou marcadores de resistência antimicrobiana tal que a CRISPR espaçadora e/ou pseudo CRISPR espaçadoras tenham homologia a CRISPR espaçadora contida na célula resistente à transferência de genes conferindo resistência a um ou mais antimicrobianos.
[000161] Em algumas modalidades, a sequência nucleotídica alvo é derivada de pelo menos um gene associado com fator(es) de virulência. Em algumas modalidades, determinadas CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras derivadas de genes que codificam fatores de virulência são adicionadas em um locux de CRISPR bacteriano para fornecer a resistência contra transferência de genes conferindo virulência às bactérias. Em algumas modalidades, fatores que comumente contribuem para a virulência microbiana (por exemplo, em agentes patogênicos) são direcionados, tais como toxinas, internalinas, hemolisinas e outros fatores de virulência.
[000162] A presente invenção também fornece métodos compreendendo etapas de: identificação de uma ou mais CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras derivadas de uma célula que compreende um ou mais fatores de virulência; e modificação da sequência do CRISPR espaçadora em uma célula que não compreende ou não expressa fator(es) ou marcador(es) de virulência tais que a CRISPR espaçadora da célula tenha homologia a uma ou mais CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras contidas na célula que compreende um ou mais fatores de virulência.
[000163] Ainda em modalidades adicionais, a presente invenção fornece métodos para conferir resistência a uma célula contra um ou mais fator(es) ou marcador(es) de virulência compreendendo etapas de: identificação de uma CRISPR espaçadora e/ou pseudo CRISPR espaçadora derivada de um ou mais fator(es) ou marcador(es) de virulência; identificação de uma ou mais combinações funcionais de repetição CRISPR-cas em uma célula que é substancialmente sensível a um ou mais fator(es) ou marcador(es) de virulência; e a engenharia de um ou mais loci de CRISPR na célula substancialmente sensível tal que compreendam uma ou mais CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras de um ou mais fator(es) ou marcador(es) de virulência para produzir a célula resistente.
[000164] A presente invenção engloba o uso de variantes, homólogos, derivados e fragmentos dos mesmos, incluindo variantes, homólogos, derivados e fragmentos de loci de CRISPR, CRISPR espaçadoras, pseudo CRISPR espaçadoras, genes ou proteínas cas, repetições de CRISPR, combinações gênicas de repetição de CRISPR-cas funcionais e sequências alvo de ácidos nucleicos ou produtos de transcrição dos mesmos.
[000165] O termo "variante" é usado para significar um polipeptídeo que ocorre naturalmente ou sequências nucleotídicas que se diferenciam de uma sequência de tipo selvagem.
[000166] O termo "fragmento" indica que a sequência nucleotídica ou polipeptídeo compreende uma fração de uma sequência de tipo selvagem. Pode compreender uma ou mais seções grandes contíguas da sequência ou uma pluralidade de pequenas seções. A sequência também pode compreender outros elementos da sequência, por exemplo, pode ser uma proteína de fusão com outra proteína. Preferencialmente a sequência compreende pelo menos 50%, mais preferencialmente pelo menos 65%, mais preferencialmente pelo menos 80%, mais preferencialmente pelo menos 85%, mais preferencialmente pelo menos 90%, mais preferencialmente pelo menos 95%, mais preferencialmente pelo menos 96%, mais preferencialmente pelo menos 97%, mais preferencialmente pelo menos 98%, ainda mais preferencialmente pelo menos 99% da sequência de tipo selvagem.
[000167] Preferencialmente, o fragmento conserva atividade de 50%, mais preferencialmente 60%, mais preferencialmente 70%, mais preferencialmente 80%, mais preferencialmente 85%, mais preferencialmente 90%, mais preferencialmente 95%, mais preferencialmente 96%, mais preferencialmente 97%, mais preferencialmente 98%, ou ainda mais preferencialmente 99% da sequência polipeptídica ou nucleotídica de tipo selvagem.
[000168] Preferencialmente, uma CRISPR espaçadora ou pseudo CRISPR espaçadora compreendem pelo menos 50%, mais preferencialmente pelo menos 65%, mais preferencialmente pelo menos 80%, mais preferencialmente pelo menos 85%, mais preferencialmente pelo menos 90%, mais preferencialmente pelo menos 95%, mais preferencialmente pelo menos 96%, mais preferencialmente pelo menos 97%, mais preferencialmente pelo menos 98%, ainda mais preferencialmente pelo menos 99% da sequência de tipo selvagem. Preferencialmente, uma CRISPR espaçadora conserva atividade de 50%, mais preferencialmente 60%, mais preferencialmente 70%, mais preferencialmente 80%, mais preferencialmente 85%, mais preferencialmente 90%, mais preferencialmente 95%, mais preferencialmente 96%, mais preferencialmente 97%, mais preferencialmente 98%, ou ainda mais preferencialmente de 99% da sequência polipeptídica ou nucleotídica de tipo selvagem.
[000169] Preferencialmente, um gene cas compreende pelo menos 50%, mais preferencialmente pelo menos 65%, mais preferencialmente pelo menos 80%, mais preferencialmente pelo menos 85%, mais preferencialmente pelo menos 90%, mais preferencialmente pelo menos 95%, mais preferencialmente pelo menos 96%, mais preferencialmente pelo menos 97%, mais preferencialmente pelo menos 98%, ainda mais preferencialmente pelo menos 99% da sequência de tipo selvagem. Preferencialmente, um gene cas conserva atividade de 50%, mais preferencialmente 60%, mais preferencialmente 70%, mais preferencialmente 80%, mais preferencialmente 85%, mais preferencialmente 90%, mais preferencialmente 95%, mais preferencialmente 96%, mais preferencialmente 97%, mais preferencialmente 98%, ou ainda mais preferencialmente de 99% sequência polipeptídica ou nucleotídica de tipo selvagem.
[000170] Preferencialmente, uma proteína Cas compreende pelo menos 50%, mais preferencialmente pelo menos 65%, mais preferencialmente pelo menos 80%, mais preferencialmente pelo menos 85%, mais preferencialmente pelo menos 90%, mais preferencialmente pelo menos 95%, mais preferencialmente pelo menos 96%, mais preferencialmente pelo menos 97%, mais preferencialmente pelo menos 98%, ainda mais preferencialmente pelo menos 99% da sequência de tipo selvagem. Preferencialmente, uma proteína Cas conserva atividade de 50%, mais preferencialmente 60%, mais preferencialmente 70%, mais preferencialmente 80%, mais preferencialmente 85%, mais preferencialmente 90%, mais preferencialmente 95%, mais preferencialmente 96%, mais preferencialmente 97%, mais preferencialmente 98%, ou ainda mais preferencialmente de 99% da sequência polipeptídica ou nucleotídica de tipo selvagem.
[000171] Preferencialmente, uma repetição de CRISPR compreende pelo menos 50%, mais preferencialmente pelo menos 65%, mais preferencialmente pelo menos 80%, mais preferencialmente pelo menos 85%, mais preferencialmente pelo menos 90%, mais preferencialmente pelo menos 95%, mais preferencialmente pelo menos 96%, mais preferencialmente pelo menos 97%, mais preferencialmente pelo menos 98%, ainda mais preferencialmente pelo menos 99% da sequência de tipo selvagem. Preferencialmente, uma repetição de CRISPR conserva atividade de 50%, mais preferencialmente 60%, mais preferencialmente 70%, mais preferencialmente 80%, mais preferencialmente 85%, mais preferencialmente 90%, mais preferencialmente 95%, mais preferencialmente 96%, mais preferencialmente 97%, mais preferencialmente 98%, ou ainda mais preferencialmente de 99% da sequência polipeptídica ou nucleotídica de tipo selvagem.
[000172] Preferencialmente, uma combinação funcional de repetição CRISPR-cas compreende pelo menos 50%, mais preferencialmente pelo menos 65%, mais preferencialmente pelo menos 80%, mais preferencialmente pelo menos 85%, mais preferencialmente pelo menos 90%, mais preferencialmente pelo menos 95%, mais preferencialmente pelo menos 96%, mais preferencialmente pelo menos 97%, mais preferencialmente pelo menos 98%, ainda mais preferencialmente pelo menos 99% da sequência de tipo selvagem. Preferencialmente, a combinação funcional de repetição de CRISPR- cas conserva atividade de 50%, mais preferencialmente 60%, mais preferencialmente 70%, mais preferencialmente 80%, mais preferencialmente 85%, mais preferencialmente 90%, mais preferencialmente 95%, mais preferencialmente 96%, mais preferencialmente 97%, mais preferencialmente 98%, ou ainda mais preferencialmente de 99% da sequência polipeptídica ou nucleotídica de tipo selvagem.
[000173] Preferencialmente, uma sequência-alvo de ácido nucleico compreende pelo menos 50%, mais preferencialmente pelo menos 65%, mais preferencialmente pelo menos 80%, mais preferencialmente pelo menos 85%, mais preferencialmente pelo menos 90%, mais preferencialmente pelo menos 95%, mais preferencialmente pelo menos 96%, mais preferencialmente pelo menos 97%, mais preferencialmente pelo menos 98%, ainda mais preferencialmente pelo menos 99% da sequência de tipo selvagem. Preferencialmente, uma sequência-alvo de ácido nucleico conserva atividade de 50%, mais preferencialmente 60%, mais preferencialmente 70%, mais preferencialmente 80%, mais preferencialmente 85%, mais preferencialmente 90%, mais preferencialmente 95%, mais preferencialmente 96%, mais preferencialmente 97%, mais preferencialmente 98%, ou ainda mais preferencialmente 99% da sequência polipeptídica ou nucleotídica de tipo selvagem.
[000174] Em algumas modalidades, o fragmento é um fragmento funcional. Por um "fragmento funcional" de uma molécula é entendido um fragmento conservando ou possuindo substancialmente a mesma atividade biológica que a molécula intacta. Em todos os exemplos, um fragmento funcional de uma molécula conserva pelo menos 10% e pelo menos aproximadamente 25%, aproximadamente 50%, aproximadamente 75%, aproximadamente 80%, aproximadamente 85%, aproximadamente 90%, aproximadamente 95%, aproximadamente 96%, aproximadamente 97%, aproximadamente 98%, ou aproximadamente 99% da atividade biológica da molécula intacta.
[000175] O termo "homólogo" significa uma entidade que tem certa homologia com as sequências objeto de aminoácido e as sequências objeto nucleotídicas. Aqui, o termo "homologia" pode ser igualado com "identidade".
[000176] No presente contexto, uma sequência homóloga é tomada para incluir uma sequência de aminoácido, que pode ser pelo menos 75, 85 ou 90% idênticas, preferencialmente pelo menos 95%, 96%, 97%, 98% ou 99% idênticas à sequência objeto. Embora a homologia também possa ser considerada em termos de similaridade (isto é, resíduos de aminoácidos que têm propriedades/funções químicas similares), no contexto da presente invenção é preferencial para expressar homologia em termos de identidade de sequência.
[000177] No presente contexto, uma sequência homóloga é tomada para incluir uma sequência nucleotídica, que pode ser pelo menos 75, 85 ou 90% idêntica, preferencialmente pelo menos 95%, 96%, 97%, 98% ou 99% idênticas à sequência objeto. Embora a homologia também possa ser considerada em termos de similaridade (isto é, resíduos de aminoácidos tendo propriedades/funções químicas similares), no contexto da presente invenção é preferencial para expressar homologia em termos de identidade de sequência.
[000178] Comparações de homologia podem ser conduzidas pelos olhos, ou mais normalmente, com a ajuda de programas de comparação de sequência prontamente disponíveis. Estes programas de computador comercialmente disponíveis podem calcular a % de homologia entre duas ou mais sequências.
[000179] Porcentagem (%) de homologia pode ser calculada nas sequências contíguas (isto é, uma sequência é alinhada com outra sequência e cada aminoácido em uma sequência é diretamente comparado com o aminoácido correspondente na outra sequência, um resíduo de cada vez). Isto é chamado um alinhamento "sem lacunas". Tipicamente, tais alinhamentos sem lacunas são realizados somente em um número relativamente pequeno de resíduos.
[000180] Embora isto seja um método muito simples e consistente, não leva em consideração que, por exemplo, em um par de sequências de outra maneira idêntico, uma inserção ou deleção causará que os seguintes resíduos de aminoácido sejam postos fora do alinhamento, dessa forma potencialmente resultando em uma grande redução na % de homologia quando um alinhamento global é realizado. Consequentemente, a maioria dos métodos de comparação de sequência são desenhados para produzir alinhamentos ótimos que levam em consideração possíveis inserções e deleções sem impor penalidade indevidamente ao escore de homologia total. Isto é alcançado pela inserção de "lacunas" no alinhamento da sequência para tentar maximizar a homologia local.
[000181] Entretanto, estes métodos mais complexos denominados "penalidades de lacuna" a cada lacuna que ocorre no alinhamento para que, para o mesmo número de aminoácidos idênticos, um alinhamento de sequência com tantas lacunas quanto possível - refletindo maior relação entre duas sequências comparadas - alcançarão um maior escore do que uma com muitas lacunas. "Atribuição de custos de lacuna" são tipicamente usados nessa carga um custo relativamente alto da existência de uma lacuna e uma penalidade menor por cada resíduo subsequente na lacuna. Este é o sistema de pontuação de lacuna ainda mais comumente usado. As penalidades maiores de lacuna produzirão naturalmente alinhamentos otimizados com menos lacunas. A maioria dos programas de alinhamento permitem às penalidades de lacuna serem modificadas. Entretanto, é preferencial para usar os valores padrão quando usando tal programa para comparações de sequência. Por exemplo, usando pacote de GCG Wisconsin Bestfit, a penalidade de lacuna padrão para sequências de aminoácido é -12 para uma lacuna e -4 para cada extensão.
[000182] O cálculo da % de homologia máxima, por isso, primeiramente necessita de produção de um alinhamento ótimo, levando em consideração penalidades de lacuna. Um programa de computador adequado para executar tal alinhamento é pacote GCG Wisconsin Bestfit (University of Wisconsin, U.S.A.; Devereux et al., 1984, Nucleic Acids Research 12:387). Exemplos de outros programas que podem realizar comparações de sequência incluem, mas não são limitados ao pacote BLAST (vide Ausubel et al., 1999 ibid - Chapter 18), FASTA (Atschul et al., 1990, J. Mol. Biol., 403-410), a suíte GENEWORKS de instrumentos de comparação e CLUSTAL. Ambos BLAST e FASTA estão disponíveis para busca offline e online (vide Ausubel et al., 1999 ibid, pages 7-58 a 7-60). Entretanto, para algumas aplicações, é preferencial usar o programa GCG Bestfit. Um nova ferramenta, chamada BLAST 2 Sequences também está disponível para comparação de sequência proteica e nucleotídica (vide FEMS Microbiol Lett 1999 174 (2): 247-50; FEMS Microbiol Lett 1999 177 (1):187-8).
[000183] Embora a % de homologia final possa ser medida em termos de identidade, o próprio processo de alinhamento não é tipicamente baseado em uma comparação de par tudo ou nada. Em vez disso, uma matriz de escore de similaridade escalada é geralmente usada que destina o grande número a cada comparação aos pares baseada em semelhança química ou distância evolutiva. Um exemplo de tal matriz comumente usada é a matriz BLOSUM62 - a matriz padrão do pacote de programas BLAST. Programas de GCG Wisconsin geralmente usam os valores padrão públicos ou uma tabela de comparação de símbolo adaptado se fornecida (vide manual de usuário para detalhes adicionais). Para algumas aplicações, é preferencial para usar os valores adaptados públicos para o pacote GCG, ou em caso de outro programa, a matriz adaptada - tais como BLOSUM62.
[000184] Uma vez que o programa produziu um alinhamento ótimo, é possível calcular a % de homologia, preferencialmente % de identidade de sequência. O programa tipicamente faz isto como parte da comparação de sequência e gera um resultado numérico.
[000185] Penalidades de Lacuna deveriam ser usadas quanto a determinação de identidade de sequência, então apropriadamente os seguintes parâmetros são usados:
[000186] Para comparação de sequência polipeptídica, as seguintes configurações podem ser usadas: penalidade de criação de LACUNA de 3,0 e penalidade de extensão de LACUNA de 0,1. Apropriadamente, o grau da identidade com respeito a uma sequência de aminoácidos é determinado em pelo menos 5 aminoácidos contíguos, determinados em pelo menos 10 aminoácidos contíguos, em pelo menos 15 aminoácidos contíguos, em pelo menos 20 aminoácidos contíguos, em pelo menos 30 aminoácidos contíguos, em pelo menos 40 aminoácidos contíguos, em pelo menos 50 aminoácidos contíguos, ou em pelo menos 60 aminoácidos contíguos.
[000187] As sequências também podem ter deleções, inserções ou substituições de resíduos de aminoácido, que produzem uma modificação silenciosa e resultam em uma substância funcionalmente equivalente. As substituições de aminoácido deliberadas podem ser feitas com base na semelhança em polaridade, carga, solubilidade, hidrofobicidade, hidrofilicidade, e/ou a natureza anfipática dos resíduos enquanto a atividade de ligação secundária da substância é conservada. Por exemplo, aminoácidos negativamente carregados incluem ácido aspártico e ácido glutâmico; aminoácidos positivamente carregados incluem lisina e arginina; e aminoácidos com grupos dianteiros polares não carregados que têm valores de hidrofilicidade similares incluem leucina, isoleucina, valina, glicina, alanina, asparagina, glutamina, serina, treonina, fenilalanina e tirosina.
[000188] Substituições conservativas podem ser feitas, por exemplo, de acordo com a tabela abaixo. Aminoácidos no mesmo bloco na segunda coluna e preferencialmente na mesma linha na terceira coluna podem ser substituídos um pelo outro:
[000189] A presente invenção também engloba a substituição homóloga (substituição e reposição são ambas usadas neste pedido para significar o intercâmbio de um resíduo de aminoácido existente, com um resíduo alternativo) pode ocorrer, isto é substituição similar para similar - tal como básico para básico, acídico para acídico, polar para polar etc. Substituição não-homóloga também pode ocorrer, isto é de uma classe de resíduo para outra ou alternativamente envolvendo a inclusão de aminoácidos não-naturais - tais como ornitina (a seguir mencionado como Z), ornitina de ácido diaminobutírico (a seguir mencionado como B), ornitina norleucina (a seguir mencionado como O), pirilalanina, tienilalanina, naftilalanina e fenilglicina.
[000190] As substituições que também podem ser feitas por aminoácidos não-naturais incluem; aminoácidos alfa* e alfa- dissubstituídos*, N-alquil aminoácidos*, ácido láctico*, derivados de haleto de aminoácidos naturais - tais como trifluorotirosina*, p-Cl- fenilalanina*, p-Br-fenilalanina*, p-I-fenilalanina*, L-alil-glicina*, β- alanina*, ácido L-α-amino butírico*, ácido L- -amino butírico*, ácido L- α-amino isobutírico*, ácido L-ε-amino caproico#, ácido 7-amino heptanoico*, L-metionina sulfona#*, L-norleucina*, L-norvalina*, p-nitro- L-fenilalanina*, L-hidroxiprolina#, L-tioprolina*, derivados metila de fenilalanina (Phe) - tais como 4-metil-Phe*, pentametil-Phe*, L-Phe(4- amino)#, L-Tyr (metil)*, L-Phe (4-isopropil)*, L-Tic(ácido l,2,3,4-tetra- hidroisoquinolina-3-carboxil)*, ácido L-diaminopropiônico# e L-Phe (4- benzil)*. A notação * foi utilizada com o objetivo da discussão acima (relacionando-se com substituição homóloga ou não-homóloga), para indicar a natureza hidrofóbica do derivado ao passo que # foi utilizada para indicar que a natureza hidrofílica do derivado, #* indica características anfipáticas.
[000191] As sequências de aminoácidos variantes incluem grupos espaçadores adequados que são adequados para a inserção inserida entre quaisquer dois resíduos de aminoácido da sequência incluindo grupos alquila - tais como grupos metila, etila ou propila - além de espaçadores de aminoácido - tais como glicina ou resíduos de β- alanina. Uma forma adicional da variação envolve a presença de um ou mais resíduos de aminoácidos na forma de peptoide será bem entendido por aqueles versados na técnica. Para evitar dúvida, "a forma peptoide" é usada para referir-se a resíduos de aminoácido de variantes em que o grupo α-carbono substituinte está no átomo de nitrogênio do resíduo em vez do α-carbono. Processos para preparação de peptídeos na forma de peptoide são bem conhecidos na técnica.
[000192] As sequências nucleotídicas para uso na presente invenção podem incluir dentro delas nucleotídeos sintéticos ou modificados. Diversos tipos diferentes da modificação de oligonucleotídeos são conhecidas na técnica. Estes incluem estruturas principais de metilfosfonato e fosforotioato e/ou a adição de cadeias acridina ou polilisina nas extremidades 3' e/ou 5' da molécula. Para os objetivos da presente invenção, deve ser entendido que as sequências nucleotídicas podem ser modificadas por qualquer método disponível na técnica. Tais modificações podem ser realizadas para aumentar atividade in vivo ou tempo de vida das sequências nucleotídicas úteis na presente invenção.
CRISPRs
[000193] CRISPRs (Repetições Palindrômicas Curtas Agrupadas Regularmente Intercaladas); também conhecidas como SPIDRs (Repetições Diretas Intercaladas por Espaçadores) constituem uma família de loci de DNA recentemente descrita que são normalmente específicas para uma determinada espécie bacteriana. O locux de CRISPR é uma classe distinta de repetições de sequência curtas intercaladas (SSRs) que foram primeiro reconhecidas em E. coli (Ishino et al, J. Bacteriol., 169:5429-5433 [1987]; e Nakata et al., J. Bacteriol., 171:3553-3556 [1989]). SSRs similares intercaladas foram identificadas em Haloferax mediterranei, Streptococcus pyogenes, Anabaena e Mycobacterium tuberculosis (Vide, Groenen et al., Mol. Microbiol., 10: 1057-1065 [1993]; Hoe et al, Emerg. Infect. Dis., 5:254263 [1999]; Masepohl et al, Biochim. Biophys. Acta 1307:26-30 [1996]; e Mojica et al, Mol. Microbiol., 17:85-93 [1995]). O loci de CRISPR diferencia-se de outras SSRs pela estrutura das repetições, que foram denominadas repetições curtas regularmente intercaladas (SRSRs) (Janssen et al., OMICS J. Integ. Biol., 6:23-33 [2002]; e Mojica et al, Mol. Microbiol., 36:244-246 [2000]). As repetições são elementos curtos que ocorrem em grupos que são sempre regularmente espaçados por sequências intervenientes únicas com um tamanho constante (Mojica et al, [2000], supra). Embora as sequências repetidas sejam altamente conservadas entre cepas, o número de repetições intercaladas e sequências das regiões espaçadoras diferenciam-se de cepa para cepa (van Embden et al, J. Bacteriol., 182:2393-2401 [2000]).
[000194] Loci de CRISPR consistem de repetições curtas e altamente conservadas parcialmente palindrômicas de DNA tipicamente de 24 a 40 bp, contendo repetições inversas internas e terminais de até 11 bp. Estas repetições foram relatadas ocorrendo de 1 a 140 vezes. Embora os elementos isolados tenham sido detectados, são geralmente arranjados em grupos (até aproximadamente 20 ou mais por genoma) de unidades repetidas espaçadas pela intervenção única de sequências de 20 a 58 bp. Até agora, até 20 loci de CRISPR distintos foram encontrados dentro de um cromossomo único.
[000195] CRISPRs são geralmente homogêneas em um dado genoma com a maioria delas sendo idênticas. Entretanto, há exemplos de heterogeneidade em, por exemplo, Archaea (Mojica et al, [2000], supra).
[000196] Como usado neste pedido, o termo "locux de CRISPR" refere-se ao segmento de DNA que inclui todas as repetições de CRISPR, começando com o primeiro nucleotídeo da primeira repetição de CRISPR e terminam com o último nucleotídeo da última repetição de CRISPR (terminal).
[000197] Embora a função biológica do loci de CRISPR seja desconhecida, algumas hipóteses foram propostas. Por exemplo, foi proposto que possam estar envolvidas na ligação do cromossomo a uma estrutura celular, ou na replicação de cromossomo e na partição de réplicon (Jansen et al., OMICS 6:23-33 [2002]; Jansen et al, Mol. Microbiol., 43: 1565-1575 [2002]; e Pourcel et al., Microbiol., 151:653-663 [2005]). Mojica et al., (Mojica et al., J. Mol. Evol., 60: 174-182 [2005]) hipotetizam que CRISPR pode estar envolvida na conferência de imunidade específica contra DNA estranho e Pourcel et al. (supra) hipotetizam que CRISPRs são estruturas que são capazes de tomar partes de DNA estranho como parte de um mecanismo de defesa. Bolotin et al. (supra) sugerem que elementos CRISPR espaçadoras sejam traços de invasões passadas por elementos extracromossomais, e hipotetizam que fornecem uma célula imune contra a infecção de fago, e mais geralmente expressão de DNA estranho, pela codificação de um RNA de antissenso. Bolotin et al. (supra) também sugerem que genes cas sejam necessários para a formação de CRISPR. Entretanto, não é destinado que a presente invenção seja limitada a qualquer determinado mecanismo, função, teoria, nem meios da ação.
[000198] O genoma do Streptococcus thermophilus LMGl 8311 contém 3 loci de CRISPR; as sequências repetidas 36-bp são diferentes em CRISPR1 (34 repetições), CRISPR2 (5 repetições), e CRISPR3 (uma sequência única). No entanto, são perfeitamente conservadas dentro de cada locux. Repetições de CRISPR1 e CRISPR2 são respectivamente intercaladas por 33 e 4 sequências de 30 bp em tamanho. Todas estas sequências intercalantes são diferentes uma da outra. São também diferentes das encontradas na cepa CNRZ1066 (41 sequências intercalantes no CRISPR1) e na cepa LMD-9 (16 no CRISPR1 e 8 no CRISPR3), as quais ambas são de S. thermophilus.
[000199] Vários métodos para identificação de loci de CRISPR são conhecidos na técnica. Por exemplo, Jensen et al. (Jensen et al., [2002], supra) descrevem uma abordagem baseada em computador na qual sequências nucleotídicas são buscadas em motivos CRISPR usando o programa PATSCAN no servidor de Divisão de Matemática e Ciências da Computação no Laboratório Nacional de Argonne, Argonne, IL, USA. O algoritmo que foi usado para identificar motivos de CRISPR foi p1 = a...bc... dp1c...dp1c...dp1, onde a e b foram o limite de tamanho inferior e superior da repetição e p1 e c e d foram o limite de tamanho inferior e superior das sequências espaçadoras. Os valores de a, b, c e d podem ser variados de aproximadamente 15 a aproximadamente 70 bp em incrementos de aproximadamente 5 bp. Em algumas modalidades preferenciais, loci de CRISPR são identificados usando "dotplots" (por exemplo, usando o programa de computador Dotter).
[000200] Qualquer método adequado conhecido na técnica encontra uso na análise de semelhança de sequência. Por exemplo, a análise pode ser realizada usando NCBI BLAST com um banco de dados de genomas microbianos e GenBank, como conhecido na técnica. Além disso, as sequências nucleotídicas, incluindo aquelas fornecidas neste pedido, estão incluídas em bancos de dados (por exemplo, GenBank ou sítio na internet de genoma JGI). Como usado neste pedido, "a montante" significa na direção 5' e "a jusante" significa na direção 3'.
[000201] Em modalidades adicionais, os métodos da presente invenção utilizam procedimentos de amplificação (Vide, por exemplo, Mojica et al., [2005], supra; e Pourcel et al., [2005], supra). A amplificação da região de DNA desejada pode ser realizada por qualquer método conhecido na técnica, incluindo a reação em cadeia da polimerase (PCR). "Amplificação" refere-se à produção de cópias adicionais de uma sequência de ácido nucleico. Isto é geralmente realizado usando tecnologias de PCR bem conhecidas na técnica. A "reação em cadeia da polimerase" ("PCR") é bem conhecida por aqueles na técnica. Na presente invenção, os iniciadores oligonucleotídicos são desenhados para uso em reações PCR para amplificação de todo ou parte de um locux de CRISPR.
[000202] O termo "iniciador" refere-se a um oligonucleotídeo, ocorrendo naturalmente como em uma digestão por restrição purificada ou produzida sinteticamente, que é capaz de atuação como um ponto de iniciação de síntese quando colocado sob condições nas quais a síntese de um produto de extensão de iniciador que é complementar a um filamento de ácido nucleico é induzida (isto é, na presença de nucleotídeos e um agente de indução - tal como DNA polimerase e a uma temperatura e pH adequados). Em algumas modalidades, o iniciador é de filamento simples para a eficiência máxima na amplificação, embora em outras modalidades, o iniciador seja filamento duplo. Em algumas modalidades, o iniciador é um oligodesoxirribonucleotídeo. O iniciador deve ser suficientemente longo para iniciar a síntese de produtos de extensão na presença do agente de indução. O tamanho exato dos iniciadores depende de muitos fatores, incluindo temperatura, fonte de iniciador, e o uso do método. Iniciadores de PCR são tipicamente pelo menos aproximadamente 10 nucleotídeos no tamanho, e ainda mais tipicamente pelo menos aproximadamente 20 nucleotídeos no tamanho. Métodos para desenho e condução da PCR são bem conhecidos na técnica, e incluem, mas não são limitados a métodos usando iniciadores pareados, iniciadores aninhados ("nested primers"), iniciadores específicos únicos, iniciadores degenerados, iniciadores específicos para o gene, iniciadores específicos para o vetor, iniciadores parcialmente mal combinados, etc.
[000203] Em algumas modalidades preferenciais da presente invenção, um locux de CRISPR ou uma porção do mesmo de uma bactéria parental e uma bactéria marcada são comparados usando qualquer método adequado conhecido na técnica. Em algumas modalidades preferenciais da presente invenção, o locux de CRISPR ou uma porção do mesmo da bactéria parental e a bactéria marcada são comparados pela amplificação do locux de CRISPR ou uma porção do mesmo. Além de métodos de amplificação por ciclagem bem conhecidos (por exemplo, PCR, reação em cadeia da ligase, etc.) Outros métodos, incluindo, mas não limitados a métodos de amplificação isotérmicos encontram uso na presente invenção. Métodos de amplificação isotérmicos bem conhecidos que encontram uso na presente invenção incluem, mas não são limitados a amplificação de deslocamento de fita (SDA), Q-beta-replicase, amplificação de sequência com base no ácido nucleico (NASBA), e replicação de sequência autossustentada.
[000204] Em algumas outras modalidades preferenciais da presente invenção, o locux de CRISPR ou uma porção do mesmo da bactéria parental e bactéria marcada são comparados sequenciando o da presente invenção, locux de CRISPR ou uma porção do mesmo a partir da bactéria parental e a bactéria marcada são comparados pela amplificação e então sequenciamento dos loci de CRISPR ou uma porção dos mesmos. Em algumas modalidades, extremidades dos loci de CRISPR são comparadas, enquanto em outras modalidades, ambas as extremidades 5' e 3' dos loci são comparadas. Em algumas modalidades preferenciais, extremidades (por exemplo, extremidade 5') dos loci de CRISPR são comparadas. Ainda em outras modalidades, pelo menos as últimas repetições de CRISPR na extremidade 3' do locux de CRISPR e/ou pelo menos a última CRISPR espaçadora (por exemplo, o núcleo da última CRISPR espaçadora) na extremidade 3' do locux de CRISPR e/ou pelo menos a primeira repetição de CRISPR na extremidade 5' do locux de CRISPR e/ou pelo menos o primeiro CRISPR espaçadora (por exemplo, o primeiro núcleo da CRISPR espaçadora) na extremidade 5' do locux de CRISPR são comparados. Em algumas modalidades preferenciais, pelo menos a primeira repetição de CRISPR na extremidade 5' do locux de CRISPR e/ou pelo menos a primeira CRISPR espaçadora (por exemplo, o primeiro núcleo da CRISPR espaçadora) na extremidade 5' do locux de CRISPR são comparados. Em algumas modalidades preferenciais adicionais, pelo menos a última CRISPR espaçadora (por exemplo, o núcleo da última CRISPR espaçadora) na extremidade 3' do locux de CRISPR e/ou pelo menos a primeira CRISPR espaçadora (por exemplo, o primeiro núcleo de CRISPR espaçadora) na extremidade 5' do locux de CRISPR são comparados. Em algumas modalidades adicionais preferenciais, pelo menos a primeira CRISPR espaçadora (por exemplo, o primeiro núcleo de CRISPR espaçadora) nas extremidades 5' do loci de CRISPR são comparados.
[000205] Em algumas modalidades, os loci de CRISPR compreendem DNA, enquanto em outras modalidades, os loci de CRISPR compreendem RNA. Em algumas modalidades, o ácido nucleico é de origem genômica, enquanto em outras modalidades, é de origem sintética ou recombinante. Em algumas modalidades, os loci de CRISPR são de filamentos duplos, enquanto em outras modalidades, são de filamentos simples, se representar o filamento de senso ou antissenso ou combinações das mesmas. Em algumas modalidades, loci de CRISPR são preparados pelo uso de técnicas de DNA recombinante (por exemplo, DNA recombinante), como descrito neste pedido.
[000206] A presente invenção também fornece métodos para geração de variantes de CRISPR. Estas variantes são expressas, isoladas, clonadas, e/ou sequenciadas usando qualquer método adequado conhecido na técnica. Em algumas modalidades particularmente preferenciais, as variantes CRISPR são cepas mutantes resistentes ao fago que têm um locux de CRISPR modificado com um espaçador adicional. Em algumas modalidades adicionais, estas variantes encontram uso para objetivos com detecção/identificação de alvos, ou para resistência construída contra moléculas de ácidos nucleicos. Ainda em modalidades adicionais, estas variantes encontram uso no desenvolvimento de agentes de biocontrole.
[000207] No contexto da presente invenção, o locux de CRISPR é orientado como descrito abaixo. O líder de CRISPR é um segmento de DNA conservado de tamanho definido. A orientação do locux de CRISPRl de S. thermophilus é estabelecida usando as seguintes características: A posição relativa de CRISPR aos genes cas vizinhos (sequências associadas a CRISPR); CRISPR1 é localizada a jusante de 4 genes cas (genes str0657, str0658, str0659, e str0660 na sequência cromossomal CNRZ1066);
[000208] Esta sequência repetida tem o potencial para formar um grampo de estrutura secundária, embora não seja totalmente palindrômica, e a sequência complementar reversa; (5'-GTTGTACAGTTACTTAAATCTTGAGAGTACAAAAAC-3'; SEQ ID NO:695) é diferente da sequência direta (5'- GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAAC-3'; SEQ ID NO:1). Geralmente a extremidade 5' da sequência direta é mais rica em nucleotídeos G e T do que a extremidade 5' da sequência complementar reversa. Além disso, como o pareamento de base de GT é melhor do que o pareamento de base de A-C, a estrutura de grampo é geralmente mais forte no filamneto; e
[000209] Como usado neste pedido, a posição da repetição terminal é a repetição da extremidade que mostra que a variação de sequência na sua extremidade 3' é geralmente a repetição terminal.
[000210] O líder de CRISPR é um segmento de DNA conservado de tamanho definido que é localizado imediatamente a montante da primeira repetição. Por exemplo, a sequência líder de CRISPR1 de S. thermophilus é o segmento de DNA que começa imediatamente após o códon de parada do gene str0660, e termina logo antes da primeira repetição. O líder de CRISPR está localizado na extremidade 5' do locux de CRISPR. O líder de CRISPR está localizado imediatamente a montante da primeira repetição de CRISPR do locux de CRISPR.
[000211] O reboque de CRISPR é um segmento de DNA conservado de tamanho definido, que está localizado imediatamente a jusante da repetição terminal. Por exemplo, a sequência de reboque de CRISPR1 de S. thermophilus é o segmento de DNA que começa imediatamente após repetição terminal, e termina logo antes do códon de parada do gene str0661 (localizado no filamento de DNA oposta). O reboque de CRISPR é localizado na extremidade 3' do locux de CRISPR. O reboque de CRISPR está localizado imediatamente a jusante da repetição terminal.
[000212] Por exemplo, sequências líder de CRISPR e reboque de CRISPR no locux de CRISPR1 da cepa Streptococcus thermophilus CNRZl066 são: Líder de CRISPR: 5'- CAAGGACAGTTATTGATTTTATAATCACTATGTGGGTATAAAAACG TCAAAATTTCATTTGAG-3' (SEQ ID NO:688) Reboque de CRISPR: 5'- TTGATTCAACATAAAAAGCCAGTTCAATTGAACTTGGCTTT-3' (SEQ ID NO:691)
[000213] O líder de CRISPR corresponde a posições 625038 a 625100, e o reboque de CRISPR equivale a posições 627845 a 627885 no genoma completo (CP000024) de S. thermophilus.
[000214] Como usado neste pedido, o termo "a montante" significa na direção 5' e "a jusante" significa na direção 3'. Como usado neste pedido o termo "porção do mesmo no contexto de um locux de CRISPR" significa pelo menos aproximadamente 10 nucleotídeos, aproximadamente 20 nucleotídeos, aproximadamente 24 nucleotídeos, aproximadamente 30 nucleotídeos, aproximadamente 40 nucleotídeos, aproximadamente 44 nucleotídeos, aproximadamente 50 nucleotídeos, aproximadamente 60 nucleotídeos, aproximadamente 70 nucleotídeos, aproximadamente 80 nucleotídeos, aproximadamente 90 nucleotídeos, aproximadamente 98 nucleotídeos ou até aproximadamente 100 ou mais nucleotídeos (por exemplo, pelo menos aproximadamente 44 a 98 nucleotídeos) de um locux de CRISPR. Em algumas modalidades preferenciais, o termo "porção do mesmo" significa pelo menos aproximadamente 10 nucleotídeos, aproximadamente 20 nucleotídeos, aproximadamente 24 nucleotídeos, aproximadamente 30 nucleotídeos, aproximadamente 40 nucleotídeos, aproximadamente 44 nucleotídeos, aproximadamente 50 nucleotídeos, aproximadamente 60 nucleotídeos, aproximadamente 70 nucleotídeos, aproximadamente 80 nucleotídeos, aproximadamente 90 nucleotídeos, aproximadamente 98 nucleotídeos ou aproximadamente 100 ou mais nucleotídeos (por exemplo, pelo menos aproximadamente 44 a 98 nucleotídeos) a partir de uma ou ambas as extremidades (isto é, extremidades 5' e/ou 3') de um locux de CRISPR. Em algumas modalidades preferenciais, o termo "porção do mesmo" refere-se a pelo menos aproximadamente os primeiros 44 nucleotídeos na extremidade 5' de um locux de CRISPR ou aproximadamente os últimos 44 nucleotídeos na extremidade 3' de um locux de CRISPR.
[000215] Em algumas modalidades adicionais, o termo "porção do mesmo no contexto de um locux de CRISPR" significa pelo menos aproximadamente os primeiros 10 nucleotídeos, aproximadamente 20 nucleotídeos, aproximadamente 24 nucleotídeos, aproximadamente 30 nucleotídeos, aproximadamente 40 nucleotídeos, aproximadamente 44 nucleotídeos, aproximadamente 50 nucleotídeos, aproximadamente 60 nucleotídeos, aproximadamente 70 nucleotídeos, aproximadamente 80 nucleotídeos, aproximadamente 90 nucleotídeos, aproximadamente 98 nucleotídeos, ou aproximadamente 100 ou mais nucleotídeos (por exemplo, pelo menos aproximadamente 44 a 98 nucleotídeos) a jusante do primeiro nucleotídeo da primeira repetição de CRISPR na extremidade 5' de um locux de CRISPR ou a montante do último nucleotídeo da última repetição de CRISPR na extremidade 3' de um locux de CRISPR. Em algumas modalidades preferenciais, o termo "porção do mesmo" refere-se a pelo menos aproximadamente os primeiros 44 nucleotídeos a jusante a partir do primeiro nucleotídeo da primeira repetição de CRISPR na extremidade 5' de um locux de CRISPR ou pelo menos aproximadamente 44 nucleotídeos a montante a partir do último nucleotídeo da última repetição de CRISPR na extremidade 3' de um locux de CRISPR.
[000216] Em algumas modalidades, o tamanho mínimo da sequência duplicada é aproximadamente 24 nucleotídeos e o tamanho mínimo da sequência de direcionamento é aproximadamente 20 nucleotídeos. Dessa maneira, em algumas modalidades preferenciais, o termo "porção do mesmo" no contexto de um locux de CRISPR, significa pelo menos 44 nucleotídeos.
[000217] Em algumas modalidades, o tamanho máximo da sequência duplicada é aproximadamente 40 nucleotídeos e o tamanho máximo da sequência de direcionamento é aproximadamente 58 nucleotídeos. Dessa maneira, em algumas modalidades, o termo "porção do mesmo" quando usado no contexto de um locux de CRISPR significa pelo menos aproximadamente 98 nucleotídeos. Em algumas modalidades preferenciais, o termo "porção do mesmo" no contexto de um locux de CRISPR significa pelo menos aproximadamente 44 a 98 nucleotídeos.
[000218] Quando comparado o locux de CRISPR ou uma porção do mesmo da bactéria parental e uma bactéria marcada, pelo menos aproximadamente 10 nucleotídeos, aproximadamente 20 nucleotídeos, aproximadamente 24 nucleotídeos, aproximadamente 30 nucleotídeos, aproximadamente 40 nucleotídeos, aproximadamente 44 nucleotídeos, aproximadamente 50 nucleotídeos, aproximadamente 60 nucleotídeos, aproximadamente 70 nucleotídeos, aproximadamente 80 nucleotídeos, aproximadamente 90 nucleotídeos, aproximadamente 98 nucleotídeos, ou aproximadamente 100 nucleotídeos (por exemplo, pelo menos aproximadamente 44 a 98 nucleotídeos) de um locux de CRISPR são comparados. Em algumas modalidades preferenciais, pelo menos aproximadamente 10 nucleotídeos, aproximadamente 20 nucleotídeos, aproximadamente 24 nucleotídeos, aproximadamente 30 nucleotídeos, aproximadamente 40 nucleotídeos, aproximadamente 44 nucleotídeos, aproximadamente 50 nucleotídeos, aproximadamente 60 nucleotídeos, aproximadamente 70 nucleotídeos, aproximadamente 80 nucleotídeos, aproximadamente 90 nucleotídeos, aproximadamente 98 nucleotídeos, ou aproximadamente 100 ou mais nucleotídeos (por exemplo, pelo menos aproximadamente 44 a 98 nucleotídeos) em uma ou ambas as extremidades de um locux de CRISPR são comparados.
[000219] Em algumas modalidades preferenciais, pelo menos aproximadamente os primeiros 10 nucleotídeos, aproximadamente 20 nucleotídeos, aproximadamente 24 nucleotídeos, aproximadamente 30 nucleotídeos, aproximadamente 40 nucleotídeos, aproximadamente 44 nucleotídeos, aproximadamente 50 nucleotídeos, aproximadamente 60 nucleotídeos, aproximadamente 70 nucleotídeos, aproximadamente 80 nucleotídeos, aproximadamente 90 nucleotídeos, aproximadamente 98 nucleotídeos ou aproximadamente 100 ou mais nucleotídeos (por exemplo, pelo menos aproximadamente 44 a 98 nucleotídeos) na extremidade 5' de um locux de CRISPR ou na extremidade 3' de um locux de CRISPR são comparados. Em algumas modalidades preferenciais, pelo menos aproximadamente os primeiros 44 nucleotídeos na extremidade 5' de um locux de CRISPR ou aproximadamente os últimos 44 nucleotídeos na extremidade 3' de um locux de CRISPR são comparados.
[000220] Em algumas modalidades, pelo menos aproximadamente os primeiros 10 nucleotídeos, aproximadamente 20 nucleotídeos, aproximadamente 24 nucleotídeos, aproximadamente 30 nucleotídeos, aproximadamente 40 nucleotídeos, aproximadamente 44 nucleotídeos, aproximadamente 50 nucleotídeos, aproximadamente 60 nucleotídeos, aproximadamente 70 nucleotídeos, aproximadamente 80 nucleotídeos, aproximadamente 90 nucleotídeos, aproximadamente 98 nucleotídeos, ou aproximadamente 100 ou mais nucleotídeos (por exemplo, pelo menos aproximadamente 44 a 98 nucleotídeos) a jusante a partir do primeiro nucleotídeo da primeira repetição de CRISPR na extremidade 5' de um locux de CRISPR ou a montante do último nucleotídeo da última repetição de CRISPR na extremidade 3' de um locux de CRISPR são comparados. Em algumas modalidades preferenciais, pelo menos aproximadamente os primeiros 44 nucleotídeos a jusante a partir do primeiro nucleotídeo da primeira repetição de CRISPR na extremidade 5' de um locux de CRISPR ou aproximadamente pelo menos 44 nucleotídeos a montante do último nucleotídeo da última repetição de CRISPR na extremidade 3' de um locux de CRISPR são comparados.
[000221] Em algumas modalidades, o tamanho mínimo da sequência duplicada é aproximadamente 24 nucleotídeos e o tamanho mínimo da sequência de direcionamento é aproximadamente 20 nucleotídeos. Em algumas modalidades preferenciais, pelo menos 44 nucleotídeos são comparados. Em algumas modalidades alternativas, o tamanho máximo da sequência duplicada é aproximadamente 40 nucleotídeos e o tamanho máximo da sequência de direcionamento é aproximadamente 58 nucleotídeos. Em algumas modalidades preferenciais, pelo menos 98 nucleotídeos são comparados. Em algumas modalidades preferenciais alternativas, pelo menos aproximadamente 44 a 98 nucleotídeos são comparados.
[000222] Como usado neste pedido, o termo "repetição de CRISPR" tem significação convencional como usado na técnica (isto é, múltiplas repetições diretas curtas, que mostram nenhuma ou muito pouca variação de sequência dentro de um dado locux de CRISPR). Como usado neste pedido, no contexto, "repetição de CRISPR" é sinônima ao termo "CRISPR".
[000223] Um locux de CRISPR compreende uma ou mais repetições de CRISPR do que há nas CRISPR espaçadoras. Dessa maneira, a repetição de CRISPR equivale à sequência repetida em um locux de CRISPR. Por exemplo, exceto a repetição terminal, a sequência repetida típica CRISPR1 da sequência do S. thermophilus é: 5'- GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAAC-3'(SEQ ID NO: 1)
[000224] Variações pontuais desta sequência de repetição foram observadas mas são muito raras. Em comparação com esta sequência de repetição típica, a sequência de repetição terminal sempre mostra a mesma variação na sua extremidade 3'. Variações pontuais desta sequência de repetição terminal também foram observadas mas são raras. As repetições de CRISPR podem ocorrer naturalmente na bactéria parental. Os números de acesso de Genbank de sequências CRISPR1 incluem: CP000023, CP000024, DQ072985, DQ072986, DQ072987, DQ072988, DQ072989, DQ072990, DQ072991, DQ072992, DQ072993, DQ072994, DQ072995, DQ072996, DQ072997, DQ072998, DQ072999, DQ073000, DQ073001, DQ073002, DQ073003, DQ073004, DQ073005, DQ073006, DQ073007, DQ073008 e AAGS01000003.
[000225] Como descrito em detalhes adicionais neste pedido, uma sequência duplicada é derivada, derivável, obtida ou obtenível a partir de uma bactéria parental. Em algumas modalidades preferenciais, a sequência compreende o DNA genômico de uma bactéria parental. Em algumas modalidades particularmente preferenciais, a repetição de CRISPR duplicada (por exemplo, no mesmo locux de CRISPR) está integrada iterativamente, sequencialmente, simultaneamente ou substancialmente simultaneamente junto com a sequência de direcionamento na bactéria parental para dar origem a uma bactéria marcada.
[000226] O número de nucleotídeos em uma repetição é geralmente aproximadamente 20 a aproximadamente 40 pares de base (por exemplo, 36 pares de base), mas em outras modalidades é aproximadamente 20 a aproximadamente 39 pares de base, aproximadamente 20 a aproximadamente 37 pares de base, aproximadamente 20 a aproximadamente 35 pares de base, aproximadamente 20 a aproximadamente 33 pares de base, aproximadamente 20 a aproximadamente 30 pares de base, aproximadamente 21 a aproximadamente 40 pares de base, aproximadamente 21 a aproximadamente 39 pares de base, aproximadamente 21 a aproximadamente 37 pares de base, aproximadamente 23 a aproximadamente 40 pares de base, aproximadamente 23 a aproximadamente 39 pares de base, aproximadamente 23 a aproximadamente 37 pares de base, aproximadamente 25 a aproximadamente 40 pares de base, aproximadamente 25 a aproximadamente 39 pares de base, aproximadamente 25 a aproximadamente 37 pares de base, aproximadamente 25 a aproximadamente 35 pares de base, ou aproximadamente 28 ou 29 pares de base.
[000227] O número de nucleotídeos em uma repetição é geralmente aproximadamente 20 a aproximadamente 40 pares de base, mas pode ser aproximadamente 20 a aproximadamente 39 pares de base, aproximadamente 20 a aproximadamente 37 pares de base, aproximadamente 20 a aproximadamente 35 pares de base, aproximadamente 20 a aproximadamente 33 pares de base, aproximadamente 20 a aproximadamente 30 pares de base, aproximadamente 21 a aproximadamente 40 pares de base, aproximadamente 21 a aproximadamente 39 pares de base, aproximadamente 21 a aproximadamente 37 pares de base, aproximadamente 23 a aproximadamente 40 pares de base, aproximadamente 23 a aproximadamente 39 pares de base, aproximadamente 23 a aproximadamente 37 pares de base, aproximadamente 25 a aproximadamente 40 pares de base, aproximadamente 25 a aproximadamente 39 pares de base, aproximadamente 25 a aproximadamente 37 pares de base, aproximadamente 25 a aproximadamente 35 pares de base, ou aproximadamente 28 ou 29 pares de base. O número de repetições pode variar de aproximadamente 1 a aproximadamente 140, de aproximadamente 1 a aproximadamente 100, de aproximadamente 2 a aproximadamente 100, de aproximadamente 5 a aproximadamente 100, de aproximadamente 10 a aproximadamente 100, de aproximadamente 15 a aproximadamente 100, de aproximadamente 20 a aproximadamente 100, de aproximadamente 25 a aproximadamente 100, de aproximadamente 30 a aproximadamente 100, de aproximadamente 35 a aproximadamente 100, de aproximadamente 40 a aproximadamente 100, de aproximadamente 45 a aproximadamente 100, de aproximadamente 50 a aproximadamente 100, de aproximadamente 1 a aproximadamente 135, de aproximadamente 1 a aproximadamente 130, de aproximadamente 1 a aproximadamente 125, de aproximadamente 1 a aproximadamente 120, de aproximadamente 1 a aproximadamente 115, de aproximadamente 1 a aproximadamente 110, de aproximadamente 1 a aproximadamente 105, de aproximadamente 1 a aproximadamente 100, de aproximadamente 1 a aproximadamente 95, de aproximadamente 1 a aproximadamente 90, de aproximadamente 1 a aproximadamente 80, de aproximadamente 1 a aproximadamente 70, de aproximadamente 1 a aproximadamente 60, de aproximadamente 1 a aproximadamente 50, de aproximadamente 10 a aproximadamente 140, de aproximadamente 10 a aproximadamente 130, de aproximadamente 10 a aproximadamente 120, de aproximadamente 10 a aproximadamente 110, de 10 a aproximadamente 95, de aproximadamente 10 a aproximadamente 90, de aproximadamente 20 a aproximadamente 80, de aproximadamente 30 a aproximadamente 70, de aproximadamente 30 a aproximadamente 60, de aproximadamente 30 a aproximadamente 50, de aproximadamente 30 a aproximadamente 40, ou aproximadamente 32.
[000228] Em algumas outras modalidades, o número de nucleotídeos em uma repetição é aproximadamente 20 a aproximadamente 39 pares de base, aproximadamente 20 a aproximadamente 37 pares de base, aproximadamente 20 a aproximadamente 35 pares de base, aproximadamente 20 a aproximadamente 33 pares de base, aproximadamente 20 a aproximadamente 30 pares de base, aproximadamente 21 a aproximadamente 40 pares de base, aproximadamente 21 a aproximadamente 39 pares de base, aproximadamente 21 a aproximadamente 37 pares de base, aproximadamente 23 a aproximadamente 40 pares de base, aproximadamente 23 a aproximadamente 39 pares de base, aproximadamente 23 a aproximadamente 37 pares de base, aproximadamente 25 a aproximadamente 40 pares de base, aproximadamente 25 a aproximadamente 39 pares de base, aproximadamente 25 a aproximadamente 37 pares de base, aproximadamente 25 a aproximadamente 35 pares de base, ou aproximadamente 28 ou 29 pares de base.
[000229] Em algumas modalidades, o número de repetições varia de aproximadamente 1 a aproximadamente 144, de aproximadamente 1 a aproximadamente 100, de aproximadamente 2 a aproximadamente 100, de aproximadamente 5 a aproximadamente 100, de aproximadamente 10 a aproximadamente 100, de aproximadamente 15 a aproximadamente 100, de aproximadamente 20 a aproximadamente 100, de aproximadamente 25 a aproximadamente 100, de aproximadamente 30 a aproximadamente 100, de aproximadamente 35 a aproximadamente 100, de aproximadamente 40 a aproximadamente 100, de aproximadamente 45 a aproximadamente 100, de aproximadamente 50 a aproximadamente 100, de aproximadamente 1 a aproximadamente 135, de aproximadamente 1 a aproximadamente 130, de aproximadamente 1 a aproximadamente 125, de aproximadamente 1 a aproximadamente 120, de aproximadamente 1 a aproximadamente 1 15, de aproximadamente 1 a aproximadamente 110, de aproximadamente 1 a aproximadamente 105, de aproximadamente 1 a aproximadamente 100, de aproximadamente 1 a aproximadamente 95, de aproximadamente 1 a aproximadamente 90, de aproximadamente 1 a aproximadamente 80, de aproximadamente 1 a aproximadamente 70, de aproximadamente 1 a aproximadamente 60, de aproximadamente 1 a aproximadamente 50, de aproximadamente 10 a aproximadamente 140, de aproximadamente 10 a aproximadamente 130, de aproximadamente 10 a aproximadamente 120, de aproximadamente 10 a aproximadamente 110, de aproximadamente 10 a aproximadamente 95, de aproximadamente 10 a aproximadamente 90, de aproximadamente 20 a aproximadamente 80, de aproximadamente 30 a aproximadamente 70, de aproximadamente 30 a aproximadamente 60, de aproximadamente 30 a aproximadamente 50, de aproximadamente 30 a aproximadamente 40, ou aproximadamente 30, 31, 32, 33, 34 ou 35 repetições.
[000230] Em algumas modalidades, o número de repetições varia de aproximadamente 2 a aproximadamente 140, de aproximadamente 2 a aproximadamente 100, de aproximadamente 2 a aproximadamente 100, de aproximadamente 5 a aproximadamente 100, de aproximadamente 10 a aproximadamente 100, de aproximadamente 15 a aproximadamente 100, de aproximadamente 20 a aproximadamente 100, de aproximadamente 25 a aproximadamente 100, de aproximadamente 30 a aproximadamente 100, de aproximadamente 35 a aproximadamente 100, de aproximadamente 40 a aproximadamente 100, de aproximadamente 45 a aproximadamente 100, de aproximadamente 50 a aproximadamente 100.
[000231] Em algumas modalidades adicionais, o número de repetições varia de aproximadamente 2 a aproximadamente 135, de aproximadamente 2 a aproximadamente 130, de aproximadamente 2 a aproximadamente 125, de aproximadamente 2 a aproximadamente 120, de aproximadamente 2 a aproximadamente 115, de aproximadamente 2 a aproximadamente 110, de aproximadamente 2 a aproximadamente 105, de aproximadamente 2 a aproximadamente 100, de aproximadamente 2 a aproximadamente 95, de aproximadamente 2 a aproximadamente 90, de aproximadamente 2 a aproximadamente 80, de aproximadamente 2 a aproximadamente 70, de aproximadamente 2 a aproximadamente 60, de aproximadamente 2 a aproximadamente 50, de aproximadamente 2 a aproximadamente 40, de aproximadamente 2 a aproximadamente 30, de aproximadamente 2 a aproximadamente 20, de aproximadamente 2 a aproximadamente 10, de aproximadamente 2 a aproximadamente 9, de aproximadamente 2 a aproximadamente 8, de aproximadamente 2 a aproximadamente 7, de aproximadamente 2 a aproximadamente 6, de aproximadamente 2 a aproximadamente 5, de aproximadamente 2 a aproximadamente 4, ou de aproximadamente 2 a aproximadamente 3.
[000232] Em algumas modalidades, as repetições de CRISPR compreendem DNA, enquanto em outras modalidades, repetições de CRISPR compreendem RNA. Em algumas modalidades, o ácido nucleico é de origem genômica, enquanto em outras modalidades, é de origem sintética ou recombinante. Em algumas modalidades, os genes de repetição de CRISPR são de filamentos simples e de filamentos simples, se representam o filamento de senso ou antissenso ou combinações das mesmas. Em algumas modalidades, os genes de repetição de CRISPR são preparados pelo uso de técnicas de DNA recombinante (por exemplo, DNA recombinante), como descrito neste pedido.
[000233] Em algumas modalidades, uma ou mais das repetições de CRISPR são usadas para construir uma célula (por exemplo, uma célula-recipiente). Em algumas modalidades preferenciais, uma ou mais, preferencialmente, duas ou mais repetições de CRISPR são usadas para construir uma célula (por exemplo, uma célula-recipiente), que em combinação com um ou mais genes ou proteínas cas e uma ou mais CRISPR espaçadoras modulam a resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. Por exemplo, em algumas modalidades, a repetição(ões) de CRISPR são inseridas no DNA de uma célula (por exemplo, DNA plasmidial e/ou genômico de uma célula-recipiente), usando qualquer método adequado conhecido na técnica. Em modalidades adicionais, as repetição(ões) de CRISPR encontram uso como um molde na qual modificação (por exemplo, mutação) do DNA de uma célula (por exemplo, DNA plasmidial e/ou genômico de uma célula-recipiente), tal que as repetição(ões) de CRISPR são criadas ou construídas no DNA da célula. Em modalidades adicionais, as repetição(ões) de CRISPR estão presentes em pelo menos um construto, pelo menos um plasmídeo, e/ou pelo menos um vetor, etc. Em modalidades adicionais, as repetições de CRISPR são introduzidas na célula usando qualquer método adequado conhecido na técnica.
[000234] Em modalidades adicionais, a presente invenção fornece métodos para identificação de uma repetição de CRISPR para uso na modulação da resistência de uma célula contra um ácido nucleico-alvo ou produto de transcrição do mesmo compreendendo as etapas de: (i) preparação de uma célula compreendendo pelo menos uma CRISPR espaçadora e pelo menos um gene cas; (ii) planejamento da célula tal que contenha uma repetição de CRISPR; e (iii) determinação se a célula modula a resistência contra o ácido nucleico-alvo ou produto de transcrição do mesmo, em que a modulação da resistência da célula contra o ácido nucleico-alvo ou produto de transcrição do mesmo é indicativa que a repetição de CRISPR pode ser usada para modular a resistência.
[000235] Em algumas modalidades adicionais, um ou mais genes ou proteínas cas são usados em conjunto com ou em combinação com uma ou mais, preferencialmente, duas ou mais repetições de CRISPR e opcionalmente uma ou mais CRISPR espaçadoras. Em algumas modalidades particularmente preferenciais, o gene(s) ou proteína(s) cas e repetição(ões) de CRISPR formam uma combinação funcional como descrito abaixo. Em algumas modalidades, as repetições de CRISPR compreendem quaisquer dos nucleotídeos apresentados nas SEQ ID NOS: l a 22. As SEQ ID NOS: 1 a 12 são de S. thermophilus, enquanto as SEQ ID NOS: 13 a 16 são de Streptococcus agalactiae, SEQ NO: 17 é de S. mutans, e SEQ ID NOS: 18 a 22 são de S. pyogenes. GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAAC (SEQ ID NO:1) GTTTTTGTATTCTCAAGATTTAAGTAACTGTACAGT (SEQ ID N0:2) GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAGT (SEQ ID NO:3) GTTTTTGTACTCTCAAGATTTAAGTAACCGTACAAC (SEQ ID N0:4) GTTTTTGTACTCTCAAGATTTAAGTAACTGTGCAAC (SEQ ID N0:5) GTTTTTGTACTCTCAAGATTTAAGTAGCTGTACAGT (SEQ ID N0:6) GTTTTTGTACTCTCAAGATATAAGTAACTGTACAAC (SEQ ID NO:7) GTTTTTGTACTCTCAAGATCTAAGTAACTGTACAAC (SEQ ID NO:8) GTTTTTGTACTCTCAAGATGTAAGTAACTGTACAAC (SEQ ID N0:9) GTCTTTGTACTCTCAAGATTTAAGTAACTGTACAAC (SEQ ID NO:10) AAAAAAGTCCCCTCTCGAGGTAATTAGGTTTATATC (SEQ ID NO:11) GTTTCCGTCCCCTCTCGAGGTAATTAGGTTTATATC (SEQ ID NO:12) GTTTTAGAGCTGTGTTGTTTCGAATGGTTCCAAAAC (SEQ ID NO:13) GTTTTAAAGCTGTGCTGTTATTATGCTAGGGCACCA (SEQ ID NO:14) GTTTTAGAGCTGTGCTGTTTCGAATGGTTCCAAAAC (SEQ ID NO:15) GTTTTAGAGCTGTGCTGTTATTATGCTAGGACATCA (SEQ ID NO:16) GTTTTAGAGCCATGTTAGTTACTGATTTACTAAAAT (SEQ ID NO:17) GTTTTAGAGCTATGCTGTTTTGAATGGTCCCAAAAC (SEQ ID NO:18) GTTTTAGAGCTATGCTGTTTTGAATGGTCTCCATTC (SEQ ID NO:19) CTTTCAATCCACTCACCCATGAAGGGTGAGACG (SEQ ID NO:20) ATTTCAATCCACTCACCCATGAAGGGTGAGACT (SEQ ID N0:21) ATTTCAATCCACTCACCCATGAAGGGTGAGACC (SEQ ID NO:22) CRISPR Espaçadora
[000236] Como usado neste pedido, "CRISPR espaçadora" engloba sequências espaçadoras não-repetitivas que são encontradas entre múltiplas repetições diretas curtas (isto é, repetições de CRISPR) dos loci de CRISPR. Em algumas modalidades da presente invenção, uma "CRISPR espaçadora" refere-se ao segmento de ácido nucleico que é flanqueado por duas repetições de CRISPR. Foi encontrado que sequências espaçadoras CRISPR muitas vezes têm similaridades significantes a uma variedade de moléculas de DNA móveis (por exemplo, bacteriófagos e plasmídeos). Em algumas modalidades preferenciais, CRISPR espaçadoras são localizadas entre duas repetições de CRISPR idênticas. Em algumas modalidades, CRISPR espaçadoras são identificadas por análise de sequência nos intervalos de DNA localizados entre duas repetições de CRISPR. Em algumas modalidades preferenciais, a CRISPR espaçadora está naturalmente presente entre duas repetições diretas curtas idênticas múltiplas que são palindrômicas.
[000237] De maneira interessante, as células que carregam estas CRISPR espaçadoras são incapazes de ser infectadas por moléculas de DNA que contêm sequências homólogas aos espaçadores (Mojica et al. 2005). Em algumas modalidades preferenciais, a CRISPR espaçadora é homóloga ao ácido nucleico-alvo ou um produto de transcrição do mesmo ou uma sequência identificada. Embora a homologia também possa ser considerada em termos de similaridade, no contexto da presente invenção é preferencial para expressar a homologia em termo de identidade de sequência. Uma sequência homóloga é tomada para incluir uma CRISPR espaçadora, que pode ser pelo menos aproximadamente 70, aproximadamente 75, aproximadamente 80, sobre 85, ou aproximadamente 90% idênticos, ou pelo menos aproximadamente 91, aproximadamente 92, aproximadamente 93, aproximadamente 94, aproximadamente 95, aproximadamente 96, aproximadamente 97, aproximadamente 98, ou aproximadamente 99% idêntica à sequência-alvo de ácido nucleico ou um produto de transcrição do mesmo ou uma sequência identificada. Em algumas modalidades preferenciais, a CRISPR espaçadora é aproximadamente 100% idêntica à sequência-alvo de ácido nucleico. É também observado que o número de CRISPR espaçadoras em um dado loci ou locux de CRISPR pode variar entre espécies. Além disso, o número de espaçadores varia de aproximadamente 1 a aproximadamente 140, de aproximadamente 1 a aproximadamente 100, de aproximadamente 2 a aproximadamente 100, de aproximadamente 5 a aproximadamente 100, de aproximadamente 10 a aproximadamente 100, de aproximadamente 15 a aproximadamente 100, de aproximadamente 20 a aproximadamente 100, de aproximadamente 25 a aproximadamente 100, de aproximadamente 30 a aproximadamente 100, de aproximadamente 35 a aproximadamente 100, de aproximadamente 40 a aproximadamente 100, de aproximadamente 45 a aproximadamente 100, ou de aproximadamente 50 a aproximadamente 100. Em algumas modalidades preferenciais, o número de espaçadores varia de aproximadamente 1 a aproximadamente 135, de aproximadamente 1 a aproximadamente 130, de aproximadamente 1 a aproximadamente 125, de aproximadamente 1 a aproximadamente 120, de aproximadamente 1 a aproximadamente 115, de aproximadamente 1 a aproximadamente 110, de aproximadamente 1 a aproximadamente 105, de aproximadamente 1 a aproximadamente 100, de aproximadamente 1 a aproximadamente 95, de aproximadamente 1 a aproximadamente 90, de aproximadamente 1 a aproximadamente 80, de aproximadamente 1 a aproximadamente 70, de aproximadamente 1 a aproximadamente 60, de aproximadamente 1 a aproximadamente 50, de aproximadamente 1 a aproximadamente 40, de aproximadamente 1 a aproximadamente 30, de aproximadamente 1 a aproximadamente 20, de aproximadamente 1 a aproximadamente 10, de aproximadamente 1 a aproximadamente 9, de aproximadamente 1 a aproximadamente 8, de aproximadamente 1 a aproximadamente 7, de aproximadamente 1 a aproximadamente 6, de aproximadamente 1 a aproximadamente 5, de aproximadamente 1 a aproximadamente 4, de aproximadamente 1 a aproximadamente 3, ou de aproximadamente 1 a aproximadamente 2. Em algumas modalidades preferenciais, os CRISPR espaçadoras são identificadas pela análise de sequência como os intervalos de DNA localizadas entre duas repetições.
[000238] Como descrito neste pedido, a presente invenção fornece métodos e composições que facilitam o uso de um ou mais genes ou proteínas cas em combinação com uma ou mais, preferencialmente, duas ou mais repetições de CRISPR adequadas para conferir especificidade de imunidade a pelo menos uma CRISPR espaçadora em uma célula-recipiente. Em algumas modalidades preferenciais, pelo menos genes ou proteínas cas e pelo menos uma repetição de CRISPR são usados em combinações funcionais para conferir especificidade de imunidade a pelo menos uma CRISPR espaçadora em uma célula.
[000239] Como usado aqui, o termo "especificidade de imunidade" significa que a imunidade é conferida contra uma sequência de ácido nucleico específica ou produto de transcrição do mesmo, usando uma CRISPR espaçadora específica ou sequência de pseudo CRISPR espaçadora. Como indicado neste pedido, uma dada CRISPR espaçadora não confere resistência contra qualquer sequência de ácido nucleico ou produto de transcrição do mesmo mas somente àquelas sequências contra as quais a CRISPR espaçadora ou pseudo CRISPR espaçadora é homóloga (por exemplo, aquelas que são aproximadamente 100% idênticas).
[000240] Em algumas modalidades, as CRISPR espaçadora(s) são obtidas a partir de um organismo doador que é diferente da célula- recipiente. Em algumas modalidades preferenciais, células doadoras e recipientes são diferentes cepas bacterianas, espécies e/ou gêneros. Em algumas modalidades preferenciais, pelo menos um gene ou proteína cas e/ou pelo menos uma repetição de CRISPR são obtidos a partir de um organismo diferente do que o organismo recipiente. Em algumas modalidades preferenciais, pelo menos duas repetições de CRISPR são transferidas. Em algumas modalidades preferenciais adicionais, CRISPR espaçadoras são obtidas a partir de um organismo que é heterólogo ao recipiente ou uma célula doadora adicional a partir da qual pelo menos genes e/ou proteína cas, e/ou pelo menos uma repetição de CRISPR são obtidos. Em algumas modalidades alternativas preferenciais, as CRISPR espaçadoras são obtidas a partir de um organismo que é homólogo ao recipiente ou uma célula doadora adicional a partir da qual pelo menos genes e/ou proteínas cas, e/ou pelo menos uma repetição de CRISPR são obtidas. Em algumas modalidades preferenciais, a CRISPR espaçadora(s) é/são desenhada e produzida usando métodos recombinantes conhecidos na técnica. De fato, é destinado que as CRISPR espaçadoras sejam produzidas usando qualquer método adequado conhecido na técnica.
[000241] Em algumas modalidades, as CRISPR espaçadoras são heterólogas à célula-recipiente a partir da qual pelo menos genes ou proteínas cas e/ou pelo menos uma, e em algumas modalidades, preferencialmente, duas ou mais repetições de CRISPR são obtidas. Em algumas modalidades alternativas, as CRISPR espaçadoras são homólogas à célula-recipiente a partir da qual pelo menos genes ou proteínas cas e/ou pelo menos uma, e em algumas modalidades, preferencialmente, duas ou mais repetições de CRISPR são obtidas. De fato, é destinado que alguns dos elementos usados nos métodos sejam heterólogos ou homólogos. Em algumas modalidades, onde múltiplos elementos são usados (por exemplo, qualquer combinação de CRISPR espaçadora(s), repetição(ões) de CRISPR, gene(s) cas, e proteína(s) Cas, alguns elementos são homólogos um com outro e alguns elementos são heterólogos um ao outro (por exemplo, em algumas modalidades, a CRISPR espaçadora(s) e genes cas são homólogos, mas a repetição(ões) de CRISPR é/são heteróloga). Dessa maneira, em algumas modalidades, a CRISPR espaçadora está associada não-naturalmente com a repetição de CRISPR e/ou genes cas e/ou combinação gênica de repetição de CRISPR-cas funcional. De fato, é destinado que qualquer combinação de elementos heterólogos e homólogos encontra uso na presente invenção. Ainda em modalidades adicionais, as células doadoras e recipientes são heterólogas, enquanto em modalidades adicionais, são homólogas. É também destinado que os elementos contidos nas células doadoras e recipientes sejam homólogos e/ou heterólogos. Os elementos (por exemplo, CRISPR espaçadoras) são introduzidos no DNA plasmidial e/ou genômico da célula-recipiente utilizando qualquer método adequado conhecido na técnica.
[000242] Em algumas modalidades preferenciais, pelo menos uma CRISPR espaçadora é usada para construir uma célula (por exemplo, uma célula-recipiente). Em algumas modalidades adicionais, uma ou mais CRISPR espaçadoras são usadas em combinação com um ou mais genes ou proteínas cas e/ou uma ou mais, preferencialmente, duas ou mais repetições de CRISPR (em algumas modalidades preferenciais, uma ou mais combinações funcionais das mesmas são usadas) para modular a resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo, para produzir uma célula construída. Em algumas modalidades adicionais, as CRISPR espaçadoras são usadas como um molde sobre o qual modificação (por exemplo, mutação) do DNA plasmidial e/ou genômico de uma célula (por exemplo, uma célula-recipiente), tal que as CRISPR espaçadoras são criadas no DNA da célula. Em algumas modalidades, a CRISPR espaçadora(s) é clonado em pelo menos um construto, plasmídeo ou outro vetor, com o qual a célula-recipiente então é transformada, usando qualquer método adequado conhecido na técnica.
[000243] Em algumas modalidades adicionais, a presente invenção fornece métodos para identificação de uma CRISPR espaçadora para uso na modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo, compreendendo as etapas de: preparação de uma célula compreendendo pelo menos duas repetições de CRISPR e pelo menos um gene ou proteína cas; identificação de pelo menos uma CRISPR espaçadora em um organismo (por exemplo, um organismo doador); modificação da sequência da CRISPR espaçadora da célula tal que tenha homologia à CRISPR espaçadora do organismo doador compreendendo o ácido nucleico-alvo; e determinação se a célula modula a resistência contra o ácido nucleico-alvo, em que a modulação da resistência da célula contra o ácido nucleico-alvo ou produto de transcrição do mesmo é indicativa que a CRISPR espaçadora modula a resistência da célula contra o ácido nucleico- alvo.
[000244] Em algumas modalidades preferenciais, as CRISPR espaçadoras compreendem ou consistem na sequência nucleotídica apresentada a qualquer uma ou mais em qualquer um das SEQ ID NO:23 a 460 e/ou SEQ ID NOS:522 a 665. As SEQ ID NOS:23 a 339, 359 a 408, 522 a 665 são de S. thermophilus, enquanto SEQ ID NOS:340 a 358 são de S. vestibularis, SEQ ID NOS:409 a 446 são de S. agalactiae, SEQ ID NOS:447 a 452 são de S. mutans, e SEQ ID NOS:453 a 460 são de S. pyogenes. AGAACGTATTCCAAAACCTCTTTACGATTA (SEQ ID NO:23) TTAACTGTTATCAAAATGATAAGATAGTCT (SEQ ID NO:24) CGTTGATGTTTATTCAAGTAAAATAATTAA (SEQ ID NO:25) TCCTTTCACGGGTAGCACACTAACATACAC (SEQ ID NO:26) GTTGGCAATGCAAACAACCTTTATGAACCG (SEQ ID NO:27) TTTATTTCCTTGCGATAACGTTCCACCTTT (SEQ ID NO:28) AGATTATAAGGAACACAACCAACTATATAG (SEQ ID NO:29) ACGACATCAAGCTGATTGTCTTCTACATAA (SEQ ID NO:30) TTTGGAATACTGAATGTTTTACTGAAAATC (SEQ ID NO:31) ACACCACTATCTTTTCCTCCTGAAAATGAA (SEQ ID NO:32) GTAATTCCACGAAATTATCAACCTTATGCA (SEQ ID NO:33) TTGGAGGATTGCCCCATATTCCCAAGAGT (SEQ ID NO:34) GAGAGGCGTTAAATATAGAAATGCAAGATT (SEQ ID NO:35) TTTTAACGTCATCAGTCCACCGCCTTAAAT (SEQ ID NO:36) CACCTCTTTCGATGGAAAGGTATCCTTCTA (SEQ ID NO:37) GACCAAAGTTTGATTATAGAGCTATACACC (SEQ ID NO:38) ACCATCATTCTTACCATTACAACTGTAATG (SEQ ID NO:39 ATACGAATTCGGTTCGCACAATTACAATTC (SEQ ID NO:40) TATCAACGCAATCATTACAACAACTTCAAACA (SEQ ID NO:41) ATCTACGTGTCAATACATATCACAAAACAG (SEQ ID NO:42) ATTTTTAGAAATTTCTGATATAATAATGA (SEQ ID NO:43) TTGTTGGAACAAGGACGACTTGGTAAACTA (SEQ ID NO:44) CATATTAAGCTGACTGGGCCTAATGCTTTT (SEQ ID NO:45) TTCATAGCATACCGTAGTTGTAAAATCTAT (SEQ ID NO:46) AACATTTAGGGAATGAAATTGATAAGACTG (SEQ ID NO:47) AACATGAGAAACTGTAGAAAACAAGCAATA (SEQ ID NO:48) TGGTGAAGATGGCAGTCATAAATGGCACATT (SEQ ID NO:49) AAGGGTTGAAAAATGTTGGTATATCAAACG (SEQ ID NO: 50) TTCTGGTAGTGGATTTAGTCAAACAGATGT (SEQ ID NO:51) TCCATAGAGCGTCTTAAACAAAGAATAGTC (SEQ ID NO:52) TTATGATTGAATGACATGGTTGTATAAGTA (SEQ ID NO:53) TTTCTTTAGGAATACCAGGGAGTTCAGCTT (SEQ ID NO:54) TGGCAGAGATTACACAGCAACGGAAACAGC (SEQ ID NO:55) GGGTATCATTGTATCTAGTGATGGACCTGA (SEQ ID NO:56) ATTTGAAAAATGCACAACAGCGTTTGATAG (SEQ ID NO:57) GAGCTACCAGCTACCCCGTATGTCAGAGAG (SEQ ID NO:58) CGTTCCTTTTTTCAAGGTAATCTTTGAAAG (SEQ ID NO: 59) AAGTCCGTAAGCACCAGTTCCAATCGTCAT (SEQ ID NO:60) TTGAATACCAATGCCAGCTTCTTTTAAGGC (SEQ ID NO:61) AACCTCATACATGGGGAAAATTGGTAAGTA (SEQ ID NO:62) TAACTTCATTAGTGTAGTTGTAATTAGCAT (SEQ ID NO:63) TTAGCTACCCAAATATCTTCTGTTTTCCAA (SEQ ID NO:64) GAGTTTTCAATATTGGCACAGGAGACAATT (SEQ ID NO:65) TGATACTATTTTAGTCAGATATGAAATATC (SEQ ID NO:66) TCATCAATGTTTAAAGCCCAACAATACATGA (SEQ ID NO:67) TAGATTTAATCAGTAATGAGTTAGGCATAA (SEQ ID NO:68) AGGAAAATAGCATGAGCGTACAACAATCTA (SEQ ID NO:69) TGTCTATCACGCTTCCTAAGTGCATGAAAA (SEQ ID N. 70) ATGTCACCAATCACTAAAGAACCTACGCTG (SEQ ID NO:71) AACATCTTCCTCTCCGATTGCAAATAGTGC (SEQ ID NO: 72) CATATTTGGTGCCCGTTCGATAAAGAGTA (SEQ ID NO:73) CATTAAATCGCTTGAAGCAGACATTGAAGC (SEQ ID NO:74) GACTTATCTTGGAAGGTAGTGAAGGCACTT (SEQ ID NO: 75) TCCTTGCCATCTGCACTGTAAGCCCAAGCA (SEQ ID NO:76) TAGTACGCATAATCAATTCATCAAGCTTGA (SEQ ID NO:77) GTAGTGACCCAAAATTCTATGACCTTGAAA (SEQ ID NO:78) AGATTGTGGTGCTTACGGAAAATTCCTTGT (SEQ ID NO:79) TGGCAAGAAGTGTAAGAGATGCAATGGATA (SEQ ID NO:80) TTTATTATCATTATTCTTCTTCCCAAGCGT (SEQ ID NO:81) TTTTATAGAATTTGGTGGTGAACTTTTTCA (SEQ ID NO: 82) AATGGGTCACAGATTGCCATAATAAGGAG (SEQ ID NO: 83) CCGAGGTCACTTTAGAACCCACAAAATAAG (SEQ ID NO: 84) ATGAGAGAACACAGTATAGACCCTGATACA (SEQ ID NO: 85) CAGTATTAATGAGGTTTGGGTGGTCATTCC (SEQ ID NO: 86) CCATACTCTCTATCAGTTCATTTAATTCTTC (SEQ ID NO:87) TAATATGTCGCTCTACTGATTCCAAAACGG (SEQ ID NO:88) ATGAATTACATTCATGATTTTATCGAGTTT (SEQ ID NO:89) CGTGCCATTGTTTCGGTCGGACGTGGGCA (SEQ ID NO:90) CTTTCTAAGTTGAATTAAATTCAAGTTTTG (SEQ ID NO:91) TCGCTACTATGGTTAACGATGAGGAACTCT (SEQ ID NO:92) AGCAACTTTAAAACTAAAAGAGCTACTTGA (SEQ ID NO:93) AAAACCCTACACAGTGTGTGAGATGTGTCA (SEQ ID NO:94) AATGGGTCACAGATTGCCATAATAAGGAGG (SEQ ID NO:95) TTTTTTAAAATCCGTCATGCTATACTATAT (SEQ ID NO:96) AATTCAAACTTTCTCCAATAATACCCTCCA (SEQ ID NO:97) CATGCTTTCAGTTAATAAGACGTGGGACTA (SEQ ID NO:98) TGGAAGGGGTGTCTAGTGAAGAAATTGTCG (SEQ ID NO:99) CTCGAAGCGCTTCATTGCCCTATTCCTTTC (SEQ ID NO: 100) ATGTCTAAGGTATCCACTCGTGAAATCAT (SEQ ID NO: 101) ATATTAATGGAAATTTCATTCAAACGCAGT (SEQ ID NO: 102) TAGAGAGTTTATATCCTGATGGAATCGATG (SEQ ID NO: 103) TGGCGAATTAGAGAGCCAATGGCAAGCAAG (SEQ ID NO: 104) AGAAGACCAATAAACTTGAGAAAAAGCAAG (SEQ ID NO: 105) AAATGGTCGTTTAATTGTTAATGTCAAAGC (SEQ ID NO: 106) CAATTGATTCTAAAATGCTTGGTACACGTA (SEQ ID NO: 107) TCTTCGTGTTATCACAGCTTCTACACGTTG (SEQ ID NO: 108) GAAATCTCATTGAAACCAACTTCAAGACCA (SEQ ID NO: 109) TGCTTGGTAGTTGATGCACTGCATTAGTAA (SEQ ID NO: 110) AATGTACCGGAATAGCGTTACATTGCACAT (SEQ ID NO: 111) TTCATAAATTCTCACTTTTCCTTGCTATTC (SEQ ID NO: 112) TGTCGAAAAAATTACCTAGTCACGACAGAC (SEQ ID NO: 113) CAACAATTACTTATGCATTAGGAACATCTG (SEQ ID NO: 114) AATTCGTGAAAAACAATAAAAACAAAAAAA (SEQ ID NO: 115) TAACATTTCTGTCCATTTCTTCCTTGATGC (SEQ ID NO: 116) CAAGGCAACTCAACCAACCAAATTGACC (SEQ ID NO: 117) CTAAAATCGTAAATGGTAAGTTGCACGATG (SEQ ID NO: 118) AACGTAAGGAGTTTTTTTATTTCTTTGTTA (SEQ ID NO: 119) GTGGAAAATTTCACACCCTACATATATCAA (SEQ ID NO: 120) CCTCTGCTAATGACTTAAACGGCTCGTTTT (SEQ ID NO: 121) AAAATCAAAGTTTTGGGTTTGTCTACGTTG (SEQ ID NO: 122) ATATGTACATACCTAAAGAAAACACGGGCA (SEQ ID NO: 123) CGTTGTCAAAATATGTGATTACTTTGTATT (SEQ ID NO: 124) CCATAGCTGTAATGTTGTTTGTGACTGCTT (SEQ ID NO: 125) CGCTAAGTTTGGCTTTAAGTATAACAAGCT (SEQ ID NO: 126) AAAGTACGCTTCAAGGCACGTTGAAGACAT (SEQ ID NO: 127) CTTTTTAACGTGTTAGCGTCTTTAGCTTTG (SEQ ID NO: 128) TTGGCTTCGTGAATAATTTTTAAAACGCAT (SEQ ID NO: 129) TGTTGAATCAATACGCTGAAACACACTCCC (SEQ ID NO: 130) CGTTATCAGTTGAAAGTTTCAACTCGTAAG (SEQ ID NO: 131) TAAACTAGTTGGCATCTATGCTCCAGGAAG (SEQ ID NO: 132) TAGACCACCATAGCCGAGTTGTCTTTTTCG (SEQ ID NO: 133) ACATCCCACTTTCTGGGTTTTTTAGCCATG (SEQ ID NO: 134) AGTATGGCTATTGTCCTGATACTCATCCAC (SEQ ID NO: 135) CGCTCTTGACGTGGCTGGTGACATCTACGC (SEQ ID NO: 136) GAGTACATGGAGTTTCTGCTAGATACACTA (SEQ ID NO: 137) TAAGTTATGAAATATAAAGTTATTGTCTA (SEQ ID NO: 138) AACGTTATGACATTTAGGAGCTTCCAAATT (SEQ ID NO: 139) AACACAGCAAGACAAAAGGATGACACTTT (SEQ ID NO: 140) CAACCATAACTTACGCATCAGGTACATCTG (SEQ ID NO: 141) ACACGCGCTTACCTCGTATATCAAATTCA (SEQ ID NO: 142) TGCCCGCAAACTAGCGATACACAACAGCAT (SEQ ID NO: 143) CTCAAGCTCTTCATCTGTGATAGGTGTTTTG (SEQ ID NO: 144) ATCACTCTTTGATAGTATCTCAAACGCTGG (SEQ ID NO: 145) GAAACAGTCAGACCAGCTAATTCGCCAATT (SEQ ID NO: 146) ATATTTCGAAAGATACAAGGACACTTACAC (SEQ ID NO: 147) GCGGATGAAACACAACTTCAATTGTATTCA (SEQ ID NO: 148) TAATGCTACATCTCAAAGGATGATCCCAGA (SEQ ID NO: 149) ACGTCTGTCTAACTGGAAAGTACCTGCTAAT (SEQ ID NO: 150) CTGTTCTCTAATCGAGAGGCGCGTGATTGA (SEQ ID NO: 151) AAACCTCACTAGTCACTTAGTGCGGTTAGG (SEQ ID NO: 152) TATTAAGTTTAGTCCCAGGTTTCTTATCGT (SEQ ID NO: 153) AAACCAATAAACATACCGATTGCTGCCAAT (SEQ ID NO: 154) GCAAACGTTAGCCCAGGAAAGCATCATGAA (SEQ ID NO: 155) AAGAGCAAAAAATAACTCTAGCTCTCGTCC (SEQ ID NO: 156) AAGAAACCTCTAAGTTGAGCATTTAATGAT (SEQ ID NO: 157) ATATAGTTTTAAACTTTCTTGACCTTCTG (SEQ ID NO: 158) ACGTTGATGAATATTGTTGATAAACTTTA (SEQ ID NO: 159) CAAGAAGTGAACAAAGTACACGCTGGAAGT (SEQ ID NO: 160) GACAGCAAGATACACGTAGTTGATGAATTG (SEQ ID NO: 161) TAAGAAATCAACGCAGATTTTTAGCCAACA (SEQ ID NO: 162) TAACCCAATAATTACAGTGAAGCACAATAG (SEQ ID NO: 163) CAGGCGTAAGGTATGCTAATTATAACGAT (SEQ ID NO: 164) GCTATCGAACTAATAGCTTAGAGGAACTCA (SEQ ID NO: 165) GTGGAATATTAAGCCCGAATTGTTGCAGCA (SEQ ID NO: 166) TATTGCAATATTTGCGTTTGGGAAACCTTC (SEQ ID NO: 167) CGTCTGTCTAACTGGAAAGTACCGGCTAAT (SEQ ID NO: 168) AAAGAGATGTACCCATCCATTCTAACAGGT (SEQ ID NO: 169) GGGGAGTTGATTTCTTACATCAAAACAATG (SEQ ID NO: 170) CATCAAAGTTGAAAAGGACTACAACAGCCC (SEQ ID NO: 171) CTTAAATTTAGAGCGTGGGATCTTGAATAT (SEQ ID NO: 172) ATATACCGATGGCACATCTGAAACTGGCTG (SEQ ID NO: 173) TAACTCATATGTATCTTGACCAACTATTTT (SEQ ID NO: 174) AAATAGCACCTCTAAGCGTTAATGGTATTC (SEQ ID NO: 175) AATATCTACAGGTCACTACAAAGCTACGCT (SEQ ID NO: 176) GTTGGGGTGTGTTTGTAACGGCGTATGCTA (SEQ ID NO: 177) TCAATCAGGTGACGGTGATGCTTATATTAA (SEQ ID NO: 178) CATACATGATAGTTTGTCAACACTTTTGAT (SEQ ID NO: 179) TCAGCATTTGGTTTACATGACCCACGTCTG (SEQ ID NO: 180) CAATCAACAGGTTTGACTGATTATAACGGT (SEQ ID NO: 181) TAGCTACACATGAATTTTATTACAATGGTG (SEQ ID NO: 182) CTTACGTTTGAAAAGAATATCAAATCAATG (SEQ ID NO: 183) TTAAAAAAGGGCCTTTCTCTAAATCAAGTA (SEQ ID NO: 184) TGCTGAACGTATCTGTCCACTGTGTGGCCA (SEQ ID NO: 185) CCGTTCTTCAAACGTTAAATTCCAAGGTGT (SEQ ID NO: 186) GCTGCGATTATGACAATGCTGTCTGTAAGG (SEQ ID NO: 187) GAAGAATTTATTAATAAAGATGGTTCTGCT (SEQ ID NO: 188) AGGCAGAAAAGAAGTATTTTGGTAAGTATG (SEQ ID NO: 189) AAATGGTTTATCGACAAGAAAATGAAGCT (SEQ ID NO: 190) CCAAATTTGCATTATACAAAACGCTCCTTC (SEQ ID NO: 191) ATCCTAACTGCTTTGCTAACTACATCATGG (SEQ ID NO: 192) TAACAAGATAAGATTAGCGTCTTCAACAT (SEQ ID NO: 193) AAAAGCCTATGTTTGCCCACTTTGTGGAAG (SEQ ID NO: 194) TGTCACTTTCTCTTTCTGGGTTGTGCCAAT (SEQ ID NO: 195) CATACTTTTCCATCTGTTTGTTGTTTGAAAA (SEQ ID NO: 196) TGAGAGTGTCTGATGGATTTATTGGCAGCC (SEQ ID NO: 197) GGGGTTATTTTCCATTTTACCGTCTATCTA (SEQ ID NO: 198) TATCACGCCCATTTTCATTTCGCCATCTGT (SEQ ID NO: 199) AACATTTTAATATAATTTCTAAATCTATTG (SEQ ID NO:200) TACAAAATTCCTTCAAACGCTATTTATTGA (SEQ ID NO:201) AGAGTTTGAAAATTATTTTTCAGTTTCTA (SEQ ID NO:202) TTCCTCATCTTTCTCCGCTTTTGCTAGCTT (SEQ ID NO:203) TTGAGCGTTCTAGTGTGTGGCTTGTAATGAA (SEQ ID NO:204) TGAAAGAAATACAATACAACGATAATGACC (SEQ ID NO:205) CTAGTTTTAAGAGATAGCTCTCTAAGTAGG (SEQ ID NO:206) AAATTCGACATAAGCACTACAGTTATATT (SEQ ID NO:207) CTATTTTCGAGAGAACGTCAGTCATTTTAA (SEQ ID NO:208) GTGCTAACTATATCAGTCGCATCAATAACA (SEQ ID NO:209) TTAGCGGTGATTGGAATAGAATAAGCGAAT (SEQ ID NO: 210) CTTCTACAGCAGTTTAAGACACATTATCAT (SEQ ID NO:211) CGTATCGAAAACGGCGATAATCCAACAGT (SEQ ID NO:212) CAATACCTTTTTTTAATTCATCTTGATAAGT (SEQ ID NO:213) TTAAGAACAATATCATCAATACGACTTTCA (SEQ ID NO:214) CATCTATCAAATTCAAATTCGGATAAACTA (SEQ ID NO:215) TGAGAGTGTCTGATGGATTTATTGGTAACC (SEQ ID NO:216) ACCTCATACATGGGGAAAACTTGTAAGTA (SEQ ID NO:217) TATTTCACGAATTTCTACACTTTTCAACCT (SEQ ID NO:218) CTGAAACCTTGTTTTGAAGCGCTTGGAAGT (SEQ ID NO:219) GTCAATTGATACTGCAATCTCTTTAACATT (SEQ ID NO:220) ACTTCAATATGGTCAACATCTTGATCACCGA (SEQ ID NO:221) TAAACTCGACAAAAGCACTACATGAATATT (SEQ ID NO:222) ATTTTTTAAGGAAAGGAGGAAAATAATATA (SEQ ID NO:223) CGTTCAAAACAGCGAAAACTTAACCCTAAC (SEQ ID NO:224) CATTAAGTCGCTTGAGGCAGACATTGAAGC (SEQ ID NO:225) CCAAACTCAAATTGTCTATAATAATAACCG (SEQ ID NO:226) TATCTCTATTTCAGGTGGTTTAAAACATTC (SEQ ID NO:227) AAACGAAGATGGAAGCGTTGATGTTTATTC (SEQ ID NO:228) GATTGCATTTGCCAGTATTTCTTTTGATTA (SEQ ID NO:229) TGAAGACAACGGAAACAATCAACCTATTA (SEQ ID NO:230) ACTTCTTTTTTAATGTCATCTAAGACAATA (SEQ ID NO:231) GCCAATGATGTTCAATTCGTTAATGGAATT (SEQ ID NO: 232) TCAACATGGGATATTTCGTTGGTCAGGATG (SEQ ID NO:233) TATGGCTCTCTTGTTGGAATAAAGATGATT (SEQ ID NO:234) ATAACATAGCAGTCTATTTCTTTGCTGATG (SEQ ID NO:235) GTTACCACGCGCCCTACTGTATTAGTGGAG (SEQ ID NO:236) TACATACCCAAGGTTGTAAGTCGTTAAATT (SEQ ID NO:237) TGTAAGTAGTCAATATTCACTTCTGATAAC (SEQ ID NO:238) GATAGCAATAGCTTTCTTGACCTAAAAGAC (SEQ ID NO:239) GAGGTCTGTAATTTCATTCCCTCGTAATCT (SEQ ID NO:240) AAAGGTTTCTCTAAACACATGCGGAATAT (SEQ ID NO:241) GTCATAGTACCAAGCACAAATAACGTTAGT (SEQ ID NO:242) GTGTATTTAGTAATGGTGATTTTTTAAATT (SEQ ID NO:243) CATTCATTTTTTATATATCAATAAAACTTT (SEQ ID N..244) GGGGATTCTTATTTCACTGTAGTTACGATG (SEQ ID NO:245) CAAAAATTGATGTCACAATTAATAAAGGTG (SEQ ID NO:246) CTATTTCTGACAATGGTTGAAATTGTGTTC (SEQ ID NO:247) CTTTTTTTAAATTAATTTATCGTAAGCAA (SEQ ID NO:248) AACAAACTTATGAGAACGGTTGAACGGCTT (SEQ ID NO:249) AGCCCGCTTATTGCTTCAGTTGGTTTATAT (SEQ ID NO:250) TGGAGCAACAAGAATGATTAACTCTAATGC (SEQ ID NO:251) TTTGATGGATATCATTGATAAACTATACGA (SEQ ID N. 252) TAACGAAAGCAATACCAATCGTGCTAAAGC (SEQ ID NO:253) TATTCCTATGGTCGATATTCGAACAGTCAA (SEQ ID NO:254) CAGGGGACAAGGACTTTGACCCAACAGAAG (SEQ ID NO:255) AGAAACACCTAATGGTCTCTTAGAACCCGA (SEQ ID NO:256) AAGAAGTTAAAGACAACTTTGTTAAAGACT (SEQ ID NO:257) GAAAAAGCATCCATGATAGTGCTTAGACCT (SEQ ID NO:258) CGGAATGGTATAAAGAATACAAAGAAAACG (SEQ ID NO:259) CCAAGTATCACGCAAAGAAATCAACGAGA (SEQ ID NO:260) TTGACCTGTTTATCCTTGTTAACTAGAATAG (SEQ ID NO:261) AGAGCACTAGCATACTGTTTAGTCCGAACG (SEQ ID NO:262) AGGCAAGGTATTTGATCCAACAGAAGCCAA (SEQ ID NO:263) CATGATTTACAACCACGCGCTAGACCAAG (SEQ ID NO:264) ACCTAGAAGCATTTGAGCGTATATTGATTG (SEQ ID NO:265) AATTTTGCCCCTTCTTTGCCCCTTGACTAG (SEQ ID NO:266) TAATAGTTTACCAAATCGTCCTTGTTCCAA (SEQ ID NO:267) ACCATTAGCAATCATTTGTGCCCATTGAGT (SEQ ID NO:268) ACGTCTGTCTAACTGGAAAGTACCTGTTAAT (SEQ ID NO:269) TTTTTATACTTTGGGTAATTACAAAATAG (SEQ ID NO:270) AAGAAAGAAATATTCTAGATATAGATATAA (SEQ ID NO:271) CAACGACCAACACAACAACTAAAGTTACTG (SEQ ID N. 272) TGATTATGGGTGTTAAACAAGGAGCTTATG (SEQ ID NO:273) TGAGTGGTAAGTACAAATACGCAGGACTGA (SEQ ID NO:274) TTATTTCCTCCTTTCCTTAAAAAAATTAGA (SEQ ID NO:275) GGATGTATCTGTTGAAAGAGGTGTGTATAT (SEQ ID NO:276) AATAGGTGAAAAATATGCAAGTCACACAAA (SEQ ID NO:277) AAAATGGCATTAAAAATTAACATAGGAATA (SEQ ID NO:278) TATCAGCTCGTAAATGTTCGATAGACTCTT (SEQ ID NO:279) ATTCCATTAACGTATTTGACTTCACTAGCT (SEQ ID NO:280) CTGTTACCGATCCAAGAGCAGACATCATAC (SEQ ID NO:281) AAGAAGCGGTTAAATGCTTCAACTGAATAG (SEQ ID NO:282) AATTGCTAAACATCTAAAAGACTTAACGGG (SEQ ID NO:283) GATGAAGATTTGACTGATGATAAAGAGAAA (SEQ ID NO:284) GACATCAGAAAGCAGTTTATAAATATTTTA (SEQ ID NO:285) TTTGAATTTAACAACCTTGATTTTGATATC (SEQ ID NO:286) TGATACGGTCAAAGTTTTTCCACTAATAGCG (SEQ ID NO:287) ATGGTTTTCATTTCCTGAACCCCTAAGAGG (SEQ ID NO:288) AAGTTATTGAAAAACGCCAACATGATGAGT (SEQ ID NO:289) ATATAAGTCCTCCTATTAATATCCACAATA (SEQ ID NO:290) TTGCCTCAAGAGATCCTGCTTGTTGCCAAG (SEQ ID NO:291) TCCCATAGTTTTAATGAGTCGGTTAACTTA (SEQ ID NO:292) GTGTACTAAAAGTGTGCTAAGTTCATAAGG (SEQ ID NO:293) ATATAGTGATTGTATCCAGCTGCGGCGTAG (SEQ ID NO:294) AAAAGCAAATCGCGAGTATAAAGGATATA (SEQ ID NO:295) TTTTAATTGATCTAGACACCCTATGAAATA (SEQ ID NO:296) ACAGAGGAGAGAAACCATGGCTATTTTAGA (SEQ ID NO:297) TGGCAGCAGTGAATTCGATGCCGAGCAAT (SEQ ID NO:298) CCAAGGAATACCAGGTCCTAAAGGTGCCGA (SEQ ID NO:299) CTAAATGAACTACAACAACAGCTTGATGA (SEQ ID NO:300) TACCTTAACATTTTCGATATTTTTCAAATT (SEQ ID NO:301) TTTGACTGCTTTTTT ATCTGAATTGTAATT (SEQ ID NO:302) CAGTAACCTAAAGCTCTATCAAGCCTATTT (SEQ ID NO:303) CGTCAAGCTGACAGACCTTGACAACAAATC (SEQ ID NO:304) AGGCATAAATAACATTGATAACCCTAACA (SEQ ID NO:305) GCCAACGAGGTCAAATATGTCAACGGCATT (SEQ ID NO:306) GAAATAGGAACTTCAAAGGTAATTTCTTTA (SEQ ID NO:307) ATTTAGAGCAAGGAAAGCAGTACATCATTA (SEQ ID NO:308) CTGTAATCATTTTTAAATCAGGATTATCAA (SEQ ID NO:309) TTAAATGTATCCTAGTATTTTTGTACTATA (SEQ ID NO:310) CCATCAGCCAACTGTATCGGCTACTTTCTA (SEQ ID NO:311) ATGCTCTTGGCGACTATCTCATGGAGCGTG (SEQ ID NO: 312) AGGAAAAAACCCAAACAACCCAAAATGTTA (SEQ ID NO:313) TCTAATTCTGTCACCACGACTATATCGCCA (SEQ ID NO:314) AATCTGTGTGGGAAGTAAAGATTGAAGATG (SEQ ID NO:315) ATAGTTTGTTAAGTCATACCCATTAAATTG (SEQ ID NO:316) TCCACATGATTACAAAGCCACGCAAGACCT (SEQ ID NO:317) GAAGACCAAAATTTGACAATGAGTCCTGC (SEQ ID NO:318) ATTATATTTAAGTTGTAAATGTTGCTTTTC (SEQ ID NO:319) GCAGACATTGGCTCAACAAGTGATTATGAA (SEQ ID NO:320) TGTTCTCATAAATTGCCTTTCCTTTTTATG (SEQ ID NO:321) CTTATCAAACATCAAGGATTGTAGATGAGG (SEQ ID NO:322) ATTTCATTAGTAGCTTGATAAATGTTTCTA (SEQ ID NO:323) GAAAATACTATACTTTAAAAGAAATTTTAA (SEQ ID NO:324) TCTCCTCCGACATAATCTTTTGTCTTTCCG (SEQ ID NO:325) ACAAAAGCACTGCCACCTATAGAAGCATTT (SEQ ID NO:326) AAAAACTTTATGCTATCCGTGTCAGTATAT (SEQ ID NO:327) TTTTCAATGATTGAAAGCCCATAACTAACA (SEQ ID NO:328) CTTTCATAGTTGTTACGAAATGTTTGGCAT (SEQ ID NO:329) CGATTTGCAATATGATGATATTGATGAATT (SEQ ID NO:330) TTTAGATGCTAGTCCTAAGACTGTAGAGAC (SEQ ID NO:331) GTAATCAAGCGTATATAAGTCAGGACTATC (SEQ ID NO:332) ATAACAGAAGGAGTAGGGGACGTAGGCGCG (SEQ ID NO:333) TTATTTGATAGGAATGTCAGTAATTTTTGA (SEQ ID NO:334) AACATTTCAGCGCTTACTTATCAATCTAAT (SEQ ID NO:335) GTATTAGTAGGCATACGATTATGGAAGTA (SEQ ID NO:336) CATATATATATATATATTTATTTTAAATAT (SEQ ID NO:337) TTGTCATAATAATTAAATCCAATAGGACTT (SEQ ID NO:338) GAAAATTTCTGTTGTGTTCTTAATATTAGC (SEQ ID NO:339) GTACTTCAAAGGTTCTAACTACATAACACA (SEQ ID NO:340) TAAAACCAGATGGTGGTTCTTCTGATACTA (SEQ ID NO:341) CATTTTCTTCAGTCAATTCGTTCTCAAGCG (SEQ ID NO:342) AAAGGACGGGGGCAATGAACAAACGACAAC (SEQ ID NO:343) TAATATCATTGATAGCTTCATCAAAGGCT (SEQ ID NO:344) TAAATTGTTCCTTGACTCCGAACTGCCCT (SEQ ID NO:345) AAACAATCGTTTATCTATCCTCAAAGGATG (SEQ ID NO:346) ATAAAAAAACGCCTCAAAAACCGAGACAAC (SEQ ID NO:347) TGGAAATCCCTTATATCGACAAATACGTTA (SEQ ID NO:348) TTCCCAGTCGTTGATTTTTATTGAATACCC (SEQ ID NO:349) GGACATCGAACAAGTCAATGCCGTAAGCTT (SEQ ID NO:350) AATCTTTAACCGGATTGTAGAACCGTTCGG (SEQ ID NO:351) TGCCTTTAAAATAACTAGATTTTACCATCA (SEQ ID NO:352) GAGCAAGCACAAGCAAGCTTTACTATCCT (SEQ ID NO:353) CAGATTGGTTTATCGAACAAGGTCGCAAGT (SEQ ID NO:354) CAAAAGCTGTTGGTTAACGGTGCTTTGGGCA (SEQ ID NO:355) CTTGTTTTTCCTCTGGGGTCTCTGCGACTT (SEQ ID NO:356) GAAATAAACTGCCCAAACATTTTTATTTTC (SEQ ID NO:357) TGAGTAAGCGACAAGCTAGAAATCAAGTCA (SEQ ID NO:358) ATAGCTAAGATGGAAGAAGCATCAAGCACC (SEQ ID NO: 359) CAGTATCTCAAACGCTGGATACAACAAGAT (SEQ ID NO:360) CCTACTCAGTGGACACCTGCAATTGAAGAC (SEQ ID NO:361) CGATTGGAACGGGTGCTTATGGCCTTAAC (SEQ ID NO:362) GCGAACAATTGAATTTGTTAGAAAATGTCG (SEQ ID NO:363) GAAGCATTTATTAATATAGATGGTTCTGCT (SEQ ID NO:364) TGCTGACGTATCTGTCCACTGTGTGCCA (SEQ ID NO:365) TTTTTATACTTTGGGTAAATTACAAAATAG (SEQ ID NO:366) TCAAGGTGTCGCCTTATGGAAAAGATGCTTG (SEQ ID NO:367) TGTAAAAATTTCTAGACGTTTAGACACTTTA (SEQ ID NO:368) AAATGATGATTGAATGCTTGAGATAGCAGT (SEQ ID NO:369) AATAAGAAGTTCTTGACGACCAACCGACAT (SEQ ID NO:370) TCGTCAACGTCGATACAGAACAACGTGCTT (SEQ ID NO:371) TGATTAGCAAATTTAAAACAGGATATTTGG (SEQ ID NO:372) AAAGACAAGCCCAAGGGATTGAACTAGCAA (SEQ ID NO:373) CGAACAGTTGGCGAGAAATCCGTCTGGCGT (SEQ ID NO:374) CTACATTATTGATCATGTTTTTTCTCCTGT (SEQ ID NO:375) TAGAAGGCTCTGGAAATACAAAGCAATTCT (SEQ ID NO:376) TAGAAGGCTCTGGTAAATACAAAGCAATTCT (SEQ ID NO:377) TCTGATGGCTCTTGGTAGGGAACTGGATAT (SEQ ID NO:378) TTTGATGGCTCTTGGTAGGGAACTGGATAT (SEQ ID NO:379) TTTTGATGGCTCTTGGTAGGGAACTGGATAT (SEQ ID NO:380) ACAGAACAAAATGGTAGAATATATCATCT (SEQ ID NO:381) CCCTGGACAAGCTATCAGCACATATCCTTG (SEQ ID NO:382) CGCTGTTGATGTAACCCGCTTTATATATAT (SEQ ID NO: 383) GAATGAATGTATTAGAGCAAGCACTTGACC (SEQ ID NO:384) TAGACGAAAAGGAAGGAAAATAGCATGAGC (SEQ ID NO:385) ATAACTCGATTGCTAACTTAAGCAAGCAGT (SEQ ID NO:386) CTGCATGTGTAACCATGACTTCTTCGTCGT (SEQ ID NO:387) CTTCGCTGGAAACTTCGTAGTCATACATAC (SEQ ID NO:388) AAGACCGCTGTACTGGTTGGTATTCGTACC (SEQ ID NO:389) CAACCAAGCGAACACAGCAGTAGCACCGCA (SEQ ID NO:390) ATGATGATGAAGTATCGTCATCTACTAAC (SEQ ID NO:391) CTTCACCTCAAATCTTAGAGATGGACTAAA (SEQ ID NO:392) AAAAGGTGCGTATGAAACTCATCCCAGCGG (SEQ ID NO:393) AAGGGTTTAAGTCCTTCATAGAGTGGAAAA (SEQ ID NO:394) CCTCAAAGCTTAAAATTGGGCTGAAGTAGA (SEQ ID NO:395) GCAATTTATTCGCTTGATGTACTCACGTTT (SEQ ID NO:396) TATTTATTGCAAATGGTTACCATATTTTTA (SEQ ID NO:397) TATTTTAGCACTACGGTATCAGCGTATCTC (SEQ ID NO:398) TGCTACGTGCTCTGGACGGGCGCTATCAGC (SEQ ID NO:399) AAATGAACAGACAAGAAGCAACAGAAATTG (SEQ ID NO:400) AAGTTGATCGTATCTATTTAGAATATCGCA (SEQ ID NO:401) ATTCACTTTGACAGATACTAATGCTACATC (SEQ ID NO:402) CAAGCAGTGTAAAGGTGGTTTATATGTTAA (SEQ ID NO:403) CATAGTATAGCCGTCTTCTTTGATTGATTG (SEQ ID NO:404) CCATGGGTGCTAAAGGTGATGACTACCGCT (SEQ ID NO:405) TTTCTAGGAATGGGTAATTATAGCGAGCTAGAAAGC (SEQ ID NO:406) AGTTGGGAAGGTCTTGGAAAATCTATGGCAAAAAACCT (SEQ ID NO:407) TATATGGTTCAAATGCGATTCAAAGACTATTCAAA (SEQ ID NO:408) TAATTGCCAATGCTTACAATATCTTCGTCA (SEQ ID NO:409) ATGTTCTGAATTACCTTTCTCGACACTCCG (SEQ ID NO:410) ACCATCAAGGCTCTTATCTGCAGATTGTTA (SEQ ID NO:411) AAATGGTTGCCAATGACTTTCTAGAGTGAT (SEQ ID NO:412) ACAAAATCTTTTGTTGCTCCTGGACGTATT (SEQ ID NO:413) ATGTAAGGTATTGTAAAACTTCTTCTTGCG (SEQ ID NO:414) ACTGTTCCTATAATTAAAATAAAAGAGGTA (SEQ ID NO:415) TGTTCCAGTAAAAAGTAATTTTAAAGCATT (SEQ ID NO:416) CGCTCGATTGATGCTATCAACTATATTGAA (SEQ ID NO:417) TTCTTCAAGAGAACTTGTAGAACAGCTTCA (SEQ ID NO:418) AAGGTACTTTTAGCTTGTTCTTGTGGTGTT (SEQ ID NO:419) ACAGCTACTGTAAATTCTGCTTTTACGGTT (SEQ ID NO:420) TAGTGCAGTTGTCAAGGAGATTGTGAGCGA (SEQ ID NO:421) TTTAACCTTTGAAAATGTGAAAGGCTCGTA (SEQ ID NO:422) GCGATGATGGTAAGTCATCATGGACAGCGT (SEQ ID NO:423) TTTTACACACGATGTCAGATATAATGTCAA (SEQ ID NO:424) AGTACTGCACTAGGAATTGTAGAGATCAAA (SEQ ID NO:425) CGTACCATCTATCAATTTACCGCAAGCTGT (SEQ ID NO:426) TTAAAAGATTTAAACTATCAAGCGTCAATT (SEQ ID NO:427) TTCTAAATGCTGGTGACTGCTTTGCATAAA (SEQ ID NO:428) TTGCTGCTAGACCCAAACAGTTTATTTTTAG (SEQ ID NO:429) TCCTTTTTTAGATAATGTGCGATCACGGAC (SEQ ID NO:430) TTTTACCAATGCTTCCATATCGCTTATAT (SEQ ID NO:431) TGGTTATACATTTACTAATCCATCAGCATT (SEQ ID NO:432) AAGCTAATTCTCATCTCACCGAGATGGATA (SEQ ID NO:433) AAAAACTCTTACCACTTACATACATGTATG (SEQ ID NO:434) GCTGGAGATTTTACAAGCAGTTTGAATTTC (SEQ ID NO:435) ATCACACCAGTCGTTATGATGGATGACTAT (SEQ ID NO:436) TGTCAACAGTACGTGAGACGAGTGTGTAGG (SEQ ID NO:437) TGAAGTTGATGGATATGTTGATTTAGAGCT (SEQ ID NO:438) TAATCATTTTATGAGAGATACCGCCTCAAG (SEQ ID NO:439) TTTAAAGAGATATCTGTTTCATCTTGCGGA (SEQ ID NO:440) AATCACTTCTGCATAAATATCTTTTACTTC (SEQ ID NO:441) AAACATCCGCAACGGGATAAATAAAGCTAG (SEQ ID NO:442) AGTTTCTTGTGGGTTAGCTTGTCCACCGTA (SEQ ID NO:443) GAACATGAAAGATTTTAAAAAAGAACATTT (SEQ ID NO:444) AGAGGGGAAAATATCAATGCCGAATGCTGA (SEQ ID NO:445) GATGGTACAAAATCATTTGTTGGTACTGAT (SEQ ID NO:446) AAAAGGAAACGCCATTAATTAATATGGTGA (SEQ ID NO:447) GATTGAACCAGCTAGCGCAGTTAGTGCTCT (SEQ ID NO:448) CGCTAAAAGCTGTTGTGTCATCATAGTTAG (SEQ ID NO:449) TAAATATTTTCAATTAGACAATAGACAAAC (SEQ ID NO:450) TGCCTATGTATTCGGACATGACTTGCCACA (SEQ ID NO:451) ATGTGAAAAGAAAGTAACTACTACATTTGA (SEQ ID NO:452) TGCGCTGGTTGATTTCTTCTTGCGCTTTTT (SEQ ID NO:453) TTATATGAACATAACTCAATTTGTAAAAAA (SEQ ID NO. 454) AGGAATATCCGCAATAATTAATTGCGCTCT (SEQ ID NO:455) TAAATTTGTTTAGCAGGTAAACCGTGCTTT (SEQ ID NO:456) TTCAGCACACTGAGACTTGTTGAGTTCCAT (SEQ ID NO:457) CTGTGACATTGCGGGATGTAATCAAAGTAAAAA (SEQ ID NO:458) AAAGCAAACCTAGCAGAAGCAGAAAATGACTT (SEQ ID NO:459) TGATGTAATTGGTGATTTTCGTGATATGCTTTTT (SEQ ID NO:460) CAACACATTCAACAGATTAATGAAGAATAC (SEQ ID NO: 522) TCCACTCACGTACAAATAGTGAGTGTACTC (SEQ ID NO:523) GCCCTTCTAATTGGATTACCTTCCGAGGTG (SEQ ID NO: 524) CTCAGTCGTTACTGGTGAACCAGTTTCAAT (SEQ ID NO:525) ATTGTCTATTACGACAACATGGAAGATGAT (SEQ ID NO: 526) GAGTTTCTTTGTCAGACTCTAACACAGCCGC (SEQ ID NO: 527) TTACTAGAGCGTGTCGTTAACCACTTTAAA (SEQ ID NO:528) TTCGTTAAAGTCACCTCGTGCTAGCGTTGC (SEQ ID NO:529) ATAACGGTAGCAAATATAAACCTGTTACTG (SEQ ID NO:530) GAAGTAGCCATACAAGAAGATGGATCAGCA (SEQ ID NO:531) ATGTCACTGAGTGTCTAAGCATTGCGTAC (SEQ ID NO:532) TGAATAAGCAGTTCTTGACGACCAACCGAC (SEQ ID NO:533) TTACGTTTGAAAAGAATATCAAATCAATGA (SEQ ID NO:535) GCTCTACGACTTCTTCCACGAGTTCCTGCC (SEQ ID NO:536) AACACAGCAAGACAAGAGGATGATGCTATG (SEQ ID NO: (SEQ ID NO:537) AAGTAGTTGATGACCTCTACAATGGTTTAT (SEQ ID NO: 538) AATAATTTATGGTATAGCTTAATATCATTG (SEQ ID NO: 539) AATCAATACGACAAGAGTTAAAATGGTCTT (SEQ ID NO: 540) AATCGTTCAAATTCTGTTTTAGGTACATTT (SEQ ID NO:541) AATGACGAGGAGCTATTGGCACAACTTACA (SEQ ID NO: 542) AATTAAGGGCATAGAAAGGGAGACAACATG (SEQ ID NO:543) ACAATTCTTCATCCGGTAACTGCTCAAGTG (SEQ ID NO: 544) ACACTTGGCAGGCTTATTACTCAACAGCGA (SEQ ID NO: 545) ATAAACTATGAAATTTTATAATTTTTAAGA (SEQ ID NO: 546) ATAACTGAAGGATAGGAGCTTGTAAAGTCT (SEQ ID NO: 547) ATAATGCCGTTGAATTACACGGCAAGTCA (SEQ ID NO:548) CAACCAACGGTAACAGCTACTTTTTACAGT (SEQ ID NO: 549) CATAGAGTGGAAAACTAGAAACAGATTCAA (SEQ ID NO:550) CGACACAAGAACGTATGCAAGAGTTCAAG (SEQ ID NO:551) CGATATTTAAAATCATTTTCATAACTTCAT (SEQ ID NO: 552) CGATTTGACAATCTGCTGACCACTGTTATC (SEQ ID NO:553) CTGTTCCTTGTTCTTTTGTTGTATCTTTTC (SEQ ID NO: 554) GAGCGAGCTCGAAATAATCTTAATTACAAG (SEQ ID NO:555) GCAGTATCAGCAAGCAAGCTGTTAGTTACT (SEQ ID NO: 556) GCTGGCGAGGAAACGAACAAGGCCTCAACA (SEQ ID NO:557) GCTTAGCTGTCCAATCCACGAACGTGGATG (SEQ ID NO:558) GGCGTCCCAATCCTGATTAATACTTACTCG (SEQ ID NO: 559) GTTCGCTAGCGTCATGTGGTAACGTATTTA (SEQ ID NO:560) TCTATATCGAGGTCAACTAACAATTATGCT (SEQ ID NO:561) TGCATCGAGCACGTTCGAGTTTACCGTTTC (SEQ ID NO:562) TGTTTGACAGCAAATCAAGATTCGAATTGT (SEQ ID NO:563) TTCATTCTTCCGTTTTTGTTTGCGAATCCT (SEQ ID NO:564) TGACTTAGCGAATTTAATCGCTAAGATATC (SEQ ID NO:565) TTTATACTTTATCTTTTTAAAGAATGTATT (SEQ ID NO:566) CCTAAAATCATTTTCAACGAGTTGCGATAC (SEQ ID NO:567) AATAAATTGCTATGATACAGCGTACCGATA (SEQ ID NO:568) TGCTCTCTATGCGATTGGACGTCTGTCTAA (SEQ ID NO:569) AAGAAAGATAAGAAAAAAGTAACACTACTT (SEQ ID NO:570) TCTCTTTCCATCGGTACTGGTATATCTCAT (SEQ ID NO:571) ATTGGTAGCCAAGTAAATATCACCATTGAT (SEQ ID NO:572) TTCTTCAAATTCACCGACTGCAAAATTACA (SEQ ID NO:573) GCTTCCTAAGTGCATGAAAATCGCAAACGG (SEQ ID NO:574) TATACCTGTCTATGTAAGGGAATTTAACTC (SEQ ID NO:575) GGTGTAGGTGCTGTTGGTAAGTTGTTTAAT (SEQ ID NO:576) GTGAAACAGGTTATCAAAAAACGTATATTG (SEQ ID NO:577) TTATTCTTGGAATTATTACAGACCCTACTA (SEQ ID NO:578) GCTTTCATTATATCACTTACTCATAAATCT (SEQ ID NO:579) TAATCACCCCTTTTTCTAGCTCTTGATTGA (SEQ ID NO:580) CAAGCAGTGTAAAGGTGGTTTAAATGTTAA (SEQ ID NO:581) AACCCGCGTGGTTATGGGCTTGAGGAGTGT (SEQ ID NO:582) ATATTAATAGCGATTCTATGCTACAACGTG (SEQ ID NO:583) TCATCTTCTAAGTAAATACCACTGTCAGGG (SEQ ID NO:584) TTTTCGCAAAGTAAGCGAAGCTCTACGTG (SEQ ID NO:585) TTCTGTAGCCACTCCGTGGATGCCTTCAGC (SEQ ID NO: 586) TTCTTTAGTTCGGACACCCTCAACACCTAT (SEQ ID NO: 587) GCTTTGATTGGACGGAAAATGGTATCCCTG (SEQ ID NO:588) TTCCTCATCTTTCTCCGCTTTTGCTAGACTT (SEQ ID NO:589) TTAGACCAGATGGACAGATATTCTTCATCG (SEQ ID NO:590) TCATCAGAGTCAACAATCACGGGAAAGACCT (SEQ ID NO:591) ACACTCATCCTTATCCTGTAGTTCAAAACA (SEQ ID NO:592) CAGCACTAGCCGCAAGCCCTTGTATATTAA (SEQ ID NO:593) TAGAAATCAAGGAACTTGGATGAAAAGTAA (SEQ ID NO:594) ATATGAAAGGGAAATGATATGAAGAATGAA (SEQ ID NO:595) TTTTGGGATACAACACGCAGTCGTTGACTTG (SEQ ID NO:596) GTTTGAGATGCCAATGTTTTTCAATCCTTG (SEQ ID NO:597) GTATCAAAAGACGCATTCATGAAGCGAGCT (SEQ ID NO:598) AAAAACAATTGAAATTCATAATCAGCGCTT (SEQ ID NO:599) GCTTTTAACGTTTTAAGAGAATACCCTCT (SEQ ID NO:660) GTGACGCTGCAATGACTTGCCATAGTAATT (SEQ ID NO:601) ATACTGGTATATAGTAATTCATACTTCATC (SEQ ID NO:602) TTGGTTTCATATTTACTCCTTTGTGTTTTG (SEQ ID NO:603) CTGATTTGGTCTTGTTCTTTTGTCCCTTTT (SEQ ID NO:604) GCAGCAGTTGAGAACTTTAGCGTCCAGTGG (SEQ ID NO:605) TGCTACTATGAAGGACGCTGTTGATACTTT (SEQ ID NO:606) TCTTCTTTAATCTTTTTTAACGTCAACGTT (SEQ ID NO:607) GTATCCATTAATATAGTAGCATTTCTATCA (SEQ ID NO:608) ATTCATTAATATCTGCAAGGATGTCTTGTT (SEQ ID NO:609) GAGAAAGTAGCCCATTCGGCCCATTCGGGG (SEQ ID NO:610) TACTTGAGTTAGCTCTGGAAGTCATTTATC (SEQ ID NO:611) CTGCATTTGTAACCATGACTTCTTCGTCGT (SEQ ID NO:612) AATTTGTCATCGACATCTACCAACGCCCAG (SEQ ID NO:613) ATAAAATTATGCCACGTTTTGGCACTAGAT (SEQ ID NO:614) ATGTCTCTGAGGCTGTAGTAATTTACTTGT (SEQ ID NO:615) CTTTAAAGAGTTGATTAAGTGCGTTACTGT (SEQ ID NO:616) AAATGGGTTATGCTGTTCAATATGCGTCCC (SEQ ID NO:617) AAACTGAAAACAACACAGACAATTCAACAA (SEQ ID NO:618) GCCCAAAATGCTAGACGTTTGAATGACGGC (SEQ ID NO:619) ATGAAGAACGTGATTCACCTACGGTATGCT (SEQ ID NO:620) GCTTTTGCAGAATTGTCTCCAGTGCCGATTT (SEQ ID NO:621) TGTACTCTATTGATTGCTTCATCTTTATTA (SEQ ID NO:622) CTTTCAAGATACTCATCAACCATTGATGTCA (SEQ ID NO:623) CTATGTCTTTACTGTTCTTCCAAAACCACC (SEQ ID NO:624) TGCTACGTGCTCTGTACGGGCGCTATCAGC (SEQ ID NO:625) CGTGGCAGCGTGGTCGGGTTTAATAGCCCG (SEQ ID NO: 626) AAGCCCAAGTCAGAGCATCCGTCCAAGCC (SEQ ID NO:627) ATTGGGTTTCGGTAAGAACTAAACATACCA (SEQ ID NO:628) CACAAAATAATTCGGTAGTTTTTACTAACT (SEQ ID NO:629) TTTGACCGTTTATTTAGACGTGCTAAAGT (SEQ ID NO:630) CTTCACCTCAAATCTTAGAGCTGGACTAAA (SEQ ID NO:631) ATGTCTGAAAAATAACCGACCATCATTACT (SEQ ID NO:632) GAAGCTCATCATGTTAAGGCTAAAACCTAT (SEQ ID NO:633) TAGTCTAAATAGATTTCTTGCACCATTGTA (SEQ ID NO:634) ATTCGTGAAAAAATATCGTGAAATAGGCAA (SEQ ID NO:635) TCTAGGCTCATCTAAAGATAAATCAGTAGC (SEQ ID NO:636) TAAAAACATGGGGCGGCGGTAATAGTGTAAG (SEQ ID NO:637) ACAACCAGCAAAGAGAGCGCCGACAACATT (SEQ ID NO:638) TATAACACAGGTTTAGAGGATGTTATACTT (SEQ ID NO:639) CTAGAAGCTCAAGCGGTAAAAGTTGATGGCG (SEQ ID NO:640) CTTTGAGGGCAAGCCCTCGCCGTTCCATTT (SEQ ID NO:641) AACTACCAAGCAAATCAGCAATCAATAAGT (SEQ ID NO:642) CTATAAGTGACAATCAGCGTAGGGAATACG (SEQ ID NO:643) ATCAGTGCGGTATATTTACCCTAGACGCTA (SEQ ID NO:644) AACAGTTACTATTAATCACGATTCCAACGG (SEQ ID NO:645) AATTAGGGCGTCTTCCTTTATTCCGTGGTT (SEQ ID NO:646) ATAGCTTCATTGCGCTTTTTAATTTGACCT (SEQ ID NO:647) AACAACAAAGCAAATACAACAGTAACAACC (SEQ ID NO:648) CTAAACTACGTTTGAAGGTCTCAACTCCGT (SEQ ID NO:649) GAGGTTGAATAGTGAGTGCACCATGTTTGT (SEQ ID NO:650) AGTAGAGAGACCAGCACACTACTGTACTAC (SEQ ID NO:651) CTTCGCACGAAAGTTTATTAGACAACTCGC (SEQ ID NO:652) TGATAGAGCTAGAATTGTCTTTTTTACCGA (SEQ ID NO:653) AGATACTCTTGCTCGCCTCTGAACAACCAG (SEQ ID NO:654) GGTGAAAAAGGTTCACTGTACGAGTACTTA (SEQ ID NO:655) TCAATGAGTGGTATCCAAGACGAAAACTTA (SEQ ID NO:656) CCTTGTCGTGGCTCTCCATACGCCCATATA (SEQ ID NO:657) TGTTTGGGAAACCGCAGTAGCCATGATTAA (SEQ ID NO:658) ACAGAGTACAATATTGTCCTCATTGGAGACAC (SEQ ID NO:659) CTCATATTCGTTAGTTGCTTTTGTCATAAA (SEQ ID NO:660) AGAACTTTATCAAGATAAAACTACTTTAAA (SEQ ID NO:661) ATAGTATTAATTTCATTGAAAAATAATTGT (SEQ ID NO:662) GCTTTCTAGCTCGCTATAATTACCCATTCCTAGAAA (SEQ ID NO:663) TCAAAATATGTTATTACCTTGTATTTCATAATTCAATTAA (SEQ ID NO:664) CCACTTGCTGTGTACATCCTACCAGTTCCGCCTATGATG (SEQ ID NO:665)
[000245] Em modalidades particularmente preferenciais, os espaçadores de CRISPR são flanqueados por duas repetições de CRISPR (isto é, uma CRISPR espaçadora que tem pelo menos uma repetição de CRISPR em cada lado). Embora não seja destinado que a presente invenção seja limitada a qualquer determinado mecanismo, teoria, ou hipótese, é contemplado ainda que uma dada CRISPR espaçadora é da extremidade 5' do locux de CRISPR compreendendo gene(s) cas e/ou sequência líder, é a menor resistência conferida por aquela CRISPR espaçadora. Dessa maneira, em algumas modalidades da presente invenção, uma ou mais das primeiras 100 CRISPR espaçadoras da extremidade 5' do locux de CRISPR são modificadas, enquanto em outras modalidades, uma ou mais das primeiras 50 CRISPR espaçadoras da extremidade 5' do locux de CRISPR são modificadas. Em algumas modalidades adicionais, uma ou mais das primeiras 40 CRISPR espaçadoras da extremidade 5' do locux de CRISPR são modificadas, enquanto em algumas modalidades ainda adicionais, uma ou mais das primeiras 30 CRISPR espaçadoras da extremidade 5' do locux de CRISPR são modificadas, e ainda em modalidades adicionais, uma ou mais das primeiras 20 CRISPR espaçadoras da extremidade 5' do locux de CRISPR são modificadas, e ainda em mais modalidades, uma ou mais das primeiras 15 CRISPR espaçadoras da extremidade 5' do locux de CRISPR são modificadas. Em algumas modalidades preferenciais, uma ou mais das primeiras 10 CRISPR espaçadoras da extremidade 5' do locux de CRISPR são modificadas. Como indicado neste pedido, bactérias diferentes têm números diferentes de CRISPR espaçadoras, dessa forma em algumas modalidades, vários espaçadores são modificados. Núcleo de CRISPR Espaçadora
[000246] Para um tipo de CRISPR específica em uma espécie microbiana, a CRISPR espaçadora é tipicamente representada por um tamanho predominante definido, embora o tamanho possa variar. Tipos de CRISPR descritas até agora foram encontradas contendo um tamanho de espaçador predominante de entre aproximadamente 20 bp e aproximadamente 58 bp.
[000247] Como usado neste pedido, o termo "núcleo de CRISPR espaçadora" refere-se ao tamanho do espaçador observado mais curto dentro de um tipo de CRISPR. Dessa maneira, por exemplo, dentro de S. thermophilus CRISPR Tipo 1 (CRISPR1), o tamanho de espaçador dominante é 30 bp, com uma minoria de espaçadores entre 28 bp e 32 bp em tamanho. Dessa maneira, em S. thermophilus CRISPR Tipo 1, o núcleo de CRISPR espaçadora é definido como um intervalo contínuo de 28 bp.
[000248] Em algumas modalidades preferenciais da presente invenção, o núcleo de CRISPR espaçadora é homólogo ao ácido nucleico-alvo, um produto de transcrição do mesmo, ou uma sequência identificada além do tamanho da sequência núcleo. Como indicado acima, embora a homologia também possa ser considerada em termos de similaridade, em algumas modalidades preferenciais da presente invenção, a homologia é expressa em termos de identidade de sequência. Dessa maneira, em algumas modalidades, uma sequência homóloga engloba um núcleo de CRISPR espaçadora, que pode ser pelo menos aproximadamente 90% idêntico, ou pelo menos aproximadamente 91, aproximadamente 92, aproximadamente 93, aproximadamente 94, aproximadamente 95, aproximadamente 96, aproximadamente 97, aproximadamente 98 ou aproximadamente 99% idêntico à sequência-alvo de ácido nucleico, um produto de transcrição do mesmo, ou uma sequência identificada além do tamanho da sequência núcleo. Em algumas modalidades particularmente preferenciais, o núcleo de CRISPR espaçadora é aproximadamente 100% idêntica a sequência-alvo de ácido nucleico, produto de transcrição do mesmo, ou sequência identificada além do tamanho da sequência núcleo.
[000249] Durante o desenvolvimento da presente invenção, as sequências de CRISPR de várias cepas de S. thermophilus, incluindo cepas industriais estreitamente relacionadas e variantes resistentes ao fago foram analisadas. As diferenças no número e tipo de espaçadores foram observadas principalmente no locux de CRISPR1. Notavelmente, a sensibilidade ao fago pareceu ser correlacionada com o conteúdo de CRISPR1 espaçadora. Especificamente, o conteúdo de espaçador foi quase idêntico entre cepas parentais e derivadas resistentes ao fago, exceto por espaçadores adicional presentes no último. Estes achados sugeriram uma relação potencial entre a presença de espaçadores adicionais e diferenças observadas na sensibilidade ao fago de uma dada cepa. Esta observação incitou a investigação da origem e função de espaçadores adicionais presentes em mutantes resistentes ao fago. Espaçador de Pseudo-CRISPR
[000250] Como usado neste pedido, o termo "pseudo CRISPR espaçadora" refere-se a uma sequência de ácido nucleico presente em um organismo (por exemplo, um organismo doador, incluindo, mas não limitado ao bacteriófago), que é preferencialmente essencial para função e/ou sobrevivência e/ou replicação e/ou infectividade, etc., e que compreende uma sequência de CRISPR espaçadora. Em algumas modalidades, as pseudo CRISPR espaçadoras encontram uso na produção de sequências CRISPR espaçadoras que são complementares a ou homólogas à pseudo CRISPR espaçadora. Em algumas modalidades particularmente preferenciais, estas sequências encontram uso na modulação de resistência.
[000251] Em algumas modalidades, pelo menos uma pseudo CRISPR espaçadora e CRISPR espaçadora(s) que é/são complementar ou homóloga a pelo menos uma pseudo CRISPR espaçadora(s) são usadas para construir uma célula-recipiente. Em algumas modalidades preferenciais, pelo menos pseudo CRISPR espaçadoras ou CRISPR espaçadora(s) que é/são complementar ou homóloga a pelo menos uma pseudo CRISPR espaçadora(s) são usadas em combinação com um ou mais genes ou proteínas cas e/ou uma ou mais repetições de CRISPR (por exemplo, uma ou mais combinações funcionais das mesmas), para construir uma célula- recipiente, tal que a resistência da célula-recipiente é modulada contra um ácido nucleico-alvo ou um produto de transcrição do mesmo.
[000252] Em algumas modalidades, as pseudo CRISPR espaçadoras ou CRISPR espaçadora(s) que é/são complementar ou homóloga a uma ou mais pseudo CRISPR espaçadora(s) são inseridas no plasmídeo e/ou DNA genômico de uma célula-recipiente usando qualquer método adequado conhecido na técnica.
[000253] Em algumas modalidades adicionais, as pseudo CRISPR espaçadoras são usadas como um molde sobre o qual a modificação (por exemplo, mutação) do DNA plasmidial e/ou genômico de uma célula-recipiente, tal que as CRISPR espaçadoras são criadas no DNA plasmidial e/ou genômico da célula. Em algumas modalidades adicionais, as pseudo CRISPR espaçadoras ou CRISPR espaçadora(s) que é/são complementar ou homóloga a uma ou mais pseudo CRISPR espaçadora(s) são clonadas em um construto, plasmídeo e/ou vetor, etc. é/são introduzida na célula-hospedeira usando qualquer método adequado conhecido na técnica. CAS e Genes cas
[000254] Como usado neste pedido, o termo "gene cas" tem a significação convencional como usado na técnica e refere-se a um ou mais genes cas que são geralmente ligados, associados ou próximos ou na vizinhança dos loci de CRISPR flanqueadores. Uma revisão compreensiva da família de proteína Cas é apresentada por Haft et al. (Haft et al, PLoS. Comput. Biol., 1(6): e60 [2005]), em que 41 famílias do gene (cas) associadas a CRISPR recentemente são descritas, além das quatro famílias gênicas anteriormente conhecidas. Como indicado neste pedido, os sistemas de CRISPR pertencem a classes diferentes, com padrões de repetição diferentes, conjuntos de genes e variadas espécies. Como indicado neste pedido, o número de genes cas em um dado locux de CRISPR pode variar entre as espécies.
[000255] Em algumas modalidades, a presente invenção fornece métodos e composições para o uso de um ou mais genes ou proteínas cas, sozinhos ou em qualquer combinação com uma ou mais CRISPR espaçadoras para modulação da resistência em uma célula (por exemplo, uma célula-recipiente) contra um ácido nucleico-alvo ou um produto de transcrição do mesmo.
[000256] Em algumas modalidades, um ou mais dos genes e/ou proteínas cas ocorrem naturalmente em uma célula-recipiente e um ou mais espaçadores heterólogos é/são integrados ou inseridos adjacentes a um ou mais dos genes ou proteínas cas. Em algumas modalidades, um ou mais dos genes e/ou proteínas cas é/são heterólogos à célula-recipiente e um ou mais dos espaçadores é/são homólogos ou heterólogos. Em algumas modalidades preferenciais, os espaçadores estão integrados ou inseridos adjacentes a um ou mais dos genes ou proteínas cas.
[000257] Em algumas modalidades adicionais, a presente invenção fornece métodos e composições para o uso de um ou mais genes ou proteínas cas e pelo menos duas repetições de CRISPR para modulação da resistência em uma célula (por exemplo, uma célula- recipiente) contra um ácido nucleico-alvo ou um produto de transcrição do mesmo.
[000258] Ainda em modalidades adicionais, a presente invenção fornece métodos e composições para o uso de um ou mais genes ou proteínas cas, pelo menos duas repetições de CRISPR e pelo menos uma CRISPR espaçadora para modulação da resistência em uma célula (por exemplo, uma célula-recipiente) contra um ácido nucleico- alvo ou um produto de transcrição do mesmo.
[000259] Estruturas de CRISPR são tipicamente encontradas na vizinhança de 4 genes denominados cas1 a cas4. O arranjo mais comum destes genes é cas3-cas4-cas1-cas2. A proteína Cas3 parece ser uma helicase, ao passo que Cas4 se parece com a família RecB de exonucleases e contém um motivo rico em cisteína, sugestivo de ligação de DNA. Casl é geralmente altamente básica e é a única proteína Cas encontrada sistematicamente em todas as espécies que contêm loci de CRISPR. Cas2 continua sendo caracterizada. cas1 a 4 são tipicamente caracterizadas pela sua maior proximidade do loci de CRISPR e sua ampla distribuição através das espécies bacterianas e arqueanas. Embora não todos os genes cas1 a 4 se associem com todos os loci de CRISPR, são todos encontrados em múltiplos subtipos.
[000260] Além disso, há outro grupo de três genes associados a estruturas CRISPR em muitas espécies bacterianas, mencionadas neste pedido como cas1B, cas5 e cas6 (Vide, Bolotin et al., [2005], supra). É observado que a nomenclatura dos genes cas é em fluxo. Dessa maneira, o texto neste pedido deve ser tomado no contexto. Em algumas modalidades, o gene cas é selecionado a partir de cas1, cas2, cas3, cas4, cas1B, cas5 e/ou cas6. Em algumas modalidades preferenciais, o gene cas é cas1. Ainda em outras modalidades, o gene cas é selecionado a partir de fragmentos, variantes, homólogos de cas1, cas2, cas3, cas4, cas1B, cas5 e/ou cas6 e/ou derivados dos mesmos. Em algumas modalidades adicionais, uma combinação de dois ou mais genes cas encontra uso, incluindo quaisquer combinações adequadas, incluindo aquelas fornecidos em WO 07/025097, incorporado neste pedido por referência. Em algumas modalidades, uma pluralidade de genes cas é fornecida. Em algumas modalidades, há uma pluralidade de diferentes e/ou mesmos genes cas, ou qualquer combinação dos mesmos, conforme WO 07/025097.
[000261] Em algumas modalidades, os genes cas compreendem DNA, enquanto em outras modalidades, cas compreendem RNA. Em algumas modalidades, o ácido nucleico é de origem genômica, enquanto em outras modalidades, é de origem sintética ou recombinante. Em algumas modalidades, os genes cas são dupla fita ou de fita simples se representando a fita de senso ou antissenso ou combinações das mesmas. Em algumas modalidades, genes cas são preparados pelo uso de técnicas de DNA recombinante (por exemplo, DNA recombinante), como descrito neste pedido.
[000262] Como descrito neste pedido, em algumas modalidades, o gene cas compreende um fragmento de um gene cas (isto é, este fragmento do gene cas compreende uma porção de uma sequência de tipo selvagem). Em algumas modalidades, a sequência compreende pelo menos aproximadamente 30%, pelo menos aproximadamente 40%, pelo menos aproximadamente 50%, pelo menos aproximadamente 60%, pelo menos aproximadamente 65%, pelo menos aproximadamente 70%, pelo menos aproximadamente 75%, pelo menos aproximadamente 80%, pelo menos aproximadamente 85%, pelo menos aproximadamente 90%, pelo menos aproximadamente 95%, pelo menos aproximadamente 96%, pelo menos aproximadamente 97%, pelo menos aproximadamente 98%, ou pelo menos aproximadamente 99% da sequência de tipo selvagem.
[000263] Em algumas modalidades é preferencial que o gene cas seja o gene cas que está muito próximo à sequência líder ou primeira repetição de CRISPR na extremidade 5' do locux de CRISPR - tal como cas4 ou cas6.
[000264] Em algumas modalidades, a proteína Cas é selecionada a partir de Casl, Cas2, Cas3, Cas4, CaslB, Cas5 e/ou Cas6, bem como fragmentos, variantes, homólogos e/ou derivados dos mesmos. Em algumas modalidades adicionais, a proteína Cas é selecionada a partir de Casl, Cas2, Cas3, Cas4, CaslB, Cas5 e/ou Cas6, e combinações das mesmas, como descrito em WO 07/025097. Ainda em modalidades adicionais, a proteína Cas é selecionada a partir de um ou mais de Casl, Cas2, Cas3, Cas4, Cas1B, Cas5 e/ou Cas6 ou uma pluralidade das mesmas e/ou diferentes proteínas Cas, em qualquer número e/ou combinação adequada.
[000265] O termo "proteína Cas" também engloba uma pluralidade de proteínas Cas (por exemplo, entre aproximadamente 2 e aproximadamente 12 proteínas Cas, mais preferencialmente, entre aproximadamente 3 e aproximadamente 11 proteínas Cas, mais preferencialmente, entre aproximadamente 4 e aproximadamente 10 proteínas Cas, mais preferencialmente, entre aproximadamente 4 e aproximadamente 9 proteínas Cas, mais preferencialmente, entre aproximadamente 4 e aproximadamente 8 proteínas Cas, e mais preferencialmente, entre aproximadamente 4 e aproximadamente 7 genes de proteína; tal como 4, 5, 6, ou 7 proteínas Cas).
[000266] Em algumas modalidades, as proteínas Cas são codificadas por genes cas compreendendo DNA, enquanto em outras modalidades, cas compreende RNA. Em algumas modalidades, o ácido nucleico é de origem genômica, enquanto em outras modalidades, é de origem sintética ou recombinante. Em algumas modalidades, genes cas que codificam a proteína Cas são dupla fita ou de fita simples se representando a fita de senso ou antissenso ou combinações das mesmas. Em algumas modalidades, genes cas são preparados pelo uso de técnicas de DNA recombinante (por exemplo, DNA recombinante), como descrito neste pedido.
[000267] A presente invenção também fornece métodos para identificação de um gene cas para uso na modulação da resistência de uma célula contra um ácido nucleico-alvo ou produto de transcrição do mesmo compreendendo as etapas de: preparação de uma célula compreendendo pelo menos uma CRISPR espaçadora e pelo menos duas repetições de CRISPR; engenharia da célula tal que compreenda pelo menos um gene cas; e determinação se a célula modula a resistência contra o ácido nucleico-alvo ou produto de transcrição do mesmo, em que a modulação da resistência da célula contra o ácido nucleico-alvo ou produto de transcrição do mesmo é indicativa que o gene cas é útil na modulação da resistência da célula.
[000268] Em algumas modalidades adicionais, a presente invenção fornece métodos e um ou mais dos genes cas úteis na construção de células (por exemplo, células-recipientes). Em algumas modalidades preferenciais, um ou mais genes cas são usados para construir uma célula (por exemplo, uma célula-recipiente), que em combinação com uma ou mais, preferencialmente, duas ou mais repetições de CRISPR e uma ou mais CRISPR espaçadoras encontram uso na modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. Por exemplo, em algumas modalidades o gene(s) cas é/estão inserido no DNA de uma célula (por exemplo, DNA plasmidial e/ou genômico de uma célula-recipiente) usando qualquer método adequado conhecido na técnica. Em algumas modalidades adicionais, os genes cas são usados como um padrão sobre a qual a modificação (por exemplo, mutação) do DNA de uma célula (por exemplo, DNA plasmidial e/ou genômico de uma célula- recipiente), tal que os genes cas são criados ou formados no DNA da célula. Em algumas modalidades, os genes cas estão presentes em pelo menos um construto, pelo menos um plasmídeo, e/ou pelo menos um vetor que então é introduzido na célula, usando qualquer método adequado conhecido na técnica.
[000269] Em algumas modalidades, os genes cas compreendem pelo menos um grupo cas selecionado a partir de uma ou mais das SEQ ID NOS:461, 466, 473, 478, 488, 493, 498, 504, 509 e 517. Em modalidades adicionais, os genes cas compreendem qualquer uma ou mais das SEQ ID NOS:462 a 465, 467 a 472, 474 a 477, 479 a 487, 489 a 492, 494 a 497, 499 a 503, 505 a 508, 510 a 517, usadas sozinhas ou em conjunto em qualquer combinação adequada. Em algumas modalidades preferenciais, o grupo(s) é/são usado em combinação com uma ou mais, preferencialmente, duas ou mais repetições de CRISPR e opcionalmente uma ou mais CRISPR espaçadoras. Em algumas modalidades adicionais, um ou mais genes ou proteínas cas é/são usado em combinações adequadas.
[000270] Como indicado neste pedido, um dado conjunto de genes ou proteínas cas está sempre associado com uma dada sequência repetida em um determinado locux de CRISPR. Dessa maneira, genes ou proteínas cas parecem ser específicos para uma dada repetição de DNA (isto é, genes ou proteínas cas e a sequência repetida formam um par funcional).
[000271] Consequentemente, combinações particulares de um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR são usadas a fim de uma CRISPR espaçadora para conferir resistência contra um ácido nucleico-alvo ou produto de transcrição do mesmo em uma célula (por exemplo, uma célula-recipiente). Consequentemente, foi surpreendentemente encontrado que não é possível usar simplesmente qualquer gene ou proteína cas ou qualquer repetição de CRISPR. Em vez disso é uma característica da presente invenção que a combinação seja funcional.
[000272] No contexto do gene de repetição CRISPR-cas ou combinação proteica descrita neste pedido, o termo "funcional" significa que a combinação é capaz de conferir resistência a um ácido nucleico-alvo ou um produto de transcrição do mesmo quando usado em conjunto com uma CRISPR espaçadora que se alinha com ou é homóloga a um ácido nucleico-alvo ou produto de transcrição do mesmo. Como usado neste pedido, os termos "combinação de repetição CRISPR-cas funcional" e "combinação gênica de repetição CRISPR-cas funcional" incluem uma combinação funcional na qual cas é um gene cas ou uma proteína Cas.
[000273] Apropriadamente, um ou mais genes ou proteínas cas e/ou uma ou mais, preferencialmente, duas ou mais repetições de CRISPR são derivadas da mesma célula (por exemplo, a mesma célula- recipiente). Em algumas modalidades, o termo "derivável" é sinônimo do termo "obtenível", como usado no contexto. Em algumas modalidades preferenciais, o termo "derivável" é também sinônimo de "derivado", como usado no contexto, já que não é destinado que a presente invenção seja especificamente limitada a elementos que são "derivados". Em algumas modalidades, o termo "derivado" é sinônimo do termo "obtido", como usado no contexto.
[000274] Em algumas modalidades, um ou mais genes ou proteínas cas e/ou uma ou mais, preferencialmente, duas ou mais repetições de CRISPR são derivadas do mesmo locux de CRISPR em um genoma ou plasmídeo, preferencialmente um genoma ou plasmídeo da mesma cepa, espécies ou gêneros. Em algumas modalidades adicionais, um ou mais genes ou proteínas cas e/ou uma ou mais, preferencialmente, duas ou mais repetições de CRISPR são derivadas do mesmo locux de CRISPR em um genoma ou plasmídeo único, preferencialmente um genoma ou plasmídeo único da mesma cepa, espécies ou gêneros. Em algumas modalidades, um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR coocorrem naturalmente. Ainda em modalidades adicionais, um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR coocorrem naturalmente na mesma célula (por exemplo, célula-recipiente). Em modalidades adicionais, um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR coocorrem naturalmente no mesmo genoma de uma célula (por exemplo, célula-recipiente). Ainda em modalidades adicionais, um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR coocorrem naturalmente no mesmo genoma de uma cepa, espécies ou gêneros. Em algumas modalidades adicionais preferenciais, a presente invenção fornece qualquer combinação adequada de ácidos nucleicos que consistem essencialmente em pelo menos duas repetições de CRISPR e pelo menos um gene ou proteína cas.
[000275] Em algumas modalidades, o termo "consiste essencialmente em" refere-se a uma combinação de pelo menos duas repetições de CRISPR e pelo menos um gene ou proteína cas e excluindo pelo menos um componente adicional de um locux de CRISPR (por exemplo, a ausência de uma ou mais CRISPR espaçadora(s) e/ou a ausência de uma ou mais sequência(s) líder comum de um locux de CRISPR). Em algumas modalidades alternativas, o termo "consiste essencialmente em" refere-se a uma combinação de pelo menos duas repetições de CRISPR e pelo menos um gene ou proteína cas somente e excluindo todos os outros componentes de um locux de CRISPR (por exemplo, um locux de CRISPR que ocorre naturalmente). Em algumas modalidades adicionais, o termo "consiste essencialmente em" refere-se a uma combinação de pelo menos duas repetições de CRISPR e pelo menos um gene ou proteína cas somente e excluindo pelo menos um componente adicional de um locux de CRISPR, preferencialmente excluindo pelo menos um componente adicional de um locux de CRISPR que ocorre naturalmente. Em algumas modalidades ainda adicionais, o termo "consiste essencialmente em" refere-se a uma combinação de pelo menos duas repetições de CRISPR e pelo menos um gene ou proteína cas, com a condição de que pelo menos um componente adicional do locux de CRISPR natural esteja ausente (por exemplo, substancialmente ausente). Dessa maneira, é destinado que o termo encontre uso no contexto. Em algumas modalidades, a presente invenção fornece qualquer combinação adequada de pelo menos duas repetições de CRISPR e pelo menos um gene ou proteína cas, com a condição de que todos outros componentes do locux de CRISPR estejam ausentes (por exemplo, substancialmente ausente), preferencialmente que todos os outros componentes do locux de CRISPR da combinação natural de repetição(ões) de CRISPR e gene(s) cas estão ausentes. Em algumas modalidades adicionais, um ou mais genes ou proteínas cas são usados em combinação ou em conjunto com uma ou mais CRISPR espaçadoras. Em algumas modalidades adicionais, um ou mais genes ou proteínas cas são usados em combinação ou em conjunto com pelo menos uma ou mais CRISPR espaçadoras e pelo menos uma ou mais, preferencialmente, duas ou mais repetições de CRISPR. Em algumas modalidades, CRISPR espaçadora(s) são ou são derivadas de um organismo (por exemplo, um organismo doador) que é diferente daquela célula (por exemplo, célula-recipiente) a partir da qual um ou mais genes ou proteínas cas e/ou uma ou mais, preferencialmente, duas ou mais repetições de CRISPR são derivadas.
[000276] Vários arranjos de repetição(ões) de CRISPR e gene(s) ou proteína(s) cas, combinações de repetição de CRISPR-cas particularmente funcionais, são fornecidas. Em algumas modalidades, a combinação compreende, consiste ou consiste essencialmente em pelo menos qualquer de aproximadamente 9, aproximadamente 10, aproximadamente 11, aproximadamente 12, aproximadamente 13, aproximadamente 14, aproximadamente 15, aproximadamente 16, aproximadamente 17, aproximadamente 18, aproximadamente 19, ou aproximadamente 20 repetição(ões) de CRISPR em combinação com qualquer uma de aproximadamente 1, aproximadamente 2, aproximadamente 3, aproximadamente 4, aproximadamente 5, aproximadamente 6, aproximadamente 7, aproximadamente 8, aproximadamente 9, aproximadamente 10, aproximadamente 11, aproximadamente 12, aproximadamente 13, aproximadamente 14, aproximadamente 15, aproximadamente 16, aproximadamente 17, aproximadamente 18, aproximadamente 19, ou aproximadamente 20 genes ou proteínas cas (por exemplo, 16 repetições de CRISPR e 12 genes ou proteínas cas ou 18 repetições de CRISPR e 20 genes ou proteínas cas ou quaisquer outras combinações dos mesmos). A presente invenção fornece a repetição(ões) de CRISPR e gene(s) cas arranjados de várias maneiras, como fornecido em WO 07/025097. Em algumas modalidades nas quais a combinação de um gene cas e uma repetição de CRISPR compreende mais de um gene cas, será entendido que a repetição de CRISPR é inserida na extremidade 3' dos genes cas, a extremidade 5' dos genes cas, ou entre os genes cas, contanto que pelo menos um dos genes cas permaneça funcional.
[000277] Em algumas modalidades, um primeiro gene de repetição de CRISPR-cas ou combinação proteica (compreendendo pelo menos um gene ou proteína cas e pelo menos duas repetições de CRISPR, em que ambos são derivados do mesmo locux de CRISPR em um genoma) são usados em combinação com um segundo gene de repetição de CRISPR-cas ou combinação proteica (compreendendo pelo menos um gene ou proteína cas e pelo menos duas repetições de CRISPR, em que ambos são derivados do mesmo ou um locux de CRISPR diferente dentro de um genoma). Consequentemente, nestas modalidades da invenção, as primeiras e segundas combinações são derivadas dos mesmos ou diferentes loci de CRISPR dentro de um genoma. Dessa maneira, em algumas modalidades, o primeiro e segundo gene de repetição de CRISPR-cas ou combinações proteicas são de genomas diferentes (por exemplo, de genomas diferentes dentro do mesmo grupo), como descrito em detalhes adicionais neste pedido.
[000278] Ainda em modalidades adicionais da presente invenção, um primeiro e/ou um segundo gene de repetição de CRISPR-cas ou a combinação proteica (compreendendo pelo menos um gene cas e pelo menos duas repetições de CRISPR derivadas do mesmo locux de CRISPR em um genoma) são usados em combinação com aproximadamente 3, aproximadamente 4, aproximadamente 5, aproximadamente 6, aproximadamente 7, aproximadamente 8, aproximadamente 9, ou aproximadamente 10 ou mais genes de repetição de CRISPR-cas ou combinações proteicas (cada um compreendendo pelo menos um gene ou proteína cas e pelo menos duas repetições de CRISPR derivadas a partir do mesmo ou diferentes loci de CRISPR dentro de um genoma). Consequentemente, nestas modalidades da invenção, as combinações são derivadas dos mesmos ou diferentes loci de CRISPR dentro de um genoma. Em algumas modalidades adicionais da invenção, as combinações são de genomas diferentes (por exemplo, genomas diferentes dentro do mesmo grupo), como descrito em detalhes adicionais neste pedido.
[000279] Dessa maneira, em algumas modalidades, para o gene de repetição de CRISPR-cas ou combinação proteica para conferir resistência, a repetição(ões) de CRISPR e gene(s) ou proteína(s) cas coocorrem naturalmente em um dado locux de CRISPR de um genoma. Em algumas modalidades, a repetição(ões) de CRISPR e gene(s) ou proteína(s) cas coocorrem naturalmente no mesmo locux de CRISPR de um genoma. Em algumas modalidades, estas combinações funcionais tomadas em conjunto, conferem resistência contra um ácido nucleico-alvo ou um produto de transcrição do mesmo.
[000280] Em algumas modalidades adicionais, a presente invenção fornece métodos para identificação de uma combinação funcional de um gene ou proteína cas e uma repetição de CRISPR compreendendo as etapas de: análise das sequências (por exemplo, sequências de ácido nucleico ou proteicas) do gene ou proteína cas e repetição de CRISPR; identificação de um ou mais grupos de genes ou proteínas cas; identificação de um ou mais grupos de repetições de CRISPR; e combinação daquelas sequências gênicas ou protéicas de cas e de repetição CRISPR que estão incluídas no mesmo grupo.
[000281] Em algumas modalidades adicionais, a presente invenção fornece métodos para identificação de uma combinação funcional de um gene ou proteína cas e uma repetição de CRISPR para uso na modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo compreendendo as etapas de: preparação de uma célula compreendendo uma combinação de um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR; engenharia da célula tal que contenha uma ou mais CRISPR espaçadoras; e determinação se a célula modula a resistência contra um ácido nucleico-alvo, em que a modulação da resistência da célula contra o ácido nucleico-alvo ou um produto de transcrição do mesmo é indicativa que a combinação pode ser usada para modular a resistência da célula contra o ácido nucleico- alvo.
[000282] Em algumas modalidades, as sequências do gene cas e/ou da proteína e/ou da repetição de CRISPR são ou derivadas das mesmas ou diferentes cepas, espécies, gêneros e/ou organismos. Em algumas modalidades, a combinação compreende DNA e/ou RNA de origem genômica, recombinante e/ou sintética. Em algumas modalidades, a repetição(ões) de CRISPR compreende(m) DNA e/ou RNA de origem genômica, recombinante e/ou sintética. Em algumas modalidades, o gene(s) cas compreende(m) DNA e/ou RNA de origem genômica, recombinante e/ou sintética. De fato, é destinado que a presente invenção englobe qualquer combinação de DNA e/ou RNA de cada um dos elementos (por exemplo, gene cas e/ou repetição de CRISPR). Em algumas modalidades, os elementos são analisados usando qualquer método adequado conhecido na técnica. Em algumas modalidades preferenciais, a análise é conduzida usando análise de dotplot. Em algumas modalidades, a repetição de CRISPR e/ou gene cas são dupla fita, enquanto em outras modalidades, são fita única, se representando a fita de senso ou antissenso ou combinações das mesmas.
[000283] Em algumas modalidades, uma ou mais das combinações funcionais descritas neste pedido são usadas para construir uma célula (por exemplo, uma célula-recipiente). Em algumas modalidades preferenciais, uma ou mais combinações funcionais são usadas para construir uma célula (por exemplo, uma célula-recipiente), o que em combinação com uma ou mais CRISPR espaçadoras encontra uso na modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. Em algumas modalidades, as combinações funcionais são inseridas em DNA de uma célula- recipiente (por exemplo, como DNA plasmidial ou genômico de uma célula) usando qualquer método adequado conhecido na técnica. Em algumas modalidades adicionais, as combinações funcionais são usadas como um molde sobre o qual a modificação (por exemplo, mutação) do DNA de uma célula-recipiente (por exemplo, DNA plasmidial ou DNA genômico), tal que as combinações funcionais são criadas no DNA da célula. Ainda em modalidades adicionais, as combinações funcionais são clonadas em um construto, plasmídeo, ou vetor, etc., que então é transformado na célula, usando métodos, tais como aqueles descritos neste pedido e conhecidos na técnica.
[000284] Em algumas modalidades, a combinação funcional é obtida ou obtenível por um método compreendendo as etapas de: análise das sequências de um gene cas e uma repetição de CRISPR; identificação de um ou mais grupos de genes cas; identificação de um ou mais grupos de repetições de CRISPR; e combinação daquelas sequências de genes cas e de repetição CRISPR que estão incluídas no mesmo grupo, em que a combinação de sequências do gene cas e de repetição de CRISPR no mesmo grupo é indicativa que a combinação é uma combinação funcional.
[000285] Como indicado acima, foi surpreendentemente encontrado que não é possível simplesmente trocar combinações de repetição de CRISPR-cas entre quaisquer células (por exemplo, quaisquer cepas, espécies ou gêneros de células), como isto não necessariamente resulta em combinações de repetição de CRISPR-cas funcionais. De fato, para a combinação(ões) de repetição de CRISPR-cas ser funcional, tem que ser compatível. Dessa maneira, é contemplado que não é possível trocar genes cas ou repetições de CRISPR entre diferentes loci de CRISPR a menos que sejam do mesmo grupo. Ainda mais surpreendente é que os grupos não seguem a filogenia do "organismo". Especificamente, dentro de um organismo, pode haver mais de uma CRISPR. Estas CRISPR(s) podem pertencer a grupos diferentes, embora estejam presentes no mesmo organismo. Por conseguinte, acredita-se que uma combinação de repetição de CRISPR-cas funcional requer que a combinação seja trocada dentro de um grupo quando oposto em um organismo.
[000286] Para evitar dúvida, o termo "grupo" como usado neste pedido não se refere a um grupo de genes localizados no mesmo locux (tipicamente formando um operon), mas à produção da análise de comparação de sequência (por exemplo, múltipla análise de comparação de sequência e/ou múltiplos alinhamentos de sequência e/ou análise por dotplot). Consequentemente, em algumas modalidades, a análise de grupo de loci de CRISPR é realizada usando vários métodos que são conhecidos na técnica (por exemplo, tais como análise por dotplot como descrito neste pedido) ou múltiplo alinhamento seguido pelo cálculo de dendrograma. Em algumas modalidades, o grupo é uma classe, uma família ou um grupo de sequências.
[000287] Vantajosamente, o uso de combinação(ões) que coocorrem naturalmente de repetição de CRISPR-cas fornece para o intercâmbio da combinação dentro e entre uma dada espécie, por meio disso permitindo construir a resistência de uma cepa usando a combinação a partir de uma cepa diferente. Bacteriófago
[000288] Como usado neste pedido, o termo "bacteriófago" (ou "fago") tem a sua significação convencional como entendido na técnica (isto é, um vírus que seletivamente infecta uma ou mais espécies bacterianas). Muitos bacteriófagos são específicos para um determinado gênero ou espécie ou cepa de bactérias. Em algumas modalidades preferenciais, os fagos são capazes de infectar bactérias parentais e/ou células hospedeiras. Em algumas modalidades, os bacteriófagos são virulentos à bactéria parental. Em algumas modalidades, os fagos são líticos, enquanto em outras modalidades, os fagos são lisogênicos.
[000289] Um bacteriófago lítico é aquele que segue a via lítica através da realização do ciclo lítico, em vez de entrar na via lisogênica. Um bacteriófago lítico sofre replicação viral levando à lise da membrana celular, destruição da célula e liberação da progênie de partículas de bacteriófago capazes de infectar outras células.
[000290] Um bacteriófago lisogênico é capaz de entrar na lisogênica, na qual o bacteriófago torna-se uma parte latente, passiva do genoma da célula por meio anterior à realização do seu ciclo lítico.
[000291] Bacteriófagos que encontram uso na presente invenção incluem, mas não são limitados a bacteriófagos que pertencem a alguma das seguintes famílias de vírus: Corticoviridae, Cystoviridae, Inoviridae, Leviviridae, Microviridae, Myoviridae, Podoviridae, Siphoviridae ou Tectiviridae. Em algumas modalidades, bacteriófagos que infectam bactérias que são patogênicas a plantas e/ou animais (incluindo sere humanos) encontram uso particular. Em algumas modalidades particularmente preferenciais, a resistência de uma célula contra um bacteriófago é modulada.
[000292] Em algumas modalidades particularmente preferenciais, o bacteriófago da presente invenção inclui, mas não é limitado a, aqueles bacteriófagos capazes de infectar uma bactéria que naturalmente compreende um ou mais loci de CRISPR. Loci de CRISPR foram identificados em mais de 40 procariontes (Vide, por exemplo, Jansen et al., Mol. Microbiol., 43: 1565-1575 [2002]; e Mojica et al., [2005]) incluindo, mas não limitado a Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus, Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella, Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pasteurella, Photobacterium, Salmonella, Xanthamonas, Yersinia, Treponema e Thermotoga.
[000293] Em algumas modalidades, o bacteriófago inclui, mas não são limitados aqueles bacteriófagos capazes de infectar bactérias que pertencem aos seguintes gêneros: Escherichia, Shigella, Salmonella, Erwinia, Yersinia, Bacillus, Vibrio, Legionella, Pseudomonas, Neisseria, Bordetella, Helicobacter, Listeria, Agrobacterium, Staphylococcus, Streptococcus, Enterococcus, Clostridium, Corynebacterium, Mycobacterium, Treponema, Borrelia, Francisella, Brucella e Xanthomonas.
[000294] Ainda em modalidades adicionais, o bacteriófago inclui, mas não são limitados aqueles bacteriófagos capazes de infectar (ou transduzir) bactérias de ácido láctico, Bifidobacterium, Brevibacterium, Propionibacterium, Lactococcus, Streptococcus, Lactobacillus (por exemplo, L. acidophilus), Enterococcus, Pediococcus, Leuconostoc e Oenococcus.
[000295] Ainda em modalidades adicionais, o bacteriófago inclui, mas não são limitados aqueles bacteriófagos capazes de infectar Lactococcus lacti (por exemplo, L. lactis subsp. lactis e L. lactis subsp. cremoris, e L. lactis subsp. lactis biovar diacetylactis), Streptococcus thermophilus, Lactobacillus delbrueckii subsp. bulgaricus, Lactobacillus helveticus, Bifidobacterium lactis, Lactobacillus acidophilus, Lactobacillus casei, Bifidobacterium infantis, Lactobacillus paracasei, Lactobacillus salivarius, Lactobacillus plantarum, Lactobacillus reuteri, Lactobacillus gasseri, Lactobacillus johnsonii ou Bifidobacterium longum.
[000296] Ainda em modalidades adicionais, bacteriófagos incluem, mas não são limitados aqueles bacteriófagos capazes de infectar qualquer bactéria fermentativa suscetível à perturbação por infecção por bacteriófago, incluindo mas não limitados a processos de produção de antibióticos, aminoácidos e solventes. Os produtos produzidos pela fermentação que eram conhecidos por experimentar infecção por bacteriófago, e as bactérias de fermentação infectadas correspondentes, incluem o queijo cheddar e cottage (Lactococcus lactis subsp. lactis, Lactococcus lactis subsp. cremoris), iogurte (Lactobacillus delbrueckii subsp. bulgaricus, Streptococcus thermophilus), queijo suíço (S. thermophilus, Lactobacillus lactis, Lactobacillus helveticus), queijo azul (Leuconostoc cremoris), queijo italiano (L. bulgaricus, S. thermophilus), viili (Lactococcus lactis subsp. cremoris, Lactococcus lactis subsp. lactis biovar diacetylactis, Leuconostoc cremoris), yakult (Lactobacillus casei), caseína (Lactococcus lactis subsp. cremoris), natto (Bacillus subtilis var. natto), vinho (Leuconostoc oenos), saquê (Leuconostoc mesenteroides), polimixina (Bacillus polymyxa), colistina (Bacillus colistrium), bacitracina (Bacillus licheniformis), ácido L-glutâmico (Brevibacterium lactofermentum, Microbacterium ammoniaphilum), e acetona e butanol (Clostridium acetobutylicum, Clostridium saccharoperbutylacetonicum).
[000297] Em algumas modalidades preferenciais, as bactérias que encontram uso na presente invenção incluem, mas não são limitadas a S. thermophilus, L. delbrueckii subsp. bulgaricus e/ou L. acidophilus.
[000298] Em algumas modalidades particularmente preferenciais, os bacteriófagos incluem, mas não são limitados aqueles bacteriófagos capazes de infectar bactérias que compreendem um ou mais loci de CRISPR heterólogos. Em algumas modalidades, as bactérias compreendem um ou mais loci de CRISPR heterólogos, e/ou um ou mais genes cas heterólogos, e/ou uma ou mais repetições de CRISPR heterólogas, e/ou uma ou mais CRISPR espaçadoras heterólogas.
[000299] A infecção de bactérias por fago resulta da injeção ou transferência do DNA de fago em células. Em algumas modalidades, a infecção leva à expressão (isto é, transcrição e tradução) do ácido nucleico do bacteriófago na célula e continuação do ciclo de vida do bacteriófago. Em algumas modalidades envolvendo bacteriófago recombinante, sequências recombinantes no genoma de fago (por exemplo, ácidos nucleicos repórteres), também são expressos.
[000300] Foi encontrado que sequências espaçadoras CRISPR em procariontes muitas vezes têm similaridades significantes com várias moléculas de DNA, incluindo tais elementos genéticos como cromossomos, bacteriófagos e plasmídeos conjugativos. Foi relatado que células carregando estas CRISPR espaçadoras são incapazes de ser infectadas por moléculas de DNA contendo sequências homólogas aos espaçadores (Vide, Mojica et al., [2005]).
[000301] Em algumas modalidades da presente invenção, uma ou mais pseudo espaçadores particulares derivados do DNA de bacteriófago ou CRISPR espaçadora(s) que é/são complementar ou homóloga a um ou mais pseudo CRISPR espaçadora(s) são adicionados em um locux de CRISPR de uma célula (por exemplo, célula-recipiente), a fim de modular (por exemplo, fornecer) resistência contra um determinado bacteriófago, dessa forma substancialmente prevenindo o ataque de fago.
[000302] Em algumas modalidades preferenciais, determinadas regiões no genoma de fago são direcionadas para preparar os pseudo espaçadores, incluindo mas não limitadas a genes de codificação de proteínas de especificidade para o hospedeiro, incluindo aquelas que fornecem determinado reconhecimento de fago-hospedeiro, tais como helicases, primase, cabeça ou cauda estruturais proteicas, proteínas com um domínio conservado (por exemplo, holina, lisina e outras) ou sequências conservadas entre genes de fago importantes.
[000303] Qualquer ácido nucleico que se origina do genoma de fago pode conferir imunidade contra o fago quando inserido, por exemplo, entre duas repetições em um locux de CRISPR ativo. Em algumas modalidades, a imunidade é mais "eficiente" quando a CRISPR espaçadora corresponde a uma sequência interna de um gene de fago. Em algumas modalidades particularmente preferenciais, a imunidade é feita ainda mais "eficiente" quando o gene codifica uma proteína "essencial" (por exemplo, o antirreceptor).
[000304] Em algumas modalidades preferenciais, a presente invenção fornece métodos para conferir resistência a uma célula (por exemplo, uma célula bacteriana) contra um bacteriófago compreendendo as etapas de: (a) fornecimento de uma ou mais pseudo CRISPR espaçadoras de pelo menos um bacteriófago; (b) identificação de uma ou mais combinações de repetição de CRISPR- cas funcionais em pelo menos uma célula que é substancialmente sensível ao bacteriófago; e (c) engenharia de um ou mais loci de CRISPR na célula substancialmente sensível tal que compreendam uma ou mais pseudo CRISPR espaçadoras de um bacteriófago ou uma ou mais CRISPR espaçadora(s) que é/são complementar ou homóloga a uma ou mais pseudo CRISPR espaçadora(s) para produzir a célula resistente.
[000305] Ainda em modalidades adicionais, a presente invenção fornece métodos para conferir resistência a uma célula (por exemplo, uma célula bacteriana) contra um bacteriófago compreendendo as etapas de: (a) fornecimento de uma ou mais pseudo CRISPR espaçadoras de pelo menos um bacteriófago; (b) identificação de uma ou mais combinações de repetição de CRISPR-cas funcionais em pelo menos uma célula que é substancialmente sensível ao bacteriófago; e (c) inserção de uma ou mais pseudo CRISPR espaçadoras do bacteriófago ou uma ou mais CRISPR espaçadora(s) que é/são complementar ou homóloga a uma ou mais pseudo CRISPR espaçadora(s) na célula substancialmente sensível tal que a célula seja produzida substancialmente resistente ao bacteriófago.
[000306] Ainda em modalidades adicionais, a presente invenção fornece métodos para modulação do lisotipo de uma célula bacteriana compreendendo as etapas de: (a) fornecimento de uma ou mais pseudo CRISPR espaçadoras de pelo menos um bacteriófago; (b) identificação de uma ou mais combinações de repetição de CRISPR- cas funcionais em pelo menos uma célula que é substancialmente sensível ao bacteriófago; e (c) engenharia de um ou mais loci de CRISPR na célula substancialmente sensível tal que compreendam um ou mais pseudo CRISPR espaçadoras de um bacteriófago ou uma ou mais CRISPR espaçadora(s) que é complementar ou homóloga a uma ou mais pseudo CRISPR espaçadora(s).
[000307] Ainda em modalidades adicionais, a presente invenção fornece métodos para modulação do lisotipo de uma célula bacteriana compreendendo as etapas de: (a) fornecimento de uma ou mais pseudo CRISPR espaçadoras de pelo menos um bacteriófago; (b) identificação de uma ou mais combinações de repetição de CRISPR- cas funcionais em pelo menos uma célula que é substancialmente sensível ao bacteriófago; e (c) inserção de uma ou mais pseudo CRISPR espaçadoras do bacteriófago ou uma ou mais CRISPR espaçadora(s) que é/são complementar ou homóloga a uma ou mais pseudo CRISPR espaçadora(s) na célula substancialmente sensível.
[000308] Em algumas modalidades preferenciais adicionais, a presente invenção fornece métodos para conferir resistência a uma célula (por exemplo, uma célula bacteriana) contra um bacteriófago compreendendo as etapas de: (i) identificação de uma pseudo CRISPR espaçadora em um bacteriófago compreendendo um ácido nucleico-alvo ou um produto de transcrição do mesmo contra o qual a resistência deve ser modulada; e (ii) modificação da sequência da CRISPR espaçadora da célula tal que a CRISPR espaçadora da célula tenha homologia à pseudo CRISPR espaçadora do bacteriófago compreendendo o ácido nucleico-alvo.
[000309] Em algumas modalidades adicionais, a presente invenção fornece métodos para conferir resistência a uma célula (por exemplo, uma célula bacteriana) contra um bacteriófago compreendendo as etapas de: (i) identificação de uma pseudo CRISPR espaçadora em um bacteriófago compreendendo um ácido nucleico-alvo ou um produto de transcrição do mesmo contra o qual a resistência deve ser modulada; e (ii) modificação da sequência da CRISPR espaçadora da célula tal que a CRISPR espaçadora da célula tenha homologia ou identidade de 100% à pseudo CRISPR espaçadora do bacteriófago compreendendo o ácido nucleico-alvo.
[000310] Ainda em modalidades adicionais, a presente invenção fornece métodos para modulação do lisotipo de uma célula bacteriana compreendendo as etapas de: (i) identificação de uma pseudo CRISPR espaçadora em um bacteriófago compreendendo um ácido nucleico-alvo ou um produto de transcrição do mesmo contra o qual a resistência deve ser modulada; e (ii) modificação da sequência da CRISPR espaçadora da célula tal que a CRISPR espaçadora da célula tenha homologia à pseudo CRISPR espaçadora do bacteriófago compreendendo o ácido nucleico-alvo.
[000311] Em algumas modalidades adicionais, a presente invenção fornece métodos para modulação do lisotipo de uma célula bacteriana compreendendo as etapas de: (i) identificação de uma pseudo CRISPR espaçadora em um bacteriófago compreendendo um ácido nucleico-alvo ou um produto de transcrição do mesmo contra o qual a resistência deve ser modulada; e (ii) modificação da sequência da CRISPR espaçadora da célula tal que a CRISPR espaçadora da célula tenha homologia ou identidade de 100% à pseudo CRISPR espaçadora do bacteriófago compreendendo o ácido nucleico-alvo.
[000312] Em algumas modalidades, a CRISPR espaçadora da célula bacteriana tem homologia ou identidade de 100% a uma sequência (por exemplo, como uma pseudo CRISPR espaçadora) no bacteriófago compreendendo o ácido nucleico-alvo.
[000313] Em algumas modalidades alternativas, a CRISPR espaçadora da célula bacteriana forma uma porção componente de um locux de CRISPR compreendendo uma combinação de repetição de CRISPR-cas funcional como descrito neste pedido.
[000314] Em algumas modalidades particularmente preferenciais, o ácido nucleico-alvo ou um produto de transcrição do mesmo no bacteriófago é uma sequência de ácido nucleico altamente conservada. Em algumas modalidades adicionais, o ácido nucleico- alvo ou produto de transcrição do mesmo no bacteriófago é um gene de codificação para uma proteína de especificidade ao hospedeiro. Em algumas modalidades adicionais, ácido nucleico-alvo ou um produto de transcrição do mesmo no bacteriófago codifica uma enzima que é essencial para sobrevivência, replicação e/ou crescimento do bacteriófago. Ainda em modalidades adicionais, o ácido nucleico-alvo ou produto de transcrição do mesmo no bacteriófago codifica uma helicase, uma primase, uma cabeça ou cauda proteica estrutural, ou proteína com um domínio conservado (por exemplo, holina, lisina, etc.).
[000315] Em algumas modalidades preferenciais, células bacterianas que são preparadas têm "reduzida suscetibilidade a multiplicação ou infecção de bacteriófago". Como usado neste pedido, este termo refere-se às bactérias como tendo uma baixa ou nenhuma suscetibilidade à multiplicação ou infecção de bacteriófago quando comparada às bactérias de tipo selvagem quando cultivadas (por exemplo, em um meio lácteo).
[000316] Em algumas modalidades, algumas células bacterianas exibem "baixa suscetibilidade a multiplicação de bacteriófago". Este termo refere-se ao nível de multiplicação de bacteriófago em uma bactéria estando abaixo de um nível, que causaria um efeito deletério em uma cultura em um dado período de tempo. Tais efeitos deletérios em uma cultura incluem, mas não são limitados a, nenhuma coagulação de leite durante a produção de produtos lácteos fermentados (por exemplo, iogurte ou queijo), redução inadequada ou lenta do pH durante a produção de produtos lácteos fermentados (por exemplo, iogurte ou queijo), maturação lenta de queijo e/ou deterioração de uma textura de alimento ao ponto onde é não apetitoso ou impróprio para o consumo.
[000317] Para um conjunto equivalente de condições de cultura a suscetibilidade bacteriana em relação a um bacteriófago da presente invenção é geralmente expressa em comparação com as bactérias de tipo selvagem. Em algumas modalidades, as bactérias têm aproximadamente 100 vezes menor (eficiência de plaqueamento [EOP] = 10-2), preferencialmente aproximadamente 1000 vezes menor (EOP = 10-3), mais preferencialmente 10.000 vezes menor (EOP = 104), e ainda mais preferencialmente aproximadamente 100.000 vezes menor (EOP=10-5). Em algumas modalidades preferenciais, o nível de multiplicação de bacteriófago em uma cultura é medido após incubação de aproximadamente 14 horas da cultura, mais preferencialmente após aproximadamente 12 horas, ainda mais preferencialmente após aproximadamente 7 horas, ainda mais preferencialmente após aproximadamente 6 horas, ainda mais preferencialmente após aproximadamente 5 horas, e ainda mais preferencialmente após aproximadamente 4 horas.
[000318] Em modalidades adicionais, a presente invenção fornece métodos para conferir sensibilidade a uma célula (por exemplo, uma célula bacteriana) contra um bacteriófago compreendendo etapas de: (a) fornecimento de uma pseudo CRISPR espaçadora de pelo menos um bacteriófago; (b) identificação de uma ou mais combinações de repetição de CRISPR-cas funcionais em uma célula que é substancialmente resistente ao bacteriófago; e (c) engenharia de um ou mais loci de CRISPR na célula substancialmente sensível tal que compreendam uma ou mais pseudo CRISPR espaçadoras ou uma ou mais CRISPR espaçadora(s) que é/são complementar ou homóloga a uma ou mais pseudo CRISPR espaçadora(s) que têm um grau reduzido de homologia quando comparada com um ou mais loci de CRISPR na célula substancialmente resistente.
[000319] Em modalidades adicionais, a presente invenção fornece métodos para modulação (por exemplo, redução) do lisotipo de uma célula (por exemplo, uma célula bacteriana), compreendendo um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR compreendendo as etapas de: (i) identificação de uma pseudo CRISPR espaçadora em um bacteriófago contra o qual a resistência deve ser modulada; e (ii) modificação da sequência da CRISPR espaçadora da célula tal que a CRISPR espaçadora da célula tenha um grau reduzido de homologia à pseudo CRISPR espaçadora do bacteriófago compreendendo o ácido nucleico-alvo.
[000320] Ainda em modalidades adicionais, a presente invenção fornece métodos para modulação (por exemplo, redução ou diminuição) da resistência de uma célula bacteriana compreendendo um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR contra um bacteriófago compreendendo as etapas de: (i) identificação de uma ou mais pseudo CRISPR espaçadoras em um bacteriófago contra o qual a resistência deve ser modulada; (ii) identificação de uma CRISPR espaçadora na célula bacteriana na qual a resistência deve ser modulada que é homóloga à pseudo CRISPR espaçadora(s); e (iii) modificação da sequência da CRISPR espaçadora na célula bacteriana na qual a resistência deve ser modulada tal que a CRISPR espaçadora tem um grau mais baixo de homologia à pseudo CRISPR espaçadora(s) do bacteriófago contra o qual a resistência deve ser modulada.
[000321] Em algumas modalidades, a CRISPR espaçadora da célula tem um grau reduzido de homologia (por exemplo, aproximadamente 1, aproximadamente 2, aproximadamente 3, aproximadamente 4, aproximadamente 5, aproximadamente 6, aproximadamente 7, aproximadamente 8, aproximadamente 9, aproximadamente 10, aproximadamente 15, aproximadamente 20, aproximadamente 25, aproximadamente 30, aproximadamente 35, aproximadamente 40, aproximadamente 45, aproximadamente 50, aproximadamente 55, aproximadamente 60, aproximadamente 65, aproximadamente 70, aproximadamente 75, aproximadamente 80, aproximadamente 90, ou redução de aproximadamente 95% na homologia) quando comparado com a pseudo CRISPR espaçadora(s) do bacteriófago contra o qual a resistência deve ser modulada.
[000322] Em algumas modalidades, as células bacterianas são preparadas usando os métodos da presente invenção tais que as células tenham uma "suscetibilidade aumentada à multiplicação de bacteriófago". Como usado neste pedido, este termo refere-se a bactérias que têm uma suscetibilidade aumentada ou mais alta à multiplicação de bacteriófago quando comparada com as bactérias de tipo selvagem quando cultivadas (por exemplo, em um meio lácteo).
[000323] Em algumas modalidades, o termo "alta suscetibilidade à multiplicação de bacteriófago" refere-se ao nível da multiplicação de bacteriófago em uma bactéria que está acima de um nível, que causaria um efeito deletério a uma cultura em um dado período de tempo. Tais efeitos deletérios em uma cultura incluem, mas não são limitados a, nenhuma coagulação de leite durante a produção de produtos lácteos fermentados (por exemplo, iogurte ou queijo), inadequada ou lenta redução do pH durante a produção de produtos lácteos fermentados (por exemplo, iogurte ou queijo), maturação lenta de queijo e/ou deterioração de uma textura do alimento ao ponto onde é não apetitoso ou impróprio para o consumo.
[000324] Para um conjunto equivalente de condições de cultura a suscetibilidade bacteriana em relação a um bacteriófago da presente invenção é geralmente expressa em comparação com as bactérias de tipo selvagem. Em algumas modalidades, as bactérias têm aproximadamente 100 vezes menor (eficiência de plaqueamento [EOP] = 10-2), preferencialmente aproximadamente 1000 vezes menor (EOP = 10-3), mais preferencialmente 10.000 vezes menor (EOP = 104), e ainda mais preferencialmente aproximadamente 100.000 vezes menor (EOP=10-5). Em algumas modalidades preferenciais, o nível de multiplicação de bacteriófago em uma cultura é medido após incubação de aproximadamente 14 horas da cultura, mais preferencialmente após aproximadamente 12 horas, mesmo mais preferencialmente após aproximadamente 7 horas, ainda mais preferencialmente após aproximadamente 6 horas, ainda mais preferencialmente após aproximadamente 5 horas, e ainda mais preferencialmente após aproximadamente 4 horas.
[000325] Em algumas modalidades preferenciais, uma CRISPR espaçadora é flanqueada por duas repetições de CRISPR (isto é, uma CRISPR espaçadora tem pelo menos uma repetição de CRISPR em cada lado).
[000326] Em algumas modalidades da presente invenção, a bactéria parental (por exemplo, "cepa bacteriana parental") é exposta (por exemplo, iterativamente, sequencialmente, simultaneamente ou substancialmente simultaneamente) a mais de um bacteriófago (por exemplo, uma mistura de um ou mais fagos). Em algumas modalidades, a cepa bacteriana parental é sensível a cada um dos bacteriófagos que é exposto na mistura, enquanto em outras modalidades, a cepa bacteriana é sensível a alguns bacteriófagos, mas resistente a outros.
[000327] Como usado neste pedido, o termo "sequência de direcionamento" refere-se à porção de um fragmento de DNA adicional que é derivado do genoma de um ou mais bacteriófagos (por exemplo, uma fita a mais do genoma de um ou mais bacteriófagos) que a bactéria parental é exposta conforme os métodos da presente invenção e é usada como uma etiqueta ou uma marca (por exemplo, fornecendo uma etiqueta única ou uma marca única).
[000328] A sequência de direcionamento é tipicamente uma sequência que é uma sequência que ocorre naturalmente no bacteriófago. Preferencialmente, a sequência de direcionamento tem pelo menos aproximadamente 90%, aproximadamente 95%, aproximadamente 96%, aproximadamente 97%, aproximadamente 98% ou de aproximadamente 99% de identidade à sequência que ocorre naturalmente no bacteriófago (por exemplo, o genoma do bacteriófago do qual é derivado). Em algumas modalidades mais preferenciais, a sequência de direcionamento tem identidade de aproximadamente 100% à sequência que ocorre naturalmente no bacteriófago (por exemplo, o genoma do bacteriófago do qual é derivado).
[000329] Em algumas modalidades, a sequência de direcionamento tem menos de aproximadamente 40%, aproximadamente 30%, aproximadamente 20%, aproximadamente 10%, aproximadamente 5%, aproximadamente 4%, aproximadamente 3%, aproximadamente 2%, aproximadamente 1%, ou identidade de aproximadamente 0% a qualquer outra CRISPR espaçadora ou núcleos de CRISPR espaçadora em um ou mais loci de CRISPR da bactéria marcada.
[000330] Em algumas modalidades, a sequência de direcionamento tem menos de aproximadamente 40%, aproximadamente 30%, aproximadamente 20%, aproximadamente 10%, aproximadamente 5%, aproximadamente 4%, aproximadamente 3%, aproximadamente 2%, aproximadamente 1%, ou identidade de aproximadamente 0% a qualquer outra sequência em um ou mais loci de CRISPR da bactéria marcada.
[000331] Em algumas modalidades adicionais, a sequência de direcionamento tem uma sequência que é idêntica a uma sequência (por exemplo, como uma CRISPR espaçadora) no locux de CRISPR da bactéria. Em algumas modalidades adicionais, a sequência de direcionamento tem uma sequência que é idêntica a uma sequência (por exemplo, uma CRISPR espaçadora) no locux de CRISPR da bactéria além de um ou mais polimorfismos de nucleotídeo único (por exemplo, um ou dois polimorfismos de nucleotídeo único).
[000332] Em algumas modalidades preferenciais, a sequência de direcionamento é pelo menos de aproximadamente 20 nucleotídeos em tamanho, enquanto em algumas modalidades particularmente preferenciais é de aproximadamente 20 a aproximadamente 58 nucleotídeos em tamanho.
[000333] Em algumas modalidades particularmente preferenciais, pelo menos uma sequência de direcionamento está integrada na bactéria parental. Em algumas modalidades adicionais, pelo menos uma sequência duplicada (por exemplo, uma sequência de repetição de CRISPR duplicada) derivada do genoma da bactéria parental ou um ou mais dos plasmídeos da bactéria parental (por exemplo, megaplasmídeos) também está integrada. Não é destinado que a presente invenção seja limitada a qualquer mecanismo ou teoria particular. Entretanto, acredita-se que pelo menos uma sequência duplicada é copiada ou replicada a partir do genoma da bactéria parental. Em particular, acredita-se tipicamente que a sequência de repetição de CRISPR em um locux de CRISPR é duplicada e a sequência de direcionamento é integrada no genoma da bactéria imediatamente após (isto é, a jusante) da nova repetição de CRISPR duplicada.
[000334] Em algumas modalidades particularmente preferenciais, pelo menos uma sequência duplicada é uma sequência de repetição de CRISPR que tem pelo menos aproximadamente 90%, aproximadamente 95%, aproximadamente 96%, aproximadamente 97%, aproximadamente 98%, ou identidade de aproximadamente 99% às repetições de CRISPR em um ou mais loci de CRISPR da bactéria parental e/ou bactéria marcada. Ainda mais preferencialmente, pelo menos uma sequência duplicada é uma sequência de repetição de CRISPR que tem identidade de pelo menos aproximadamente 100% às repetições de CRISPR em um ou mais loci de CRISPR da bactéria parental e/ou bactéria marcada. Em algumas modalidades preferenciais, a sequência duplicada é de pelo menos aproximadamente 24 nucleotídeos em tamanho, enquanto em algumas modalidades particularmente preferenciais é de aproximadamente 24 a aproximadamente 40 nucleotídeos em tamanho.
[000335] Em algumas modalidades preferenciais, pelo menos uma sequência de direcionamento e pelo menos uma sequência duplicada estão integradas na bactéria parental. Não é destinado que a presente invenção seja limitada a qualquer mecanismo ou teoria particular. Entretanto, acredita-se que cada vez que uma sequência de direcionamento é integrada ao genoma da bactéria parental, isto é acompanhado pela integração iterativa, sequencial, simultânea ou substancialmente simultânea de pelo menos uma sequência duplicada. Consequentemente, pelo menos um par de sequências compreendendo a sequência de direcionamento e a sequência duplicada são integradas na bactéria parental, por meio disso resultando em uma bactéria marcada.
[000336] Em algumas modalidades preferenciais, pelo menos uma sequência de direcionamento e pelo menos uma sequência duplicada integram-se adjacente uma a outra. Mais preferencialmente, pelo menos uma sequência de direcionamento e pelo menos uma sequência duplicada são diretamente integradas adjacentes uma a outra tal que não haja nucleotídeos intervenientes entre as sequências.
[000337] Em algumas modalidades, a sequência duplicada é anexada, ligada ou fusionada a uma extremidade (por exemplo, a extremidade 5' ou 3') da sequência de direcionamento. Preferencialmente, a sequência duplicada é anexada, ligada ou fusionada à extremidade 5' da sequência de direcionamento. Consequentemente, após integração de um par único de sequências, a sequência duplicada é a primeira sequência na extremidade 5' do locux de CRISPR e a sequência de direcionamento será a segunda (por exemplo, a próxima) sequência no locux de CRISPR, a jusante da sequência duplicada. Em algumas modalidades preferenciais, as sequências são diretamente anexadas, diretamente ligadas ou diretamente fusionadas tal que não haja nucleotídeos intervenientes entre a sequência duplicada e a sequência de direcionamento.
[000338] Dessa maneira, em algumas modalidades, uma sequência duplicada e um par de sequência de direcionamento são integrados no genoma da bactéria parental para dar origem a uma bactéria marcada. A sequência duplicada é derivada, derivável, obtida ou obtenível a partir do genoma da bactéria parental e a sequência de direcionamento é derivada, derivável, obtida ou obtenível a partir do genoma do bacteriófago que é usado para infectar a bactéria parental.
[000339] Surpreendentemente, tem sido encontrado que em algumas modalidades, múltiplos pares de sequências são integrados no genoma da bactéria parental. De acordo com estas modalidades, os múltiplos pares compreendem um primeiro par compreendendo uma sequência duplicada e uma sequência de direcionamento, e um segundo par compreendendo uma segunda sequência duplicada e uma segunda sequência de direcionamento. A segunda sequência duplicada tipicamente compreende a mesma sequência (por exemplo, maior do que aproximadamente 95%, aproximadamente 96,%, aproximadamente 97%, aproximadamente 98%, aproximadamente 99%, ou identidade de aproximadamente 100%) como a primeira sequência duplicada. A sequência de direcionamento tipicamente compreende uma sequência diferente (por exemplo, menos de aproximadamente 40%, aproximadamente 30%, aproximadamente 20%, aproximadamente 10%, aproximadamente 5%, aproximadamente 4%, aproximadamente 3%, aproximadamente 2%, aproximadamente 1%, ou identidade de aproximadamente 0%) à primeira sequência de direcionamento. Este é também o caso em modalidades nas quais os pares adicionais de sequências estão integrados.
[000340] Consequentemente, a configuração dos múltiplos pares tipicamente compreende: [sequência duplicada-sequência de direcionamento]n em que n = 2, 3, 4, 5, 6, ou mais. Preferencialmente, a configuração dos múltiplos pares tipicamente compreende: [repetição de CRISPR-sequência de direcionamento]n em que n = 2, 3, 4, 5, 6, ou mais. Em algumas modalidades, a configuração dos múltiplos pares é: 5'-[sequência duplicada-sequência de direcionamento]n-3' em que n = 2, 3, 4, 5, 6, ou mais. Preferencialmente, a configuração dos múltiplos pares é: 5'-[repetição de CRISPR-sequência de direcionamento]n-3' em que n = 2, 3, 4, 5, 6, ou mais.
[000341] Consequentemente, em algumas modalidades, múltiplos pares de sequências estão integrados na bactéria parental. Em algumas modalidades, a sequência de direcionamento integra-se adjacente a: (i) uma sequência duplicada que é homóloga (por exemplo, idêntica) a uma sequência que ocorre naturalmente na bactéria parental; (ii) uma sequência duplicada que é homóloga (por exemplo, idêntica) a uma sequência que ocorre naturalmente no locux de CRISPR da bactéria parental; ou (iii) ainda mais preferencialmente, uma sequência duplicada que é homóloga (por exemplo, idêntica) a uma repetição de CRISPR que ocorre naturalmente no locux de CRISPR da bactéria parental.
[000342] Após cada exposição de uma bactéria parental a um dado bacteriófago em experimentos independentes, a sequência de direcionamento em cada uma das bactérias marcadas apresenta uma sequência nucleotídica diferente, por meio disso criando uma sequência que é única para cada bactéria. Dessa maneira, sem estar ligado por qualquer teoria particular, acredita-se que na exposição de uma bactéria parental a um dado bacteriófago, a sequência de direcionamento que está integrada em uma bactéria parental é aparentemente selecionada randomicamente a partir do genoma do bacteriófago. Entretanto, não é destinado que a presente invenção seja limitada a eventos de integração randômicos.
[000343] Vantajosamente, este achado surpreendente é utilizado no contexto da presente invenção em virtude do fato que a sequência de direcionamento selecionada randomicamente fornece uma marca ou etiqueta única na bactéria marcada. Surpreendentemente, também foi encontrado que quando a mesma bactéria parental é exposta ao mesmo bacteriófago a sequência de direcionamento que está integrada em experimentos independentes/distintos é de uma sequência diferente, por meio disso resultando em uma marcação única na bactéria marcada após cada exposição.
[000344] Em algumas modalidades, a sequência de direcionamento randomicamente selecionada é identificada na bactéria marcada em virtude de uma ou mais das seguintes propriedades da sequência de direcionamento: (1) A posição da sequência de direcionamento em um ou mais loci de CRISPR do mutante insensível a bacteriófago. Como descrito neste pedido, a sequência de direcionamento é tipicamente localizada em uma e/ou ambas as extremidades (por exemplo, extremidade 5' e/ou 3', mais preferencialmente, extremidade 5') do locux de CRISPR da bactéria marcada. (2) A sequência de direcionamento tem um alto grau de homologia ou identidade (por exemplo, identidade de 100%) a uma sequência no genoma de bacteriófago a qual a bactéria parental foi exposta; e/ou (3) A sequência de direcionamento é fusionada, ligada ou anexada a (por exemplo, diretamente fusionada, ligada ou anexada) pelo menos uma sequência (por exemplo, uma repetição de CRISPR) que é duplicada a partir do genoma da bactéria parental. Tipicamente, como descrito neste pedido, este par adicional de sequências é localizado em uma e/ou ambas extremidades (por exemplo, extremidade 5' e/ou 3', preferencialmente, extremidade 5') do locux de CRISPR da bactéria marcada.
[000345] Em algumas modalidades de marcação/etiquetagem fornecidas neste pedido, uma ou mais sequências de marcação e/ou uma ou mais sequências duplicadas (por exemplo, a repetição de CRISPR duplicada a partir da bactéria parental) integradas no locux de CRISPR da bactéria parental. Em algumas modalidades preferenciais, um ou mais pares de sequência duplicada-sequência de direcionamento como descrito neste pedido integra-se no locux de CRISPR da bactéria parental. Em algumas modalidades, a sequência(s) de marcação e/ou sequência(s) duplicadas integram-se no locux de CRISPR da bactéria parental. Em algumas outras modalidades, a sequência(s) de marcação e/ou sequência(s) duplicada integram-se em uma ou ambas as extremidades do locux de CRISPR da bactéria parental. Ainda em modalidades adicionais, a sequência(s) de marcação e/ou sequência(s) duplicada integram-se em ambas as extremidades do locux de CRISPR da bactéria parental tal que as sequências estejam na extremidade 5' e na extremidade 3' do locux de CRISPR. Uma das sequências duplicadas será tipicamente a primeira sequência na extremidade 5' do locux de CRISPR e a sequência de direcionamento estará imediatamente a jusante da sequência duplicada. A outra sequência duplicada será a última sequência na extremidade 3' do locux de CRISPR e a sequência de direcionamento estará imediatamente a montante da sequência duplicada.
[000346] Em algumas modalidades, a sequência(s) de marcação e/ou sequência(s) duplicada integra-se em um ou mais loci de CRISPR. Ainda em modalidades adicionais, a sequência(s) de marcação e/ou sequência(s) duplicada integram-se em uma extremidade do locux de CRISPR da bactéria parental tal que a sequência(s) esteja na extremidade 3' do locux de CRISPR. A sequência duplicada será a última sequência na extremidade 3' do locux de CRISPR e a sequência de direcionamento estará imediatamente a montante da sequência duplicada. Preferencialmente, a sequência(s) de marcação e/ou sequência(s) duplicada integram-se em uma extremidade do locux de CRISPR da bactéria parental tal que as sequências estejam na extremidade 5' do locux de CRISPR. A sequência duplicada é a primeira sequência na extremidade 5' do locux de CRISPR e a sequência de direcionamento está imediatamente a jusante da sequência duplicada.
[000347] Como descrito neste pedido, a sequência(s) de marcação é uma cepa de marca específica no sentido em que a sequência de direcionamento que é integrada ou inserida a partir do bacteriófago na bactéria parental é diferente cada vez que a bactéria parental (por exemplo, a mesma bactéria parental) é exposta ao bacteriófago (por exemplo, o mesmo bacteriófago). Consequentemente, a sequência de direcionamento encontra uso como uma marca única para uma dada cepa bacteriana.
[000348] A sequência(s) de marcação e/ou a sequência(s) duplicada integra-se em um ou mais loci de CRISPR diferente, enquanto em outras modalidades, duas ou mais sequência(s) de marcação diferentes e/ou sequência(s) duplicada integram-se em um locux de CRISPR, e são ainda modalidades adicionais, duas ou mais sequência(s) de marcação diferentes e/ou sequência(s) duplicada cada uma integra-se em dois ou mais loci de CRISPR diferentes. Cada uma das sequências de marcação de cada bacteriófago e/ou cada uma das sequências duplicadas (por exemplo, a repetição de CRISPR duplicada) da bactéria parental podem integrar-se no mesmo locux de CRISPR.
[000349] Em algumas modalidades, cada uma das sequências de marcação e/ou cada uma das sequências duplicadas integram-se em uma ou ambas as extremidades do mesmo locux de CRISPR. Em algumas modalidades adicionais, cada uma das sequências de marcação e/ou cada uma das sequências duplicadas integram-se nas extremidade 5' e/ou 3' do mesmo locux de CRISPR. Preferencialmente, cada uma das sequências de marcação e/ou cada uma das sequências duplicadas integram-se na extremidade 5' do mesmo locux de CRISPR. Em algumas modalidades adicionais, cada uma das sequências de marcação e/ou cada uma das sequências duplicadas da bactéria parental integram-se iterativamente, simultaneamente ou substancialmente simultaneamente. Em algumas modalidades, cada uma das sequências de marcação e/ou cada uma das sequências duplicadas integram-se sequencialmente, pelo qual a primeira sequência de direcionamento e/ou a primeira sequência duplicada estão integradas na bactéria parental. Uma segunda sequência de direcionamento a partir de um segundo bacteriófago e/ou outra sequência duplicada então se integra na bactéria parental. Apropriadamente, a sequência de direcionamento e/ou a sequência duplicada integram-se no DNA cromossômico da bactéria parental.
[000350] Em algumas modalidades, cada uma das sequências de marcação e/ou cada uma das sequências duplicadas integram-se em uma extremidade (por exemplo, a extremidade 5') do mesmo locux de CRISPR adjacente (por exemplo, próximo a) uma a outra. Dessa maneira, em algumas modalidades, cada uma das sequências de marcação e/ou sequências duplicadas integra-se sequencialmente, de acordo com as quais as primeiras sequências estão integradas na bactéria parental em uma extremidade (por exemplo, dentro de ou na extremidade 5' e/ou 3') do locux de CRISPR. Uma segunda sequência de direcionamento e/ou sequência duplicada podem então integrar-se na bactéria parental adjacente (por exemplo, diretamente adjacente) ao primeiro par de sequências. Em algumas modalidades, as segundas sequências integram-se na bactéria parental adjacente (por exemplo, diretamente adjacente) a extremidade 5' ou 3' das primeiras sequências. Preferencialmente, as segundas sequências integram-se na bactéria parental adjacente (por exemplo, diretamente adjacente) a extremidade 3' das primeiras sequências e similares. Em algumas modalidades, cada uma das sequências integra-se adjacente (por exemplo, próximo a) uma a outra dentro de ou na extremidade 3' e/ou na extremidade 5' do mesmo locux de CRISPR da bactéria parental. Em algumas modalidades preferenciais, cada uma das sequências integra-se adjacente (por exemplo, próximo a) uma a outra na extremidade 5' do mesmo locux de CRISPR da bactéria parental. Mais preferencialmente, cada uma das sequências integra-se adjacente (por exemplo, próximo a) uma a outra a montante da extremidade 5' do locux de CRISPR da bactéria parental. Mais preferencialmente, cada uma das sequências integra-se adjacente (por exemplo, próximo a) uma a outra a montante da repetição de CRISPR em 5' do locux de CRISPR da bactéria parental. Ainda mais preferencialmente, cada uma das sequências integra-se adjacente (por exemplo, próximo a) uma a outra a montante da primeira repetição de CRISPR em 5' do locux de CRISPR da bactéria parental. Bactérias Marcadas
[000351] Como usado neste pedido, o termo "bactérias marcadas" e "bactéria marcada" refere-se a uma bactéria parental, bactérias parentais, ou cepa bacteriana parental na qual um ou mais loci de CRISPR ou uma porção do mesmo foram modificados (por exemplo, mutados) de tal modo que é insensível a um ou mais bacteriófagos a que foram expostas. Como descrito em detalhes adicionais neste pedido, em algumas modalidades, a bactéria marcada é exposta a mais de um bacteriófago (por exemplo, iterativamente, sequencialmente ou simultaneamente), tal que acumula uma ou mais modificações genômicas dentro de um ou mais loci de CRISPR de tal modo que fica insensível a cada um dos bacteriófagos aos quais foi exposta.
[000352] Para infectar células, um bacteriófago injeta ou transfere seu ácido nucleico para a célula com o ácido nucleico de fago existente independentemente do genoma da célula. Em algumas modalidades, a infecção resulta na expressão (isto é, transcrição e tradução) do ácido nucleico do bacteriófago dentro da célula e continuação do ciclo de vida do bacteriófago.
[000353] Em algumas modalidades da presente invenção, após exposição ao bacteriófago, a bactéria marcada tem uma reduzida ou nenhuma suscetibilidade de infecção e/ou multiplicação de bacteriófago quando comparada com a bactéria parental. Como usado neste pedido, o termo "reduzida suscetibilidade à infecção e/ou multiplicação de bacteriófago" significa que o nível de infecção e/ou multiplicação de bacteriófago na bactéria marcada não causa um efeito deletério à bactéria marcada.
[000354] Dessa maneira, em algumas modalidades da presente invenção, uma bactéria parental não é morta após exposição ao bacteriófago, devido à mutação da bactéria parental de tal modo que fica insensível ao bacteriófago.
[000355] Em algumas modalidades, a bactéria marcada é insensível ou substancialmente insensível a infecção e/ou multiplicação adicional por bacteriófago. Em modalidades adicionais, a bactéria marcada é insensível ou substancialmente insensível a um ou mais dos mecanismos usados pelo bacteriófago para infectar e/ou multiplicar-se em uma bactéria. Ainda em modalidades adicionais, a bactéria marcada é insensível ou substancialmente insensível a todos os mecanismos usados pelo bacteriófago para infectar e/ou multiplicar-se em uma bactéria. Ainda em modalidades adicionais, a bactéria marcada desenvolve um ou mais mecanismos que atenuam, inativam ou destroem o bacteriófago durante o ciclo de infecção. Em algumas modalidades adicionais, a presente invenção fornece cepas marcadas selecionadas por procedimentos de seleção padrão que são conhecidos na técnica para isolar mutantes insensíveis a bacteriófago.
[000356] Em algumas modalidades da presente invenção, uma bactéria marcada compreendendo uma sequência de direcionamento no locux de CRISPR que não está presente na bactéria parental é selecionada a partir da comparação do locux de CRISPR ou uma porção do mesmo da bactéria parental e da bactéria marcada.
[000357] Em algumas modalidades preferenciais, uma bactéria marcada compreendendo um fragmento de DNA adicional dentro de ou na extremidade 5' e/ou 3' do locux de CRISPR que não está presente na bactéria parental é selecionado. Mais preferencialmente, uma bactéria marcada compreendendo uma sequência de direcionamento adjacente (por exemplo, diretamente adjacente) à extremidade 3' de uma sequência recentemente duplicada no locux de CRISPR da bactéria marcada que não está presente na bactéria parental é selecionada. Ainda mais preferencialmente, uma bactéria marcada compreendendo uma sequência de direcionamento adjacente (por exemplo, diretamente adjacente) à extremidade 3' da primeira repetição de CRISPR do locux de CRISPR na bactéria marcada que não está presente na bactéria parental é selecionada.
[000358] Em algumas modalidades, a sequência de direcionamento (por exemplo, uma ou mais sequências de marcação) são isoladas e/ou clonadas. Em algumas modalidades adicionais, a sequência de direcionamento (por exemplo, uma ou mais sequências de marcação) é sequenciada. Estas modalidades fornecem vantagens, como não somente fornecem informação sobre a posição da sequência de direcionamento dentro do locux de CRISPR, mas também a sequência específica do mesmo, também. Em algumas modalidades, esta informação é guardada em um banco de dados, por meio disso fornecendo uma marca única para a dada bactéria e também um meio para posteriormente rastrear e/ou identificar a bactéria.
[000359] Uma vez que a sequência da sequência de direcionamento na bactéria marcada é conhecida, a sequência de direcionamento sozinha encontra uso na identificação de bactérias. Usando vários métodos que são conhecidos na técnica e descritos neste pedido, a sequência e/ou posição da sequência de direcionamento são determinadas. Esta sequência então é combinada contra, por exemplo, um banco de dados de sequência bacteriana e/ou um banco de dados de sequência de bacteriófago e/ou um banco de dados ou etiquetas/marcas a fim de identificar a bactéria. Organismo Doador
[000360] Como usado em algumas modalidades neste pedido, o termo "organismo doador" refere-se a um organismo ou célula a partir da qual a repetição de CRISPR e/ou o gene cas e/ou a combinação(ões) dos mesmos e/ou CRISPR espaçadoras são derivados. Estes podem ser os mesmos ou diferentes. Em algumas modalidades, o termo "organismo doador" refere-se a um organismo ou célula a partir da qual uma ou mais, preferencialmente, duas ou mais repetições de CRISPR e/ou um ou mais gene cas e/ou combinação(ões) dos mesmos e/ou CRISPR espaçadoras são derivados. Estes podem ser os mesmos ou diferentes. Em algumas modalidades, a CRISPR espaçadora e/ou pseudo CRISPR espaçadora é sinteticamente derivada. Ainda em modalidades adicionais, o organismo ou célula doadora compreende uma ou mais CRISPR espaçadoras, que confere a especificidade da imunidade contra um ácido nucleico-alvo ou produto de transcrição do mesmo. Em modalidades adicionais, o organismo ou célula doadora a partir da qual a repetição de CRISPR e/ou gene cas e/ou combinação dos mesmos é derivado é também a célula/organismo recipiente do locux de CRISPR recombinante. Estes podem ser os mesmos ou diferentes. Em outras modalidades, o organismo ou célula doadora a partir do qual a CRISPR espaçadora é derivada é também a célula/organismo recipiente do locux de CRISPR recombinante. Estes podem ser os mesmos ou diferentes. Em modalidades nas quais o organismo doador é uma célula bacteriana então o organismo doador tipicamente compreende uma CRISPR espaçadora que confere a imunidade específica contra o ácido nucleico-alvo ou produto de transcrição do mesmo. Em algumas modalidades, o organismo é uma célula bacteriana enquanto em outras modalidades é um bacteriófago. Célula-hospedeira
[000361] Como usado neste pedido, o termo "célula-hospedeira" refere-se a qualquer célula que compreende a combinação, o construto ou o vetor e similares de acordo com a presente invenção. Em algumas modalidades, as células hospedeiras são transformadas ou transfectadas com uma sequência nucleotídica contida em um vetor (por exemplo, um vetor de clonagem). Em algumas modalidades, uma sequência nucleotídica pode ser transportada em um vetor para a replicação e/ou expressão da sequência nucleotídica. As células são escolhidas para serem compatíveis com o vetor e em algumas modalidades, células procarióticas (por exemplo, bacterianas). Célula-recipiente
[000362] Como usado neste pedido, o termo "célula-recipiente" refere-se a qualquer célula em que a resistência contra um ácido nucleico-alvo ou um produto de transcrição do mesmo seja modulada ou deva ser modulada. Em algumas modalidades, a célula-recipiente refere-se a qualquer célula compreendendo o ácido nucleico recombinante de acordo com a presente invenção. Em algumas modalidades, a célula-recipiente compreende uma ou mais, preferencialmente, duas ou mais repetições de CRISPR e um ou mais genes ou proteínas cas. Apropriadamente, as repetições de CRISPR e os genes ou proteínas cas formam uma combinação funcional na célula-recipiente, como descrito neste pedido. Em algumas modalidades adicionais, a célula-recipiente compreende uma ou mais repetições de CRISPR modificadas e/ou um ou mais genes ou proteínas cas modificados. Apropriadamente, as repetições de CRISPR modificadas e/ou os genes ou proteínas cas modificados formam uma combinação funcional na célula-recipiente, como descrito neste pedido. Em algumas modalidades, a célula-recipiente compreende uma ou mais repetições de CRISPR geneticamente construídas e/ou um ou mais genes ou proteínas cas construídos geneticamente. Apropriadamente, as repetições de CRISPR geneticamente construídas e/ou genes ou proteínas cas geneticamente construídos formam uma combinação funcional na célula-recipiente, como descrito neste pedido. Em algumas modalidades alternativas, a célula-recipiente compreende uma ou mais repetições de CRISPR recombinante e/ou um ou mais genes ou proteínas cas recombinantes. Apropriadamente, as repetições de CRISPR recombinantes e/ou genes ou proteínas cas recombinantes formam uma combinação funcional na célula-recipiente, como descrito neste pedido. Ainda em modalidades adicionais, a célula-recipiente compreende uma ou mais repetições de CRISPR que ocorrem naturalmente e um ou mais genes ou proteínas cas que ocorrem naturalmente. Apropriadamente, a repetição(ões) de CRISPR e o gene(s) ou proteínas cas formam uma combinação funcional.
[000363] Em algumas modalidades, a célula-recipiente compreende combinações de uma ou mais repetições modificadas de CRISPR geneticamente construídas, recombinantes ou que ocorrem naturalmente e um ou mais genes ou proteínas cas modificados geneticamente construídos, recombinantes ou que ocorrem naturalmente. Apropriadamente, uma ou mais CRISPR espaçadora(s) modificada, geneticamente construída, recombinante ou que ocorre naturalmente ou um ou mais gene(s) ou proteína cas modificados, geneticamente construídos, recombinantes ou que ocorrem naturalmente formam uma combinação funcional.
[000364] Em algumas modalidades, a célula-recipiente é uma célula procariótica. Em algumas modalidades preferenciais, a célula- recipiente é uma célula bacteriana. Células bacterianas adequadas são descritas neste pedido. Em algumas modalidades, a célula bacteriana é selecionada a partir de espécies de bactérias de ácido láctico, uma espécie Bifidobacterium, uma espécie Brevibacterium, uma espécie Propionibacterium, uma espécie Lactococcus, uma espécie Streptococcus, uma espécie Lactobacillus incluindo a espécie Enterococcus, espécie Pediococcus, uma espécie Leuconostoc e espécie Oenococcus. Espécies adequadas incluem, mas não são limitadas a Lactococcus lactis, incluindo Lactococcus lactis subsp. lactis e Lactococcus lactis subsp. cremoris, Lactococcus lactis subsp. cremoris, Leuconostoc sp., Lactococcus lactis subsp. lactis biovar, Streptococcus thermophilus, Lactobacillus delbrueckii subsp. bulgaricus e Lactobacillus helveticus, Bifidobacterium lactis, Lactobacillus acidophilus, Lactobacillus casei.
[000365] Em algumas modalidades, nas quais a resistência da célula deve ser modulada, a célula bacteriana é usada para fermentação de carne (incluindo carne bovina, carne suína e carne de aves) incluindo, mas não limitadas a, bactérias de ácido láctico, Pediococcus cerevisiae, Lactobacillus plantarum, Lactobacillus brevis, Micrococcus species, Lactobacillus sakei, Lactobacillus curvatus, Pediococcus pentosaceus, Staphylococcus xylosus e Staphylococcus vitulinus e misturas das mesmas, como conhecido na técnica. Em algumas modalidades alternativas, a célula bacteriana é usada para a fermentação de vegetais (por exemplo, cenouras, pepinos, tomates, pimentão e repolho) incluindo, mas não limitadas a Lactobacillus plantatum, Lactobacillus brevis, Leuconostoc mesenteroides, Pediococcus pentosaceus e misturas das mesmas, como conhecido na técnica. Em algumas modalidades alternativas, a célula bacteriana é usada para a fermentação da massa de farinha formada por cereais (por exemplo, trigo, centeio, arroz, aveia, cevada e milho). Em algumas modalidades adicionais, a célula bacteriana é usada para a produção de vinho. Tipicamente, isto é alcançado pela fermentação do suco de fruta, tipicamente suco de uva. Ainda em modalidades adicionais, a célula bacteriana é usada para a fermentação de leite para produzir queijo (por exemplo, Lactobacillus delbrueckii subsp. bulgaricus, Lactobacillus helveticus, Streptococcus thermophilus, Lactococcus lactis subsp. lactis, Lactococcus lactis subsp. cremoris, Lactococcus lactis subsp. lactis biovar diacetylactis, Lactococcus, Bifidobacterium e Enterococcus, etc. e misturas das mesmas), como conhecido na técnica. Ainda em modalidades adicionais, a célula bacteriana é usada para a fermentação de ovo (por exemplo, Pediococcus pentosaceus, Lactobacillus plantarum e misturas das mesmas), como conhecido na técnica. Em algumas modalidades adicionais, a célula bacteriana é usada em composições cosméticas ou farmacêuticas.
[000366] Em algumas modalidades, a célula na qual a resistência deve ser modulada é uma bactéria que naturalmente compreende um ou mais loci de CRISPR. Loci de CRISPR foi identificado em mais de 40 procariontes (Vide, Haft et al., 2005, supra) incluindo, mas não limitado a Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus, Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium. Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella, Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pasteurella, Photobacterium, Salmonella, Xanthamonas, Yersinia, Treponema e Thermotoga. Cepa Bacteriana Parental
[000367] Como usado neste pedido, os termos "bactéria parental" "bactérias parentais" e "cepa parental" referem-se a qualquer bactéria/bactérias/cepas que é/são exposta a um ou mais bacteriófago(s). Em algumas modalidades, os bacteriófagos são virulentos para a cepa bacteriana parental, enquanto em outras modalidades, são não virulentos. Em algumas modalidades particularmente preferenciais, as bactérias parentais são sensíveis ao fago virulento. Em algumas modalidades preferenciais, a cepa parental é infectada pelo bacteriófago. Em algumas modalidades particularmente preferenciais, a infecção pelo fago produz a bactéria/bactérias/cepa parental ou uma subpopulação das mesmas insensível à infecção adicional pelo bacteriófago. Em algumas modalidades preferenciais, a infecção de uma "bactéria parental" por um ou mais bacteriófago resulta na criação de uma cepa marcada que pode ser selecionada com base na sua insensibilidade ao bacteriófago. Em algumas modalidades preferenciais, "mutante resistente a bacteriófago" são bactérias que são marcadas ou etiquetadas de acordo com os métodos da presente invenção. Em algumas modalidades, as bactérias parentais são de cepas bacterianas de tipo selvagem. Em algumas modalidades preferenciais, as bactérias parentais são cepas de tipo selvagem de bactérias que não foram anteriormente infectadas com nenhum bacteriófago. Em algumas modalidades preferenciais, as bactérias parentais são cepas de tipo selvagem de bactérias que não foram anteriormente marcadas ou etiquetadas, enquanto em algumas modalidades alternativas, as bactérias da patente são mutantes resistentes a bacteriófago que foram anteriormente marcados ou etiquetados.
[000368] Em algumas modalidades particularmente preferenciais, a bactéria parental é selecionada a partir de qualquer bactéria que naturalmente compreende um ou mais loci de CRISPR. Como indicado acima, loci de CRISPR foram identificados em mais de 40 procariontes (Vide, Haft et al. [2005], supra) incluindo, mas não limitados a Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus, Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella, Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pasteurella, Photobacterium, Salmonella, Xanthamonas, Yersinia, Treponema, e Thermotoga.
[000369] Em algumas modalidades, a bactéria parental compreende uma ou mais CRISPR espaçadoras heterólogas, uma ou mais repetições de CRISPR heterólogas, e/ou um ou mais genes cas heterólogos. Em algumas modalidades alternativas, a bactéria parental compreende um ou mais loci de CRISPR heterólogo, preferencialmente, um ou mais loci de CRISPR completos. Em algumas modalidades adicionais, a bactéria parental naturalmente compreende um ou mais loci de CRISPR e também compreende uma ou mais CRISPR espaçadoras heterólogas, uma ou mais repetições de CRISPR heterólogas, e/ou um ou mais genes cas heterólogos. Em algumas modalidades adicionais, a bactéria parental naturalmente compreende um ou mais loci de CRISPR e também compreende um ou mais loci de CRISPR heterólogo, preferencialmente, um ou mais loci de CRISPR completos.
[000370] Em algumas modalidades preferenciais, a subpopulação resistente ao fago criada pela exposição das bactérias parentais a pelo menos um fago é uma cultura pura. Entretanto, não é destinado que a presente invenção seja limitada a culturas puras de cepas bacterianas, variantes ou fago. De fato, é destinado que a presente invenção englobe culturas mistas de células e fago. Em algumas modalidades, a cultura variada é uma mistura de mutantes diferentes correspondendo a diferentes eventos de integração no mesmo e/ou diferente loci de CRISPR.
[000371] Embora não seja destinado que a presente invenção seja tão limitada, os gêneros bacterianos parentais preferenciais são Streptococcus e Lactobacillus. De fato, é destinado que qualquer espécie bacteriana encontrará uso na presente invenção, incluindo mas não limitadas a Escherichia, Shigella, Salmonella, Erwinia, Yersinia, Bacillus, Vibrio, Legionella, Pseudomonas, Neisseria, Bordetella, Helicobacter, Listeria, Agrobacterium, Staphylococcus, Streptococcus, Enterococcus, Clostridium, Corynebacterium, Mycobacterium, Treponema, Borrelia, Francisella, Brucella, Bifidobacterium, Brevibacterium, Propionibacterium, Lactococcus, Lactobacillus, Enterococcus, Pediococcus, Leuconostoc, Oenococcus e/ou Xanthomonas. Em algumas modalidades, as bactérias parentais são ou são derivadas de bactérias de ácido láctico, incluindo mas não limitadas a Bifidobacterium, Brevibacterium, Propionibacterium, Lactococcus, Streptococcus, Lactobacillus (por exemplo, L. acidophilus), Enterococcus, Pediococcus, Leuconostoc e/ou Oenococcus. Em modalidades adicionais, as bactérias parentais são ou são derivadas de Lactococcus lactis (por exemplo, L. lactis subsp. lactis e L. lactis subsp. cremoris, e L. lactis subsp. lactis biovar diacetylactis), L. delbrueckii subsp. bulgaricus, L. helveticus, L. acidophilus, L. casei, L. paracasei, L. salivarius, L. plantarum, L. reuteri, L. gasseri, L. johnsonii, Bifidobacterium lactis, B. infantis, B. longum e/ou Streptococcus thermophilus.
[000372] Em algumas modalidades da presente invenção, a bactéria parental é uma "bactéria de grau alimentício" (isto é, uma bactéria que é usada e geralmente encontrada como segura para uso na preparação e/ou produção de alimento e/ou ração). Em algumas modalidades preferenciais, a bactéria parental é adequada para o uso como uma cultura iniciadora, uma cultura probiótica e/ou um suplemento dietético. Em modalidades adicionais, a bactéria parental encontra uso na fermentação de carne (por exemplo, carne bovina, carne suína, carne de cordeiro, e carne de aves) incluindo, mas não limitadas a bactérias de ácido lático, Pediococcus cerevisiae, Lactobacillus plantarum, L. brevis, L. sakei, L. curvatus, Micrococcus species, Pediococcus pentosaceus, Staphylococcus xylosus, S. vitulinus e misturas das mesmas (Vide, por exemplo, Knorr (ed.), Food Biotechnology, em 538-39 [1987]; e Pederson, Microbiology of Fermented Foods, em 210-34, 2d ed., [1979]; e Patente norte- americana N° 2.225.783, neste pedido incorporado por referência em sua totalidade). Ainda em modalidades adicionais, a bactéria parental encontra uso na fermentação de vegetais (por exemplo, cenouras, pepinos, tomates, pimentão e repolho) incluindo, mas não limitadas a L. plantatum, L. brevis, Leuconostoc mesenteroides, Pediococcus pentosaceus e misturas das mesmas (Vide, por exemplo, Knorr, supra; Pederson, supra; e Patentes norte-americanas N°s 3.024.116, 3.403.032, 3.932.674 e 3.897.307). Ainda em modalidades adicionais, a bactéria parental encontra uso na fermentação de massa de farinha formada por cereais (por exemplo, trigo, centeio, arroz, aveia, cevada e milho). Ainda em modalidades adicionais, a bactéria parental encontra uso na produção de vinho através da fermentação de suco de fruta (por exemplo, suco de uva). Em algumas modalidades adicionais, a bactéria parental encontra uso na fermentação de leite (por exemplo, L. delbrueckii subsp. bulgaricus, L. acidophilus, S. thermophilus e misturas das mesmas (Vide, Knorr, supra; e Pederson supra, nas páginas 105-35). Em algumas modalidades preferenciais, a bactéria parental encontra uso na produção de queijo, incluindo mas não limitadas a L. delbrueckii subsp. bulgaricus, L. helveticus, L. lactis subsp. lactis, L lactis subsp. cremoris, L. lactis subsp. lactis biovar diacetylactis, S. thermophilus, Bifidobacterium Enterococcus, etc. e misturas das mesmas (Vide, por exemplo, Knorr, supra, e Pederson, supra, em 135-51). Ainda em modalidades adicionais, a bactéria parental encontra uso na fermentação de ovos, incluindo mas não limitadas a Pediococcus pentosaceus, Lactobacillus plantarum, e misturas das mesmas (Vide, Knorr, supra). Em algumas modalidades, a bactéria parental encontra uso na fermentação para produzir vários produtos, incluindo mas não limitados a queijo cheddar e cottage (por exemplo, L. lactis subsp. lactis, L. lactis subsp. cremoris), iogurte (L. delbrueckii subsp. bulgaricus e S. thermophilus), queijo suíço (por exemplo, S. thermophilus, L. lactis, e L. helveticus), queijo azul (Leuconostoc cremoris), queijo italiano (L. bulgaricus e S. thermophilus), viili (L. lactis subsp. cremoris, L. lactis subsp. lactis biovar diacetylactis, Leuconostoc cremoris), yakult (L. casei), caseína (L. lactis subsp. cremoris), natto (Bacillus subtilis var. natto), vinho (Leuconostoc oenos), saquê (Leuconostoc mesenteroides), polimixina (Bacillus polymyxa), colistina (Bacillus colistrium), bacitracina (Bacillus licheniformis), ácido L-Glutâmico (Brevibacterium lactofermentum e Microbacterium ammoniaphilum), e acetona e butanol (Clostridium acetobutyricum e Clostridium saccharoperbutylacetonicum). Em algumas modalidades preferenciais, as espécies bacterianas parentais são selecionadas a partir de S. thermophilus, L. delbrueckii subsp. bulgaricus e/ou L. acidophilus.
[000373] Ainda em modalidades adicionais, as bactérias parentais encontram uso em métodos incluindo mas não limitados a produção de antibiótico, produção de aminoácido, produção de solvente e a produção de outros materiais economicamente úteis. Ainda em outras modalidades, as bactérias parentais encontram uso em composições cosméticas, terapêuticas e/ou farmacêuticas. Em algumas modalidades, as composições têm atividades particulares, incluindo, mas não limitadas à regeneração da pele, incluindo mas não limitadas para propriedades antirrugas, apagamento de velhas cicatrizes, reparação de tecidos danificados por queimadura, promoção de cura de pele, eliminação de manchas pigmentadas, etc. Em algumas modalidades, as composições promovem ou inibem o crescimento de unhas, cabelo ou pelos. Em algumas modalidades adicionais, as composições compreendem pelo menos uma cultura microbiana e/ou bactéria marcada e/ou uma cultura celular produzida usando os métodos e composições da presente invenção.
[000374] Em modalidades adicionais, as bactérias parentais são mutantes insensíveis a bacteriófago. Dessa maneira, em algumas modalidades, as bactérias parentais são insensíveis a um ou mais bacteriófagos. Em algumas modalidades preferenciais, a bactéria parental não é um mutante insensível a bacteriófago para o bacteriófago que deve ser exposto durante o uso da presente invenção. Culturas Iniciadoras
[000375] Culturas iniciadoras são usadas extensivamente na indústria alimentícia na produção de produtos fermentados incluindo produtos lácteos (por exemplo, iogurte e queijo), bem como embutidos, produtos de padaria, vinho e produtos vegetais.
[000376] Culturas iniciadoras usadas na produção de muitos produtos de leite fermentado, queijo e manteiga incluem culturas de bactérias, geralmente classificadas como bactérias de ácido lático. Tais culturas iniciadoras bacterianas transmitem características específicas a vários produtos lácteos pela realização de diversas funções.
[000377] Culturas não concentradas comerciais de bactérias são referidas na indústria como "culturas mãe," e são propagadas no sítio de produção, por exemplo, uma leiteria, antes de serem adicionadas a um material inicial comestível, tal como leite, para fermentação. A cultura iniciadora propagada no sítio de produção de inoculação em um material inicial comestível é mencionada como "iniciador de volume".
[000378] Culturas iniciadoras adequadas para uso na presente invenção incluem qualquer organismo que seja de uso indústria alimentícia, cosmética ou farmacêutica (isto é, "culturas industrialmente úteis" ou "cepas industrialmente úteis").
[000379] Culturas iniciadoras são preparadas por técnicas bem conhecidas na técnica (Vide, por exemplo, Patente norte-americana N° 4.621.058, incorporada neste pedido por referência). Em algumas modalidades, culturas iniciadoras são preparadas pela introdução de um inóculo, por exemplo, uma bactéria, a um meio de crescimento (por exemplo, um meio ou produto de fermentação) para produzir um meio inoculado e incubando o meio inoculado para produzir uma cultura iniciadora.
[000380] Culturas iniciadoras secas são preparadas por técnicas bem conhecidas na técnica (Vide, por exemplo, Patentes norte- americanas N°s 4.423.079 e 4.140.800). Qualquer forma adequada de culturas iniciadoras secas encontra uso na presente invenção, incluindo preparações sólidas (por exemplo, comprimidos, péletes, cápsulas, pós, grânulos e pó) que são umidificáveis, secas por pulverização, congeladas secas ou liofilizadas. Em algumas modalidades, as culturas iniciadoras secas para uso na presente invenção estão em uma forma de precipitado profundamente congelado ou em forma de pó congelado seco. Culturas iniciadoras secas em uma precipitado profundamente congelado ou pó seco congelado são preparadas de acordo com qualquer método adequado conhecido na técnica.
[000381] Em algumas modalidades, as culturas iniciadoras usadas na presente invenção estão na forma de concentrados que compreendem uma concentração substancialmente alta de uma ou mais cepas bacterianas. Em algumas modalidades, os concentrados são diluídos com água ou ressuspensos em água ou outros diluentes adequados, (por exemplo, um meio de crescimento apropriado, óleo mineral ou óleo vegetal). As culturas iniciadoras secas da presente invenção na forma de concentrados são preparadas de acordo com os métodos conhecidos na técnica (por exemplo, centrifugação, filtração ou uma combinação de tais técnicas).
[000382] Em algumas modalidades, a cultura iniciadora é adequada para uso na indústria láctea. Quando usada na indústria láctea, a cultura iniciadora muitas vezes é selecionada a partir de uma espécie de bactérias de ácido láctico, uma espécie Bifidobacterium, uma espécie Brevibacterium, uma espécie Propionibacterium. Culturas iniciadoras adequadas do grupo de bactérias de ácido láctico incluem cepas comumente usadas de uma espécie Lactococcus, uma espécie Streptococcus, uma espécie Lactobacillus incluindo o Lactobacillus acidophilus, espécies Enterococcus, espécies Pediococcus, uma espécie Leuconostoc e espécies Oenococcus.
[000383] Culturas de bactérias de ácido láctico são comumente usadas na produção de lácteos fermentados (por exemplo, leitelho, iogurte ou creme de leite) e na fabricação de manteiga e queijo (por exemplo, brie ou havarti). Espécies de Lactococcus incluem os largamente usados Lactococcus lactis, incluindo Lactococcus lactis subsp. lactis e Lactococcus lactis subsp. cremoris.
[000384] Outras espécies de bactérias de ácido lático incluem Leuconostoc sp., Streptococcus thermophilus, Lactobacillus delbrueckii subsp. bulgaricus e Lactobacillus helveticus. Além disso, cepas probióticas (por exemplo, espécies Lactococcus), incluem os largamente usados Lactococcus lactis, incluindo Lactococcus lactis subsp. lactis e Lactococcus lactis subsp. cremoris.
[000385] Culturas mesofílicas de bactérias de ácido lático comumente usadas na produção de produtos lácteos fermentados, tais como leitelho, iogurte ou creme de leite e na produção de manteiga e queijo (por exemplo, brie ou havarti). Outras espécies Lactococcus incluem Lactococcus lactis subsp. cremoris, Lactococcus lactis, Leuconostoc sp., Lactococcus lactis subsp. lactis biovar, Streptococcus thermophilus, Lactobacillus delbrueckii subsp. bulgaricus e Lactobacillus helveticus. Além disso, em algumas modalidades, cepas probióticas, tais como Bifidobacterium lactis, Lactobacillus acidophilus, Lactobacillus casei são adicionadas durante a produção para aumentar o sabor ou promover saúde.
[000386] Culturas de bactérias de ácido lático comumente usadas na produção de queijo cheddar e queijos monterey jack incluem Streptococcus thermophilus, Lactococcus lactis subsp. lactis e Lactococcus lactis subsp. cremoris ou combinações das mesmas.
[000387] Culturas termofílicas de bactérias de ácido lático comumente usadas na produção de queijos italianos, tais como pasta filata ou parmesão, inclui Streptococcus thermophilus e Lactobacillus delbrueckii subsp bulgaricus. Outras espécies Lactobacillus (por exemplo, Lactobacillus helveticus) são adicionadas durante a produção para obter um sabor desejado.
[000388] Em algumas modalidades preferenciais, o organismo de culturas iniciadoras compreende ou consiste em uma cepa geneticamente modificada preparada de acordo com os métodos fornecidos neste pedido, de uma das cepas de bactérias de ácido lático acima ou qualquer outra cepa de cultura iniciadora.
[000389] A seleção de organismos para a cultura iniciadora da invenção dependerá do tipo particular de produtos a serem preparados e tratados. Dessa maneira, por exemplo, para fabricação de manteiga e queijo, culturas mesofílicas das espécies Lactococcus, espécies Leuconostoc e espécies Lactobacillus são largamente usadas, ao passo que para iogurte e outros produtos lácteos fermentados, cepas termofílicas das espécies Streptococcus e de espécies Lactobacillus são tipicamente usadas.
[000390] Em algumas modalidades, a cultura iniciadora é uma cultura iniciadora seca, uma cultura iniciadora desidratada, uma cultura iniciadora congelada ou uma cultura iniciadora concentrada. Em algumas modalidades, a cultura iniciadora é usada na inoculação direta do meio ou produto de fermentação.
[000391] Em algumas modalidades, a cultura iniciadora compreende uma cultura pura (isto é, compreendendo somente uma cepa bacteriana). Em algumas modalidades alternativas, a cultura iniciadora é uma cultura mista (isto é, compreendendo pelo menos duas cepas bacterianas diferentes). Bactérias de Ácido Lático
[000392] Culturas iniciadoras particularmente adequadas, em particular culturas iniciadoras secas, para uso na presente invenção compreendem bactérias de ácido lático.
[000393] Como usado neste pedido, o termo "bactérias de ácido lático" refere-se a bactérias Gram-positivas, microaerofílicas ou anaeróbicas que fermentam açúcar com a produção de ácidos incluindo o ácido láctico como o ácido predominantemente produzido, ácido acético, ácido fórmico e ácido propiônico. As bactérias de ácido lático industrialmente mais úteis são encontradas entre espécies Lactococcus, tais como Lactococcus lactis, espécies Lactobacillus, espécies Bifidobacterium, espécies Streptococcus, espécies Leuconostoc, espécies Pediococcus e espécies Propionibacterium.
[000394] As culturas iniciadoras da presente invenção podem compreender uma ou mais espécies de bactérias de ácido lático tais como, Lactococcus lactis, Lactobacillus delbrueckii subsp. bulgaricus e Streptococcus thermophilus ou combinações das mesmas.
[000395] Culturas iniciadoras de bactérias de ácido lático são comumente usadas na indústria alimentícia como cultura de cepa mista compreendendo uma ou mais espécies. Para diversas culturas de cepas mistas, tais como culturas iniciadoras de iogurte compreendendo cepas de Lactobacillus delbrueckii subsp. bulgaricus e Streptococcus thermophilus, uma relação simbiótica existe entre as espécies em que a produção de ácido láctico é maior em comparação com culturas de cepa única de bactérias de ácido lático (Vide, por exemplo, Rajagopal et al., J. Dairy Sci., 73:894-899 [1990]). Produtos
[000396] Produtos adequados para uso na presente invenção incluem, mas não são limitados a gêneros alimentícios, produtos cosméticos ou produtos farmacêuticos. Qualquer produto, que é preparado a partir de, ou compreende uma cultura, é contemplado conforme a presente invenção. Estes incluem, mas não são limitados a, frutas, legumes, plantações de forragem e vegetais incluindo produtos derivados, grão e produtos derivados do grão, alimentos lácteos e produtos derivados de alimentos lácteos, carne, carne de aves, frutos do mar, produtos cosméticos e farmacêuticos.
[000397] O termo "alimento" é usado em um sentido amplo e inclui alimentos, gêneros alimentícios, ingredientes alimentícios, suplementos alimentares e alimentos funcionais.
[000398] Como usado aqui, o termo "ingrediente alimentício" inclui uma formulação, que é ou pode ser adicionada a alimentos e inclui formulações que podem ser usadas em baixos níveis em uma larga variedade de produtos que necessitam, por exemplo, de acidificação ou emulsificação.
[000399] Como usado neste pedido, o termo "alimento funcional" significa um alimento que é capaz de fornecer não somente um efeito nutricional e/ou uma satisfação de paladar, mas é também capaz de entregar um efeito benéfico adicional ao consumidor. Embora não haja nenhuma definição legal de um alimento funcional, a maioria das partes com um interesse nesta área aceitam que há alimentos vendidos como tendo efeitos de saúde específicos.
[000400] O termo "alimento" cobre o alimento para humanos bem como alimento para animais (isto é, uma ração). Em um aspecto preferencial, o alimento é para consumo humano.
[000401] Em algumas modalidades, as células descritas neste pedido compreendem ou são adicionadas a um ingrediente alimentício, um suplemento alimentar, ou um alimento funcional. Em algumas modalidades, o alimento está em uma forma líquida (por exemplo, uma solução), gel, emulsão ou sólido, como solicitado pelo modo de aplicação e/ou administração.
[000402] As células descritas neste pedido encontram uso na preparação de produtos alimentícios, tais como um ou mais dos: produtos de confeitaria, produtos lácteos, embutidos, embutidos de aves, produtos de pesca e produtos de padaria. Em algumas modalidades, as bactérias encontram uso como ingredientes de refrigerantes, sucos de fruta, bebidas compreendendo proteína de soro de leite, chás saudáveis, bebidas de cacau, bebidas lácteas, bebidas de bactérias de ácido lático, iogurte, bebida láctea e vinho, etc.
[000403] É também fornecido um método para preparação de um alimento, o método compreendendo mistura das células de acordo com a presente invenção com um ingrediente alimentar (tal como um material inicial de um alimento). O método para preparação de um alimento é também outro aspecto da presente invenção.
[000404] Apropriadamente um alimento como descrito neste pedido é um produto lácteo. Em algumas modalidades preferenciais, o produto lácteo é iogurte, queijo (por exemplo, queijo de coalho ácido, queijo duro, queijo semiduro, queijo cottage, etc), leitelho, quark, creme de leite, Kefir, creme fraiche, bebida fermentada baseada no soro de leite, kumis, bebida láctea ou bebida de iogurte.
[000405] Como usado neste pedido, o termo "alimento" é termo de sentido muito amplo, como é destinado para cobrir o alimento para humanos bem como alimento para animais não-humanos (isto é, ração). Em algumas modalidades preferenciais, o alimento é para o consumo humano. O termo "ração", como usado neste pedido, inclui material vegetal cru e processado e material não vegetal. O termo engloba qualquer ração adequada para consumo por um animal, incluindo, mas não limitado a gado, aves domésticas, peixe, crustáceos e/ou animais domésticos. Desenvolvimento de Cepas e Culturas Iniciadoras Resistentes ao Fago
[000406] Durante o desenvolvimento da presente invenção, a resistência ao fago envolvendo os genes CRISPR-cas, bem como seu papel na resistência na entrada de DNA alheio e no papel dos espaçadores inseridos dentro do CRISPR na especificidade desta resistência foram elucidados. Importantemente, a presente invenção fornece métodos e composições para desenvolvimento de cepas resistentes ao fago e culturas iniciadoras. Em algumas modalidades, uma cepa parental "A" é exposta ao fago "P" e um fago variante resistente (Variante "A1.0") é selecionado. Variante A1.0 é analisada (por exemplo, por PCR e/ou sequenciamento de DNA) para confirmar a presença de um espaçador inserido adicional em um locux de CRISPR. A sequência nucleotídica do espaçador adicional (Espaçador Sp1.0) então é determinada. Tipicamente, o espaçador Sp1.0 é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fago P, e fornece resistência ao fago P e fagos relacionados ("fagos relacionados" são aqueles contendo a sequência espaçadora em seus genomas e definem uma família de fagos).
[000407] Independentemente da primeira exposição ao fago, a mesma cepa parental A é exposta ao mesmo fago P e uma segunda variante resistente ao fago (Variante A2.0) é selecionada. A variante A2.0 é selecionada a fim de ter também um espaçador adicional inserido (Espaçador Sp2.0) dentro de um locux de CRISPR mas com a sequência do espaçador Sp2.0 sendo diferente daquela do espaçador Sp1.0. Tipicamente, o espaçador Sp2.0 é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fago P, e fornece resistência ao fago P e fagos relacionados. Similarmente, em algumas modalidades, variante A3.0 a variante Ax.0 são geradas através da exposição da mesma cepa A ao mesmo fago P. Todas as variantes "A" são selecionadas a fim de ter também um espaçador adicional inserido (Espaçador Sp3.0 a Spx.0) dentro de um locux de CRISPR mas com a sequência de todos os espaçadores "Sp" sendo diferentes cada um dos outros. Tipicamente, os espaçadores "Sp" são fragmentos de aproximadamente 30 nucleotídeos em tamanho a partir do fago P, e todos fornecem resistência ao fago P e fagos relacionados.
[000408] Embora estas variantes sejam úteis, são limitadas em termos do escopo da sua resistência. Dessa maneira, em algumas modalidades, é vantajoso desenvolver o segundo nível de cepas resistentes ao fago. De fato, é vantajoso desenvolver, além disso, estas variantes resistentes aos fagos pelo aumento e expansão de sua resistência aos fagos. Tipicamente, pode ser estimado que o nível de resistência será aproximadamente aquele de uma mutação única que ocorre dentro do genoma de fago dentro da sequência correspondente ao espaçador (isto é, aproximadamente 10-4 a 10-6). Consequentemente, cepas resistentes ao fago que acumulam espaçadores diferentes dentro do locux de CRISPR tem um nível aumentado de resistência ao fago contendo a sequência destes espaçadores dentro de seu genoma (isto é, uma vez que múltiplas mutações únicas precisam ocorrer dentro do genoma de fago).
[000409] Em algumas modalidades, as variantes de segundo nível são produzidas pelo isolamento de um fago mutado através da exposição da variante A1.0 ao fago P. Tipicamente, este fago mutado (fago P1.0) tem uma mutação (deleção, mutação pontual, etc.) em seu genoma na região contendo a sequência do espaçador Sp1.0. A variante A1.0 é sensível ao fago P1.0. Então, a variante A1.0 é exposta ao fago P1.0 e uma variante resistente ao fago (Variante A1.1) selecionada (Vide, Figura 15). A variante A1.1 também é selecionada tal que tenha um espaçador adicional inserido (Espaçador Sp1.1) dentro de um locux de CRISPR mas com a sequência de espaçador Sp1.1 sendo diferente daquela de espaçadores Sp1.0, Sp2.0 a Spx.0. Tipicamente, espaçador Sp1.1 é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fago P1.0, e fornecerá resistência ao fago P1.0 e fagos relacionados. A variante A1.1 é resistente ao fago P1.0 e preferencialmente, tem uma resistência aumentada ao fago P por causa da acúmulo do espaçador Sp1.0 e Sp1.1.
[000410] Em modalidades adicionais, um fago recentemente mutado (fago P1.1) é gerado através da exposição da variante A1.1 ao fago P1.0. Então, na exposição da variante A1.1 ao fago P1.1 uma nova variante A1.2 é obtida contendo um novo espaçador adicional (Sp1.2). Este espaçador fornece resistência ao fago P1.1 e preferencialmente aumenta a resistência ao fago P1.0 e P (isto é, devido ao acúmulo de espaçadores Sp1.0, Sp1.1, Sp1.2). Ainda em modalidades adicionais, espaçadores diferentes (por exemplo, 2, 3 ou 4) são iterativamente acumulados dentro da cepa A através da variante A1, então variante A1.1, então variante A1.2, etc, para obter uma variante altamente resistente aos fagos (variante A1.n). Ainda em modalidades adicionais, os espaçadores diferentes adicionais podem ser acumulados na mesma cepa através de variantes A2, então variantes A2.1, então variantes A2.2, etc. para gerar outra variante da cepa A altamente resistente aos fagos (variantes A2.n) em paralelo. A mesma estratégia encontra uso com variantes A3.0 a Ax.0.
[000411] Em algumas modalidades, cepas que são resistentes a mais de uma família de fagos são fornecidas. Como uma cepa dada pode ser sensível a mais de uma família de fagos, em algumas modalidades, é desejado para alargar a resistência da cepa a múltiplas famílias de fago pela introdução de espaçador(es) adicional em um locux de CRISPR que se origina de outras famílias de fagos ( Vide, Figura 16). Por exemplo, os fagos P, Q e R são fagos representativos de três famílias de fagos capazes de infectar a cepa A. Usando o método delineado acima e neste pedido, variantes resistentes às três famílias de fago são produzidas. Em algumas modalidades, o fago P é usado para gerar a variante A1p (contendo o espaçador Sp1) que é resistente ao fago P. Então, a variante A1p é exposta ao fago Q e uma variante resistente ao fago (Variante A1pq) é selecionada. A variante A1pq tem um espaçador adicional (Sq1) inserido em um locux de CRISPR. Tipicamente, o espaçador Sq1 é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fago Q, e fornede resistência ao fago Q e fagos relacionados. A variante A1pq é resistente a ambos fagos P e Q. Após, a variante Apq é exposta ao fago R e uma variante resistente ao fago (Variante A1pqr) é selecionada. A variante A1pqr tem um terceiro espaçador adicional (Sr1) inserido em um locux de CRISPR. Tipicamente, Sr1 é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fago R, e também fornece resistência ao fago R e fagos relacionados. A variante A1pqr é resistente aos três fagos. Em algumas modalidades particularmente preferenciais, a variante é também resistente aos fagos relacionados.
[000412] Em modalidades adicionais, os métodos acima mencionados são usados em combinação para produzir resistência aumentada e expandida aos fagos. Em algumas modalidades particularmente preferenciais, estas variantes têm altas resistências a múltiplas famílias de fago. Ainda em modalidades adicionais, cepas que são produzidas são resistentes a fagos ou famílias de fagos particulares que são problemáticos em determinadas fábricas e/ou fermentadores. Imunidade mediada por CRISPR e Aplicações de Cepas resistentes ao Fago
[000413] Em contraste com os ensinamentos da técnica anterior que hipotetiza que CRISPR ou CRISPR espaçadoras possam estar envolvidas na conferência de imunidade específica, a presente invenção é baseada, em parte, no achado surpreendente que genes ou proteínas cas são necessários para imunidade contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. Entretanto, não é destinado que a presente invenção seja limitada a qualquer mecanismo, função, nem meios de ação particulares.
[000414] Ainda mais surpreendentemente, durante o desenvolvimento da presente invenção, foi encontrado que um ou mais genes ou proteínas cas estão associadas com duas ou mais repetições de CRISPR dentro dos loci de CRISPR. Em outras palavras, os genes ou proteínas cas parecem ser específicos para um dado DNA de repetição de CRISPR, significando que os genes ou proteínas cas e a sequência de repetição formam um par funcional. Consequentemente, uma ou mais CRISPR espaçadoras encontram uso em conjunto com um ou mais destes pares funcionais (isto é, repetições de CRISPR e genes cas) a fim de modular a resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo.
[000415] Em uma modalidade, para uma ou mais CRISPR espaçadoras para conferir imunidade à célula, a repetição(ões) de CRISPR e o gene(s) ou proteínas cas formam uma combinação funcional (isto é, a repetição(ões) de CRISPR e o gene(s) ou proteínas cas é compatível).
[000416] Em modalidades preferenciais adicionais, a presente invenção fornece genes/proteínas cas que influenciam na resistência de bactérias aos fagos. Ainda em modalidades adicionais preferenciais, a presente invenção fornece pelo menos duas repetições de CRISPR e pelo menos um gene/proteína cas útil em predição, determinação e/ou modificação de resistência bacteriana aos fagos. De fato, a presente invenção fornece métodos para modificação do lisotipo (isto é, a resistência/sensibilidade a vários fagos) de bactérias. Consequentemente, a identificação e detecção de loci de CRISPR em células e fagos fornecem meios para determinar, predizer e modificar o perfil de resistência das células, bem como interações de fago-hospedeiro.
[000417] Vantajosamente, a aplicação de um ou mais loci de CRISPR, duas ou mais repetições de CRISPR, um ou mais genes ou proteínas cas e/ou uma ou mais CRISPR espaçadoras na engenharia genética fornece meios para produzir variantes resistentes ou sensíveis de células para uso dentro de uma larga variedade de aplicações na indústria de biotecnologia.
[000418] Como discutido em maiores detalhes abaixos, os fagos são parasitas naturais de bactérias que podem desenvolver-se durante a fermentação. Na infecção por fagos, as bactérias são mortas, que prejudica o processo de fermentação. Na fermentação láctea, estas infecções por fago muitas vezes têm grandes impactos econômicos, variando de uma qualidade reduzida do produto fermentado até a perda completa do produto.
[000419] Para superar problemas de fago, as companhias de culturas iniciadoras desenvolveram várias estratégias. Programas tradicionais de culturas iniciadoras têm dependido de estratégias de rotação para defesa contra fago (PDRS) para minimizar falhas devido ao ataque de fago (Vide, por exemplo, Klaenhammer, Adv. Appl. Microbiol., 30: 1 [1984]; Lawrence et al., J. Dairy Res. 43: 141 [1976); e Whitehead and Hunter, J. Dairy Res., 15:112 [1947]). Estas estratégias confiam em cepas múltiplas geneticamente não relacionadas que provavelmente apresentarão espectro diferente de sensibilidade ao fago (isto é, lisotipos diferentes). Quando um fago aparece durante um processo de fermentação usando uma cepa definida, uma cepa que é idealmente de um lisotipo diferente (isto é, com um padrão de sensibilidade diferente ao fagos) é usada em substituição para a fermentação. A história provou, entretanto, que é difícil identificar números suficientes de lisotipos diferentes para utilizar com sucesso estas estratégias. De fato, muitas cepas de interesse industrial apresentam traços funcionais raros (por exemplo, texturização rápida acidificadora S. thermophilus). Além disso, nem todas cepas apresentam traços apropriados para serem produzidas como culturas iniciadoras. Além disso, por causa da sua raridade e o aumento do tamanho das fábricas de leite, estas cepas são intensivamente usadas.
[000420] Há problemas adicionais com estratégias tradicionais de rotação de culturas iniciadoras. Embora algumas cepas não sejam atacadas por fagos existentes quando introduzidos, fago muitas vezes consequentemente aparecem devido a mutação de fago, modificação, e aumento que atacam a cepa recentemente introduzida (Vide, por exemplo, Heap and Lawrence, N.Z.J. Dairy Sci. Technol., 11:16 [1976]; Limsowtin and Terzaghi, N.Z.J. Dairy Sci. Technol., 11:251 [1976]; Pearce, N.Z.J. Dairy Sci. Technol., 13:166 [1978]; e Sanders and Klaenhammer, Appl. Environ. Microbiol., 40:500 [1980]). Além disso, em muitos casos, a longevidade e atividade de rotações iniciadoras de cepas complexas é imprevisível e muitas vezes leva a falhas precoces (Vide, por exemplo, Limsowtin et al., N.Z.J. Dairy Sci. Technol., 13: 1 [1977]; e Thunell et al., J. Dairy Sci., 64, 2270 [1981]). Além disso, rotações prolongadas que envolvem cepas numerosas aumentam o nível e diversidade do fago que contamina a fábrica (Vide, por exemplo, Heap and Lawrence, N.Z.J. Dairy Sci. Technol., 12:213 [1981]; Lawrence et al., J. Dairy Sci., 61:1 181 [1978]; e Thunell et al, J. Dairy Sci. 64, 2270 [1981]).
[000421] A fim de combater a proliferação de fago, os programas tradicionais de culturas iniciadoras dependeram do uso de cepas que apresentam as mesmas funcionalidades tecnológicas ou similares, mas sensibilidades ao fago diferentes. As cepas são usadas em rotação para realizar a fermentação sucessiva. Estes programas tradicionalmente confiam em cepas múltiplas geneticamente não- relacionadas o que consequentemente apresenta o espectro diferente de sensibilidade ao fago (lisotipo). Abordagens alternativas (Vide, por exemplo, Patente Americana 5.593.885) utilizam programas de cultura iniciadora com base no uso de conjuntos de cepas isogênicas que apresentam sensibilidade ao fago diferente, em vez de cepas geneticamente não-relacionadas apresentando lisotipos diferentes. O termo "conjunto de cepas isogênicas" como usado neste pedido define cepas que são idênticas de um ponto de vista cromossomal mas cada uma se diferencia pela presença de um ou mais mecanismos de resistência ao fago que são carregados pelo plasmídeo. Em tal programa de rotação de culturas iniciadoras, quando um fago aparece durante um processo de fermentação usando uma cepa definida, uma cepa que é idealmente de um lisotipo diferente (isto é, com um espectro diferente de sensibilidade aos fagos) é usada em substituição para fermentação. Devido a este lisotipo diferente, a segunda cepa não é afetada pelos fagos que permanecem latentes no ambiente. A maioria da população de fagos latentes são então lavados por fermentação sucessiva e sanitização, e erradicados na altura da primeira cepa é usada novamente para a fermentação, se o sistema trabalhar como destinado.
[000422] A presente invenção fornece métodos melhorados e composições adequadas para dirigir estes problemas na indústria de fermentação. De fato, a presente invenção fornece métodos e composições para indústria de fermentação, e especialmente a indústria do leite com uma seleção de cepas adequadas para cumprir as necessidades de estratégias de rotação para defesa contra fago. Além disso, a presente invenção fornece métodos e composições adequadas para personalizar cepas que têm lisotipos que são adaptados a um determinado ambiente de fago. Especialmente, a presente invenção fornece métodos e composições adequadas para dirigir a evolução de uma dada cepa a vários lisotipos, a fim de produzir cepas que se diferenciam de cada uma das outras somente por seu espectro de sensibilidade ao fago (lisotipo). Esta diferença de lisotipo é uma função do sistema CRISPR-cas, como descrito neste pedido. Em algumas modalidades preferenciais, lisotipos diferentes são obtidos através da "modulação" da resistência ao fago. Em algumas modalidades particularmente preferenciais, embora os lisotipos sejam diferentes, as cepas deste tipo têm metabolismo idêntico (por exemplo, de carbono, nitrogênio, etc) e então funcionalidades idênticas (por exemplo, acidificação, sabor, textura, etc). Isto fornece meios para amplificação da construção de rotação iniciadora. Além disso, processabilidades industriais da cepa resistente ao fago são idênticas (por exemplo, necessidades nutricionais, resistência à operação de processamento, etc). Dessa forma reduzindo a necessidade de desenvolvimento de processos de produção específicos. De fato, a presente invenção fornece métodos e composições adequadas para minimizar falhas na fermentação devido ao ataque de fago. Em algumas modalidades, métodos e composições são fornecidos para a produção de culturas iniciadoras altamente resistentes ao fago, pela associação de múltiplas cepas resistentes ao fago que se diferenciam pelo seu lisotipo. Em algumas modalidades alternativas, métodos e composições são fornecidos para produzir culturas iniciadoras com funcionalidades industriais estritamente idênticas para serem usadas na rotação da fermentação do leite. Em modalidades adicionais, métodos e composições são contanto que sejam adequados para substituir iniciadoras existentes pela prevenção de ataques de fago frequentes em fábricas de leite, pela introdução de uma nova cepa bacteriana que é resistente aos fagos envolvidos nestes ataques de fago. Em algumas modalidades, estes métodos e composições são usados iterativamente, a fim de combater ataques de fago sequenciais.
[000423] Em algumas modalidades adicionais, a cultura iniciadora é uma cultura bacteriana variada. Em algumas modalidades particularmente preferenciais, a iniciadora compreende quantidades iguais de múltiplas (isto é, pelo menos 2) variantes resistentes ao fago que somente se diferenciam em seus CRISPRs e sua sensibilidade aos fagos. Em algumas modalidades, estas variantes estão no primeiro nível de variantes resistentes ao fago (por exemplo, variantes A1.0 mais A2.0, como descrito acima). Em algumas modalidades preferenciais, as variantes são selecionadas a partir daquelas no segundo nível de variantes resistentes ao fago (por exemplo, variantes A1.4 mais A2.4, como descrito acima). Em algumas modalidades particularmente preferenciais, as variantes são selecionadas entre o terceiro nível de variantes resistentes ao fago. Em tais culturas bacterianas variadas, quando uma das variantes é atacada por um dado fago as outras variantes não serão atacadas pelo fago, devido às suas sensibilidades ao fago diferentes e a fermentação não é afetada adversamente.
[000424] Em algumas modalidades adicionais, uma iniciadora principal e uma iniciadora de reserva são usadas. A iniciadora principal é composta de uma cepa única. Em algumas modalidades, esta cepa é do primeiro nível de variantes resistentes ao fago, enquanto em outras modalidades preferenciais a cepa é do segundo nível, e ainda em outras modalidades mais preferenciais, a cepa é do terceiro nível. Em algumas modalidades preferenciais, a iniciadora de reserva é baseada em uma variante resistente ao fago obtida independentemente a partir da mesma cepa parental. Esta segunda variante resistente ao fago diferencia-se de outra variante pelas suas CRISPRs e é do primeiro nível de variantes resistentes ao fago, enquanto em outras modalidades preferenciais a cepa é do segundo nível, e ainda em outras modalidades mais preferenciais, a cepa é do terceiro nível. Por exemplo, em algumas modalidades, a iniciadora principal é feito da variante A1.4 e a iniciadora reserva é feita da cepa A2.4. Na primeira aparição de um fago durante a fermentação com a iniciadora principal, esta iniciadora é descartada e substituída pela iniciadora reserva. Em algumas modalidades mais preferenciais, uma terceira iniciadora também é preparada como uma iniciadora reserva que servirá de reserva para a reserva. Em algumas modalidades preferenciais, as iniciadoras são cada uma feitas de variantes resistentes a múltiplos fagos.
[000425] Ainda em modalidades adicionais, a presente invenção fornece métodos e composições adequadas em estratégias de rotação. Em algumas modalidades, em vez de descartar a iniciadora muitas vezes atacada por fagos, as iniciadoras são usadas de um modo cíclico mesmo se o ataque de fago for observado. Esta estratégia limita o número de iniciadoras a serem desenvolvidas. Em algumas modalidades particularmente preferenciais, as iniciadoras são cada uma feitas de cepas resistentes a múltiplos fagos em vez de um único. Isto fornece a robustez aumentada ao fago emergente. Ainda em modalidades adicionais, as iniciadoras construídas são fornecidas. Em algumas modalidades preferenciais, as variantes resistentes ao fago são produzidas para combater especificamente fagos que estão presentes em uma dada fábrica ou instalação de fermentação. TIPAGEM
[000426] Em um aspecto adicional da presente invenção, é fornecido um método para identificação (por exemplo, tipagem) de uma bactéria marcada.
[000427] Em uma modalidade, a etapa de identificação é realizada por amplificação (por exemplo, amplificação por PCR) do locux de CRISPR ou uma porção do mesmo.
[000428] Uma primeiro iniciador pode ser desenhado para hibridizar em uma sequência que está localizada a montante da primeira repetição de CRISPR de um locux de CRISPR. Por meio do exemplo, o primeiro iniciador pode hibridizar-se na porção da sequência líder comum do locux de CRISPR. Por meio do exemplo adicional, o primeiro iniciador pode hibridizar em um gene vizinho que é localizado a montante do locux de CRISPR.
[000429] O segundo iniciador pode hibridizar a jusante pelo menos na primeira CRISPR espaçadora ou pelo menos no primeiro núcleo da CRISPR espaçadora. O segundo iniciador pode hibridizar tão longe quanto no reboque ou até em um gene vizinho a jusante. Preferencialmente, o segundo iniciador hibridiza com o locux de CRISPR. Preferencialmente, o segundo iniciador hibridiza pelo menos parcialmente em uma CRISPR espaçadora a jusante ou núcleo de CRISPR espaçadora.
[000430] Seguinte à amplificação, a sequência de direcionamento pode ser identificada usando vários métodos que são conhecidos na técnica.
[000431] Por meio do exemplo, a sequência de direcionamento pode ser identificada pela determinação do padrão de restrição do produto de amplificação. Consequentemente, uma vez que o DNA compreendendo o locux de CRISPR ou uma porção do mesmo foi amplificado, pode ser digerido (por exemplo, corte) com uma ou mais enzimas de restrição.
[000432] Como usado neste pedido, o termo "enzimas de restrição" refere-se a enzimas (por exemplo, enzimas bacterianas), cada uma das quais corta o DNA de filamento duplo em ou perto de uma sequência nucleotídica específica. Enzimas de restrição são bem conhecidas na técnica e podem ser prontamente obtidas, por exemplo, de uma variedade de fontes comerciais (por exemplo, New England Biolabs Inc., Beverly, Massachusetts). Similarmente, métodos para uso de enzimas de restrição também são geralmente bem conhecidos e rotineiro na técnica. Enzimas de restrição que produzem entre 10 e 24 fragmentos de DNA quando cortam o locux de CRISPR ou uma porção do mesmo podem ser usadas. Exemplos de tais enzimas incluem, mas não são limitados a, AluI, Mse1 e Tsp5091. Fragmentos de DNA obtidos usando enzimas de restrição podem ser detectados, por exemplo, como bandas por eletroforese em gel. Enzimas de restrição podem ser usadas para criar Polimorfismos de Tamanho de Fragmento de Restrição (RFLPs).
[000433] RFLPs são gerados pelo corte ("restrição") de uma molécula de DNA com uma endonuclease de restrição. Muitas centenas de tais enzimas foram isoladas, como naturalmente feito por bactérias. Em essência, bactérias usam tais enzimas como um sistema defensivo, para reconhecer e então clivar (restringir) qualquer molécula de DNA estranho que poderia entrar na célula bacteriana (por exemplo, uma infecção viral). Foi encontrado que cada uma de muitas centenas de enzimas de restrição diferentes cortam (isto é, "clivam" ou "restringem") DNA em uma sequência diferente de 4 nucleotídeos básicos (A, T, G, C) que compõem todas as moléculas de DNA, por exemplo, uma enzima e somente poderia reconhecer especificamente a sequência A-A-T-G-A-C, enquanto outra poderia especificamente e somente reconhecer a sequência G-T-A-C-T-A, etc. Dependendo da enzima única envolvida, tais sequências de reconhecimento podem variar em tamanho, de alguns como 4 nucleotídeos para tanto como 21 nucleotídeos. Sequências maiores de reconhecimento, fragmentos de restrição menores resultarão, já que maior o sítio de reconhecimento, menor a probabilidade que será repetidamente encontrada em todas as partes do DNA.
[000434] Por meio de exemplo adicional, a sequência de direcionamento pode ser identificada pela determinação ou também determinação de diferença no tamanho do produto de amplificação.
[000435] A separação pode ser realizada por qualquer método adequado para separação de DNA, incluindo, mas não limitado a, eletroforese em gel, cromatografia líquida de alta performance (HPLC), espectroscopia de massa e uso de um dispositivo microfluídico. Em uma modalidade, os produtos de amplificação ou fragmentos de DNA são separados por eletroforese em gel de agarose. Eletroforese em gel separa diferentes moléculas carregadas classificadas por sua velocidade de movimento através de um gel estacionário sob a influência de uma corrente elétrica. Estes produtos de amplificação separados ou fragmentos de DNA podem ser facilmente visualizados, por exemplo, por marcação com brometo de etídeo e pela visualização do gel sob iluminação UV. O padrão de bandeamento reflete os tamanhos da restrição do DNA digerido ou os produtos de amplificação.
[000436] Por meio de exemplo adicional, a sequência de direcionamento pode ser identificada por sequenciamento dos produtos de amplificação.
[000437] A sequência dos produtos amplificados pode ser obtida por qualquer método conhecido na técnica, incluindo métodos de sequenciamento automáticos e manuais. Vide, por exemplo, Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York; Roe et al. (1996) DNA Isolation and Sequencing (Essential Techniques Series, John Wiley & Sons).
[000438] Métodos de hibridização estão também dentro do escopo da presente invenção, usando uma molécula de ácido nucleico como uma sonda, ou uma molécula de ácido nucleico capaz de hibridizar-se a uma sequência nucleotídica particular. Vide, por exemplo, Sambrook et al. (1989) Molecular Cloning: Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York).
[000439] Em técnicas de hibridização, a sonda(s) de hibridização pode ser fragmentos de DNA genômico, produtos amplificados por PCR, ou outros oligonucleotídeos, e pode compreender toda ou parte de uma sequência nucleotídica conhecida. Além disso, pode ser marcado com um grupo detectável tal como 32P, ou qualquer outro marcador detectável, tal como outros radioisótopos, um composto fluorescente, uma enzima, ou um cofator enzimático. O termo "marcado", com relação à sonda, é destinado a englobar a marcação direta da sonda pela ligação (isto é, ligação fisicamente) de uma substância detectável à sonda, bem como marcação indireta da sonda pela reatividade com outro reagente que é diretamente marcado. Exemplos de marcação indireta incluem a marcação da extremidade de uma sonda de DNA com biotina tal que possa ser detectada com estreptavidina fluorescentemente marcada.
[000440] Métodos que englobam técnicas de hibridização para detectar ou diferenciar cepas bacterianas também são englobadas. Estes incluem, mas não são limitados a, Southern blotting (Vide, por exemplo, Van Embden et al. (1993) J. Clin. Microbiol. 31:406-409), ensaios de alteração de (Vide, por exemplo, Pedido de Patente Americana No. 20030219778), ensaios de sequenciamento usando arranjos de oligonucleotídeo (Vide, por exemplo, Pease et al. (1994) Proc. Natl. Acad. Sci. USA 91:5022-5026), espoligotipagem (Vide, por exemplo, Kamerbeek et al. (1997) J. Clin. Microbiol. 35:907-914), Hibridização Fluorescente In Situ (FISH) (Vide, por exemplo, Amann et al. (1990) J. Bacteriol. 172:762-770) e ensaios de rastreamento heteroduplex ou análise de mobilidade heteroduplex (Vide, por exemplo, White et al. (2000) J. Clin. Micro. 38:477-482).
[000441] A sequência de direcionamento que é identificada pode ser comparada com um banco de dados de sequência de fago e/ou um banco de dados de sequência bacteriana. Tipicamente, a sequência de direcionamento combinará com uma ou mais sequências no banco de dados de sequência de fago, mas não com o banco de dados de sequência bacteriana.
[000442] Como novas bactérias marcadas são preparadas usando os métodos descritos neste pedido, um banco de dados de marcações pode ser criado levando em conta a identificação específica de bactérias que foram marcadas.
[000443] Em um aspecto é fornecido uso de uma sequência obtida ou obtenível a partir de um bacteriófago (por exemplo, na produção de uma bactéria marcada) para marcar e/ou identificar uma bactéria, em que a dita sequência está integrada em uma extremidade do locux de CRISPR da bactéria parental.
[000444] Em um aspecto adicional é fornecido o uso de uma sequência obtida ou obtenível a partir de um bacteriófago (por exemplo, na produção de uma bactéria marcada) para marcação e/ou identificação de uma bactéria, em que a dita sequência compreende: (i) pelo menos uma sequência que é homóloga (por exemplo, idêntica) a uma repetição de CRISPR no locux de CRISPR da dita bactéria; e (ii) uma sequência de direcionamento.
[000445] Em um aspecto adicional, é fornecido o uso de uma sequência para marcação e/ou identificação de uma bactéria (por exemplo, na fabricação de uma bactéria marcada), em que a dita sequência é obtida ou obtenível por: (a) exposição de uma bactéria parental a um bacteriófago; (b) seleção de um mutante insensível a bacteriófago; (c) comparação do locux de CRISPR ou uma porção do mesmo da bactéria parental e o mutante insensível a bacteriófago; e (d) seleção de uma sequência no locux de CRISPR ou uma porção do mesmo do mutante insensível a bacteriófago que não está presente na bactéria parental. CRISPR e Eucariontes
[000446] Como detalhado neste pedido, mostrou-se que CRISPR fornece resistência contra a entrada de ácido nucleico em procariontes. Especificamente, mostrou-se que as CRISPR espaçadoras mostrando homologia ao DNA viral (por exemplo, ácido nucleico de bacteriófago) fornecem resistência contra o vírus que compartilha identidade de sequência com pelo menos uma sequência espaçadora. Entretanto, também é contemplado que o sistema CRISPR, incluindo genes e/ou proteínas cas junto com espaçadores, repetições, líder e reboque a células que atualmente não contêm loci de CRISPR encontrará uso no fornecimento de resistência contra o ácido nucleico de novo. De fato ,em algumas modalidades, tais manipulações encontram uso com vários eucariontes, incluindo mas não limitados a humanos, outros animais, fungos, etc. É contemplado que o sistema CRISPR seja transferido para células eucarióticas utilizando qualquer método adequado conhecido na técnica, incluindo, mas não limitados à transformação através de plasmídeos. Nestas modalidades, o loci de CRISPR, bem como sinais de transcrição/tradução necessários são incluídos no DNA plasmidial, todos para expressão e função das sequências em células eucarióticas.
[000447] Em algumas modalidades adicionais, as sequências espaçadoras são contruídas tais que tenham identidade com sequências virais de interesse infectando o hospedeiro envolvido. Em algumas modalidades preferenciais, estes métodos e composições fornecem resistência à célula-hospedeira contra vírus que compartilham identidade de sequência com a CRISPR espaçadora introduzida na célula. Em algumas modalidades particularmente preferenciais, os vírus incluem, mas não são limitados a HIV, ortomixovírus, paramixovírus, pseudomixovírus, RSV, influenza, rubeóla, varicela, rubéola, coronavírus, vírus de hepatite, calicivírus, poxvírus, herpesvírus, adenovírus, papovavírus, papilomavírus, enterovírus, arbovírus, rabdovírus, arenavírus, arbovírus, rinovírus, reovírus, coronavírus, reovírus, rotavírus, retrovírus, etc. Em modalidades adicionais, o direcionamente específico de sequências de ácidos nucleicos altamente conservadas em CRISPR espaçadoras fornece resistência aumentada contra tais vírus em células eucarióticas. Em algumas modalidades particularmente preferenciais, as células eucarióticas são células humanas. CRISPR e Geração de Mutantes Resistentes ao Fago
[000448] Durante o desenvolvimento da presente invenção, experimentos foram conduzidos para determinar se loci de CRISPR são alterados durante a geração natural de mutantes resistentes ao fago. Um sistema modelo de fago-hospedeiro foi selecionado, composto de uma cepa de S. thermophilus de tipo selvagem sensível ao fago largamente usada na indústria do leite, DGCC7710 (WT) e dois bacteriófagos virulentos isolados distintos, mas estreitamente relacionados a partir de amostras de iogurte industriais, ou seja, fago 858 e fago 2972 (Levesque et al., Appl. Environ. Microbiol., 71:4057 [2005]). Nove mutantes resistentes ao fago foram independentemente gerados pelo desafio da cepa de WT com o fago 858, fago 2972 ou simultaneamente com ambos, e seus loci de CRISPR foram analisados. Diferenças foram constantemente observadas no locux de CRISPR1, onde 1 a 4 espaçadores adicionais foram inseridos próximos aos 32 espaçadores presentes na cepa de WT (Vide, Figura 9). A adição de novos espaçadores em resposta à infecção de fago pareceu ser polarizada em direção a uma extremidade do locux de CRISPR1. Isto é compatível com a observação anterior da hipervariabilidade do espaçador na extremidade líder do locux de CRISPR em várias cepas (Vide, por exemplo, Pourcel et al., Microbiol., 151:653 [2005]; e Lillestol et al, Archaea 2:59 [2006]). Análise de sequência dos espaçadores adicionais inseridos no locux de CRISPR1 de vários mutantes resistentes ao fago revelaram a similaridade a sequências encontradas nos genomas dos fagos usados no desafio. Similaridades foram observadas em todas as partes dos genomas de fago, na maioria de módulos funcionais, ambas nos filamentos codificantes e não codificantes. Nenhuma sequência, gene ou grupo funcional particular pareceu ser direcionados especificamente. Estes resultados indicam que para tornar-se resistente a bacteriófagos, o locux de CRISPR1 foi modificado pela integração de novos espaçadores aparentemente derivados do DNA do fago. Entretanto, não é destinado que a presente invenção seja limitada a qualquer mecanismo específico.
[000449] Surpreendentemente, observou-se que algumas cepas foram resistentes a ambos os fagos enquanto outras foram resistentes somente ao fago usado no desafio (Vide, Figura 9). O perfil de resistência ao fago pareceu ser correlacionado ao conteúdo do espaçador pelo qual as cepas com espaçadores mostrando identidade de 100% a sequências conservadas em ambos os fagos foram resistentes a ambos os fagos, tais como espaçadores S3, S6 e S7. Ao contrário, quando polimorfismos nucleotídicos foram observados entre o espaçador e sequência de fago (de 1 a 15 SNPs em 29 ou 30 nucleotídeos), o espaçador não pareceu fornecer resistência, tal como espaçadores Sl, S2, S4, S5 e S8 (Vide, Figura 9).
[000450] Adicionalmente, quando vários espaçadores foram inseridos (S9 a S14), os níveis de resistência ao fago foram mais altos. Estes achados indicam que o locux de CRISPR1 é sujeito a modificações evolucionárias dinâmicas e rápidas dirigidas pela exposição ao fago. Estes resultados indicam que loci de CRISPR de fato podem ser alterados durante a geração de mutantes resistentes ao fago e estabelecer uma conexão entre o conteúdo de CRISPR e sensibilidade ao fago. Dessa maneira, é contemplado que a presença de uma CRISPR espaçadora idêntica a uma sequência de fago fornece a resistência contra fagos contendo esta sequência particular.
[000451] Para determinar se o conteúdo de CRISPR espaçadora define a resistência ao fago, o locux de CRISPR1 foi alterado pela adição e deleção de espaçadores, e sensibilidade da cepa ao fagos foi testada. Todos os construtos foram gerados e integrados no cromossomo de S. thermophilus usando métodos conhecidos na técnica (Vide, por exemplo, Russell and Klaenhammer, Appl. Environ. Microbiol., 67:4361 [2001]). Os espaçadores e repetições no locux de CRISPR1 da cepa WTΦ858+S1S2 foram removidos e substituídos com uma repetição única sem qualquer espaçador. A cepa resultante WTΦ858+S1S2ΔCRISPR1 foi sensível ao fago 858, indicando que a resistência ao fago do mutante resistente ao fago original (WTΦ858+S1S2) foi provavelmente ligada à presença de Sl e S2 (Vide, Figura 10).
[000452] Além disso, para determinar se a adição de espaçadores fornece nova resistência ao fago, o locux de CRISPR1 da cepa WTΦ2972+S4 foi substituído com uma versão contendo somente espaçadores Sl e S2. A sensibilidade ao fago do construto resultante então foi testada. A cepa resultante WTΦ2972+S4:: pSl S2 ganhou resistência ao fago 858, sugerindo que estes dois espaçadores tenham capacidade de fornecer resistência ao fago de novo (Vide, Figura 10). Estas modificações observadas estabelecem uma conexão entre o conteúdo da CRISPR espaçadora e resistência ao fago.
[000453] No processo de geração da cepa WTΦ858+S1S2ΔCRISPR1, WTΦ858+SIS2::pR, uma variante que contém o vetor de integração com uma repetição única inserida entre os genes cas e o locux de CRISPR1 nativo foi criada (Vide, Figura 10). Inesperadamente, a cepa WTΦ858+SIS2::pR foi sensível ao fago 858, embora os espaçadores Sl e S2 permaneceram presentes no cromossomo (Vide, Figura 10). Similarmente, construto de WTΦ2972+S4::pSlS2 perdeu resistência ao fago 2972, embora o espaçador S4 esteja presente no cromossomo (Vide, Figura 10). Estes resultados indicaram que espaçadores sozinhos não forneceram resistência, e possivelmente têm que estar em um determinado contexto genético para serem eficazes.
[000454] Embora experimentos iniciais sugeriram envolvimento no reparo de DNA (Makarova et al., Nucl. Acids Res., 30:482 [2002]), a hipótese atual é que genes cas (Jansen et al., Mol. Microbiol., 43: 1565 [2002]; e Haft et al., PIoS Comput. Biol., 1:e60 [2005]) estão envolvidos na imunidade mediada por CRISP- (Makarova et al., Biol. Direct. 1:7 [2006]). Em experimentos adicionais, dois genes cas na cepa WTΦ858+S1S2 foram inativados, ou seja, cas5 (COG3513) e cas7, que são equivalentes a str0657lstu0657 e str0660lstu0660, respectivamente (Vide, Bolotin et al., Nat. Biotechnol., 22: 1554 [2004]; e Bolotin et al., Microbiol., 151:2551 [2005]). A inativação de cas5 resultou na perda de resistência ao fago (Vide, Figura 10). Além disso, é possível que Cas5 atue como uma nuclease, uma vez que contém um motivo de nuclease tipo HNH. Ao contrário, a inativação de cas7 não alterou a resistência ao fago 858 (Vide, Figura 10). Entretanto, não é destinado que a presente invenção seja limitada a qualquer mecanismo particular. Além disso, experimentos para gerar mutantes resistentes ao fago CRISPR1 a partir da ausência de expressão de cas 7 não participaram. Embora não seja destinado que a presente invenção seja limitada a qualquer mecanismo particular, isto pode ser porque Cas7 está envolvida na síntese e/ou inserção de novos espaçadores e repetições adicionais.
[000455] Em testes de a sensibilidade dos mutantes resistentes ao fago, foi encontrado que a formação de placa foi dramaticamente reduzida, mas que uma população relativamente pequena de bacteriófago conservou a capacidade de infectar os mutantes. As variantes de fago derivadas do fago 858 que conservaram a capacidade de infectar WTΦ858+S1S2 foram ainda analisadas. Em particular, as sequências da região genômica correspondente aos espaçadores adicionais Sl e S2 em duas variantes de fago virulentas foram investigadas. Em ambos os casos, a sequência genômica da variante de fago foi mutata e dois polimorfismos de nucleotídeo únicos distintos foram identificados na sequência correspondente ao espaçador Sl (Vide, Figura 13).
[000456] Além de tudo, os procariontes parecem ter desenvolvido um sistema de "imunidade" com base em ácido nucleico pelo qual a especificidade é ditada pelo conteúdo de CRISPR espaçadora, enquanto a resistência é fornecida pela maquinaria enzimática Cas. Adicionalmente, foi especulado que alguns dos genes cas que não fornecem diretamente resistência estão de fato envolvidos na inserção de CRISPR espaçadoras adicionais e repetições, como parte de uma resposta "imune" adaptativa. Este sistema com base em ácido nucleico contrasta com equivalentes com base em aminoácido em eucariontes pelos quais a imunidade adaptativa não é herdável. A natureza herdável das CRISPR espaçadoras suporta o uso dos loci de CRISPR como alvos para estudos evolucionários, tipagem e de genômica comparativa (Vide, Pourcel et al, supra; Groenen et al., Mol. Microbiol., 10: 1057 [1993]; Mongodin et al, J. Bacterid., 187:4935 [2005]; e DeBoy et al, J. Bacteriol., 188:2364 [2006]). Como este sistema é reativo ao ambiente de fago, provavelmente desempenha um papel significante em evolução e ecologia procariótica e fornece uma perspectiva histórica da exposição ao fago, bem como uma ferramenta preditiva de sensibilidade ao fago. Entretanto, não é destinado que a presente invenção seja limitada a qualquer mecanismo particular. Todavia, a presente invenção fornece métodos e composições para utilização do sistema CRISPR/cas como um meio de defesa de vírus, e também potencialmente reduzir a disseminação de elementos genéticos móveis e a aquisição de traços indesejáveis, tais como genes de resistência antimicrobianos e marcadores de virulência. Em algumas modalidades, é ainda contemplado de uma perspectiva de evolução do fago, as sequências do fago integradas dentro dos loci de CRISPR também fornecem pontos de ancoragem adicionais para facilitar a recombinação durante as infecções de fago subsequentes, dessa forma aumentando o conjunto de genes aos quais fagos têm acesso (Vide, Hendrix et al., Proc. Natl. Acad. Sci. USA 96:2192 [1999]). Uma vez que loci de CRISPR são encontrados na maioria dos gêneros bacterianos e está ubíquo em arqueana (Vide, Jansen et al, supra; Lillestol et al., supra; e Goode and Bickerton J. Mol. Evol. 62:718 [2006]), fornecem novos percepções na relação e evolução codirigida entre procariontes e seus predadores. Fagos de Biocontrole
[000457] A presente invenção também fornece métodos e composições para desenvolvimento de fagos como agentes de biocontrole. Como indicado neste pedido, bactérias podem tornar-se resistentes ao ataque de fago pela incorporação de sequências derivadas de fago (espaçadores) em um loci de CRISPR ativo. O fago pode escapar desta resistência pela mutação dentro da sequência genômica correspondente ao espaçador ou sequência de reconhecimento de motivo de CRISPR que corresponde a um dado sistema Cas-CRISPR. Através de ciclos iterativos de desafio por fago para criar cepa hospedeira derivada resistente ao fago mediado por CRISPR e isolamento de mutantes de escape fago, a presente invenção fornece fagos que foram alterados dentro de sequências alvos de CRISPR e/ou sítios de reconhecimento CRISPR putativos que direciona a inserção de espaçador. Além disso, a presente invenção fornece fagos que foram sinteticamente desenhados tal que a sequência de motivo de CRISPR de um dado sistema Cas CRISPR tenha sido eliminada. Estes fagos "alterados", aplicados como um coquetel ou em um "esquema de rotação sequencial" reduzem a capacidade de bactérias alvo para adaptar resistência através do sistema CRISPR. De fato, a presente invenção fornece um conjunto diverso de fago virulento para uso como agentes de biocontrole. Em modalidades particularmente preferenciais, esta diversidade é direcionada ao mecanismo dirigido à CRISPR de resistência ao fago, tal que a capacidade do organismo hospedeiro de desenvolver-se rapidamente contra o ataque de fago (através de CRISPR) é severamente reduzida ou eliminada. A administração do fago diverso, como um coquetel ou em uma rotação sequencial adicional reduz a possibilidade do organismo de hospedeiro de adaptar ou desenvolver a resistência ao fago dirigida por CRISPR.
[000458] Fagos são agentes antimicrobianos naturais que foram extensivamente estudados como um agente terapêutico alternativo a antibióticos. Este interesse foi recentemente renovado, devido à proliferação de agentes patogênicos resistentes a múltiplos antibióticos. Como com antibióticos, as bactérias desenvolveram múltiplos mecanismos para superar o ataque de fago. A presente invenção fornece métodos e composições envolvendo o uso de Cas- CRISPR mediando a resistência ao fago para gerar uma população de fago diversa, criando fagos sintéticos destituídos de sequências de motivo de CRISPR, bem como métodos para administrar tal fago que reduzirá a capacidade de um organismo-alvo de desenvolver a resistência contra o fago.
[000459] Como detalhado neste pedido, os sistemas de Cas- CRISPR foram descritos em uma larga faixa de organismos que incluem exemplos de gêneros patogênicos. Na infecção por fago, bactérias que escapam da lise podem ser encontradas contendo nova sequência(s) espaçadora dentro de um locux de CRISPR. O novo espaçador é tipicamente de um tamanho definido que é característico para um dado locux de CRISPR e derivado do genoma de fago de ataque ao qual confere resistência. Como o nível de resistência conferida por um espaçador único não é muitas vezes completo, o fago pode escapar do mecanismo. A análise do "fagos de escape"" indicou que os genomas foram mutados em ou proximal à sequência espaçadora correspondente encontrada na variante hospedeira resistente. Além disso, os "fagos de escape" são totalmente virulentos para a variante hospedeira mediada por CRISPR a partir da qual foram derivados.
[000460] Um aspecto único do fago terapêutico, distinguindo-o de antibióticos tradicionais, é a capacidade de propagar exponencialmente em conjunto com as bactérias infectadas. Enquanto isto pode ser vantajoso de uma perspectiva farmacológica, também fornece oportunidades únicas para o fago para desenvolver em relação à resposta adaptativa das bactérias direcionadas pelo ataque de fago.
[000461] Bactérias têm desenvolvido vários mecanismos de defesa contra fagos virulentos. Como indicado neste pedido, os loci Cas- CRISPR desempenha um papel na conferência de resistência bacteriana ao fago. Seguinte infecção por fago, a análise da sobrevivência bacteriana encontrou que alguns isolados tinham inserido um novo elemento espaçador dentro do seu locux de CRISPR residente, a sequência da qual foi idêntica a que foi encontrada no genoma do fago correspondente. Quando desafiada com fago, esta primeira geração de variantes resistentes ao fago mediada por CRISPR dão origem a placas; o fago dos quais foram encontrados para serem totalmente infectivos em ambas parental e derivada. Análise destes fagos de "escape de CRISPR" indicou que seus genomas foram mutados na sequência correspondente à CRISPR espaçadora abrigado pelo variante resistente ao fago ou em uma sequência proximal acreditada para direcionar a inserção do espaçador e identificada como o motivo específico de CRISPR para um dado sistema Cas-CRISPR. Por isso, o fago de "escape de CRISPR" é potencialmente mais virulento do que as variantes parental e de primeira geração, já que este fago é capaz de infectar ambas as cepas parental e primeira geração de CRISPR variante.
[000462] Como indicado acima, loci de CRISPR foram identificados em vários gêneros/espécies de bactérias que incluem exemplos de agentes patogênicos conhecidos e micro-organismos prejudiciais. Também como descrito neste pedido, a presente invenção fornece métodos e composições para utilização de loci de CRISPR em combinação com proteínas Cas para conferir "imunidade" à invasão de DNA estranho, em particular, bacteriófagos. Também como descrito neste pedido, as cepas bacterianas que abrigam loci de CRISPR-cas "ativo" contendo um espaçador que é idêntico a uma sequência correspondente dentro de um genoma de fago (isto é, um "protoespaçador"), confere àquela cepa bacteriana, resistência ao fago. Em algumas modalidades preferenciais, as sequências genômicas do fago de biocontrole são conhecidas. Em alguns métodos particularmente preferenciais, o micro-organismo-alvo isolado é examinado para a presença de loci de CRISPR. Em algumas modalidades preferenciais, PCR usando iniciadores específicos para sequências conservadas que flanqueiam os loci de CRISPR do micro- organismo-alvo encontram uso. Em algumas modalidades preferenciais, produto(s) de amplificação é sequenciado comparado com a sequência genômica do fago de biocontrole. Em algumas modalidades preferenciais, a geração de variantes resistentes ao fago de CRISPR e análise do espaçador/protoespaçador fornece meios para identificar o motivo de CRISPR específico. Uma vez identificado, a informação sobre a sequência é usada para desenhar e sintetizar um fago destituído do motivo de CRISPR. Dessa maneira, o fago resultante é insensível à resistência mediada por CRISPR-cas. Nestas avaliações, a ausência de espaçadores com similaridade ao genoma de fago indica suscetibilidade do micro-organismo-alvo ao fago de biocontrole. Dessa maneira, o fago de biocontrole tem um maior grau de virulência e eficácia como um agente de biocontrole.
[000463] A presente invenção fornece métodos e composições adequadas para o uso em indústrias alimentícias, de ração, médica e veterinária para gerar fago com maior faixa de hospedeiro e método de aplicação do biocontrole mais eficaz de bactérias. A presente invenção fornece meios para produzir um número suficiente de fagos alterados (em resposta a CRISPR) para reduzir significativamente a capacidade das bactérias nativas de desenvolver uma resistência mediada por CRISPR eficaz.
[000464] A presente invenção também fornece métodos da aplicação/administração desenhados tais que a taxa da evolução pelas bactérias nativas seja significativamente reduzida. EXPERIMENTAL
[000465] Os seguintes exemplos são fornecidos a fim de demonstrar e ainda ilustrar certas modalidades preferenciais e aspectos da presente invenção e não devem ser interpretados como limitação do escopo da mesma.
[000466] Na descrição experimental que segue, as seguintes abreviaturas aplicam-se: 0C (graus Centígrados); rpm (rotações por minuto); H2O (água); HCl (ácido clorídrico); aa (aminoácido); bp (par de base); Kb (par de quilobase); kD (quilodaltons); g (gramas); μg e ug (microgramas); mg (miligramas); ng (nanogramas); μl e ul (microlitros); ml (mililitros); mm (milímetros); nm (nanômetros); μm e um (micrômetro); M (molar); mM (milimolar); μM e uM (micromolar); U (unidades); V (volts); MW (peso molecular); seg (segundos); min (minuto/minutos); h (hora/horas); MOI (multiplicidade de infecção); EOP (eficiência de plaqueamento); PFU (unidades formadoras de placa); MgCl2 (cloreto de magnésio); NaCl (cloreto de sódio); DO420 (densidade ótica em 420 nm); PAGE (eletroforese em gel de poliacrilamida); EtOH (etanol); PBS (salina tamponada de fosfato [NaCl a 150 mM, tampão de fosfato de sódio a 10 mM, pH 7,2]); SDS (sódio dodecil sulfato); Tris (tris (hidroximetil) aminometano); p/v (peso por volume); v/v (volume por volume); Amicon (Amicon, Inc, Beverly, MA); ATCC (American Type Culture Collection, Manassas, VA); Amersham (Amersham Biosciences, Inc., Piscataway, NJ); NEB (New England Biolabs, Beverly, MA); Becton Dickinson (Becton Dickinson Labware, Lincoln Park, NJ); BioRad (BioRad, Richmond, CA); Clontech (CLONTECH Laboratories, Palo Alto, CA); Difco (Difco Laboratories, Detroit, MI); GIBCO BRL ou Gibco BRL (Life Technologies, Inc., Gaithersburg, MD); Sigma (Sigma Chemical Co., Saint Louis, MO); e Sorvall (Sorvall Instruments, uma filial da DuPont Co., Biotechnology Systems, Wilmington, DE).
[000467] A presente invenção utiliza, a menos que de outra maneira indicada, técnicas convencionais de química, biologia molecular, microbiologia, DNA recombinante e imunologia, que estão dentro das capacidades de uma pessoa versada na técnica. Tais técnicas são bem conhecidas para aqueles versado na técnica.
[000468] Como usado neste pedido, DGCC7710 é também mencionado como "WT"; DGCC771 ORH 1 também é mencionado como "DGCC7710-RH1" e "RHl"; DGCC7710RH2 também é mencionado como "DGCC7710-RH2" e "RH-2"; DGCC7778casl também é mencionado como "DGCC7778casl KO," "CASl KO," e "cas1 KO"; DGCC7778cas4 também é mencionado como "DGCC7778cas4KO"; DGCC7778 também é mencionado como "WTΦ858+S1S2"; DGCC7778RT também é mencionado como "WTΦ858+SlS2::pR"; DGCC7778RT' é também mencionado como "WTΦ858+S1S2ΔCRISPR1"; DGCC7710-R2 também é mencionado como "WTΦ2972+S4"; e DGCC7710-R2S1S2 também é mencionado como "WTΦ2972+S4::pSlS2." EXEMPLO 1 - Manipulação de Espaçadores específicos para o Fago
[000469] Neste Exemplo, experimentos conduzidos para manipular espaçadores específicos para o fago são descritos. Em alguns experimentos, um espaçador específico para fago foi inserido em uma CRISPR existente, funcional para fornecer resistência ao fago correspondente é descrito. A cepa bacteriana usada foi Streptococcus thermophilus ST0089 e o fago foi fago 2972. S. thermophilus ST0089 é uma cepa industrialmente importante usada na produção de iogurte. É geneticamente acessível à manipulação, e suscetível ao bem conhecido fago virulento 2972.
[000470] Os loci de CRISPR foram determinados na cepa ST0089. Este foi determinado preferencialmente pelo sequenciamento do genoma inteiro de ST0089. Alternativamente, os loci de CRISPR são identificados através de PCR usando conjuntos de iniciadores com sequências idênticas a elementos anteriormente identificados de CRISPR de S. thermophilus.
[000471] Uma vez identificadas, as sequências de loci de CRISPR foram determinadas bem como as regiões proximais que contêm genes cas relevantes.
[000472] Pelo menos um locux particular de CRISPR-cas foi selecionado para manipulação adicional. A funcionalidade deste locux foi apurada por análise in silico das regiões de espaçador e sua homologia a sequências de DNA do fago (isto é, ausência e/ou presença de sequências espaçadoras e correlação de infectividade do fago com a cepa ST0089). A ausência desta correlação, a funcionalidade foi assumida, baseada na presença de todos os elementos documentados (isto é, repetições, espaçadores, sequências líder, e genes cas que putativamente codificam proteínas de tamanho total).
[000473] Uma sequência(s) espaçadora adequada foi escolhida a partir do genoma do fago 2972. Os critérios usados para selecionar o espaçador foram geralmente baseados no tamanho dos espaçadores dentro do locux de CRISPR selecionado e a identidade (preferencialmente aproximadamente 100%) à sequência do fago. De fato, qualquer sequência do fago adequada encontra uso em várias modalidades da presente invenção.
[000474] Em algumas modalidades, uma unidade CRISPR composta de uma sequência espaçadora de fago 2972, flanqueada por dois elementos de repetição (idêntico ao locux de CRISPR selecionado) foi quimicamente sintetizada. Por definição, esta "unidade de CRISPR sintética" é aproximadamente 100 bp em tamanho e é muito curta para assegurar a integração no locux de CRISPR.
[000475] Por isso, DNA adicional que flanqueia foi construído junto com a unidade CRISPR. Um mínimo de 500 bp de DNA homólogo, idêntico ao locux de CRISPR direcionado que flanqueia a unidade CRISPR sintética, foi produzido para facilitar a integração.
[000476] Em modalidades adicionais, há múltiplas abordagens. Em uma modalidade, um construto emula a adição de um novo espaçador no CRISPR existente. Em algumas modalidades alternativas, o locux de CRISPR inteiro é substituído com a unidade CRISPR sintética.
[000477] A CRISPR integrante resultante foi verificada através do sequenciamento de DNA do locux de CRISPR antes do teste biológico. Além disso, padrões de sensibilidade ao fago da CRISPR integrante contra o fago 2972 foram testados e comparados com a cepa parental.
[000478] A CRISPR integrante construída com sucesso demonstrou correlação direta entre a presença de um espaçador específico dentro do contexto próprio de CRISPR-cas.
[000479] Em experimentos adicionais, inserção de um espaçador homólogo a um DNA de fago em uma célula-recipiente foi realizada. Nestes experimentos, uma novo CRISPR espaçadora foi desenhada a partir do DNA de fago (com a identidade de 100% ao DNA de fago) dentro do gene antirreceptor e inserido na célula em um locux de CRISPR. O gene de antirreceptor foi direcionado porque CRISPR espaçadoras a partir de outras cepas foram encontradas mostrando similaridade aos genes antirreceptores de fago. Quatro cepas que carregam espaçadores mostrando identidade aos genes antirreceptor de fago foram resistentes ao fago particular. O mutante foi exposto ao fago e considerado ser resistente.
[000480] Em experimentos adicionais, um espaçador foi inserido em um hospedeiro original, mas não em um locux de CRISPR. O mutante resultante conservou sua sensibilidade ao fago. Dessa maneira, estes experimentos mostraram que o espaçador tem que estar em um determinado ambiente dentro do contexto de uma CRISPR e genes cas.
[000481] Em outros experimentos, uma determinada CRISPR espaçadora foi deletada a partir de locux de CRISPR que ocorre naturalmente. Esta deleção removeu a imunidade contra um dado fago e o hospedeiro tornou-se sensível (isto é, perdeu a resistência) ao fago ao qual o espaçador foi homólogo. Resultados destes experimentos são fornecidos na Figura 10.
[000482] Em experimentos ainda adicionais, as combinações de repetição de CRISPR-cas inteiras foram inseridas em uma célula- recipiente a fim de fornecer imunidade contra a entrada de ácido nucleico.
[000483] Em experimentos adicionais, um plasmídeo compreendendo uma CRISPR espaçadora foi preparada usando os métodos apresentados neste pedido. As tentativas de transferir este plasmídeo para células que contêm o mesmo espaçador foram mal sucedidas. Entretanto, plasmídeos que não contêm o espaçador podem ser transformados em células. As figuras 11 e 12 ilustram estes resultados.
[000484] Em experimentos adicionais, as combinações de CRISPR- cas presentes em duas cepas diferentes foram trocadas. Mostrou-se que esta troca de espaçadores modificava seus fenótipos (sensibilidade/resistência ao fago). Como indicado neste pedido quando S1S2 é introduzido em uma cepa com S4, a sensibilidade ao fago foi trocada (Vide, Figura 10).
[000485] Em experimentos adicionais, diferentes combinações de repetição CRISPR-cas são preparadas. Não somente os genes ou proteínas cas são necessários, mas os pares de repetição cas- CRISPR específicos são necessários para funcionalidade. Quando os genes ou proteínas cas são fornecidos de outro locux de CRISPR, a cepa permanece sensível ao fago.
[000486] Em experimentos ainda adicionais, um ou mais genes cas (de uma unidade CRISPR-cas funcional) foram deletados. Genes Cas são necessários para a imunidade ser fornecida. Cas mutantes são ainda sensíveis ao fago, apesar da presença do espaçador idêntico ao DNA do fago. Nestes experimentos, cas 5 (outrora conhecido como cas1) e cas7 (outrora conhecido como cas4) foram deletados. Mostrou-se que Cas5 era necessário para a resistência. Além disso, foi mostrado que cas7 é necessário para integração de novos espaçadores.
[000487] Em experimentos adicionais, genes cas são fornecidos em trans ao hospedeiro. Onde o gene cas é apagado, a imunidade é restaurada. EXEMPLO 2 - Integração de CRISPR Espaçadora(s)
[000488] Nestes experimentos, foi mostrado que a integração de uma CRISPR espaçadora no locux de CRISPR fornece resistência contra um bacteriófago ao qual CRISPR espaçadora mostra identidade. Nestes experimentos, a cepa de S. thermophilus DGCC7710RH1 foi produzida.
[000489] A cepa de Streptococcus thermophilus DGCC7710 (depositado na "Coleção Nacional de Culturas de Micro-organismos" francesa sob o número CNCM 1-2423) possui pelo menos 3 loci de CRISPR: CRISPR1, CRISPR2, e CRISPR3. Em cepas de S. thermophilus CNRZl066 e LMG18311 das quais a sequência genômica completa é conhecida (Bolotin et al., Microbiol., 151:2551-1561 [2005], CRISPR1 está localizado no mesmo locux cromossômico: entre str0660 (ou stu0660) e str0661 (ou stu0661).
[000490] Na cepa DGCC7710, CRISPR1 também está localizado no mesmo locux cromossômico, entre genes altamente similares. CRISPR1 da cepa DGCC7710 contém 33 repetições (incluindo a repetição terminal), e dessa forma 32 espaçadores.
[000491] Todos estes espaçadores são diferentes um do outro. A maioria destes espaçadores são novos (isto é, não anteriormente descritos em loci de CRISPR), mas quatro espaçadores próximos ao reboque de CRISPR1 são idênticos a CRISPR1 espaçadoras já conhecidas: - o 28o espaçador de DGCC7710 é 100% idêntico a 31o CRISPR1 espaçadora da cepa CNRZ1575 (número de acesso de Genbank DQ072991); - o 30o espaçador de DGCC7710 é 100% idêntico a 27° CRISPR1 espaçadora da cepa CNRZ703 (Número de acesso de Genbank DQ072990); - o 31o espaçador de DGCC7710 é 100% idêntico a 28o CRISPR1 espaçadora da cepa CNRZ703 (número de acesso de Genbank DQ072990); - o 32o espaçador de DGCC7710 é 100% idêntico a 30o CRISPR1 espaçadora da cepa CNRZ703 (número de acesso de Genbank DQ072990).
[000492] Durante o desenvolvimento da presente invenção, a cepa de S. thermophilus DGCC7710RH1 foi isolado como um mutante resistente ao fago natural usando DGCC7710 como cepa parental, e fago D858 como o fago virulento. D858, um bacteriófago pertencente à família Siphoviridae de vírus foi usado.
[000493] CRISPR1 da cepa DGCC7710-RH1 contém 34 repetições (incluindo a repetição terminal), e dessa maneira 33 espaçadores. Quando comparada com a sequência CRISPR1 da cepa de S. thermophilus DGCC7710, a sequência CRISPR1 da cepa de S. thermophilus DGCC7710-RH1 possui um novo espaçador adicional (e uma repetição adicional que flanqueia o novo espaçador) em uma extremidade do locux de CRISPR (isto é, próximo ao líder, na extremidade 5' do locux de CRISPR). Todos os outros espaçadores de locux de CRISPR1 permaneceram inalterados.
[000494] A sequência CRISPR1 (5'-3') da cepa DGCC7710-RH1 é fornecida abaixo:
[000495] Na sequência acima, o líder tem sequência:
[000496] A sequência integrada (GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtcaacaattgcaac atcttataacccactt; SEQ ID NO:689) compreendendo uma repetição de CRISPR é mostrada em caixa alta e uma CRISPR espaçadora (isto é, sequência de direcionamento) em caixa baixa; ambos são mostrados acima em cinza. As sequências de repetição terminal e reboque da repetição de CRISPR são mostradas abaixo: Repetição terminal: 5'gtttttgtactctcaagatttaagtaactgtacagt3'(SEQ ID NO:3) Sequência reboque: 5'ttgattcaacataaaaagccagttcaattgaacttggcttt 3' (SEQ ID NO:691)
[000497] A sequência do novo espaçador 5- TCAACAATTGCAACATCTTATAACCCACTT (SEQ ID NO:534) existe dentro do genoma do fago D858.
[000498] A sequência espaçadora é encontrada entre posições 31921 e 31950 bp (isto é, no filamento adicional) do genoma de D858 (e tem identidade de 100% à sequência genômica D858 mais 30 nucleotídeos):
[000499] O novo espaçador que está integrado no locux de CRISPR1 da cepa de S. thermophilus DGCC7710-RHl confere resistência ao fago D858 a esta cepa, como mostrado na Figura 1 e Tabela 2-1. Tabela 2-1.
[000500] Fagos conservaram a capacidade de adsorver aos mutantes.
[000501] Além disso, durante o desenvolvimento da presente invenção, a cepa de S. thermophilus DGCC7710-RH2 foi isolada como um mutante resistente ao fago natural usando a cepa de S. thermophilus DGCC7710 como a cepa parental, e o fago D858 como o fago virulento.
[000502] CRISPR1 da cepa de S. thermophilus DGCC7710-RH2 contém 34 repetições (incluindo a repetição terminal), e dessa forma 33 espaçadores. Quando comparado com a sequência CRISPR1 da cepa de S. thermophilus DGCC7710, a sequência de CRISPR1 da cepa de S. thermophilus DGCC7710-RH2 possui um novo espaçador adicional (e uma repetição adicional que flanqueia o novo espaçador) em uma extremidade do locux de CRISPR (por exemplo, próximo ao líder, na extremidade 5' do locux de CRISPR). Todos os outros espaçadores de locux de CRISPR1 permaneceram inalterados.
[000503] A sequência CRISPR1 (5'-3') da cepa DGCC7710-RH2 é mostrada abaixo:
[000504] Na sequência acima, a sequência líder é:
[000505] A sequência integrada compreendendo uma repetição de CRISPR é mostrada em caixa alta e uma CRISPR espaçadora (isto é, sequência de direcionamento) em caixa baixa ambas são mostradas acima em cinza Repetição terminal:
NO:694). As sequências de repetição terminal e reboque da repetição de CRISPR são mostradas abaixo:
[000506] Foi mostrado que a sequência dos novos espaçadores existe no genoma do fago D858.
[000507] A sequência do espaçador (SEQ ID NO:535) é encontrada entre as posições 17215 e 17244 bp (isto é, na fita mais) no genoma do D858 (e tem 100% de identidade à sequência genômica de D858 em 30 nucleotídeos):
[000508] O novo espaçador que é integrado no locux de CRISPR1 da cepa de S. thermophilus DGCC7710-RH2 confere resitência contra o fago D858 à cepa de S. thermophilus DGCC7710-RH2, como mostrado na Figura 2 e na Tabela 2-1 (Vide também, Figura 10). EXEMPLO 3 - Integração de Construto e Apagamento
[000509] Neste Exemplo, os métodos usados para integração de construto e apagamento são descritos. As cepas usadas nestes experimentos foram: cepa parental de S. thermophilus DGCC7710, sensível aos fagos 858 e 2972 S. thermophilus DGCC7778 CRISPR mutante resistente a 858 S. thermophilus DGCC7778casl KO S. thermophilus DGCC7778cas4KO S. thermophilus DGCC7778RT S. thermophilus DGCC7778RT' S. thermophilus DGCC7710R2 CRISPR mutante resistente a 2972 S. thermophilus DGCC7710R2S1S2 E. coli EC1000 forneceu pORI28 (Vide, Russell amd Klaenhammer, Appl. Environ. Microbiol., 67:43691-4364 [2001]) Escherichia coli pCR2.1TOPO forneceu pTOPO (Vide, catálogo de Invitrogen N° K4500-01)
[000510] Os seguintes plasmídeos foram usados nestes experimentos: pTOPO, um plasmídeo usado para subclonagem de vários construtos pTOPOcas1ko contém um fragmento integral de cas1 pTOPOcas4 contém um fragmento integrante de cas4 pTOPOS1S2 contém o construto de espaçador S1S2 pTOPO RT contém o construto de repetição terminal RT pORI28 é um plasmídeo usado para integração dos vários construtos no cromossomo de cepas de S. thermophilus. pORlcas1ko contém um fragmento integral de cas1 pORIcas4ko contém um fragmento integral de cas4 pORIS1S2 contém o construto de espaçador S1S2 purista contém o construto da repetição terminal de RT.
[000511] Os seguintes iniciadores foram usados nestes experimentos:
[000512] As cepas e os fagos foram obtidos da Coleção de Cultura de Danisco, ou do material referido (Russell and Klaenhammer, Appl. Environ. Microbiol., 67:43691-4364 [2001]; e Levesque et al., Appl. Environ. Microbiol., 71:4057-4068 [2005]).
[000513] A preparação, purificação e testes de fago foram realizados usando métodos conhecidos na técnica (Vide, por exemplo, Duplessis et al., Virol., 340: 192-208 [2005]; e Levesque et al., Appl. Environ. Microbiol., 71:4057-4068 [2005]).
[000514] Cepas de S. thermophilus foram cultivadas a 370C ou 42°C em M17 (Difco) suplementado com 0,5% de lactose ou sacarose. Para a infecção do fago, CaCl2 10mM foram adicionados ao meio antes da infecção por fago, como conhecido na técnica (Vide, por exemplo, Duplessis et al., supra; e Levesque et al., supra).
[000515] Enzimas usadas para realizar a digestão de restrição e PCR foram adquiridas de Invitrogen e usadas de acordo com instruções do fabricante. PCRs foram realizadas em um termociclador Eppendorf Mastercycler Gradient como conhecido na técnica (Vide, por exemplo, Barrangou et al., Appl. Environ. Microbiol., 68:2877-2884 [2002]).
[000516] A inativação gênica e a inserção do plasmídeo sítio- específica através de recombinação homóloga no cromossomo de S. thermophilus foram realizadas por subclonagem no sistema da Invitrogen pCR2.1 TOPO, a clonagem subsequente no sistema de Pori usando E. coli como um hospedeiro e os construtos foram enfim purificados e transformados em S. thermophilus como anteriormente descrito (Russell and Klaenhammer, supra). Integração do Construto de RT
[000517] Usando o construto de RT construído como mostrado na Figura 4, o construto foi inserido logo após cas4, como mostrado na Figura 5. A DGCC7778 parental é resistente ao fago 858. A parental tem dois espaçadores (Sl e D2) que são idênticos ao DNA do fago 858. A cepa resultante (RT) perdeu a resistência ao fago 858. Este resultado indica que genes cas precisam estar na vizinhança imediata do espaçador(es) para conferir resistência. Como mostrado na Figura 3, a DGCC7778 parental foi construída tal que o gene cas1 seja interrompido, resultando em uma perda de resistência, significando que cas1 é necessário para conferir resistência. Como mostrado na Figura 3, a DGCC7778 parental foi construída tal que o gene cas4 seja interrompido. Além disso, o construto S1S2 foi integrado na DGCC7710 parental, como mostrado nas Figuras 6 a 8.
EXEMPLO 4 - Isolamento de Mutantes Resistentes ao Fago e Confirmação das Sequências de CRISPR
[000518] Neste Exemplo, métodos usados no isolamento de mutantes resistentes ao fago e confirmação das sequências de CRISPR são descritos. Mutantes de S. thermophilus resistentes ao fago foram obtidos a partir de desafio da cepa hospedeira de tipo selvagem DGCC7710 (também chamada "RD534") com fago 2972 e/ou fago 858 (Levesque et al., Appl. Environ. Microbiol., 71:4057 [2005]). A cepa hospedeira foi cultivada a 420C em 10 ml do caldo M17 suplementado com lactose 0,5% (LM17). Quando a densidade ótica (600 nm) alcançou 0,3, fagos e cloreto de cálcio 10mM foram adicionados a uma concentração final de 107 pfu/ml e 50 mM, respectivamente. A cultura contendo o fago foi incubada a 420C por 24 horas e monitorada para lise. Então, 100 μl do lisado foram inoculados em 10 ml de LM17 fresco. O lisado restante foi centrifugado e o pélete foi inoculado em outro tubo contendo 10 ml de LM17 fresco. Estas duas culturas foram incubadas a 420C por 16 horas. Finalmente, estas culturas foram diluídas e plaqueadas em LM17. Colônias isoladas foram testadas para a sensibilidade ao fago como conhecido na técnica (Vide, Moineau et al., Can. J. Microbiol., 38:875 [1992]). Os loci de CRISPR dos isolados resistentes foram verificados pelo sequenciamento dos produtos de PCR, e usando relevante informação sobre genoma de fago conhecida na técnica (Vide, Levesque et al., Appl. Environ. Microbiol., 71:4057 [2005]).
EXEMPLO 5 - Engenharia de CRISPR Espaçadora
[000519] Neste Exemplo, métodos usados em algumas modalidades para engenharia de CRISPR espaçadora são descritos. Enzimas usadas para realizar digestão de restrição e PCR foram adquiridas de Invitrogen e usadas de acordo com instruções do fabricante. PCRs foram realizadas em termociclador Eppendorf Mastercycler Gradient, usando métodos conhecidos na técnica.
[000520] A inativação genética e inserção de plasmídeo sítio- específica através de recombinação homóloga no cromossomo de S. thermophilus foram realizadas por subclonagem no sistema pCR2.1- TOPO (Invitrogen), pela clonagem subsequente no sistema Pori usando E. coli como uma hospedeira, e os construtos foram enfim purificados e transformados em S. thermophilus como conhecido na técnica (Vide, Russell and Klaenhammer, Appl. Environ. Microbiol., 67:4361 [2001]).
[000521] DNA a partir do mutante WT 858+S1S2 foi usada como um molde para amplificar dois fragmentos de PCR distintos usando Pl (5'- acaaacaacagagaagtatctcattg-3'; SEQ ID NO:666) e P2 (5'- aacgagtacactcactatttgtacg-3'; SEQ ID NO:667) em uma reação, e P3(5'- tccactcacgtacaaatagtgagtgtactcgtttttgtattctcaagatttaagtaactgtacagtttgatt caacataaaaag-3'; SEQ ID NO:668) e P4 (5'-crttccttcatcctcgctttggtt-3'; SEQ ID NO:669) em outra reação. Ambos os produtos de PCR foram posteriormente usados como moldes em outras reações de PCR usando Pl e P4 para gerar o construto de S1S2 segundo a Figura 11.
[000522] O construto S1S2 foi subclonado no sistema Invitrogen pCR2.1-TOPO. Este construto foi digerido com NotI e HindIII e posteriormente clonado em Pori nos sítios NotI e HindIII, fornecendo o construto pS1S2. A integração de pS1S2 no locux de CRISPR1 de WTΦ2972+S4 ocorreu através de recombinação homóloga na extremidade 3' de cas7, para gerar WTΦ2972+S4::pS1S2.
[000523] O construto pR foi gerado usando o construto pS1S2 como um molde. Especificamente, o construto S1S2 subclonado em pCR2.1- TOPO foi digerido usando BsrG1, que corta dentro da repetição de CRISPR.
[000524] Então, a digestão foi religada e um plasmídeo contendo uma repetição única e nenhum espaçador foi usado posteriormente para clonagem em pORI usando NotI e HindIII, gerando pR. A integração de pR no cromossomo de WTΦ858+S1S2 na extremidade 3' de cas7 através de recombinação homóloga gerou WT 858+SlS2::pR, um mutante onde o locux de CRISPR1 é deslocado e uma repetição única é inserida em seu lugar.
[000525] O mutante WT 858+SlS2::pR foi posteriormente cultivado na ausência de eritromicina, e variantes sensíveis ao antibiótico foram analisadas para encontrar um mutante que tinha uma deleção completa do locux de CRISPR1. A deleção foi derivada da recombinação homóloga ocorrendo na extremidade 3' da ORF (ao contrário de um evento de recombinação ocorrendo na extremidade 3' de cas7, que teria resultado na restauração da cepa de WTΦ858+S1S2), gerando WTΦ858+S1S2ΔCRISPR1 (Vide, Figura 12), um mutante onde o locux de CRISPR1 é deletado (Vide também, Figura 10).
EXEMPLO 6 - Inativação de Genes cas
[000526] Para inativação de cas5, uma porção interna de 801 bp de cas5 foi amplificada por PCR usando iniciadores 5'- caaatggatagagaaacgc-3'(SEQ ID NO:670) e 5'-ctgataaggtgttcgttgtcc-3' (SEQ ID NO:671) e subclonada em pCR2.1-TOPO de E. coli (Invitrogen). Este construto foi digerido com EcoRV e HindIII e posteriormente clonado no pORI nos sítios EcoRV e HindIII. A integração deste construto no gene cas5 de WTΦ858+S1S2 ocorreu através de recombinação homóloga da porção interna do gene, resultando em WTΦ858+S1S2:: p cas 5-.
[000527] Similarmente, uma porção interna de 672 bp de cas7 foi amplificada por PCR usando iniciadores 5'- ggagcagatggaatacaagaaagg-3'(SEQ ID NO:672) e 5'- gagagactaggttgtctcagca-3' (SEQ ID NO:673) e subclonado em pCR2.1-TOPO de E. coli (Invitrogen). Este construto foi digerido com EcoRV e HindIII e posteriormente clonados em pORI nos sítios EcoRV e HindIII. A integração destes construtos no gene cas7 de WT 858+S1S2 ocorreu através de recombinação homóloga da porção interna do gene, resultando em WT 858+S1S2:: pcas7- (Vide, Figuras 10 a 12).
EXEMPLO 7 - Métodos Naturais para Inserção de uma Sequência Adicional em um Locux de CRISPR
[000528] Neste Exemplo, métodos usados para provocar naturalmente a inserção de uma sequência adicional dentro de um locux de CRISPR de uma cepa bacteriana são descritos. "Sequência adicional" como usada neste pedido é definida como uma sequência espaçadora associada com a sequência de repetição de CRISPR. Mais particularmente, a "sequência adicional" origina-se em parte de um fago doador capaz de infectar a bactéria alvo e parcialmente da duplicação da sequência de repetição de CRISPR. A introdução do DNA do fago doador na célula bacteriana resulta na infecção da célula pelo fago doador. A seleção de células que contém sequência adicional é feito através da pressão de seleção com o fago doador tal que as células modificadas selecionadas sejam resistentes ao fago.
[000529] Nestes experimentos, uma cepa parental foi exposta a um fago doador e uma variante resistente ao fago da cepa parental (isto é, uma cepa variante) selecionada. A cepa variante foi analisada (por exemplo, por PCR e/ou sequenciamento de DNA) para confirmar a presença de uma sequência adicional dentro de um locux de CRISPR. A sequência nucleotídica da sequência adicional foi determinada. Tipicamente, a sequência adicional é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fago doador associado (fusionado) a uma sequência de repetição de CRISPR, e confere resistência ao fago doador.
[000530] Em alguns experimentos, a cepa parental foi pré-cultivada durante a noite em um meio baseado em leite a 420C. Um meio baseado em leite foi então inoculado em 0,1% (v/v) com uma pré- cultura da cepa parental e com uma suspensão do fago doador em um MOI de 10. Após 6 h de incubação a 42 0C, diluições da cultura foram plaqueadas em um meio nutricional, para obter colônias isoladas. Isolados foram então testados para sua resistência ao fago doador (qualquer método adequado conhecido na técnica encontram uso nestes experimentos). As cepas variantes foram então analisadas para presença de uma sequência adicional dentro de um dos seus loci de CRISPR.
[000531] Loci de CRISPR foram amplificados por PCR e as sequências nucleotídicas dos produtos PCR resultantes foram determinadas sequenciamento de DNA padrão usando métodos de PCR de sequenciamento conhecidos na técnica. Estas sequência foram então comparadas com aquela da cepa parental usando métodos padrão conhecidos na técnica.
[000532] Em alguns experimentos, DGCC7710 foi usada como a cepa parental e D2972 foi usado como um fago doador. A cepa parental de S. thermophilus DGCC7710 foi exposta ao fago doador D2972 como descrito acima. Uma cepa variante denominada WTphi2972+S6 foi obtida (Vide, Tabela 7-1). A Tabela 7-1 também inclui resultados de cepas de variantes descritas em outros Exemplos. Na Tabela 7-1, a EOP é expressa relativamente ao fago D2972. O posicionamento da sequência adicional no genoma do fago é dado relativamente ao fago D2972, a menos que especificado de outra maneira. Tabela 7.1 Descrição das Cepas Variantes Modificadas em CRISPR de DGCC7710
[000533] Esta variante exibiu resistência a D2972, quando a eficiência de plaqueamento (EOP) de D2972 em WTphi2972+S6 foi reduzida por 4 logs. DNA foi extraído de WT phi2972+S6 e o locux de CRISPR1 foi analisado por PCR como conhecido na técnica (Vide, por exemplo, Bolotin et al. [2005], supra) usando combinação de um iniciador de senso (YC70 e/ou SPIDR a montante (5'- gTCTTTAgAAACTgTgACACC-3'; SEQ ID NO:674) e um iniciador de antissenso (YC31 e/ou SPIDR a jusante (5'- TAAACAgAgCCTCCCTATCC; SEQ ID NO:675). A sequência do produto PCR foi determinada e comparada com aquela do locux de CRISPR1 de DGCC7710. Comparado com DGCC7710, WTphi2972+S6 fooi encontrada difererir pela adição de uma sequência espaçadora única de 30 bp na extremidade 5' da sua região CRISPR1 e pela duplicação da sequência de repetição, como mostrado na Figura 14. A comparação da sequência adicional com a sequência do genoma D2972 mostra que a nova sequência espaçadora é 100% idêntica àquela do genoma D2972 do nucleotídeo 34521 ao nucleotídeo 34492.
[000534] Em alguns experimentos adicionais, WTphi858+S1S2::pcas5 foi usada como a cepa parental e D858 foi usado como um fago doador. A cepa resultante variante denominada WTphi858+S1S2:: pcas5phi858+Sl9 (Vide, Tabela 7-1) foi resistente a D858, com uma EOP reduzida por 5 logs. DNA foi extraído de WTphi858+S1S2:: pcas5phi858+Sl9 e seu locux de CRISPR3 foi analisado por PCR usando um iniciador de senso (CR3_cabeçaFl, 5'-CTGAGATTAATAGTGCGATTACG; SEQ ID NO:676) e um iniciador de antissenso (CR3_caudaR2, 5'- GCTGGATATTCGTATAACATGTC; SEQ ID NO:677). A sequência do produto de PCR foi determinado e comparada com aquela do locux de CRISPR3 de WTphi858+S1S2::pcas5. Comparada a WTphi858+SIS2::pcas5, WTphi858+S1S2::pcas5phi858+Sl9 diferencia-se pela adição de uma sequência espaçadora única de 30 bp na extremidade 5' da sua região de CRISPR3 e pela duplicação da sequência de repetição. A comparação da sequência adicional com a sequência do genoma D858 mostrou que a nova sequência espaçadora é 100% idêntica àquela do genoma D858 do nucleotídeo 33824 ao nucleotídeo 33853.
[000535] Em outros experimentos adicionais, DGCC7809 foi usada como a cepa parental e D3743 foi usado como fago doador. A cepa variante resultante denominada DGCC7809phiD3743+S28 (Vide, Tabela 72) foi resistente ao D3743 com uma EOP reduzida por 8 logs. DNA foi extraído de DGCC7809phiD3743+S28 e seu locux de CRISPR3 foi analisado por PCR usando um iniciador de senso (CR3_leadFl, 5 '- CTGAGATTAATAGTGCGATTACG; SEQ ID NO:676) e um iniciador de antissenso (CR3_caudaR2, 5'-GCTGGATATTCGTATAACATGTC; SEQ ID NO:677). A sequência do produto de PCR foi determinada e comparada àquela do locux de CRISPR3 de ST0l89. Em comparação ao DGCC7809, DGCC7809phiD3743+S28 diferencia-se pela adição de uma sequência espaçadora única de 29 bp na extremidade 5' da sua região CRISPR3 e pela duplicação da sequência de repetição. A sequência do fago D3743 é desconhecida; entretanto a comparação da sequência adicional com a sequência de outro genoma de fago estreptocócico mostra que a nova sequência espaçadora é 100% idêntica àquela do genoma do fago DT1 do nucleotídeo 6967 ao nucleotídeo 6996.
[000536] Em outros experimentos adicionais, DGCC3198 foi usada como a cepa parental e D4241 foi usado como o fago doador. A cepa variante resultante denominada DGCC3198phi4241+S29 (Vide, Tabela 7-2) foi resistente a D4241 com uma EOP reduzida por 8 logs. DNA foi extraído de DGCC3198phi4241+S1 e seu locux de CRISPR1 foi analisado por PCR usando um iniciador de senso (YC70 e/ou SPIDR-a montante (5'-gTCTTTAgAAACTgTgACACC-3'; SEQ ID NO:674) e de um iniciador de antissenso (YC31 e/ou SPIDR a jusante (5'- TAAACAgAgCCTCCCTATCC; SEQ ID NO:675). A sequência do produto de PCR foi determinada e comparada com aquela do locux de CRISPR1 de DGCC3198. Em comparação com DGCC3198, DGCC3198phi4241+S29 diferencia-se pela adição de uma sequência espaçadora única de 30 bp na extremidade 5' de sua região CRISPR1 e pela duplicação da sequência de repetição. A sequência do fago D4241 é desconhecida; entretanto a comparação da sequência adicional com a sequência de outro genoma de fago estreptocócico mostra que a nova sequência espaçadora é 100% idêntica àquela do genoma do fago DT1 do nucleotídeo 3484 ao nucleotídeo 3455.
[000537] A Tabela 7-2 abaixo fornece uma descrição de cepas de variantes CRISPR-modificadas de DGCC7809 e de DGCC3198. Nesta Tabela, EOP é expressa relativamente aos fagos doadores. O posicionamento da sequência adicional no genoma do fago é dado relativamente ao fago DT1.
EXEMPLO 8 - Seleção do grupo de Cepas de Variantes de CRISPR modificadas a partir da Mesma Cepa Parental
[000538] Neste Exemplo, métodos usados para a seleção do grupo de cepas de variantes a partir da mesma cepa parental que se diferencia pela sua sequência adicional que se origina do mesmo fago são descritos. Como várias porções de um fago doador encontram uso como fontes de sequências adicionais, múltiplas cepas variantes diferentes podem ser geradas a partir do dado fago doador. Além disso, cada cepa variante tem uma sequência adicional diferente. Consequentemente, múltiplas cepas são desenvolvidas a partir da mesma cepa parental além da cepa variante descrita no Exemplo 7. Em alguns experimentos, estas cepas adicionais foram geradas pela exposição da cepa recipiente ao mesmo fago doador. As várias cepas variantes resultantes foram contempladas para apresentar diferente espectro de sensibilidade ao fago.
[000539] Em culturas independentes, a cepa parental foi submetida ao mesmo fago doador. Para cada cultura, uma variante resistente a um único fago foi isolada como descrito no Exemplo 7 e então analisada. Sequências adicionais em cada uma das cepas variantes foram comparadas uma com a outra. O espectro de sensibilidade das cepas variantes ao fago doador e outros fagos foi determinado usando métodos microbiológicos clássicos conhecidos na técnica. Os espectros de sensibilidade das várias cepas foram então comparados. As cepas variantes selecionadas foram aquelas apresentando sequência(s) adicional diferente e espectros diferentes de sensibilidade ao fago.
[000540] Em alguns experimentos, a seleção de várias cepas variantes de DGCC7710 usando D2972 como um fago doador único foi conduzida. A cepa parental DGCC7710 foi exposta ao fago doador D2972 em quatro culturas independentes como descrito no Exemplo 7. Para cada uma das culturas, uma cepa variante foi isolada e foi respectivamente denominada WTphi2972+S4, WTphi2972+S20, WTphi2972+S21 e WTphi2972+S22 (Vide, Tabela 7-1).
[000541] Estas cepas variantes exibiram resistência a D2972, como a eficiência de plaqueamento (EOP) de D2972 nas quatro variantes resistentes ao fago foi reduzido por 3 a 5 logs. DNA foi extraído de WTphi2972+S4, WTphi2972+S20, WTphi2972+S21 e WTphi2972+S22 e foi analisado por PCR usando métodos conhecidos na técnica (Vide, por exemplo, Bolotin em al. [2005], supra), usando combinação de um iniciador de senso (YC70 e/ou SPIDR a montante (5'- gTCTTTAgAAACTgTgACACC; SEQ ID NO:674) e de um iniciador de antissenso (YC31 e/ou SPIDR a jusante (5'- TAAACAgAgCCTCCCTATCC; SEQ ID NO:675). As sequências dos produtos de PCR foram determinadas e comparadas com aquelas do locux de CRISPR1 de DGCC7710. Comparada a DGCC7710, WTphi2972+S4, WTphi2972+S20, WTphi2972+S21 e WTphi2972+S22 diferenciam-se pela adição de uma sequência espaçadora de 30 bp na extremidade 5' da sua região de CRISPR1 e pela duplicação da sequência de repetição, como mostrado na Figura 17). A comparação destas novas sequências espaçadoras com a sequência do genoma D2972 mostra que as novas sequências espaçadoras são 100% idênticas àquelas do genoma D2972 do nucleotídeo 31582 ao nucleotídeo 31611, do nucleotídeo 25693 ao nucleotídeo 25722, do nucleotídeo 27560 ao nucleotídeo 27589 e do nucleotídeo 24624 ao nucleotídeo 24653, respectivamente. Todos os quatro espaçadores adicionais foram encontrados sendo cada uma diferente da outra e diferentes dos espaçadores descritos no Exemplo 7.
EXEMPLO 9 - Métodos Naturais Usados para Inserção de uma Segunda Sequência Adicional em um locux de CRISPR
[000542] Neste Exemplo, métodos naturais usados para provocar a inserção de uma segunda sequência adicional em locux de CRISPR são descritos. Na inserção de uma sequência adicional de um dado fago doador em um locux de CRISPR bacteriano, a cepa variante torna-se resistente ou pelo menos menos sensível a este fago. Por isso, o método descrito no Exemplo 7 não é mais eficiente para a inserção de sequências adicionais no locux de CRISPR desta cepa variante. Por exemplo, o método não pode ser aplicado à cepa variante WTphi2972+S6 (como uma cepa parental) usando D2972 como um fago doador, porque WTphi2972+S6 tem sensibilidade significativamente reduzida a D2972 (Vide, Exemplo 7).
[000543] Em alguns experimentos, este problema foi superado pelo uso de um fago doador mutado derivado de D2972 que inclui pelo menos uma modificação específica dentro do seu genoma (isto é, um "fago mutado"). Este fago mutado foi selecionado pela exposição do fago doador à cepa variante, tal que a modificação (isto é, mutação) do fago parental produziu virulência para a cepa variante.
[000544] Em alguns experimentos, o fago mutado tinha uma mutação no seu genoma dentro da região contendo a sequência espaçadora adicional que é parte da sequência adicional na cepa variante. A cepa variante foi sensível a este fago mutado. A cepa variante foi exposta ao fago mutado e a variante resistente a um novo fago (variante de 2a geração) da cepa variante foi selecionada. A variante de 2a geração foi analisada usando métodos adequados conhecidos na técnica (por exemplo, PCR e sequenciamento), para confirmar a presença de uma sequência adicional dentro de um locux de CRISPR. A sequência nucleotídica da sequência adicional foi determinada. Em alguns experimentos, a sequência adicional foi encontrada contendo um fragmento de aproximadamente 30 nucleotídeos em tamanho do fago mutado que fornece resistência ao fago mutado.
[000545] Em alguns experimentos, a cepa variante foi pré-cultivada durante a noite em um meio apropriado baseado em leite a 42°C. Um meio baseado em leite adequado então foi inoculado com a pré-cultura da cepa variante a uma concentração de aproximadamente 106 cfu/ml e com uma suspensão do fago doador em uma maior MOI do que 100. A cultura foi incubada durante a noite a 42°C, e então centrifugada. O sobrenadante foi colhido e filtrado usando um filtro de 0,45 μm. Diluições do sobrenadante filtrado foram usadas para inocular um meios de ágar nutritivos semeados com a cepa variante a fim de obter placas de fago isoladas, usando qualquer método adequado conhecido na técnica. Placas isoladas foram cultivadas na cepa variante em meios nutritivos líquidos, usando qualquer método adequado conhecido na técnica. Uma suspensão do fago mutado foi obtida pela filtração da cultura através de um filtro de 0,45 μm. O fago mutado então foi usado como descrito acima ( Vide, Exemplo 7) para provocar a inserção de uma segunda sequência espaçadora adicional no locux de CRISPR da cepa variante.
[000546] Em alguns experimentos, WTphi2972+S6 (Vide, Exemplo 7 e Tabela 7-1) foi usado como a cepa parental e D4724 foi usado como o fago doador. A cepa variante WTphi2972+S6 foi cultivada na presença da alta concentração do fago D2972. Um fago mutado chamado D4724 foi isolado pelo plaqueamento do sobrenadante a partir desta cultura na cepa WTphi2972+S6 usando os métodos descritos acima. A virulência do fago mutado D4724 na WTphi2972+S6 foi verificada. A cepa variante WTphi2972+S6 foi exposta ao fago mutado D4724 em uma cultura como descrito no Exemplo 7. Uma cepa variante resistente ao fago denominada WTphi2972+S6 phi4724+S15 (Vide, Tabela 7-1) foi obtido.
[000547] Em comparação com WTphi2972+S6 esta cepa variante exibiu uma resistência aumentada a D2972, quando a eficiência de plaqueamento (EOP) de D2972 em WTphi2972+S6 phi4724+S15 foi reduzida por mais que 8 logs (em vez de 4 logs); além disso, sua resistência também foi aumentada emm comparação a WTphi2972+S6 como mostra alguma resistência a D4724 (Vide, Tabela 9-1). DNA foi extraído de WTphi2972+S6 phi4724+S15 e seu locux de CRISPR1 foi analisado por PCR como descrito acima usando as mesmas combinações de iniciadores como descrito acima. A sequência do produto de PCR foi determinada e comparada àquela do locux de CRISPR1 de WTphi2972+S6 . Comparado a WTphi2972+S6, WTphi2972+S6 phi4724+S15 diferencia-se pela adição de uma sequência espaçadora de 30 bp na extremidade 5' da sua região de CRISPR1 e pela duplicação da sequência de repetição, como mostrado na Figura 17. Uma comparação desta sequência espaçadora adicional com a sequência do genoma D2972 mostrou que a segunda sequência espaçadora adicional é 100% idêntica àquela do genoma D2972 do nucleotídeo 1113 ao nucleotídeo 1142.
[000548] A partir de culturas independentes usando condições experimentais idênticas, as cepas variantes WTphi2972+S6phi4724+S16 e WTphi2972+S6phi4724+S24 foram isoladas e analisadas (Vide, Tabela 7-1). Quando comparado com WTphi2972+S6 estas cepas variantes exibiram uma resistência aumentada a D2972, quando a eficiência de plaqueamento (EOP) de D2972 em WTphi2972+S6phi4724+S17 e WTphi2972+S6phi4724+S24 foi reduzida por mais que 8 logs de ambas as cepas variantes; e sua resistência também foi aumentada, quando comparada com WTphi2972+S6 quando apresentou alguma resistência a D4724 (Vide Tabela 9-1). Além disso, estas cepas variantes exibem sequencias espaçadoras adicionais em CRISPR1 que são 100% idênticas àquelas do genoma de D2972 do nucleotídeo 33968 a nucleotídeo 33997 e nucleotídeo 30803 ao nucleotídeo 30832, respectivamente.
[000549] Em experimentos adicionais, WTphi2972+S6phi4724+S15 foi usada como a cepa parental e D4733 foi usado como fago doador. Os métodos descritos acima foram usados para gerar o fago mutado D4733 a partir do fago D4724. Então, o fago D4733 foi usado para obter uma cepa variante resistente ao fago a partir de WTphi2972+S6phi4724+S15. A cepa variante resultante foi denominada WTphi2972+S6phi4724+S15phi4733+S16 (Vide, Tabela 7-1). Esta cepa variante contém uma sequência adicional incluindo uma sequência espaçadora que é 100% idêntica a uma sequência do genoma de D2972, nucleotídeo 29923 ao nucleotídeo 29894. Exibiu uma resistência aumentada a D2972, quando a eficiência de plaqueamento (EOP) de D2972 em WTphi2972+S6phi4724+S15phi4733+S16 foi reduzida por mais que 8 logs e sua resistência foi expandida ao fago D4733 (Vide Tabela 91). A tabela 9-1 fornece uma descrição da resistência ao fago de algumas cepas variantes CRISPR-modificadas de DGCC7710. Nesta Tabela, "nd" indica que os resultados não foram determinados.

[000550] Em ainda experimentos adicionais, WTphi2972+S4 foi usada como a cepa parental e D4720 foi usado como o fago doador. Usando os mesmos métodos como descrito acima, fago mutado D4720 foi gerado a partir do fago D2972. O fago D4720 foi usado para obter uma variante resistente ao fago de WTphi2972+S4. A cepa variante resultante foi denominado WTphi2972+S4phi4720+S17 (Vide Tabela 7-1). Esta cepa variante contém uma sequência adicional incluindo uma sequência espaçadora que é 100% idêntica a uma sequência do genoma de D2972 do nucleotídeo 33968 ao 33997. Ela exibe resistência aumentada a D2972, quando a eficiência de plaqueamento (EOP) de D2972 em WTphi2972+S4phi4720+S17 foi reduzida por 6 logs (comparada com 5 logs); e sua resistência foi aumentada ao fago D4720 (Vide, Tabela 9-1). EXEMPLO 10 - Métodos Naturais Alternativos para Inseção da Segunda Sequência(s) Adicional em Loci de CRISPR
[000551] Neste Exemplo, métodos naturais alternativos úteis para inserção de uma segunda sequência adicional em um locux de CRISPR são descritos. É conhecido que uma dada cepa parental pode ser sensível a mais de uma família de fagos. Esta diversidade de sensibilidade foi vantajosamente usada para inserir sequências adicionais em um locux de CRISPR de uma cepa variante, como descrito neste pedido. Nestes experimentos, o segundo fago doador foi selecionado pelo teste de virulência de uma seleção de fagos na cepa parental e na cepa(s) variante. Os segundos fagos doadores de interesse foram aqueles que foram virulentos para ambas as cepas. Foi contemplado que estes fagos poderiam provavelmente representar uma família diferente de fagos que aquelas representadas pelo fago doador inicial. Após sua seleção, o segundo fago doador foi usado para infectar a cepa variante. Como descrito nos métodos acima, uma segunda geração de cepa variante resistente ao fago foi isolada e testada para uma sequência adicional dentro do locux de CRISPR.
[000552] Nestes experimentos, uma coleção de fagos (ou amostras contendo fago) foi testada contra a cepa parental usando métodos microbiológicos clássicos conhecidos na técnica. Fagos (ou amostras) que são virulentos à cepa parental então foram testados contra a cepa variante usando os mesmos métodos. Um fago (ou amostra) que foi virulento para a cepa variante foi selecionado como um segundo fago doador. No caso do fago contendo amostras, um fago virulento foi purificado para homogeneizar na cepa variante usando métodos microbiológicos clássicos conhecidos na técnica. Em alguns experimentos, a sequência do segundo fago doador foi determinada. Em alguns experimentos, o segundo fago doador foi então usado como descrito acima (Vide, Exemplo 7) para provocar a inserção de uma segunda sequência adicional no locux de CRISPR da cepa variante.
[000553] Em alguns experimentos, WTphi2972+S4 (Vide, Exemplo 8 e Tabela 7-1) foi usada como a cepa parental e D858 foi usado como o fago doador. Em testes de vários fagos, a cepa DGCC7710 foi encontrada sendo sensível a ambos fago D2972 e fago D858. Além disso, D858 foi encontrado sendo virulento contra a cepa variante WTphi2972+S4. O fago D858, por isso, foi escolhido como um segundo fago doador em alguns experimentos.
[000554] A cepa variante WTphi2972+S4 foi exposta ao segundo fago doador D858, como descrito no Exemplo 7. A cepa variante resistente a um fago denominada WTphi2972+S4phi858+S18 (Vide, Tabela 7-1) foi obtida que é resistente a D858 (Vide Tabela 9-1). Esta cepa exibe uma resistência aumentada a D2972, quando a eficiência de plaqueamento de D2972 em WTphi2972+S4phi858+S18 foi reduzida por mais que 8 logs (comparada com 5 logs de WTphi2972+S4; Vide Tabela 9-1). DNA foi extraído de WTphi2972+S4phi858+S18 e seu locux de CRISPR1 foi analisado por PCR usando os mesmos métodos e iniciadores como descrito acima. A sequência do produto PCR foi determinada e comparada com aquela do locux de CRISPR de WTphi2972+S4. Comparada a WTphi2972+S4, WTphi2972+S4phi858+S18 diferencia-se pela adição de uma sequência espaçadora de 30 bp na extremidade 5' da sua região de CRISPR1 e pela duplicação da sequência de repetição, como mostrado na Figura 17. A comparação desta sequência espaçadora adicional com a sequência do genoma D858 mostrou que a segunda sequência adicional espaçadora é 100% idêntica àquela do genoma D858 do nucleotídeo 30338 ao nucleotídeo 30367.
[000555] Outra cepa variante denominada WTphi2972+S4phi4720+S25 (Vide, Tabela 7-1) também foi obtida usando este método em trabalho experimental independente. Esta cepa variante contém uma sequência adicional incluindo uma sequência espaçadora que é 100% idêntica a uma sequência do genoma D858 do nucleotídeo 33886 ao 33915. Ela exibe resistência aumentada a D2972, quando a eficiência de plaqueamento de D2972 em WTphi2972+S4phi4724+S25 foi reduzida por mais que 7 logs (Vide, Tabela 9-1). EXEMPLO 11 - Gênese de uma Cepa Variante CRISPR-modificada Resistente a Múltiplos Fagos por Inserções Múltiplas de Sequências Adicionais nos Loci de CRISPR
[000556] Neste Exemplo, o desenvolvimento de uma cepa resistente a multifago é descrita através da adição iterativa de sequências de fago nos loci de CRISPR, quando a adição de 2 sequências de fago nos loci de CRISPR não é suficiente para conferir resistência a todos os fagos a uma dada cepa. Por exemplo, cepa WTphi2972+S4phi858+S18 (descrito no Exemplo 10) foi encontrada sendo sensível a múltiplos outros fagos. No processo de desenvolvimento de uma cepa resistente a multifagos, a cepa parental foi submetida a um primeiro fago para selecionar uma cepa variante, então a cepa variante foi submetida a um segundo fago para selecionar uma segunda geração da cepa variante que é resistente a ambos os fagos. Então, a última cepa variante foi submetida iterativamente aos fagos aos quais foi ainda sensível, até que uma cepa variante final fosse obtida que foi resistente a todos os fagos disponíveis.
[000557] Usando métodos conhecidos na técnica, um grupo de 10 fagos de referência foi identificado que são representativos da diversidade de fagos que são capazes de se desenvolver na cepa DGCC7710, ou seja, fagos D858, D1126, D2766, D2972, D3288, D3821, D4083, D4752, D4753, e N1495. Como descrito no Exemplo 7, DGCC7710 foi exposta ao fago D2972 para gerar a cepa variante DGCC9705. DGCC9705 foi encontrada sendo resistente ao fago D2766 e D4752 em adição ao fago D2972, mas foi ainda sensível a outros fagos como mostrado na Tabela 11-1. DGCC9705 é descrita na Tabela 11 - 1 e na Figura 17. DGCC9705 apresenta 1 sequência adicional em CRISPR1 e 1 sequência adicional em CRISPR3. Análise da sequência do locux de CRISPR1 e do locux de CRISPR3 foi feita de acordo com métodos descritos no Exemplo 7. A sequência dos produtos de PCR foi determinada e comparada com aquela dos loci da CRISPR1 e 3 de DGCC7710. DGCC9705 apresenta 1 espaçador adicional em seu locux de CRISPR1 e um espaçador adicional no seu locux de CRISPR3. As sequências espaçadoras são idênticas a sequências do fago D2972. Usando os mesmos métodos, DGCC9705 então foi exposta ao fago D3821 e a cepa variante estira DGCC9726 então foi isolada. Além de ser resistente a D2972, DGCC9726 tem resistência aos fagos D858, D3821, D4083 e N1495 (Vide, Tabela 111). DGCC9726 tem 1 sequência espaçadora adicional em seu locux de CRISPR1 quando comparada com DGCC9705 (Vide, Tabela 7-1 e Figura 17). A sequência espaçadora adicional é idêntica a uma sequência de D2972. Através da exposição da cepa DGCC9726 ao fago D3288, DGCC9733 foi isolado. A cepa DGCC9733 é adicionalmente resistente ao fago D3288 e Dl126 (Vide, Tabela 11-1). DGCC9733 tem 1 sequência espaçadora adicional em seu locux de CRISPR1 comparativamente a DGCC9726 (Vide, Tabela 7-1 e Figura 17). Esta sequência espaçadora tem alguma identidade (identidade de 25/30 pares de base) a uma sequência do fago estreptocócico 7201. Finalmente, por uma última exposição iterativa ao fago D4753, DGCC9836 foi isolada que é resistente a todos os fagos (Vide, Tabela 11-1). DGCC9836 tem 2 sequências espaçadoras adicionais em seu locux de CRISPR1 e 2 sequências espaçadoras adicionais em seu locux de CRISPR3 (Vide, Tabela 7-1 e Figura 17). Uma sequência espaçadora é idêntica a uma sequência no fago D2972 e 3 outras sequências espaçadoras são idênticas a sequências no fago D858.
[000558] A Tabela 11-1 fornece dados quanto à sensibilidade ao fago da cepa variante CRISPR-modificada DGCC9836 e cepas variantes CRISPR-modificadas intermediárias. Nesta Tabela, "S" indica sensibilidade e "R" indica resistência.
EXEMPLO 12 - Método Natural para Inserir Múltipla Sequência(s) Adicional em um Locux de CRISPR
[000559] Neste Exemplo, métodos são descritos para inserir múltiplas sequências adicionais nos loci de CRISPR.
[000560] Nestes métodos, antes de usar vários fagos iterativamente, a cepa parental foi exposta a uma mistura contendo múltiplos fagos. Uma coleção de fagos foi testada contra múltiplas cepas usando métodos microbiológicos clássicos, a fim de determinar seu espectro de hospedeiro. Fagos que foram virulentos para a cepa parental mas que tiveram diferente espectro de hospedeiro foram selecionados. Os fagos selecionados foram misturados e usados nos métodos fornecidos acima (Vide, Exemplo 7) para provocar a inserção de sequências adicionais nos loci de CRISPR da cepa variante.
[000561] Em alguns experimentos, DGCC7710 foi usado como a cepa parental e D858 e D2972 foram usados como fagos doadores. Em testes de vários fagos, a cepa DGCC7710 foi encontrada sendo sensível a ambos fago D2972 e fago D858. Entretanto, D2972 e D858 apresentaram diferentes espectros de hospedeiro quando testados na cepa DGCC7778, sugerindo que os dois fagos foram diferentes.
[000562] A cepa parental DGCC7710 foi exposta a uma mistura de fago D858 e D2972 como descrito no Exemplo 7. Uma cepa variante resistente ao fago denominada WTphi858phi2972+S9S10S11S12 (Vide, Tabela 7-1) foi obtido. Ela exibe resistência a D858, quando a eficiência de plaqueamento de D858 em WTphi858phi2972+S9S10S11S12 foi reduzida por mais de 7 logs, bem como a resistência a D2972, quando a eficiência de plaqueamento de D2972 em WTphi858phi2972+S9S10S11S12 foi reduzida por mais de 7 logs. DNA foi extraído de WTphi858phi2972+S9S10S11S12 e seus loci de CRISPR foram analisados por PCR usando os mesmos métodos e iniciadores como descrito acima. A sequência dos produtos de PCR foram determinados e comparada com aquela do locux de CRISPR1 e do locux de CRIPR3 de DGCC7710. Comparada com DGCC7710, WTphi858phi2972+S9S10S11S12 diferencia-se pela adição de 4 sequências espaçadoras de 30 bp na extremidade 5' da sua região de CRISPR1 e pela duplicação das sequências de repetição, como mostrado na Figura 17. A comparação das sequências espaçadoras adicionais com a sequência do genoma D2972 mostrou que as sequências espaçadoras adicionais são 100% idênticas àquelas dos D2972 do nucleotídeo 7874 ao nucleotídeo 7903, do nucleotídeo 20650 ao nucleotídeo 20621, do nucleotídeo 8360 ao nucleotídeo 8389 e do nucleotídeo 18998 ao nucleotídeo 19027.
[000563] Em experimentos adicionais, a cepa WTphi858phi2972+S13S14 (Vide, Tabela 7-1) foi também obtido após estes métodos. Ela exibe resistência a D858, quando a eficiência de plaqueamento de D858 em WTphi858phi2972+S13S14 foi reduzida por 7 logs, e resistência a D2972, quando a eficiência de plaqueamento de D2972 em WTphi858phi2972+S13S14 foi reduzida por 8 logs. A comparação das sequências espaçadoras adicionais com a sequência do genoma de D2972 mostrou que as sequências espaçadoras adicionais são 100% idênticas àquelas da D2972 do nucleotídeo 33602 ao nucleotídeo 33631 e do nucleotídeo 4830 ao nucleotídeo 4801. EXEMPLO 13 - Combate a Fagos na Fermentação Usando uma Cepa variante CRISPR-modificada
[000564] Neste Exemplo, métodos de combate aos fagos na fermentação pelo uso de uma cepa variante em vez de uma cepa parental (isto é, de tipo selvagem, recipiente) são descritos. Dessa maneira, este Exemplo fornece ainda outra descrição dos benefícios fornecidos pelas cepas variantes.
[000565] Em alguns experimentos, comparação da cepa DGCC7710 para WTphi2972+S20 e a cepa WTphi2972+S26S27 na fermentação de leite na presença do fago D2972 foi realizada. DGCC7710 é uma cepa industrial usada na fermentação de leite. A cepa WTphi2972+S20 é descrito na Tabela 7-1 e no Exemplo 8 e exibe em seu locux de CRISPR1 um espaçador adicional, quando comparada a cepa DGCC7710. A cepa WTphi2972+S20 exibe resistência melhorada a D2972, quando comparada com DGCC7710. WTphi2972+S26S27 é outra variante exibindo a mesma resistência a D2972 (descrita na Tabela 7-1) e exibe 2 espaçadores adicionais em seu locux de CRISPR1.
[000566] As fermentações seriadas foram realizadas com cada cepa. Em primeiro lugar, meio de leite em pó 10% (p/v) foi semeado com 1% (v/v) de uma pré-cultura da cepa testada e com 104 pfu/ml de fago D2972. A cultura foi incubada a 42°C por 6 h. Após a primeira fermentação, uma segunda fermentação foi configurada. As mesmas condições exatas de fermentação foram usados exceto que 0,1% do volume do fermentado da fermentação precedente foi adicionado (antes da adição, o fermentado foi filtrado usando um filtro de 0,45 μm). Então, sucessivas fermentações foram realizadas com as mesmas condições experimentais como aquelas usadas para a segunda fermentação. Todas as fermentações foram registradas por impedimetria. No fim da cada uma das fermentações, a coagulação do leite foi testada e a titulação de fagos foi realizada usando métodos conhecidos na técnica. No caso de fermentação láctea na ausência de fago, variação de impedância com DGCC7710 foi acima de 2500 μS em 6 horas. Na presença de D2972, (DGCC7710 sendo mais sensível aos fagos), os fagos de D2972 alcançaram alto nível de população durante a primeira cultura e a fermentação falhou em coagular o leite. A variação da impedância em 6 horas esteve sempre abaixo de 500 μS. Ao contrário, a fermentação de leite com WTphi2972+S20 na presença de D2972 permitiu coagulação do leite pelo menos até a 3a subcultura e evolução lenta do nível de fago foi observada. Variação da impedância aumentou para mais de 2500 μS também até a 3a subcultura. Isto demonstra que a cepa variante WTphi2972+S20 é mais apropriada que a cepa parental DGCC7710 para acidificação láctea na presença de fagos. Além disso, a fermentação de leite com WTphi2972+S26S27 na presença de D2972 permitiu coagulação do leite até a última subcultura sem desenvolvimento de fago. Além disso, a variação da impedância aumentou para mais de 2500 μS também até a última subcultura. Isto demonstra que a cepa variante WTphi2972+S26S27 é mais apropriado do que a cepa parental DGCC7710 e mesmo mais apropriada do que WTphi2972+S20 para acidificação láctea na presença de fagos. Os experimentos foram duplicados; os resultados são apresentados na Tabela 13-1. Cepa Subculturas Coagulação do Leite Dentro de 6 h Nível de Fago na Cepa Fermentadora Variação da Impedância Dentro de 6 h (em μS)

[000567] Em um segundo conjunto de experimentos, a comparação da cepa DGCC7710 a cepa WTphi2972+S20 e cepa WTphi2972+S26S27 na fermentação láctea na presença do fago D2972 foi reproduzida. Além disso, a cepa DGCC9836 foi estudada. A cepa DGCC9836 é até mais desenvolvida cepa variante de DGCC7710 que é o resultado de desafio com múltiplos fagos. Esta cepa apresenta 5 espaçadores adicionais em seu locux de CRISPR1 e 3 espaçadores adicionais em seu locux de CRISPR3 (Vide, Exemplo 11 e Figura 17). DGCC9836 é resistente a todos os fagos testados.
[000568] Os experimentos foram conduzidos como descrito acima. Os resultados são mostrados na Tabela 13-2. Como para o primeiro conjunto de experimentos, a fermentação de leite com WTphi2972+S20 na presença de D2972 permitiu a coagulação do leite até a 5a subcultura e evolução lenta do nível de fago foi medida. A variação da impedância aumentou a mais de 2500 μS durante as 5 primeiras subculturas, demonstrando que acidificação láctea não é afetada pelos fagos. Na 6a subcultura, o nível de fago aumentou significativamente e a fermentação láctea foi prejudicada. Para 2 outras cepas variantes, a fermentação láctea não foi afetada ao longo das 6 subculturas, fagos nunca desenvolvidos e a variação registrada da impedância foi sempre acima de 2500 μS.
[000569] Estes experimentos demonstram que cepas contendo pelo menos uma sequência espaçadora adicional em seu locux de CRISPR1 permite a fermentação láctea até na presença de fagos. A fermentação láctea é mesmo mais segura quando as cepas têm mais de uma sequência espaçadora adicional em seus loci de CRISPR.
EXEMPLO 14 - Combate de Fagos na Fermentação Usando uma Combinação de Cepas Variantes CRISPR modificadas
[000570] Neste Exemplo, métodos para combater fagos na fermentação através do uso de uma combinação de cepas variantes em vez de usar uma cepa única são descritos. Dessa maneira, este Exemplo ilustra o uso simultâneo de mais de uma cepa variante (isto é, uma combinação de cepas variantes). De fato, misturas de cepas exibinido as mesmas funcionalidades, ainda padrões de sensibilidade ao fago diferentes encontram uso em tais aplicações. Por exemplo, 2 ou 3 ou até mais cepas variantes como descrito neste pedido encontram uso em tais aplicações. Usando uma combinação de cepas variantes com sequências espaçadoras adicionadas diferentes em seus loci de CRISPR permite que a fermentação resista mais facilmente a quaisquer fagos mutantes emergentes.
[000571] Em alguns experimentos, comparações foram feitas entre a cepa WTphi2972+S21 sozinha e uma combinação de 3 cepas (ou seja, WTphi2972+S20, WTphi2972+S21 e WTphi2972+S22) usada na fermentação láctea na presença do fago D2972. As cepas WTphi2972+S20, WTphi2972+S21 e WTphi2972+S22 são descritas na Tabela 7-1 e no Exemplo 8. Elas são cepas variantes independentes de DGCC7710. Cada cepa variante exibe em seu locux de CRISPR1 uma sequência espaçadora adicional distinta (as quais originadas do fago D2972) quando comparada à cepa DGCC7710.
[000572] Fermentações seriadas foram realizadas com a cepa WTphi2972+S21 sozinha ou na combinação das três cepas. Em primeiro lugar, meio de leite em pó 10% (p/v) foi semeado com 1% (v/v) de uma pré-cultura da cepa sozinha ou a combinação de cepas e com 104 pfu/ml do fago D2972. A cultura foi incubada a 42°C por 6 h. Seguinte a primeira fermentação, uma segunda fermentação foi configurada. As mesmas condições exatas de fermentação foram usadas exceto que o volume de 0,1% do fermentado da fermentação precedente foi adicionado (antes da adição, o fermentado foi filtrado usando um filtro de 0,45 μm). Então fermentações sucessivas foram realizadas usando as mesmas condições experimentais como aquelas usadas para a segunda fermentação. Todas as fermentações foram registradas por impedimetria. No fim da cada uma das fermentações a coagulação do leite foi testada e a titulação de fagos foi realizada usando métodos conhecidos na técnica. Os experimentos foram duplicados; os resultados foram fornecidos na Tabela 14-1.

[000573] A fermentação láctea feita com WTphi2972+S21 na presença de fagos falhou na terceira subcultura em ambas os testes. Isto foi mostrado por uma ausência de coagulação do leite e por uma variação altamente reduzida da impedância após 6 horas de fermentação. Ao contrário, apesar de algum desenvolvimento do fago D2972, as fermentações foram conduzidas com sucesso até a quinta subcultura quando a mistura das três cepas foi usada. A coagulação do leite foi registrada em todas as culturas e a variação da impedância em 6 horas de incubação nunca esteve abaixo de 3000 μS.
[000574] Estes experimentos demonstram que o uso da combinação das cepas variantes tendo pelo menos uma sequência espaçadora distinta adicional em seu locux de CRISPR1 permite a fermentação láctea na presença de fagos, quando comparado ao uso da cepa variante única.
EXEMPLO 15 - Combate a Fagos em Fermentação Usando uma Rotação de Cepas Variantes CRISPR-modificadas
[000575] Em experimentos adicionais, as cepas variantes foram usadas em rotação. Em alguns experimentos, as cepas tiveram as mesmas funcionalidades, mas diferentes padrões de sensibilidade ao fago. Dessa maneira, neste Exemplo, os experimentos conduzidos no uso iterativo/subsequente de várias cepas diferentes (isto é, cepas variantes CRISPR-modificadas) sequencialmente em um esquema de rotação são descritos.
[000576] Em alguns experimentos, comparações foram feitas entre as cepas WTphi2972+S21 sozinha e as cepas WTphi2972+S20, WTphi2972+S21 e WTphi2972+S22 usadas sucessivamente (em rotação) na fermentação láctea na presença do fago D2972. A primeira fermentação de leite foi conduzida com a cepa WTphi2972+S20. Então, a cepa WTphi2972+S22 foi usada para a segunda fermentação, e a cepa WTphi2972+S21 foi usada para a terceira fermentação. A quarta fermentação foi então novamente feita usando a cepa WTphi2972+S20 ; seguido por uma fermentação com a cepa WTphi2972+S22, então com a cepa WTphi2972+S21, e similares. As cepas WTphi2972+S20, WTphi2972+S21 e WTphi2972+S22 são descritas acima na Tabela 7-1. Elas são cepas variantes independentes da cepa DGCC7710. Cada cepa variante exibe uma sequência espaçadora adicional distinta em seu locux de CRISPR1, quando comparada com a cepa DGCC7710, que originou-se a partir do fago D2972.
[000577] Fermentações seriadas foram realizadas usando os mesmos métodos experimentais descritos no Exemplo 14. Experimentos foram feitos em triplicata; resultados são mostrados na Tabela 15-1. As fermentações seriadas inoculadas com WTphi2972+S20 sozinha foram bem sucedidos até a 3a subcultura, como mostrado pelos valores de variação da impedância acima de 3000 μS e pela coagulação do leite. As próximas subculturas falharam em coagular o leite e os altos valores de fago foram registrados. Ao contrário, as fermentações seriadas feitas pela inoculação do leite pela rotação com 3 diferentes cepas variantes (WTphi2972+S20, WTphi2972+S21 e WTphi2972+S22) foram bem sucedidas até a décima subcultura. Sob estas condições experimentais, os fagos falharam em propagar e permanecer em baixos níveis. Os resultados indicam que usar uma rotação de cepas variantes fornece a resistência ao fago melhorada durante a fermentação, quando comparada ao uso de uma cepa variante única.
EXEMPLO 16 - Redução e Controle de População de Fago Usando Cepas Variantes CRISPR-modificadas
[000578] Neste Exemplo, experimentos conduzidos para determinar a capacidade de uma cepa CRISPR-modificada para destruir fagos que foram resistentes são descritos. Em particular, experimentos foram desenhados determinar se uma população de fago será reduzida a um nível indetectável durante a fermentação de uma cepa CRISPR-modificada.
[000579] Em alguns experimentos, DGCC9836 (descrito no Exemplo 11 e na Figura 17) foi usada para realizar fermentação láctea na presença do fago D2972, em comparação as fermentações feitas com a sua cepa parental DGCC7710 na presença de D2972. Meio de leite em pó dez por cento (p/v) foi semeado com aproximadamente 106 cfu/ml de uma pré-cultura da cepa testada e com 107 pfu/ml do fago D2972. A cultura foi incubada a 42°C por 24 h. Em vários pontos de tempo, uma alíquota foi tomada e população de fago foi medida usando placa semeada de ágar em dupla camada semeada com DGCC7710 usando métodos padrão conhecidos na técnica. Os resultados são apresentados na Figura 20. Na fermentação de leite por DGCC7710, fago D2972 desenvolvido para alcançar uma população acima de 108 pfu/ml. Ao contrário, durante a fermentação com DGCC9836, a população de fago D2972 gradualmente diminuiu a um nível muito baixo (120 pfu/ml) após 6 horas da incubação, e foi quase inetectável após 24 horas de incubação. Este último resultado sugere que fagos foram destruídos durante o processo de fermentação com a cepa variante DGCC9836.
[000580] A propriedade de uma cepa variante de destruir fagos, bem como não ser sensível aos fagos representa um benefício adicional, quando comparado com o programa de rotação de cultura iniciadora tradicional pelo qual as cepas não são sensíveis, mas são inofensivas aos fagos. De fato, pelo uso de cepas variantes, a erradicação de fagos latentes ocorrerá pela combinação da lavagem dos fagos (quanto à rotação usando cultura iniciadora tradicional) e de destruição dos fagos.
[000581] Em outros experimentos, cepas variantes apresentando alguma mas incompleta resistência ao fago D2972 foram associadas na fermentação láctea na presença de D2972. Cepas de variantes selecionadas incluíram WTphi2972+S20 e WTphi2972+S21, como descrito no Exemplo 8 e na Tabela 7-1. Estas cepas exibem reduções de EOP do fago D2972 de aproximadamente 5 logs. Fermentações lácteas foram realizadas como descrita acima (taxa de inoculação bacteriana de 106 cfu/ml; taxa de inoculação de fago de 107 pfu/ml). As fermentações lácteas foram feitas com WTphi2972+S20 ou com WTphi2972+S21 ou uma mistura das duas cepas. Em vários pontos de tempo, a população de fagos foi registrada. Com esta finalidade, uma alíquota foi tomada e a população de fago foi medida usando placa semeada de ágar de dupla camada com WTphi2972+S20 ou com WTphi2972+S21, usando métodos padrão conhecidos na técnica. Os resultados são apresentados na Figura 21, que indica a adição de fagos detectados em WTphi2972+S20 e em WTphi2972+S21 para cada uma das fermentações lácteas. Quando uma cepa única foi usada para a fermentação (WTphi2972+S20 ou WTphi2972+S21), o número de fagos detectados no tempo de inoculação foi aproximadamente 100 pfu/ml (devido aos 5 logs da redução de EOP). Sobre o cultivo, este número de fagos aumentou a 106 ou 107 (respectivamente), correspondente a uma multiplicação dos fagos de 4 a 5 logs. O fator de multiplicação dos fagos foi muito mais baixo (2 logs) para a fermentação de leite inoculada com 2 cepas. De fato, o número de fagos aumentou de 100 pfu/ml a um máximo de aproximadamente 104 pfu/ml. Estes resultados conclusivamente mostram que durante uma cocultura de 2 cepas variantes a taxa de propagação dos fagos é significativamente reduzida comparada com a taxa de propagação dos fagos em uma cultura feita com cepas variantes únicas.
EXEMPLO 17 - Inserção de Espaçadores
[000582] Neste Exemplo, métodos e composições usadas para inserir dois espaçadores em S. thermophilus DGC7710 são descritos. A cepa de S. thermophilus DGCC7710 (depositado na "Coleção Naciona de Micro-organismo" francesa sob o número CNCM 1-2423) possui pelo menos 3 loci de CRISPR: CRISPR1, CRISPR2 e CRISPR3. Em cepas CNRZ1066 e LMG18311, das quais a sequência genômica completa é conhecida (Vide, Bolotin et al., [2004], supra), CRISPR1 está localizada no mesmo locux cromossômico: entre str0660 (ou stu0660) e str0661 (ou stu0661) (Vide, Figura 18). Na cepa DGCC7710, CRISPR1 também está localizada no mesmo locux cromossômico, entre genes altamente similares. CRISPR1 da cepa DGCC7710 contém 33 repetições (incluindo a repetição terminal), e dessa forma 32 espaçadores (Vide, Figura 19). Todos estes espaçadores são diferentes um do outro. A maioria destes espaçadores não foi anteriormente descrito como sendo dentro dos loci de CRISPR, mas quatro espaçadores perto do reboque de CRISPR1 são idênticos as CRISPRl espaçadoras conhecidas. Por exemplo, o 28° espaçador de DGCC7710 é 100% idêntico ao 31° CRISPRl espaçadora da cepa CNRZ1575 (número de acesso no Genbank DQ072991); O 30° espaçador de DGCC7710 é 100% idêntico ao 27° CRISPRl espaçadora da cepa CNRZ703 (número de acesso no Genbank DQ072990); o 31° espaçador de DGCC7710 é 100% idêntico ao 28° CRISPRl espaçadora da cepa CNRZ703 (número de acesso no Genbank DQ072990); e o 32° espaçador de DGCC7710 é 100% idêntico ao 30° CRISPRl espaçadora da cepa CNRZ703 (número de acesso no Genbank DQ072990). A sequência de CRISPR1 (5'-3') da cepa DGCC7710 é mostrada em SEQ ID NO:678, abaixo:

[000583] D858, o fago usado nestes experimentos é um bacteriófago que pertence à família de vírus Siphoviridae. Sua sequência genômica foi completamente determinada, aparentemente continua a ser publicada. Este fago é virulento para a cepa de S. thermophilus DGCC7710. A cepa de S. thermophilus DGCC7778 foi isolada como um mutante natural resistente ao fago usando DGCC7710 como a cepa parental, e o fago D858 como fago virulento. A CRISPR1 da cepa DGCC7778 contém 35 repetições (incluindo a repetição terminal), e dessa forma 34 espaçadores. Quando comparada à sequência CRISPR1 de DGCC7710, a sequência CRISPR1 de DGCC7778 possui dois novos espaçadores adicionais, adjacentes (e naturalmente duas repetições adicionais que flanqueiam os novos espaçadores) em uma extremidade do locux de CRISPR (isto é, próximo ao líder). Todos os outros espaçadores do locux de CRISPR1 estão inalterados. A sequência de CRISPR1 (5'-3') da cepa DGCC7778 é mostrada em SEQ ID NO:679, abaixo:
[000584] No caso de DGCC7778, o primeiro espaçador (5'- caacacattcaacagattaatgaagaatac-3'; SEQ ID NO:680) e o segundo espaçador (5'-tccactcacgtacaaatagtgagtgtactc-3'; SEQ ID NO:681) constituem a marcação específica para a cepa que identifica esta cepa marcada. Foi determinado que a sequência de ambos os novos espaçadores existe dentro do genoma do fago D858. Sequência do segundo novo espaçador é encontrada entre posições 25471 e 25442 bp (isto é, na fita menos) do genoma de D858, com uma incompatibilidade (96,7% de nucleotídeos idênticos em mais de 30 nucleotídeos):
[000585] A sequência do primeiro espaçador é encontrada entre as posições 31481 e 31410 bp (isto é, na fita mais) do genoma de D858 (100% de nucleotídeos idênticos em mais de 30 nucleotídeos):
[000586] Embora não seja destinado que a presente invenção seja limitada a qualquer mecanismo nem teoria particular, é contemplado que dois novos espaçadores presentes no locux de CRISPR1 de DGCC7778 foram necessários para conferir à cepa DGCC7778 uma nova resistência ao fago D858. O espaçador "2" (como encontrado em DGCC7778) foi primeiro inserido no locux de CRISPR1 de DGCC7710 (33 repetições e 32 espaçadores), em uma extremidade deste locux de CRISPR, em conjunto com uma repetição. Esta inserção deu origem a um mutante insensível a bacteriófago (cepa intermediária), marcada por este novo espaçador adicional (dessa forma carregando 34 repetições e 33 espaçadores). Este espaçador foi derivado do genoma de D858, mas um erro de replicação ou erro de transcrição reversa provavelmente ocorreu durante o processo de inserção, levando a uma mutação pontual. Devido à combinação imperfeita (isto é, a incompatibilidade 1) entre este espaçador recentemente adquirido e a sequência direcionada pelo fago, a eficiência da resistência desta cepa intermediária ao fago D858 foi baixa. Um segundo evento de inserção de espaçador ocorreu nesta cepa intermediária (mais resistente ao fago D858 do que a cepa parental DGCC7710, mas não totalmente resistente por causa da incompatibilidade), levando à inserção de um segundo novo espaçador (isto é, espaçador "1" como encontrado em DGCC7778) na mesma extremidade de locux de CRISPR1, em conjunto com uma repetição. Esta segunda inserção deu origem a um novo mutante insensível a bacteriófago , que foi isolado e denominado DGCC7778. DGCC7778 é mais resistente ao D858 do que a cepa intermediária, e naturalmente muito mais resistente que a cepa parental DGCC7710, devido à presença do espaçador "1", que é 100% idêntico à sequência direcionada pelo fago.
EXEMPLO 18 - Método para Marcação de DGCC7710 e Seleção da Cepa Marcada DGCC7778
[000587] Neste Exemplo, métodos usados para marcação de DGCC7710 e seleção da cepa de DGCC7778 marcada são descritos. A cepa DGCC7710 foi infectada/desafiada pelo fago D858 pela inoculação em leite pasteurizado com a cepa DGCC7710 em aproximadamente 2.106 cfu/ml e com fago D858 a aproximadamente 1.105 pfu/ml. O leite inoculado foi cultivado por 12 horas a 35°C. Após incubação, as bactérias viáveis (isto é, aquelas que são provavelmente mutantes insensíveis a bacteriófago) foram isoladas em meio não- seletivo (placas de ágar leite) a 35°C, usando uma diluição apropriada da cultura infectada. Um isolado denominado DGCC7778 foi propagado em meio de líquido M17-glicose a 350C e seu DNA foi extraído usando um protocolo de extração de DNA clássico, como conhecido na técnica.
[000588] O extrato de DNA foi amplificado usando PCR como conhecido na técnica (Vide, por exemplo, Bolotin et al. [2005], supra) usando combinação de um iniciador de senso (yc70 e/ou SPIDR-a montante [5'-gTCTTTAgAAACTgACACC]; SEQ ID NO:674) e de um iniciador de antissenso (yc31 e/ou SPIDR-a jusante [5'- TAAACAgAgCCTCCCTATCC]; SEQ ID NO:675). A sequência dos produtos PCR foi determinada e comparada com aquela do locux de CRISPR de DGCC7710.
EXEMPLO 19 - Produção de uma Segunda Cepa Marcada
[000589] Neste Exemplo, métodos usados para produzir uma segunda cepa marcada são descritos. A cepa de S. thermophilus DGCC7710-RH1 foi isolada como um mutante natural resistente ao fago usando DGCC7710 como a cepa parental e fago D858 como o fago virulento.
[000590] A CRISPR1 da cepa DGCC7710-RH1 contém 34 repetições (incluindo a repetição terminal), e dessa forma 33 espaçadores. Quando comparada com a sequência de CRISPR1 da cepa de S. thermophilus DGCC7710, a sequência de CRISPR1 da cepa de S. thermophilus DGCC7710-RH1 possui um novo espaçador adicional (isto é, sequência de direcionamento) (e naturalmente uma repetição adicional que flanqueia o novo espaçador) em uma extremidade do locux de CRISPR (isto é, próximo ao líder, na extremidade 5' do locux de CRISPR). Todos os outros espaçadores do locux de CRISPR1 são inalterados. A sequência CRISPR1 (5'-3') da cepa DGCC7710-RH1 é:
[000591] A sequência líder é 5' caaggacagttattgattttataatcactatgtgggtataaaaacgtcaaaatttcatttgag 3'(SEQ ID NO: 688).
[000592] A sequência integrada (GTTTTTGTACTCTCAAGATTT AAGTAACTGTACAACtcaacaattgcaacatcttataacccactt; SEQ ID NO:689) é mostrada em cinza, compreendendo a Repetição de CRISPR (caixa alta) e uma CRISPR espaçadora (isto é, sequência de narcação), que é mostrada em caixa baixa. A repetição terminal (5' gtttttgtactctcaagatttaagtaactgtacagt 3' (SEQ ID N0:3)) sequência reboque: 5'ttgattcaacataaaaagccagttcaattgaacttggcttt3' (SEQ ID NO:691) são mostradas.
[000593] Consequentemente, em caso da cepa de S. thermophilus DGCC7710-RH1, o espaçador (5'-tcaacaattgcaacatcttataacccactt-3'; SEQ ID NO:534) constitui a sequência de direcionamento específica para a cepa que identifica esta cepa mutante (isto é, a bactéria marcada). A sequência do novo espaçador (isto é, sequência de direcionamento) existe dentro do genoma de fago D858. A sequência espaçadora é encontrada entre posições 31921 e 31950 bp (isto é, na fita mais) do genoma de D858 (e tem a identidade de 100% à sequência genômica de D858 em mais de 30 nucleotídeos):
[000594] O novo espaçador (isto é, sequência de direcionamento) que está integrado no locux de CRISPR1 da cepa de Streptococcus thermophilus DGCC7710-RH1 confere a esta cepa uma nova resistência ao fago D858.
EXEMPLO 20 - Produção de uma Terceira Cepa Marcada
[000595] Neste Exemplo, métodos usados para produzir uma terceira cepa marcada são descritos. A cepa de S. thermophilus DGCC7710- RH2 foi isolada como um mutante natural resistente ao fago usando a cepa de S. thermophilus DGCC7710 como a cepa parental, e fago D858 como o fago virulento. A CRISPR1 da cepa de S. thermophilus DGCC7710-RH2 contém 34 repetições (incluindo a repetição terminal), e dessa forma 33 espaçadores. Quando comparada à sequência de CRISPR1 da cepa de S. thermophilus DGCC7710, a sequência de CRISPR1 da cepa de S. thermophilus DGCC7710-RH2 possui um novo espaçador adicional (isto é, sequência de direcionamento) (e naturalmente uma repetição adicional que flanqueia o novo espaçador) em uma extremidade do locux de CRISPR (isto é, próximo ao líder, na extremidade 5' do locux de CRISPR). Todos os outros espaçadores de locux de CRISPR1 são inalterados.
[000596] A sequência CRISPR1 (5'-3') de cepa DGCC7710-RH2 é:
[000597] A sequência líder é 5' caaggacagttattgattttataatcactatgtgggtataaaaacgtcaaaatttcatttgag 3' (SEQ ID NO:688).
[000598] A sequência integrada (GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACttacgtttgaaaaga atatcaaatcaatgat SEQ ID NO:694) é mostrada em cinza, compreendendo uma Repetição de CRISPR (caixa alta) e uma CRISPR espaçadora (isto é, sequência de direcionamento), que é mostrado em caixa baixa.
[000599] A repetição terminal (5' gtttttgtactctcaagatttaagtaactgtacagt (SEQ ID NO:3)) sequência reboque: 5'ttgattcaacataaaaagccagttcaattgaacttggcttt3' (SEQ ID NO:691) são mostradas.
[000600] Dessa maneira, no caso da cepa de Streptococcus thermophilus DGCC7710-RH2, o espaçador (5'- ttacgtttgaaaagaatatcaaatcaatga-3'; SEQ ID NO:697) constitui uma marcação específica para a cepa que identifica esta cepa mutante (isto é, bactéria marcada). A sequência do novo espaçador foi mostrada existindo dentro do genoma de fago D858. A sequência espaçadora é encontrada entre posições 17215 e 17244 bp (isto é, na fita mais) do genoma de D858 (e tem identidade de 100% à sequência genômica D858 em mais de 30 nucleotídeos):
[000601] O novo espaçador integrado ao locux de CRISPR1 da cepa de S. thermophilus DGCC7710-RH2 confere uma nova resistência ao fago D858 à cepa de S. thermophilus DGCC7710-RH2.
EXEMPLO 21 - Construção do Fago "de escape de CRISPR" a partir de Variantes Bacterianas Resistentes ao Fago
[000602] Neste Exemplo, métodos da construção de fagos de escape de CRISPR são descritos. As variantes hospedeiras resistentes ao fago são primeiro construídas como descrito nos Exemplos acima. Nestes experimentos, uma cepa parental "A" é exposta ao fago "P" e uma variante resistente ao fago (Variante "A1.0") selecionado. A variante A1.0 é analisada (por exemplo por PCR, e/ou sequenciamento de DNA) para confirmar a presença de um espaçador inserido adicional dentro de um locux de CRISPR. A sequência nucleotídica do espaçador adicional (Espaçador Sp1.0) então é determinada. Tipicamente, espaçador Sp1.0 é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fago P, e fornece resistência ao fago P e fagos relacionados ("fagos relacionados" são aqueles contendo a sequência espaçadora em seus genomas e define uma família de fagos).
[000603] Independentemente da primeira exposição ao fago, a mesma cepa parental A é exposta ao mesmo fago P e uma segunda variante resistente ao fago (Variante A2.0) é selecionada. A variante A2.0 é selecionado a fim de também ter um espaçador adicional inserido (Espaçador Sp2.0) dentro de um locux de CRISPR mas com a sequência espaçadora Sp2.0 sendo diferente daquela do espaçador Sp1.0. Tipicamente, espaçador Sp2.0 é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fago P, e fornece a resistência ao fago P e fagos relacionados. Similarmente em algumas modalidades, variantes A3.0 a variantes Ax.0. são geradas pela exposição da mesma cepa A ao mesmo fago P. Todas as variantes "A" são selecionadas a fim de também ter um espaçador adicional inserido (Espaçador Sp3.0 a Spx.0) dentro de um locux de CRISPR mas com a sequência de todos os espaçadores "Sp" sendo diferentes de cada um dos outros. Tipicamente, espaçadores de "Sp" são fragmentos de aproximadamente 30 nucleotídeos em tamanho a partir do fago P, e todos fornecem resistência ao fago P e fagos relacionados.
[000604] Tipicamente, pode ser estimado que o nível de resistência será aproximadamente aquele de uma mutação única que ocorre dentro do genoma do fago na sequência correspondente ao espaçador (isto é, aproximadamente 10-4 a 10-6). Dessa forma, fago que escapa da resistência mediada por CRISPR são fáceis de isolar. Os fago mutados são gerados através da exposição da variante A1.0 ao fago P. Tipicamente, o fago "de escape de CRISPR" mutado (P1.0) abriga pelo menos uma mutação dentro do seu genoma correspondente à sequência do espaçador Sp1.0 (por exemplo, deleção(ões), mutação(ões) pontual(ais), etc.) Ou em algumas modalidades preferenciais, a região flanqueadora Sp1.0, mais ou menos 20 bp correspondente ao motivo de CRISPR. A variante A1.0 seria sensível ao fago P1.0. Similarmente, variantes resistentes ao fago P independentemente geradas (Variante A2.0, A3.0 a Ax.0) que abriga espaçadores únicos (Sp2.0, Sp3.0 a Spx.0, respectivamente) são do mesmo modo desafiados com o fago P para gerar os fagos mutantes correspondentes (P2.0, P3.0 a Px.0, respectivamente). Subsequentemente, um grupo de fagos mutantes virulentos, cujos genomas foram especificamente mutados em uma sequência esperada para ser uma CRISPR espaçadora, pode ser gerado.
[000605] De fato, o fago D2792 representa um fago de biocontrole totalmente virulento contra a cepa de S. thermophilus DGCC7710 (WT). Ao contrário, a análise do locux de CRISPR de cepas relacionadas WTphi2972+S6, WTphi2972+S4, WTphi2972+S20, WTphi2972+S21 e WTphi2972+S22, indicam a presença de uma sequência espaçadora que é similar as sequências encontradas no fago D2972 que indicam que o fago D2972 virulência reduzida sobre estas cepas. Dados de plaqueamento (Vide, Tabela 7-1) confirmam a virulência reduzida do fago D2972 nestas cepas. Com relação à cepa WTphi2972+S6, que foi caracterizada por ser resistente ao fago D2972 devido à presença de uma CRISPR espaçadora correspondente, a seleção de fagos relacionados a D2972 para total virulência aumentada identifica fagos D4724 e D4733 como agentes candidatos como agentes de biocontrole (Vide, Tabela 7-1).
[000606] Em experimentos adicionais, a cepa DGCC7710 foi exposta ao fago D2972 para gerar a variante resistente WTphi2972+S6 Quando a cepa WTphi2972+S6 foi exposta ao fago D2972, foi possível isolar o fago mutante, tal como D4724. Foi encontrado que este fago D4724 era totalmente virulento sobre DGCC7710 e WTphi2972+S6 em uma segunda iteração, WTphi2972+S6 foi exposto ao fago D4724, para gerar a variante resistente WTphi2972+S6phi4724+S15 sobre a exposição desta cepa a D4724, os fagos mutantes foram identificados, tais como D4733, que são totalmente virulentos em relação à DGCC7710 e WTphi2972+S6. Em algumas modalidades, as iterações sucessivas são usadas para gerar o fago com o nível desejado de virulência.
[000607] Exemplos de mutantes de fago adicionais são fornecidos na Figura 13. Nesta Figura, o fago mutante 858-A e 858-B derivado do fago parental D858 são mostrados. As mutações correspondem ao espaçador Sl de WTΦ858+S1S2 desafiado com o fago D858.
[000608] Ainda em exemplos adicionais, mutantes de fago totalmente virulentos onde a mutação é identificada no motivo de CRISPR são mostrados na Tabela 20-1. Nesta Tabela, as sequências nucleotídicas de fagos de tipo selvagem e mutantes que correspondem aos espaçadores recentemente adquiridos pelas cepas de S. thermophilus são mostradas. O motivo AGAAW está destacado em cinza. Cada mutação está em negrito e sublinhada. *, indica uma deleção. Esta Tabela fornece sequências das variantes de CRISPR resistentes ao fago e pares de mutantes de fago virulentos: DGCC7710D858+S3/fago 2972.S3C, DGCC7710:2972+S4/fago 2972.S4A ou fago 2972.S4C, DGCC7710:2972+S6/fago 2972.S6A, e DGCC7710D2972+S4D858+S32/fago 858.S32A ou fago 858.S32D. Nesta Tabela, o novo espaçador corresponde a SEQ ID NO:535 (DGCC7710 □858+S3)
EXEMPLO 22 - Fago de Segundo Nível "de escape de CRISPR
[000609] Neste Exemplo, experimentos para construção de fagos de escape de CRISPR de segundo nível (isto é, com múltiplas mutações dirigidas a múltiplos espaçadores) são descritos.
[000610] Por um processo iterativo de criação das variantes resistentes ao fago CRISPR-mediada seguidas pelo isolamento dos fagos mutados ("escape de CRISPR") capazes de superar o mecanismo cas-CRISPR, é possível para criar fagos que têm "pré-adaptados" com múltiplas mutações contra a resistência CRISPR-mediada potencial.
[000611] Em algumas modalidades, as variantes de segundo nível são produzidas pelo isolamento de um fago mutado através da exposição da variante A1.0 ao fago P. Tipicamente, este fago mutado (fago P1.0) tem uma mutação (deleção, mutação pontual, etc.) no seu genoma dentro da região contendo a sequência espaçadora Sp 1.0 ou dentro da região flanqueadora de Sp1.0, mais ou menos 20 bp correspondente ao motivo de CRISPR. A variante A1.0 é sensível ao fago P1.0. Dessa forma, a variante A1.0 é exposta ao fago P1.0 e um variante resistente ao fago (Variante A1.1) selecionada (Vide, Figura 15). A variante A1.1 é também selecionada tal que tenha um espaçador adicional inserido (Espaçador Sp 1.1) dentro de um locux de CRISPR mas com a sequência espaçadora Sp1.1 sendo diferente daquela dos espaçadores Sp1.0, Sp2.0 a Spx.0. Tipicamente, espaçador Sp1.1 é um fragmento de aproximadamente 30 nucleotídeos em tamanho do fago P1.0, e fornecerá a resistência ao fago P1.0 e fagos relacionados. Variante Al.1 é resistente ao fago P1.0 e preferencialmente, tem uma resistência aumentada ao fago P por causa do acúmulo de espaçador Sp 1.0 e Sp 1.1.
[000612] Em modalidades adicionais, um fago recentemente mutado (fago P1.1) é gerado através da exposição da variante A1.1 ao fago P1.0. Dessa maneira, sobre a exposição da variante A1.1 ao fago P 1.1 uma nova variante A1.2 é obtida que contém um novo espaçador adicional (Sp1.2). Este espaçador fornece resistência ao fago P 1.1 e preferencialmente aumenta a resistência ao fago P1.0 e P (isto é, devido ao acúmulo de espaçadores Sp1.0, Sp1.1, Sp1.2). O fago P1.1 é totalmente infectante em relação à cepa parental A, bem como as variantes A1.0 e A1.1.
[000613] Ainda em modalidades adicionais, diferentes espaçadores (por exemplo, 2, 3 ou 4) são iterativamente acumulados dentro da cepa A através da variante A1, então variante A1.1, então variante A1.2, etc. para obter uma variante altamente resistente ao fagos (variante Al.n). Ainda em modalidades adicionais, diferentes espaçadores adicionais podem ser acumulados na mesma cepa através da variante A2, então variante A2.1, então variante A2.2, etc. para gerar outra variante da cepa A altamente resistente aos fagos (variante A2.n) em paralelo. A mesma estratégia encontra uso com variantes A3.0 a Ax.0.
[000614] Após um processo iterativo de criação de variantes de CRISPR resistentes ao fago e isolamento do fago mutante "de escape de CRISPR" (por exemplo, a exposição da variante A1.1 ao fago Pl.1 cria nova variante A1.2 que contém um novo espaçador adicional (Sp1.2) a partir do qual um fago mutante é isolado (P1.2) que é totalmente virulento na variante A1.2, A1.1, A1.0 e cepa parental A.
[000615] Em algumas modalidades, mutações combinatórias são acumuladas por construção iterativa de variantes bacterianas combinando diferentes espaçadores (por exemplo, Sp2.0. Sp3.0 a Spx.0), exposição ao fago mutante de primeiro nível correspondente (P2.0, P3.0 a Px.0), e isolamento de fagos mutantes de segundos nível.
[000616] Um exemplo de mutações combinatórias iterativas que criam variantes de CRISPR resistentes ao fago e fago mutante "de escape de CRISPR" é mostrado na Tabela 22-1. Esta tabela fornece uma lista de novos espaçadores encontrados em CRISPR1 e a região correspondente em fagos 2972, 858, ou DT1. Nesta Tabela, o "a" indica regiões de DNA que são 100% idênticas entre os fagos 858 e 2972. A "Posição 5'" refere-se à posição protoespaçadora 5' no genoma de fago. Nucleotídeos sublinhados e sombreados na sequência do protoespaçador indicam incompatibilidades entre o fago e o espaçador. Um asterisco (*) indica uma deleção. Na "Região 3' Flanqueadora" indica a sequência 3' flanqueadora no genoma de fago. Incompatibilidades no motivo AGAAW são sublinhadas e sombreadas em cinza. Na coluna denominada "Fita/Módulo", os módulos de transcrição são "E" (genes precocemente expressos); "M" (genes expressos medialmente); e "L" (genes tardiamente expressos).
[000617] DGCC7710 foi exposta ao fago 2972 para criar variante de CRISPR resistente ao fago DGCC7710 2972+S6 da qual o fago mutante de escape de CRISPR 2972.S6B foi gerado. Exposição de DGCC7710 2972+S6 ao fago 2972.S6B criou a variante de CRISPR resistente ao fago DGCC7710 2972+S6 2972.S6B+S20 da qual o fago mutante de escape de CRISPR 2972.S20A foi isolado.
[000618] Em algumas modalidades, cepas que são resistentes a mais de uma família de fagos são fornecidas.
[000619] Como uma dada cepa pode ser sensível a mais de uma família de fagos, em algumas modalidades, se é desejado aumentar a resistência de cepa a múltiplas famílias de fago pela introdução de espaçador(es) adicional(is) dentro de um locux de CRISPR que se origina de outras famílias de fagos (Vide, Figura 16). Por exemplo, fagos P, Q, e R são fagos representativos das três famílias de fagos capazes de infectar a cepa A. Usando o método delineado acima e neste pedido, as variantes resistentes às três famílias de fago são produzidas. Em algumas modalidades, o fago P é usado para gerar a variante A1p (contendo espaçador Sp1) que é resistente ao fago P. Então, a variante A1p é exposta ao fago Q e uma variante resistente ao fago (variante A1pq) é selecionada. A variante A1pq tem um espaçador adicional (Sq1) inserido dentro de um locux de CRISPR. Tipicamente, espaçador Sq1 é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fago Q, e fornece resistência ao fago Q e fagos relacionados. A variantes A1pq é resistente a ambos os fagos P e Q. A seguir, a variante A1pq é exposta ao fago R e uma variante resistente ao fago (Variantes A1pqr) é selecionada. A variante A1pqr tem um terceiro espaçador adicional (Sr1) inserido dentro de um locux de CRISPR. Tipicamente, Sr1 é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fago R, e também fornece resistência ao fago R e fagos relacionados. A variante A1pqr é resistente a todos os três fagos. Em algumas modalidades particularmente preferenciais, a variante é também resistente aos fagos relacionados.
[000620] Estes fagos de escape de CRISPR encontram uso como fagos de biocontrole/terapêuticos. Como descrito acima, pelo processo de criação de variantes resistentes ao fago CRISPR-mediada, exposição ao fago e o isolamento do fago de "escape de CRISPR" virulento, uma mistura de espécies de fago que abrigam mutações simples e/ou múltiplas dirigidas contra sequências genômicas de fago simples e/ou múltiplas que são alvos das CRISPR espaçadoras potenciais é gerada. Como bactérias hospedeiras alvo podem ficar resistentes ao fago pela incorporação de espaçadores únicos ou múltiplos e aquele mecanismo Cas-CRISPR pode ser superado por uma mutação dentro do genoma do fago correspondente a tais espaçadores, o uso de uma mistura de fago abrigando várias mutações reduz a taxa de uma bactéria individual para adquirir novos espaçadores e proliferar com sucesso.
[000621] Em uma modalidade adicional, análises das regiões protoespaçadoras e flanqueadoras, como determinados para os espaçadores nas variantes de CRISPR resistentes ao fago correspondentes, facilita a identificação do motivo de CRISPR para uma CRISPR específica. No exemplo de variantes CRISPR1 resistentes ao fago DGCC7710 contendo espaçadores Sl a S33, foram gerados após desafio com o fago 2972 ou 858. Alinhamento das regiões protoespaçadoras e flanqueadoras, a partir do genoma de fagos 2972 ou 858 que correspondem aos espaçadores S1 a S33, usando o programa de computador Clustal X, identificou-se o motivo de CRISPR1 como NNAGAAW (SEQ ID NO:696), e é visualizado usando WebLogo (Figura 22).
[000622] Em um exemplo adicional, variantes de CRISPR 3 resistentes ao fago foram derivadas de DGCC7710 após desafio com os fagos 858 e 3821, e LMD-9 após desafio com o fago 4241. Alinhamento da região protoespaçadoras e flanqueadoras dos respectivos genomas dos fagos com os espaçadores correspondentes das respectivas variantes de CRISPR3 resistentes ao fago, identificou o motivo CRISPR3 como NGGNG (SEQ ID NO:723) (Figura 23).
[000623] A análise para presença de um motivo de CRISPR específico fornece meios para identificar a posição de protoespaçadores putativos dentro de um genoma ou outra sequência especificada (por exemplo, um plasmídeo ou outro elemento genético móvel). No exemplo de fagos sequenciados 858, 2972 e DT1, a análise da distribuição do motivo de CRISPR1 AGAAW identificou a posição de protoespaçadores potenciais dentro dos respectivos genomas. Utilizando a degeneração do código genético e/ou o uso de substituições de aminoácido conservativas, cada motivo AGAAW foi eliminado no processo de sintetizar quimicamente um genoma como descrito para o fago QX174, como conhecido na técnica. Dessa maneira, o fago torna-se insensível ao sistema Cas-CRISPR1 de resistência. Dessa maneira, uma molécula de DNA, destituída de motivos CRISPR específicos é insensível ao sistema Cas-CRISPR correspondente.
[000624] Estes fagos e "coquetéis" de múltiplos tipos de fago encontram uso em estratégias de rotação (por exemplo, definida a administração sequencial de fago). Como uma extensão do uso de um coquetel simples, composto de um fago abrigando diferentes mutações espaçadoras, em algumas modalidades, múltiplos fagos virulentos, cada um abrigando uma mutação no espaçador diferente de uma maneira sequencial definida são usados. Por exemplo, usando conjunto de fagos "de escape de CRISPR" (P1.0, P2.0 e P3.0, ou P1.0, Pl.1, Pl.2 ou alguma combinação dos mesmos), cada fago é aplicado individualmente e em uma sequência e rotação definida (P.10> P2.0> P3.0> P1.0, P2.0> etc.) para minimizar a probabilidade das bactérias alvo desenvolverem resistência ao fago CRISPR- mediada. Do mesmo modo, um conjunto de coquetéis de fago (isto é, cada fago dentro do coquetel bem como cada coquetel possui uma combinação única de mutações) encontra uso na sequência e rotação. Em algumas modalidades, o fago e/ou coquetel é compreendido de uma família única de fago, enquanto em outras modalidades, o fago e/ou coquetel é compreendido de múltiplas famílias de fago.
EXEMPLO 23 - Combinações Funcionais
[000625] Este Exemplo fornece várias combinações funcionais que encontram uso na presente invenção. Por meio de exemplo somente, as seguintes combinações funcionais podem ser usadas conforme a presente invenção. Combinação Funcional N° 1:
[000626] Sequências de cas: SEQ ID NO:461 a SEQ ID NO:465 e SEQ ID NO:473 a SEQ ID NO:477 (todas as quais são sequências de S. thermophilus), como apresentadas abaixo:
com as sequências de repetição: SEQ ID NO: 1 a SEQ ID NO: 10. Combinação Funcional N° 2
[000627] Sequências de cas SEQ ID NO: 466 a SEQ ID NO: 472; e SEQ ID NO: 478 a SEQ ID NO: 487 (todas as quais são sequências de S. thermophilus), como mostrado abaixo: SEQ ID NO:4&6:
com as sequências de repetição: SEQ ID NO: 11 e/ou SEQ ID NO: 12. Combinação Funcional N° 3
[000628] Sequências de cas SEQ ID NO:488 a SEQ ID NO:508; e SEQ ID NO: 517 a SEQ ID NO: 521 como mostrado abaixo. As SEQ ID NOS:488 a 497 são de S. agalactiae, enquanto as SEQ ID NOS: 498 a 503 são de S. mutants, e as SEQ ID NOS: 504 a 508, 517 a 521 são de S. pyogenes.
Combinação Funcional N° 4
[000629] Sequências de cas SEQ ID NO:509 a SEQ ID NO:516 (todas as quais são de S. pyogenes), como mostrado abaixo:
com as sequências de repetição: SEQ ID NO: 20 e SEQ ID NO:22.
[000630] Todas as patentes e publicações mencionadas no pedido de patente são indicativas dos níveis daqueles versados na técnica à qual a invenção pertence. Todas as patentes e publicações são neste pedido incorporadas por referência quanto ao mesmo ponto como se cada publicação individual fosse especificamente e individualmente indicada para ser incorporada por referência.
[000631] Aqueles versados na técnica prontamente apreciam que a presente invenção é bem adaptada para alcançar os objetivos e obter os fins e vantagens mencionados, bem como aqueles inerentes a este pedido. As composições e métodos descritos neste pedido são representativos de modalidades preferenciais, são exemplares, e não são destinados como limitações no escopo da invenção. É prontamente evidente para um versado na técnica que variação de substituições e modificações pode ser feita na invenção revelada neste pedido sem afastamento do escopo e espírito da invenção.
[000632] A invenção descrita ilustrativamente neste pedido adequadamente pode ser praticada na ausência de qualquer elemento ou elementos, limitação ou limitações que não é especificamente revelada neste pedido. Os termos e expressões que foram empregados são usados como termos de descrição e não de limitação e não há nenhuma intenção que no uso de tais termos e expressões de exclusão de quaisquer equivalentes das características mostradas e descritas ou porções das mesmas, mas é reconhecido que várias modificações são possíveis dentro do escopo da invenção. Dessa forma, deveria ser entendido que embora a presente invenção tenha sido especificamente revelada por modalidades preferenciais e características opcionais, modificação e variação dos conceitos neste pedido revelados podem ser utilizadas por aqueles versados na técnica, e que tais modificações e variações são consideradas dentro dos limites desta invenção.
[000633] A invenção foi amplamente e genericamente descrita neste pedido. Cada uma das espécies mais limitadas e agrupamentos subgenéricos que estão incluídos na revelação genérica também tomam parte da invenção. Isto inclui o relatório descritivo genérico da invenção com uma condição ou limitação negativa removendo qualquer assunto do gênero, independentemente ou não material ser cortado é especificamente declarado neste pedido.